1. 程式人生 > >linux中檔案描述符fd和檔案指標flip的理解

linux中檔案描述符fd和檔案指標flip的理解

整理自:http://www.cnblogs.com/Jezze/archive/2011/12/23/2299861.html

簡單歸納:fd(file descriptor)只是一個整數,在open時產生。起到一個索引的作用。每個程序在PCB(Process Control Block)即程序控制塊中都儲存著一份檔案描述符表,檔案描述符就是這個表的索引,檔案描述表中每個表項都有一個指向已開啟檔案的指標,程序通過PCB中的檔案描述符表找到該fd所指向的檔案指標filp。

檔案描述符的操作(如: open)返回的是一個檔案描述符,核心會在每個程序空間中維護一個檔案描述符表, 所有開啟的檔案都將通過此表中的檔案描述符來引用; 
而流(如: fopen)返回的是一個FILE結構指標, FILE結構是包含有檔案描述符的,FILE結構函式可以看作是對fd直接操作的系統呼叫的封裝, 它的優點是帶有I/O快取

下面舉一個實際的例子,在Linux中,值為012fd分別代表標準輸入、標準輸出和標準錯誤輸出。在程式中開啟檔案得到的fd3開始增長。 fd具體是什麼呢?在核心中,每一個程序都有一個私有的開啟檔案表,這個表是一個指標陣列,每一個元素都指向一個核心的開啟檔案物件。而fd,就是這個表的下標。當用戶開啟一個檔案時,核心會在內部生成一個開啟檔案物件,並在這個表裡找到一個空項,讓這一項指向生成的開啟檔案物件,並返回這一項的下標作為fd。由於這個表處於核心,並且使用者無法訪問到,因此使用者即使擁有fd,也無法得到開啟檔案物件的地址,只能夠通過系統提供的函式來操作。

Linux支援各種各樣的檔案系統格式,如ext2、ext3、reiserfs、FAT、NTFS、iso9660等等,不同的磁碟分割槽、光碟或其它儲存裝置都有不同的檔案系統格式,然而這些檔案系統都可以mount

到某個目錄下,使我們看到一個統一的目錄樹,各種檔案系統上的目錄和檔案我們用ls命令看起來是一樣的,讀寫操作用起來也都是一樣的,這是怎麼做到的呢?Linux核心在各種不同的檔案系統格式之上做了一個抽象層,使得檔案、目錄、讀寫訪問等概念成為抽象層的概念,因此各種檔案系統看起來用起來都一樣,這個抽象層稱為虛擬檔案系統(VFS,Virtual Filesystem)。上一節我們介紹了一種典型的檔案系統在磁碟上的儲存佈局,這一節我們介紹執行時檔案系統在核心中的表示。

3.1. 核心資料結構

Linux核心的VFS子系統可以圖示如下:


現在我們明確一下:已開啟的檔案在核心中用file結構體表示,檔案描述符表中的指標指向file

結構體。

file結構體中維護File Status Flag(file結構體的成員f_flags)和當前讀寫位置(file結構體的成員f_pos)。在上圖中,程序1和程序2都開啟同一檔案,但是對應不同的file結構體,因此可以有不同的File Status Flag和讀寫位置。file結構體中比較重要的成員還有f_count,表示引用計數(Reference Count),後面我們會講到,dupfork等系統呼叫會導致多個檔案描述符指向同一個file結構體,例如有fd1fd2都引用同一個file結構體,那麼它的引用計數就是2,當close(fd1)時並不會釋放file結構體,而只是把引用計數減到1,如果再close(fd2),引用計數就會減到0同時釋放file結構體,這才真的關閉了檔案。

每個file結構體都指向一個file_operations結構體,這個結構體的成員都是函式指標,指向實現各種檔案操作的核心函式。比如在使用者程式中read一個檔案描述符,read通過系統呼叫進入核心,然後找到這個檔案描述符所指向的file結構體,找到file結構體所指向的file_operations結構體,呼叫它的read成員所指向的核心函式以完成使用者請求。在使用者程式中呼叫lseekreadwriteioctlopen等函式,最終都由核心呼叫file_operations的各成員所指向的核心函式完成使用者請求。file_operations結構體中的release成員用於完成使用者程式的close請求,之所以叫release而不叫close是因為它不一定真的關閉檔案,而是減少引用計數,只有引用計數減到0才關閉檔案。對於同一個檔案系統上開啟的常規檔案來說,readwrite等檔案操作的步驟和方法應該是一樣的,呼叫的函式應該是相同的,所以圖中的三個開啟檔案的file結構體指向同一個file_operations結構體。如果開啟一個字元裝置檔案,那麼它的readwrite操作肯定和常規檔案不一樣,不是讀寫磁碟的資料塊而是讀寫硬體裝置,所以file結構體應該指向不同的file_operations結構體,其中的各種檔案操作函式由該裝置的驅動程式實現。

每個file結構體都有一個指向dentry結構體的指標,“dentry”是directory entry(目錄項)的縮寫。我們傳給openstat等函式的引數的是一個路徑,例如/home/akaedu/a,需要根據路徑找到檔案的inode。為了減少讀盤次數,核心快取了目錄的樹狀結構,稱為dentry cache,其中每個節點是一個dentry結構體,只要沿著路徑各部分的dentry搜尋即可,從根目錄/找到home目錄,然後找到akaedu目錄,然後找到檔案a。dentry cache只儲存最近訪問過的目錄項,如果要找的目錄項在cache中沒有,就要從磁碟讀到記憶體中。

每個dentry結構體都有一個指標指向inode結構體。inode結構體儲存著從磁碟inode讀上來的資訊。在上圖的例子中,有兩個dentry,分別表示/home/akaedu/a/home/akaedu/b,它們都指向同一個inode,說明這兩個檔案互為硬連結。inode結構體中儲存著從磁碟分割槽的inode讀上來資訊,例如所有者、檔案大小、檔案型別和許可權位等。每個inode結構體都有一個指向inode_operations結構體的指標,後者也是一組函式指標指向一些完成檔案目錄操作的核心函式。和file_operations不同,inode_operations所指向的不是針對某一個檔案進行操作的函式,而是影響檔案和目錄佈局的函式,例如新增刪除檔案和目錄、跟蹤符號連結等等,屬於同一檔案系統的各inode結構體可以指向同一個inode_operations結構體。

inode結構體有一個指向super_block結構體的指標。super_block結構體儲存著從磁碟分割槽的超級塊讀上來的資訊,例如檔案系統型別、塊大小等。super_block結構體的s_root成員是一個指向dentry的指標,表示這個檔案系統的根目錄被mount到哪裡,在上圖的例子中這個分割槽被mount/home目錄下。

filedentryinodesuper_block這幾個結構體組成了VFS的核心概念。對於ext2檔案系統來說,在磁碟儲存佈局上也有inode和超級塊的概念,所以很容易和VFS中的概念建立對應關係。而另外一些檔案系統格式來自非UNIX系統(例如Windows的FAT32、NTFS),可能沒有inode或超級塊這樣的概念,但為了能mount到Linux系統,也只好在驅動程式中硬湊一下,在Linux下看FAT32和NTFS分割槽會發現許可權位是錯的,所有檔案都是rwxrwxrwx,因為它們本來就沒有inode和許可權位的概念,這是硬湊出來的。