一、儲存裝置分割槽簡述
檔案系統最終目的是把大量資料有組織的放入永續性的儲存裝置,如硬碟。硬碟儲存能力具有永續性,不會因為斷電而消失,儲存量大,但讀取速度慢。作業系統讀取硬碟的時候,不會一個一個扇區讀取,效率太低,而是一次性連續讀取多個扇區,即一次性讀取一個“塊”。這種由扇區組成的塊,是檔案存取的最小單位,塊最常見的是4KB,即連續的8個sector組成一個block。檔案資料都儲存在塊中,那麼顯然必須找到一個地方儲存檔案的元資訊,比如檔案的建立者、建立日期、檔案大小等等。這種儲存檔案元資訊的區域就叫做inode,中文譯名為“索引節點”。
硬碟最開始的區域是MBR,用於Linux開機啟動。剩餘空間可分成若干分割槽。每個分割槽有一個相關的分割槽表,記錄分割槽的相關資訊,這個分割槽表是儲存在分割槽之外的,分割槽表說明了對應分割槽的起始位置和分割槽的大小。
一個典型的Linux分割槽包含有下面各個部分:
1、分割槽的第一個部分是啟動分割槽(Boot Block),它主要是為計算機開機服務的。Linux開機啟動後,會首先載入MBR,隨後MBR從某個硬碟的啟動區載入程式。該程式負責進一步的作業系統的載入和啟動。為了方便管理,即使某個分割槽中沒有安裝作業系統,Linux也會在該分割槽預留啟動區。
2、啟動區之後的是超級區,它儲存有檔案系統的相關資訊,包括檔案系統的型別,inode的數目,資料塊的數目;貌似一個inode點陣圖和block點陣圖,用一些空間的二進位制來表示inode和block的使用情況,1表示使用過,0表示未使用,快速定位,具體怎麼儲存不知道。
3、隨後是多個inodes,它們是實現檔案儲存的關鍵。在Linux系統中,一個檔案可以分成幾個資料塊儲存,每個檔案對應一個inode,這個inode中包含多個指標,指向屬於該檔案的各個資料塊。當作業系統需要讀取檔案時,就根據inode指向的資料塊進行讀取。
4、最後一部分,就是真正儲存資料的資料塊了。
二、iNode節點
在Linux檔案管理中,檔案除了自身資料之外,還有附屬資訊,即檔案的元資料;這個元資料用於記錄檔案的許多資訊,比如檔案大小,屬主,屬組,修改日期等等。元資料並不包含在檔案資料中,由系統維護,也就是包含在inode中。每個inode有一個唯一的整數編號表示(inode number)。
三、inode的內容
inode包含檔案的元資訊,具體來說具有以下內容:
**檔案的位元組數
**檔案擁有者的UID
**檔案的組ID
**檔案的讀、寫、執行許可權
**檔案的時間戳,共有三個:ctime指inode建立時間,mtime檔案內容上一次修改時間,atime指檔案最後一次訪問的時間。
**連結數,即有多少個檔名指向這個inode
**檔案資料塊block的位置
可以使用stat命令,檢視某個檔案的inode資訊:stat example.txt
總之,除了檔名以外的所有檔案資訊,都存在inode之中。至於為什麼沒有檔名,下文會有詳細解釋。
四、inode大小
inode也會消耗硬碟空間,所以硬碟格式化的時候,系統自動將硬碟分成2個區域;一個是資料區,存放檔案資料,另一個是inode區,存放inode所包含的資訊。每個inode節點大小一般是128位元組。inode節點的總數,在格式化時就給定,一般是每1KB或2KB就設定一個inode,此數值不確實是不是正確。
檢視每個硬碟分割槽的inode總數和已使用的數量,可以使用df命令:df –i
檢視每個inode節點的大小,可以用如下命令:dumpe2fs –h /dev/hda | grep “Inode size”
由於每個檔案都必須有inode,因此有可能發生inode已經用光,但是硬碟還未存滿的情況,這時就無法在硬碟上建立新檔案。
五、inode號碼
每個inode都有一個號碼,作業系統用inode號碼來識別不同的檔案。Linux系統內部不使用檔名,而使用inode號碼來識別檔案。對於系統來說,檔名只是inode號碼便於識別的別稱或綽號。表面上使用者通過檔名開啟檔案,實際上系統內部過程分三步:首先系統找到這個檔名對應的inode號碼;其次通過inode號獲取inode資訊;最後根據inode資訊找到檔案資料所在的block,讀出資料。
使用ls -i命令,可以看到檔名對應的inode號:
ls –i example.txt
六、目錄檔案
Linux系統中,目錄也是一種檔案。開啟目錄,實際上就是開啟目錄檔案。目錄檔案的結構非常簡單,就是一系列目錄項的列表。每個目錄項由2部分組成:所包含檔案的檔名和檔案對應的inode號碼。
ls命令只能列出目錄檔案中的所有檔名:ls /etc/
-i可以列出整個目錄檔案,即檔名和inode號碼:ls –i /etc
如果要檢視檔案的詳細資訊,就必須根據inode號碼,訪問inode節點,讀取資訊。
舉例:檔案系統查詢檔案/var/log/message的過程
首先確定/目錄檔案的資料塊,事實上/目錄是由系統決定在哪裡儲存的,我們不用關心太多;讀取/目錄檔案,找到var的檔名,找到對應的inode號,根據var的inode號查詢到inode節點,從inode節點中讀取var的block,得知var是個目錄檔案;開啟var目錄檔案,查詢到名稱為log的檔名,找出log對應的inode號,查詢inode對應的inode節點,通過inode節點找到log的block,讀取log的block,發現log是個目錄檔案;開啟log目錄檔案,查詢到名稱message檔名,找出message對應的inode號,查詢inode對應的inode節點,通過inode節點找到message的block,即找到了message檔案;由此可以看到作業系統經過了哪些曲折的步驟。
七、硬連結
一般情況下,檔名和inode號碼是"一一對應"關係,每個inode號碼對應一個檔名。但是,Unix/Linux系統允許,多個檔名指向同一個inode號碼。這意味著,可以用不同的檔名訪問同樣的內容;對檔案內容進行修改,會影響到所有檔名;但是,刪除一個檔名,不影響另一個檔名的訪問。這種情況就被稱為"硬連結"(hard link)。
ln命令可以建立硬連結:ln 原始檔 目標檔案
執行上面這條命令以後,原始檔與目標檔案的inode號碼相同,都指向同一個inode。inode資訊中有一項叫做"連結數",記錄指向該inode的檔名總數,這時就會增加1。反過來,刪除一個檔名,就會使得inode節點中的"連結數"減1。當這個值減到0,表明沒有檔名指向這個inode,系統就會回收這個inode號碼,以及其所對應block區域。刪除一個檔案本質上就是去刪除這個檔案的硬連結。
順便說一下目錄檔案的連結數。目錄檔案是不可以通過ln命令來建立硬連結的,但是目錄檔案本身卻有硬連結,且至少2個硬連結數。建立目錄時,預設會生成兩個目錄項:"."和".."。前者的inode號碼就是當前目錄的inode號碼,等同於當前目錄的"硬連結";後者的inode號碼就是當前目錄的父目錄的inode號碼,等同於父目錄的"硬連結"。所以,任何一個目錄的"硬連結"總數,總是等於2加上它的子目錄總數(含隱藏目錄),這裡的2是原目錄對其的“硬連結”和當前目錄下的".硬連結“。
八、軟連線
除了硬連結以外,還有一種特殊情況。檔案A和檔案B的inode號碼雖然不一樣,但是檔案A的內容是檔案B的路徑。讀取檔案A時,系統會自動將訪問者導向檔案B。因此,無論開啟哪一個檔案,最終讀取的都是檔案B。這時,檔案A就稱為檔案B的"軟連結"(soft link)或者"符號連結(symbolic link)。
這意味著,檔案A依賴於檔案B而存在,如果刪除了檔案B,開啟檔案A就會報錯:"No such file or directory"。這是軟連結與硬連結最大的不同:檔案A指向檔案B的檔名,而不是檔案B的inode號碼,檔案B的inode"連結數"不會因此發生變化。建立軟連線時會增加一個inode節點,而硬連結不會。
其它區別:
軟連線可以連線目錄,而硬連結不可以連結目錄。
軟連線可以跨分割槽進行連結,而硬連結不可以跨分割槽,更不可以跨磁碟作連結,這是由於硬連結的inode號是針對分割槽來說的,inode在分割槽裡才有實際意義。
九、inode的特殊作用
由於inode號碼與檔名分離,這種機制導致了一些Unix/Linux系統特有的現象:
1. 有時,檔名包含特殊字元,無法正常刪除。這時,直接刪除inode節點,就能起到刪除檔案的作用:find . -inum 69905165 -exec rm -i {} \;
2. 移動檔案或重新命名檔案,只是改變檔名,不影響inode號碼。
3. 開啟一個檔案以後,系統就以inode號碼來識別這個檔案,不再考慮檔名。因此,通常來說,系統無法從inode號碼得知檔名。
第3點使得軟體更新變得簡單,可以在不關閉軟體的情況下進行更新,不需要重啟。因為系統通過inode號碼,識別執行中的檔案,不通過檔名。更新的時候,新版檔案以同樣的檔名,生成一個新的inode,不會影響到執行中的檔案。等到下一次執行這個軟體的時候,檔名就自動指向新版檔案,舊版檔案的inode則被回收。
十、實際問題
在一臺配置較低的Linux伺服器(記憶體、硬碟比較小)的/data分割槽內建立檔案時,系統提示磁碟空間不足,用df -h命令查看了一下磁碟使用情況,發現/data分割槽只使用了66%,還有12G的剩餘空間,按理說不會出現這種問題。 後來用df -i查看了一下/data分割槽的索引節點(inode),發現已經用滿(IUsed=100%),導致系統無法建立新目錄和檔案。
查詢原因:
/data/cache目錄中存在數量非常多的小位元組快取檔案,佔用的Block不多,但是佔用了大量的inode。
解決方案:
1、刪除/data/cache目錄中的部分檔案,釋放出/data分割槽的一部分inode。
2、用軟連線將空閒分割槽/opt中的newcache目錄連線到/data/cache,使用/opt分割槽的inode來緩解/data分割槽inode不足的問題:ln -s /opt/newcache /data/cache
十一、檔案共享
在Linux的程序中,當我們開啟一個檔案時,返回的是一個檔案描述符。這個檔案描述符是一個數組的下標,對應陣列元素為一個指標。有趣的是,這個指標並沒有直接指向檔案的inode,而是指向了一個檔案表格,再通過該表格,指向載入到記憶體中的目標檔案的inode。如下圖,一個程序打開了兩個檔案。
可以看到,每個檔案表格中記錄了檔案開啟的狀態(status flags),比如只讀,寫入等,還記錄了每個檔案的當前讀寫位置(offset)。當有兩個程序開啟同一個檔案時,可以有兩個檔案表格,每個檔案表格對應的開啟狀態和當前位置不同,從而支援一些檔案共享的操作,比如同時讀取。要注意的是程序fork之後的情況,子程序將只複製檔案描述符的陣列,而和父程序共享核心維護的檔案表格和inode。此時要特別小心程式的編寫