Linux內存尋址之分頁機制

阿新 • • 發佈：2017-05-20

緩存 itl ans linux 存儲器 apt target tar linux中

http://blog.xiaohansong.com/2015/10/05/Linux內存尋址之分頁機制/

在上一篇文章Linux內存尋址之分段機制中，我們了解邏輯地址通過分段機制轉換為線性地址的過程。下面，我們就來看看更加重要和復雜的分頁機制。

分頁機制在段機制之後進行，以完成線性—物理地址的轉換過程。段機制把邏輯地址轉換為線性地址，分頁機制進一步把該線性地址再轉換為物理地址。

硬件中的分頁

分頁機制由CR0中的PG位啟用。如PG=1，啟用分頁機制，並使用本節要描述的機制，把線性地址轉換為物理地址。如PG=0，禁用分頁機制，直接把段機制產生的線性地址當作物理地址使用。分頁機制管理的對象是固定大小的存儲塊，稱之為頁(page)。分頁機制把整個線性地址空間及整個物理地址空間都看成由頁組成，在線性地址空間中的任何一頁，可以映射為物理地址空間中的任何一頁（我們把物理空間中的一頁叫做一個頁面或頁框(page frame)）
技術分享

80386使用4K字節大小的頁。每一頁都有4K字節長，並在4K字節的邊界上對齊，即每一頁的起始地址都能被4K整除。因此，80386把4G字節的線性地址空間，劃分為1M個頁面，每頁有4K字節大小。分頁機制通過把線性地址空間中的頁，重新定位到物理地址空間來進行管理，因為每個頁面的整個4K字節作為一個單位進行映射，並且每個頁面都對齊4K字節的邊界，因此，線性地址的低12位經過分頁機制直接地作為物理地址的低12位使用。

為什麽使用兩級頁表

假設每個進程都占用了4G的線性地址空間，頁表共含1M個表項，每個表項占4個字節，那麽每個進程的頁表要占據4M的內存空間。為了節省頁表占用的空間，我們使用兩級頁表。每個進程都會被分配一個頁目錄，但是只有被實際使用頁表才會被分配到內存裏面。一級頁表需要一次分配所有頁表空間，兩級頁表則可以在需要的時候再分配頁表空間。

兩級頁表結構

兩級表結構的第一級稱為頁目錄，存儲在一個4K字節的頁面中。頁目錄表共有1K個表項，每個表項為4個字節，並指向第二級表。線性地址的最高10位(即位31~位32)用來產生第一級的索引，由索引得到的表項中，指定並選擇了1K個二級表中的一個表。
兩級表結構的第二級稱為頁表，也剛好存儲在一個4K字節的頁面中，包含1K個字節的表項，每個表項包含一個頁的物理基地址。第二級頁表由線性地址的中間10位(即位21~位12)進行索引，以獲得包含頁的物理地址的頁表項，這個物理地址的高20位與線性地址的低12位形成了最後的物理地址，也就是頁轉化過程輸出的物理地址。
技術分享兩級頁表結構

頁目錄項

技術分享頁目錄項結構

第31~12位是20位頁表地址，由於頁表地址的低12位總為0，所以用高20位指出32位頁表地址就可以了。因此，一個頁目錄最多包含1024個頁表地址。

第0位是存在位，如果P=1，表示頁表地址指向的該頁在內存中，如果P=0，表示不在內存中。
第1位是讀/寫位，第2位是用戶/管理員位，這兩位為頁目錄項提供硬件保護。當特權級為3的進程要想訪問頁面時，需要通過頁保護檢查，而特權級為0的進程就可以繞過頁保護。
第3位是PWT（Page Write-Through）位，表示是否采用寫透方式，寫透方式就是既寫內存（RAM）也寫高速緩存,該位為1表示采用寫透方式
第4位是PCD（Page Cache Disable）位，表示是否啟用高速緩存,該位為1表示啟用高速緩存。
第5位是訪問位，當對頁目錄項進行訪問時，A位=1。
第7位是Page Size標誌，只適用於頁目錄項。如果置為1，頁目錄項指的是4MB的頁面，請看後面的擴展分頁。
第9~11位由操作系統專用，Linux也沒有做特殊之用。

頁面項

技術分享頁面項結構
80386的每個頁目錄項指向一個頁表，頁表最多含有1024個頁面項，每項4個字節，包含頁面的起始地址和有關該頁面的信息。頁面的起始地址也是4K的整數倍，所以頁面的低12位也留作它用。
第31~12位是20位物理頁面地址，除第6位外第0～5位及9~11位的用途和頁目錄項一樣，第6位是頁面項獨有的，當對涉及的頁面進行寫操作時，D位被置1。
4GB的內存只有一個頁目錄，它最多有1024個頁目錄項，每個頁目錄項又含有1024個頁面項，因此，內存一共可以分成1024×1024=1M個頁面。由於每個頁面為4K個字節，所以，存儲器的大小正好最多為4GB。

線性地址到物理地址的轉換

技術分享 32位線性地址到物理地址的轉換

CR3包含著頁目錄的起始地址，用32位線性地址的最高10位A31~A22作為頁目錄的頁目錄項的索引，將它乘以4，與CR3中的頁目錄的起始地址相加，形成相應頁表的地址。
從指定的地址中取出32位頁目錄項，它的低12位為0，這32位是頁表的起始地址。用32位線性地址中的A21~A12位作為頁表中的頁面的索引，將它乘以4，與頁表的起始地址相加，形成32位頁面地址。
將A11~A0作為相對於頁面地址的偏移量，與32位頁面地址相加，形成32位物理地址。

擴展分頁

從奔騰處理器開始,Intel微處理器引進了擴展分頁,它允許頁的大小為4MB。
技術分享擴展分頁
在擴展分頁的情況下,分頁機制把32位線性地址分成兩個域：最高10位的目錄域和其余22位的偏移量。

頁面高速緩存

技術分享頁面高速緩存
由於在分頁情況下，每次存儲器訪問都要存取兩級頁表，這就大大降低了訪問速度。所以，為了提高速度，在386中設置一個最近存取頁面的高速緩存硬件機制，它自動保持32項處理器最近使用的頁面地址，因此，可以覆蓋128K字節的存儲器地址。當進行存儲器訪問時，先檢查要訪問的頁面是否在高速緩存中，如果在，就不必經過兩級訪問了，如果不在，再進行兩級訪問。平均來說，頁面高速緩存大約有98%的命中率，也就是說每次訪問存儲器時，只有2%的情況必須訪問兩級分頁機構。這就大大加快了速度。

Linux中的分頁機制

Linux使用了一個適合32位和64位系統的分頁機制。
技術分享 Linux分頁模型

頁全局目錄
頁頂級目錄
頁中間目錄
頁表

頁全局目錄包含若幹頁上級目錄的地址，頁上級目錄又依次包含若幹頁中間目錄的地址，而頁中間目錄又包含若幹頁表的地址。每一個頁表項指向一個頁框。線性地址因此被分成五個部分。圖中沒有顯示位數，因為每一部分的大小與具體的計算機體系結構有關。

對於沒有啟用物理地址擴展的32位系統，兩級頁表已經足夠了。從本質上說Linux通過使“頁上級目錄”位和“頁中間目錄”位全為0，徹底取消了頁上級目錄和頁中間目錄字段。不過，頁上級目錄和頁中間目錄在指針序列中的位置被保留，以便同樣的代碼在32位系統和64位系統下都能使用。內核為頁上級目錄和頁中間目錄保留了一個位置，這是通過把它們的頁目錄項數設置為1，並把這兩個目錄項映射到頁全局目錄的一個合適的目錄項而實現的。

啟用了物理地址擴展的32 位系統使用了三級頁表。Linux的頁全局目錄對應80×86 的頁目錄指針表（PDPT），取消了頁上級目錄，頁中間目錄對應80×86的頁目錄，Linux的頁表對應80×86的頁表。

最後，64位系統使用三級還是四級分頁取決於硬件對線性地址的位的劃分。

總結

這裏我們不討論代碼實現，只關註原理。從上面的討論可以看到分頁機制主要依賴硬件的實現。Linux采用的四級頁表只是為了最大化兼容不同的硬件實現，單就IA32架構的CPU來說，就有多種分頁實現，常規分頁機制，PAE機制等。

我們雖然討論的是Linux的分頁機制，實際上我們用了大部分篇幅來討論Intel CPU的分頁機制實現。因為Linux的分頁機制是建立在硬件基礎之上的，不同的平臺需要有不同的實現。Linux在軟件層面構造的虛擬地址，最終還是要通過MMU轉換為物理地址，也就是說，不管Linux的分頁機制是怎樣實現的，CPU只按照它的分頁實現來解讀線性地址，所以Linux傳給CPU的線性地址必然是滿足硬件實現的。例如說：Linux在32位CPU上，它的四級頁表結構就會兼容到硬件的兩級頁表結構。可見，Linux在軟件層面上做了一層抽象，用四級頁表的方式兼容32位和64位CPU內存尋址的不同硬件實現。

最後分享兩篇linux內存尋址的實驗文檔，結合實例更容易理解。
Linux內存地址映射
Linux內核在x86_64 CPU中地址映射

參考資料
《深入理解Linux內核》
《深入分析Linux內核源碼》

Linux內存尋址之分頁機制

緩存 itl ans linux 存儲器 apt target tar linux中 http://blog.xiaohansong.com/2015/10/05/Linux內存尋址之分頁機制/ 在上一篇文章Linux內存尋址之分段機制中，我們了解邏輯地址通過分段機制轉換為

Linux內存尋址之分頁機制