Linux下邏輯地址-線性地址-實體地址圖解

阿新 • • 發佈：2019-01-09

轉載：http://blog.csdn.net/wxzking/article/details/5905214

一、邏輯地址轉線性地址

機器語言指令中出現的記憶體地址，都是邏輯地址，需要轉換成線性地址，再經過MMU(CPU中的記憶體管理單元)轉換成實體地址才能夠被訪問到。

我們寫個最簡單的hello world程式，用gccs編譯，再反編譯後會看到以下指令：

mov 0x80495b0, %eax

這裡的記憶體地址0x80495b0 就是一個邏輯地址，必須加上隱含的DS 資料段的基地址，才能構成線性地址。也就是說0x80495b0 是當前任務的DS資料段內的偏移。

在x86保護模式下，段的資訊（段基線性地址、長度、許可權等）即段描述符

佔8個位元組，段資訊無法直接存放在段暫存器中（段暫存器只有2位元組）。Intel的設計是段描述符集中存放在GDT或LDT中，而段暫存器存放的是段描述符在GDT或LDT內的索引值(index)。

Linux中邏輯地址等於線性地址。為什麼這麼說呢？因為Linux所有的段（使用者程式碼段、使用者資料段、核心程式碼段、核心資料段）的線性地址都是從 0x00000000 開始，長度4G，這樣線性地址=邏輯地址+ 0x00000000，也就是說邏輯地址等於線性地址了。

這樣的情況下Linux只用到了GDT，不論是使用者任務還是核心任務，都沒有用到LDT。GDT的第12和13項段描述符是__KERNEL_CS 和__KERNEL_DS，第14

和15項段描述符是 __USER_CS 和__USER_DS。核心任務使用__KERNEL_CS 和__KERNEL_DS，所有的使用者任務共用__USER_CS 和__USER_DS，也就是說不需要給每個任務再單獨分配段描述符。核心段描述符和使用者段描述符雖然起始線性地址和長度都一樣，但DPL(描述符特權級)是不一樣的。__KERNEL_CS 和__KERNEL_DS 的DPL值為0（最高特權），__USER_CS 和__USER_DS的DPL值為3。

用gdb除錯程式的時候，用info reg 顯示當前暫存器的值：

cs 0x73 115

ss 0x7b 123

ds 0x7b 123

es 0x7b 123

可以看到ds值為0x7b, 轉換成二進位制為 00000000 01111011，TI欄位值為0,表示使用GDT，GDT索引值為 01111，即十進位制15，對應的就是GDT內的__USER_DATA 使用者資料段描述符。

從上面可以看到，Linux在x86的分段機制上執行，卻通過一個巧妙的方式繞開了分段。

Linux主要以分頁的方式實現記憶體管理。

二、線性地址轉實體地址

前面說了Linux中邏輯地址等於線性地址，那麼線性地址怎麼對應到實體地址呢？這個大家都知道，那就是通過分頁機制，具體的說，就是通過頁表查詢來對應實體地址。

準確的說分頁是CPU提供的一種機制，Linux只是根據這種機制的規則，利用它實現了記憶體管理。

在保護模式下，控制暫存器CR0的最高位PG位控制著分頁管理機制是否生效，如果PG=1，分頁機制生效，需通過頁表查詢才能把線性地址轉換實體地址。如果PG=0，則分頁機制無效，線性地址就直接做為實體地址。

分頁的基本原理是把記憶體劃分成大小固定的若干單元，每個單元稱為一頁（page），每頁包含4k位元組的地址空間（為簡化分析，我們不考慮擴充套件分頁的情況）。這樣每一頁的起始地址都是4k位元組對齊的。為了能轉換成實體地址，我們需要給CPU提供當前任務的線性地址轉實體地址的查詢表，即頁表(page table)。注意，為了實現每個任務的平坦的虛擬記憶體，每個任務都有自己的頁目錄表和頁表。

為了節約頁表佔用的記憶體空間，x86將線性地址通過頁目錄表和頁表兩級查詢轉換成實體地址。

32位的線性地址被分成3個部分：

最高10位 Directory 頁目錄表偏移量，中間10位 Table是頁表偏移量，最低12位Offset是物理頁內的位元組偏移量。

頁目錄表的大小為4k（剛好是一個頁的大小），包含1024項，每個項4位元組（32位），專案裡儲存的內容就是頁表的實體地址。如果頁目錄表中的頁表尚未分配，則實體地址填0。

頁表的大小也是4k，同樣包含1024項，每個項4位元組，內容為最終物理頁的實體記憶體起始地址。

每個活動的任務，必須要先分配給它一個頁目錄表，並把頁目錄表的實體地址存入cr3暫存器。頁表可以提前分配好，也可以在用到的時候再分配。

還是以 mov 0x80495b0, %eax 中的地址為例分析一下線性地址轉實體地址的過程。

前面說到Linux中邏輯地址等於線性地址，那麼我們要轉換的線性地址就是0x80495b0。轉換的過程是由CPU自動完成的，Linux所要做的就是準備好轉換所需的頁目錄表和頁表（假設已經準備好，給頁目錄表和頁表分配實體記憶體的過程很複雜，後面再分析）。

核心先將當前任務的頁目錄表的實體地址填入cr3暫存器。

線性地址 0x80495b0 轉換成二進位制後是 0000 1000 0000 0100 1001 0101 1011 0000，最高10位0000 1000 00的十進位制是32，CPU檢視頁目錄表第32項，裡面存放的是頁表的實體地址。線性地址中間10位00 0100 1001 的十進位制是73，頁表的第73項儲存的是最終物理頁的物理起始地址。物理頁基地址加上線性地址中最低12位的偏移量，CPU就找到了線性地址最終對應的實體記憶體單元。

我們知道Linux中使用者程序線性地址能定址的範圍是0 － 3G，那麼是不是需要提前先把這3G虛擬記憶體的頁表都建立好呢？一般情況下，實體記憶體是遠遠小於3G的，加上同時有很多程序都在執行，根本無法給每個程序提前建立3G的線性地址頁表。Linux利用CPU的一個機制解決了這個問題。程序建立後我們可以給頁目錄表的表項值都填0，CPU在查詢頁表時，如果表項的內容為0,則會引發一個缺頁異常，程序暫停執行，Linux核心這時候可以通過一系列複雜的演算法給分配一個物理頁，並把物理頁的地址填入表項中，程序再恢復執行。當然程序在這個過程中是被矇蔽的，它自己的感覺還是正常訪問到了實體記憶體。

Linux下邏輯地址-線性地址-實體地址圖解

Linux下邏輯地址-線性地址-實體地址圖解

Linux下邏輯地址、線性地址、實體地址詳細總結

Linux下如何修改網卡MAC地址

Linux下使用iptables禁止指定IP地址的網路連線

作業系統_邏輯地址轉換為實體地址

linux下修改網絡卡MAC地址

Linux下Java獲取本機IP地址

利用bochs將邏輯地址轉化為實體地址理解作業系統的分段分頁機制

Linux 下的ipcalc命令掩碼地址轉換

Linux下由域名程式設計解析ip地址（段錯誤(吐核)）

作業系統的分段與邏輯地址和轉換實體地址

LINUX下獲取網絡卡IP地址和MAC地址，子網掩碼程式參考

MIT6.828 虛擬地址轉化為實體地址——二級分頁

linux下邏輯卷建立

Linux下搭建Redis分散式叢集（詳細圖解演示）

Linux下搭建Zookeeper分散式叢集（詳細圖解演示）

Linux核心的虛擬地址、邏輯地址、線性地址、實體地址的區別

linux記憶體管理---虛擬地址邏輯地址線性地址實體地址的區別（一）

Linux記憶體管理－虛擬地址、邏輯地址、線性地址、實體地址的區別

LINUX 邏輯地址、線性地址、虛擬地址和實體地址

Linux下邏輯地址-線性地址-實體地址圖解

相關推薦