1. 程式人生 > >進入保護模式(二)——《x86組合語言:從真實模式到保護模式》讀書筆記14

進入保護模式(二)——《x86組合語言:從真實模式到保護模式》讀書筆記14

首先來段題外話:之前我發現我貼出的程式碼都沒有行號,給講解帶來不便。所以從現在起,我要給程式碼加上行號。我寫部落格用的這個插入程式碼的外掛,確實不支援自動插入行號。我真的沒有找到什麼好方法,無奈之下,只能按照網友的說法,在VIM中給每行程式碼加上行號,然後再貼出來。

在VIM中每一行都新增上行號的方法是:

:%s/^/\=line(".")/

對,只要執行這個命令就可以了。至於為什麼這樣寫,可以參考我的另一篇博文

(五)設定PE位

44         cli                                ;保護模式下中斷機制尚未建立,應 
45                                            ;
禁止中斷 46 mov eax,cr0 47 or eax,1 48 mov cr0,eax ;設定PE位

第44行,用於關中斷。因為保護模式下的中斷和真實模式不同,所以原來的中斷向量表不再適用,BIOS中斷也不能再用,因為它們都是真實模式下的程式碼。在重新配置保護模式下的中斷環境之前,我們必須關中斷。

CR0是處理器內部的一個控制暫存器,也是32位的(如下圖,圖片來自趙炯的《Linux核心完全剖析》)。

它的bit0是保護模式允許位(Protection Enable,PE)。當PE=1時,則處理器進入保護模式。

cr0

第46~48用於設定CR0的bit0為1.

(六)關於段暫存器

我們知道,32位模式下,段暫存器有CS,DS,ES,SS,FS,GS. 這些段暫存器每個都分為2個部分,一個是16位的可見部分,一個是隱藏部分,稱為描述符快取記憶體器,用來存放段的線性基地址、段界限和段屬性。如下圖:

New0002段暫存器的格式

1.真實模式下的記憶體訪問

在32位處理器上的真實模式下,假如執行下面的程式碼。

mov cx,0x2000
mov ds,cx
mov [0xc0],al

CPU在把0x2000傳送到DS的同時,還會把0x2000左移4位(0x20000),傳送到DS描述符快取記憶體暫存器(段基地址部分僅低20位有效,高12位全部是0)。此後,只要不改變DS的內容,那麼每次訪問記憶體都直接使用DS描述符快取記憶體暫存器的內容作為段地址。

2.保護模式下的記憶體訪問

在保護模式下,真實模式的6個段暫存器叫做“段選擇器”。儘管在訪問記憶體的時候也要指定一個段,但是傳送到段選擇器的內容不是邏輯段地址,而是段選擇子(也叫段選擇符)

如下圖(圖片來自趙炯的《Linux核心完全剖析》)所示,段選擇子由三部分組成。

  • 請求特權級RPL(Requested Privilege Level):提供了段保護資訊,我們以後會學習。現在只需設定為00即可。
  • 表指示標誌TI(Table Index):TI=0時,表示描述符在GDT中;TI=1時,表示描述符在LDT(我們以後會學習)中。
  • 索引值(Index):描述符在GDT或者LDT中的索引項號。

段選擇子

為了說明保護模式下的記憶體訪問,我們回到程式碼。

56         mov cx,00000000000_10_000B         ;載入資料段選擇子(0x10)
57         mov ds,cx
58
59         ;以下在螢幕上顯示"Protect mode OK." 
60         mov byte [0x00],'P'  
61         mov byte [0x02],'r'
62         mov byte [0x04],'o'
63         mov byte [0x06],'t'
64         mov byte [0x08],'e'
65         mov byte [0x0a],'c'
66         mov byte [0x0c],'t'

第56、57行,將段選擇子10000b傳到段選擇器DS中,從段選擇子可以看出,RPL=0;TI=0(表示GDT);索引號為2;

當處理器執行任何改變段選擇器的指令時(比如mov、jmp far、call far、iret、retf等),就將指令中提供的索引號*8作為偏移地址,同GDTR暫存器中的線性基地址相加,然後訪問GDT。如果沒有什麼問題(比如超過了GDT的界限),就把找到的描述符載入到不可見的描述符快取記憶體暫存器。此後,每當有訪問記憶體的指令時,就不再訪問GDT中的描述符,而是直接使用段暫存器的描述符快取記憶體暫存器。

結合程式碼來說,第57行,處理器把2*8(=16)作為偏移地址,同GDTR的內容(內容為0x00007e00)相加,得到0x0000_7e16,根據這個地址找到描述符(就是我們之前建立的#2描述符)

27         ;建立#2描述符,保護模式下的資料段描述符(文字模式下的顯示緩衝區) 
28         mov dword [bx+0x10],0x8000ffff     
29         mov dword [bx+0x14],0x0040920b

然後,把這個描述符載入到快取記憶體暫存器(包括線性基地址0x000b8000,段界限,段屬性)。

第60行,執行這條指令時,處理器用DS描述符快取記憶體暫存器中的線性基地址(0x000b8000,文字模式的視訊記憶體起始地址)加上指令中的偏移量0x00,形成32位的實體地址0x000b8000,並將字元‘P’寫入該處。

不僅僅是訪問資料段,處理器訪問程式碼段取指令的時候,也是採用相同的方法。假設CS描述符快取記憶體暫存器已經裝載了正確的32位線性基地址,那麼處理器取指令的時候,會使用CS描述符快取記憶體暫存器中的32位線性基地址加上EIP中的偏移量,構成32位的實體地址,根據這個實體地址從記憶體中取得指令。

(七)清空流水線並序列化處理器

正如前文所述,即使在真實模式下,段暫存器的快取記憶體暫存器也被用於訪問記憶體。當處理器進入保護模式後,快取記憶體暫存器的內容依然殘留,但是這些內容在保護模式下是無效的。因此,比較安全的做法是儘快重新整理段選擇器,包括描述符快取記憶體暫存器。

另外,在進入保護模式之前,很多指令已經進入了流水線。因為處理器工作在真實模式下,所以它們都是按照16位運算元和地址長度進行譯碼的,即使是那些用bits32編譯的指令,為了防止執行結果不正確,所以必須清空流水線。還用,那些通過亂序執行得到的中間結果也是無效的,所以必須清理掉,讓處理器串化執行。

為了達到上述目的,我們可以採用遠轉移指令jmp或者遠過程呼叫指令call。遇到這類指令,處理器一般會清空流水線並且串化執行;另一方面,遠轉移會重新載入CS,並重新整理描述符快取記憶體暫存器的內容。所以,強烈建議在設定了PE位後,立刻用jmp或者call轉移到當前指令流的下一條指令上。

於是程式碼中有:

50         ;以下進入保護模式... ...
51         jmp dword 0x0008:flush             ;16位的描述符選擇子:32位偏移
52                                            ;清流水線並序列化處理器 
53         [bits 32] 
54
55    flush:
56         mov cx,00000000000_10_000B         ;載入資料段選擇子(0x10)
57         mov ds,cx

這條指令和位於它前面的指令一樣,是預設用[bits 16]編譯的。但是因為使用了關鍵字dword(注意:這裡的dword是修飾偏移地址flush的),所以編譯後的偏移地址是32位的。

如果51行這樣寫:

51         jmp  0x0008:flush             ;16位的描述符選擇子:16位偏移

這樣寫是不嚴謹的。因為這樣編譯出來的目標地址是16位的。如果flush代表的地址是0x12345678,那麼編譯後會被截斷成為0x5678,這顯然是錯的。所以這個跳轉一定要加dword.

注意:因為設定了PE位,所以現在已經處於保護模式下了。所以處理器會把第一個運算元(0x0008)理解為段選擇子,而不是是模式下的邏輯段基址。當51行的指令執行時,處理器會把選擇子0x0008(索引號為1,TI=0,RPL=00)載入到CS,並把#1描述符(定義了一個程式碼段,基地址是0x7c00,段界限是0x1ff,長度為0x200)載入到CS描述符快取記憶體暫存器中。所以程式會轉移到基地址為0x0000_7c00的程式碼段內的某個位置執行。這個位置取決於偏移地址。偏移地址就是標號flush的彙編地址(因為指定了dword,所以編譯後是32位的),處理器會用這個32位的數值來代替EIP的原有內容。於是,程式就轉移到flush處了。

第53行,使用了偽指令[bits 32],從這以後,指令是按照32位編譯的。因為指令執行到這裡的時候,已經真真正正地進入了保護模式了。

(八)進入保護模式的主要步驟

我們總結一下進入保護模式的主要步驟:

1.安裝段描述符,構造GDT

2.用lgdt指令載入GDTR

3.開啟A20

4.設定CR0的PE位為1

5.跳轉,真正進入保護保護模式。

(九)在螢幕上顯示字元

55    flush:
56         mov cx,00000000000_10_000B         ;載入資料段選擇子(0x10)
57         mov ds,cx
58
59         ;以下在螢幕上顯示"Protect mode OK." 
60         mov byte [0x00],'P'  
61         mov byte [0x02],'r'
62         mov byte [0x04],'o'
63         mov byte [0x06],'t'
64         mov byte [0x08],'e'
65         mov byte [0x0a],'c'
66         mov byte [0x0c],'t'
67         mov byte [0x0e],' '
68         mov byte [0x10],'m'
69         mov byte [0x12],'o'
70         mov byte [0x14],'d'
71         mov byte [0x16],'e'
72         mov byte [0x18],' '
73         mov byte [0x1a],'O'
74         mov byte [0x1c],'K'

56、57行,前文已經說過,令DS指向文字模式的顯示緩衝區。

60~74行,就是在螢幕左上角顯示"Protect mode OK." 需要說明的是:不管是真實模式還是保護模式,外圍裝置是不受影響的。

最後注意一點:

保護模式下,不允許使用mov指令改變段暫存器CS的內容。比如

mov cs,ax

這樣寫是不對的。這樣做會導致處理器產生一個無效操作碼的異常中斷。