1. 程式人生 > >從零開始設計指令集的過程

從零開始設計指令集的過程

前一篇文章簡單介紹了我的指令集和虛擬機器,這篇文章介紹指令集的設計過程。

設計指令集

這裡我一步步說明目前指令的設計過程,這些指令大多已經確定,也有一些是臨時加入,還沒有驗證實用性。

希望看到這篇文章的讀者能多多給我提建議,讓我的虛擬指令能從玩具變成實用品。

針對軟體設計的虛擬指令集

在設計指令前,我就確定了設計的原則:

  1. 首先,我的指令不是用來做硬體電路,而是用C語言和彙編解釋執行的,所以指令要設計得使軟體虛擬機器能儘可能快地執行。
  2. 對於虛擬機器,執行的最小單位是每條指令,每條指令前要取指和翻譯,指令後要更改PC(程式計數器)的值,這也是虛擬指令相比原生程式碼的一部分累贅。因此一條虛擬指令內執行的事越多,效能就可以越接近原生程式碼。所以指令並非越簡單越好,複雜是有必要也有收益的。反過來說就是要減少一個操作所需要的指令數。
  3. 指令越短越好。這不僅能減小程式大小,也使虛擬機器取指令更快。
  4. 固定的東西越多,執行越快。這是因為變數需要讀取記憶體。例如在指令中取虛擬機器暫存器R[rx]和固定的R[3]是不同的,因為rx需要再讀一次值才能確定。然而為了更靈活的功能,變數常常是必須,只能自行權衡。

省著分配opcode

在增加指令前,還要考慮指令的數量,由此確定操作碼(opcode)需要的位數。為了加快指令譯碼,我將操作碼定為1位元組,因此可以表示256種不同的指令。

但這256個位置不是都用來表示指令,我將操作碼 0 認定為空異常,而255是程式結束符。這是因為0x00和0xFF經常出現在程式中,可以檢測程式是否執行到非法的地方。

這樣還剩254個指令,這裡我按設計順序列為

  1. 立即數指令
  2. 移動指令
  3. 加減運算
  4. 跳轉、分支
  5. 函式呼叫
  6. 記憶體讀取儲存
  7. 移位、位運算
  8. 系統指令
  9. 暫存器視窗操作
  10. 結束符

指令說明

在介紹指令前我先解釋文中表示指令的格式,表格裡靠左的是低地址位元組,每格里靠左是低位。

第一大格為操作碼,佔1byte即8bit,中格一般是“r”開頭的暫存器佔4bit,一小格代表1bit。

藍色的代表立即數,也就是在指令中的常數;橙色的代表偏移或地址,用於跳轉指令。


 

空指令

首先加入的是最簡單的空操作指令,只需一個opcode。

nop代表什麼都不做,這條指令在硬體系統中可能會用來調節流水線,但在我的虛擬機器中,應該是沒用的。

立即數指令

之後設計的是向暫存器寫入立即數的指令,因為這是一臺機器基本功能的“輸入-執行-輸出”中開頭的部分,對應程式中的常數量。

因為很多時候時候都需要設定像-1,0,1,2這樣不大的常數,所以這種常用指令應該比較短。

此外也要考慮使用使用大常數的情況。在x86,JAVA等大多數程式中都設定一塊常數池,執行時查表取數。

我沒有采用常量池的方法,因為我不想多查表,所以考慮後的結果是把立即數都存指令裡,分別設計了4條獲取立即數的指令:

表示立即數時,我用s代表有符號(signed),u為無符號(unsigned),後接數字代表位長。s8就對應char,s16為short。

暫時沒有set rd,u32,因此沒辦法表示u32。這不一定是問題,如果虛擬機器是32位,那麼s32和u32在資料上沒有差別。如果是64位還要再考慮要不要加。

rd表示目標暫存器,rd後面是空的,因為我為了讀取和譯碼效率,儘量對齊立即數,這裡空出的4位未來也可能用上。

移動暫存器指令

之後加入的是移動暫存器指令。

非常簡單,rd目標暫存器,rs來源暫存器。

加減運算指令

加減是機器功能的基礎,所以也在一開始就加入了。

先加入的有自增,立即數加法和暫存器加法。

inc指令雖然叫自增,事實上可以運算[-8,7]的範圍。

add是一個只有兩個操作暫存器的運算指令,相當於rd+=rs。因為這種運算經常出現,所以添加了這條指令,可以縮小指令大小。

add2中的2代表"To",rs1和rs2加到rd的意思。

而sub和sub2是最後才加入的。

跳轉指令

跳轉也是計算機功能中的基礎,我設了兩條相對跳轉和一條絕對跳轉指令。

計劃將jump_32也改成相對跳轉。

在VL指令集中,跳轉代表無條件跳轉,分支代表有條件跳轉。

分支指令

在x86中,分支是通過先測試暫存器值,設定標誌位,然後根據標誌位跳轉。

我的虛擬機器沒有采用標誌位的方法,是類似於MIPS的無標誌位跳轉。

這會導致分支指令佔據指令總量的一大部分,為了讓分支少一兩句程式碼,我覺得值。

目前只有和0、整數、暫存器的比較分支,各分為相等分支,不相等分支,大於分支,大於等於分支。這部分還在變動階段,後續會大量改動。

指令格式如下(長度分別為 4,4,6位元組):

這些指令分別有beq/bne/bgt/bgeq共四組。

這裡offset20並沒有遵循對齊的原則,因為我受到4位空間的誘惑,選擇了將16位向前拓展4位而不是向後拓展16位。因此也意味著offset20分支最大隻能跳轉前後512KB的程式大小,而offset16只能前後跳轉32KB。

雖然似乎非常受限,但是因為分支指令在程式中經常出現且一般範圍不大,所以我儘量壓縮它們的大小。

除了這個原因,遠距離分支的問題也可以通過反轉分支條件並在分支後接一條遠跳轉指令的方法來解決。

 

函式指令

到函式這部分可以說指令設計已經到了高階階段。

首先是函式呼叫,通常函式呼叫就是儲存PC,然後跳轉。因為我的虛擬機器是基於暫存器視窗的,所以我的呼叫還要移動視窗。

函式呼叫指令會使虛擬機器執行一系列操作:

  1. 將視窗後移。
  2. 把PC儲存到視窗前一個暫存器。(移動視窗和儲存PC的順序可以調換)
  3. 將PC跳轉到函式地址。

參考上一篇文章中的這張圖:

所以,呼叫指令中需要指定視窗移動量,還要包含函式的地址。

我設計了兩條指令,xcall是可控制視窗移動量的超級呼叫;call則是固定移動14個暫存器的普通呼叫,用這條指令來節約程式大小並減少取碼加快執行。

我也在考慮將address32改為offset32。

函式返回

返回指令的功能是和呼叫正相反:

  1. 將之前的PC從視窗前一個暫存器取出。
  2. 將視窗移回。
  3. PC跳回之前的PC。

其實,如果在呼叫時,將視窗移動量也儲存在視窗前,那麼返回時就可以不用設定移動量,而是像PC一樣讀取。但考慮到暫存器佔用問題,我還沒有加入這樣的指令。如果有了堆疊,就可以將PC和移動量都儲存到棧中了,這些就之後再說。

此外,現在移動量都是寫死的值,如果可以使用暫存器值在函式呼叫時控制視窗移動量,程式靈活性會更高,這些也還在考慮中。

記憶體儲存讀取

記憶體的讀寫操作也是程式很重要的需求,放到現在是因為最開始不敢貿然確立。所謂記憶體操作就是暫存器到記憶體,記憶體到暫存器,還有記憶體到記憶體。

在精簡指令集中,記憶體操作限定為一個load和一個store,不僅減少了指令也大大簡化電路設計。

而在英特爾指令集中,有很多記憶體指令,可以對指標地址和內容進行運算再讀寫。根據上面列出的第二點原則,我希望這些指令功能往復雜方向走。

目前的指令如下:

其中每種指令都對應了8位,16位,32位這三種情況,載入指令還分有符號和無符號數。他們的彙編語法格式為:

-*讀取記憶體
load rd,[rs].s8
load rd,[rs].u8
load rd,[rs].s16
load rd,[rs].u16
load rd,[rs].s32
load rd,[rs].u32
-*寫入記憶體
save rd,[rs].8
save rd,[rs].16
save rd,[rs].32

-*讀取記憶體 自增
load rd,[rs+s8].s8
load rd,[rs+s8].u8
load rd,[rs+s8].s16
load rd,[rs+s8].u16
load rd,[rs+s8].s32
-*寫入記憶體 自增
save rd,[rs+s8].8
save rd,[rs+s8].16
save rd,[rs+s8].32

其中savef/loadf都會對源暫存器的地址進行自增,這樣的指令在順序讀取中可以減少指令數。

為了複雜的目標,我還準備加入load rd,[rs+rx].s8這樣的三暫存器指令,還有從記憶體到記憶體的copy指令 copy [rd],[rs]。

在那之前,大家已經可以看到其代價也非常大,在現在不支援浮點數的情況下,記憶體指令就已經有18條,如果加上[rs+rx](9條)和copy(6條)等指令,起碼會有33條指令。若再加上浮點數那真是爆炸了,所以我也在考慮是否有必要,還要看後續指令空間是否有剩餘。

為什麼將暫存器存到記憶體指令叫save不叫store? 因為load和save都是四個字母,對齊好看。

系統指令

系統指令是虛擬機器的魔法,也是促使我一直做到現在的動力。

虛擬機器特點就在“虛擬”二字,在虛擬機器中宛如隔世,對真實世界一無所知。而系統指令,讓虛擬機器可以訪問真實系統裡的資訊,建起了真實與虛擬間的橋。

此外,虛擬機器對虛擬機器中執行程式而言也是“系統”,因此係統指令也包括程式對虛擬機器的訪問指令,例如讀取虛擬機器的暫存器視窗指標(RP),PC,SP,error等特殊暫存器:

其中vreg是指虛擬機器的特殊暫存器。

addvi指令的用途在於,由於程式檔案是載入到記憶體中的隨機地址中,所以要讀取儲存在程式檔案中的資料塊data,只能通過相對程式頭部或相對某指令偏移的方法,通過addvi指令就可以rd=pc+offset,從而獲取到資料塊的地址。

而真正賦予虛擬機器能力的是系統呼叫指令,讓虛擬機器站在巨人的肩膀上。

系統呼叫是呼叫C函式執行操作,例如分配記憶體,輸出文字到控制檯,從控制檯獲取輸入等,這些函式使虛擬機器連線到了真實世界中。

系統呼叫不同於虛擬機器內函式呼叫,它執行在C環境中,所以不用移動暫存器視窗,系統函式直接從視窗內獲取引數並將結果寫入視窗內。

目前function是8位的空間,所以可以容納256種系統呼叫。

目前的系統函式簡單封裝了malloc/free/resize/printf/scanf,後續會繼續完善。

移位操作指令

移位共有左移位(shl)、右算術移位(shr)和右邏輯移位(ushr)三種類型。

我認為移位是很常用的功能,所以每種移位我都給了4條指令。總共12條指令。

位運算指令

 位運算有“與”、“或”、“異或”和一個還未新增的“非”指令。

如果加上一條非指令not rd,共有10條指令。

乘除法指令

乘數法指令格式類似於加減法。但立即數乘除法都只設計了8位的立即數,而沒有16位和32位,我還在考慮他們的實用性。

除法格式相同。

程式結束指令

 這個放在最後寫,有始有終。與真實系統不同,真實系統從開機開始就一直在執行指令,不需要停止,而虛擬機器就像一個程式,通常都會有執行結束的時候。

所以我使用END符代表結束,opcode=0xFF,虛擬機器碰到這個指令就會正常的結束退出。

 


 

接下來

至此,我已經介紹完所有已確定的和未列入集的指令,總共有73條。之後,我打算先測試目前指令的實用性,然後謹慎新增需要的指令。

計劃加入浮點數和可能增加的棧指令後,指令總數在180之內,最後考慮新增向量指令。

指令集大致確定之後,我就開始編寫虛擬機器程式碼,下一篇文章將會記錄LVM虛擬機器的實現過程和優化心得。

 

&n