1. 程式人生 > >你還在為怎麼檢視位元組碼指令而擔憂嗎?

你還在為怎麼檢視位元組碼指令而擔憂嗎?

## 前言 我們平時編碼過程中,可能很少去檢視 Java 檔案編譯後的位元組碼指令。但是,不管你是因為對技術非常熱愛,喜歡刨根問底,還是想在別人面前裝X 。我認為,都非常有必要了解一下常見的位元組碼指令。這對於我們理解程式碼的執行原理也會很有幫助。 ## 註釋會被執行嗎? 比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也讓我漲了見識了。且看程式碼,可能會讓你懷疑人生~ ```java public class TestAnno { public static void main(String[] args) { String str = "張三"; // \u000d str="李四"; System.out.println(str); } } ``` 可以猜一下最終列印結果是什麼。我來告訴你,結果是: “李四”。What? 這是什麼神仙操作。為何會這樣,這被註釋的程式碼還能執行? 別光顧著吃驚,我們來看一下為什麼列印結果跟我們想象中的略有偏差。 仔細檢視,發現註釋行中,有一個 \u000d 。這是一個 unicode 碼,它代表的是一個換行符。因此,在執行後,就會把 ` str="李四" ` 這行程式碼換行到下一行,從而導致了它也被編譯執行。 有的小夥伴就說了,我怎麼知道你說的是真是假呢,你這不是瞎說呢嗎,一點說服力都沒有啊。 好吧,這就需要我們看一下編譯後的位元組碼了,編譯器總不能騙我們吧。 ## 檢視位元組碼的兩種方式 我們知道,通過 javac 命令,可以把 java 檔案編譯成 class 檔案。然後,想看它的位元組碼指令,需要用到 javap -c 反編譯一下。 但是,每次都通過命令列,還是有一些麻煩。因此,懶人福利來了。這裡我提供兩種方式,直接在 idea 中就可以檢視,非常的方便(果然,懶惰才是促使科技進步的原動力啊)。 ### 配置 External Tools 這種方式,其實就是先配置一下,JDK 中 javap 命令的位置,然後讓 idea 幫我們自動執行 javap 命令。 找到 idea 的選單欄,File --> Settings 。然後找到 External Tools 。 ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095455940-2013311215.jpg) 點選加號,新增一個 tool ,裡邊的配置項,如下, ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095456198-1325913814.jpg) * Name,就給當前 tool 起一個名字好了,用於使用時,在右鍵選單選項中展示。 * Decriptions,描述此功能,別到時候你自己都忘了當前配置這個東西是用來幹嘛的了。 * Program:電腦本機 javap 命令的絕對路徑。 * Arguments:填寫 -c \$FileNameWithoutExtension\$.class 就可以,代表編譯的class檔案。 * Working directory:填寫 \$OutputPath\$/\$FileDirRelativeToSourcepath\$ ,代表class檔案的工作目錄。 配置完成了,可以在idea中,直接右鍵,選擇配置中 Name 對應的選項。 ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095456452-1188476716.jpg) 此時 ,就可以打印出當前類編譯後的位元組碼指令。 ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095456729-1624802025.jpg) 我們稍後再來分析裡邊的具體含義。下邊,還有另外一種使用外掛的方式,來檢視位元組碼。而且功能更加強大。 ### jclasslib bytecode viewer 外掛 同上,在 idea 的 setting 選單,找到 Plugins 外掛項,然後搜尋這個外掛。 ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457019-1083129596.jpg) 安裝之後,並重啟 idea ,就可以生效了。 使用的時候,在 View 選單,找到 show bytecode with jclasslib。 ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457479-423012352.jpg) 它可以檢視基本資訊,常量池,介面,屬性,方法等資訊。如下,找到我們對應的 main 方法。 ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457751-456029105.jpg) 這個外掛還有一個好處,就是當我們不知道某個指令是什麼意思的時候,直接滑鼠在指令上邊單擊,就可以連結到官方的解釋。如,不知道第一行 ldc 什麼意思,直接單擊 ldc 就可以跳轉到 oracle 官網對應命令的解釋。這非常有利用我們學習此命令。 ![](https://img2020.cnblogs.com/other/1714084/202005/1714084-20200508095457983-939040830.jpg) ## 常用位元組碼指令 以上兩種方式,都挺方便的,根據自己喜好自由選擇就好了。 相信你肯定也被很多位元組碼指令搞的一頭霧水過,接下來,我們就一起學習下常用的指令都有哪些吧。之後,再來看上邊的例子就輕鬆很多了。 ### 資料型別 我們知道 Java 是強型別語言,在使用之前肯定已經確定了它的型別。而資料型別,無非就是基本資料型別和引用型別。它們對應的位元組碼,其實就是用它們的對應型別的英文首字母來表示的。(引用型別除外) 例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。 ### 載入和儲存指令 我們知道,一個方法的執行,會在棧的棧幀中執行。方法中的變數稱為區域性變數,數的操作需要用到運算元棧。因此,載入和儲存指令,就是資料在區域性變量表和運算元棧中來回傳輸。 將一個區域性變數載入到運算元棧:如 iload、iload\_ 。表示載入的是 int 型別變數。 iload\_ 後邊帶數字代表第幾個 int 型變數。例如 iload\_0 代表把第一個 int 型區域性變數載入到運算元棧。 其他型別變數同上: lload ,fload ,dload,aload 。 將一個數值儲存到區域性變量表: istore,istore\_,lstore,lstore\_,fstore,fstore\_,dstore,dstore\_,astore,astore\_ 。 將一個常量載入到運算元棧: aconst_null,iconst\_m1,iconst\_,lconst\_,fconst\_,dconst\_ ,bipush,sipush。 ldc 代表把 int、float、String型別常量從常量池中載入到運算元棧。 ldc_w 代表寬索引。 ldc2_w 代表把 long 或 double 型別常量從常量池中載入到運算元棧。(寬索引) 這裡需要說的是,int 型別根據數值的取值範圍不同,而採用不同的位元組碼指令。 iconst\_m1 代表 -1 ,iconst\_ 代表 0~5 。bipush 代表 -128~127(byte取值範圍), sipush 代表 -32768~32767(short取值範圍),ldc 在 int 中代表 -2147483648~2147483647(int取值範圍)。 ```java public class TestByteCode { public static void main(String[] args) { int a = -1; int b = 0; int c = 1; int d = 2; int e = 3; int f = 4; int g = 5; int h = 127; int i = 32767; int j = 2147483647; } } ``` 其位元組碼為: ``` 0 iconst_m1 1 istore_1 2 iconst_0 3 istore_2 4 iconst_1 5 istore_3 6 iconst_2 7 istore 4 9 iconst_3 10 istore 5 12 iconst_4 13 istore 6 15 iconst_5 16 istore 7 18 bipush 127 20 istore 8 22 sipush 32767 25 istore 9 27 ldc #2 <2147483647> 29 istore 10 31 return ``` ### 訪問指令 訪問類欄位:getstatic,putstatic 訪問類例項欄位:getfield,putfield ### 方法呼叫和返回 * invokevirtual : 用於呼叫物件的例項方法。 * invokeinterfce: 用於呼叫介面方法。 * invokespecial:用於呼叫一些特殊的方法,如父類構造方法,例項初始化方法,私有方法。 * invokestatic:用於呼叫類的靜態方法。 * invokedynamic:用於呼叫動態方法。 方法返回是跟返回型別相關,根據不同的返回型別,有不同的指令。 * return:返回 void。 * ireturn:注意,這個不止返回 int ,返回 boolean,byte,char,short 也用這個指令。其實,很多指令都沒有直接支援 byte,char,short和 boolean,而是用 int 型別代替。這是因為,虛擬機器的操作碼長度只有一個位元組,只能表示有限個數的指令。(我們這裡所提到的所有指令,都只是方便我們記憶的助記符,而在計算機內部肯定還是一個位元組,即 8 個 bit 位的二進位制) * lreturn:返回 long 型別。 * freturn:返回 float 型別。 * dreturn:返回 double 型別。 * areturn:返回引用型別。 ## 其餘位元組碼指令 上邊介紹的指令只是很少一部分位元組碼指令。但是,麻雀雖小,五臟俱全,也包括了最基本的變數定義,呼叫方法,和方法返回這些最基本的功能。同時,也足夠我們去解釋上邊的問題,為什麼註釋行會被執行了。 > 更多的位元組碼指令可以參考《深入理解Java虛擬機器》這本書的 6.4 節,和最後的附錄位元組碼指令表。需要這本書的,可以微信搜尋到我《煙雨星空》,後臺回覆“Java虛擬機器”。 由於位元組碼指令太多,比如還有運算指令,包括加減乘除、位運算,比較指令等,if 等控制指令,型別強轉指令,還有多執行緒用到的同步鎖。And so on ~ 不可能把它們全部記住背會,但是,其實都是由規律可循的,很多都是見名知意,用各種英文首字母簡寫代表。比如,int型別的加法運算,就是 iadd,double 型別的減法運算是 dsub。等等。 因此,我這裡只是給了一個引子,重要的還是需要自己去尋找方法,不斷的實踐探索 ~ 另外,官方文件才是最好的學習途徑:[https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html](https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html) ## 註釋行位元組碼 最後,學以致用,實踐出真知。我們一起看一下開頭丟擲的問題吧,為什麼註釋行會被執行。看一下它的位元組碼指令就知道了。 ```java public class TestAnno { public static void main(String[] args) { String str = "張三"; // \u000d str="李四"; System.out.println(str); } } ``` ```java //這裡就是從常量池中取出一個字串“張三”,然後載入到運算元棧 0 ldc #2 <張三> //從運算元棧把這個字串引用儲存到區域性變量表中 2 astore_1 //從常量池中取出一個字串“李四”,然後載入到運算元棧 3 ldc #3 <李四> //可以發現和上邊一樣都是astore_1,說明指向的是同一個引用 str。 //若定義另外一個str2賦值給“李四”,這個操作指令肯定就不同了。 5 astore_1 //訪問的是System類的靜態屬性out,我們知道它的型別是PrintStream 6 getst