1. 程式人生 > >深入分析Java的編譯期與執行期

深入分析Java的編譯期與執行期

不知大家有沒有思考過,當我們使用IDE寫了一個Demo類,並執行main函式列印 hello world時都經歷了哪些流程麼?
想通過這篇文章來分析分析Java的執行流程,或者換句話說想聊聊Java的編譯期與執行期的流程。

  • 開門見山
  • 編譯期間都做了什麼
  • 執行期間都做了什麼

1. 開門見山

public class MyApp {

    public static void main(String[] args) {
        System.out.println("hello world");
    }
}

假如我們寫了一個MyApp.java,並要列印‘hello world’ 那它需要經過哪些步驟?

第一步:compile

通過編譯器進行編譯,從Java原始碼 ---> Java 位元組碼

這個編譯器則是jdk 裡的javac 編譯器,我們只需 javac MyApp.java 即可以編譯該原始碼,javac 編譯器位於jdk --> bin -->javac

第二步:load and execute

載入java 位元組碼並執行

可以通過jdk 裡的java命令執行java位元組碼,我們只需 java MyApp.class 即可載入並執行該位元組碼,當執行java命令時,JRE將與您指定的類一起載入。然後,執行該類的主要方法。

java命令位於jdk --> bin -->java。

上面只是大概講了執行一個java程式的流程,下面再從編譯期以及執行期的角度在剖析一下細節。

2. 編譯期間都做了什麼?

編譯器(compiler)是一種計算機程式,它會將某種程式語言寫成的原始碼(原始語言)轉換成另一種程式語言(目標語言)。

編譯期都做了什麼?從我們使用者角度看無非就是把原始碼編譯成了可被虛擬機器執行的位元組碼,但是從平臺(編譯器)角度看,它所經歷的流程還不少。
畢竟總不能給你什麼以.java為字尾的檔案都進行編譯吧,需要有各種校驗解析步驟

2.1 解析與填充符號表

詞法語法分析

詞法分析

是指把原始碼的字元流轉為標記(Token)集合,標記(Token)是編譯階段的最小單元,字元則是程式設計階段原始碼的最小單元。
比如,int i = 0由4個標記構成分別是「int,i,=,0」編譯器只認識這些標記,詞法分析過程就是識別一個個標記的過程

語法分析

則是把生成的標記集合 構成一個語法樹,每個節點代表程式程式碼中的語法結構,如包,型別,修飾符,運算子等等。

填充符號表
通過了上面的詞義語義分析之後我們需要把資料存起來,以供後續流程使用,編譯器會以key-value的形式儲存資料,以符號地址為key符號資訊為value,具體形式沒做限制可以是樹狀符號表或者有序符號表等。
在語義分析中,根據符號表所登記的內容 語義檢查和產生中間程式碼,在目的碼生成階段,當對符號表進行地址分配時,該符號表是檢查的依據。

2.2 註解處理器

註解與普通的Java程式碼一樣,是在執行期間發揮作用的。我們可以把它看做是一組編譯器的外掛,在這些外掛裡面,可以讀取、修改、新增抽象語法樹中的任意元素。
如果這些外掛在處理註解期間對語法樹進行了修改,編譯器將回到解析及填充符號表的過程重新處理,直到所有插入式註解處理器都沒有再對語法樹進行修改為止。
換句話說當我們處理註解時如果修改了語法樹的話會重新執行分析以及符號填充過程,把註解也填充進來,直到處理完所有註解。

2.3 語義分析

語法分析以及處理註解之後,編譯器獲得了程式程式碼的抽象語法樹,語法樹能表示一個結構正確的源程式的抽象,但無法保證源程式是符合邏輯的。
說白了,語法樹上的內容單個來說是合法的但是結合到上下文語義則未必是合法的。

比如定義了兩個變數
int a = 1; boolean b = false; int c = a + b
以上 都能構成結構正確的語法樹,但是根據語義分析之後編譯是通不過,Java語言中是不合乎邏輯的。

2.4 解語法糖

Java 中最常用的語法糖主要有泛型、變長引數、條件編譯、自動拆裝箱、內部類等。虛擬機器並不支援這些語法,它們在編譯階段就被還原回了簡單的基礎語法結構,這個過程成為解語法糖。

換句話說,不論你是否使用Java的語法糖,最終到jvm哪裡的時候都是一樣的,jvm不支援語法糖,所以需要編譯階段解語法糖,語法糖的初衷是用來提升開發效率,而不是程式碼效能。

2.5 位元組碼生成

位元組碼生成是Javac編譯過程的最後一個階段,在Javac原始碼裡面由com.sun.tools.javac. jvm.Gen類來完成。位元組碼生成階段前面各個步驟所生成的資訊(語法樹、符號表)轉化成位元組碼寫到磁碟中,主要工作就是把語法樹和符號表加工成位元組碼檔案。

3. 執行期間都做了什麼?

java的執行期主要是處理編譯器產生的位元組碼,包括載入與執行。

3.1 載入器與驗證器

java提供類載入器把虛擬機器外部的位元組碼資源載入到虛擬機器的執行時環境(主要是指虛擬機器的方法區)
並提供位元組碼驗證器來保證載入的位元組碼是安全合法的,對程式沒有危害的。

載入器 (Class Loader)

當位元組碼還沒被類載入器載入之前它目前還處於虛擬機器外部儲存空間裡,要想執行它需要通過類載入器來載入到虛擬機器的執行時記憶體空間裡。關於類載入器不太想過多擴充套件,有興趣珂查閱相關書籍資料。

常見類載入器有:

  • Bootstrap ClassLoader(啟動類載入器:載入位於
  • Extension ClassLoader(擴充套件類載入器): 載入位於
  • Application ClassLoader(應用程式類載入器):載入位於類路徑(ClassPath)下的類檔案

總之,載入器的任務就是把位元組碼資源載入到虛擬機器執行時環境裡

位元組碼驗證 (Bytecode Verifier)

當類載入器將新載入的位元組碼呈現給虛擬機器時,首先由驗證器來檢查驗證這些位元組碼。驗證程式檢查指令是否無法執行明顯有害的操作。除系統類之外的所有類都需要經過驗證。也可以使用命令-noverify選項來停用驗證。

位元組碼驗證器主要驗證如下幾項:

  • 變數在使用前初始化
  • 不違反訪問私有資料和方法的規則
  • 執行時堆疊不會溢位
  • 所有Java虛擬機器指令的引數都是有效型別
  • 各種型別檢查

參考 http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.10。

總之,驗證器的任務就是保證載入器載入的位元組碼資源的安全性,正確性

3.2 直譯器與JIT編譯器

直譯器

直譯器(interpreter),是一種計算機程式,能夠把高階程式語言一行一行解釋 執行。

劃重點:一行一行執行,說白了就是效率低

直譯器每次執行程式時都要一行一行先轉成另一種語言再作執行,因此直譯器的程式執行速度比較緩慢。它不會一次把整段程式碼翻譯出來,而是每翻譯一行程式敘述就立刻執行,然後再翻譯下一行,再執行,如此不停地進行下去。

JIT編譯器

即時編譯(Just-in-time compilation)是一種提高程式執行效率的方法。通常,程式在執行前全部被翻譯為機器碼。

Java最初的版本沒有JIT編譯器,完全靠直譯器來執行的,但是為了提升效能便引入了JIT編譯器,

重點說明:當我們說編譯的時候基本上指的是上面的從原始碼到位元組碼的編譯過程,而不是指JIT編譯器

JIT編譯器工作階段基本是java程式執行期的最後階段了,它的工作是將載入的位元組碼轉換為機器碼。當使用JIT編譯器時,硬體可以執行JIT編譯器生成的機器碼,而不是讓JVM重複解釋執行相同的位元組碼導致相對冗長的翻譯過程。 這樣可以帶來執行速度的效能提升。

什麼時候觸發即時編譯?

  • 被多次呼叫的方法
  • 被多次執行的迴圈體

上面兩個條件又叫做熱點程式碼,至於如何界定這個多次或者熱點,Java提供了兩種策略:

熱點探測: 虛擬機器定期檢查執行緒的棧頂,如果某個方法經常出現在棧頂 則推斷為熱點程式碼

計數器: 統計方法的呼叫次數,維護一個計數器列表

基於計數器來推斷熱點程式碼是HotSpot虛擬機器採用的策略

通常情況下,直譯器和JIT編譯器混合配合工作,而不是單獨工作,這樣可以做到互補提升整體效能。HotSpot 虛擬機器的直譯器JIT編譯器架構如下圖所示:

HotSpot虛擬機器中內建了兩個即時編譯器,分別稱為Client Compiler和Server Compiler,或者簡稱為C1編譯器和C2編譯器,預設採用直譯器與其中一個編譯器直接配合的方式工作,程式使用哪個編譯器,取決於虛擬機器執行的模式,使用者也可以使用“-client”或“-server”引數去強制指定虛擬機器執行在Client模式或Server模式。

4. 總結

java 程式是如何執行的?

首先需要把原始碼(高階語言) 編譯成虛擬機器可執行的語言(位元組碼)
其次,需要把位元組碼解釋執行後者編譯成作業系統級別的機器語言,用於執行函式呼叫(System call)

Java是如何做到平臺獨立的?

主要是因為位元組碼技術。我們可以把在Windows系統上編譯生成的位元組碼檔案放在Linux系統上去執行,反之亦可。
虛擬機器不在乎你是那個作業系統生成的位元組碼檔案,他只在乎載入的這個.class位元組碼檔案是否是正確的,安全的。

雖然Java語言是平臺獨立的,但是虛擬機器不行。每種作業系統都要下載對應的虛擬機器,這主要是由於它最終呼叫的函式庫以及執行緒模型不同。

參考:

1.http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.10.
2.深入理解Java虛擬機器