1. 程式人生 > >自動記憶體管理機制(1)- java記憶體區域與虛擬機器物件

自動記憶體管理機制(1)- java記憶體區域與虛擬機器物件

自動記憶體管理機制(1)- java記憶體區域與虛擬機器物件

1. 執行時資料區域

Java虛擬機器在執行Java程式的過程中會把它所管理的記憶體劃分為若干個不同的資料區域。有的區域隨著虛擬機器進行的啟動而存在,有些區域則以來使用者執行緒的啟動和結束而建立和銷燬。

有以下幾個區域:
java記憶體區域

1.1. 程式計數器

程式計數器是一塊較小的記憶體空間,可以看作是當前執行緒所執行的位元組碼的行號指示器。它是執行緒私有的。

如果執行緒執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機器位元組碼指令的地址;如果執行的是本地方法,那麼這個計數器值為空(Undefined)。

1.2. Java虛擬機器棧

虛擬機器棧描述的是Java方法執行的記憶體模型:每個方法在執行的同時會建立一個棧幀用於儲存區域性變量表、運算元棧、動態連結、方法出口等資訊。每一個方法從呼叫到執行完成的過程,對應著一個棧幀在虛擬機器中從入棧到出棧的過程。

與程式計數器一樣,Java虛擬機器棧也是執行緒私有的。

經常有人把Java記憶體區分為堆記憶體(Heap)和棧記憶體(Stack),這種分法比較粗糙,其中的“棧”就是現在所講的虛擬機器棧,或者說是虛擬機器棧中區域性變量表的部分

在這個區域會丟擲以下兩種異常:

  • StackOverflowError:如果執行緒請求的棧深度大於虛擬機器所允許的深度,丟擲異常
  • OutOfMemoryError:如果虛擬機器棧可以動態拓展,如果拓展時無法申請到足夠的記憶體,丟擲異常

1.3. 本地方法棧

本地方法棧與虛擬機器棧是非常類似的,區別在於虛擬機器棧為虛擬機器執行Java方法(也就是位元組碼服務),而本地方法棧則為虛擬機器使用到的Natice(本地)方法服務。

和虛擬機器棧一樣,本地方法棧也是執行緒私有的,本地方法棧也會丟擲StackOverflowErrorOutOfMemoryError異常。

1.4. Java堆

Java堆(Java Heap)是Java虛擬機器所管理的記憶體中最大的一塊。Java堆是執行緒共享的,在虛擬機器啟動時建立。

Java堆的唯一目的就是存放物件例項,幾乎所有的物件例項都在這分配記憶體。

Java堆是垃圾收集器管理的主要區域。由於現在收集器基本都採用分代收集演算法,所以Java堆還可以細分為:新生代和老年代;再細一些還可以劃分為Eden空間,From Survivor空間,To Survivor空間

如果堆中沒有記憶體完成例項分配,並且堆也無法再拓展時,將會丟擲OutOfMemoryError異常。

1.5. 方法區

方法區(Method Area)也是執行緒共享的。

方法區是用於儲存已經被虛擬機器載入的類訊息、常量、靜態變數、即時編譯器編譯後的程式碼等資料。它有一個別名叫做Non-Heap(非堆)。

除了以上五個區域外,還有兩個概念需要熟悉:

  1. 執行時常量池

    執行時常量池(Runtime Constant Pool)是方法區的一部分。

    Class檔案中除了有類的版本,欄位,方法,介面等資訊外,還有一項是常量池(Constant Pool Table),用於存放編譯期生成的各種字面量和符號引用,這部分再類載入後進入方法區的執行時常量池存放。

  2. 直接記憶體

    直接記憶體(Direct Memory)並不是虛擬機器執行時資料區的一部分,也不是Java虛擬機器規範中定義的記憶體區域。

    在JDK1.4中新加入了NIO類,引入了一種基於通道(Channel)與緩衝區(Buffer)的I/O 方式,它可以使用native 函式庫直接分配堆外記憶體,然後通過一個儲存在Java堆中的DirectByteBuffer 物件作為這塊記憶體的引用進行操作。這樣能在一些場景中顯著提高效能,因為避免了在Java堆和Native堆中來回複製資料。

    • 直接記憶體的分配不會受到Java堆大小的限制,但會受到本機總記憶體大小的限制
    • 配置虛擬機器引數時,不要忽略直接記憶體 防止出現OutOfMemoryError異常

2. HotSpot虛擬機器物件

2.1. 物件的建立

  1. 虛擬機器遇到一條new指令時,首先區檢查這個指令的引數是否能在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已被載入、解析和初始化過。如果沒有,那執行相應的類載入過程。

  2. 在類載入檢查通過後,虛擬機器將為新生物件分配記憶體。記憶體分配方法有以下兩種:

    1. 指標碰撞(Bump the Pointer)

      假設堆中記憶體是絕對規整的,所有用過的記憶體都放在一邊,空閒的記憶體放在另一邊,中間放著一個指標作為分界點的指示器,那分配記憶體就僅僅是把指標向空閒空間那邊挪動一段與物件大小相等的距離。

    2. 空閒列表(Free List)

      如果Java堆中的記憶體並不是規整的,已使用的記憶體和空閒的記憶體相互交錯,虛擬機器就必須維護一個列表,記錄哪些記憶體塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給物件例項,並更新列表上的記錄。

    選擇哪種分配方法由Java堆是否規整決定,而Java堆是否規整又由所採用的垃圾收集器是否帶有壓縮整理功能決定。

    在使用Serial、ParNew、等帶Compact(壓縮)過程的收集器時,採用指標碰撞演算法。而使用CMS這種基於Mark-Sweep(標記掃描)演算法的收集器時,使用空閒列表演算法。

  3. 解決劃分可用空間的問題後,還有一個問題就是物件建立在併發情況下並不是執行緒安全的,解決這個方法由兩種方案:

    1. 對分配記憶體空間的動作進行同步處理

    2. 把記憶體分配的動作按照執行緒劃分在不同的空間之中進行

      每個執行緒在Java堆中預先分配一小塊記憶體,稱為本地執行緒分配緩衝(Thread Local Allocation Buffer, TLAB)。哪個執行緒要分配記憶體,就在哪個執行緒的TLAB上分配,只有TLAB用完並分配新的TLAB時,才需要同步鎖定。

  4. 接下來,虛擬機器會對物件進行一些必要的設定,比如這個物件是哪個類的例項、如何才能找到類的元資料資訊、物件的雜湊碼、物件的GC分代年齡等資訊。

完成以上步驟後,從虛擬機器的角度看,一個新的物件已經產生了,但從Java程式的角度看,物件的建立才剛剛開始——init()方法話沒有執行,所有的欄位都為零。所以執行new指令後還會接著執行init方法,這樣才真正建立了一個物件。

物件的建立過程

2.2. 物件的記憶體佈局

在HotSpot虛擬機器中,物件在記憶體中的佈局可以分為3塊區域:

  • 物件頭(Header)
  • 例項資料(Instance Data)
  • 對齊補充(Padding)

2.2.1. 物件頭

物件頭包括兩部分資訊

  1. 第一部分用於儲存物件自身的執行時資料,如雜湊碼、GC分代年齡、鎖狀態標誌、執行緒持有的鎖、偏向執行緒ID、偏向時間戳等,官方稱為“Mark Word”。

    ![Mark Word](img/Mark Word.png)

  2. 第二部分是型別指標,即物件指向它的類元資料的指標,虛擬機器通過這個指標來確定這個物件是哪個類的例項。

2.2.2. 例項資料

例項資料部分是物件真正儲存的有效資訊,也是在程式程式碼中所定義的各種型別的欄位內容。這部分的儲存順序會受到虛擬機器分配策略引數(FieldsAllocationStyle)和欄位在Java原始碼中定義順序的影響。

HotSpot虛擬機器預設的分配策略為longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers),從分配策略中可以看出,相同寬度的欄位總是被分配到一起。在滿足這個前提條件的情況下,父類中定義的變數會出現在子類之前。

2.2.3. 對齊填充

對齊填充並不是必然存在的,也沒有特別的含義,它僅僅起著佔位符的作用。因為HotSpot VM的自動記憶體管理系統要求物件起始地址必須是8位元組的整數倍。物件頭部分正好是8位元組的倍數,因此,當例項資料部分不是8位元組的倍數時,通過對齊填充使其成為8的倍數。

2.3. 物件的訪問定位

Java程式需要通過棧上的reference資料來操作堆上的具體物件。由於reference型別在Java虛擬機器規範中只規定了一個指向物件的引用,並沒有定義這個引用應該通過何種方式去定位、訪問堆中的物件的具體位置,所以物件訪問方式也是取決於虛擬機器實現而定的。目前主流的有使用控制代碼和直接指標兩種。

  1. 控制代碼訪問

    如果使用控制代碼訪問,Java堆中會劃分出一塊記憶體來作為控制代碼池,reference中儲存的就是物件的控制代碼地址,而控制代碼中包含了物件例項資料與型別資料各自的具體地址資訊。

    控制代碼訪問物件

  2. 直接指標訪問

    如果使用直接指標訪問,那麼Java堆物件的佈局中就必須考慮如何放置訪問型別資料的相關資訊,而reference中儲存的直接就是物件地址。

    直接指標訪問

各自的優勢:

  • 控制代碼訪問最大好處就是reference中儲存的是穩定的控制代碼地址,在物件被移動時只會改變控制代碼中的例項資料指標,而reference本身不需要修改。
  • 直接指標訪問最大好處就是速度更快,節省了一次指標定位的時間開銷。

3. 小結

  1. 虛擬機器中的記憶體是如何劃分的

    程式計數器、Java虛擬機器棧、本地方法棧、Java堆、方法區

  2. 物件的建立過程

    new一個物件,查詢常量池中是否有相同的符號引用,如果沒有則進行類的載入、解析和初始化;有的話就為物件分配記憶體(堆),有兩種分配方式:指標碰撞和空閒列表,分配過程可能會引發併發問題;初始化為零值,呼叫init方法

  3. 物件的記憶體佈局

    物件頭,例項資料,對齊補充

  4. 物件的訪問方式

    控制代碼訪問,直接指標訪問