1. 程式人生 > >JVM(2)——HotSpot虛擬機器:物件建立、物件記憶體佈局、物件的訪問定位

JVM(2)——HotSpot虛擬機器:物件建立、物件記憶體佈局、物件的訪問定位

物件的建立

  • 步驟1:檢查。虛擬機器遇到一條new指令時,首先將去檢查這個指令的引數是否能在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已被載入、解析和初始化過。如果沒有,那必須先執行相應的類載入過程。

  • 步驟2:分記憶體。在類載入檢查通過後,JVM將會為新生物件分配記憶體。物件所需記憶體的大小在類載入完成後便可完全確定,為物件分配空間的任務等同於把一塊確定大小的記憶體從java堆中劃分出來。下面列出兩種劃分方式:

    • 指標碰撞:假設java堆中記憶體是絕對規整的,所有用過的記憶體都放在一邊,空閒的記憶體放在另一邊,中間放著一個指標作為分界點的指示器,那所分配記憶體就僅僅是把那個指標向空閒空間那邊挪動一段與物件大小相等的距離,這種分配方式稱為“指標碰撞”
    • 空閒列表:如果java堆中的記憶體並不是規整的,已使用的記憶體和空閒的記憶體相互交錯,那就沒有辦法簡單地進行指標碰撞了,虛擬機器就必須維護一個列表,記錄上哪些記憶體塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給物件例項,並更新列表上的記錄,這種分配方式稱為“空閒列表”
  • 步驟3:同步問題。除如何劃分可用空間之外,還有另一個需要考慮的問題是物件建立在虛擬機器中是非常頻繁的行為,即使是僅僅修改一個指標鎖指向的位置,在併發情況下也並不是執行緒安全的,可能出現正在給物件A分配記憶體,指標還沒來得及修改,物件B又同時使用了原來的指標來分配記憶體的情況。解決這個問題有兩種方案:

    • 對分配記憶體空間的動作進行同步處理——實際上虛擬機器採用CAS配上失敗重試的方式保證更新操作的原子性
    • 本地執行緒分配快取(TLAB):把記憶體分配的動作按照執行緒劃分在不同的空間中進行,即每個執行緒在java堆中預先分配一小塊記憶體,稱為TLAB。那個執行緒要分配記憶體,就在哪個執行緒的TLAB上分配,只有TLAB用完並分配新的TLAB時,才需要同步鎖定。
  • 步驟4:設初值。記憶體分配完成後,虛擬機器需要將分配到的記憶體空間都初始化為零值(不包括物件頭),如果使用TLAB,這一工作過程也可以提前至TLAB分配時進行。這一步驟操作保證了物件的實際欄位在java程式碼中可以不賦初值就直接使用,程式能訪問到這些欄位的資料型別所對應的零值。

  • 步驟5:對物件進行進行必要的設定。例如這個物件是哪個類的例項、如何才能找到類的元資料資訊、獨享的雜湊碼、獨享的GC分帶年齡等資訊。

  • 步驟6:在上面工作做完成之後,從JVM角度來看,一個新的物件已經產生了,但Java程式的視角來看,物件的建立才剛剛開始——<init>方法還沒有執行,所有的欄位都還為零。所以,一般來說,執行new指令之後會接著執行<init>方法,把物件按照程式設計師的醫院進行初始化,這樣一個真正可用的物件才算完全產生出來

物件的記憶體佈局

物件的記憶體分為3個區域:物件頭例項資料對其填充

  • 物件頭包括兩個部分資訊:
    • Mark Word:用於儲存物件自身的執行時資料,如雜湊碼、GC分帶年齡、鎖狀態標誌、執行緒持有的鎖、偏向執行緒ID、現象時間戳等
    • 型別指標:即物件指向它的類元資料的指標,虛擬機器通過這個指標來確定這個物件是哪個類的例項。(並不是所有的虛擬機器實現都必須在物件資料上保留型別指標,換句話說,查詢物件的元資料資訊並不一定要經過物件本身)

【注意】如果物件是一個java陣列,那在物件頭中還必須有一塊用於記錄陣列長度的資料,因為虛擬機器可以通過普通java物件的元資料資訊確定java物件的大小,但是從陣列的元陣列中卻無法確定陣列的大小

  • 例項資料:是物件真正儲存的有效資訊,也是在程式程式碼中所定義的各種型別的欄位內容。無論是從父類繼承下來的,還是在子類中定義的,都需要記錄下來,這部分的儲存順序會受到JVM的分配策略引數和欄位在java原始碼中定義順序的影響。同時,在父類中定義的變數會出現在子類之前。

  • 對其填充:這部分不是必然存在的,也沒有特別的含義,它僅僅起著佔位符的作用。由於HotSpot VM的自動記憶體管理系統要求物件起始地址必須是8位元組的整數倍,換句話說,就是物件的大小必須是8位元組的整數倍。而物件頭部分正好是8位元組的倍數,因此,當物件例項資料部分沒有對齊時,就需要通過對齊填充來補全。

物件訪問定位

建立物件是為了使用物件,我們的java程式需要通過棧上的reference資料來操作堆的具體物件。由於reference型別在java虛擬機器規範中只規定了一個指向物件的引用,並沒有定義這個引用應該通過何種方式去定位、訪問堆中的物件的具體位置,所以物件訪問方式也是取決於虛擬機器實現而定的。目前主流的訪問方式有兩種:使用控制代碼直接使用指標

使用控制代碼

如果使用控制代碼訪問的話,那麼java堆中將會劃分出一塊記憶體來作為控制代碼池,reference中儲存的就是物件的控制代碼地址,而控制代碼中包含了物件例項資料域型別資料各自的具體地址資訊

這裡寫圖片描述

用控制代碼來訪問物件的最大好處是:reference中儲存的是穩定的控制代碼地址,在物件被移動(垃圾收集時移動物件是非常普遍的行為)時只會改變控制代碼中的例項資料指標,而reference不需要修改

直接使用指標

如果使用直接指標訪問,那麼java堆物件的佈局中就必須考慮如何防止訪問型別資料相關的資訊,而reference中儲存的直接就是物件地址

這裡寫圖片描述

使用直接指標訪問方式的最大好處就是速度更虧啊,它節省了一次指標定位的時間開銷,由於物件的訪問在java中很頻繁,因此這類開銷積少成多後也是一項非常可觀的執行成本。對於Sun HotSpot而言,是使用該種方式

物件與控制代碼

在java中,大家習慣於把任何東西都看成一個物件。這裡需要注意,儘管將一切“看成”物件,但是操作的識別符號實際是指向一個物件的“控制代碼”。

舉個栗子:
- 控制代碼就相當於遙控器,物件就相當於電視。用遙控器來操作電視,同樣也是用控制代碼來操作物件。我們在換臺或者調聲音的時候使用的是遙控器(控制代碼),再有遙控器自己控制電視。此外,即使沒有電視,遙控器也可以獨立存在。
- 控制代碼:風箏線,物件:風箏。我們通過拽著風箏線來控制風箏。

從上面兩個栗子可以看出,擁有控制代碼,並不代表必須有一個物件同它進行連線。

再舉個栗子

String s;

這個語句實際上是建立了控制代碼,而不是物件。這個時候s並沒有與任何東西進行連線。所以如果這個是想要執行System.out.println(s)就會報錯,會提示:請初始化s。所以,一個安全的做法就是:建立控制代碼的時候,要進行初始化。

String s = "hello world!"

這個語句在後臺實際上是三個操作:

  • 一個是建立了一個String的控制代碼s
  • 在常量池中新增“hello world!”,如果常量池原來沒有這個字串的話。如果常量池有,則不會進行該步驟
  • 將控制代碼s與字串“hello world!”連線起來