1. 程式人生 > >JVM體系結構-----深入理解內存結構

JVM體系結構-----深入理解內存結構

分配機制 buffer 內部 磁盤 運行期 java語言 同時 內存溢出 結束

一、概述

內存在計算機中占據著至關重要的地位,任何運行時的程序或者數據都需要依靠內存作為存儲介質,否則程序將無法正常運行。與C和C++相比,使用Java語言編寫的程序並不需要顯示的為每一個對象編寫對應的內存分配和內存回收等相關的函數,這主要是得益於JVM的自動內存管理機制,使得Java開發人員可以從頻繁的體力勞動中解放出來,只關註與自身的業務即可。

盡管JVM的自動內存管理機制大大提高了Java開發人員的編程效率,甚至從某種意義上說降低了內存泄漏和內存溢出的風險,但是Java開發人員過度的依賴於“自動”那麽將是一場災難。最嚴重的就是會弱化Java開發人員在程序出現內存溢出時定位問題和解決問題的能力。在此需要提醒大家,千萬不要被JVM自動內存管理機制牽著鼻子走,所以了解JVM究竟是如何管理內存後,才能在出現OutOfMemoryError時,快速地根據異常日誌單位問題和解決問題。

對於從事C和C++程序開發的開發人員來說,在內存管理領域,他們既是擁有最高權力的皇帝,又是從事最基礎工作的勞動人民—既擁有每一個對象的“所有權”,又擔負著每一個對象生命開始到終結的維護責任。可以自由控制對象的消亡。而Java對象一旦創建,只能完全由JVM決策何時標記為“垃圾”,何時進行GC。

內存溢出和內存泄漏的區別

內存溢出 :out of memory,是指程序在申請內存時,沒有足夠的內存空間供其使用,出現out of memory;好比一個盤子用盡各種方法只能裝4個果子,你裝了5個,結果掉倒地上不能吃了。這就是溢出!比方說棧,棧滿時再做進棧必定產生空間溢出,叫上溢,棧空時再做退棧也產生空間溢出,稱為下溢。就是分配的內存不足以放下數據項序列,稱為內存溢出。

內存泄露 :memory leak,是指程序在申請內存後,無法釋放已申請的內存空間,一次內存泄露危害可以忽略,但內存泄露堆積後果很嚴重,無論多少內存,遲早會被占光。向系統申請分配內存進行使用(new),可是使用完了以後卻不歸還(delete),結果你申請到的那塊內存你自己也不能再訪問(也許你把它的地址給弄丟了),而系統也不能再次將它分配給需要的程序。

二、Java虛擬機的體系結構和運行時數據區域

一個JVM實例的行為不光是它自己的事,還涉及到它的子系統、存儲區域、數據類型和指令這些部分,它們描述了JVM的一個抽象的內部體系結構,其目的不光規定實現JVM時它內部的體系結構,更重要的是提供了一種方式,用於嚴格定義實現時的外部行為。每個JVM都有兩種機制,一個是裝載具有合適名稱的類(類或是接口),叫做類裝載子系統;另外的一個負責執行包含在已裝載的類或接口中的指令,叫做運行引擎。每個JVM又包括方法區、堆、Java棧、程序計數器和本地方法棧這五個部分,這幾個部分和類裝載機制與運行引擎機制一起組成的體系結構圖為:

技術分享

Java虛擬機定義了若幹種程序運行期間會使用到的運行時數據區,其中有一些會隨著虛擬機啟動而創建,隨著虛擬機退出而銷毀。另外一些則是與線程一一對應的,這些與線程對應的數據區域會隨著線程開始和結束而創建和銷毀。

參考《Java虛擬機規範(第7版)》的描述,Java虛擬機所管理的內存將會包括以下幾個運行時數據區域,如下圖所示:技術分享

可以看出Java虛擬機的運行時數據區包括了:方法區、Java堆、Java虛擬機棧、PC寄存器、本地方法棧,還有常量池。它們被分為兩大類-------線程共享、私有數據區。

1.線程共享數據區

包括:Java堆、方法區、常量池。它們會隨著虛擬機啟動而創建,隨著虛擬機退出而銷毀。

(1)Java堆

推薦文章:http://blog.csdn.net/ljheee/article/details/52196455

Java堆在虛擬機啟動的時候被創建,Java堆主要用來為類實例對象和數組分配內存。Java虛擬機規範並沒有規定對象在堆中的形式。對於大多數應用來說,Java堆(Java Heap)是Java虛擬機所管理的內存中最大的一塊。Java堆是被所有線程共享的一塊內存區域,在虛擬機啟動時創建。此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這裏分配內存。這一點在Java虛擬機規範中的描述是:所有的對象實例以及數組都要在堆上分配,但是隨著JIT(Just In Time)編譯器的發展與逃逸分析技術的逐漸成熟,棧上分配、標量替換優化技術將會導致一些微妙的變化發生,所有的對象都分配在堆上也漸漸變得不是那麽“絕對”了-----可是使用逃逸分析和棧幀存儲技術。

如果從內存分配的角度看,線程共享的Java堆中可能劃分出多個線程私有的分配緩沖區(Thread Local Allocation Buffer,TLAB)。不過,無論如何劃分,都與存放內容無關,無論哪個區域,存儲的都仍然是對象實例,進一步劃分的目的是為了更好地回收內存,或者更快地分配內存。

參考《Java虛擬機規範(第7版)》的描述,Java堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx和-Xms控制)。

在 Java 中,堆被劃分成兩個不同的區域:新生代 ( Young )、老年代 ( Old );這也就是JVM采用的“分代收集算法”,簡單說,就是針對不同特征的java對象采用不同的策略實施存放和回收,自然所用分配機制和回收算法就不一樣。新生代 ( Young ) 又被劃分為三個區域:Eden、From Survivor、To Survivor。(《Java虛擬機精講》(高翔龍...))

分代收集算法:采用不同算法處理[存放和回收]Java瞬時對象和長久對象。大部分Java對象都是瞬時對象,朝生夕滅,存活很短暫,通常存放在Young新生代,采用復制算法對新生代進行垃圾回收。老年代對象的生命周期一般都比較長,極端情況下會和JVM生命周期保持一致;通常采用標記-壓縮算法對老年代進行垃圾回收。

這樣劃分的目的是為了使 JVM 能夠更好的管理堆內存中的對象,包括內存的分配以及回收。

  Java堆可能發生如下異常情況:如果實際所需的堆超過了自動內存管理系統能提供的最大容量,那Java虛擬機將會拋出一個OutOfMemoryError異常。

(2)方法區

方法區在虛擬機啟動的時候被創建,它存儲了每一個類的結構信息,例如運行時常量池、字段和方法數據、構造函數和普通方法的字節碼內容、還包括在類、實例、接口初始化時用到的特殊方法。

方法區(Method Area)與Java堆一樣,是各個線程共享的內存區域,它用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。雖然Java虛擬機規範把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java堆區分開來。

對於習慣在HotSpot虛擬機上開發和部署程序的開發者來說,很多人願意把方法區稱為“永久代”(Permanent Generation),本質上兩者並不等價,僅僅是因為HotSpot虛擬機的設計團隊選擇把GC分代收集擴展至方法區,或者說使用永久代來實現方法區而已。對於其他虛擬機(如BEA JRockit、IBM J9等)來說是不存在永久代的概念的。即使是HotSpot虛擬機本身,根據官方發布的路線圖信息,現在也有放棄永久代並“搬家”至Native Memory來實現方法區的規劃了。

  Java虛擬機規範對這個區域的限制非常寬松,除了和Java堆一樣不需要連續的內存和可以選擇固定大小或者可擴展外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行為在這個區域是比較少出現的,但並非數據進入了方法區就如永久代的名字一樣“永久”存在了。這個區域的內存回收目標主要是針對常量池的回收和對類型的卸載,一般來說這個區域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區域的回收確實是有必要的。在Sun公司的BUG列表中,曾出現過的若幹個嚴重的BUG就是由於低版本的HotSpot虛擬機對此區域未完全回收而導致內存泄漏。

方法區可能發生如下異常情況: 如果方法區的內存空間不能滿足內存分配請求,那Java虛擬機將拋出一個OutOfMemoryError異常.

(3)常量池

運行時常量池(Runtime Constant Pool)是每一個類或接口的常量池的運行時表示形式,它包括了若幹種不同的常量:從編譯期可知的數值字面量到必須運行期解析後才能獲得的方法或字段引用。運行時常量池在方法區中。

運行時常量池(Runtime Constant Pool)是方法區的一部分。Class文件中除了有類的版本、字段、方法、接口等描述等信息外,還有一項信息是常量池(Constant Pool Table),用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類加載後存放到方法區的運行時常量池中。 Java虛擬機對Class文件的每一部分(自然也包括常量池)的格式都有嚴格的規定,每一個字節用於存儲哪種數據都必須符合規範上的要求,這樣才會被虛擬機認可、裝載和執行。但對於運行時常量池,Java虛擬機規範沒有做任何細節的要求,不同的提供商實現的虛擬機可以按照自己的需要來實現這個內存區域。不過,一般來說,除了保存Class文件中描述的符號引用外,還會把翻譯出來的直接引用也存儲在運行時常量池中。 運行時常量池相對於Class文件常量池的另外一個重要特征是具備動態性,Java語言並不要求常量一定只能在編譯期產生,也就是並非預置入Class文件中常量池的內容才能進入方法區運行時常量池,運行期間也可能將新的常量放入池中,這種特性被開發人員利用得比較多的便是String類的intern()方法。 既然運行時常量池是方法區的一部分自然會受到方法區內存的限制,當常量池無法再申請到內存時會拋出OutOfMemoryError異常。

在創建類和接口的運行時常量池時,可能會發生如下異常情況:當創建類或接口的時候,如果構造運行時常量池所需要的內存空間超過了方法區所能提供的最大值,那Java虛擬機將會拋出一個OutOfMemoryError異常。

2.線程私有數據區

包括:PC寄存器、JVM棧、本地方法區。它們是與線程一一對應的,這些與線程對應的數據區域會隨著線程開始和結束而創建和銷毀。

(1)PC寄存器

PC(Program Counter Register)是一塊較小的內存空間,它的作用可以看做是當前線程所執行的字節碼的行號指示器。在虛擬機的概念模型裏(僅是概念模型,各種虛擬機可能會通過一些更高效的方式去實現),字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。

每個Java虛擬機線程都有自己的PC寄存器。在某個線程被新建時,會獲得一個PC寄存器。線程當前執行的方法稱為當前方法,PC寄存器用來存放當前方法中當前執行的字節碼指令的地址;之所以為每一個線程都分配一個PC寄存器,試想:多線程運行時,某個時間片內只執行一個線程,CPU在不停的切換多個線程,那如何記錄具體每一個線程上一次執行到哪個位置了呢,這時候PC寄存器用來存放當前方法中當前執行的字節碼指令的地址,就完美解決了,這就是為什麽PC寄存器是線程私有數據區的原因。

如果當前方法是本地方法(Native),那麽寄存器存放undefined。寄存器的大小至少應該能夠存放一個returnAddress類型的數據或者與平臺相關的本地指針的值。

PC寄存器是惟一一個沒有明確規定需要拋出OutOfMemoryError異常的運行時數據區。

(2)JVM棧

每個Java虛擬機線程都有自己的Java虛擬機棧。Java虛擬機棧用來存放棧幀,而棧幀主要包括了:局部變量表、操作數棧、動態鏈接。Java虛擬機棧允許被實現為固定大小或者可動態擴展的內存大小。

與程序一樣,Java虛擬機棧(Java Virtual Machine Stacks)也是線程私有的,它的生命周期計數器與線程相同。虛擬機棧描述的是Java方法執行的內存模型:每個方法被執行的時候都會同時創建一個棧幀(Stack Frame)用於存儲局部變量表、操作棧、動態鏈接、方法出口等信息。每一個方法被調用直至執行完成的過程,就對應著一個棧幀在虛擬機棧中從入棧到出棧的過程。

  經常有人把Java內存區分為堆內存(Heap)和棧內存(Stack),這種分法比較粗糙,Java內存區域的劃分實際上遠比這復雜。這種劃分方式的流行只能說明大多數程序員最關註的、與對象內存分配關系最密切的內存區域是這兩塊。其中所指的“堆”在後面會專門講述,而所指的“棧”就是現在講的虛擬機棧,或者說是虛擬機棧中的局部變量表部分。

Java虛擬機使用局部變量表來完成方法調用時的參數傳遞。局部變量表的長度在編譯期已經決定了並存儲於類和接口的二進制表示中,一個局部變量可以保存一個類型為boolean、byte、char、short、float、reference 和 returnAddress的數據,兩個局部變量可以保存一個類型為long和double的數據。

  Java虛擬機提供一些字節碼指令來從局部變量表或者對象實例的字段中復制常量或變量值到操作數棧中,也提供了一些指令用於從操作數棧取走數據、操作數據和把操作結果重新入棧。在方法調用的時候,操作數棧也用來準備調用方法的參數以及接收方法返回結果。

  每個棧幀中都包含一個指向運行時常量區的引用支持當前方法的動態鏈接。在Class文件中,方法調用和訪問成員變量都是通過符號引用來表示的,動態鏈接的作用就是將符號引用轉化為實際方法的直接引用或者訪問變量的運行是內存位置的正確偏移量。

總的來說,Java虛擬機棧是用來存放局部變量和過程結果的地方。

Java虛擬機棧可能發生如下異常情況: 如果Java虛擬機棧被實現為固定大小內存,線程請求分配的棧容量超過Java虛擬機棧允許的最大容量時,Java虛擬機將會拋出一個StackOverflowError異常。

如果Java虛擬機棧被實現為動態擴展內存大小,並且擴展的動作已經嘗試過,但是目前無法申請到足夠的內存去完成擴展,或者在建立新的線程時沒有足夠的內存去創建對應的虛擬機棧,那Java虛擬機將會拋出一個OutOfMemoryError異常。

(3)本地方法區

本地方法棧用於支持native方法的運行。(native方法,比如用C/C++實現的代碼)。

本地方法棧(Native Method Stacks)與虛擬機棧所發揮的作用是非常相似的,其區別不過是虛擬機棧為虛擬機執行Java方法(也就是字節碼)服務,而本地方法棧則是為虛擬機使用到的Native方法服務。虛擬機規範中對本地方法棧中的方法使用的語言、使用方式與數據結構並沒有強制規定,因此具體的虛擬機可以自由實現它。甚至有的虛擬機(譬如Sun HotSpot虛擬機)直接就把本地方法棧和虛擬機棧合二為一。與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常。

文章參閱《Java虛擬機精講》

JVM體系結構-----深入理解內存結構