1. 程式人生 > >Java GC、新生代、老年代過程

Java GC、新生代、老年代過程

存                                                                                 

Java 中的堆是 JVM 所管理的最大的一塊記憶體空間,主要用於存放各種類的例項物件。
在 Java 中,堆被劃分成兩個不同的區域:新生代 ( Young )、老年代 ( Old )。新生代 ( Young ) 又被劃分為三個區域:Eden、From Survivor、To Survivor。
這樣劃分的目的是為了使 JVM 能夠更好的管理堆記憶體中的物件,包括記憶體的分配以及回收。
堆的記憶體模型大致為:


從圖中可以看出: 堆大小 = 新生代 + 老年代

。其中,堆的大小可以通過引數 –Xms、-Xmx 來指定。
(本人使用的是 JDK1.6,以下涉及的 JVM 預設值均以該版本為準。)
預設的,新生代 ( Young ) 與老年代 ( Old ) 的比例的值為 1:2 ( 該值可以通過引數 –XX:NewRatio 來指定 ),即:新生代 ( Young ) = 1/3 的堆空間大小。老年代 ( Old ) = 2/3 的堆空間大小。其中,新生代 ( Young ) 被細分為 Eden 和 兩個 Survivor 區域,這兩個 Survivor 區域分別被命名為 from 和 to,以示區分。
預設的,Edem : from : to = 8 : 1 : 1
( 可以通過引數 –XX:SurvivorRatio 來設定 ),即: Eden = 8/10 的新生代空間大小,from = to = 1/10 的新生代空間大小。
JVM 每次只會使用 Eden 和其中的一塊 Survivor 區域來為物件服務,所以無論什麼時候,總是有一塊 Survivor 區域是空閒著的。
因此,新生代實際可用的記憶體空間為 9/10 ( 即90% )的新生代空間。

GC 堆                                                                                  

Java 中的堆也是 GC 收集垃圾的主要區域。GC 分為兩種:Minor GC、Full GC ( 或稱為 Major GC )。

Minor GC 是發生在新生代中的垃圾收集動作,所採用的是複製演算法
新生代幾乎是所有 Java 物件出生的地方,即 Java 物件申請的記憶體以及存放都是在這個地方。Java 中的大部分物件通常不需長久存活,具有朝生夕滅的性質。
當一個物件被判定為 "死亡" 的時候,GC 就有責任來回收掉這部分物件的記憶體空間。新生代是 GC 收集垃圾的頻繁區域。
當物件在 Eden ( 包括一個 Survivor 區域,這裡假設是 from 區域 ) 出生後,在經過一次 Minor GC 後,如果物件還存活,並且能夠被另外一塊 Survivor 區域所容納( 上面已經假設為 from 區域,這裡應為 to 區域,即 to 區域有足夠的記憶體空間來儲存 Eden 和 from 區域中存活的物件 ),則使用複製演算法將這些仍然還存活的物件複製到另外一塊 Survivor 區域 ( 即 to 區域 ) 中,然後清理所使用過的 Eden 以及 Survivor 區域 ( 即 from 區域 ),並且將這些物件的年齡設定為1,以後物件在 Survivor 區每熬過一次 Minor GC,就將物件的年齡 + 1,當物件的年齡達到某個值時 ( 預設是 15 歲,可以通過引數 -XX:MaxTenuringThreshold 來設定 ),這些物件就會成為老年代。
但這也不是一定的,對於一些較大的物件 ( 即需要分配一塊較大的連續記憶體空間 ) 則是直接進入到老年代
Full GC 是發生在老年代的垃圾收集動作,所採用的是標記-清除演算法
現實的生活中,老年代的人通常會比新生代的人 "早死"。堆記憶體中的老年代(Old)不同於這個,老年代裡面的物件幾乎個個都是在 Survivor 區域中熬過來的,它們是不會那麼容易就 "死掉" 了的。因此,Full GC 發生的次數不會有 Minor GC 那麼頻繁,並且做一次 Full GC 要比進行一次 Minor GC 的時間更長。
另外,標記-清除演算法收集垃圾的時候會產生許多的記憶體碎片 ( 即不連續的記憶體空間 ),此後需要為較大的物件分配記憶體空間時,若無法找到足夠的連續的記憶體空間,就會提前觸發一次 GC 的收集動作。

GC 日誌                                                                               

public static void main(String[] args) {    Object obj = new Object();    System.gc();    System.out.println();    obj = new Object();    obj = new Object();    System.gc();    System.out.println();}

設定 JVM 引數為 -XX:+PrintGCDetails,使得控制檯能夠顯示 GC 相關的日誌資訊,執行上面程式碼,下面是其中一次執行的結果。



Full GC 資訊與 Minor GC 的資訊是相似的,這裡就不一個一個的畫出來了。
從 Full GC 資訊可知,新生代可用的記憶體大小約為 18M,則新生代實際分配得到的記憶體空間約為 20M(為什麼是 20M? 請繼續看下面...)。老年代分得的記憶體大小約為 42M,堆的可用記憶體的大小約為 60M。可以計算出: 18432K ( 新生代可用空間 ) + 42112K ( 老年代空間 ) = 60544K ( 堆的可用空間 )
新生代約佔堆大小的 1/3,老年代約佔堆大小的 2/3。也可以看出,GC 對新生代的回收比較樂觀,而對老年代以及方法區的回收並不明顯或者說不及新生代。
並且在這裡 Full GC 耗時是 Minor GC 的 22.89 倍。

JVM 引數選項                                                                        

jvm 可配置的引數選項可以參考 Oracle 官方網站給出的相關資訊:http://www.oracle.com/technetwork/java/javase/tech/vmoptions-jsp-140102.html
下面只列舉其中的幾個常用和容易掌握的配置選項

-Xms 初始堆大小。如:-Xms256m
-Xmx 最大堆大小。如:-Xmx512m
-Xmn 新生代大小。通常為 Xmx 的 1/3 或 1/4。新生代 = Eden + 2 個 Survivor 空間。實際可用空間為 = Eden + 1 個 Survivor,即 90% 
-Xss JDK1.5+ 每個執行緒堆疊大小為 1M,一般來說如果棧不是很深的話, 1M 是絕對夠用了的。
-XX:NewRatio 新生代與老年代的比例,如 –XX:NewRatio=2,則新生代佔整個堆空間的1/3,老年代佔2/3
-XX:SurvivorRatio 新生代中 Eden 與 Survivor 的比值。預設值為 8。即 Eden 佔新生代空間的 8/10,另外兩個 Survivor 各佔 1/10 
-XX:PermSize 永久代(方法區)的初始大小
-XX:MaxPermSize 永久代(方法區)的最大值
-XX:+PrintGCDetails 列印 GC 資訊
-XX:+HeapDumpOnOutOfMemoryError 讓虛擬機器在發生記憶體溢位時 Dump 出當前的記憶體堆轉儲快照,以便分析用
1 /** 2  -Xms60m 3  -Xmx60m 4  -Xmn20m 5  -XX:NewRatio=2 ( 若 Xms = Xmx, 並且設定了 Xmn, 那麼該項配置就不需要配置了 ) 6  -XX:SurvivorRatio=8 7  -XX:PermSize=30m 8  -XX:MaxPermSize=30m 9  -XX:+PrintGCDetails10  */11 public static void main(String[] args) {12     new Test().doTest();13 }14 15 public void doTest(){16     Integer M = new Integer(1024 * 1024 * 1);  //單位, 兆(M)17     byte[] bytes = new byte[1 * M]; //申請 1M 大小的記憶體空間18     bytes = null;  //斷開引用鏈19     System.gc();   //通知 GC 收集垃圾20     System.out.println();21     bytes = new byte[1 * M];  //重新申請 1M 大小的記憶體空間22     bytes = new byte[1 * M];  //再次申請 1M 大小的記憶體空間23     System.gc();24     System.out.println();25 }

按上面程式碼中註釋的資訊設定 jvm 相關的引數項,並執行程式,下面是一次執行完成控制檯列印的結果:

[ GC [ PSYoungGen:  1351K -> 288K (18432K) ]  1351K -> 288K (59392K), 0.0012389 secs ]  [ Times: user=0.00 sys=0.00, real=0.00 secs ] [ Full GC (System)  [ PSYoungGen:  288K -> 0K (18432K) ]  [ PSOldGen:  0K -> 160K (40960K) ]  288K -> 160K (59392K)  [ PSPermGen:  2942K -> 2942K (30720K) ],  0.0057649 secs ] [ Times:  user=0.00  sys=0.00,  real=0.01 secs ] [ GC [ PSYoungGen:  2703K -> 1056K (18432K) ]  2863K -> 1216K(59392K),  0.0008206 secs ]  [ Times: user=0.00 sys=0.00, real=0.00 secs ] [ Full GC (System)  [ PSYoungGen:  1056K -> 0K (18432K) ]  [ PSOldGen:  160K -> 1184K (40960K) ]  1216K -> 1184K (59392K)  [ PSPermGen:  2951K -> 2951K (30720K) ], 0.0052445 secs ]  [ Times: user=0.02 sys=0.00, real=0.01 secs ] Heap PSYoungGen      total 18432K, used 327K [0x00000000fec00000, 0x0000000100000000, 0x0000000100000000)  eden space 16384K, 2% used [0x00000000fec00000,0x00000000fec51f58,0x00000000ffc00000)  from space 2048K, 0% used [0x00000000ffe00000,0x00000000ffe00000,0x0000000100000000)  to   space 2048K, 0% used [0x00000000ffc00000,0x00000000ffc00000,0x00000000ffe00000) PSOldGen        total 40960K, used 1184K [0x00000000fc400000, 0x00000000fec00000, 0x00000000fec00000)  object space 40960K, 2% used [0x00000000fc400000,0x00000000fc5281f8,0x00000000fec00000) PSPermGen       total 30720K, used 2959K [0x00000000fa600000, 0x00000000fc400000, 0x00000000fc400000)  object space 30720K, 9% used [0x00000000fa600000,0x00000000fa8e3ce0,0x00000000fc400000)

從列印結果可以看出,堆中新生代的記憶體空間為 18432K ( 約 18M ),eden 的記憶體空間為 16384K ( 約 16M),from / to survivor 的記憶體空間為 2048K ( 約 2M)。
這裡所配置的 Xmn 為 20M,也就是指定了新生代的記憶體空間為 20M,可是從列印的堆資訊來看,新生代怎麼就只有 18M 呢? 另外的 2M 哪裡去了? 別急,是這樣的。新生代 = eden + from + to = 16 + 2 + 2 = 20M,可見新生代的記憶體空間確實是按 Xmn 引數分配得到的。而且這裡指定了 SurvivorRatio = 8,因此,eden = 8/10 的新生代空間 = 8/10 * 20 = 16M。from = to = 1/10 的新生代空間 = 1/10 * 20 = 2M。
堆資訊中新生代的 total 18432K 是這樣來的: eden + 1 個 survivor = 16384K + 2048K = 18432K,即約為 18M。
jvm 每次只是用新生代中的 eden 和 一個 survivor,因此新生代實際的可用記憶體空間大小為所指定的 90%。
因此可以知道,這裡新生代的記憶體空間指的是新生代可用的總的記憶體空間,而不是指整個新生代的空間大小。
另外,可以看出老年代的記憶體空間為 40960K ( 約 40M ),堆大小 = 新生代 + 老年代。因此在這裡,老年代 = 堆大小 - 新生代 = 60 - 20 = 40M。
最後,這裡還指定了 PermSize = 30m,PermGen 即永久代 ( 方法區 ),它還有一個名字,叫非堆,主要用來儲存由 jvm 載入的類檔案資訊、常量、靜態變數等。

回到 doTest() 方法中,可以看到程式碼在第 17、21、22 這三行中分別申請了一塊 1M 大小的記憶體空間,並在 19 和 23 這兩行中分別顯式的呼叫了 System.gc()。從控制檯列印的資訊來看,每次調 System.gc(),是先進行 Minor GC,然後再進行 Full GC。
第 19 行觸發的 Minor GC 收集分析:
從資訊 PSYoungGen :  1351K -> 288K,可以知道,在第 17 行為 bytes 分配的記憶體空間已經被回收完成。
引起 GC 回收這 1M 記憶體空間的因素是第 18 行的 bytes = null;   bytes 為 null 表明之前申請的那 1M 大小的記憶體空間現在已經沒有任何引用變數在使用它了,並且在記憶體中它處於一種不可到達狀態 ( 即沒有任何引用鏈與 GC Roots 相連 )。那麼,當 Minor GC 發生的時候,GC 就會來回收掉這部分的記憶體空間。
第 19 行觸發的 Full GC 收集分析:
在 Minor GC 的時候,資訊顯示 PSYoungGen :  1351K -> 288K,再看看 Full GC 中顯示的 PSYoungGen :  288K -> 0K,可以看出,Full GC 後,新生代的記憶體使用變成0K 了,那麼這 288K 到底哪去了 ? 難道都被 GC 當成垃圾回收掉了 ? 當然不是了。我還特意在 main 方法中 new 了一個 Test 類的例項,這裡的 Test 類的例項屬於小物件,它應該被分配到新生代記憶體當中,現在還在呼叫這個例項的 doTest 方法呢,GC 不可能在這個時候來回收它的。
接著往下看 Full GC 的資訊,會發現一個很有趣的現象,PSOldGen:  0K  -> 160K,可以看到,Full GC 後,老年代的記憶體使用從 0K 變成了 160K,想必你已經猜到大概是怎麼回事了。當 Full GC 進行的時候,預設的方式是儘量清空新生代 ( YoungGen ),因此在調 System.gc() 時,新生代 ( YoungGen ) 中存活的物件會提前進入老年代。
第 23 行觸發的 Minor GC 收集分析:
從資訊 PSYoungGen :  2703K -> 1056K,可以知道,在第 21 行建立的,大小為 1M 的陣列被 GC 回收了。在第 22 行建立的,大小也為 1M 的陣列由於 bytes 引用變數還在引用它,因此,它暫時未被 GC 回收。
第 23 行觸發的 Full GC 收集分析:
在 Minor GC 的時候,資訊顯示 PSYoungGen :  2703K -> 1056K,Full GC 中顯示的 PSYoungGen :  1056K -> 0K,以及 PSOldGen:  160K -> 1184K,可以知道,新生代 ( YoungGen ) 中存活的物件又提前進入老年代了。

我是天王蓋地虎的分割線