【JVM】垃圾收集器
七、垃圾收集器
JDK7/8後,HotSpot虛擬機器所有收集器及組合(連線),如下圖:
-
圖中展示了7種不同分代的收集器:
Serial、ParNew、Parallel Scavenge、Serial Old、Parallel Old、CMS、G1;
-
它們所處區域,則表明其是屬於新生代收集器還是老年代收集器:
新生代收集器:Serial、ParNew、Parallel Scavenge;
老年代收集器:Serial Old、Parallel Old、CMS;
整堆收集器:G1;
-
兩個收集器間有連線,表明它們可以搭配使用
併發垃圾收集和並行垃圾收集的區別
-
並行(Parallel):指多條垃圾收集執行緒並行工作,但此時使用者執行緒仍然處於等待狀態;如ParNew、Parallel Scavenge、Parallel Old;
-
併發(Concurrent):指使用者執行緒與垃圾收集執行緒同時執行(但不一定是並行的,可能會交替執行);使用者程式在繼續執行,而垃圾收集程式執行緒運行於另一個CPU上;如CMS、G1(也有並行);
1、Serial收集器
-
Serial(序列)垃圾收集器是最基本、發展歷史最悠久的收集器;
-
JDK1.3.1前是HotSpot新生代收集的唯一選擇;
1)、特點
-
針對新生代,採用複製演算法;
-
單執行緒收集,進行垃圾收集時,必須暫停所有工作執行緒,直到完成;即會"Stop The World";
Serial/Serial Old組合收集器執行示意圖如下
2)、應用場景
依然是HotSpot在Client模式下預設的新生代收集器;
也有優於其他收集器的地方:
簡單高效(與其他收集器的單執行緒相比);
對於限定單個CPU的環境來說,Serial收集器沒有執行緒互動(切換)開銷,可以獲得最高的單執行緒收集效率;
在使用者的桌面應用場景中,可用記憶體一般不大(幾十M至一兩百M),可以在較短時間內完成垃圾收集(幾十MS至一百多MS),只要不頻繁發生,這是可以接受的
3)、設定引數
"-XX:+UseSerialGC":新增該引數來顯式的使用序列垃圾收集器;
4)、Stop TheWorld說明
-
JVM在後臺自動發起和自動完成的,在使用者不可見的情況下,把使用者正常的工作執行緒全部停掉,即GC停頓;
-
會帶給使用者不良的體驗;
從JDK1.3到現在,從Serial收集器-》Parallel收集器-》CMS-》G1,使用者執行緒停頓時間不斷縮短,但仍然無法完全消除;
2、ParNew收集器
ParNew垃圾收集器是Serial收集器的多執行緒版本。
1)、特點
-
除了多執行緒外,其餘的行為、特點和Serial收集器一樣;
-
如Serial收集器可用控制引數、收集演算法、Stop The World、記憶體分配規則、回收策略等;
-
兩個收集器共用了不少程式碼;
ParNew/Serial Old組合收集器執行示意圖如下:
2)、應用場景
-
在Server模式下,ParNew收集器是一個非常重要的收集器,因為除Serial外,目前只有它能與CMS收集器配合工作;
-
使用多個CPU的情況下,對於GC系統資源有效利用還是很有好處的。但在單個CPU環境中,不會比Serail收集器有更好的效果,因為存線上程互動開銷。
3)、設定引數
-
"-XX:+UseConcMarkSweepGC":指定使用CMS後,會預設使用ParNew作為新生代收集器;
-
"-XX:+UseParNewGC":強制指定使用ParNew;
-
"-XX:ParallelGCThreads":指定垃圾收集的執行緒數量,ParNew預設開啟的收集執行緒與CPU的數量相同;
4)、為什麼只有ParNew能與CMS收集器配合
CMS是HotSpot在JDK1.5推出的第一款真正意義上的併發(Concurrent)收集器,第一次實現了讓垃圾收集執行緒與使用者執行緒(基本上)同時工作;
CMS作為老年代收集器,但卻無法與JDK1.4已經存在的新生代收集器Parallel Scavenge配合工作;
因為Parallel Scavenge(以及G1)都沒有使用傳統的GC收集器程式碼框架,而另外獨立實現;而其餘幾種收集器則共用了部分的框架程式碼;
3、Parallel Scavenge收集器
Parallel Scavenge垃圾收集器因為與吞吐量關係密切,也稱為吞吐量收集器(Throughput Collector)。
1)、特點
-
有一些特點與ParNew收集器相似
-
新生代收集器;
-
採用複製演算法;
-
多執行緒收集;
-
-
主要特點是:
-
CMS等收集器的關注點是儘可能地縮短垃圾收集時使用者執行緒的停頓時間;
-
Parallel Scavenge收集器的目標則是達一個可控制的吞吐量(Throughput);
-
2)、應用場景
-
高吞吐量為目標,即減少垃圾收集時間,讓使用者程式碼獲得更長的執行時間;
-
當應用程式執行在具有多個CPU上,對暫停時間沒有特別高的要求時,即程式主要在後臺進行計算,而不需要與使用者進行太多互動;例如,那些執行批量處理、訂單處理、工資支付、科學計算的應用程式;
3)、設定引數
Parallel Scavenge收集器提供兩個引數用於精確控制吞吐量:
-
"-XX:MaxGCPauseMillis"
-
控制最大垃圾收集停頓時間,大於0的毫秒數;
-
MaxGCPauseMillis設定得稍小,停頓時間可能會縮短,但也可能會使得吞吐量下降;
-
因為可能導致垃圾收集發生得更頻繁;
-
-
"-XX:GCTimeRatio"
-
設定垃圾收集時間佔總時間的比率,0<n<100的整數;
-
GCTimeRatio相當於設定吞吐量大小;
-
垃圾收集執行時間佔應用程式執行時間的比例的計算方法是:1 / (1 + n),例如,選項-XX:GCTimeRatio=19,設定了垃圾收集時間佔總時間的5%--1/(1+19);預設值是1%--1/(1+99),即n=99;垃圾收集所花費的時間是年輕一代和老年代收集的總時間;如果沒有滿足吞吐量目標,則增加代的記憶體大小以儘量增加使用者程式執行的時間;
-
-
此外,還有一個值得關注的引數:"-XX:+UseAdptiveSizePolicy",開啟這個引數後,就不用手工指定一些細節引數,如:
-
新生代的大小(-Xmn)、Eden與Survivor區的比例(-XX:SurvivorRation)、晉升老年代的物件年齡(-XX:PretenureSizeThreshold)等;
-
JVM會根據當前系統執行情況收集效能監控資訊,動態調整這些引數,以提供最合適的停頓時間或最大的吞吐量,這種調節方式稱為GC自適應的調節策略(GC Ergonomiscs);這也是Parallel Scavenge收集器與ParNew收集器一個重要區別;
-
這是一種值得推薦的方式: (1)、只需設定好記憶體資料大小(如"-Xmx"設定最大堆);(2)、然後使用"-XX:MaxGCPauseMillis"或"-XX:GCTimeRatio"給JVM設定一個優化目標;(3)、那些具體細節引數的調節就由JVM自適應完成;
-
4)、吞吐量與收集器關注點說明
-
吞吐量(Throughput)
-
CPU用於執行使用者程式碼的時間與CPU總消耗時間的比值;
-
即吞吐量=執行使用者程式碼時間/(執行使用者程式碼時間+垃圾收集時間);
-
高吞吐量即減少垃圾收集時間,讓使用者程式碼獲得更長的執行時間;
-
-
垃圾收集器期望的目標(關注點)
-
(1)、停頓時間
-
停頓時間越短就適合需要與使用者互動的程式;
-
良好的響應速度能提升使用者體驗;
-
-
(2)、吞吐量
-
高吞吐量則可以高效率地利用CPU時間,儘快完成運算的任務;
-
主要適合在後臺計算而不需要太多互動的任務;
-
-
(3)、覆蓋區(Footprint)
-
在達到前面兩個目標的情況下,儘量減少堆的記憶體空間;
-
可以獲得更好的空間區域性性;
-
-
4、Serial Old收集器
Serial Old是 Serial收集器的老年代版本;
1)、特點
-
針對老年代;
-
採用"標記-整理"演算法(還有壓縮,Mark-Sweep-Compact);
-
單執行緒收集;
Serial/Serial Old收集器執行示意圖如下:
2)、應用場景
-
主要用於Client模式;
-
在Server模式有兩大用途:
-
(A)、在JDK1.5及之前,與Parallel Scavenge收集器搭配使用(JDK1.6有Parallel Old收集器可搭配);
-
(B)、作為CMS收集器的後備預案,在併發收集發生Concurrent Mode Failure時使用(後面詳解);
-
5、Parallel Old收集器
Parallel Old垃圾收集器是Parallel Scavenge收集器的老年代版本;JDK1.6中才開始提供;
1)、特點
-
針對老年代;
-
採用"標記-整理"演算法;
-
多執行緒收集;
Parallel Scavenge/Parallel Old收集器執行示意圖如下:
2)、應用場景
-
JDK1.6及之後用來代替老年代的Serial Old收集器;
-
特別是在Server模式,多CPU的情況下;這樣在注重吞吐量以及CPU資源敏感的場景,就有了Parallel Scavenge加Parallel Old收集器的"給力"應用組合;
3)、設定引數
"-XX:+UseParallelOldGC":指定使用Parallel Old收集器;
6、CMS收集器
併發標記清理(Concurrent Mark Sweep,CMS)收集器也稱為併發低停頓收集器(Concurrent Low Pause Collector)或低延遲(low-latency)垃圾收集器;
在前面ParNew收集器曾簡單介紹過其特點;
1)、特點
-
針對老年代;
-
基於"標記-清除"演算法(不進行壓縮操作,產生記憶體碎片);
-
以獲取最短回收停頓時間為目標;
-
併發收集、低停頓;
-
需要更多的記憶體(看後面的缺點);
-
是HotSpot在JDK1.5推出的第一款真正意義上的併發(Concurrent)收集器;
-
第一次實現了讓垃圾收集執行緒與使用者執行緒(基本上)同時工作;
2)、應用場景
-
與使用者互動較多的場景;
-
希望系統停頓時間最短,注重服務的響應速度;
-
以給使用者帶來較好的體驗;如常見WEB、B/S系統的伺服器上的應用;
3)、設定引數
"-XX:+UseConcMarkSweepGC":指定使用CMS收集器;
4)、CMS收集器運作過程
比前面幾種收集器更復雜,可以分為4個步驟:
-
(A)、初始標記(CMS initial mark)
-
僅標記一下GC Roots能直接關聯到的物件;
-
速度很快;
-
但需要"Stop The World";
-
-
(B)、併發標記(CMS concurrent mark)
-
進行GC Roots Tracing的過程;
-
剛才產生的集合中標記出存活物件;
-
應用程式也在執行;
-
並不能保證可以標記出所有的存活物件;
-
-
(C)、重新標記(CMS remark)
-
為了修正併發標記期間因使用者程式繼續運作而導致標記變動的那一部分物件的標記記錄;
-
需要"Stop The World",且停頓時間比初始標記稍長,但遠比並發標記短;
-
採用多執行緒並行執行來提升效率;
-
-
(D)、併發清除(CMS concurrent sweep)
-
回收所有的垃圾物件;
-
整個過程中耗時最長的併發標記和併發清除都可以與使用者執行緒一起工作;
-
-
所以總體上說,CMS收集器的記憶體回收過程與使用者執行緒一起併發執行;
CMS收集器執行示意圖如下:
5)、CMS收集器3個明顯的缺點
(A)、對CPU資源非常敏感
-
併發收集雖然不會暫停使用者執行緒,但因為佔用一部分CPU資源,還是會導致應用程式變慢,總吞吐量降低。
-
CMS的預設收集執行緒數量是=(CPU數量+3)/4;
-
當CPU數量多於4個,收集執行緒佔用的CPU資源多於25%,對使用者程式影響可能較大;不足4個時,影響更大,可能無法接受。
-
增量式併發收集器:
-
針對這種情況,曾出現了"增量式併發收集器"(Incremental Concurrent Mark Sweep/i-CMS);
-
類似使用搶佔式來模擬多工機制的思想,讓收集執行緒和使用者執行緒交替執行,減少收集執行緒執行時間;
-
但效果並不理想,JDK1.6後就官方不再提倡使用者使用。
-
(B)、無法處理浮動垃圾,可能出現"Concurrent Mode Failure"失敗
-
(1)、浮動垃圾(Floating Garbage)
-
在併發清除時,使用者執行緒新產生的垃圾,稱為浮動垃圾;
-
這使得併發清除時需要預留一定的記憶體空間,不能像其他收集器在老年代幾乎填滿再進行收集;
-
也要可以認為CMS所需要的空間比其他垃圾收集器大;
-
"-XX:CMSInitiatingOccupancyFraction":設定CMS預留記憶體空間;
-
JDK1.5預設值為68%;JDK1.6變為大約92%;
-
-
(2)、"Concurrent Mode Failure"失敗
-
如果CMS預留記憶體空間無法滿足程式需要,就會出現一次"Concurrent Mode Failure"失敗;
-
這時JVM啟用後備預案:臨時啟用Serail Old收集器,而導致另一次Full GC的產生;
-
這樣的代價是很大的,所以CMSInitiatingOccupancyFraction不能設定得太大。
-
(C)、產生大量記憶體碎片
-
由於CMS基於"標記-清除"演算法,清除後不進行壓縮操作;產生大量不連續的記憶體碎片會導致分配大記憶體物件時,無法找到足夠的連續記憶體,從而需要提前觸發另一次Full GC動作。
-
解決方法:
-
(1)、"-XX:+UseCMSCompactAtFullCollection"
-
使得CMS出現上面這種情況時不進行Full GC,而開啟記憶體碎片的合併整理過程;
-
但合併整理過程無法併發,停頓時間會變長;
-
預設開啟(但不會進行,結合下面的CMSFullGCsBeforeCompaction);
-
-
(2)、"-XX:+CMSFullGCsBeforeCompaction"
-
設定執行多少次不壓縮的Full GC後,來一次壓縮整理;
-
為減少合併整理過程的停頓時間;
-
預設為0,也就是說每次都執行Full GC,不會進行壓縮整理;
-
-
由於空間不再連續,CMS需要使用可用"空閒列表"記憶體分配方式,這比簡單實用"碰撞指標"分配記憶體消耗大;
總體來看,與Parallel Old垃圾收集器相比,CMS減少了執行老年代垃圾收集時應用暫停的時間;
但卻增加了新生代垃圾收集時應用暫停的時間、降低了吞吐量而且需要佔用更大的堆空間;
7、G1收集器
G1(Garbage-First)是JDK7-u4才推出商用的收集器;
1)、特點
(A)、並行與併發
能充分利用多CPU、多核環境下的硬體優勢;
可以並行來縮短"Stop The World"停頓時間;
也可以併發讓垃圾收集與使用者程式同時進行;
(B)、分代收集,收集範圍包括新生代和老年代
能獨立管理整個GC堆(新生代和老年代),而不需要與其他收集器搭配;
能夠採用不同方式處理不同時期的物件;
雖然保留分代概念,但Java堆的記憶體佈局有很大差別;
將整個堆劃分為多個大小相等的獨立區域(Region);
新生代和老年代不再是物理隔離,它們都是一部分Region(不需要連續)的集合;
(C)、結合多種垃圾收集演算法,空間整合,不產生碎片
從整體看,是基於標記-整理演算法;
從區域性(兩個Region間)看,是基於複製演算法;
這是一種類似火車演算法的實現;
都不會產生記憶體碎片,有利於長時間執行;
(D)、可預測的停頓:低停頓的同時實現高吞吐量
G1除了追求低停頓處,還能建立可預測的停頓時間模型;
可以明確指定M毫秒時間片內,垃圾收集消耗的時間不超過N毫秒;
2、應用場景
面向服務端應用,針對具有大記憶體、多處理器的機器;
最主要的應用是為需要低GC延遲,並具有大堆的應用程式提供解決方案;
如:在堆大小約6GB或更大時,可預測的暫停時間可以低於0.5秒;
用來替換掉JDK1.5中的CMS收集器;
在下面的情況時,使用G1可能比CMS好:
(1)、超過50%的Java堆被活動資料佔用;
(2)、物件分配頻率或年代提升頻率變化很大;
(3)、GC停頓時間過長(長於0.5至1秒)。
是否一定採用G1呢?也未必:
如果現在採用的收集器沒有出現問題,不用急著去選擇G1;
如果應用程式追求低停頓,可以嘗試選擇G1;
是否代替CMS需要實際場景測試才知道。
3、設定引數
"-XX:+UseG1GC":指定使用G1收集器;
"-XX:InitiatingHeapOccupancyPercent":當整個Java堆的佔用率達到引數值時,開始併發標記階段;預設為45;
"-XX:MaxGCPauseMillis":為G1設定暫停時間目標,預設值為200毫秒;
"-XX:G1HeapRegionSize":設定每個Region大小,範圍1MB到32MB;目標是在最小Java堆時可以擁有約2048個Region;
4、為什麼G1收集器可以實現可預測的停頓
G1可以建立可預測的停頓時間模型,是因為:
可以有計劃地避免在Java堆的進行全區域的垃圾收集;
G1跟蹤各個Region獲得其收集價值大小,在後臺維護一個優先列表;
每次根據允許的收集時間,優先回收價值最大的Region(名稱Garbage-First的由來);
這就保證了在有限的時間內可以獲取儘可能高的收集效率;
5、一個物件被不同區域引用的問題
一個Region不可能是孤立的,一個Region中的物件可能被其他任意Region中物件引用,判斷物件存活時,是否需要掃描整個Java堆才能保證準確?
在其他的分代收集器,也存在這樣的問題(而G1更突出):
回收新生代也不得不同時掃描老年代?
這樣的話會降低Minor GC的效率;
解決方法:
無論G1還是其他分代收集器,JVM都是使用Remembered Set來避免全域性掃描:
每個Region都有一個對應的Remembered Set;
每次Reference型別資料寫操作時,都會產生一個Write Barrier暫時中斷操作;
然後檢查將要寫入的引用指向的物件是否和該Reference型別資料在不同的Region(其他收集器:檢查老年代物件是否引用了新生代物件);
如果不同,通過CardTable把相關引用資訊記錄到引用指向物件的所在Region對應的Remembered Set中;
當進行垃圾收集時,在GC根節點的列舉範圍加入Remembered Set;
就可以保證不進行全域性掃描,也不會有遺漏。
6)、G1收集器運作過程
不計算維護Remembered Set的操作,可以分為4個步驟(與CMS較為相似)。
(A)、初始標記(Initial Marking)
僅標記一下GC Roots能直接關聯到的物件;
且修改TAMS(Next Top at Mark Start),讓下一階段併發執行時,使用者程式能在正確可用的Region中建立新物件;需要"Stop The World",但速度很快;
(B)、併發標記(Concurrent Marking)
進行GC Roots Tracing的過程;
剛才產生的集合中標記出存活物件;
耗時較長,但應用程式也在執行;
並不能保證可以標記出所有的存活物件;
(C)、最終標記(Final Marking)
為了修正併發標記期間因使用者程式繼續運作而導致標記變動的那一部分物件的標記記錄;
上一階段物件的變化記錄線上程的Remembered Set Log;
這裡把Remembered Set Log合併到Remembered Set中;
需要"Stop The World",且停頓時間比初始標記稍長,但遠比並發標記短;
採用多執行緒並行執行來提升效率;
(D)、篩選回收(Live Data Counting and Evacuation)
首先排序各個Region的回收價值和成本;
然後根據使用者期望的GC停頓時間來制定回收計劃;
最後按計劃回收一些價值高的Region中垃圾物件;
回收時採用"複製"演算法,從一個或多個Region複製存活物件到堆上的另一個空的Region,並且在此過程中壓縮和釋放記憶體;
可以併發進行,降低停頓時間,並增加吞吐量;
G1收集器執行示意圖如下:
常用的收集器組合
伺服器31 | 新生代GC策略 | 老年老代GC策略 | 說明 |
---|---|---|---|
組合1 | Serial | Serial Old | Serial和Serial Old都是單執行緒進行GC,特點就是GC時暫停所有應用執行緒。 |
組合2 | Serial | CMS+Serial Old | CMS(Concurrent Mark Sweep)是併發GC,實現GC執行緒和應用執行緒併發工作,不需要暫停所有應用執行緒。另外,當CMS進行GC失敗時,會自動使用Serial Old策略進行GC。 |
組合3 | ParNew | CMS | 使用-XX:+UseParNewGC 選項來開啟。ParNew是Serial的並行版本,可以指定GC執行緒數,預設GC執行緒數為CPU的數量。可以使用-XX:ParallelGCThreads選項指定GC的執行緒數。如果指定了選項-XX:+UseConcMarkSweepGC 選項,則新生代預設使用ParNew GC策略。 |
組合4 | ParNew | Serial Old | 使用-XX:+UseParNewGC 選項來開啟。新生代使用ParNew GC策略,年老代預設使用Serial Old GC策略。 |
組合5 | Parallel Scavenge | Serial Old | Parallel Scavenge策略主要是關注一個可控的吞吐量:應用程式執行時間 / (應用程式執行時間 + GC時間),可見這會使得CPU的利用率儘可能的高,適用於後臺持久執行的應用程式,而不適用於互動較多的應用程式。 |
組合6 | Parallel Scavenge | Parallel Old | Parallel Old是Serial Old的並行版本 |
組合7 | G1GC | G1GC | -XX:+UnlockExperimentalVMOptions -XX:+UseG1GC #開啟;-XX:MaxGCPauseMillis =50 #暫停時間目標;-XX:GCPauseIntervalMillis =200 #暫停間隔目標;-XX:+G1YoungGenSize=512m #年輕代大小;-XX:SurvivorRatio=6 #倖存區比例 |