1. 程式人生 > >搞定面試官:咱們從頭到尾再說一次 Java 垃圾回收

搞定面試官:咱們從頭到尾再說一次 Java 垃圾回收

接著前幾天的兩篇文章,繼續解析JVM面試問題,送給年後想要跳槽的小夥伴

萬萬沒想到,面試中,連 ClassLoader類載入器 也能問出這麼多問題.....

萬萬沒想到,JVM記憶體區域的面試題也可以問的這麼難?

三、GC垃圾回收

1、GC是什麼?為什麼要GC

GC:垃圾收集,GC能幫助我們釋放jvm記憶體,可以一定程度避免OOM問題,但是也無法完全避免。Java的GC是自動工作的,不像C++需要主動呼叫。

當new物件的時候,GC就開始監控這個物件的地址大小和使用情況了,通過可達性分析演算法尋找不可達的物件然後進行標記看看是否需要GC回收掉釋放記憶體。

2、你能保證GC執行嗎?

不能,我只能通過手動執行System.gc()

方法通知GC執行,但是他是否執行的未知的。

3、物件的引用型別有哪幾種,分別介紹下

強引用

發生GC的時候不會回收強引用所關聯的物件。比如new就是強引用。

軟引用

有用但非必須的物件,在OOM之前會把這些物件列進回收範圍之中進行第二次回收,若第二次回收還沒有足夠的記憶體,則會丟擲OOM。也就是第一次快要發生OOM的時候不會立馬丟擲OOM,而是會回收掉這些軟引用,然後再看記憶體是否足夠,若還不夠才會丟擲OOM。

弱引用

有用但非必須的物件,比軟引用更弱一些,只要開始GC,不管你記憶體夠不夠,都會將 弱引用所關聯的物件給回收掉。

虛引用

也叫幽靈引用/幻影引用,無法通過虛引用獲得物件,他的意義在於能在這個物件被GC掉時收到一個系統通知,僅此而已。

4、垃圾收集演算法有哪些

標記清除

分為兩步:標記和清除。

首先需要標記出所有需要回收的物件,然後進行清除回收變為可用記憶體。

缺點:效率低,會產生垃圾碎片 。

標記清除01

標記清除

複製演算法

將可用堆記憶體按照容量分為大小相等的兩塊,每次只用一塊,當這塊記憶體快用完了,就將還存活著的物件複製到另一塊上面,然後再把已使用過的記憶體一次清理掉。

年輕代from/to(s1/s2)採取的就是此種演算法。老年代一般不會採取此種演算法,因為老年代都是大物件且存活的久的,空間壓縮一半代價略高。

優點:效率較高、不會產生碎片。

缺點:將記憶體縮小為原來的一半,代價略高。

 

 

標記整理

分為兩步:標記和整理。

整理其實也是兩步:整理+清除。

整理讓所有存活的物件都移動到一端,然後清理掉邊界以外的記憶體。

優點:不會產生碎片問題,適合年老代的大物件儲存,不像複製演算法那樣浪費空間。

缺點:效率趕不上覆制演算法。

 

 

分代演算法

並不是新演算法,而是根據物件存活週期的不同將記憶體劃分為幾塊,一般是新生代和老年代,新生代基本採用複製演算法,老年代採用標記整理演算法。

5、為什麼要分代

因為在不進行物件存活時間區分的情況下,每次垃圾回收都是對整個堆空間進行回收,花費時間會相對較長,也有很多物件完全沒必要遍歷,比如大物件存活的時間更長,遍歷下來發現不需要回收,這樣更浪費時間。所以才有了分代,分治的思想,進行區域劃分,把不同生命週期的物件放在不同的區域,不同的區域採取最適合他的垃圾回收方式進行回收。

6、分代垃圾回收是怎麼工作的

分代回收基於這樣一個理念:不同的物件的生命週期是不一樣的,因此根據物件存活週期的不同將記憶體劃分為幾塊,一般是新生代和老年代,新生代基本採用複製演算法,老年代採用標記整理演算法。這樣來提高回收效率。

新生代執行流程:

  • 把 Eden + From Survivor(S1) 存活的物件放入 To Survivor(S2) 區;
  • 清空 Eden 和S1 區;
  • S1 和 S2 區交換,S1 變 S2,S2變S1。

每次在S1到S2移動時都存活的物件,年齡就 +1,當年齡到達 15(預設配置是 15)時,升級為老年代。大物件也會直接進入老年代。

老年代當空間佔用到達某個值之後就會觸發全域性垃圾收回,一般使用標記整理的執行演算法。

7、垃圾回收器有哪些

 

Serial

採取複製演算法,用於新生代,單執行緒收集器,所以在他工作時會產生StopTheWorld。單執行緒情況下效率更高,比如用於GUI小程式

ParNew

採取複製演算法,用於新生代,是Serial的多執行緒版本,多個GC執行緒同時工作,但是也會產生StopTheWorld,因為不能和工作執行緒並行。

Parallel Scavenge

採取複製演算法,用於新生代,和ParNew一樣,所以也會產生STW,多執行緒收集器,他是吞吐量優先的收集器,提供了很多引數來調節吞吐量。

Serial Old

採取標記整理演算法,用於老年代,單執行緒收集器,所以在他工作時會產生StopTheWorld。單執行緒情況下效率更高,比如用於GUI小程式

Parallel Old

採取標記整理演算法,用於老年代,Parallel Scavenge收集器的老年代版本,吞吐量優先。

CMS

採取標記清除演算法,老年代並行收集器,號稱以最短STW時間為目標的收集器,併發高、停頓低、STW時間短的優點。主流垃圾收集器之一。

G1

採取標記整理演算法,並行收集器。對比CMS的好處之一就是不會產生記憶體碎片,此外,G1收集器不同於之前的收集器的一個重要特點是:G1回收的範圍是整個Java堆(包括新生代,老年代),而前六種收集器回收的範圍僅限於新生代或老年代。而且他的STW停頓時間是可以手動控制一個長度為M毫秒的時間片段(可以用JVM引數 -XX:MaxGCPauseMillis指定),設定完後垃圾收集的時長不得超過這個(近實時)。

8、詳細介紹一下 CMS 垃圾回收器?

採取標記清除演算法,老年代並行收集器,號稱以最短STW時間為目標的收集器,併發高、停頓低、STW時間短的優點。主流垃圾收集器之一。

主要分為四階段:

  • 初始標記:只是標記一下 GC Roots 能直接關聯的物件,速度很快,仍然需要暫停所有的工作執行緒。所以此階段會STW,但時間很短。
  • 併發標記:進行 GC Roots 跟蹤的過程,和使用者執行緒一起工作,不需要暫停工作執行緒。不會STW。
  • 重新標記:為了修正在併發標記期間,因使用者程式繼續執行而導致標記產生變動的那一部分物件的標記記錄,仍然需要暫停所有的工作執行緒。STW時間會比第一階段稍微長點,但是遠比並發標記短,效率也很高。
  • 併發清除:清除GC Roots不可達物件,和使用者執行緒一起工作,不需要暫停工作執行緒。

 

所以CMS的優點是:

  • 併發高
  • 停頓低
  • STW時間短。

缺點:

  • 對cpu資源非常敏感(併發階段雖然不會影響使用者執行緒,但是會一起佔用CPU資源,競爭激烈的話會導致程式變慢)。

  • 無法處理浮動垃圾,當剩餘記憶體不能滿足程式執行要求時,系統將會出現 Concurrent Mode Failure,失敗後而導致另一次Full GC的產生,由於CMS併發清除階段使用者執行緒還在執行,伴隨程式的執行自然會有新的垃圾產生,這一部分垃圾是出現在標記過程之後的,CMS無法在本次去處理他們,所以只好留在下一次GC時候將其清理掉。

  • 記憶體碎片問題(因為是標記清除演算法)。當剩餘記憶體不能滿足程式執行要求時,系統將會出現 Concurrent Mode Failure,臨時 CMS 會採用 Serial Old 回收器進行垃圾清除,此時的效能將會被降低。

9、詳細介紹一下 G1 垃圾回收器?

採取標記整理演算法,並行收集器。

特點:

  • 並行與併發執行:利用多CPU的優勢來縮短STW時間,在GC工作的時候,使用者執行緒可以並行執行。
  • 分代收集:無需其他收集器配合,自己G1會進行分代收集。
  • 空間整合:不會像CMS那樣產生記憶體碎片。
  • 可預測的停頓:可以手動控制一個長度為M毫秒的時間片段(可以用JVM引數 -XX:MaxGCPauseMillis指定),設定完後垃圾收集的時長不得超過這個(近實時)。

原理:

G1並不是簡單的把堆記憶體分為新生代和老年代兩部分,而是把整個堆劃分為多個大小相等的獨立區域(Region),新生代和老年代也是一部分不需要連續Region的集合。G1跟蹤各個Region裡面的垃圾堆積的價值大小,在後臺維護一個優先列表,每次根據允許的收集時間,優先回收價值最大的Region。

補充:

Region不是孤立的,也就是說一個物件分配在某個Region中,他並非只能被本Region中的其他物件引用,而是整個堆中任意的物件都可以相互引用,那麼在【可達性分析法】來判斷物件是否存活的時候也無需掃描整個堆,Region之間的物件引用以及其他手機其中新生代和老年代之間的物件引用虛擬機器都是使用Remembered Set來避免全堆掃描的。

步驟:

  • 初始標記:僅僅標記GCRoots能直接關聯到的物件,且修改TAMS的值讓下一階段使用者程式併發執行時能正確可用的Region中建立的新物件。速度很快,會STW。
  • 併發標記:進行 GC Roots 跟蹤的過程,和使用者執行緒一起工作,不需要暫停工作執行緒。不會STW。
  • 最終標記:為了修正在併發標記期間,因使用者程式繼續執行而導致標記產生變動的那一部分物件的標記記錄,仍然需要暫停所有的工作執行緒。STW時間會比第一階段稍微長點,但是遠比並發標記短,效率也很高。
  • 篩選回收:首先對各個Region的回收價值和成本進行排序,根據使用者所期望的GC停頓時間來制定回收計劃。

 

10、GC日誌分析

11、Minor GC與Full GC分別在什麼時候發生

新生代記憶體(Eden區)不夠用時候發生Minor GC也叫YGC。

Full GC發生情況:

  • 老年代被寫滿
  • 持久代被寫滿
  • System.gc()被顯示呼叫(只是會告訴需要GC,什麼時候發生並不知道)

12、新生代垃圾回收器和老年代垃圾回收器都有哪些?有什麼區別?

  • 新生代回收器:Serial、ParNew、Parallel Scavenge
  • 老年代回收器:Serial Old、Parallel Old、CMS
  • 整堆回收器:G1

新生代垃圾回收器一般採用的是複製演算法,複製演算法的優點是效率高,缺點是記憶體利用率低;老年代回收器一般採用的是標記-整理的演算法進行垃圾回收。標記整理很適合大物件,不會產生空間碎片。

13、棧上分配是什麼意思

JVM允許將執行緒私有的物件分配在棧上,而不是分配在堆上。分配在棧上的好處是棧上分配不需要考慮垃圾回收,因為出棧的時候物件就順帶著一起出去了,沒了,而不需要垃圾回收器的介入,從而提高系統性能。

補充1:物件逃逸。

逃逸的目的是判斷物件的作用域是否有可能逃出函式體。例如下面的程式碼就顯示了一個逃逸的物件:

private User user;
private void hello(){
   user = new User();
}

 

物件例項 user 是類的成員變數,可以被任何執行緒訪問,因此它屬於逃逸物件。但如果我們將程式碼稍微改動一下,該物件就可以執行緒非逃逸的了。

private void hello(){
   User user = new User();
}

 

可以看到 user 例項作用域只在 hello 函式中,不會被其他執行緒訪問到,也不會訪問。所以該 user 例項物件的作用域只在該函式中,因此它並未發生逃逸。對於這樣的情況,虛擬機器就有可能將其分配在棧上,而不在堆上。

補充2:TLAB,自行Google。

簡單點說,就是將本來應該分配在堆中的物件,讓其分配線上程私有的棧上。通過這種方式,減少垃圾回收的壓力,提高虛擬機器的執行效率。

14、簡述下物件的分配規則

  • 物件優先分配在Eden區,如果Eden區沒有足夠的空間時,虛擬機器執行一次YGC。並將還活著的物件放到from/to區,若本次YGC後還是沒有足夠的空間,則將啟用分配擔保機制在老年代中分配記憶體。
  • 大物件直接進入老年代(大物件是指需要大量連續記憶體空間的物件)。這樣做的目的是避免在Eden區和兩個Survivor區之間發生大量的記憶體拷貝(新生代採用複製演算法收集記憶體)。
  • 長期存活的物件進入老年代。虛擬機器為每個物件定義了一個年齡計數器,如果物件經過了1次YGC那麼物件會進入Survivor區,之後每經過一次YGC那麼物件的年齡加1,直到達到閥值物件進入老年區。預設閾值是15。可以通過-XX:MaxTenuringThreshold引數來設定。
  • 動態判斷物件的年齡。如果Survivor區中相同年齡的所有物件大小的總和大於Survivor空間的一半,年齡大於或等於該年齡的物件可以直接進入老年代。無需等到-XX:MaxTenuringThreshold引數要求的年齡。

動態年齡判斷是有歧義的,要想面試加分,必看這個

https://www.jianshu.com/p/989d3b06a49d

  • 空間分配擔保。每次進行YGC時,JVM會計算Survivor區移至老年區的物件的平均大小,如果這個值大於老年區的剩餘值大小則進行一次Full GC,如果小於檢查HandlePromotionFailure設定,如果true則只進行YGC,如果false則進行Full GC。

推薦好文

強大,10k+點讚的 SpringBoot 後臺管理系統竟然出了詳細教程!

分享一套基於SpringBoot和Vue的企業級中後臺開源專案,程式碼很規範!

能掙錢的,開源 SpringBoot 商城系統,功能超全,超漂