1. 程式人生 > >jvm入門及理解(六)——垃圾回收與演算法

jvm入門及理解(六)——垃圾回收與演算法

一、jvm垃圾回收要做的事情

  • 哪些記憶體需要回收
  • 什麼時候回收
  • 怎麼回收

二、如何判斷物件已經死亡,或者說確定為垃圾

  1. 引用計數法:

    給物件中新增一個引用計數器,每當有一個地方引用它時,計數器的值就加1;當引用失效時,計數器值就減1;任何時刻計數器為0的物件就是不可能再被使用的。這也就是需要回收的物件,簡單地說,即一個物件如果沒有任何與之關聯的引用,即他們的引用計數都為 0,則說明物件不太可能再被用到,那麼這個物件就是可回收的物件。

    引用計數法是物件記錄自己被多少程式引用,引用計數為零的物件將被清除。

    計數器表示的是有多少程式引用了這個物件(被引用數)。計數器是無符號的整數。

  2. 根搜尋演算法:

    通過一系列成為GC roots的點作為起點,向下搜尋,當一個物件到任何GC Roots時沒有引用鏈相連,則說明物件已經死亡。

    如果在GC roots和一個物件之間沒有可達路徑(引用鏈),則稱該物件是不可達的。要注意的是,不可達物件不等價於可回收物件,不可達物件變為可回收物件至少要經過兩次標記 過程。兩次標記後仍然是可回收物件,則將面臨回收。

    jvm會將以下的物件定義為GC Roots:

 

  • Java虛擬機器棧中引用的物件:比如方法裡面定義這種區域性變數 User user= new User();
  • 方法區中的靜態屬性引用的物件:比如 private static User user = new User();
  • 常量引用的物件:比如 private static final  User user = new User();
  • 本地方法棧(JNI)中引用的物件

三、垃圾回收演算法

  1. 標記清除演算法(Mark-Sweep)

    是最基礎的垃圾回收演算法,分為兩個階段,標註和清除。標記階段標記出所有需要回收的物件,清除階段回收被標記的物件所佔用的空間。首先從根開始將可能被引用的物件用遞迴的方式進行標記,然後將沒有標記到的物件作為垃圾進行回收。

 

 

從圖中我們就可以發現,該演算法最大的問題是記憶體碎片化嚴重,後續可能發生大物件不能找到可利用空間的問題。

 

 

  2. 複製演算法(copying)

   為了解決 Mark-Sweep 演算法記憶體碎片化的缺陷而被提出的演算法。按記憶體容量將記憶體劃分為等大小 的兩塊。每次只使用其中一塊,當這一塊記憶體滿後將尚存活的物件複製到另一塊上去,把已使用 的記憶體清掉,如圖:

 

 

 

 

 

 這種演算法雖然實現簡單,記憶體效率高,不易產生碎片,但是最大的問題是可用記憶體被壓縮到了原 本的一半。且存活物件增多的話,Copying 演算法的效率會大大降低。

  

  3.標記整理演算法(Mark-Compact)

   結合了以上兩個演算法,為了避免缺陷而提出。標記階段和 Mark-Sweep 演算法相同,標記後不是清 理物件,而是將存活物件移向記憶體的一端。然後清除端邊界外的物件。如圖:

 

 

 

四、分代收集演算法

  介紹:分代收集法是目前大部分 JVM 所採用的方法,其核心思想是根據物件存活的不同生命週期將記憶體 劃分為不同的域,一般情況下將 GC 堆劃分為老生代(Tenured/Old Generation)和新生代(Young Generation)。老生代的特點是每次垃圾回收時只有少量物件需要被回收,新生代的特點是每次垃圾回收時都有大量垃圾需要被回收,因此可以根據不同區域選擇不同的演算法。

  1. 新生代與複製演算法

    目前大部分 JVM 的 GC 對於新生代都採取 Copying 演算法,因為新生代中每次垃圾回收都要 回收大部分物件,即要複製的操作比較少,但通常並不是按照 1:1 來劃分新生代。一般將新生代 劃分為一塊較大的 Eden 空間和兩個較小的 Surviror 空間(From Space, To Space),每次使用 Eden 空間和其中的一塊 Survivor 空間,當進行回收時,將該兩塊空間中還存活的物件複製到另 一塊 Survivor 空間中。

  

 

 

 假設from space為s0,to space 為s1

演算法過程:

  1. Eden+S0可分配新生物件;
  2. 對Eden+S0進行垃圾收集,存活物件複製到S1。清理Eden+S0。一次新生代GC結束。
  3. Eden+S1可分配新生物件;
  4. 對Eden+S1進行垃圾收集,存活物件複製到S0。清理Eden+S1。二次新生代GC結束。
  5. 迴圈1。

  2.老年代與標記整理演算法

老年代因為每次只回收少量物件,因而採用 Mark-Compact 演算法。

1. JAVA 虛擬機器提到過的處於方法區的永生代(Permanet Generation),它用來儲存 class 類, 常量,方法描述等。對永生代的回收主要包括廢棄常量和無用的類。

2. 物件的記憶體分配主要在新生代的 Eden Space 和 Survivor Space 的 From Space(Survivor 目 前存放物件的那一塊),少數情況會直接分配到老生代。

3. 當新生代的 Eden Space 和 From Space 空間不足時就會發生一次 GC,進行 GC 後,Eden Space 和 From Space 區的存活物件會被挪到 To Space,然後將 Eden Space 和 From Space 進行清理。

4. 如果 To Space 無法足夠儲存某個物件,則將這個物件儲存到老生代。

5. 在進行 GC 後,使用的便是 Eden Space 和 To Space 了,如此反覆迴圈。

6. 當物件在 Survivor 區躲過一次 GC 後,其年齡就會+1。預設情況下年齡到達 15 的物件會被 移到老生代中。

 

五、分割槽收集演算法

分割槽演算法則將整個堆空間劃分為連續的不同小區間, 每個小區間獨立使用, 獨立回收. 這樣做的 好處是可以控制一次回收多少個小區間 , 根據目標停頓時間, 每次合理地回收若干個小區間(而不是 整個堆), 從而減少一次 GC 所產生的停頓。

 

六、java中的四種引用

  • 強引用

在 Java 中最常見的就是強引用,把一個物件賦給一個引用變數,這個引用變數就是一個強引 用。當一個物件被強引用變數引用時,它處於可達狀態,它是不可能被垃圾回收機制回收的,即 使該物件以後永遠都不會被用到 JVM 也不會回收。因此強引用是造成 Java 記憶體洩漏的主要原因之一,直接new的物件就是強引用的。

  • 軟引用

軟引用需要用 SoftReference 類來實現,對於只有軟引用的物件來說,當系統記憶體足夠時它 不會被回收,當系統記憶體空間不足時它會被回收。軟引用通常用在對記憶體敏感的程式中。

  • 弱引用

弱引用需要用 WeakReference 類來實現,它比軟引用的生存期更短,對於只有弱引用的物件 來說,只要垃圾回收機制一執行,不管 JVM 的記憶體空間是否足夠,總會回收該物件佔用的記憶體。

  • 虛引用

虛引用需要 PhantomReference 類來實現,它不能單獨使用,必須和引用佇列聯合使用。虛 引用的主要作用是跟蹤物件被垃圾回收的狀態。

 

七、GC 垃圾收集器

Java 堆記憶體被劃分為新生代和年老代兩部分,新生代主要使用複製和標記-清除垃圾回收演算法; 年老代主要使用標記-整理垃圾回收演算法,因此 java 虛擬中針對新生代和年老代分別提供了多種不 同的垃圾收集器,JDK1.6 中 Sun HotSpot 虛擬機器的垃圾收集器如下:

 

新生代:

  1.  Serial 垃圾收集器(單執行緒、複製演算法)

Serial(英文連續)是最基本垃圾收集器,使用複製演算法,曾經是JDK1.3.1 之前新生代唯一的垃圾 收集器。Serial 是一個單執行緒的收集器,它不但只會使用一個 CPU 或一條執行緒去完成垃圾收集工 作,並且在進行垃圾收集的同時,必須暫停其他所有的工作執行緒,直到垃圾收集結束。 Serial 垃圾收集器雖然在收集垃圾過程中需要暫停所有其他的工作執行緒,但是它簡單高效,對於限 定單個 CPU 環境來說,沒有執行緒互動的開銷,可以獲得最高的單執行緒垃圾收集效率,因此 Serial 垃圾收集器依然是 java 虛擬機器執行在 Client 模式下預設的新生代垃圾收集器。

   2.ParNew 垃圾收集器(Serial+多執行緒)

ParNew 垃圾收集器其實是 Serial 收集器的多執行緒版本,也使用複製演算法,除了使用多執行緒進行垃 圾收集之外,其餘的行為和 Serial 收集器完全一樣,ParNew 垃圾收集器在垃圾收集過程中同樣也 要暫停所有其他的工作執行緒。 ParNew 收集器預設開啟和 CPU 數目相同的執行緒數,可以通過-XX:ParallelGCThreads 引數來限 制垃圾收集器的執行緒數。ParNew雖然是除了多執行緒外和Serial 收集器幾乎完全一樣,但是ParNew垃圾收集器是很多 java 虛擬機器執行在 Server 模式下新生代的預設垃圾收集器。

  3.Parallel Scavenge 收集器(多執行緒複製演算法、高效)

Parallel Scavenge 收集器也是一個新生代垃圾收集器,同樣使用複製演算法,也是一個多執行緒的垃 圾收集器,它重點關注的是程式達到一個可控制的吞吐量(Thoughput,CPU 用於執行使用者程式碼 的時間/CPU 總消耗時間,即吞吐量=執行使用者程式碼時間/(執行使用者程式碼時間+垃圾收集時間)), 高吞吐量可以最高效率地利用 CPU 時間,儘快地完成程式的運算任務,主要適用於在後臺運算而 不需要太多互動的任務。自適應調節策略也是 ParallelScavenge 收集器與 ParNew 收集器的一個 重要區別。

 

老年代:

  4.Serial Old 收集器(單執行緒標記整理演算法 )

Serial Old 是 Serial 垃圾收集器年老代版本,它同樣是個單執行緒的收集器,使用標記-整理演算法, 這個收集器也主要是執行在 Client 預設的 java 虛擬機器預設的年老代垃圾收集器。 在 Server 模式下,主要有兩個用途:

    1. 在 JDK1.5 之前版本中與新生代的 Parallel Scavenge 收集器搭配使用。

    2. 作為年老代中使用 CMS 收集器的後備垃圾收集方案。

新生代 Parallel Scavenge 收集器與 ParNew 收集器工作原理類似,都是多執行緒的收集器,都使 用的是複製演算法,在垃圾收集過程中都需要暫停所有的工作執行緒。

  

  5.Parallel Old 收集器(多執行緒標記整理演算法)

Parallel Old 收集器是Parallel Scavenge的年老代版本,使用多執行緒的標記-整理演算法,在 JDK1.6 才開始提供。 在 JDK1.6 之前,新生代使用 ParallelScavenge 收集器只能搭配年老代的 Serial Old 收集器,只 能保證新生代的吞吐量優先,無法保證整體的吞吐量,Parallel Old 正是為了在年老代同樣提供吞 吐量優先的垃圾收集器,如果系統對吞吐量要求比較高,可以優先考慮新生代 Parallel Scavenge 和年老代 Parallel Old 收集器的搭配策略。

 

  6.Parallel Old 收集器(多執行緒標記整理演算法)

Parallel Old 收集器是Parallel Scavenge的年老代版本,使用多執行緒的標記-整理演算法,在 JDK1.6 才開始提供。 在 JDK1.6 之前,新生代使用 ParallelScavenge 收集器只能搭配年老代的 Serial Old 收集器,只 能保證新生代的吞吐量優先,無法保證整體的吞吐量,Parallel Old 正是為了在年老代同樣提供吞 吐量優先的垃圾收集器,如果系統對吞吐量要求比較高,可以優先考慮新生代 Parallel Scavenge 和年老代 Parallel Old 收集器的搭配策略。

  

  7.CMS 收集器(多執行緒標記清除演算法)

Concurrent mark sweep(CMS)收集器是一種年老代垃圾收集器,其最主要目標是獲取最短垃圾 回收停頓時間,和其他年老代使用標記-整理演算法不同,它使用多執行緒的標記-清除演算法。 最短的垃圾收集停頓時間可以為互動比較高的程式提高使用者體驗。

 

 

  8.G1 收集器

Garbage first 垃圾收集器是目前垃圾收集器理論發展的最前沿成果,相比與 CMS 收集器,G1 收 集器兩個最突出的改進是:

    1. 基於標記-整理演算法,不產生記憶體碎片。

    2. 可以非常精確控制停頓時間,在不犧牲吞吐量前提下,實現低停頓垃圾回收。 G1 收集器避免全區域垃圾收集,它把堆記憶體劃分為大小固定的幾個獨立區域,並且跟蹤這些區域 的垃圾收集進度,同時在後臺維護一個優先順序列表,每次根據所允許的收集時間,優先回收垃圾 最多的區域。區域劃分和優先順序區域回收機制,確保 G1 收集器可以在有限時間獲得最高的垃圾收 集效率。

 

相關推薦

jvm入門理解——垃圾回收演算法

一、jvm垃圾回收要做的事情 哪些記憶體需要回收 什麼時候回收 怎麼回收 二、如何判斷物件已經死亡,或者說確定為垃圾 引用計數法: 給物件中新增一個引用計數器,每當有一個地方引用它時,計數器的值就加1;當引用失效時,計數器值就減1;任何時刻計數器為0的物件就是不可能再被使用的。這也就是需要回收的物件

jvm入門理解——類載入器子系統

一、類載入子系統的作用 類載入子系統負責從檔案系統或者網路中載入Class檔案,class檔案在檔案開頭有特定的檔案標識; ClassLoader只負責class檔案的載入,至於它是否可以執行,則由Execution Engine決定 載入的類資訊存放於一塊成為方法區的記憶體空間。除了類資訊之外,方法區還會

JVM垃圾回收機制---垃圾回收演算法垃圾分類器種類

針對HotSpot VM的實現,它裡面的GC其實準確分類只有兩大種: Partial GC:並不收集整個GC堆的模式 Young GC:只收集young gen的GC Old GC:只收集old gen的GC。只有CMS的concurrent collection是這個

JVM調優總結-垃圾回收面臨的問題

也會 直接 問題 行程 完成 情況 出現 基本類型 不能 如何區分垃圾 上面說到的“引用計數”法,通過統計控制生成對象和刪除對象時的引用數來判斷。垃圾回收程序收集計數為0的對象即可。但是這種方法無法解決循環引用。所以,後來實現的垃圾判斷算法

我的軟考之路——資料結構演算法4之八大排序

        排序是程式設計的基礎,在程式中會經常使用,好的排序方法可以幫助你提高程式執行的效率,所以學好排序,打好基礎,對於程式的優化會手到擒來。無論你的技術多麼強,如果沒有基礎也強不到哪去。  

JVM調優總結-分代垃圾回收詳述2

分代垃圾回收流程示意     選擇合適的垃圾收集演算法 序列收集器   用單執行緒處理所有垃圾回收工作,因為無需多執行緒互動,所以效率比較高。但是,也無法使用多處理器的優勢,所以此收集器適合單處理器機器。當然,此收集

《深入理解java虛擬機器》讀書筆記---- 垃圾回收演算法垃圾收集器介紹

一、垃圾回收演算法 1、標記--清除演算法 標記--清除(Mark-Sweep)演算法,分為標記和清除兩個階段,首先標記出所有需要回收的物件,在標記完成後統一回收所有被標記的物件,這是最基礎的收集演算法,後續很多演算法都是基於這種思想進行設計的。 標記--清除演算法主要的不足有兩點:一個

python爬蟲從入門到放棄之 BeautifulSoup庫的使用

src 表達 支持 正則表達 必須 這樣的 com 子節點 prettify 上一篇文章的正則,其實對很多人來說用起來是不方便的,加上需要記很多規則,所以用起來不是特別熟練,而這節我們提到的beautifulsoup就是一個非常強大的工具,爬蟲利器。 beautifulS

solr搜索之入門原理

solr solr入門 1 solr簡介solr官方文檔:http://wiki.apache.org/solr/DataImportHandler 下載地址:http://www.apache.org/dyn/closer.cgi/lucene/solr/2 solr入門我們使

linux從入門到精通查找文件 find

技術分享 test 復合 通配符 alt 區別 -name {} 等於 1. 通過name查找文件: find 文件目錄 -name 文件名 linux裏面find不是模糊查詢,而是精準查找 如果要模糊查詢,輸入命令: find /tmp -name *test* 2.

Docker入門應用系列Docker私有公共鏡像倉庫

nbsp one 默認 span epo refers 1.8 png list 1.搭建私有鏡像倉庫Docker Hub作為Docker默認官方公共鏡像;如果想搭建自己的私有鏡像倉庫,官方提供registry鏡像,使搭建私有倉庫非常簡單1.1.1下載registry鏡像並

JVM—— 垃圾回收

class 隨著 策略 兩種 oid 獨立 內存管理 最大 就會 垃圾回收 垃圾回收主要解決三個問題(回收哪些Which,什麽時候回收WHEN,如何回收HOW) 一、回收哪些 這三個問題,最主要的還是第一個,Which回收哪些,評斷回收還是不回收的標準是看對象是否被引用 引

JVM實用參數 吞吐量收集器

機制 次數 基於 統計表 周期 間接 討論 建議 reads JVM實用參數(六) 吞吐量收集器 原文鏈接 本文連接 譯者:張軍 校對:梁海艦在實踐中我們發現對於大多數的應用領域,評估一個垃圾收集(GC)算法如何根據如下兩個標準: 吞吐量越高算法越好 暫停時

慕課網/安卓攻城獅視頻學習練習

lba etl 居住 style 北京 click con notify absl manifest A跳轉B,在B的文件中用permission權限,然後A就無權跳轉到B,如果在A中用uses-permission把權限給了A,那麽A就可以跳轉到B了.可以通俗的說,

Linux常用終端命令擴充套件

1.find命令格式:find(路徑) -name "條件" #如果不指定路徑,預設在所在目錄查詢  #注意與萬用字元的聯合使用2.檔案軟連線 ln -s 被連線的原始檔(目標路經) 連結檔案#建立檔案連結,用通俗地方式講類似於windows  #下的快捷方式 #沒有-s建立的是一個硬連結

kaggle 入門系列翻譯 RSNA 肺炎預測

https://www.kaggle.com/zahaviguy/what-are-lung-opacities 這篇從醫學的角度來闡述檢測影象的特徵 這篇文章說比賽主要是檢測肺渾濁而非肺炎,反正也是一種肺病吧。 通常肺部的圖片還包括很多部分,如血管、脂肪、心臟等。一個正常人的x光

TensorFlow從入門理解:你的第一個迴圈神經網路RNN分類例子

執行程式碼: import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # set random seed for comparing the two result calculations

TensorFlow從入門理解:你的第一個迴圈神經網路RNN迴歸例子

執行程式碼: import tensorflow as tf import numpy as np import matplotlib.pyplot as plt BATCH_START = 0 TIME_STEPS = 20 BATCH_SIZE = 50 INPUT_SIZE = 1 OUTP

Matlab從入門到精通--矩陣基本運算

1、行向量的定義 rowvec = [1.2 3 56]; 2、列向量的定義 colvec = [1.2;3;56]; 3、逐個元素的分配矩陣 B(1,1) = 1 ; B(1,2) = 2 ; B(2,1) = 3 ; B(2,2) = 4 ; B = &n

Linux入門實踐筆記——壓力測試工具Apache Bench的安裝、使用和結果解讀

內容   本文介紹了壓力測試工具Apache Bench在Centos系統中的安裝,常用的測試指令,以及測試結果的解讀。 版本 ​  作業系統: CentOS 7.2 64位   Apache Bench:2.3 說明   轉載請說明出處:Linux入門實踐筆記(六)——壓力測試工具Apache