1. 程式人生 > >JVM學習(3) 垃圾收集演算法

JVM學習(3) 垃圾收集演算法

由於垃圾收集演算法的實現涉及大量的程式細節,而且各個平臺的虛擬機器操作記憶體的方法又各不相同,因此不打算過多地討論演算法地實現,只是介紹幾種演算法地思想及其發展過程。

標記-清除演算法

最基礎地收集演算法是“標記-清除”(Mark-Sweep)演算法,演算法分為”標記“和”清除“兩個階段:首先標記出所有需要回收的物件,在標記完成後統一回收掉所有被標記地物件,它地標記過程其實在前一節講述物件標記判定時已經基本介紹過了。它地主要缺點有兩個:一個是效率問題,標記和清除過程地效率都不高;另外一個是空間問題,標記清除之後會產生大量不連續地記憶體碎片,空間碎片太多可能會導致,當前程式在以後地執行過程中需要分配較大物件時無法找到足夠地連續記憶體而不得不提前觸發另一次垃圾收集動作。標記-清除演算法的執行過程如圖所示。

複製演算法

為了解決效率問題,一種稱為”複製“(Copying)的收集演算法出現了,它將可用記憶體按容量劃分為大小相等的兩塊,每次只使用其中的一塊。當這一塊的記憶體用完了,就將還存活著的物件複製到另外一塊上面,然後再把已使用過的記憶體空間一次清理掉。這樣使得每次都是對其中的一塊進行記憶體回收,記憶體分配時也就不用考慮記憶體碎片等複雜情況,只要移動堆頂指標,按順序分配記憶體即可,實現簡單,執行高效。只是這種演算法的代價是將記憶體縮小為原來的一半,未免太高了一點。

複製演算法的執行過程如圖所示:

現在的商業虛擬機器都採用這種收集演算法來回收新生代,IBM的專門研究表明,新生代中的物件98%是朝生夕死的,所以並不需要按照1:1的比例來劃分記憶體空間,而是將記憶體分為一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中的一塊Survivor。當回收時,將Eden和Survivor中還存活著的物件一次性拷貝到另外一塊Survivor空間上,最後清理掉Eden和剛才用過的Survivor的空間。

記憶體的分配擔保就好比我們去銀行借款,如果我們信譽很好,在98%的情況下都能按時償還,於是銀行可能會預設我們下一次也能按時按量地償還貸款,只需要有一個擔保人能保證如果我不能還款時,可以從他地賬戶扣錢,那銀行就認為沒有風險了。記憶體的分配擔保也一樣,入宮另外一塊Survivor空間沒有足夠的空間存放上一次新生代收集下來的存活物件,這些物件將直接通過分配擔保機制進入老年代。

標記-整理演算法

複製收集演算法在物件存活率較高時就要執行較多的複製操作,效率將會變低。更關鍵的是,如果不想浪費50%的空間,就需要有額外的空間進行分配擔保,以應對被使用的記憶體中所有物件都100%存活的極端情況,所以在老年代一般不能直接選用這種演算法。

根據這一特點,有人提出了另外一種“標記-整理”(Mark-Compact)演算法,標記過程仍然與“標記-清除”演算法一樣,但後續步驟不是直接對可回收物件進行清理,而是讓所有存活的物件都向一端移動,然後直接清理掉邊界以外的記憶體,“標記-整理”演算法的示意圖如圖所示:

分代收集演算法

當前商業虛擬機器的垃圾收集都採用“分代收集”(Generational Colletion)演算法,這種演算法並沒有什麼新的思想,只是根據物件的存活週期的不同將記憶體劃分為幾塊。一般是把Java堆分為新生代和老生代,這樣就可以根據各個年代的特點採用最適當的收集演算法。在新生代中,每次垃圾收集時都發現有大批物件死去,只有少量存活,那就選用複製演算法,只需要付出少量存活物件的複製成本就可以完成收集。而老年代中因為物件存活率高、沒有額外空間對它進行分配擔保,就必須使用“標記-清理”或“標記-整理”演算法來進行回收。