1. 程式人生 > >【高併發】在高併發環境下該如何構建應用級快取?

【高併發】在高併發環境下該如何構建應用級快取?

寫在前面

隨著我們的系統負載越來越高,系統的效能就會有所下降,此時,我們可以很自然地想到使用快取來解決資料讀寫效能低下的問題。但是,立志成為資深架構師的你,是否能夠在高併發環境下合理並且高效的構建應用級快取呢?

快取命中率

快取命中率是從快取中讀取資料的次數與總讀取次數的比率,命中率越高越好。快取命中率=從快取中讀取次數 / (總讀取次數 (從快取中讀取次數 + 從慢速裝置上讀取次數))。這是一個非常重要的監控指標,如果做快取,則應通過監控這個指標來看快取是否工作良好。

快取回收策略

1.基於空間

基於空間指快取設定了儲存空間,如設定為10MB,當達到儲存空間上限時,按照一定的策略移除資料。

2.基於容量

基於容量指快取設定了最大大小,當快取的條目超過最大大小時,按照一定的策略移除舊資料。

3.基於時間

TTL(Time To Live):存活期,即快取資料從建立開始直到到期的一個時間段(不管在這個時間段內有沒有被訪問,快取資料都將過期)。
TTI(Time To Idle):空閒期,即快取資料多久沒被訪問後移除快取的時間。

4.基於物件引用

軟引用:如果一個物件是軟引用,則當JVM堆記憶體不足時,垃圾回收器可以回收這些物件。軟引用適合用來做快取,從而當JVM堆記憶體不足時,可以回收這些物件騰出一些空間供強引用物件使用,從而避免OOM。
弱引用:當垃圾回收器回收記憶體時,如果發現弱引用,則將它立即回收。相對於軟引用,弱引用有更短的生命週期。

注意:只有在沒有其他強引用物件引用弱引用/軟引用物件時,垃圾回收時才回收該引用。即如果有一個物件(不是弱引用/軟引用物件)引用了弱引用/軟引用物件,那麼垃圾回收時不會回收該弱引用/軟引用物件。

5.回收演算法

使用基於空間和基於容量的快取會使用一定的策略移除舊資料,常見的如下。

  • FIFO(First In First Out):先進先出演算法,即先放入快取的先被移除。
  • LRU(Least Recently Used):最近最少使用演算法,時間時間距離現在最久的那個被移除。
  • LFU(Least Frequently Used):最不常用演算法,一定時間段內使用次數(頻率)最少的那個被移除。

實際應用中基於LRU的快取居多。

快取型別

堆記憶體: 使用Java堆記憶體來儲存物件。使用堆快取的好處是沒有序列化/反序列化,是最快的快取。缺點也很明顯,當快取的資料量很大時,GC(垃圾回收)暫停時間會變長,儲存容量受限於堆空間大小。一般通過軟引用/弱引用來儲存快取物件。即當堆記憶體不足時,可以強制回收這部分記憶體釋放堆記憶體空間。一般使用堆快取儲存較熱的資料。可以使用Guava Cache、Ehcache 3.x、 MapDB實現。

堆外記憶體: 即快取資料儲存在堆外記憶體,可以減少GC暫停時間(堆物件轉移到堆外,GC掃描和移動的物件變少了),可以支援更多的快取空間(只受機器記憶體大小限制,不受堆空間的影響)。但是,讀取資料時需要序列化/反序列化。因此,會比堆快取慢很多。可以使用Ehcache 3.x、 MapDB實現。

磁碟快取: 即快取資料儲存在磁碟上,在JVM重啟時資料還存在,而堆/堆外快取資料會丟失,需要重新載入。可以使用Ehcache 3.x、MapDB實現。

分散式快取: 分散式快取可以使用ehcache-clustered(配合Terracotta server)實現Java程序間分散式快取。也可以使用Memcached、Redis實現。

快取模式

單機模式: 儲存最熱的資料到堆快取,相對熱的資料到堆外快取,不熱的資料到磁碟快取。
叢集模式: 儲存最熱的資料到堆快取,相對熱的資料到對外快取,全量資料到分散式快取。

寫在最後

如果覺得文章對你有點幫助,請微信搜尋並關注「 冰河技術 」微信公眾號,跟冰河學習高併發程式設計技術。

最後,附上併發程式設計需要掌握的核心技能知識圖,祝大家在學習併發程式設計時,少走彎路。