1. 程式人生 > >DB主從一致性架構優化4種方法

DB主從一致性架構優化4種方法

利用 場景 主從一致性 經驗 主從同步 互聯網 主從 發生 就是

需求緣起

大部分互聯網的業務都是“讀多寫少”的場景,數據庫層面,讀性能往往成為瓶頸。如下圖:業界通常采用“一主多從,讀寫分離,冗余多個讀庫”的數據庫架構來提升數據庫的讀性能。

技術分享圖片
這種架構的一個潛在缺點是,業務方有可能讀取到並不是最新的舊數據:

技術分享圖片
(1)系統先對DB-master進行了一個寫操作,寫主庫

(2)很短的時間內並發進行了一個讀操作,讀從庫,此時主從同步沒有完成,故讀取到了一個舊數據

(3)主從同步完成

有沒有辦法解決或者緩解這類“由於主從延時導致讀取到舊數據”的問題呢,這是本文要集中討論的問題。

方案一(半同步復制)

不一致是因為寫完成後,主從同步有一個時間差,假設是500ms,這個時間差有讀請求落到從庫上產生的

。有沒有辦法做到,等主從同步完成之後,主庫上的寫請求再返回呢?答案是肯定的,就是大家常說的“半同步復制”semi-sync:

技術分享圖片
(1)系統先對DB-master進行了一個寫操作,寫主庫

(2)等主從同步完成,寫主庫的請求才返回

(3)讀從庫,讀到最新的數據(如果讀請求先完成,寫請求後完成,讀取到的是“當時”最新的數據)

方案優點:利用數據庫原生功能,比較簡單

方案缺點:主庫的寫請求時延會增長,吞吐量會降低

方案二(強制讀主庫)

如果不使用“增加從庫”的方式來增加提升系統的讀性能,完全可以讀寫都落到主庫,這樣就不會出現不一致了:

技術分享圖片
方案優點:“一致性”上不需要進行系統改造

方案缺點:只能通過cache來提升系統的讀性能,這裏要進行系統改造

方案三(數據庫中間件)

如果有了數據庫中間件,所有的數據庫請求都走中間件,這個主從不一致的問題可以這麽解決:

技術分享圖片
(1)所有的讀寫都走數據庫中間件,通常情況下,寫請求路由到主庫,讀請求路由到從庫

(2)記錄所有路由到寫庫的key,在經驗主從同步時間窗口內(假設是500ms),如果有讀請求訪問中間件,此時有可能從庫還是舊數據,就把這個key上的讀請求路由到主庫

(3)經驗主從同步時間過完後,對應key的讀請求繼續路由到從庫

方案優點:能保證絕對一致

方案缺點:數據庫中間件的成本比較高

方案四(緩存記錄寫key法)

既然數據庫中間件的成本比較高,有沒有更低成本的方案來記錄某一個庫的某一個key上發生了寫請求呢?很容易想到使用緩存,當寫請求發生的時候:

技術分享圖片
(1)將某個庫上的某個key要發生寫操作,記錄在cache裏,並設置“經驗主從同步時間”的cache超時時間,例如500ms

(2)修改數據庫

而讀請求發生的時候:

技術分享圖片
(1)先到cache裏查看,對應庫的對應key有沒有相關數據

(2)如果cache hit,有相關數據,說明這個key上剛發生過寫操作,此時需要將請求路由到主庫讀最新的數據

(3)如果cache miss,說明這個key上近期沒有發生過寫操作,此時將請求路由到從庫,繼續讀寫分離

方案優點:相對數據庫中間件,成本較低

方案缺點:為了保證“一致性”,引入了一個cache組件,並且讀寫數據庫時都多了一步cache操作

總結

為了解決主從數據庫讀取舊數據的問題,常用的方案有四種:

(1)半同步復制

(2)強制讀主

(3)數據庫中間件

(4)緩存記錄寫key

以上內容均來自微信公眾號“架構師之路”胡劍老師的文章,歡迎關註。

DB主從一致性架構優化4種方法