1. 程式人生 > >Redis 復制原理及特性

Redis 復制原理及特性

操作數 就是 stat 發送 -i cpu 足夠 然而 cati

摘要

早期的RDBMS被設計為運行在單個CPU之上,讀寫操作都由經單個數據庫實例完成,復制技術使得數據庫的讀寫操作可以分散在運行於不同CPU之上的獨立服務器上,Redis作為一個開源的、優秀的key-value緩存及持久化存儲解決方案,也提供了復制功能,本文主要介紹Redis的復制原理及特性。

Redis復制概論

數據庫復制指的是發生在不同數據庫實例之間,單向的信息傳播的行為,通常由被復制方和復制方組成,被復制方和復制方之間建立網絡連接,復制方式通常為被復制方主動將數據發送到復制方,復制方接收到數據存儲在當前實例,最終目的是為了保證雙方的數據一致、同步。

技術分享圖片

復制示意圖

Redis復制方式

Redis的復制方式有兩種,一種是主(master)-從(slave)模式,一種是從(slave)-從(slave)模式,因此Redis的復制拓撲圖會豐富一些,可以像星型拓撲,也可以像個有向無環

技術分享圖片

Redis集群復制結構圖

通過配置多個Redis實例獨立運行、定向復制,形成Redis集群,master負責寫、slave負責讀

復制優點

通過配置多個Redis實例,數據備份在不同的實例上,主庫專註寫請求,從庫負責讀請求,這樣的好處主要體現在下面幾個方面:

1、高可用性

在一個Redis集群中,如果master宕機,slave可以介入並取代master的位置,因此對於整個Redis服務來說不至於提供不了服務,這樣使得整個Redis服務足夠安全。

2、高性能

在一個Redis集群中,master負責寫請求,slave負責讀請求,這麽做一方面通過將讀請求分散到其他機器從而大大減少了master服務器的壓力,另一方面slave專註於提供讀服務從而提高了響應和讀取速度。

3、水平擴展性

通過增加slave機器可以橫向(水平)擴展Redis服務的整個查詢服務的能力。

復制缺點

復制提供了高可用性的解決方案,但同時引入了分布式計算的復雜度問題,認為有兩個核心問題:

  1. 數據一致性問題,如何保證master服務器寫入的數據能夠及時同步到slave機器上。
  2. 編程復雜,如何在客戶端提供讀寫分離的實現方案,通過客戶端實現將讀寫請求分別路由到master和slave實例上。

上面兩個問題,尤其是第一個問題是Redis服務實現一直在演變,致力於解決的一個問題。

復制實時性和數據一致性矛盾

Redis提供了提高數據一致性的解決方案,本文後面會進行介紹,一致性程度的增加雖然使得我能夠更信任數據,但是更好的一致性方案通常伴隨著性能的損失,從而減少了吞吐量和服務能力。然而我們希望系統的性能達到最優,則必須要犧牲一致性的程度,因此Redis的復制實時性和數據一致性是存在矛盾的。

Redis復制原理及特性

slave指向master

舉個例子,我們有四臺redis實例,M1,R1、R2、R3,其中M1為master,R1、R2、R3分別為三臺slave redis實例。在M1啟動如下:

./redis-server ../redis8000.conf --port 8000

下面分別為R1、R2、R3的啟動命令:

./redis-server ../redis8001.conf --port 8001 --slaveof 127.0.0.1 8000
./redis-server ../redis8002.conf --port 8002 --slaveof 127.0.0.1 8000
./redis-server ../redis8003.conf --port 8003 --slaveof 127.0.0.1 8000

這樣,我們就成功的啟動了四臺Redis實例,master實例的服務端口為8000,R1、R2、R3的服務端口分別為8001、8002、8003,集群圖如下:

技術分享圖片

Redis集群復制拓撲

上面的命令在slave啟動的時候就指定了master機器,我們也可以在slave運行的時候通過slaveof命令來指定master機器。

復制過程

Redis復制主要由SYNC命令實現,復制過程如下圖:

技術分享圖片

Redis復制過程

上圖為Redis復制工作過程:

  1. slave向master發送sync命令。
  2. master開啟子進程來講dataset寫入rdb文件,同時將子進程完成之前接收到的寫命令緩存起來。
  3. 子進程寫完,父進程得知,開始將RDB文件發送給slave。
  4. master發送完RDB文件,將緩存的命令也發給slave。
  5. master增量的把寫命令發給slave。

值得註意的是,當slave跟master的連接斷開時,slave可以自動的重新連接master,在redis2.8版本之前,每當slave進程掛掉重新連接master的時候都會開始新的一輪全量復制。如果master同時接收到多個slave的同步請求,則master只需要備份一次RDB文件。

增量復制

上面復制過程介紹的最後提到,slave和master斷開了、當slave和master重新連接上之後需要全量復制,這個策略是很不友好的,從Redis2.8開始,Redis提供了增量復制的機制:

技術分享圖片

增量復制機制

master除了備份RDB文件之外還會維護者一個環形隊列,以及環形隊列的寫索引和slave同步的全局offset,環形隊列用於存儲最新的操作數據,當slave和maste斷開重連之後,會把slave維護的offset,也就是上一次同步到哪裏的這個值告訴master,同時會告訴master上次和當前slave連接的master的runid,滿足下面兩個條件,Redis不會全量復制:

  1. slave傳遞的run id和master的run id一致。
  2. master在環形隊列上可以找到對應offset的值。

滿足上面兩個條件,Redis就不會全量復制,這樣的好處是大大的提高的性能,不做無效的功。

增量復制是由psync命令實現的,slave可以通過psync命令來讓Redis進行增量復制,當然最終是否能夠增量復制取決於環形隊列的大小和slave的斷線時間長短和重連的這個master是否是之前的master。

環形隊列大小配置參數:

repl-backlog-size 1mb

Redis同時也提供了當沒有slave需要同步的時候,多久可以釋放環形隊列

repl-backlog-ttl 3600

免持久化復制

免持久化機制官方叫做Diskless Replication,前面基於RDB文件寫磁盤的方式可以看出,Redis必須要先將RDB文件寫入磁盤,才進行網絡傳輸,那麽為什麽不能直接通過網絡把RDB文件傳送給slave呢?免持久化復制就是做這個事情的,而且在Redis2.8.18版本開始支持,當然目前還是實驗階段。

值得註意的是,一旦基於Diskless Replication的復制傳送開始,新的slave請求需要等待這次傳輸完畢才能夠得到服務。

是否開啟Diskless Replication的開關配置為:

repo-diskless-sync no

為了讓後續的slave能夠盡量趕上本次復制,Redis提供了一個參數配置指定復制開始的時間延遲

repl-diskless-sync-delay 5

slave只讀模式

自從Redis2.6版本開始,支持對slave的只讀模式的配置,默認對slave的配置也是只讀。只讀模式的slave將會拒絕客戶端的寫請求,從而避免因為從slave寫入而導致的數據不一致問題。

半同步復制

和MySQL復制策略有點類似,Redis復制本身是異步的,但也提供了半同步的復制策略,半同步復制策略在Redis復制中的語義是這樣的:

允許用戶給出這樣的配置:在maste接受寫操作的時候,只有當一定時間間隔內,至少有N臺slave在線,否則寫入無效。

上面功能的實現基於Redis下面特性:

  1. Redis slaves每秒鐘會ping一次master,告訴master當前slave復制到哪裏了。
  2. Redis master會記住每個slave復制到哪裏了。

我們可以通過下面配置來指定時間間隔和N這個值:

min-slaves-to-write <number of slaves>
min-slaves-max-lag <number of seconds>

如果:

min-slaves-to-write 3
min-slaves-max-lag 10

那麽在從服務器的數量少於3個,或者三個從服務器的延遲(lag)值都大於或等於10秒時,主服務器將拒絕執行寫命令,這裏的延遲值就是上面提到的INFO replication命令的lag值。

當配置了上面兩個參數之後,一旦對於一個寫操作沒有滿足上面的兩個條件,則master會報錯,並且將本次寫操作視為無效。這有點像CAP理論中的“C”,即一致性實現,雖然半同步策略不能夠完全保證master和slave的數據一致性,但是相對減少了不一致性的窗口期。

總結

本文在理解Redis復制概念和復制的優缺點的基礎之上介紹了當前Redis復制工作原理以及主要特性,希望能夠幫助大家。

原文鏈接:https://my.oschina.net/andylucc/blog/683631

Redis 復制原理及特性