1. 程式人生 > >Redis進階篇1

Redis進階篇1

Redis進階篇

本章主要介紹redis持久化、主從架構、複製原理、叢集架構、資料分散式儲存原理、哨兵原理、高可用架構.

1、redis資料持久化

背景:redis宕機後,redis中的資料全部丟失,如何進行資料的恢復。

解決辦法:資料持久化。redis現有的持久化方式有RDB和AOF。

2、RDB持久化方式(預設開啟)

RDB持久化機制,對redis中的資料執行週期性的持久化。開啟 redis.conf 檔案,找到 SNAPSHOTTING 對應內容。可以看到一下配置內容:

save <seconds> <changes>

# save ""

 save 900 1

save 30010

 save

60 10000

dir ./ *本地快照儲存位置**/

rdbcompression yes/**是否進行壓縮**/

表達的意思:save <指定時間間隔> <執行指定次數更新操作>,滿足條件就將記憶體中的資料同步到硬碟中。官方出廠配置預設是 900秒內有1個更改,300秒內有10個更改以及60秒內有10000個更改,則將記憶體中的資料快照寫入磁碟。 若不想用RDB方案,可以把 save "" 的註釋開啟,下面三個註釋。

1.1RDB工作原理

RDB每個一段時間就會在本地資料庫儲存一份完整的快照。Redis採用LZF壓縮方式,但會佔用一些cpu的時。若關閉,這會導致資料庫檔案過大。下圖為原理圖。

   RDB的優點:

1、RDB會生成多個數據檔案,每個資料檔案都代表了某一個時刻中redis的資料,這種多個數據檔案的方式,非常適合做冷備.可以將這種完整的資料檔案傳送到一些遠端的安全儲存上去,比如說AmazonS3雲服務上去,在國內可以是阿里雲的ODPS分散式儲存上,以預定好的備份策略來定期備份redis中的資料

2、RDB對redis堆外服務提供的讀寫服務,影響非常小,可以讓redis保持高效能,因為redis主程序只需要fork一個子程序,讓子程序執行磁碟IO操作來進行RDB持久化即可。

3、相對於AOF持久化機制來說,直接基於RDB資料檔案來重啟和恢復redis程序,更加快速。

RDB的缺點:

1、如果想要redis在故障時,儘可能少的丟失資料,那麼RDB沒有AOF好,可能會丟失一個時間段的資料。一般來說,RDB資料快照檔案都是每隔5分鐘,或者更長時間生成一次,這個時候一旦redis程序宕機,那麼就會丟失最近5分鐘的資料。

2、RDB每次在fork子程序來執行RDBd快照資料檔案生成的時候,如果資料檔案特別大,由於此時會暫停資料讀寫,可能會導致對客戶端提供的服務暫停數毫秒甚至數秒。

1.2AOF的工作原理(預設關閉)

AOF機制對每條寫入命令作為日誌,以append-only的模式寫入一個日誌檔案中,在redis重啟的時候,可以通過會放AOF日誌中的寫入指令來重新構建整個資料集。

如果我們想要redis僅僅作為純記憶體的快取來使用,那麼可以禁止RDB和AOF所有的持久化機制。通過RDB和AOF,都可以將redis記憶體中的資料持久化到磁碟上面來。然後可以將這些資料備份到別的地方去,比如說阿里雲,雲服務。如果redis掛了,伺服器上的記憶體和磁碟上的資料都丟了,可以重雲服務中將資料拷貝出來進行資料恢復。

然後重新啟動redisredis就會自動根據持久化資料檔案中的資料,去恢復記憶體中的資料,繼續對外提供服務如果同時使用RDB和AOF兩種持久化機制,那麼在redis重啟的時候,會使用AOF來重新構建資料,因為AOF中的資料更加完整

1.2.1AOF持久化原理

redis中的資料,是有一定限量的,不可能說redis記憶體中的資料無限增長,進而導致AOF無限增長。由於記憶體是一定的,到了一定時候,redis就會用快取淘汰演算法,LRU,自動將一部分資料從記憶體中清除。AOF是存放每條寫命令的,所以會不斷膨脹,當大到一定的時候,AOF做rewrite操作,此時就會基於當時redis的記憶體中資料,來重新構造一個更小的AOF檔案,然後將舊的膨脹得很大的檔案給刪除。

寫操作過程:

現在作業系統中,寫檔案不是直接寫磁碟的,會先寫到 os cache,然後一般每隔一秒,執行fsync操作,強制將os cache中的資料寫入磁碟中。

 AOFrewrite原理剖析

LRU快取清除演算法會將最不經常使用的資料從記憶體中刪除,給新的資料騰出空間。

LRU淘汰的場景:

1.主動淘汰。

1.1通過定時任務serverCron定期的清理過期的key。

2.被動淘汰

2.1每次寫入key時,發現記憶體不夠,呼叫activeExpireCycle釋放一部分記憶體。

2.2每次訪問相關的key,如果發現key過期,直接釋放掉該key相關的記憶體。

AOF的優點

1、AOF可以更好的保護資料不丟失,一般AOF會每隔一秒,通過一個後臺執行緒執行一次fsync操作,最多丟失1秒鐘的資料。

2、AOF日誌檔案以append-only模式寫入,所以沒有任何磁碟定址的開銷,寫入的效能是非常高的,而且檔案不容易破損,即使檔案尾部破損,也很容易修復。

3、AOF日誌檔案即使過大的時候,出現後臺重寫操作,也不會影響客戶端的讀寫。因為在rewrite log的時候,會對其中的指導進行壓縮,創建出一份需要恢復資料的最小日誌出來。再建立新日誌檔案的時候,老的日誌檔案還是照常寫入。當新的merge後的日誌檔案ready的時候,再交換新老日誌檔案即可。

4、AOF日誌檔案的命令通過非常可讀的方式進行記錄,這個特性非常適合做災難性的誤刪除的緊急恢復。比如某人不小心用flushall命令清空了所有資料,只要這個時候後臺rewrite還沒有發生,那麼就可以立即拷貝AOF檔案,將最後一條flushall命令給刪了,然後再將該AOF檔案放回去,就可以通過恢復機制,自動恢復所有資料。

AOF的缺點

1、對於同一份資料來說,AOF日至檔案通常比RDB資料快照檔案更大。

2、AOF開啟後,支援寫的QPS會比RDB支援寫的QPS低,因為AOF一般會配置成每秒fsync一次日誌檔案,當然,每秒一次fsync,效能也還是很高的。

3、以前AOF發生過bug,就是通過AOF日誌記錄,進行資料恢復的時候,沒有恢復一模一樣的資料出來。所以說,類似AOF這種較為複雜的基於命令日誌/merge/回放的方式,比基於RDB每次持久化一份完整的資料快照檔案的方式,更加脆弱一些,容易有bug。不過AOF就是為了避免rewrite過程導致的bug,因此每次rewrite並不是基於舊的指令日誌進行merge的,而是基於當時記憶體中的資料進行指令的重新構建,這樣健壯性會好很多。

1.3RDB和AOF到底該如何選擇

1、不要僅僅使用RDB,因為那樣會導致你丟失很多資料

2、也不要僅僅使用AOF,因為那樣有兩個問題,第一,你通過AOF做冷備,沒有RDB做冷備,來的恢復速度更快;第二,RDB每次簡單粗暴生成資料快照,更加健壯,可以避免AOF這種複雜的備份和恢復機制的bug

3、綜合使用AOF和RDB兩種持久化機制,用AOF來保證資料不丟失,作為資料恢復的第一選擇;用RDB來做不同程度的冷備,在AOF檔案都丟失或損壞不可用的時候,還可以使用RDB來進行快速的資料恢復。

1.4、AOF和RDB同時工作

1、如果RDB在執行snapshotting操作,那麼redis不會執行AOF rewrite; 如果redis再執行AOF rewrite,那麼就不會執行RDB snapshotting。

2、如果RDB在執行snapshotting,此時使用者執行BGREWRITEAOF命令,那麼等RDB快照生成之後,才會去執行AOFrewrite。

3、同時有RDB snapshot檔案和AOF日誌檔案,那麼redis重啟的時候,會優先使用AOF進行資料恢復,因為其中的日誌更完整。

1.5企業級資料備份方案

1、寫crontab定時排程指令碼去做資料備份

2、每小時都copy一份rdb的備份,到一個目錄中去,僅僅保留最近48小時的備份

3、每天都保留一份當日的rdb的備份,到一個目錄中去,僅僅保留最近1個月的備份

4、每次copy備份的時候,都把太舊的備份給刪了

5、每天晚上將當前伺服器上所有的資料備份,傳送一份到遠端的雲服務上去

每小時copy一次備份,刪除48小時前的資料

在目錄 /usr/local/redis下生成redis_rdb_copy_hourly.sh

Vi redis_rdb_copy_hourly.sh

#!/bin/sh

cur_date=`date+%Y%m%d%k`

rm-rf /usr/local/redis/snapshotting/$cur_date

mkdir/usr/local/redis/snapshotting/$cur_date

cp/var/redis/6379/dump.rdb /usr/local/redis/snapshotting/$cur_date

del_date=`date-d -48hour +%Y%m%d%k`

rm-rf /usr/local/redis/snapshotting/$del_date

然後進行定時備份

crontab-e

0 * * * * sh /usr/local/redis/copy/redis_rdb_copy_hourly.sh

每天copy一次備份

在目錄 /usr/local/redis下生成redis_rdb_copy_daily.sh

viredis_rdb_copy_daily.sh

#!/bin/sh

cur_date=`date+%Y%m%d`

rm-rf /usr/local/redis/snapshotting/$cur_date

mkdir/usr/local/redis/snapshotting/$cur_date

cp/var/redis/6379/dump.rdb /usr/local/redis/snapshotting/$cur_date

del_date=`date-d -1month +%Y%m%d`

rm-rf /usr/local/redis/snapshotting/$del_date

然後進行定時備份

crontab-e

00 * * * sh /usr/local/redis/copy/redis_rdb_copy_daily.sh