【case study】兩個redis cluster集群拓撲混掉故障處理

阿新 • • 發佈：2018-02-02

交換 node cluster -i cas 處理過程基本背景相同

【背景】

XXX服務，前後使用了兩個redis cluster集群：集群A（2018.1.23前使用，在1.23之後沒有流量，但是服務沒停），集群B（2018.1.23後使用）。

【原因】

根本原因：兩個集群使用相同的實例，導致兩個集群的拓撲信息互相傷害拓撲亂掉

誘因：老集群下線流程有誤，服務未停，卻把記錄服務實例信息的db數據刪除了

恢復緩慢原因：缺少處理cluster的工具&經驗，臨時寫腳本處理

【過程】

1、給集群B增加新的redis實例（其中選出了和集群A相同的ip和port）

2、啟動集群B的新實例失敗，發現和集群B的某個實例相同的ip和port

3、停掉集群A的具有相同ip和port的實例，集群A的相應實例起來（目前集群B還未將該實例加入自己集群，該實例目前與集群A的其他實例通信）

4、對集群B操作同步拓撲信息（將上訴實例加入了集群B，上訴實例與集群B中的其他實例相互交換拓撲信息）

5、集群B中的主都把自己作為了集群A中實例的從，開始主從同步，集群崩潰

【處理過程】

1、停掉集群A的所有實例

2、強制提升集群B中的相應實例為主（cluster failover takeover -> 將某個從強制提升為主且不與其他實例通信）

3、修復拓撲狀態，檢查slot分配，給沒有分配master的slot分配master（cluster setslot <slot> node <node-id> -> 發給每個主分配slot信息）

4、給缺少slave的master掛上slave（cluster replicate ip port）

【改進方案】

1、完善集群下線流程：1）避免刪除集群基本信息；2）下線集群時停掉服務（停服務發現、檢查流量、停服務、註銷systemd）

2、針對cluster的拓撲修復，提供工具：1）集群拓撲比較工具，找出拓撲不一致的實例；2）批量將實例踢出集群；3）批量提升實例為主？？

【思考】

對於redis cluster這種無中心的架構來說，如果拓撲信息不一致了，如何修復信息確實是挺麻煩的。想到好的方式後，後續補充。

【case study】兩個redis cluster集群拓撲混掉故障處理

交換 node cluster -i cas 處理過程基本背景相同【背景】 XXX服務，前後使用了兩個redis cluster集群：集群A（2018.1.23前使用，在1.23之後沒有流量，但是服務沒停），集群B（2018.1.23後使用）。

【面試題】兩個佇列實現一個棧

題目：用佇列來實現棧。用兩個佇列來回倒騰基本就可以了，假設有兩個佇列A、B，初始都為空，將元素放入佇列A中，如果佇列B不為空，將B中的元素全部取出放入A中，這樣B就為空隊列了，然後下次加入元素就加入

【C語言】兩個變數值的交換——指標

C語言中交換兩個變數的值可以在主函式中直接實現，也可以通過子函式來實現。下面我們介紹用子函式實現的情況。 1.將兩個變數的值作為實參直接傳遞，在子函式內部定義一個普通變數來對兩個形參進行交換，並分別在子函式和主函式中列印。#include <stdio.

【C語言】兩個int（32位）整數m和n的二進位制表達中，有多少個位(bit)不同

根據異或我們可以知道，兩個數字的二進位制位按位異或，相同為0，相異為1。因此我們可以通過將兩個數字按位異或，並計算該異或結果中二進位制位中1的個數，即可知道有多少個位元位不同。 int count(int a, int b) { int m = a ^ b; // 兩個數按位異或，對應不

【連結串列】兩個單鏈表求差集

問題描述已知集合A和B的元素分別用不含頭結點的單鏈表儲存，函式difference()用於求解集合A與B的差集，並將結果儲存在集合A的單鏈表中。例如，若集合A={5,10,20,15,25,30}，集合B={5,15,35,25}，完成計算後A={10,20

【反射機制】兩個類名不同但其屬性相同的物件，如何將一個物件的值賦給另外一個物件

最近公司需要用執行緒遷移一張表（業務表）的資料至另外一張表（備份表）中，兩張表的欄位一樣，如何在程式中將查到的業務表資料集合轉換到另外一個備份表資料集合中。最初的想法，是新建一個一個的去賦值，但是這種方法後期如果表增加了欄位將需要修改賦值的方法，捨棄了該方法。後來想到可以

【C語言】【unix c】兩個程序通過訊息佇列實現程序間的通訊

send.c: #include <stdio.h> #include <sys/types.h> #include <sys/ipc.h> #include <sys/msg.h>

【C語言】兩個有序單鏈表的合併

Node *MergeList(PLinkList p1,PLinkList p2) { PLinkList newhead = NULL; //新連結串列的頭結點 PLinkList end = newhead ;

JFinal redis cluster集群插件

ext 註意 param nal system static private rim spa JFinal redis cluster集群插件 JFinal 框架到了2.1版本號，可是依舊僅僅支持redis的主從集群，沒有看到Cluster集群的插件。筆者

Ubuntu 16.04下Redis Cluster集群搭建（官方原始方案）

選擇正數 mil 請求點數據包含最終 util 交互前提：先安裝好Redis，參考：http://www.cnblogs.com/EasonJim/p/7599941.html 說明：Redis Cluster集群模式可以做到動態增加節點和下線節點，使用起來非常

Redis Cluster集群搭建後，客戶端的連接研究（Spring/Jedis）（待實踐）

turn ron 記錄 redis div println 刪除 clu name 說明：無論是否已經搭建好集群，還是使用什麽樣的客戶端去連接，都是必須把全部IP列表集成進去，然後隨機往其中一個IP寫。這樣做的好處： 1、隨機IP寫入之後，Redis Cluster代

centos6下redis cluster集群部署過程

pap des .sh gcc con 不兼容 migrating 升級ru messages 一般來說，redis主從和mysql主從目的差不多，但redis主從配置很簡單，主要在從節點配置文件指定主節點ip和端口，比如：slaveof 192.168.10.10 6

Redis Cluster集群總結性梳理

from 等等 skiplist 數據訪問更新 1.10 都沒有 daemon rst 前面已經介紹了Redis Cluster集群及其部署過程，下面再補充下有關Redis Cluster應用原理部分內容，以便更加深刻透徹地理解Redis Cluster。一、Red

redis cluster 集群暢談（一）

比較互連下標 view bus 單機 strip 瓶頸由於 redis單機在大數據量情況的會出現瓶頸問題，通過redis 主從架構和哨兵集群結合可以實現99.99% 高可用、水平擴容支持更高QPS的解決方案。在大數據量面前，主從架構結合哨兵集群的解決方案在

redis cluster集群部署

sta 配置 view cat AC ont 相關介紹提供服務上一篇 http://www.cnblogs.com/qinyujie/p/9029153.html，主要講解了 redis cluster 集群架構的優勢、redis cluster 和 redis

redis cluster 集群暢談（三）之水平擴容、slave自動化遷移

fig star init.d 物理成功其它 -i .html enabled 　　上一篇 http://www.cnblogs.com/qinyujie/p/9029522.html，主要講解實驗多master寫入、讀寫分離、實驗自動故障切換（高可用性

Redis Cluster集群

ipp 全部 reat location lib .... 版本錯誤 per 一、redis-cluster設計 Redis集群搭建的方式有多種，例如使用zookeeper等，但從redis 3.0之後版本支持redis-cluster集群，Redis-Cluster采用

php操作redis cluster集群

技術分享數據 ron req github master 分配 key locate php要操作redis cluster集群有兩種方式： 1、使用phpredis擴展，這是個c擴展，性能更高，但是phpredis2.x擴展不行，需升級phpredis到3.0，但這個方

redis之redis-cluster(集群)(七)

服務導致 info -i 刷新客戶端連接 clu == tsl redis的主流高可用集群模式為redis-cluster.從redis3.0+版本後開始支持，自帶集群管理工具redis-trib.rb。安裝redis 參考：https://www.cnblogs.

centos6.x redis-cluster集群離線安裝

addition 允許 tps out ted 版本過低 ins lis .gz 一、環境準備: 系統OS： CentOS6.8 集群環境：三臺主機9個節點軟件版本：redis-4.0.11.tar.gz redis cluster節點信息： redis01 172.1

【case study】兩個redis cluster集群拓撲混掉故障處理

相關推薦