MySQL MHA高可用方案【五、故障切換】

阿新 • • 發佈：2018-12-06

5.1 故障模擬

01：在db01（Master）伺服器上檢視主從複製及mha是否正常

02：停止db01（Master）伺服器上的mysql服務

02：在db04上檢查MHA的日誌（/var/log/mha/app/app1/manager.log）

03：檢視VIP是否飄移到新Master的伺服器上，在新Master上檢視主從複製的狀態

04：在db04伺服器上檢視mha服務的狀態及配置檔案的變化

#在db01（Master）伺服器上檢視主從複製及mha是否正常

[[email protected] ~]# mysql -uroot -pchenliang -S /data/3306/mysql.sock

mysql> show processlist\G

*************************** 1. row ***************************

Id: 4

User: rep

Host: 172.16.1.12:36522

db: NULL

Command: Binlog Dump GTID

Time: 14070

State: Master has sent all binlog to slave; waiting for more updates

Info: NULL

*************************** 2. row ***************************

Id: 5

User: rep

Host: 172.16.1.13:59189

db: NULL

Command: Binlog Dump GTID

Time: 13380

State: Master has sent all binlog to slave; waiting for more updates

Info: NULL

*************************** 3. row ***************************

Id: 6

User: rep

Host: 172.16.1.14:22492

db: NULL

Command: Binlog Dump GTID

Time: 12999

State: Master has sent all binlog to slave; waiting for more updates

Info: NULL

*************************** 4. row ***************************

Id: 33

User: mha

Host: 172.16.1.14:22720

db: NULL

Command: Sleep

Time: 2

State:

Info: NULL

*************************** 5. row ***************************

Id: 34

User: root

Host: localhost

db: NULL

Command: Query

Time: 0

State: starting

Info: show processlist

5 rows in set (0.00 sec)

#停止db01（Master）伺服器上的mysql服務

[[email protected] ~]# /data/3306/mysqld stop

MySQL [3306] is not running

[[email protected] ~]# lsof -i :3306

[[email protected] ~]#

#在db04上檢查MHA的日誌（/var/log/mha/app/app1/manager.log）

[[email protected] ~]# tailf /var/log/mha/app/app1/manager.log

Started automated(non-interactive) failover.

Invalidated master IP address on 172.16.1.11(172.16.1.11:3306)

Selected 172.16.1.12(172.16.1.12:3306) as a new master.

172.16.1.12(172.16.1.12:3306): OK: Applying all logs succeeded.

172.16.1.12(172.16.1.12:3306): OK: Activated master IP address.

172.16.1.14(172.16.1.14:3306): OK: Slave started, replicating from 172.16.1.12(172.16.1.12:3306)

172.16.1.13(172.16.1.13:3306): OK: Slave started, replicating from 172.16.1.12(172.16.1.12:3306)

172.16.1.12(172.16.1.12:3306): Resetting slave info succeeded.

Master failover to 172.16.1.12(172.16.1.12:3306) completed successfully.

^=可以看出Master failover(故障轉移)至172.16.1.12伺服器上成功

^=那麼就可以去172.16.1.12伺服器上檢查是否有VIP地址(172.16.1.10)及主從複製的狀態

#檢視VIP是否飄移到新Master的伺服器上，在新Master(db02)上檢視主從複製的狀態

[[email protected] ~]# ifconfig eth1:1

eth1:1 Link encap:Ethernet HWaddr 00:0C:29:D3:59:E8

inet addr:172.16.1.10 Bcast:172.16.1.255 Mask:255.255.255.0

UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1

[[email protected] ~]# mysql -uroot -pchenliang -S /data/3306/mysql.sock

mysql> show processlist\G

*************************** 1. row ***************************

Id: 41

User: rep

Host: 172.16.1.14:45688

db: NULL

Command: Binlog Dump GTID

Time: 269

State: Master has sent all binlog to slave; waiting for more updates

Info: NULL

*************************** 2. row ***************************

Id: 42

User: rep

Host: 172.16.1.13:16598

db: NULL

Command: Binlog Dump GTID

Time: 269

State: Master has sent all binlog to slave; waiting for more updates

Info: NULL

*************************** 3. row ***************************

Id: 43

User: root

Host: localhost

db: NULL

Command: Query

Time: 0

State: starting

Info: show processlist

3 rows in set (0.00 sec)

^=從上面可以看出，當前Master（db02）的從庫有172.16.1.13和172.16.1.14這兩臺伺服器

^=mha服務也已經停止了（因為mha成功切換一次主庫，它的服務是會自動停止的）

#在db04伺服器上檢視mha服務的狀態及配置檔案的變化

[[email protected] ~]# ps -ef|grep mha|grep -v grep

[[email protected] ~]#

[[email protected] ~]# cat /etc/mha/app/app1/app1.cnf

[server default]

manager_log=/var/log/mha/app/app1/manager.log

manager_workdir=/var/log/mha/app/app1

master_binlog_dir=/data/3306/binlog

master_ip_failover_script=/server/scripts/master_ip_failover

password=mha

ping_interval=2

repl_password=chenliang

repl_user=rep

ssh_port=921

ssh_user=toor

user=mha

[server2]

hostname=172.16.1.12

port=3306

[server3]

hostname=172.16.1.13

port=3306

[server4]

hostname=172.16.1.14

no_master=1

port=3306

^=從上面可以看出，mha服務已停止（正常的），配置檔案中少了[server1]標籤（正常的）

5.2 故障恢復

01：啟動db01伺服器上的mysql服務

02：在db04伺服器的mha日誌中找到change master語句

03：在db01伺服器操作change master語句，把db01指向為新master（db02）的從庫

04：在mha的配置檔案（在db04伺服器上）中加入[server1]標籤

05：在db04伺服器上的toor普通使用者下再次啟動mha服務

#啟動db01伺服器上的mysql服務

[[email protected] ~]# /data/3306/mysqld start

Start MySQL [3306] [ OK ]

[[email protected] ~]# netstat -lntup|grep mysqld

tcp 0 0 :::3306 :::* LISTEN 6184/mysqld

#在db04伺服器的mha日誌中找到change master語句

[[email protected] ~]# grep -i "change master" /var/log/mha/app/app1/manager.log

Fri Nov 16 14:15:16 2018 - [info] All other slaves should start replication from here. Statement should be: CHANGE MASTER TO MASTER_HOST='172.16.1.12', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='xxx';

Fri Nov 16 14:15:17 2018 - [info] Executed CHANGE MASTER.

Fri Nov 16 14:15:17 2018 - [info] Executed CHANGE MASTER.

#在db01伺服器操作change master語句，把db01指向為新master（db02）的從庫

[[email protected] ~]# mysql -uroot -pchenliang -S /data/3306/mysql.sock

mysql>

mysql> CHANGE MASTER TO MASTER_HOST='172.16.1.12', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='chenliang';

Query OK, 0 rows affected, 2 warnings (0.07 sec)

mysql> start slave;

Query OK, 0 rows affected (0.06 sec)

mysql> show slave status\G

*************************** 1. row ***************************

Slave_IO_State: Waiting for master to send event

Master_Host: 172.16.1.12

Master_User: rep

Master_Port: 3306

Connect_Retry: 60

Master_Log_File: db02_mysql_bin.000003

Read_Master_Log_Pos: 1495

Relay_Log_File: db01_relay_bin.000003

Relay_Log_Pos: 469

Relay_Master_Log_File: db02_mysql_bin.000003

Slave_IO_Running: Yes

Slave_SQL_Running: Yes

Replicate_Do_DB:

Replicate_Ignore_DB:

Replicate_Do_Table:

Replicate_Ignore_Table:

Replicate_Wild_Do_Table:

Replicate_Wild_Ignore_Table:

Last_Errno: 0

Last_Error:

Skip_Counter: 0

Exec_Master_Log_Pos: 1495

Relay_Log_Space: 1294

Until_Condition: None

Until_Log_File:

Until_Log_Pos: 0

Master_SSL_Allowed: No

Master_SSL_CA_File:

Master_SSL_CA_Path:

Master_SSL_Cert:

Master_SSL_Cipher:

Master_SSL_Key:

Seconds_Behind_Master: 0

Master_SSL_Verify_Server_Cert: No

Last_IO_Errno: 0

Last_IO_Error:

Last_SQL_Errno: 0

Last_SQL_Error:

Replicate_Ignore_Server_Ids:

Master_Server_Id: 12

Master_UUID: 1386976f-e7b8-11e8-b34b-000c29d359de

Master_Info_File: mysql.slave_master_info

SQL_Delay: 0

SQL_Remaining_Delay: NULL

Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates

Master_Retry_Count: 86400

Master_Bind:

Last_IO_Error_Timestamp:

Last_SQL_Error_Timestamp:

Master_SSL_Crl:

Master_SSL_Crlpath:

Retrieved_Gtid_Set: 1386976f-e7b8-11e8-b34b-000c29d359de:1-2

Executed_Gtid_Set: 1386976f-e7b8-11e8-b34b-000c29d359de:1-2,

3ad8129b-e7b2-11e8-817e-000c296b2e4b:1-6

Auto_Position: 1

Replicate_Rewrite_DB:

Channel_Name:

Master_TLS_Version:

1 row in set (0.03 sec)

#在mha的配置檔案（在db04伺服器上）中加入[server1]標籤

[[email protected] ~]# cat /etc/mha/app/app1/app1.cnf

[server default]

manager_log=/var/log/mha/app/app1/manager.log

manager_workdir=/var/log/mha/app/app1

master_binlog_dir=/data/3306/binlog

master_ip_failover_script=/server/scripts/master_ip_failover

password=mha

ping_interval=2

repl_password=chenliang

repl_user=rep

ssh_port=921

ssh_user=toor

user=mha

[server1]

hostname=172.16.1.11

port=3306

[server2]

hostname=172.16.1.12

port=3306

[server3]

hostname=172.16.1.13

port=3306

[server4]

hostname=172.16.1.14

no_master=1

port=3306

#在db04伺服器上的toor普通使用者下再次啟動mha服務

[[email protected] ~]# su - toor

[toor[email protected] ~]$ masterha_check_ssh --conf=/etc/mha/app/app1/app1.cnf

.........................

Fri Nov 16 14:56:42 2018 - [info] All SSH connection tests passed successfully.

[[email protected] ~]$ masterha_check_repl --conf=/etc/mha/app/app1/app1.cnf

........

172.16.1.12(172.16.1.12:3306) (current master)

+--172.16.1.11(172.16.1.11:3306)

+--172.16.1.13(172.16.1.13:3306)

+--172.16.1.14(172.16.1.14:3306)

..........

MySQL Replication Health is OK

[[email protected] ~]$ ps -ef|grep mha|grep -v grep

toor 6349 1 4 14:58 pts/0 00:00:00 perl /usr/bin/masterha_manager --conf=/etc/mha/app/app1/app1.cnf --remove_dead_master_conf --ignore_last_failover

5.3 再次提升原master為主庫

[[email protected] ~]# /data/3306/mysqld stop

Stop MySQL[3306]

[[email protected] ~]# grep -i "change master" /var/log/mha/app/app1/manager.log

Fri Nov 16 15:50:29 2018 - [info] All other slaves should start replication from here. Statement should be: CHANGE MASTER TO MASTER_HOST='172.16.1.11', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='xxx';

Fri Nov 16 15:50:29 2018 - [info] Executed CHANGE MASTER.

Fri Nov 16 15:50:29 2018 - [info] Executed CHANGE MASTER.

[[email protected] ~]# ifconfig eth1:1

eth1:1 Link encap:Ethernet HWaddr 00:0C:29:6B:2E:55

inet addr:172.16.1.10 Bcast:172.16.1.255 Mask:255.255.255.0

UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1

[[email protected] ~]# /data/3306/mysqld start

Start MySQL [3306] [ OK ]

[[email protected] ~]# mysql -uroot -pchenliang -S /data/3306/mysql.sock
mysql>
mysql> CHANGE MASTER TO MASTER_HOST='172.16.1.11', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='chenliang';

Query OK, 0 rows affected, 2 warnings (0.07 sec)

mysql> start slave;

Query OK, 0 rows affected (0.20 sec)

mysql> show slave status\G

*************************** 1. row ***************************

Slave_IO_State: Waiting for master to send event

Master_Host: 172.16.1.11

Master_User: rep

Master_Port: 3306

Connect_Retry: 60

Master_Log_File: db01_mysql_bin.000010

Read_Master_Log_Pos: 234

Relay_Log_File: db02_relay_bin.000002

Relay_Log_Pos: 377

Relay_Master_Log_File: db01_mysql_bin.000010

Slave_IO_Running: Yes

Slave_SQL_Running: Yes

Replicate_Do_DB:

Replicate_Ignore_DB:

Replicate_Do_Table:

Replicate_Ignore_Table:

Replicate_Wild_Do_Table:

Replicate_Wild_Ignore_Table:

Last_Errno: 0

Last_Error:

Skip_Counter: 0

Exec_Master_Log_Pos: 234

Relay_Log_Space: 583

Until_Condition: None

Until_Log_File:

Until_Log_Pos: 0

Master_SSL_Allowed: No

Master_SSL_CA_File:

Master_SSL_CA_Path:

Master_SSL_Cert:

Master_SSL_Cipher:

Master_SSL_Key:

Seconds_Behind_Master: 0

Master_SSL_Verify_Server_Cert: No

Last_IO_Errno: 0

Last_IO_Error:

Last_SQL_Errno: 0

Last_SQL_Error:

Replicate_Ignore_Server_Ids:

Master_Server_Id: 11

Master_UUID: 3ad8129b-e7b2-11e8-817e-000c296b2e4b

Master_Info_File: mysql.slave_master_info

SQL_Delay: 0

SQL_Remaining_Delay: NULL

Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates

Master_Retry_Count: 86400

Master_Bind:

Last_IO_Error_Timestamp:

Last_SQL_Error_Timestamp:

Master_SSL_Crl:

Master_SSL_Crlpath:

Retrieved_Gtid_Set:

Executed_Gtid_Set: 1386976f-e7b8-11e8-b34b-000c29d359de:1-2,

3ad8129b-e7b2-11e8-817e-000c296b2e4b:1-6

Auto_Position: 1

Replicate_Rewrite_DB:

Channel_Name:

Master_TLS_Version:

1 row in set (0.00 sec)

[[email protected] ~]# cat /etc/mha/app/app1/app1.cnf

[server default]

manager_log=/var/log/mha/app/app1/manager.log

manager_workdir=/var/log/mha/app/app1

master_binlog_dir=/data/3306/binlog

master_ip_failover_script=/server/scripts/master_ip_failover

password=mha

ping_interval=2

repl_password=chenliang

repl_user=rep

ssh_port=921

ssh_user=toor

user=mha

[server1]

hostname=172.16.1.11

port=3306

[server2]

hostname=172.16.1.12

port=3306

[server3]

hostname=172.16.1.13

port=3306

[server4]

hostname=172.16.1.14

no_master=1

port=3306

[[email protected] ~]# su - toor

[[email protected] ~]$ mha

[[email protected] ~]$ ps -ef|grep mha

toor 9310 1 16 15:56 pts/0 00:00:00 perl /usr/bin/masterha_manager --conf=/etc/mha/app/app1/app1.cnf --remove_dead_master_conf --ignore_last_failover

toor 9322 9290 0 15:56 pts/0 00:00:00 grep --color=auto mha

MySQL MHA高可用方案【五、故障切換】

5.1 故障模擬 01：在db01（Master）伺服器上檢視主從複製及mha是否正常 02：停止db01（Master）伺服器上的mysql服務 02：在db04上檢查MHA的日誌（/var/log/mha/app/app1/manager.log） 03：檢視VIP是否飄移到新Ma

MySQL MHA高可用方案【三、主從複製】

3.1 db01伺服器上的操作 db01是用作Master，所以需要先在上面建立主從複製的帳號 [[email protected] ~]# mysql -uroot -pchenliang -S /data/3306/mysql.sock mysql> mysql&g

MySQL MHA高可用方案【四、MHA部署】

4.1 建立普通使用者所有伺服器上建立普通使用者toor、設定密碼及sudo授權ifconfig，加入mysql使用者組 useradd -u 900 toor echo "chenliang"|passwd --stdin toor id toor sed -i '92a t

MySQL MHA高可用方案（一）

1.1 系統環境所以有伺服器的版本均如下所示，這裡只是拿其中一臺來列出版本號。 [[email protected] ~]# cat /etc/redhat-release;uname -r;uname -m; CentOS release 6.8 (Final) 2.6.

MySQL MHA高可用方案（二）

2.1 部署前注意事項所有MySQL的部署方法與2.2章節的大至一樣，需要修改的如下所示： 01：server_id不能相同 02：相應日誌檔案的檔名不要相同，例如 slow_query_log_file=/data/3306/slowlog/db01_mysql_slow.log

MySQL MHA高可用方案

四、配置relay_log的清除方式（在每個Node上） (1)所有Node的cnf配置檔案加上 relay_log_purge=0 MHA在發生切換的過程中，從庫的恢復過程中依賴於relay log的相關資訊，所以這裡要將relay log的自動清除設定為OFF，採用手動清除relay l

mysql mha高可用架構的安裝

pin 變量 log-bin dump 控制 masters 否則 ava 1.5 MMM無法全然地保證數據的一致性，所以MMM適用於對數據的一致性要求不是非常高。可是又想最大程度的保證業務可用性的場景對於那些對數據一致性要求非常高的業務，非常不建議採用MMM的這樣

mysql+mha高可用搭建

mysql mha 主庫：172.25.254.125備庫：172.25.254.225管理節點：172.25.254.126在開始之前，請先配置好服務器間的時間同步和名稱解析一:在數據庫節點安裝mha node[[email protected]/* */ ~]# rpm -ivh ep

Mysql MHA高可用集群架構

mysql- root 免密鑰登錄 sep ges 至少 isp 原來 mysql數據庫記得之前發過一篇文章，名字叫《淺析MySQL高可用架構》，之後一直有很多小夥伴在公眾號後臺或其它渠道問我，何時有相關的深入配置管理文章出來，因此，民工哥，也將對前面的各類架構

mysql MHA高可用測試

fin warn cell adding war dem cati -- end 【環境介紹】系統環境：Red Hat Enterprise Linux 7 + 5.7.18 + MHA version 0.57 當前數據庫狀態：系統 IP 主機名

MySQL MMM高可用方案

介紹本篇文章主要介紹搭建MMM方案以及MMM架構的原理。這裡不介紹主從、主主的搭建方法，MMM方案不適用對資料一致性要求很高的業務。架構部署 1.修改hosts 在所有的伺服器中執行相同的操作。 vim /etc/hosts 192.168.137.10 mast

MySQL資料庫高可用方案

一.什麼是高可用性：　　高可用性=可靠性，它的本質就是通過技術和工具提高可靠性，儘可能長時間保持資料可用和系統執行，實現高可用性的原則，首先要消除單點故障，其次通過冗餘機制實現快速恢復，還有就是實現容錯。二.我們在考慮資料庫的高可用方案時，應該考慮幾個方面： 1.若資料庫發生了宕機或者意外中

智能家居入門DIY——【五、執行命令】

嵌套實現 mps 狀態 client ble cmd sid 智能家居前面幾篇介紹了ESP8266使用AT命令來連接WIFI實現一系列功能。這一篇介紹一下使用Wemos D1 Wifi來進行開發，當然也可以用常見的8針ESP8266來完成（只是需要按網上

（轉）MySQL高可用方案MHA的部署和原理

進制說明 only manager 方案運行例如必須轉移背後深層次的邏輯： MHA Node則運行在每個mysql節點上，MHA Manager會定時探測集群中的master節點，當master出現故障時，它自動將最新數據的slave提升為master，然後將其

Linux實戰教學筆記40： Mha-Atlas-MySQL高可用方案實踐(二)

broadcast level lis 失敗 mat password cti overruns red 六，配置VIP漂移主機名 IP地址（NAT）漂移VIP 描述 mysql-db01 eth0:192.168.0.51 VIP：192.168.0.6

（專案六）Mha-Atlas-MySQL高可用方案實踐

mha-mysql環境準備：三臺虛擬機器，都安裝了mysql，都關閉防火牆和selinux，同時在每臺虛擬機器上都做對映軟體包 1） mha管理節點安裝包： mha4mysql-manager-0.56-0.el6.noarch.rpm mha4mysql-manager-0.56.tar.

（項目六）Mha-Atlas-MySQL高可用方案實踐

sta var block 三臺 libc 阿裏雲切換截圖 tro mha-mysql環境準備：三臺虛擬機，都安裝了mysql，都關閉防火墻和selinux，同時在每臺虛擬機上都做映射軟件包 1） mha管理節點安裝包： mha4mysql-manager-0.5

Mha-Atlas-MySQL高可用方案實踐。

Mha-Atlas-MySQL高可用方案實踐（一） Mha-Atlas-MySQL高可用方案實踐一，mysql-mha環境準備 1.1 實驗環境：

Mha-Atlas-MySQL高可用方案實踐

一：MySQL環境的準備（1）關閉iptables和selinux （2）主機名對映（3）安裝MySQL(三臺都要裝) [[email protected] ~]# yum -y install ncurses-devel [[email prot

專案課---Mha-Atlas-MySQL高可用方案實踐（六）

一，mysql-mha環境準備 1.1 實驗環境： 1.2 軟體包用到得所有包連結：https://pan.baidu.com/s/1aQ1HC-j3U762zWGW63dfbA 提取碼：o1dh 1） mha管理節點安裝包： m

MySQL MHA高可用方案【五、故障切換】

5.1 故障模擬

5.2 故障恢復

5.3 再次提升原master為主庫

相關推薦