並行複製的從庫執行FTWRL死鎖

阿新 • • 發佈：2018-12-30

最近線上執行備份的從庫遇到兩個死鎖，show full processlist的狀態圖如下，資料庫版本基本是官方5.7.18版本，我們內部做了些許修改，與此次死鎖無關。

先說一下結論，圖一中162執行緒是執行innobackup執行的flush tables with read lock;
144是sql執行緒，並行複製中的Coordinator執行緒，145/146是並行複製的worker執行緒，145/146worker執行緒佇列中的事務可以並行執行。
144Coordinator執行緒分發relaylog中的事務時發現這個事務還不能執行，要等待前面的事務完成提交，所以處於waiting for dependent transaction to commit的狀態。145/146執行緒和備份執行緒162形成死鎖，145執行緒等待162執行緒 global read lock 釋放，162執行緒佔有MDL::global read lock 全域性讀鎖，申請全域性commit lock的時候阻塞等待146執行緒，146執行緒佔有MDL:: commit lock，因為從庫設定slave_preserve_commit_order=1，保證從庫binlog提交順序，而146執行緒執行事務對應的binlog靠後面，所以等待145的事務提交。最終形成了145->162->146->145的死迴圈，形成死鎖。

同樣的圖二中,183是備份程式執行的flush tables with read lock;165是sql執行緒，並行複製的Coordinator執行緒；166/167是並行複製的worker執行緒。165Coordinator執行緒分發的事務還不能執行，進入waiting for dependent transaction to commit的狀態，183、166、167三個執行緒形成死鎖，183佔有全域性讀鎖，獲取全域性commit鎖的時候進入阻塞，等待167釋放事務涉及到表的commit鎖；166，167的事務可以並行複製，167佔有表級commit鎖，但是事務對應的binlog在後面，阻塞等待166先提交進入waiting for preceding transaction to commit的狀態；166執行緒事務執行時提交要獲得表級commit鎖，但是已經被183佔有，所以阻塞等待。這樣形成了183->167->166->183的死鎖。

三個執行緒相互形成死鎖，在我的經驗中還是很少見的，又因為涉及的MDL鎖是服務層的鎖，死鎖檢測也不會起作用，

死鎖原因分析

1、MDL鎖

2、flush tables with read lock獲取兩個鎖

MDL::global read lock 和MDL::global commit lock,而且是顯示的MDL_SHARED鎖。

//Global_read_lock::lock_global_read_lock
MDL_REQUEST_INIT(&mdl_request,MDL_key::GLOBAL, "", "", MDL_SHARED, MDL_EXPLICIT);
//Global_read_lock::make_global_read_lock_block_commit
MDL_REQUEST_INIT(&mdl_request,MDL_key::COMMIT, "", "", MDL_SHARED, MDL_EXPLICIT);

3、事務執行中涉及兩個鎖

在所有更新資料的程式碼路徑裡，除了必須的鎖外，還會額外請求MDL_key::GLOBAL鎖的MDL_INTENTION_EXCLUSIVE鎖；在事務提交前，會先請求MDL_key::COMMIT鎖的MDL_INTENTION_EXCLUSIVE鎖。對於scope鎖來說，IX鎖和S鎖是不相容的。

4、–slave_preserve_commit_order

For multi-threaded slaves, enabling this variable ensures that 
transactions are externalized on theslave in the same order as they appear in the slave's relay log.

slave_preserve_commit_order=1時，relay-log中事務的提交順序會嚴格按照在relay-log中出現的順序提交。

所以，事務的執行和flush tables with read lock語句獲得兩個鎖都不是原子的，並行複製時模式下按一下的順序就會出現死鎖。

事務A、B可以並行複製，relay-log中A在前，slave_preserve_commit_order=1
從庫回放時B事務執行較快，先執行到commit，獲得commit鎖，並進入waiting for preceding transaction to commit的狀態
執行flush tables with read lock,進入waiting for commit的狀態
事務A執行。事務A如果在FTWRL語句獲得global read lock鎖之後執行，那麼事務A就進入waiting for global read lock的狀態，即第一種死鎖；如果事務A在FTWRL獲得global read lock之前執行，同時FTWRL獲得global commit鎖之後應該Xid_event提交事務，則進入 waiting for the commit lock的狀態，即第二種死鎖。

復現

理解了死鎖出現的原因以後重現就簡單多了。重現這個死鎖步驟主要是2步

1、在主庫構造並行複製的事務，利用debug_sync

session 1
SET DEBUG_SYNC='waiting_in_the_middle_of_flush_stage SIGNAL s1 WAIT_FOR f';
insert into test.test values(13);//事務A

//session 2
SET DEBUG_SYNC= 'now WAIT_FOR s1'; 
SET DEBUG_SYNC= 'bgc_after_enrolling_for_flush_stage SIGNAL f';   
insert into test.test values(16);//事務B

2、從庫執行，修改原始碼，在關鍵地方sleep若干時間，控制並行複製的worke的執行並留出足夠時間執行flush tables with read lock
修改點如下：
```
//Xid_apply_log_event::do_apply_event_worker
if(w->id==0)
{
    cout<<"before commit"<<endl;
    sleep(20);
}
//pop_jobs_item
if(worker->id==0)    
    sleep(20);  
```

開啟slave以後，觀察show full processlist和輸出日誌，在其中一個worker出現wait for preceding transaction to commit以後，執行 ftwrl，出現圖1的死鎖；wait for preceding transaction to commit以後，出現日誌before commit之後，執行 ftwrl，出現圖2的死鎖。

如何解決？

出現死鎖以後如果不人工干預，IO執行緒正常，但是sql執行緒一直卡主，一般需要等待lock-wait-timeout時間，這個值我們線上設定1800秒，所以這個死鎖會產生很大影響。
那麼如何解決呢？kill ！kill那個執行緒呢？對圖1的死鎖，146處於wait for preceding transaction狀態的worker執行緒實際處於mysql_cond_wait的狀態，kill不起作用，所以只能kill 145執行緒或者備份執行緒，如果kill145worker執行緒，整個並行複製就報錯結束，show slave status顯示SQL異常退出，之後需要手動重新開啟sql執行緒，所以最好的辦法就是kill執行flush tables with read lock的執行緒，代價最小。至於圖2的死鎖，則只能kill掉執行flush tables with read lock的執行緒。所以出現上述死鎖時，kill執行flush tables with read lock的備份執行緒就恢復正常，之後擇機重新執行備份即可。

如何避免？

設定xtrabackup的kill-long-queries-timeout引數可以避免第一種死鎖的出現，其實不算避免，只是出現以後xtrabackup會殺掉阻塞的執行語句的執行緒；但是這個引數對第二種死鎖狀態則無能為力了，因為xtrabackup選擇殺掉的執行緒時，會過濾Info！=NULL。

另外還有個引數safe-slave-backup，執行備份的時候加上這個引數會停掉SQL執行緒，這樣也肯定不會出現這個死鎖，只是停掉SQL未免太暴力了，個人不提倡這樣做。

可以設定slave_preserve_commit_order=0關閉從庫binlog的順序提交，關閉這個引數只是影響並行複製的事務在從庫的提交順序，對最終的資料一致性並無影響，所以如果無特別的要求從庫的binlog順序必須與主庫保持一致，可以設定slave_preserve_commit_order=0避免這個死鎖的出現。

福利：關於xtrabackup kill-long-query-type引數

首先說下kill-long-queries-timeout,kill-long-query-type引數，
官方文件介紹如下

–KILL-LONG-QUERY-TYPE=ALL|SELECT

  This option specifies which types of queries should be killed to 
unblock the global lock. Default is “all”.

–KILL-LONG-QUERIES-TIMEOUT=SECONDS

  This option specifies the number of seconds innobackupex waits 
between starting FLUSH TABLES WITH READ LOCK and killing those queries 
that block it. Default is 0 seconds, which means innobackupex will not 
attempt to kill any queries. In order to use this option xtrabackup 
user should have PROCESS and SUPER privileges.Where supported (Percona 
Server 5.6+) xtrabackup will automatically use Backup Locks as a 
lightweight alternative to FLUSH TABLES WITH READ LOCK to copy non-
InnoDB data to avoid blocking DML queries that modify InnoDB tables.

引數的作用的就是在Xtrabackup執行FLUSH TABLES WITH READ LOCK以後，獲得全域性讀鎖時，如果有正在執行的事務會阻塞等待，kill-long-queries-timeout引數就是不為0時，xtrabackup內部建立一個執行緒，連線到資料庫執行show full processlist,如果TIME超過kill-long-queries-timeout，會kill掉執行緒，kill-long-query-type設定可以kill掉的sql型別。官方文件介紹kill-long-query-type預設值時all，也就是所有語句都會kill掉。但是在使用中發現，只設置kill-long-queries-timeout，未設定kill-long-query-type時，引數沒起作用！最後查閱xtrabackup程式碼，如下

{"kill-long-query-type", OPT_KILL_LONG_QUERY_TYPE,
"This option specifies which types of queries should be killed to "
"unblock the global lock. Default is \"all\".",
(uchar*) &opt_ibx_kill_long_query_type,
(uchar*) &opt_ibx_kill_long_query_type, &query_type_typelib,
GET_ENUM, REQUIRED_ARG, QUERY_TYPE_SELECT, 0, 0, 0, 0, 0}

心中一萬頭草泥馬，也是隻是筆誤，但是也太坑爹了！
所以使用kill-long-query-type時一定要自己指定好型別！

並行複製的從庫執行FTWRL死鎖

死鎖原因分析

復現

如何解決？

如何避免？

福利：關於xtrabackup kill-long-query-type引數

並行複製的從庫執行FTWRL死鎖

執行緒死鎖問題

34-多執行緒--死鎖+執行緒間通訊+等待喚醒機制+多生產者多消費者問題

Java多執行緒-47-多執行緒死鎖

Java開發之執行緒同步造成的執行緒死鎖

java 多執行緒死鎖和valitile關鍵字

python中的多程序,多執行緒,死鎖,多協程

Java筆記-多執行緒之執行緒死鎖問題加簡單舉例

多執行緒死鎖程式碼

多執行緒死鎖的產生以及如何避免死鎖

VC中使用SetThreadName引起的執行緒死鎖

.NET Core中遇到奇怪的執行緒死鎖問題：記憶體與執行緒數不停地增長

嘗試解決在建構函式中同步呼叫Dns.GetHostAddressesAsync()引起的執行緒死鎖

《手Q Android執行緒死鎖監控與自動化分析實踐》

VisualVM（9）排查JAVA應用程式執行緒死鎖

關於GCD執行緒死鎖的一點兒理解

ＭｙＳＱＬ主從複製從庫狀態監測

哲學家吃飯問題程式碼實現如何避免執行緒死鎖

Linux核心中的執行緒死鎖

使用Jvisualvm監控執行緒死鎖案例分析

並行複製的從庫執行FTWRL死鎖

死鎖原因分析

復現

如何解決？

如何避免？

福利：關於xtrabackup kill-long-query-type引數

相關推薦