搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

阿新 • • 發佈：2019-02-08

ext 不能所有賬戶 fir transacti star 本地 namenode

搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

初步認識RocketMQ的核心模塊

技術分享圖片

rocketmq模塊

rocketmq-broker：接受生產者發來的消息並存儲（通過調用rocketmq-store），消費者從這裏取得消息。

rocketmq-client：提供發送、接受消息的客戶端API。

rocketmq-namesrv：NameServer，類似於Zookeeper，這裏保存著消息的TopicName，隊列等運行時的元信息。（有點NameNode的味道）

rocketmq-common：通用的一些類，方法，數據結構等

rocketmq-remoting：基於Netty4的client/server + fastjson序列化 + 自定義二進制協議

rocketmq-store：消息、索引存儲等

rocketmq-filtersrv：消息過濾器Server，需要註意的是，要實現這種過濾，需要上傳代碼到MQ！【一般而言，我們利用Tag足以滿足大部分的過濾需求，如果更靈活更復雜的過濾需求，可以考慮filtersrv組件】

rocketmq-tools：命令行工具

分布式消息隊列RocketMQ--事務消息--解決分布式事務

說到分布式事務，就會談到那個經典的”賬號轉賬”問題：2個賬號，分布處於2個不同的DB，或者說2個不同的子系統裏面，A要扣錢，B要加錢，如何保證原子性？

一般的思路都是通過消息中間件來實現“最終一致性”：A系統扣錢，然後發條消息給中間件，B系統接收此消息，進行加錢。

但這裏面有個問題：A是先update DB，後發送消息呢？還是先發送消息，後update DB？

假設先update DB成功，發送消息網絡失敗，重發又失敗，怎麽辦？假設先發送消息成功，update DB失敗。消息已經發出去了，又不能撤回，怎麽辦？

所以，這裏下個結論：只要發送消息和update DB這2個操作不是原子的，無論誰先誰後，都是有問題的。

那這個問題怎麽解決呢？

錯誤的方案

有人可能想到了，我可以把“發送消息”這個網絡調用和update DB放在同1個事務裏面，如果發送消息失敗，update DB自動回滾。這樣不就保證2個操作的原子性了嗎？

這個方案看似正確，其實是錯誤的，原因有2：

（1）網絡的2將軍問題：發送消息失敗，發送方並不知道是消息中間件真的沒有收到消息呢？還是消息已經收到了，只是返回response的時候失敗了？

     如果是已經收到消息了，而發送端認為沒有收到，執行update db的回滾操作。則會導致A賬號的錢沒有扣，B賬號的錢卻加了。

（2）把網絡調用放在DB事務裏面，可能會因為網絡的延時，導致DB長事務。嚴重的，會block整個DB。這個風險很大。

     基於以上分析，我們知道，這個方案其實是錯誤的！

方案1–業務方自己實現

假設消息中間件沒有提供“事務消息”功能，比如你用的是Kafka。那如何解決這個問題呢？

解決方案如下：（1）Producer端準備1張消息表，把update DB和insert message這2個操作，放在一個DB事務裏面。

（2)準備一個後臺程序，源源不斷的把消息表中的message傳送給消息中間件。失敗了，不斷重試重傳。允許消息重復，但消息不會丟，順序也不會打亂。

（3）Consumer端準備一個判重表。處理過的消息，記在判重表裏面。實現業務的冪等。但這裏又涉及一個原子性問題：如果保證消息消費 + insert message到判重表這2個操作的原子性？

消費成功，但insert判重表失敗，怎麽辦？關於這個，在Kafka的源碼分析系列，第1篇， exactly once問題的時候，有過討論。

通過上面3步，我們基本就解決了這裏update db和發送網絡消息這2個操作的原子性問題。

但這個方案的一個缺點就是：需要設計DB消息表，同時還需要一個後臺任務，不斷掃描本地消息。導致消息的處理和業務邏輯耦合額外增加業務方的負擔。

方案2 – RocketMQ 事務消息

為了能解決該問題，同時又不和業務耦合，RocketMQ提出了“事務消息”的概念。

具體來說，就是把消息的發送分成了2個階段：Prepare階段和確認階段。

具體來說，上面的2個步驟，被分解成3個步驟： (1) 發送Prepared消息 (2) update DB (3) 根據update DB結果成功或失敗，Confirm或者Cancel Prepared消息。

可能有人會問了，前2步執行成功了，最後1步失敗了怎麽辦？這裏就涉及到了RocketMQ的關鍵點：RocketMQ會定期（默認是1分鐘）掃描所有的Prepared消息，詢問發送方，到底是要確認這條消息發出去？還是取消此條消息？

具體代碼實現如下：

也就是定義了一個checkListener，RocketMQ會回調此Listener，從而實現上面所說的方案。

// 也就是上文所說的，當RocketMQ發現`Prepared消息`時，會根據這個Listener實現的策略來決斷事務
TransactionCheckListener transactionCheckListener = new TransactionCheckListenerImpl();
// 構造事務消息的生產者
TransactionMQProducer producer = new TransactionMQProducer("groupName");
// 設置事務決斷處理類
producer.setTransactionCheckListener(transactionCheckListener);
// 本地事務的處理邏輯，相當於示例中檢查Bob賬戶並扣錢的邏輯
TransactionExecuterImpl tranExecuter = new TransactionExecuterImpl();
producer.start()
// 構造MSG，省略構造參數
Message msg = new Message(......);
// 發送消息
SendResult sendResult = producer.sendMessageInTransaction(msg, tranExecuter, null);
producer.shutdown();
?
---------------------------------------------------------------------------------------------
    
    
 public TransactionSendResult sendMessageInTransaction(.....)  {
    // 邏輯代碼，非實際代碼
    // 1.發送消息
    sendResult = this.send(msg);
    // sendResult.getSendStatus() == SEND_OK
    // 2.如果消息發送成功，處理與消息關聯的本地事務單元
    LocalTransactionState localTransactionState = tranExecuter.executeLocalTransactionBranch(msg, arg);
    // 3.結束事務
    this.endTransaction(sendResult, localTransactionState, localException);
}
?
?

技術分享圖片

上面所說的消息中間件上註冊的listener，超時以後會回調producer的接口以確定事務執行情況

技術分享圖片

總結：對比方案2和方案1，RocketMQ最大的改變，其實就是把“掃描消息表”這個事情，不讓業務方做，而是消息中間件幫著做了。

至於消息表，其實還是沒有省掉。因為消息中間件要詢問發送方，事物是否執行成功，還是需要一個“變相的本地消息表”，記錄事物執行狀態。

人工介入

可能有人又要說了，無論方案1，還是方案2，發送端把消息成功放入了隊列，但消費端消費失敗怎麽辦？

消費失敗了，重試，還一直失敗怎麽辦？是不是要自動回滾整個流程？

答案是人工介入。從工程實踐角度講，這種整個流程自動回滾的代價是非常巨大的，不但實現復雜，還會引入新的問題。比如自動回滾失敗，又怎麽處理？

對應這種極低概率的case，采取人工處理，會比實現一個高復雜的自動化回滾系統，更加可靠，也更加簡單。

搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

ext 不能所有賬戶 fir transacti star 本地 namenode 搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務初步認識RocketMQ的核心模塊 rocketmq模塊 rocketmq-broker：接受生產者發來的消息並存儲（通

搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

初步認識RocketMQ的核心模塊

錯誤的方案

方案1–業務方自己實現

方案2 – RocketMQ 事務消息

人工介入

搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

搞懂分布式技術16：淺談分布式鎖的幾種方案

搞懂分布式技術9：Nginx負載均衡原理與實踐

搞懂分布式技術1：分布式系統的一些基本概念

搞懂分布式技術2：分布式一致性協議與Paxos，Raft算法

搞懂分布式技術10：LVS實現負載均衡的原理與實踐

搞懂分布式技術12：分布式ID生成方案

搞懂分布式技術15：緩存更新的套路

搞懂分散式技術19：使用RocketMQ事務訊息解決分散式事務

C# 數據推送實時數據推送輕量級消息訂閱發布多級消息推送分布式推送

Apache RocketMQ 正式開源分布式事務消息

MIT18.06線性代數課程筆記19：矩陣行列式公式與代數餘子式

徹底搞懂CSS偽類選擇器：is、not

三文搞懂學會Docker容器技術（上）

三文搞懂學會Docker容器技術（中）

三文搞懂學會Docker容器技術（下）

《RocketMQ技術內幕：RocketMQ架構設計與實現原理》—1.1.2　Eclipse除錯RocketMQ原始碼

關於laravel5 消息訂閱/發布的理解初

阿裏雲消息隊列Kafka商業化：支持消息無縫遷移到雲上

rabbitmq學習（二）：rabbitmq（消息隊列）的作用以及rabbitmq之直連交換機

搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

搞懂分布式技術19：使用RocketMQ事務消息解決分布式事務

初步認識RocketMQ的核心模塊

錯誤的方案

方案1–業務方自己實現

方案2 – RocketMQ 事務消息

人工介入

相關推薦