1. 程式人生 > >大型網站架構之分布式消息隊列(轉)

大型網站架構之分布式消息隊列(轉)

工作經驗 大型網站 異步處理 消費 min 實現 通知 ima 可能

以下是消息隊列以下的大綱,本文主要介紹消息隊列概述,消息隊列應用場景和消息中間件示例(電商,日誌系統)。

本次分享大綱

  1. 消息隊列概述
  2. 消息隊列應用場景
  3. 消息中間件示例
  4. JMS消息服務
  5. 常用消息隊列
  6. 參考(推薦)資料
  7. 本次分享總結

一、消息隊列概述

消息隊列中間件是分布式系統中重要的組件,主要解決應用耦合,異步消息,流量削鋒等問題。實現高性能,高可用,可伸縮和最終一致性架構。是大型分布式系統不可缺少的中間件。

目前在生產環境,使用較多的消息隊列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等。

二、消息隊列應用場景

以下介紹消息隊列在實際應用中常用的使用場景。異步處理,應用解耦,流量削鋒和消息通訊四個場景。

2.1異步處理

場景說明:用戶註冊後,需要發註冊郵件和註冊短信。傳統的做法有兩種1.串行的方式;2.並行方式。

(1)串行方式:將註冊信息寫入數據庫成功後,發送註冊郵件,再發送註冊短信。以上三個任務全部完成後,返回給客戶端。(架構KKQ:466097527,歡迎加入)

技術分享圖片

(2)並行方式:將註冊信息寫入數據庫成功後,發送註冊郵件的同時,發送註冊短信。以上三個任務完成後,返回給客戶端。與串行的差別是,並行的方式可以提高處理的時間。

技術分享圖片

假設三個業務節點每個使用50毫秒鐘,不考慮網絡等其他開銷,則串行方式的時間是150毫秒,並行的時間可能是100毫秒。

因為CPU在單位時間內處理的請求數是一定的,假設CPU1秒內吞吐量是100次。則串行方式1秒內CPU可處理的請求量是7次(1000/150)。並行方式處理的請求量是10次(1000/100)。

小結:如以上案例描述,傳統的方式系統的性能(並發量,吞吐量,響應時間)會有瓶頸。如何解決這個問題呢?

引入消息隊列,將不是必須的業務邏輯,異步處理。改造後的架構如下:

技術分享圖片

按照以上約定,用戶的響應時間相當於是註冊信息寫入數據庫的時間,也就是50毫秒。註冊郵件,發送短信寫入消息隊列後,直接返回,因此寫入消息隊列的速度很快,基本可以忽略,因此用戶的響應時間可能是50毫秒。因此架構改變後,系統的吞吐量提高到每秒20 QPS。比串行提高了3倍,比並行提高了兩倍。

2.2應用解耦

場景說明:用戶下單後,訂單系統需要通知庫存系統。傳統的做法是,訂單系統調用庫存系統的接口。如下圖:(架構KKQ:466097527,歡迎加入)

技術分享圖片

傳統模式的缺點:

1) 假如庫存系統無法訪問,則訂單減庫存將失敗,從而導致訂單失敗;

2) 訂單系統與庫存系統耦合;

如何解決以上問題呢?引入應用消息隊列後的方案,如下圖:

技術分享圖片

  • 訂單系統:用戶下單後,訂單系統完成持久化處理,將消息寫入消息隊列,返回用戶訂單下單成功。
  • 庫存系統:訂閱下單的消息,采用拉/推的方式,獲取下單信息,庫存系統根據下單信息,進行庫存操作。
  • 假如:在下單時庫存系統不能正常使用。也不影響正常下單,因為下單後,訂單系統寫入消息隊列就不再關心其他的後續操作了。實現訂單系統與庫存系統的應用解耦。
  • 2.3流量削鋒

    流量削鋒也是消息隊列中的常用場景,一般在秒殺或團搶活動中使用廣泛。

    應用場景:秒殺活動,一般會因為流量過大,導致流量暴增,應用掛掉。為解決這個問題,一般需要在應用前端加入消息隊列。

    1. 可以控制活動的人數;
    2. 可以緩解短時間內高流量壓垮應用;
    3. 技術分享圖片
  1. 用戶的請求,服務器接收後,首先寫入消息隊列。假如消息隊列長度超過最大數量,則直接拋棄用戶請求或跳轉到錯誤頁面;
  2. 秒殺業務根據消息隊列中的請求信息,再做後續處理。

2.4日誌處理

日誌處理是指將消息隊列用在日誌處理中,比如Kafka的應用,解決大量日誌傳輸的問題。架構簡化如下:(架構KKQ:466097527,歡迎加入)

技術分享圖片

  • 日誌采集客戶端,負責日誌數據采集,定時寫受寫入Kafka隊列;
  • Kafka消息隊列,負責日誌數據的接收,存儲和轉發;
  • 日誌處理應用:訂閱並消費kafka隊列中的日誌數據;

以下是新浪kafka日誌處理應用案例:

轉自(http://cloud.51cto.com/art/201507/484338.htm)

技術分享圖片

(1)Kafka:接收用戶日誌的消息隊列。

(2)Logstash:做日誌解析,統一成JSON輸出給Elasticsearch。

(3)Elasticsearch:實時日誌分析服務的核心技術,一個schemaless,實時的數據存儲服務,通過index組織數據,兼具強大的搜索和統計功能。

(4)Kibana:基於Elasticsearch的數據可視化組件,超強的數據可視化能力是眾多公司選擇ELK stack的重要原因。

2.5消息通訊

消息通訊是指,消息隊列一般都內置了高效的通信機制,因此也可以用在純的消息通訊。比如實現點對點消息隊列,或者聊天室等。

點對點通訊:

技術分享圖片

客戶端A和客戶端B使用同一隊列,進行消息通訊。

聊天室通訊:

技術分享圖片

客戶端A,客戶端B,客戶端N訂閱同一主題,進行消息發布和接收。實現類似聊天室效果。

以上實際是消息隊列的兩種消息模式,點對點或發布訂閱模式。模型為示意圖,供參考。

三、消息中間件示例

3.1電商系統

技術分享圖片

消息隊列采用高可用,可持久化的消息中間件。比如Active MQ,Rabbit MQ,Rocket Mq。(1)應用將主幹邏輯處理完成後,寫入消息隊列。消息發送是否成功可以開啟消息的確認模式。(消息隊列返回消息接收成功狀態後,應用再返回,這樣保障消息的完整性)

(2)擴展流程(發短信,配送處理)訂閱隊列消息。采用推或拉的方式獲取消息並處理。

(3)消息將應用解耦的同時,帶來了數據一致性問題,可以采用最終一致性方式解決。比如主數據寫入數據庫,擴展應用根據消息隊列,並結合數據庫方式實現基於消息隊列的後續處理。

3.2日誌收集系統

技術分享圖片

分為Zookeeper註冊中心,日誌收集客戶端,Kafka集群和Storm集群(OtherApp)四部分組成。

  • Zookeeper註冊中心,提出負載均衡和地址查找服務;
  • 日誌收集客戶端,用於采集應用系統的日誌,並將數據推送到kafka隊列;
  • Kafka集群:接收,路由,存儲,轉發等消息處理;

Storm集群:與OtherApp處於同一級別,采用拉的方式消費隊列中的數據;

四、JMS消息服務

講消息隊列就不得不提JMS 。JMS(JAVA Message Service,java消息服務)API是一個消息服務的標準/規範,允許應用程序組件基於JavaEE平臺創建、發送、接收和讀取消息。它使分布式通信耦合度更低,消息服務更加可靠以及異步性。

在EJB架構中,有消息bean可以無縫的與JM消息服務集成。在J2EE架構模式中,有消息服務者模式,用於實現消息與應用直接的解耦。

4.1消息模型

在JMS標準中,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)。

4.1.1 P2P模式

技術分享圖片

P2P模式包含三個角色:消息隊列(Queue),發送者(Sender),接收者(Receiver)。每個消息都被發送到一個特定的隊列,接收者從隊列中獲取消息。隊列保留著消息,直到他們被消費或超時。

P2P的特點

  • 每個消息只有一個消費者(Consumer)(即一旦被消費,消息就不再在消息隊列中)
  • 發送者和接收者之間在時間上沒有依賴性,也就是說當發送者發送了消息之後,不管接收者有沒有正在運行,它不會影響到消息被發送到隊列
  • 接收者在成功接收消息之後需向隊列應答成功

如果希望發送的每個消息都會被成功處理的話,那麽需要P2P模式。(架構KKQ:466097527,歡迎加入)

4.1.2 Pub/sub模式

技術分享圖片

P2P模式包含三個角色:消息隊列(Queue),發送者(Sender),接收者(Receiver)。每個消息都被發送到一個特定的隊列,接收者從隊列中獲取消息。隊列保留著消息,直到他們被消費或超時。

P2P的特點

  • 每個消息只有一個消費者(Consumer)(即一旦被消費,消息就不再在消息隊列中)
  • 發送者和接收者之間在時間上沒有依賴性,也就是說當發送者發送了消息之後,不管接收者有沒有正在運行,它不會影響到消息被發送到隊列
  • 接收者在成功接收消息之後需向隊列應答成功

如果希望發送的每個消息都會被成功處理的話,那麽需要P2P模式。(架構KKQ:466097527,歡迎加入)

4.1.2 Pub/sub模式

技術分享圖片

幾個重要概念:

Broker:簡單來說就是消息隊列服務器實體。

  Exchange:消息交換機,它指定消息按什麽規則,路由到哪個隊列。

  Queue:消息隊列載體,每個消息都會被投入到一個或多個隊列。

  Binding:綁定,它的作用就是把exchange和queue按照路由規則綁定起來。

  Routing Key:路由關鍵字,exchange根據這個關鍵字進行消息投遞。

  vhost:虛擬主機,一個broker裏可以開設多個vhost,用作不同用戶的權限分離。

  producer:消息生產者,就是投遞消息的程序。

  consumer:消息消費者,就是接受消息的程序。

  channel:消息通道,在客戶端的每個連接裏,可建立多個channel,每個channel代表一個會話任務。

消息隊列的使用過程,如下:

(1)客戶端連接到消息隊列服務器,打開一個channel。

(2)客戶端聲明一個exchange,並設置相關屬性。

(3)客戶端聲明一個queue,並設置相關屬性。

(4)客戶端使用routing key,在exchange和queue之間建立好綁定關系。

(5)客戶端投遞消息到exchange。

exchange接收到消息後,就根據消息的key和已經設置的binding,進行消息路由,將消息投遞到一個或多個隊列裏。

5.3 ZeroMQ

號稱史上最快的消息隊列,它實際類似於Socket的一系列接口,他跟Socket的區別是:普通的socket是端到端的(1:1的關系),而ZMQ卻是可以N:M 的關系,人們對BSD套接字的了解較多的是點對點的連接,點對點連接需要顯式地建立連接、銷毀連接、選擇協議(TCP/UDP)和處理錯誤等,而ZMQ屏蔽了這些細節,讓你的網絡編程更為簡單。ZMQ用於node與node間的通信,node可以是主機或者是進程。

引用官方的說法: “ZMQ(以下ZeroMQ簡稱ZMQ)是一個簡單好用的傳輸層,像框架一樣的一個socket library,他使得Socket編程更加簡單、簡潔和性能更高。是一個消息處理隊列庫,可在多個線程、內核和主機盒之間彈性伸縮。ZMQ的明確目標是“成為標準網絡協議棧的一部分,之後進入Linux內核”。現在還未看到它們的成功。但是,它無疑是極具前景的、並且是人們更加需要的“傳統”BSD套接字之上的一 層封裝。ZMQ讓編寫高性能網絡應用程序極為簡單和有趣。”

特點是:

  • 高性能,非持久化;
  • 跨平臺:支持Linux、Windows、OS X等。
  • 多語言支持; C、C++、Java、.NET、Python等30多種開發語言。
  • 可單獨部署或集成到應用中使用;
  • 可作為Socket通信庫使用。

與RabbitMQ相比,ZMQ並不像是一個傳統意義上的消息隊列服務器,事實上,它也根本不是一個服務器,更像一個底層的網絡通訊庫,在Socket API之上做了一層封裝,將網絡通訊、進程通訊和線程通訊抽象為統一的API接口。支持“Request-Reply “,”Publisher-Subscriber“,”Parallel Pipeline”三種基本模型和擴展模型。

ZeroMQ高性能設計要點:

1、無鎖的隊列模型

對於跨線程間的交互(用戶端和session)之間的數據交換通道pipe,采用無鎖的隊列算法CAS;在pipe兩端註冊有異步事件,在讀或者寫消息到pipe的時,會自動觸發讀寫事件。

2、批量處理的算法

對於傳統的消息處理,每個消息在發送和接收的時候,都需要系統的調用,這樣對於大量的消息,系統的開銷比較大,zeroMQ對於批量的消息,進行了適應性的優化,可以批量的接收和發送消息。

3、多核下的線程綁定,無須CPU切換

區別於傳統的多線程並發模式,信號量或者臨界區, zeroMQ充分利用多核的優勢,每個核綁定運行一個工作者線程,避免多線程之間的CPU切換開銷。

5.4 Kafka

Kafka是一種高吞吐量的分布式發布訂閱消息系統,它可以處理消費者規模的網站中的所有動作流數據。 這種動作(網頁瀏覽,搜索和其他用戶的行動)是在現代網絡上的許多社會功能的一個關鍵因素。 這些數據通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。 對於像Hadoop的一樣的日誌數據和離線分析系統,但又要求實時處理的限制,這是一個可行的解決方案。Kafka的目的是通過Hadoop的並行加載機制來統一線上和離線的消息處理,也是為了通過集群機來提供實時的消費。

Kafka是一種高吞吐量的分布式發布訂閱消息系統,有如下特性:

  • 通過O(1)的磁盤數據結構提供消息的持久化,這種結構對於即使數以TB的消息存儲也能夠保持長時間的穩定性能。(文件追加的方式寫入數據,過期的數據定期刪除)
  • 高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒數百萬的消息。
  • 支持通過Kafka服務器和消費機集群來分區消息。
  • 支持Hadoop並行數據加載。

Kafka相關概念

  • Broker

Kafka集群包含一個或多個服務器,這種服務器被稱為broker[5]

  • Topic

每條發布到Kafka集群的消息都有一個類別,這個類別被稱為Topic。(物理上不同Topic的消息分開存儲,邏輯上一個Topic的消息雖然保存於一個或多個broker上但用戶只需指定消息的Topic即可生產或消費數據而不必關心數據存於何處)

  • Partition

Parition是物理上的概念,每個Topic包含一個或多個Partition.

  • Producer

負責發布消息到Kafka broker

  • Consumer

消息消費者,向Kafka broker讀取消息的客戶端。

  • Consumer Group

每個Consumer屬於一個特定的Consumer Group(可為每個Consumer指定group name,若不指定group name則屬於默認的group)。

一般應用在大數據日誌處理或對實時性(少量延遲),可靠性(少量丟數據)要求稍低的場景使用。

六、參考資料

以下是本次分享參考的資料和推薦大家參考的資料。

參考資料(可參考資料):

(1)Jms

http://blog.sina.com.cn/s/blog_3fba24680100r777.html

http://blog.csdn.net/jiuqiyuliang/article/details/46701559(深入淺出JMS(一)--JMS基本概念)

(2)RabbitMQ

http://baike.baidu.com/link?url=s2cU-QgOsXan7j0AM5qxxlmruz6WEeBQXX-Bbk0O3F5jt9Qts2uYQARxQxl7CBT2SO2NF2VkzX_XZLqU-CTaPa

http://blog.csdn.net/sun305355024sun/article/details/41913105

(3)Zero MQ

http://www.searchtb.com/2012/08/zeromq-primer.html

http://blog.csdn.net/yangbutao/article/details/8498790

http://wenku.baidu.com/link?url=yYoiZ_pYPCuUxEsGQvMMleY08bcptZvwF3IMHo2W1i-ti66YXXPpLLJBGXboddwgGBnOehHiUdslFhtz7RGZYkrtMQQ02DV5sv9JFF4LZnK

(4)Kafka

http://baike.baidu.com/link?url=qQXyqvPQ1MVrw9WkOGSGEfSX1NHy4unsgc4ezzJwU94SrPuVnrKf2tbm4SllVaN3ArGGxV_N5hw8JTT2-lw4QK

http://www.infoq.com/cn/articles/apache-kafka/

http://www.mincoder.com/article/3942.shtml

已分享的電子資料(在群文件中)

技術分享圖片

技術分享圖片

技術分享圖片

七、本次分享總結

以上是本周的分享,主要講解了消息隊列概述,常用消息隊列應用場景(異步處理,應用解耦,流量削鋒,日誌處理和消息通訊),JMS Java消息服務,以及目前流行的幾款消息隊列介紹。最後演示了兩個使用消息中間件的架構。

因為時間關系,有些講解的不細致,大家可以問下度娘/Google,希望本次分享對大家有幫助。

本次是春節前最後一次分享,我們的分享年後會繼續,明年會繼續《大型網站架構系列》,並會增加《一步一步學架構系列》。具體時間和分享內容會以QQ群公告的方式通知大家。感謝大家的關註。

分享是快樂的,也是個人成長的過程。文章一般是自己的學習總結,工作經驗,不足之處在所難免,請大家指正,共同進步。建立了一個以架構為中心的KK群466097527 ,歡迎大家加入。專註大型分布式網站架構,大數據,架構模式,設計模式。

原文:http://www.cnblogs.com/itfly8/p/5155983.html

大型網站架構之分布式消息隊列(轉)