1. 程式人生 > >中介軟體之訊息佇列

中介軟體之訊息佇列

一、簡介

訊息佇列中介軟體是分散式系統中重要的元件,主要解決應用耦合,非同步訊息,流量削鋒等問題。實現高效能、高可用、可伸縮和最終一致性架構。使用較多的訊息佇列有ActiveMQ、RabbitMQ、ZeroMQ、Kafka、MetaMQ、RocketMQ。

二、訊息佇列應用場景

以下介紹訊息佇列在實際應用中常用的使用場景:非同步處理,應用解耦,流量削鋒,日誌處理和訊息通訊五個場景。

1、非同步處理

場景說明:使用者註冊後,需要發註冊郵件和註冊簡訊。傳統的做法有兩種:序列的方式和並行方式。

序列方式:將註冊資訊寫入資料庫成功後,傳送註冊郵件,再發送註冊簡訊。以上三個任務全部完成後,返回給客戶。

並行方式:將註冊資訊寫入資料庫成功後,傳送註冊郵件的同時,傳送註冊簡訊。以上三個任務完成後,返回給客戶端。與序列的差別是,並行的方式可以提高處理的時間。

假設三個業務節點每個使用50毫秒鐘,不考慮網路等其他開銷,則序列方式的時間是150毫秒,並行的時間可能是100毫秒。

因為CPU在單位時間內處理的請求數是一定的,假設CPU1秒內吞吐量是100次。則序列方式1秒內CPU可處理的請求量是7次(1000/150)。並行方式處理的請求量是10次(1000/100)。

小結:如以上案例描述,傳統的方式系統的效能(併發量,吞吐量,響應時間)會有瓶頸。如何解決這個問題呢?

引入訊息佇列,將不是必須的業務邏輯,非同步處理。改造後的架構如下:

按照以上約定,使用者的響應時間相當於是註冊資訊寫入資料庫的時間,也就是50毫秒。註冊郵件,傳送簡訊寫入訊息佇列後,直接返回,因此寫入訊息佇列的速度很快,基本可以忽略,因此使用者的響應時間可能是50毫秒。因此架構改變後,系統的吞吐量提高到每秒20QPS。比序列提高了3倍,比並行提高了兩倍!

2、應用解耦

場景說明:使用者下單後,訂單系統需要通知庫存系統。傳統的做法是,訂單系統呼叫庫存系統的介面。如下圖:

傳統模式的缺點:

假如庫存系統無法訪問,則訂單減庫存將失敗,從而導致訂單失敗,訂單系統與庫存系統耦合。

如何解決以上問題呢?引入應用訊息佇列後的方案,如下圖:

訂單系統:使用者下單後,訂單系統完成持久化處理

,將訊息寫入訊息佇列,返回使用者訂單下單成功

庫存系統:訂閱下單的訊息,採用拉/推的方式,獲取下單資訊,庫存系統根據下單資訊,進行庫存操作

假如:在下單時庫存系統不能正常使用。也不影響正常下單,因為下單後,訂單系統寫入訊息佇列就不再關心其他的後續操作了。實現訂單系統與庫存系統的應用解耦

3、流量削鋒

流量削鋒也是訊息佇列中的常用場景,一般在秒殺或團搶活動中使用廣泛!

應用場景:秒殺活動,一般會因為流量過大,導致流量暴增,應用掛掉。為解決這個問題,一般需要在應用前端加入訊息佇列。

可以控制活動的人數,可以緩解短時間內高流量壓垮應用

使用者的請求,伺服器接收後,首先寫入訊息佇列。假如訊息佇列長度超過最大數量,則直接拋棄使用者請求或跳轉到錯誤頁面。

秒殺業務根據訊息佇列中的請求資訊,再做後續處理。

4、日誌處理

日誌處理是指將訊息佇列用在日誌處理中,比如Kafka的應用,解決大量日誌傳輸的問題。架構簡化如下:

日誌採集客戶端,負責日誌資料採集,定時寫受寫入Kafka佇列;Kafka訊息佇列,負責日誌資料的接收,儲存和轉發;日誌處理應用:訂閱並消費kafka佇列中的日誌資料。

以下是新浪kafka日誌處理應用案例:

Kafka:接收使用者日誌的訊息佇列;

Logstash:做日誌解析,統一成JSON輸出給Elasticsearch;

Elasticsearch:實時日誌分析服務的核心技術,一個schemaless,實時的資料儲存服務,通過index組織資料,兼具強大的搜尋和統計功能;

Kibana:基於Elasticsearch的資料視覺化元件,超強的資料視覺化能力是眾多公司選擇ELK stack的重要原因。

5、訊息通訊

訊息通訊是指,訊息佇列一般都內建了高效的通訊機制,因此也可以用在單純的訊息通訊。比如實現點對點訊息佇列,或者聊天室等。

點對點通訊:

客戶端A和客戶端B使用同一佇列,進行訊息通訊。

聊天室通訊:

客戶端A,客戶端B,客戶端N訂閱同一主題,進行訊息釋出和接收。實現類似聊天室效果。

以上實際是訊息佇列的兩種訊息模式,點對點或釋出訂閱模式。模型為示意圖,供參考。

三、訊息中介軟體示例

1、電商系統

訊息佇列採用高可用,可持久化的訊息中介軟體。比如Active MQ,Rabbit MQ,Rocket MQ。

應用將主幹邏輯處理完成後,寫入訊息佇列。訊息傳送是否成功可以開啟訊息的確認模式。(訊息佇列返回訊息接收成功狀態後,應用再返回,這樣保障訊息的完整性);

擴充套件流程(發簡訊,配送處理)訂閱佇列訊息。採用推或拉的方式獲取訊息並處理;

訊息將應用解耦的同時,帶來了資料一致性問題,可以採用最終一致性方式解決。比如主資料寫入資料庫,擴充套件應用根據訊息佇列,並結合資料庫方式實現基於訊息佇列的後續處理;

2、日誌收集系統

分為Zookeeper註冊中心,日誌收集客戶端,Kafka叢集和Storm叢集(OtherApp)四部分組成。

Zookeeper註冊中心,提出負載均衡和地址查詢服務;

日誌收集客戶端,用於採集應用系統的日誌,並將資料推送到kafka佇列;

Kafka叢集:接收,路由,儲存,轉發等訊息處理;

Storm叢集:與OtherApp處於同一級別,採用拉的方式消費佇列中的資料;

四、JMS訊息服務

JMS(JAVA Message Service,java訊息服務)API是一個訊息服務的標準/規範,允許應用程式元件基於JavaEE平臺建立、傳送、接收和讀取訊息。它使分散式通訊耦合度更低,訊息服務更加可靠以及非同步性更加優良。在EJB架構中,有訊息bean可以無縫的與JM訊息服務整合。在J2EE架構模式中,有訊息服務者模式,用於實現訊息與應用直接的解耦。

4.1訊息模型

在JMS標準中,有兩種訊息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)。

4.1.1 P2P模式

P2P模式包含三個角色:訊息佇列(Queue),傳送者(Sender),接收者(Receiver)。每個訊息都被髮送到一個特定的佇列,接收者從佇列中獲取訊息。佇列保留著訊息,直到他們被消費或超時。

P2P的特點:

  • 每個訊息只有一個消費者(Consumer)(即一旦被消費,訊息就不再在訊息佇列中)。
  • 傳送者和接收者之間在時間上沒有依賴性,也就是說當傳送者傳送了訊息之後,不管接收者有沒有正在執行,它不會影響到訊息被髮送到佇列。
  • 接收者在成功接收訊息之後需向佇列應答成功。如果希望傳送的每個訊息都會被成功處理的話,那麼需要P2P模式

4.1.2 Pub/Sub模式

包含三個角色主題(Topic),釋出者(Publisher),訂閱者(Subscriber) 多個釋出者將訊息傳送到Topic,系統將這些訊息傳遞給多個訂閱者。

Pub/Sub的特點:

  • 每個訊息可以有多個消費者。
  • 釋出者和訂閱者之間有時間上的依賴性。針對某個主題(Topic)的訂閱者,它必須建立一個訂閱者之後,才能消費釋出者的訊息。為了消費訊息,訂閱者必須保持執行的狀態。
  • 為了緩和這樣嚴格的時間相關性,JMS允許訂閱者建立一個可持久化的訂閱。這樣,即使訂閱者沒有被啟用(執行),它也能接收到釋出者的訊息。
  • 如果希望傳送的訊息可以不被做任何處理、或者只被一個訊息者處理、或者可以被多個消費者處理的話,那麼可以採用Pub/Sub模型。

4.2訊息消費

在JMS中,訊息的產生和消費都是非同步的。對於消費來說,JMS的訊息者可以通過兩種方式來消費訊息。

(1)同步:訂閱者或接收者通過receive方法來接收訊息,receive方法在接收到訊息之前(或超時之前)將一直阻塞;

(2)非同步:訂閱者或接收者可以註冊為一個訊息監聽器。當訊息到達之後,系統自動呼叫監聽器的onMessage方法。

JNDI:Java命名和目錄介面,是一種標準的Java命名系統介面。可以在網路上查詢和訪問服務。通過指定一個資源名稱,該名稱對應於資料庫或命名服務中的一個記錄,同時返回資源連線建立所必須的資訊。JNDI在JMS中起到查詢和訪問傳送目標或訊息來源的作用。

五、常用訊息佇列

一般商用的容器,比如WebLogic,JBoss,都支援JMS標準,開發上很方便。但免費的比如Tomcat,Jetty等則需要使用第三方的訊息中介軟體。本部分內容介紹常用的訊息中介軟體(Active MQ,Rabbit MQ,Zero MQ,Kafka)以及他們的特點。

5.1 ActiveMQ

ActiveMQ 是Apache出品,最流行的,能力強勁的開源訊息匯流排。ActiveMQ 是一個完全支援JMS1.1和J2EE 1.4規範的 JMS Provider實現,儘管JMS規範出臺已經是很久的事情了,但是JMS在當今的J2EE應用中間仍然扮演著特殊的地位。

ActiveMQ特性如下:

  • 多種語言和協議編寫客戶端。語言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應用協議: OpenWire,Stomp REST,WS Notification,XMPP,AMQP。
  • 完全支援JMS1.1和J2EE 1.4規範 (持久化,XA訊息,事務)。
  •  對Spring的支援,ActiveMQ可以很容易內嵌到使用Spring的系統裡面去,而且也支援Spring2.0的特性。
  • 通過了常見J2EE伺服器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試,其中通過JCA 1.5 resource adaptors的配置,可以讓ActiveMQ可以自動的部署到任何相容J2EE 1.4 商業伺服器上。
  • 支援多種傳送協議:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA
  • 支援通過JDBC和journal提供高速的訊息持久化
  • 從設計上保證了高效能的叢集,客戶端-伺服器,點對點
  • 支援Ajax
  • 支援與Axis的整合
  • 可以很容易得呼叫內嵌JMS provider,進行測試

5.2 Kafka

Kafka是一種高吞吐量的分散式釋出訂閱訊息系統,它可以處理消費者規模的網站中的所有動作流資料。 這種動作(網頁瀏覽,搜尋和其他使用者的行動)是在現代網路上的許多社會功能的一個關鍵因素。 這些資料通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。 對於像Hadoop的一樣的日誌資料和離線分析系統,但又要求實時處理的限制,這是一個可行的解決方案。Kafka的目的是通過Hadoop的並行載入機制來統一線上和離線的訊息處理,也是為了通過叢集機來提供實時的消費。

Kafka是一種高吞吐量的分散式釋出訂閱訊息系統,有如下特性:

  • 通過O(1)的磁碟資料結構提供訊息的持久化,這種結構對於即使數以TB的訊息儲存也能夠保持長時間的穩定效能。(檔案追加的方式寫入資料,過期的資料定期刪除)
  • 高吞吐量:即使是非常普通的硬體Kafka也可以支援每秒數百萬的訊息
  • 支援通過Kafka伺服器和消費機叢集來分割槽訊息
  • 支援Hadoop並行資料載入

Kafka相關概念

Broker:Kafka叢集包含一個或多個伺服器,這種伺服器被稱為broker。

Topic:每條釋出到Kafka叢集的訊息都有一個類別,這個類別被稱為Topic。(物理上不同Topic的訊息分開儲存,邏輯上一個Topic的訊息雖然保存於一個或多個broker上但使用者只需指定訊息的Topic即可生產或消費資料而不必關心資料存於何處)

Partition:Parition是物理上的概念,每個Topic包含一個或多個Partition。

Producer:負責釋出訊息到Kafka broker。

Consumer:訊息消費者,向Kafka broker讀取訊息的客戶端。

Consumer Group:每個Consumer屬於一個特定的Consumer Group(可為每個Consumer指定group name,若不指定group name則屬於預設的group)。

一般應用在大資料日誌處理或對實時性(少量延遲),可靠性(少量丟資料)要求稍低的場景使用。

參考資料: