Kafka訊息佇列介紹、環境搭建及應用：C#實現消費者-生產者訂閱

阿新 • • 發佈：2018-11-29

一：kafka介紹

kafka（官網地址：http://kafka.apache.org）是一種高吞吐量的分散式釋出訂閱的訊息佇列系統，具有高效能和高吞吐率。

1.1 術語介紹

Broker
Kafka叢集包含一個或多個伺服器，這種伺服器被稱為broker
Topic
主題：每條釋出到Kafka叢集的訊息都有一個類別，這個類別被稱為Topic。（物理上不同Topic的訊息分開儲存，邏輯上一個Topic的訊息雖然保存於一個或多個broker上但使用者只需指定訊息的Topic即可生產或消費資料而不必關心資料存於何處）
Partition
分割槽：Partition是物理上的概念，每個Topic包含一個或多個Partition.（一般為kafka節點數cpu的總核數）

Producer
生產者，負責釋出訊息到Kafka broker
Consumer
消費者：從Kafka broker讀取訊息的客戶端。
Consumer Group
消費者組：每個Consumer屬於一個特定的Consumer Group（可為每個Consumer指定group name，若不指定group name則屬於預設的group）。

1.2 基本特性

可擴充套件性

在不需要下線的情況下進行擴容
資料流分割槽(partition)儲存在多個機器上

高效能

單個broker就能服務上千客戶端

單個broker每秒種讀/寫可達每秒幾百兆位元組
多個brokers組成的叢集將達到非常強的吞吐能力
效能穩定，無論資料多大
Kafka在底層摒棄了Java堆快取機制，採用了作業系統級別的頁快取，同時將隨機寫操作改為順序寫，再結合Zero-Copy的特性極大地改善了IO效能。

1.3 訊息格式

一個topic對應一種訊息格式，因此訊息用topic分類
一個topic代表的訊息有1個或者多個patition(s)組成
一個partition應該存放在一到多個server上，如果只有一個server，就沒有冗餘備份，是單機而不是叢集；如果有多個server，一個server為leader（領導者），其他servers為followers（跟隨者），leader需要接受讀寫請求，followers僅作冗餘備份，leader出現故障，會自動選舉一個follower作為leader，保證服務不中斷；每個server都可能扮演一些partitions的leader和其它partitions的follower角色，這樣整個叢集就會達到負載均衡的效果

訊息按順序存放；訊息順序不可變；只能追加訊息，不能插入；每個訊息都有一個offset，用作訊息ID, 在一個partition中唯一；offset有consumer儲存和管理，因此讀取順序實際上是完全有consumer決定的，不一定是線性的；訊息有超時日期，過期則刪除

1.4 原理解析

producer建立一個topic時，可以指定該topic為幾個partition（預設是1，配置num.partitions），然後會把partition分配到每個broker上，分配的演算法是：a個broker，第b個partition分配到b%a的broker上，可以指定有每個partition有幾分副本Replication，副本的分配策略為：第c個副本儲存在第（b+c）%a的broker上。一個partition在每個broker上是一個資料夾，資料夾中檔案的命名方式為：topic名稱+有序序號。每個partition中檔案是一個個的segment，segment file由.index和.log檔案組成。兩個檔案的命名規則是，上一個segmentfile的最後一個offset。這樣，可以快速的刪除old檔案。

producer往kafka裡push資料，會自動的push到所有的分割槽上，訊息是否push成功有幾種情況：1，接收到partition的ack就算成功，2全部副本都寫成功才算成功；資料可以儲存多久，預設是兩天；producer的資料會先存到快取中，等大小或時間達到閾值時，flush到磁碟，consumer只能讀到磁碟中的資料。

consumer從kafka裡poll資料，poll到一定配置大小的資料放到記憶體中處理。每個group裡的consumer共同消費全部的訊息，不同group裡的資料不能消費同樣的資料，即每個group消費一組資料。

consumer的數量和partition的數量相等時消費的效率最高。這樣，kafka可以橫向的擴充broker數量和partitions；資料順序寫入磁碟；producer和consumer非同步

二：環境搭建（windows）

2.1 安裝zookeeper

kafka需要用到zookeeper,所以需要先安裝zookeeper

到官網下載最新版zookeeper，http://www.apache.org/dyn/closer.cgi/zookeeper/
解壓到指定路徑
複製conf目錄下zoo_sample.cfg，貼上改名為zoo.cfg，修改zoo.cfg中的dataDir的值為E:/data/zookeeper，並新增一行dataLogDir=E:/log/zookeeper
修改系統環境變數，在Path後新增 ;E:\zookeeper\zookeeper-3.4.10\bin
執行cmd命令視窗，輸入zkServer回車，啟動

2.2 安裝kafka

到官網下載最新版kafka，http://kafka.apache.org/downloads
解壓到指定路徑，如：E:\kafka_2.12-0.10.2.0
修改E:\kafka_2.12-0.10.2.0\config目錄下的server.properties中 log.dirs的值為E:/log/kafka
新增系統環境變數，在Path後新增 ;E:\kafka_2.12-0.10.2.0\bin\windows
啟動kafka，在cmd命令列用cd命令切換到kafka根目錄E:\kafka_2.12-0.10.2.0，輸入命令
.\bin\windows\kafka-server-start.bat .\config\server.properties
出現started (kafka.server.KafkaServer)字樣表示啟動成功
執行cmd命令列，建立一個topic，命令如下：
kafka-topics.bat --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
再開啟一個cmd，建立一個Producer，命令如下：
kafka-console-producer.bat --broker-list localhost:9092 --topic test
再開啟一個cmd，建立一個Customer，命令如下：
kafka-console-consumer.bat --zookeeper localhost:2181 --topic test
在Producer視窗下輸入資訊進行測試，每輸入一行回車後訊息馬上就會出現在Customer中，表明kafka已經安裝測試成功

三：基於.net的常用類庫

基於.net實現kafka的訊息佇列應用，常用的類庫有kafka-net，Confluent.Kafka，官網推薦使用Confluent.Kafka，本文也是基於該庫的實現，使用版本預發行版1.0.0-beta，建立控制檯應用程式。

四：應用–生產者

生產者將資料釋出到指定的主題，一般生產環境下的負載均衡，服務代理會有多個，BootstrapServers屬性則為以逗號隔開的多個代理地址

/// <summary>
/// 生產者
/// </summary>
public static void Produce()
{
     var config = new ProducerConfig { BootstrapServers = "localhost:9092" }
     Action<DeliveryReportResult<Null, string>> handler = r =>
     Console.WriteLine(!r.Error.IsError
         ? $"Delivered message to {r.TopicPartitionOffset}"
         : $"Delivery Error: {r.Error.Reason}");

    using (var producer = new Producer<Null, string>(config))
    {
        // 錯誤日誌監視
        producer.OnError += (_, msg) => { Console.WriteLine($"Producer_Erro資訊：Code：{msg.Code}；Reason：{msg.Reason}；IsError：{msg.IsError}"); };

        for (int i = 0; i < 5; i++)
        {
            // 非同步傳送訊息到主題
            producer.BeginProduce("MyTopic", new Message<Null, string> { Value = i.ToString() }, handler);
        }   
        // 3後 Flush到磁碟
        producer.Flush(TimeSpan.FromSeconds(3));
    }
}

五：應用–消費者

消費者使用消費者組名稱標記自己，並且釋出到主題的每個記錄被傳遞到每個訂閱消費者組中的一個消費者例項。消費者例項可以在單獨的程序中，也可以在不同的機器

如果所有消費者例項具有相同的消費者組，則記錄將有效地在消費者例項上進行負載平衡。

如果所有消費者例項具有不同的消費者組，則每個記錄將廣播到所有消費者程序
在這裡插入圖片描述
上圖為兩個伺服器Kafka群集，託管四個分割槽（P0-P3），包含兩個消費者組。消費者組A有兩個消費者例項，B組有四個消費者例項。

預設EnableAutoCommit 是自動提交，只要從佇列取出訊息，偏移量自動移到後一位，無論訊息後續處理成功與否，該條訊息都會消失，所以為免除處理失敗的資料丟失，消費者方可設定該屬性為false，後面進行手動commint()提交偏移

  /// <summary>
  /// 消費者
  /// </summary>
  public static void Consumer()
  {
      var conf = new ConsumerConfig
      {
          GroupId = "test-consumer-group",
          BootstrapServers = "localhost:9092",
          AutoOffsetReset = AutoOffsetResetType.Earliest,
          EnableAutoCommit = false  // 設定非自動偏移，業務邏輯完成後手動處理偏移，防止資料丟失
      };

      using (var consumer = new Consumer<Ignore, string>(conf))
      {
          // 訂閱topic
          consumer.Subscribe("MyTopic");
          // 錯誤日誌監視 
          consumer.OnError += (_, msg) => { Console.WriteLine($"Consumer_Error資訊：Code：{msg.Code}；Reason：{msg.Reason}；IsError：{msg.IsError}"); };

          while (true)
          {
              try
              {
                  var consume = consumer.Consume();
                  string receiveMsg = consume.Value;
                  Console.WriteLine($"Consumed message '{receiveMsg}' at: '{consume.TopicPartitionOffset}'.");
                  // 開始我的業務邏輯
                  ...
                  // 業務結束
                  if(成功)
                  {
                   	 consumer.Commit(new List<TopicPartitionOffset>() { consume.TopicPartitionOffset }); //手動提交偏移
                  }
              }
              catch (ConsumeException e)
              {
                  Console.WriteLine($"Consumer_Error occured: {e.Error.Reason}");
              }
          }
      }
  }

執行結果

在這裡插入圖片描述

常見資料問題處理

重複消費最常見的原因：re-balance問題,通常會遇到消費的資料，處理很耗時，導致超過了Kafka的session timeout時間（0.10.x版本預設是30秒），那麼就會re-balance重平衡，此時有一定機率offset沒提交，會導致重平衡後重復消費。
去重問題：訊息可以使用唯一id標識
保證不丟失訊息：
生產者（ack= -1 或 all 代表至少成功傳送一次)
消費者（offset手動提交，業務邏輯成功處理後，提交offset）
保證不重複消費：落表（主鍵或者唯一索引的方式，避免重複資料）
業務邏輯處理（選擇唯一主鍵儲存到Redis或者mongdb中，先查詢是否存在，若存在則不處理；若不存在，先插入Redis或Mongdb,再進行業務邏輯處理）

Kafka 視覺化除錯

藉助視覺化客戶端工具 kafka tool
具體使用可參考：https://www.cnblogs.com/frankdeng/p/9452982.html

END

Kafka訊息佇列介紹、環境搭建及應用：C#實現消費者-生產者訂閱

一：kafka介紹 kafka（官網地址：http://kafka.apache.org）是一種高吞吐量的分散式釋出訂閱的訊息佇列系統，具有高效能和高吞吐率。 1.1 術語介紹 Broker Kafka叢集包含一個或多個伺服器，這種伺服器被稱為broker

【Qt學習筆記之一】初識Qt、環境搭建及hello world的實現

初識Qt Qt，簡單來說就是一個跨平臺的C++圖形使用者介面應用程式開發框架。因此，相比很多開發框架，Qt的特點更多體現在GUI程式的開發上。我們平時使用的QQ（介面越來越花哨）、微信、瀏覽器等等，只要是你作為使用者，能夠看到一個介面去操作，那麼它就可以

SSM到Spring Boot從零開發校園商鋪平臺---1、環境搭建及測試

根據慕課網專案深入學習SSM和SpringBoot，練手中，將學習筆記做記錄，後期會繼續更新。慕課網地址：SSM到Spring Boot-從零開發校園商鋪平臺-慕課網實戰，文末會附上免費視訊地址！先上效果圖（此文講述中最後要完成的結果）：

1、Vue介紹、環境搭建、項目運行

命令行工具 mce 成功 pan 技術 ins 國內 info 自帶 1、Vue介紹 Vue和Angular、React都是前端框架，特點： 1、單頁面框架； 2、基於模塊化組件化的開發模式； 3、Vue簡單靈活高效國內的中小企業裏面用的非常多。 2、開發環境搭建 1

react介紹、環境搭建、demo運行實例

eat yarn tcs host 腳手架重新 pan 二進制文件部分 React官網:https://reactjs.org/docs/create-a-new-react-app.html cnpm網址:http://npm.taobao.org/ 1、react介

Locust環境搭建及應用

Locust環境搭建： 1，在命令視窗中，進入到python專案路徑，如：d:\Pycharmproject\venv\Scripts 2，執行Scripts下的active.bat，進入到虛擬環境 3，執行命令安裝：pip install locust 4，安裝完成後，可以看到Lib->sit

116.k8s介紹、k8s搭建一個應用（mysql+tomcat）

k8s介紹 k8s搭建一個應用（mysql+tomcat） kubetnetes介紹官網

linux ELK（filebeat）環境搭建中加入kafka訊息佇列的詳細介紹（菜鳥新手級別）

本文所使用的軟體版本如下filebeat 5.4.0，elasticsearch 5.4.0，kibana 5.4.0，最近公司需要做實時日誌分析系統，在網上查了很多資料，發現ELK是最適合的，而且是開源，官方文件還算詳細。儘管ELK環

訊息佇列-ActiveMQ學習筆記（一）-JMS介紹與環境搭建

一、介紹JMS（來自於百度百科） JMS即Java訊息服務（Java Message Service）應用程式介面，是一個Java平臺中關於面向訊息中介軟體（MOM）的API，用於在兩個

Ubuntu下kafka集群環境搭建及測試

delet 指定文件中新增 img --delete replicat pro alt 1，解壓 root@Ubuntu-1:/usr/local# tar zxvf kafka_2.11-0.8.2.2.tgz 2，重命名 root@Ubuntu-1:/usr/

UI自動化測試簡介及Selenium工具的介紹和環境搭建

版本 ebe 需求分析核心 nis rep color 基於多語自動化測試簡介 1.1何為自動化測試？　　是把以人為驅動的測試轉化為機器執行的一種過程，它是一種以程序測試程序的過程。換言之，就是以程序實現的方式來代替手工測試。 1.2自動化測試分類　　分為功能自動

Maven環境搭建及常用命令、生命周期

ngs 打包 efault info inf com clean setting 常用一、下載maven包，解壓二、配置環境變量，MAVEN_PATH=解壓路徑添加到path中三、測試 mvn -v 查看maven版本四、設置本地倉庫的路徑在co

kubernetes 環境搭建及基礎架構介紹及一個進銷存管理系統簡單搭建

kubernetes是一個全新的基於容器技術的分散式架構領先方案。它是谷歌十幾年來大規模應用容器技術的經驗積累和昇華的一個重要成果 kubernetes是一個完備的分散式系統支撐平臺。kubernetes具有完備的叢集管理能力，包括多層次的安全防護和准入機制，多租戶應用支撐能力，透明的服務註冊和

安卓學習筆記 -- （安裝環境） Android Studio安裝配置、環境搭建詳細步驟及基本使用 Android Studio和SDK官方開發工具下載 Android Studio教程從入門到精通 Android開發-之第一個程式：HelloWorld！

1、下載Android Studio安裝配置、環境搭建詳細步驟及基本使用 https://www.cnblogs.com/yanglh6-jyx/p/Android_AS_Configuration.html https://blog.csdn.net/k491022087/ar

Kafka訊息佇列介紹、環境搭建及應用：C#實現消費者-生產者訂閱

一：kafka介紹

1.1 術語介紹

1.2 基本特性

1.3 訊息格式

1.4 原理解析

二：環境搭建（windows）

2.1 安裝zookeeper

2.2 安裝kafka

三：基於.net的常用類庫

四：應用–生產者

五：應用–消費者

執行結果

常見資料問題處理

Kafka 視覺化除錯

Kafka訊息佇列介紹、環境搭建及應用：C#實現消費者-生產者訂閱

【Qt學習筆記之一】初識Qt、環境搭建及hello world的實現

SSM到Spring Boot從零開發校園商鋪平臺---1、環境搭建及測試

1、Vue介紹、環境搭建、項目運行

react介紹、環境搭建、demo運行實例

Locust環境搭建及應用

116.k8s介紹、k8s搭建一個應用（mysql+tomcat）

linux ELK（filebeat）環境搭建中加入kafka訊息佇列的詳細介紹（菜鳥新手級別）

訊息佇列-ActiveMQ學習筆記（一）-JMS介紹與環境搭建

Ubuntu下kafka集群環境搭建及測試

UI自動化測試簡介及Selenium工具的介紹和環境搭建

Maven環境搭建及常用命令、生命周期

kubernetes 環境搭建及基礎架構介紹及一個進銷存管理系統簡單搭建

安卓學習筆記 -- （安裝環境） Android Studio安裝配置、環境搭建詳細步驟及基本使用 Android Studio和SDK官方開發工具下載 Android Studio教程從入門到精通 Android開發-之第一個程式：HelloWorld！

Maven環境搭建及建立Web專案、部署

PHP訊息佇列實現及應用：訊息佇列概念介紹

springboot2.x簡單詳細教程--訊息佇列介紹及整合ActiveMQ （第十三章）

Spring1：Spring簡介、環境搭建、原始碼下載及匯入MyEclipse

Android Studio安裝配置、環境搭建詳細步驟及基本使用

[Kafka] Apache Kafka 簡介、叢集搭建及配置詳解

Kafka訊息佇列介紹、環境搭建及應用：C#實現消費者-生產者訂閱

一：kafka介紹

1.1 術語介紹

1.2 基本特性

1.3 訊息格式

1.4 原理解析

二：環境搭建（windows）

2.1 安裝zookeeper

2.2 安裝kafka

三：基於.net的常用類庫

四：應用–生產者

五：應用–消費者

執行結果

常見資料問題處理

Kafka 視覺化除錯

相關推薦