Apache Kafka

Kakfa學習筆記(一)——概述

Kafka是一個分散式流處理平臺,一般用作分散式訊息中介軟體 架構 以訊息系統的角度來看,Kafka是基於釋出-訂閱模型,Producer主動發起push,將一條訊息推到Brok

你猜:為什麼Kafka不支援讀寫分離

在 Kafka 中,生產者寫入訊息、消費者讀取訊息的操作都是與 leader 副本進行互動的,從 而實現的是一種主寫主讀的生產消費模型。資料庫、Redis 等都具備主寫主讀的功能,與此同時還支援主寫從讀的功能,

EFK接入kafka訊息佇列

1 前言 在筆者最開始維護的日誌服務中,日質量較小,沒有接入kafka。隨著業務規模擴增,日質量不斷增長,接入到日誌服務的產品線不斷增多,遇到流量高峰,寫入到es的效能就會降低,cpu打滿,隨時都有叢集宕機

Kafka竟然不支援讀寫分離!今天才知道!

在 Kafka 中,生產者寫入訊息、消費者讀取訊息的操作都是與 leader 副本進行互動的,從 而實現的是一種主寫主讀的生產消費模型。資料庫、Redis 等都具備主寫主讀的功能,與此同時還支援主寫從讀的功能,

基於Log4Net簡單實現KafkaAppender

背景 基於之前基於Log4Net本地日誌服務簡單實現 實現本地日誌服務,但是隨著專案開發演進,本地日誌服務滿足不了需求,譬如在預釋出環境或者生產環境,不可能讓開發人員登入檢視本地日誌

Flink是如何儲存Offset的

Flink對Offset的管理,有兩種方式: 1.Checkpointing disabled 完全依賴於kafka自身的API 2.Checkpointing enabled

讀《Kafka權威指南》04 深入Kafka

叢集成員關係 Kafka 使用 Zookeeper 來維護叢集成員的資訊。每個 broker 都有一個唯一識別符號,這個識別符號可以在配置檔案裡指定,也可以自動生成。在 broker 啟動的時候,它通過建立

Kafka在專案實踐中的若干經驗分享

Kafka是一個分散式訊息佇列,它將資料分割槽儲存,並將每個分割槽儲存成多份以提高資料可靠性。Kafka是在大資料背景下產生的,用以應對海量資料的處理場景,具有高效能、良好的擴充套件性、資料永續性等特點。

基於Flume、Kafka技術實現新能源大資料中心資料採集

隨著近幾年新能源發電行業的迅猛發展,新能源大資料中心平臺建設也悄然興起。越來越多的新能源企業投入人力、物力和財力著手建設自己的大資料中心,旨在提升生產管理水平和發電經濟效益。大資料中心建設首先要解決的問題是大

Spark streaming消費Kafka的正確姿勢

前言 在遊戲專案中,需要對每天千萬級的遊戲評論資訊進行詞頻統計,在生產者一端,我們將資料按照每天的拉取時間存入了Kafka當中,而在消費者一端,我們利用了spark streaming從kafka中不斷拉取

1716052227.2801