kafka使用high api如何確保不丟失訊息，不重複傳送，訊息只讀取一次？

阿新 • • 發佈：2019-02-14

首先說明，Kafka 的設計就是 at-least-once 的

那麼，如何確保非極端環境下，Kafka 不丟資料，以及 Kafka 叢集儘可能穩定呢？

Producer 端設定 ack 為 all（或者說盡可能越多越好，但實際生產裡叢集例項過多，這樣設定會影響效能，因此根據具體情況來定），即確保所有 replication 都拿到資料的時候，send 方法才得以返回，以此來判斷資料是否傳送成功，那麼理論上來說，此時傳送成功的資料都不會丟失；
unclean.leader.election.enable 設定為 false（預設引數為 true），意思是，當存有你最新一條記錄的 replication 宕機的時候，Kafka 自己會選舉出一個主節點，如果預設允許還未同步你最新資料的 replication 所在的節點被選舉為主節點的話，你的資料將會丟失，因此這裡應該按需將引數調控為 false；

auto.offset.reset 引數設定為 earliest 避免出現 offset 丟失的時候，跳過需要消費的資料的情況，準確來說這裡並非丟失，即使因為引數配置的問題出現跳過的情況，也可以通過前置 offset 找回歷史訊息；
資料持久化的時間需要設定業務足夠接受的程度，我自己業務上使用就是能保證我的資料持久化時間為8個小時，超過8個小時的資料將被清空。

即使這樣配置了，Kafka 在極端環境下也並非確保絕對不丟資料！！！

既然是極端環境的探討，也就意味著能碰到的機率是非常低的，機率有多少我沒統計過，其中第二種情況在業務中時常遇到。

根據 Kafka 官方文件說明，Producer 傳送訊息持久化到 Kafka 得到 ack 的回饋這段過程中，基於效能的考慮，Kafka 並沒有及時把資料落盤的，而是將資料放到記憶體（FS cache）中，並週期性的落盤（從磁碟監控也可以看的出來），如果資料未及時落盤，如遇到伺服器斷電宕機，則資料丟失；

實際業務中，對資料可靠性較高的場景我建議手動提交 offset，自動提交 offset 會出現一個比較尷尬的情況，在業務應用被 kill 之前， A 訊息的offset 可能被提交了，然而 A 訊息在應用系統中尚未執行完畢，且狀態都儲存在了記憶體中，無法保留，此時重啟應用將不會繼續消費 A 訊息，而是神不知鬼不覺的跳過。當然這種情況也並非算得上丟失資料，重置 offset 一樣可以找的回來，但是手動提交 offset 可以避免這種詭異的情況發生。

Kafka HA 如何保障？
官方的意思是儘可能多節點叢集部署，節點數儘可能大於等於3，並且 replication 數量也是大於等於3，那麼當 replication 數量為 N 時，ack 設定為 all，這種情況下，就能確保 N-1臺機子宕機的時候，資料仍能保持不丟。

另外補充，既然是at-least-once，肯定會出現重複消費的情況，這個不難解決，Consumer 保持無狀態和冪等性就可以了。

kafka使用high api如何確保不丟失訊息，不重複傳送，訊息只讀取一次

首先說明，Kafka 的設計就是 at-least-once 的那麼，如何確保非極端環境下，Kafka 不丟資料，以及 Kafka 叢集儘可能穩定呢？Producer 端設定 ack 為 all（或者說盡可能越多越好，但實際生產裡叢集例項過多，這樣設定會影響效能，因此根據具體情況來定），即確保所有 r

kafka使用high api如何確保不丟失訊息，不重複傳送，訊息只讀取一次？

首先說明，Kafka 的設計就是 at-least-once 的那麼，如何確保非極端環境下，Kafka 不丟資料，以及 Kafka 叢集儘可能穩定呢？Producer 端設定 ack 為 all（或者說盡可能越多越好，但實際生產裡叢集例項過多，這樣設定會影響效能，因此根據具體情況來定），即確保所有 repl

一個數組中，除了有兩個數字只出現一次外，其他數字都出現兩次，求出這兩個出現一次的數字

求出兩個只出現一次的數字首先，我們知道兩個相同的數字進行異或操作時為0，如果題目裡面只有一個數字出現一次的話，我們就可以直接對陣列中的所有數字進行異或操作，最後得到的數字就是單獨出現的那個數字，但

不想做架構師的程式設計師不是好碼農，擡高身價36招只取一招

工作了挺久，發現有個挺有意思的現象，從程式設計師、高階程式設計師，到現在掛著架構師、專家之類的頭銜，伴隨著技術和能力的提高，想不明白的事情反而越來越多了。文末有面試題以及架構資料，需要的可以去領取一、來自架構師對架構的解讀架構師是一個充滿挑戰的

爬取有驗證碼的網站，（爬之前最好看一下君子協定）robots.txt,以人人網為例，每爬100條資料需要驗證一次（需要自己購買一個驗證碼破解會員，不是很貴，我這裡選擇的是超級鷹），簡版

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/15 14:03 # @Author : zhangz # @File : day4_yanzhengma.py # @Software: Py

當日志文件中的時間與主機時間不同步時，怎麼監控每隔五分鐘檢測一次日誌檔案是否出自按某個關鍵字？

今有需求：需要監控每隔五分鐘檢測一次日誌檔案是否出自按某個關鍵字。利用過濾全部的日誌資訊雖然可以過濾出來關鍵字告警，但是修復後，依然還是會報警，存在侷限性，所以需要使用以下辦法來實現需求。本想迴圈獲取5分鐘內的時間戳，然後從日誌檔案中grep這個時間端的資訊，然後再獲取關鍵字，但是通過檢視日誌檔案發現時

標頭檔案裡面實現一個函式，在兩個cpp中包含，則重複定義，如果加上inline則不會報錯

為什麼類的定義應當寫在標頭檔案中,從而被多個原始檔包含？比如myclass.h定義了一個類myclass（只定義類，不定義成員函式）， file1.cpp裡#include "myclass.h"，編譯得到file1.obj； file2.cpp裡也#include "my

260. 只出現一次的數字 III（建立一個字典+一種我不會的思路）

參考：https://blog.csdn.net/wem603947175/article/details/82117675 這道題很簡單，用字典的方法做的，但是我的字典實現超過時間限制。對比如下：（學習(*^▽^*)） # 通過，優於我的字典存取 # class Solution(

劍指offer——（15）第一個只出現一次的字元 && 陣列中重複的數字 && 字元流中第一個不重複的字元

public class Solution { public int FirstNotRepeatingChar(String str) { if(str.length()<=0) return -1; char c[] = str.toC

vue寫法，抽獎訊息跑馬燈動畫（每N秒出現一次）

HTML程式碼：  <div class="lamp-count" id="lamp" v-cloak> <div class="lamp"> <ul :class="{marquee_left

資料庫併發問題及事物隔離級別問題：髒讀，不可重複讀，幻讀，第一類丟失更新，第二類丟失更新

來源：《spring 4 企業應用開發實戰》資料庫併發問題：髒讀，不可重複讀，幻讀，第一類丟失更新，第二類丟失更新一個數據庫，多個客戶端併發訪問資料庫。在資料庫中的相同資料可能被多個事物同時訪問，如果沒有采取必要的隔離措施，就會導致併發問題，破壞資料的完整性。這些問題可以歸結為5類：3類

MySQL事物的4種併發問題（髒讀，幻讀，不可重複度，丟失更新）

由於MySQL事物的隔離級別不同，可以造成一些併發問題：一、髒讀：事物A修改了資料表中的一個數據num，但是沒有提交，此時事物B讀取了num，事物A rollback ，num改變為原來的值，那麼事物B讀到的num即為髒資料。二、幻讀：事物A在用一個表，此時事

Powershell管理系列（四十）PowerShell查詢和解鎖AD賬號(改進後，只發一次郵件)

powershell管理系列（四十）powershell查詢和解鎖ad賬號(改進後只發一次郵件) -----提供AD\Exchange\Lync\Sharepoint\CRM\SC\O365等微軟產品實施及外包，QQ:185426445.電話18666943750需求：根據要求對集團AD域及下屬3個

一只青蛙一次可以跳上1級臺階，也可以跳上2級。求該青蛙跳上一個n級的臺階總共有多少種跳法。

就是回歸數列求和 AR 得出 for post 可能性 ... 斐波那契數列指的是這樣一個數列： 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233，377，610，987，1597，2584，4181，6765，1094

136 Single Number 數組中除一個數外其他數都出現兩次，找出只出現一次的數

時間 body 算法一次整數除了給定一個整數數組 pub leetcode 給定一個整數數組，除了某個元素外其余元素均出現兩次。請找出這個只出現一次的元素。備註：你的算法應該是一個線性時間復雜度。你可以不用額外空間來實現它嗎？詳見：https://leetcod

關於解決多次接收相同條件，如何只執行一次if條件語句的簡單問題

public class FacesSet { private static FacesSet instance = null; private Set<String> faceNames = new HashSet<String>();

劍指offer系列（十四）二叉樹的深度，平衡二叉樹，陣列中只出現一次的數字

二叉樹的深度題目描述輸入一棵二叉樹，求該樹的深度。從根結點到葉結點依次經過的結點（含根、葉結點）形成樹的一條路徑，最長路徑的長度為樹的深度。解題思路：利用遞迴實現。如果一棵樹只有一個結點，那麼它的深度為1。遞迴的時候無需判斷左右子樹是否存在，因為如果該節點為葉節點，它的左右

關於 C#呼叫C庫Dll，有回撥函式時，只執行一次回撥函式就直接掛掉的解決方法

錯誤直接當機，如下圖：錯誤原因回撥函式宣告原因，跟堆疊有關係

資料結構之排序篇——選擇排序 //交換第i下標與最小下標，只交換一次

首先在陣列的所有元素中找到一個最小的元素，將該元素與陣列的第一個元素進行交換，這樣交換之後，陣列的第一個元素就變成了陣列元素中的最小值，再在除第一個元素外的其它陣列元素中，尋找最小的陣列元素，將這個第二小的陣列元素與陣列

ETM“黃金礦工”火爆來襲，你和大富翁之間只差一臺礦機了！

最近幣圈涼涼，主流數字貨幣大跌。資料顯示，比特幣從2018年初的兩萬美元，跌至 6200 美元附近。跌幅已超60%！幣圈熊市帶來的損失可謂慘重，礦工們更是哀嚎一片。幣價暴跌，First blood!電費越來越貴，Double kill !挖礦難度達歷史之最，Tri

kafka使用high api如何確保不丟失訊息，不重複傳送，訊息只讀取一次？

相關推薦