1. 程式人生 > >大資料專案效能優化實戰

大資料專案效能優化實戰

眾所周知,kafka partition 和消費者的關係是一個 partition 只能由一個消費者進行消費,而一個消費者可以消費多個 partition。鑑於目標是確認效能問題點,便將單執行緒版本改為 8 執行緒,每個執行緒處理一個固定 partition 的資料。然並卵,修改後的版本效能並沒有提升,果然事情不會這麼簡單~轉而詢問研發得知由於專案週期緊,並未對 snappy 的效能進行過測試。好吧,測試走起。在測試環境中進行基準測試,按照原始碼中 2000 條每次批量寫入的方式,發現單執行緒寫入每次的耗時約 150-200ms。所以保守估計可以支撐 8000/s。如此看來 snappy 也並未達到瓶頸。這一眼就能看穿的資料流,還能靈異事件了不成?