Storm部分：Storm Grouping -- 資料流分組（即資料分發策略）

阿新 • • 發佈：2019-01-21

1. Shuffle Grouping 隨機分組，隨機派發stream裡面的tuple，保證每個bolt task接收到的tuple數目大致相同。輪詢，平均分配

2. Fields Grouping 按欄位分組，比如，按"user-id"這個欄位來分組，那麼具有同樣"user-id"的 tuple 會被分到相同的Bolt裡的一個task，而不同的"user-id"則可能會被分配到不同的task。

3. All Grouping 廣播發送，對於每一個tuple，所有的bolts都會收到

4. Global Grouping 全域性分組，把tuple分配給task id最低的task 。

5. None Grouping 不分組，這個分組的意思是說stream不關心到底怎樣分組。目前這種分組和Shuffle grouping是一樣的效果。有一點不同的是storm會把使用none grouping的這個bolt放到這個bolt的訂閱者同一個執行緒裡面去執行（未來Storm如果可能的話會這樣設計）。

6. Direct Grouping 指向型分組，這是一種比較特別的分組方法，用這種分組意味著訊息（tuple）的傳送者指定由訊息接收者的哪個task處理這個訊息。只有被宣告為 Direct Stream 的訊息流可以宣告這種分組方法。而且這種訊息tuple必須使用 emitDirect 方法來發射。訊息處理者可以通過 TopologyContext 來獲取處理它的訊息的task的id (OutputCollector.emit方法也會返回task的id)

7. Local or shuffle grouping 本地或隨機分組。如果目標bolt有一個或者多個task與源bolt的task在同一個工作程序中，tuple將會被隨機發送給這些同進程中的tasks。否則，和普通的Shuffle Grouping行為一致 customGrouping 自定義，相當於mapreduce那裡自己去實現一個partition一樣。

Storm部分：Storm Grouping -- 資料流分組（即資料分發策略）

Storm部分：Storm Grouping -- 資料流分組（即資料分發策略）

Android 資料持久化技術（即資料儲存方式）

跟我學storm教程2-並行機制及資料流分組

Storm部分：程式碼模板【Java版純程式碼】

Storm框架：Storm整合springboot

storm筆記：storm基本概念

Strom資料流分組解析

scrapy詳細資料流走向（個人總結）

TCP/IP學習筆記(11) --TCP互動資料流，成塊資料流

TCP/IP協議--11 TCP 互動資料流、成塊資料流

UML資料流圖（帶作業）

TCP/IP學習筆記（11）-tcp互動資料流，成塊資料流

SparkStreaming部分：OutPutOperator類，SaveAsHadoopFile運算元（實際上底層呼叫textFileStream讀取的，跟前兩種有一些區別）【Java版純程式碼】

資料流圖-2(分層資料流圖)

資料科學個人筆記：推薦系統之推薦演算法（基於圖+隱語義）

資料視覺化 —— 資料流圖（Data Flow Diagram）

SparkStreaming部分：OutPutOperator類，SaveAsTextFile運算元（實際上底層呼叫textFileStream讀取的，呼叫dstream儲存的）【Java版純程式碼】

資料中介軟體：mysql主從Master+Slave資料同步實驗（雙機熱備）

Storm學習記錄（二、分發策略與架構）

題目：MySql資料查詢題目（學生和課程成績）

Storm部分：Storm Grouping -- 資料流分組（即資料分發策略）

相關推薦