1. 程式人生 > >Spark Streaming的工作機制

Spark Streaming的工作機制

系統 lan park 儀表 red 進行 工作 數據 現場

1. Spark Streaming的工作機制

Spark Streaming 是Spark核心API的一個擴展,可以實現高吞吐量的、具備容錯機制的實時流數據的處理。

支持從多種數據源獲取數據,包括Kafk、Flume、Twitter、ZeroMQ、Kinesis 以及TCP sockets,

從數據源獲取數據之後,可以使用諸如map、reduce、join和window等高級函數進行復雜算法的處理。

最後還可以將處理結果存儲到文件系統,數據庫和現場儀表盤。

技術分享圖片

2.編寫Spark Streaming程序的基本步驟:

技術分享圖片

技術分享圖片

技術分享圖片

Spark Streaming的工作機制