1. 程式人生 > >Apache Flink-資料流之上的有狀態的計算

Apache Flink-資料流之上的有狀態的計算

官網給出的Flink應用場景圖:

1.狀態計算。

2.從上圖看出的應用場景有?

-----事件驅動式的流處理

-----ETL管道

-----資料分析

3.一般性架構

從架構上來說與一般的流式架構沒有太大的不同,任務排程和資源管理可以放在我們熟悉的yarn上進行,flink的特點如下:

所有流式應用場景:事件驅動應用程式,流和批處理分析,資料管道和ETL

正確性保證:"正好一次"狀態的一致性,事件-時間處理,複雜的延遲資料處理

多層級的API支援:流式和批處理上的SQL,資料流API和資料集API,處理函式(時間和狀態)

操作重點:靈活部署,高可用性設定,儲存點

擴充套件到任何使用者場景:橫向擴充套件的架構,支援超大狀態的計算,增量的檢查點

優秀的效能:低延遲,高吞吐量,記憶體計算