1. 程式人生 > >Spark Streaming實時流處理筆記(2)—— 實時處理介紹

Spark Streaming實時流處理筆記(2)—— 實時處理介紹

1 實時和離線計算對比

1.1 資料來源

  • 離線:HDFS 歷史資料,資料量較大
  • 實時:訊息佇列(Kafka)

1.2 處理過程

  • 離線:Mapreduce
  • 實時:Spark(DStream/SS)

1.3 處理速度

  • 離線:慢
  • 實時:快速

1.4 程序

  • 離線:啟動,銷燬
  • 實時:7x24小時

2 實時流處理框架

  • Apache Storm
  • Apache Spark Streaming
  • IBM Stream
  • Yahoo! S4
  • LinkedIn Kafka
    在這裡插入圖片描述