1. 程式人生 > >Apache Pulsar:實時資料處理中訊息、計算和儲存的統一

Apache Pulsar:實時資料處理中訊息、計算和儲存的統一

本文來自於 QCon 北京2018全球開發者大會,作者翟佳,其畢業於中科院計算所,目前就職於一家下一代實時處理初創公司Streamlio,是Streamlio的核心創始成員之一。在此之前任職於EMC,是北京EMC實時處理平臺的技術負責人。主要從事實時計算和分散式儲存系統的相關開發,是開源專案Apache BookKeeper PMC Member和Committer,也在Apache Pulsar, Distributedlog等專案中持續貢獻程式碼。

實時資料處理在各個行業和領域中已經變得越來越關鍵。但是在實時資料棧中,Messaging,Computing和Storage三個部分的分離,給方案的實現帶來了高複雜性,低可維護性,低效率等問題。

本次演講將介紹Apache Pulsar,並展示Apache Pulsar怎樣從這三個方面,提供一個端到端的實時資料解決方案。

Messaging:Pulsar對pub/sub和queue兩種模式提供統一的支援,同時保證了一致性,高效能和易擴充套件性。

Computing:Pulsar內部的Pulsar-Functions提供了Stream-native的輕量級計算框架,保證了資料的即時流式處理。

Storage:Pulsar藉助Apache BookKeeper提供了以segment為中心的儲存架構,保證了儲存的效能,永續性和彈性。

Apache Pulsar 在2016年開源,是Streamlio,阿里巴巴,和滴滴出行等公司一同起草的全球訊息領域標準 OpenMessaging 的重要成員。希望通過這次分享,能夠為大家帶來對Apache Pulsar及其生態系統有更好的理解,和對pub/sub訊息系統,實時處理系統的更多

的認識。本文將主要介紹以下內容:

  • 瞭解實時處理的三部分的特點和需求;

  • 理解Apache Pulsar的特性和優勢。

本文 PPT 下載地址:(點選下面閱讀原文 即可獲取)

https://www.iteblog.com/Pulsar.pdf

http://cdn.iteblog.com/Pulsar.pdf

猜你喜歡

歡迎關注本公眾號:iteblog_hadoop:

0、回覆 電子書獲取 本站所有可下載的電子書

11、更多大資料文章歡迎訪問https://www.iteblog.com及本公眾號(iteblog_hadoop)12、Flink中文文件:http://flink.iteblog.com13、Carbondata 中文文件
http://carbondata.iteblog.com