Apache Pulsar:實時資料處理中訊息、計算和儲存的統一
本文來自於 QCon 北京2018全球開發者大會,作者翟佳,其畢業於中科院計算所,目前就職於一家下一代實時處理初創公司Streamlio,是Streamlio的核心創始成員之一。在此之前任職於EMC,是北京EMC實時處理平臺的技術負責人。主要從事實時計算和分散式儲存系統的相關開發,是開源專案Apache BookKeeper PMC Member和Committer,也在Apache Pulsar, Distributedlog等專案中持續貢獻程式碼。
實時資料處理在各個行業和領域中已經變得越來越關鍵。但是在實時資料棧中,Messaging,Computing和Storage三個部分的分離,給方案的實現帶來了高複雜性,低可維護性,低效率等問題。
本次演講將介紹Apache Pulsar,並展示Apache Pulsar怎樣從這三個方面,提供一個端到端的實時資料解決方案。
Messaging:Pulsar對pub/sub和queue兩種模式提供統一的支援,同時保證了一致性,高效能和易擴充套件性。
Computing:Pulsar內部的Pulsar-Functions提供了Stream-native的輕量級計算框架,保證了資料的即時流式處理。
Storage:Pulsar藉助Apache BookKeeper提供了以segment為中心的儲存架構,保證了儲存的效能,永續性和彈性。
Apache Pulsar 在2016年開源,是Streamlio,阿里巴巴,和滴滴出行等公司一同起草的全球訊息領域標準 OpenMessaging 的重要成員。希望通過這次分享,能夠為大家帶來對Apache Pulsar及其生態系統有更好的理解,和對pub/sub訊息系統,實時處理系統的更多
瞭解實時處理的三部分的特點和需求;
理解Apache Pulsar的特性和優勢。
本文 PPT 下載地址:(點選下面閱讀原文 即可獲取)
https://www.iteblog.com/Pulsar.pdf
http://cdn.iteblog.com/Pulsar.pdf
猜你喜歡歡迎關注本公眾號:iteblog_hadoop:
0、回覆 電子書獲取 本站所有可下載的電子書
11、更多大資料文章歡迎訪問https://www.iteblog.com及本公眾號(iteblog_hadoop)12、Flink中文文件:http://flink.iteblog.com13、Carbondata 中文文件