1. 程式人生 > >大資料和雲端計算技術週報(第0期)

大資料和雲端計算技術週報(第0期)

寫在第0期週報

Q1:為什麼要搞一個週報:

A1:受眾多社群日報、週報的啟發(如灣區日報,ES日報等等),所以大資料和雲端計算技術社群經過眾多討論,也決定搞一個週報。目的很簡單,營造分享的氣氛,同時參與的同學能從中學到東西。

Q2:為什麼是第0期,不是從1開始嗎?

A2:程式設計師寫程式碼不是上來就int i=0嗎,從0開始也挺好。

Q3:準備搞多久?

A3:能堅持多久算多,怎麼樣也應該半年以上沒問題。我們現在已經有8位編輯了(分別是:劉濤、薛述強、劉彬、劉超、程鵬、董言、呂西金、朱潔),希望更多有興趣的同學加入我們。

Q4:想加入這個活動的,怎麼加入?

A4:微信聯絡群主就可以了,長期堅持有驚喜。:)

以下是正文,限於眾編輯水平有限,不保證大家都喜歡。

1HBase協處理器

HBase雖然能夠通過MapReuduce對它表中的資料進行分散式計算,但是某些簡單的相加和聚合操作,比如求和與計數,要是能夠把它們放到服務端直接計算,便可省去巨大的通訊開銷,從而直接提升掃描效能。官方對協處理器的介紹如下:

https://blogs.apache.org/hbase/entry/coprocessor_introduction

HBase提供以下三種方法來呼叫協處理器提供的服務,如何部署、執行以及除錯,這篇文章具有很好的參考價值。

https://www.ibm.com/developerworks/cn/opensource/os-cn-hbase-coprocessor2/index.html

HBase協處理可以應用於二級索引,在插入資料之前通過協處理器來實現索引欄位在索引表的儲存,刪除資料之前通過協處理刪除索引表的索引,該方案來自華為貢獻於社群。

https://github.com/Huawei-Hadoop/hindex

2Flink

Apache Flink 是一個面向分散式資料流處理和批量資料處理的開源計算平臺,它能夠基於同一個Flink執行時(Flink Runtime),提供支援流處理和批處理兩種型別應用的功能。

3Apache Kylin

Apache Kylin是一個開源的分散式分析引擎,提供Hadoop之上的SQL查詢介面及多維分析(OLAP)能力以支援超大規模資料。本文將從kylin的架構設計與原理入手,介紹kylin的核心模組與架構體系


4JAVA RPC

如果公司對效率有極高的要求建議使用 Dubbo,相對比 RPC 的效率會比 HTTP 高很多;如果團隊不想對技術架構做大的改造建議使用 Dubbo,Dubbo 僅僅需要少量的修改就可以融入到內部系統的架構中。但如果技術團隊喜歡挑戰新技術,建議選擇 Spring Cloud,Spring Cloud 架構體系有有趣很酷的技術。

5應用架構

今年剛上線就成功經受雙11網購狂潮的網聯平臺,是國內金融資訊化建設的又一重要系統,將對包括支付寶、微信支付在內的整個支付體系產生關鍵影響,其分散式架構應用了諸多最新的雲端計算和大資料技術,值得深入研究。

猜你喜歡

加入技術討論群

為了方便大家相互交流學習,建立了一個公眾號同名微信群:《大資料和雲端計算技術交流群》,人數已經1000+,歡迎大家加下面我的微信,我拉大家進群,自由交流。

0?wx_fmt=png