1. 程式人生 > >HBase+Spark技術雙週刊第1期

HBase+Spark技術雙週刊第1期

400083221_meitu_1

精彩直播

HBase多模式
HBase多模式,包括 分析層:支援複雜分析、運算元下推;多模式層:提供各種模型轉換,貼切業務;索引引擎:提供索引支援,基於 Lucene ;儲存引擎:提供 KV 支援,基於LSM;分散式檔案層:保障低成本、與上層分離、共享降低成本。本次直播,阿里雲資料架構師明惠就為大家分享HBase多模式。

HBase核心及能力
HBase核心及能力包括:HBase的特性與生態:自動分割槽、LSM Tree、儲存計算分離、HBase生態;全新的HBase2.0版本新功能:小物件儲存MOB、讀寫鏈路Off-heap 、Region Replica 、In Memory Compaction 、Assignment MangerV2。在本次直播中,阿里巴巴技術專家正研就將為大家分享HBase核心及能力。

中國HBase技術社群第八屆MeetUp(南京站) ——HBase應用實踐專場 【培訓視訊及資料下載】
2018年11月17號,由中國HBase技術社群、DataFun社群聯合氪空間主辦的中國第八屆HBase Meetup將來到南京,屆時來自阿里雲、畢馬威、蘇寧等公司HBase的專家們,將為大家分享HBase的應用實踐。

Spark介紹及Spark多資料來源分析
開源大資料處理首選Spark,Spark引擎助力資料構架升級,大資料構架分為多種系統,如:流式處理系統、離線分析系統、演算法分析系統、互動式分析系統,通過阿里多模型資料庫專家沐遠的講解學習Spark並解決各種業務問題。

技術分享

HBase 在人工智慧場景的使用
近幾年來,人工智慧逐漸火熱起來,特別是和大資料一起結合使用。人工智慧的主要場景又包括影象能力、語音能力、自然語言處理能力和使用者畫像能力等等。這些場景我們都需要處理海量的資料,處理完的資料一般都需要儲存起來,這些資料的特點主要有如下幾點:大、稀疏、列動態變化。

HBase2.0重新定義小物件實時存取
小物件,特別指1K~10MB範圍的資料,比如圖片,短視訊,文件等廣泛的存在於人工智慧,醫療,教育,生活分享,電子商務等領域。HBase 2.0在MOB技術的加持下重新定義小物件實時存取,具有低延遲,讀寫強一致,檢索能力強,水平易擴充套件等關鍵能力。本文將以一條SQL展開小物件實時存取的方案演進,介紹不同架構的優缺點。然後提供人工智慧和醫療方面兩個採用HBase2.0的案例分析。最後總結小物件實時存取的最佳實踐。

消滅毛刺!HBase2.0全鏈路offheap效果拔群
阿里雲HBase2.0版本是基於社群2018年釋出的HBase2.0.0版本開發的全新版本。在社群HBase2.0.0版本基礎上,做了大量的改進和優化,吸收了眾多阿里內部成功經驗,比社群HBase版本具有更好的穩定性和效能,同時具備了HBase2.0提供的全新能力。HBase2.0提供的新功能介紹可以參照這篇文章。如果想要申請使用全新的HBase2.0版本,可以在此連結申請試用。

技術社群


【HBase生態+Spark社群大群】


群福利:群內每週進行群直播技術分享及問答


加入方式1:


點選link申請加入 https://dwz.cn/Fvqv066s


加入方式2:


HBase_Spark_