1. 程式人生 > >HBase全網最佳學習資料匯總

HBase全網最佳學習資料匯總

十個 機構 cto 評價 pen 動態列 geohash 流行 Go

HBase全網最佳學習資料匯總

摘要: HBase這幾年在國內使用的越來越廣泛,在一定規模的企業中幾乎是必備存儲引擎,互聯網企業阿裏巴巴、百度、騰訊、京東、小米都有數千臺的HBase集群,中國電信的話單、中國人壽的保單都是存儲在HBase中。

前言

HBase這幾年在國內使用的越來越廣泛,在一定規模的企業中幾乎是必備存儲引擎,互聯網企業阿裏巴巴、京東、小米都有數千臺的HBase集群,中國電信的話單、中國人壽的保單都是存儲在HBase中。註意大公司有數十個數百個HBase集群,此點跟Hadoop集群很不相同。另外,數據需求,很多公司是mysql+hbase+hadoop(spark),滿足關系型數據庫需求,滿足大規模結構化存儲需求,滿足復雜分析的需求。如此流行的原因來源於很多方面,如:

  • 開源繁榮的生態:1. 任何公司倒閉了,開源的HBase還在 2.幾乎每家公司都可以去下載源碼,改進她,再反饋給社區,就如阿裏已經反饋了數百個patch了。加入的人越多,引擎就越好
  • 跟HADOOP深度結合:本就同根同源,在數據存儲在HBase後,如果想復雜分析,則非常方便
  • 高擴展、高容量、高性能、低成本、低延遲、稀疏寬表、動態列、TTL、多版本等最為關鍵,起源google論文,發揚社區及廣大互聯網公司,設計之初就是為存儲互聯網,後經過多年的改進升級,如今已經是結構化存儲的事實標準

以下資料會一直更新中......請大家關註!

書籍

最好買紙質書籍,集中時間看下

  • HBase權威指南(HBase: The Definitive Guide):理論多一些
  • HBase實戰:實踐多一些

總結性

  • HBase2.0: HBase2.0 :預計今年會發布,hbase2.0是革命性的版本
  • HBase Phoenix:Apache Phoenix與HBase:HBase之上SQL的過去,現在和未來
  • 社區hbase博客:https://blogs.apache.org/hbase/

方法論

  • 學術界關於HBase應用場景(物聯網/車聯網/交通/電力等)研究大全: HBase在互聯網領域有廣泛的應用,比如:互聯網的消息系統的存儲、訂單的存儲、搜索原材料的存儲、用戶畫像數據的存儲等。得益於HBase海量的存儲量及超高並發寫入讀取量。HBase在09年就開始在工業界大範圍使用,在學術界,也有非常多的高校、機構在研究HBase應用於不同的行業,本文主要梳理下這些資料(主要是中文資料,有一些是碩士論文期刊),這些很多都在工業界使用了。
  • HBase使用場景和成功案例 存儲互聯網的初心不變
  • 一種基於物聯網大數據的設備信息采集系統及方法:怎麽使用HBase、sparkStreaming、redis處理物聯網大數據
  • 一種基於HBase的智能電網時序大數據處理方方案:一種基於HBase的智能電網時序大數據處理方方案
  • HBase配合GeoHash算法支持經緯度:此文主要講GeoHash算法的
  • 基於HBase的海量GIS數據分布式處理實踐:設計了一種基於分布式數據庫HBase的GIS數據管理系統。系統優化了柵格數據的生成和存儲過程,將海量柵格數據直接寫入HBase存儲、索引。同時,針對矢量空間數據的存儲、索引與檢索,提出了一種新的rowkey設計,既考慮經緯度,又考慮空間數據類型和屬性,使得在按空間位置檢索矢量地理信息時,能通過HBase的rowkey迅速定位需要返回的數據。在HBase的集群環境上用真實GIS數據對上述方法進行了驗證,結果表明,提出的系統具有較高的海量數據存儲和檢索性能,實現了海量地理信息數據的高效存儲和實時高速檢索。
  • 基於HBase的金融時序數據存儲系統:金融類時序數據的存儲方案,寫的還是結合實際場景的。

各大公司的實踐

基本圍繞在用戶畫像、安全風控、訂單存儲、交通軌跡、物理網、監控、大數據中間存儲、搜索、推薦等方面:

  • 阿裏巴巴-大數據時代的結構化存儲HBase在阿裏的應用實踐:講述在阿裏巴巴集團的實踐,HBase在阿裏集團已經10000臺左右,主要在訂單、監控、風控、消息、大數據計算等領域使用
  • 阿裏巴巴搜索-Hbase在阿裏巴巴搜索中的完美應用實踐:講述在搜索場景下hbase的應用及相關的改進
  • 日均采集1200億數據點,騰訊千億級服務器監控數據存儲實踐:本文將從當前存儲架構存在的問題出發,介紹從嘗試使用 Opentsdb 到自行設計 Hbase 存儲方案來存儲 TMP 服務器海量監控數據的實踐歷程。
  • 滴滴-HBase在滴滴出行的應用場景和最佳實踐:統計結果、報表類數據、原始事實類數據、中間結果數據、線上系統的備份數據的一些應用
  • HBase在京東的實踐 :跟阿裏一樣,京東各個業務線使用了HBase,如:風控、訂單、商品評價等
  • 中國人壽基於HBase的企業級大數據平臺:使用一個大跨表存儲所有的保單,HBase寬表的實踐
  • HBase在Hulu的使用和實踐:用戶畫像、訂單存儲系統、日誌存儲系統的使用
  • Apache HBase at Netease:在報表、監控、日誌類業務、消息類業務、推薦類業務、風控類業務有所使用,另外講述了一些優化的點。
  • 10 Million Smart Meter Data with Apache HBase:講述Hitachi為什麽選擇hbase及在HBase方面的應用
  • G7:如何用雲計算鏈接30萬車輛--EMR&Hbase 在物聯網領域的實踐及解決方案 講述了怎麽使用spark及hbase來滿足物聯網的需求

HBase資料庫

  • HBase:https://pan.baidu.com/s/1jILzgns
  • 知乎HBase討論:https://www.zhihu.com/topic/19600820/hot
  • hbase中文社區:www.hbase.group
  • csdn HBase資料庫:http://lib.csdn.net/hbase/node/734

結尾

這些資料是筆者整理,以供有大規模結構化需求的用戶及HBase愛好者學習交流,以使用HBase更好的解決實際的問題。

交流群

如果大家對HBase有興趣,致力於使用HBase解決實際的問題,歡迎加入阿裏雲Hbase技術交流群交流.
歡迎加入阿裏雲雲HBase技術交流群
釘釘阿裏雲hbase交流群
技術分享圖片

聲明

以上資料來自互聯網,如果侵權,請聯系我刪除

HBase全網最佳學習資料匯總