1. 程式人生 > >選擇阿里雲資料庫HBase版十大理由

選擇阿里雲資料庫HBase版十大理由

根據Gartner的預計,全球非關係型資料庫(NoSQL)在2020~2022預計保持在30%左右高速增長,遠高於資料庫整體市場。

阿里雲資料庫HBase版也是踏著技術發展的節奏,伴隨著NoSQL和大資料技術的興起和發展,從2010年開始研究和發展。時光荏苒,日月如梭,轉眼九年時間,在阿里雲上直接開放提供服務也有1年多時間,並在去年的12月份全新發布X-Pack,將單一的HBase演進到一個完整的資料處理平臺的能力。我們注意到還有很多同學和客戶不清楚HBase X-Pack是什麼,什麼場景下合適選擇HBase X-Pack。

首先我們先來看下HBase X-Pack的定位:

  • HBase X-Pack是基於HBase及HBase生態構建的 低成本一站式資料處理平臺。
  • HBase X-Pack支援:HBase API(包括RestServerThriftServer)、關係Phoenix SQL、時序OpenTSDB、全文Solr、時空GeoMesa、圖HGraph、分析Spark on HBase,是阿里雲首個支援多模式的分散式資料庫,且協議100%相容開源協議。
  • HBase X-Pack實現資料從處理、儲存到分析全流程閉環,讓客戶用最低成本實現一站式資料處理。

接下來一起來梳理一下阿里雲HBase X-Pack關鍵能力,一起看看選擇阿里雲HBase X-Pack的十個理由。

理由一:一體化資料處理平臺,提供一站式能力

企業數字化轉型時代,業務越來越複雜,需要一個平臺可以提供一站式處理能力。傳統大資料各個元件非常多,各個元件分層發展,給擴充套件性帶來非常大的便利,但同時也引入了非常高的技術門檻,雲HBase X-Pack通過整合Spark,Solr,HBase,時序,時空,圖等元件,打通各個元件之間的資料同步,通過資料工作臺提供統一一體化互動式的操作體驗,實現計算、儲存、分析、檢索、機器學習五位一體的一站式能力,極大的降低了使用門檻,輕鬆上手,同時提供全託管的服務,避免各種複雜的運維和技術坑。

雲HBase X-Pack詳細的能力可以訪問雲HBase的幫助,裡面有各個能力詳細的介紹:

理由二:深厚的技術積累

企業決策選擇雲服務,最核心的一個因素就是降低TCO,最看重的核心因素就是背後的技術力量,服務能力。

阿里雲HBase X-Pack經過9年的發展,積累強大的專家團隊,目前擁有國際認證7個committer,4個PMC,擁有國內獨一無二的技術實力。

我們擁有集團超過萬臺的服務經驗,對各種異常場景,資料可靠性,可用性,效能,資料遷移各個方面有全套的服務和工具。

理由三:獨家企業版本,以及最新2.0版本

阿里雲HBase提供的版本是經過、千錘百煉的企業版本,在穩定性和效能上遠勝於開源的版本,並且全球首家提供最新2.0版本。關於阿里雲HBase發展歷程,可以看這裡詳細介紹:

https://yq.aliyun.com/articles/601531。阿里雲HBase和開源版本的關鍵區別,可以檢視:
https://help.aliyun.com/document_detail/49502.html

理由四:開發效率最高的資料庫

Gartner在2017年資料庫廠商推薦報告中就明確指出多模是發展趨勢阿里雲新發布X-Pack更是將多模推上新高度,KV的基礎上,同時支援時序、時空、圖、文件等多種資料模型。

我們知道,大資料時代,業務多樣性是大資料的本質之一,強制使用單一模型只會降低生產效率,HBase X-Pack提供KV、SQL、時序、時空、圖豐富的多模多模能力,幫助客戶可以根據不同的業務選擇不同的資料處理模型,支援業務靈活選擇,從而實現最高效率的開發和生產。

理由五:做成本最低的資料庫

HBase誕生於Google的bigtable論文,天然是為了儲存海量網際網路資料而誕生,低成本能力是其天然的屬性。雲HBase X-Pack在繼承HBase自身能力的同時,為了給客戶節省成本做了很多努力。體現在核心,整體方案各個方面,主要有:

  • 雲HBase版本的核心是經過優化的,效能平均高出自建版本30%~300%:
    如果對效能有要求的場景,就可以節省更少的CPU資源,獲取更大的效果,具體可以參考https://yq.aliyun.com/articles/198654
  • 齊全的產品形態,滿足各種業務場景,提供最高性價比:
    HBase X-Pack支援單節點,叢集版本,跨可用區/跨地域雙叢集版本,滿足使用者從測試,生產環境,高可用各種使用環境,平衡能力和成本,提供高性價比的選擇,具體可以參考https://help.aliyun.com/document_detail/71538.html
  • 提供資料全生命週期管理功能,資料冷熱分離,儲存成本下降3.5倍:
    很多場景裡面,資料有冷熱的需求,我們提供不同的儲存介質,包括OSS,本地盤,雲盤,高效能雲盤,幫助客戶實現最佳的儲存成本,詳細的可以看下https://yq.aliyun.com/articles/646983
  • 客戶基於ECS自建,儲存選擇雲盤,hdfs副本數天然是3副本:
    HBase服務通過和雲盤深度整合2副本就可以同樣的效能和可靠性。在儲存上天然節省1/3,詳細的可以訪問https://yq.aliyun.com/articles/646983
  • 全託管服務,提供代維,99.9%的SLA:
    運維在日常資料庫工作中佔了很大的比重,而且資料庫的穩定性關係到整個系統,牽一髮和動全身,雲HBase X-Pack提供全託管的服務,給客戶節省運維費用,以及極大的避免故障帶來的損失。
  • 提供一體化的方案節省成本:
    雲HBase X-Pack通過把各個元件深度整合和融合,通過組合各個產品之間的能力,給很多場景帶來增效,解決了效能瓶頸的同時,帶來成本的下降。這裡舉2個典型的例子:
  1. 很多人工智慧,多媒體場景,線上教育裡面,大量圖片、小視訊檔案。傳統的使用方法都是存在OSS裡面,OSS天然併發和時延處理能力有限,同時讀寫都是要收費的,讀寫次數越多,費用越高,使用HBase X-Pack沒有這部分的費用,可以解決效能的瓶頸的同時,帶來綜合成本的降低。

  2. 碰到非結構化資料查詢的訴求時,大家一般會想起ES。ES適合文字查詢,入庫會比較差(一般就幾百條/S),查詢函式也有限。HBase X-Pack通過支援Solr完全補齊了文字查詢的能力。同時Phoneix+solr組合結合了HBase和搜尋的兩者的優勢,在吞吐和併發上有優勢。對SQL的易用性也有優勢。尤其是在新零售等場景,一張表中混雜結構化欄位和非結構化欄位,可以根據需求,自動建立索引,融合兩者的優勢。倒排膨脹率很高,入庫會極速下降。大部分客戶只是部分欄位有模糊查詢的需求,ES強制所有的用單一技術。Phoneix非常適合併發高的查詢,條件不多。搜尋技術補充了索引技術,適合各種條件。通過結合phoneix+solr成功平滑查詢和儲存效能,提高效能的同時,儲存成本也下降幾倍,非常適合結構化+非結構化混合的場景。

理由六:力爭做最好用的資料處理平臺

HBase主要提供線上查詢能力,沉澱下來的資料需要使用Spark來做複雜分析,HBase X-Pack中的Spark為了讓使用者更便捷的做資料處理,產品上面提供了以下能力:

1)資料工作臺:支援互動式、作業管理、工作流、資源管理、元資料管理,從測試、開發、上線一站式開發體驗
2)spark內建connector:一鍵關聯hbase、mongo、redis、rds等叢集,免去除錯的煩惱,更加便捷的分析其他資料庫的資料
3)支援多語言:可以選擇習慣的語言進行程式設計
4)可維護性:支援小版本升級、監控、報警,免去Spark叢集維護
5)離線數倉能力:一鍵歸檔線上庫rds、polardb、mongo、hbase、cassandra資料到Spark數倉
6)成本:叢集預設儲存為叢集版本HDFS,同時支援資料儲存在oss降成本

使用HBase X-Pack Spark能夠構建業界成熟的一體化資料處理平臺,支撐推薦、風控、離線數倉、實時處理及計算、大資料運營、日誌分析、去oracle複雜分析等業務場景:

理由七:資料可靠性作為重中之重

對大多數公司來說資料的安全性以及可靠性是非常重要的,如何保障資料的安全以及資料的可靠是大多數資料庫必須考慮的。2016 IDC的報告表示資料的備份(data-protection)和資料恢復(retention)是NoSQL的最基礎的需求之一,阿里雲NoSQL資料庫也一直把怎麼保障客戶的資料安全放在首位。
以雲HBase為例,傳統資料庫備份恢復的能力都是TB級別,在交易等場景下面是足夠的,但面向大資料場景就捉襟見肘了。雲HBase通過垂直整合高壓縮、核心級優化等能力,將備份恢復的量級成功推高百倍以上,做到 百TB級別甚至更高 ,讓客戶在大資料量場景下也無後顧之憂。
雲HBase支援全量(備份集)備份、全量(備份集)恢復、增量(實時)備份、增量(時間點)恢復完整備份恢復能力。

理由八:單叢集3個9高可用,雙叢集4個9高可用

HBase通過核心加固,一系列自動運維修復工具,單叢集可以提供3個9的可用性,為了滿足很多場景下面更高可用性的要求,雲HBase支援跨可用區或者跨地域雙叢集主備同步,可以讓多個HBase叢集保持同步關係。在一個叢集出現故障的時候,迅速地將業務切換至另外一個叢集從而避免故障。HBase主備之間資料的同步基於非同步鏈路實現,遵循最終一致性協議,典型的主備同步延遲在200ms左右。

理由九:大量場景驗證,久經考驗

阿里雲HBase從10年上線以來,在阿里集團內部久經考驗,超過12000臺伺服器,單叢集超過2000臺的規模應用。

雲HBase自發布以來,通過豐富的能力,優秀的全託管能力,全面超越同類產品的技術能力得到金融、社交、多媒體、新零售、車聯網網、製作業、政企等等多個行業,多上千個客戶的信賴,積累了大量的使用經驗。歡迎我們的新老客戶訪問首頁獲取更多的資訊:

理由十:提供不停機遷移服務,讓自建遷移無憂

客戶已經使用ECS自建服務,想使用雲HBase服務,最擔心的應該還是遷移過程中對業務的影響,技術團隊充分考慮這一點,提供免費的不停機遷移服務,對線上業務0影響,資料遷移一行不丟。當前業界有能力提供不提供不停機遷移HBase服務的僅此一家。

本文簡單梳理了阿里雲HBase X-Pack十大理由,希望能對大家理解雲HBase有一個幫助,另外也給您選型做一個充分的參考。當能我們還有很多改進的空間,我們還在成長的路上持續努力,也歡迎大家聯絡我們提出寶貴的意見,最後福利,歡迎使用雲HBase X-Pack版本,針對首次購買的使用者推出了雲資料庫HBase單節點獨享規格,歡迎大家申請試用:https://promotion.aliyun.com/ntms/act/hbasefree.html

作者:所在jason

原文連結

本文為雲棲社群原創內容,未經