1. 程式人生 > >【大資料技術】HBase基本知識介紹及典型案例分析

【大資料技術】HBase基本知識介紹及典型案例分析

  (1)分散式、多版本、面向列的開源資料庫

 

 

 (2)支援上億行、百萬列;

 

(3)強一致性、高擴充套件、高可用

Hbase是一個強一致性資料庫,不是“最終一致性”資料庫。

HBase資料讀寫,更新的資料是放在Memstore,只有當Memstore裡的資料達到閾值,或者時間達到閾值,就會flush到磁碟上,生成HFile,而一旦生成HFile就是不可改變的。

當某一個DataNode上生成一個HFile後,就會非同步更新到其他兩個DataNode上(假設為3副本),這3個HFile是一模一樣的。

PS:當客戶端提交刪除操作的時候,資料不是真正的刪除,只是做了一個刪除標記(delete marker,又稱母被標記),表明給定航已經被傷處了,在檢索過程中,這些刪除標記掩蓋了實際值,客戶端讀不到實際值。直到發生compaction的時候資料才會真正被刪除。

 

 

參考文件:

HBase基本知識介紹及典型案例分析

HBase強一致性詳解

淺談Hbase多版本儲存