1. 程式人生 > >HBase 和 Hive 的比較

HBase 和 Hive 的比較

1、相同點

1、HBase 和 Hive 都是架構在 Hadoop 之上,用 HDFS 做底層的資料儲存,用 MapReduce 做資料計算

 

2、不同點

1、Hive 是建立在 Hadoop 之上為了降低 MapReduce 程式設計複雜度的 ETL 工具。 HBase 是為了彌補 Hadoop 對實時操作的缺陷

2、Hive 表是純邏輯表,因為 Hive 的本身並不能做資料儲存和計算,而是完全依賴 Hadoop HBase 是物理表,提供了一張超大的記憶體 Hash 表來儲存索引,方便查詢

3、Hive 是資料倉庫工具,需要全表掃描,就用 Hive,因為 Hive 是檔案儲存 HBase 是資料庫,需要索引訪問,則用 HBase,因為 HBase 是面向列的 NoSQL 資料庫

4、Hive 表中存入資料(檔案)時不做校驗,屬於讀模式儲存系統 HBase 表插入資料時,會和 RDBMS 一樣做 Schema 校驗,所以屬於寫模式儲存系統

5、Hive 不支援單行記錄操作,資料處理依靠 MapReduce,操作延時高 HBase 支援單行記錄的 CRUD,並且是實時處理,效率比 Hive 高得多