1. 程式人生 > >索引原理-btree索引與hash索引的區別

索引原理-btree索引與hash索引的區別

基於 信息 一起 特殊性 hash算法 一個 即使 數據 就會

  btree索引與hash索引的區別,之前不清楚,mark一下。

  Hash索引結構的特殊性,其檢索效率非常高,索引的檢索可以一次定位,不像B-Tree索引需要從根節點到枝節點,最後才能訪問到頁節點這樣多次的IO訪問,所以Hash索引的查詢效率要遠高於B-Tree索引。

  可能很多人又有疑問了,既然Hash索引的效率要比B-Tree高很多,為什麽大家都不用Hash索引而還要使用B-Tree索引呢?任何事物都是有兩面性的,Hash索引也一樣,雖然Hash索引效率高,但是Hash索引本身由於其特殊性也帶來了很多限制和弊端,主要有以下這些:

  1、Hash索引僅僅能夠滿足“=”,“IN”和“<=>”查詢,不能使用範圍查詢。

  由於Hash索引比較的是進行Hash運算之後的Hash值,所以它只能用於等值的過濾,不能用於基於範圍的過濾,因為進過相應的Hash算法處理之後的Hash值的大小關系,並不能保證和Hash運算前完全一樣。

  2、Hash索引無法被用來避免數據的排序操作

   由於Hash索引中存放的是經過Hash計算之後的Hash值,而且Hash值的大小管理並不一定和Hash運算前的鍵值完全一樣,所以數據庫無法利用索引的數據來避免任何排序運算。

  3、Hash索引不能利用部分索引查詢

  對於組合索引,Hash索引在計算Hash值的時候是組合索引鍵合並後再一起計算Hashs值,而不是單獨計算Hash值,所以通過組合索引的前面一個或者幾個索引鍵進行查詢的時候,Hash索引也無法被利用。

  4、Hash索引在任何時候都不能避免表掃描

  前面已經知道,Hash索引是將索引鍵通過Hash運算之後,將Hash運算結果的Hash值和對應的行指針信息存放於一個Hash表中,由於不同索引鍵存在相同Hash值,所以即使取滿足某個Hash鍵值的數據的記錄條數,也無法從Hash索引中年直接完成查詢,還要通過訪問表中實際數據進行相應的比較,並得到相應的結果。

  5、Hash索引遇到大量Hash值相等的情況後性能不一定會比B-Tree索引高

  對於選擇性比較低的索引鍵,如果創建Hash索引,那麽將會存在大量記錄指針信息存於同一個Hash值相關聯。這樣要定位某一條記錄時就會非常麻煩,會浪費多次表數據的訪問,而造成整體性能低下。

索引原理-btree索引與hash索引的區別