1. 程式人生 > >java——HashMap的實現原理,自己實現簡單的HashMap

java——HashMap的實現原理,自己實現簡單的HashMap

資料結構中有陣列和連結串列來實現對資料的儲存,但是陣列儲存區間是連續的,定址容易,插入和刪除困難;而連結串列的空間是離散的,因此定址困難,插入和刪除容易。

因此,綜合了二者的優勢,我們可以設計一種資料結構——雜湊表(hash table),它定址、插入和刪除都很方便。在java中,雜湊表的實現主要就是HashMap了,可以說HashMap是java開發中使用最多的類之一吧。

HashMap的底層其實就是連結串列的陣列,程式碼為

transient Entry[] table;

這裡的table其實就是一個連結串列的陣列,因為我們的資料是二元的,因此HashMap定義了一個內部的類Entry,它包含了key和value兩個屬性。這樣一個一維的線性陣列就可以儲存兩個值了。同時Entry是一個連結串列,因此還有一個Entry next屬性,它指向了下一個節點。

儲存put時:

首先計算出key的hash,然後用table[hash]得到那個連結串列,再遍歷這個連結串列,如果連結串列中有一個key和這個key是滿足equals的話,則將value替換掉;如果沒有的話,則插入到連結串列的尾部。

int h = hash(key);
Entry e = table[h];
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            //如果key在連結串列中已存在,則替換為新value
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

在get時,也是以同樣的方法得到那個連結串列Entry e;然後遍歷這個連結串列取出元素

for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;

HashMap對效能的優化:

HashMap對效能優化,主要是在於減少hash衝突(不同的key算出同樣的hash),因為hash衝突越多,從連結串列中需要的定址時間就越長。

1.通過計算hash值的方式減少hash衝突:

這個hash方法有效的減少了hash衝突:(具體我確實不懂!大家參考http://zhangshixi.iteye.com/blog/672697)

static int hash(int h) {  
    h ^= (h >>> 20) ^ (h >>> 12);  
    return h ^ (h >>> 7) ^ (h >>> 4);  
}  
static int indexFor(int h, int length) {  
    return h & (length-1);  
}

我自己寫了一個非常簡單計算hash值的方式,勉強能用:

Math.abs(o==null?0:o.hashCode()) % length

2.自動擴容

當HashMap中的元素越來越多的時候,hash衝突的機率也就越來越高,因為陣列的長度是固定的。因此,此時就需要對陣列進行擴容了。

當HashMap中的元素個數超過陣列大小*loadFactor(預設值0.75)時,就會進行陣列擴容。這時,需要建立一張新表,將原表的對映到新表中。

擴容時,遍歷每個元素,重新計算其hash值,然後加入新表中。

一般來說,擴容陣列的大小為原陣列大小的兩倍。而這是一個很耗效能的操作,因此,如果我們已經預知HashMap中元素的個數,那麼提前設定初始容量將大大提升其效能。

我將我的原始碼放到了github上,歡迎大家下載交流。

附上自己實現的效能測試結果,勉強能接受

這篇博文和程式碼肯定還有很多不足的地方,也請各位大神指出!或者fork我的程式碼並提出寶貴的建議,謝謝!