1. 程式人生 > >HashMap原始碼解析(初始化及put方法)

HashMap原始碼解析(初始化及put方法)

Map初始化及put過程:

首先通過預設的構造方法在堆記憶體中開闢一塊地址。並指定預設負載因子。
HashMap底層是一個數組+連結串列的結構。即一個線性陣列結構,Map中有一個內部Entry介面,HashMap在自己的靜態內部類Node中實現了它。有三個屬性key/value/next。即鍵值和下一指向。
當呼叫map的put方法時,呼叫hashmap的getNode方法,它返回一個Node節點。

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

再往下看,如果key不為空,通過key算出雜湊值,並賦給h,h再與右移16位的h異或。這種操作是為了加大hashcode低位的隨機性。雜湊值是一個int型別的16進位制數,共32位。在底層需要通過該雜湊值算出所在陣列下標,以確定儲存位置。但Hashmap預設容量16,32位雜湊值太大,不能直接拿來計算,因此要先對陣列長度取模,得到餘數,再用於計算下標。取模還是通過一個indexFor函式實現的,它將雜湊值和陣列長度做與。高位清空,保留低位,如果陣列長度還是取16的話,那取模之後只保留4位了。但如果只取最後幾位,雜湊碰撞可能很嚴重,且如果雜湊本身做的不好,分佈上成等差數列,會產生規律性。這是就通過下面的擾動函式解決問題。先右移16位,在與自身異或。混合原始雜湊碼的高位和低位,以此來加大低位的隨機性。
而且這一步在jdk1.7是做了4次擾動,jdk1.8簡化為1次,一次就夠用了,畢竟邊際遞減效應。
這裡寫圖片描述


這部分的返回值即擾動後的雜湊值。

static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

外層putValue方法,當Node陣列為空/長度為0時,呼叫resize函式,進行如下操作:
當放入第一個元素時,出發resize函式的newCap =DEFAULT_INITIAL_CAPACITY。即當陣列為空時,以預設容量16構造一個數組。

final V putVal(int hash, K key, V value, boolean
onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null);

然後繼續執行下面的語句,有個判斷,即上面所說的,將雜湊值和陣列長度做與,算出陣列下標。這個算出來的一定在0到n-1之間。然後將其賦值,把Node放進該陣列位置中。
最後放進去是這個樣子,所謂的線性陣列。
這裡寫圖片描述
但也可能出現數組下標衝突的情況。緊接著上面putVal的程式碼。

else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

For迴圈裡有一行p.next = newNode(hash, key, value, null);
也就是說new一個新的Node物件並把當前Node的next引用指向該物件,也就是說原來該位置上只有一個元素物件,現在轉成了單向連結串列。
下面還有兩行
if (binCount >= TREEIFY_THRESHOLD - 1) //當binCount>=TREEIFY_THRESHOLD-1
treeifyBin(tab, hash);
當連結串列長度到8時,將連結串列轉化為紅黑樹來處理。果然追根溯源都到資料結構了。
在JDK1.7及以前的版本中,HashMap裡是沒有紅黑樹的實現的,在JDK1.8中加入了紅黑樹是為了防止雜湊表碰撞攻擊,當連結串列鏈長度為8時,及時轉成紅黑樹,提高map的效率。
這裡寫圖片描述
1.從底層陣列取值,算出陣列位置,如果該位置為空,直接把node插進去
2.如果該位置不為空,判斷key是否重複了,如果重複,就替換掉老的node
3.如果該位置既不是空,又沒重複,判斷一下是否是紅黑樹
4.如果該位置既不是空,又沒重複,又不是紅黑樹,那必然是連結串列。把node放下一鏈上。再看一下連結串列長度是否大於8
,如果大於8,轉成紅黑樹。4下面的和2一樣。在連結串列上判斷是否重複了,重複的話就把該位置的連結串列值替換掉
5.如果e不為空,執行替換操作
解決雜湊衝突有兩種方法:
鏈地址法
開放地址法
HashMap採用了鏈地址法,即在衝突的陣列位置上加連結串列
總結:
這裡寫圖片描述
HashMap的最底層是陣列來實現的,數組裡的元素可能為null,也有可能是單個物件,還有可能是單向連結串列或是紅黑樹。
文中的resize在底層陣列為null的時候會初始化一個數組,不為null的情況下會去擴容底層陣列,並會重排底層數組裡的元素。
知道hashmap的put實現,也就能針對性的做一些效能優化,比如用map做一個本地快取,如果沒指定出事容量,預設16,乘以負載因子後該map的臨界容量為12,想要往這個map裡放600個key,這個map就需要擴容六次,這個過程拋棄以前的線性陣列,new一個新的線性陣列,容量為其二倍,而且原有鍵值需要進行重hash,很浪費效能。反之,如果初始容量過大,雜湊程度過高,會減慢檢索速度。所以要指定合適的初始容量,