HashMap、LinkedHashMap、HashSet、LinkedHashSet 原理解析及關系梳理
本文以jdk源碼為線索學習幾種數據類型實現機制。
【HashMap數據機制】
HashMap提供了key、value存儲機制。
HashMap是LinkedHashMap的基類,其內部維護一個Node數組用來存儲數據:
transient Node<K,V>[] table;
為了解決hash沖突,每個節點存儲鏈表或者紅黑樹。當鏈表長度小於閾值8時,使用鏈表存儲;當長度達到閾值8時,將鏈表轉換為紅黑樹提升讀寫效率:
if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); }
A. put
public V put(K key, V value);
put數據時,首先依據key計算hash值,與數組尺寸做與運算,計算存儲數據在數組中的位置。
若該位置沒有數據(未發生hash沖突),直接依據hash值、key、value構造Node存入該位置:
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
當存在沖突時,遍歷鏈表/紅黑樹查找當前key是否存在。若key已經存在,則替代舊的value:
V oldValue = e.value; e.value = value; afterNodeAccess(e); return oldValue;
否則,將新的數據存入鏈表/紅黑樹:
插入鏈表:
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
插入紅黑樹:
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
在插入數據之後,執行回調方法:
afterNodeInsertion(evict);
當數據數量達到一定閾值時,resize()方法將被執行,對數組進行擴容。
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab;
B. remove
public V remove(Object key);
執行remove方法時,將首先依據要移除key的hash值定位在數組中的位置,
之後依據Node類型是TreeNode或鏈表對key進行查找。
當匹配上時,將node從鏈表或tree中移除,並將其value作為remove方法返回值。
在remove之後,調用回調方法:
afterNodeRemoval(node);
【linkedHashMap】
為了解決hashMap無序的問題,引入了有序存儲key、value的數據結構LinkedHashMap。
linkedHashMap以HashMap為基類,提供了記錄插入key、value順序的功能,讀取時將按序輸出。
記錄的節點以雙向鏈表的形式存儲:
transient LinkedHashMap.Entry<K,V> head;
transient LinkedHashMap.Entry<K,V> tail;
A. put
基類HashMap中當插入數據時,構造新節點時執行newNode方法。
LinkedHashMap重寫了newNode方法:
Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
LinkedHashMap.Entry<K,V> p =
new LinkedHashMap.Entry<K,V>(hash, key, value, e);
linkNodeLast(p);
return p;
}
每一個put的key、value被構造成雙向鏈表節點p,最終被接在tail節點的後面,成為新的tail節點:
LinkedHashMap.Entry<K,V> last = tail;
tail = p;
p.before = last;
last.after = p;
若put之前存在相同key的舊值,那麽就需要將舊值移除。
在插入完成之後,HashMap中會調用afterNodeInsertion方法,LinkedHashMap中實現此模板方法,將雙向鏈表中舊的節點移除。
B. remove
基類HashMap中當remove被調用,將相應key的節點移除後,回調方法afterNodeRemoval將被調用。
LinkedHashMap重寫了此方法,將相應key的節點從雙向鏈表中移除。
C. 讀取
LinkedHashMap內部的叠代器iterator以雙向鏈表head為起點遍歷輸出,從而實現有序輸出的屬性。
【HashSet】
HashSet實現了Set接口,存儲一組不重復的元素。
為了實現不重復的功能,其內部使用HashMap存儲數據,利用其key的唯一性:
public HashSet() {
map = new HashMap<>();
}
執行add元素時,
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
執行remove移除元素時,
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
遍歷元素時,直接使用HashMap的KeySet():
public Iterator<E> iterator() {
return map.keySet().iterator();
}
由於HashMap內部數據依據hash值在數組中存儲,因此HashSet的iterator也是無序的。
【LinkedHashSet】
為了解決HashSet無序存儲的問題,引入了LinkedHashSet。
其內部利用了LinkedHashMap有序的特性:
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
其叠代器返回LinkedHashMap的KeySet,從而實現有序輸出。
HashMap、LinkedHashMap、HashSet、LinkedHashSet 原理解析及關系梳理