本文概要

HashMap概述
HashMap資料結構
HashMap的原始碼解析

HashMap概述

在官方文件中是這樣描述的:

Hash table based implementation of the Map interface. This implementation provides all of the optional map operations, and permits null values and the null key. (The HashMap class is roughly equivalent to Hashtable, except that it is unsynchronized and permits nulls.) This class makes no guarantees as to the order of the map; in particular, it does not guarantee that the order will remain constant over time.

我們可以總結一下：

基於Map實現，也就是key-value形式去儲存
允許key為null，允許value為null
非同步，它不是執行緒安全的
沒有順序

HashMap資料結構

JDK7以及之前HashMap使用的是陣列+連結串列在這裡插入圖片描述

JDK8以後HashMap使用的是陣列+連結串列+紅黑樹（我們這篇文章主要講的是JDK8）

連結串列大於一定長度會轉換為紅黑樹，主要是為了提高操作效率

在這裡插入圖片描述

HashMap的原始碼解析

原始碼解析主要為以下幾個方面去分析

HashMap主要的成員變數
HashMap的建構函式
get()方法
put()方法
resize()擴容方法

HashMap主要的成員變數

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable {
 	/* ---------------- Fields -------------- */
	// 預設陣列初始化容量
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
	
	// 陣列最大容量
    static final int MAXIMUM_CAPACITY = 1 << 
 30;

  	// 預設的擴容因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

	// 當連結串列的長度大於等於這個值，會把連結串列轉為紅黑樹
    static final int TREEIFY_THRESHOLD = 8;

	// 當樹的長度小於這個值，把樹轉為連結串列
    static final int UNTREEIFY_THRESHOLD = 6;

	// 桶中結構轉化為紅黑樹對應的陣列的最小長度，如果當前陣列的長度（即table的長度）小於它，就不會將連結串列轉化為紅黑樹，而是用resize()代替
    static final int MIN_TREEIFY_CAPACITY = 64;

    // 儲存元素的陣列
    transient Node<K,V>[] table;

     // 儲存元素的集
    transient Set<Map.Entry<K,V>> entrySet;

     // 存放元素的總個數
    transient int size;

     // 更改結構的計數器(比如put()、remove()等對hashmap結構有改動的操作，那麼該數值都會+1)
    transient int modCount;

    // 擴容臨界值，當size > threshold。就會進入擴容
    int threshold;
    
     // 擴容因子
    final float loadFactor;
}

HashMap建構函式

    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }
    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

這裡總結兩點

建立HashMap物件，呼叫建構函式時，沒有初始化table陣列
如果呼叫了第三個建構函式（即傳入了initialCapacity初始化容量和擴容因子），會呼叫tableSizeFor()，雖然這時候會把值賦給擴容臨界值threshold，但是第一次put()，會進行resize()，然後初始化table陣列，這時候會把threshold當成table陣列的長度，所以暫時我們可以理解這個threshold就是容量，但是實際上它還是擴容臨界值，只不過第一次比較特殊。這裡會把initialCapacity轉換成大於initialCapacity的最靠近2次冪的那個數，比如說initialCapacity = 10，經過tableSizeFor(10)後，threshold = 16。因為16是2次冪的數，也是最靠近10的。

這裡需要說下tableSizeFor(initialCapacity)方法

	static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

下面用一個圖解釋下tableSizeFor(10) ：在這裡插入圖片描述

get()方法

    public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

    // 對key進行hash
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

這裡沒有直接使用key的hashCode，而是使key的hashCode高16位不變，低16位與高16位異或作為最終hash值。原因就是：如果直接使用key的hashCode作為hash很容易發生碰撞。比如n-1為15(0x1111)時，雜湊值真正生效的只是低4位，當新增的值hashCode為2、18、34這些以16位倍數的等差數列，就產生大量碰撞

    // get()實際上就是呼叫getNode()
    final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        /*	   
	     * 1、首先判斷table是否為空、table的長度是否大於0
	     * 2、hash & (n - 1)，取的這個hash在這個陣列的下標，類似於(hash % (n-1))，但是&效率更高
	     * 3、tab[hash & (n - 1)],獲取該陣列在該索引的的頭元素，
	     */
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            /*
             * 判斷該key是否為頭元素
             */             
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
             // 如果不相等，然後獲取頭元素的下一個元素
            if ((e = first.next) != null) {
           		// 判斷頭元素是否為紅黑樹節點
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                // 不是紅黑樹節點，那麼就是連結串列
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

整個get()方法，還是比較簡單，可以總結為幾點

hash = hash(key)，獲取key的hashcode，用於獲取在陣列中的下標
(n - 1) & hash，通過hashcode與陣列的長度進行&運算，獲取該hashcode在陣列中的下標。
first = tab[(n - 1) & hash]，獲取該下標的頭元素
first.hash == hash && ((k = first.key) == key || (key != null && key.equals(k)))，判斷該key是否為頭元素
因為可能會出現hash碰撞【即為不同的hashcode可能定位到同一個下標】，所以判斷該頭元素是為紅黑樹節點，還是連結串列，然後在節點中進行迴圈判斷。

put()方法

    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        /*
         * 我們說過建立HashMap物件，是不初始化table陣列的。
         * 所以第一次呼叫put()的時候。table陣列為空。
        */ 
        if ((tab = table) == null || (n = tab.length) == 0)
        	// 那麼呼叫resize()進行初始化table陣列
            n = (tab = resize()).length;
        //  通過hash定位在table陣列下的索引，判斷該索引是否存在元素
        if ((p = tab[i = (n - 1) & hash]) == null)
        	// 不存在元素，直接往該索引下插入一個Node元素
            tab[i] = newNode(hash, key, value, null);
        else {
        	// 說明該索引下存在頭元素
            Node<K,V> e; K k;
            // 判斷插入的key與頭元素的key是否相等
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                // 說明插入的key與頭元素的key相等，賦值給e變數
                e = p;
            else if (p instanceof TreeNode)
            	// 說明頭元素是紅黑樹節點
            	// 判斷樹中是否存在一個節點的key與插入的key相等，存在賦值給e，不存在，往紅黑樹節點插入節點，並且返回null
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
            	// 說明頭元素是連結串列中的一個節點
            	// 迴圈遍歷該連結串列
                for (int binCount = 0; ; ++binCount) {               	
                    if ((e = p.next) == null) {
                    	// 如果直到連結串列的尾節點，都沒有找到與該key相等的節點
                    	// 往該連結串列插入一個新的節點
                        p.next = newNode(hash, key, value, null);
                        // 判斷該連結串列的長度是否大於等於TREEIFY_THRESHOLD
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        	// 呼叫treeifyBin()，判斷是否需要把連結串列轉為紅黑樹
                            treeifyBin(tab, hash);
                        break;
                    }                    
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        // 找到了和該key相等的節點e，直接break跳出迴圈
                        break;
                    p = e;
                }
            }
            // 如果e不為空，說明該連結串列或者紅黑樹中存在與該key相等的節點
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                	// 把該節點的值替換成新的值
                    e.value = value;
                // 回撥方法，HashMap沒有實現，忽略
                afterNodeAccess(e);
                // 返回舊的值
                return oldValue;
            }
        }        
        ++modCount;
        // size+1，並且判斷大小是否大於擴容閾值
        if (++size > threshold)
        	// 進行擴容
            resize();
        // 回撥方法，HashMap沒有實現，忽略
        afterNodeInsertion(evict);
        return null;
    }

我們看下TreeNode.putTreeVa()，往紅黑樹裡新增節點

	final TreeNode<K,V> putTreeVal(HashMap<K,V> map, Node<K,V>[] tab,
                                       int h, K k, V v) {
            Class<?> kc = null;
            boolean searched = false;
            // 獲取樹的根節點
            TreeNode<K,V> root = (parent != null) ? root() : this;
            // 遍歷樹
            for (TreeNode<K,V> p = root;;) {
                int dir, ph; K pk;
                // 如果p的hash大於傳入的hash
                if ((ph = p.hash) > h)
                	// 把-1賦值給dir，代表左邊查詢樹
                    dir = -1;
                // 如果p的hash小於傳入的hash
                else if (ph < h)
                	// 把-1傳遞給dir，代表右邊查詢樹
                    dir = 1;
                // 如果傳入的hash和p.hash相等，而且p.key 等於傳進來的key，那麼直接返回p
                else if ((pk = p.key) == k || (k != null && k.equals(pk)))
                    return p;
                // 如果k所屬的類沒有實現Comparable介面 或者 k和p節點的key相等
                else if ((kc == null &&
                          (kc = comparableClassFor(k)) == null) ||
                         (dir = compareComparables(kc, k, pk)) == 0) {
                    // 如果k所屬的類沒有實現Comparable介面 或者 k和p節點的key相等
                    if (!searched) {
                        TreeNode<K,V> q, ch;
                        searched = true;
                        if (((ch = p.left) != null &&
                             (q = ch.find(h, k, kc)) != null) ||
                            ((ch = p.right) != null &&
                             (q = ch.find(h, k, kc)) != null))
                            return q;
                    }
                     // 從p節點的左節點和右節點分別呼叫find方法進行查詢, 如果查詢到目標節點則返回
                    dir = tieBreakOrder(k, pk);
                }

                TreeNode<K,V> xp = p;
                // 根據dir的值，獲取p的左節點或者右節點，判斷獲取的節點是否為空
                if ((p = (dir <= 0) ? p.left : p.right) == null) {
                	// 如果獲取的節點為空，那麼則需要往樹裡插入一個新節點
                    Node<K,V> xpn = xp.next;
                    // 建立一個新Node節點
                    TreeNode<K,V> x = map.newTreeNode(h, k, v, xpn);
                    // 如果dir小於0
                    if (dir <= 0)
                    	// 插入左節點
                        xp.left = x;
                    else
                    	// 如果dir大於0
                    	// 插入右節點
                        xp.right = x;
                    // 這裡進行調整指標
                    xp.next = x;
                    x.parent = x.prev = xp;
                    if (xpn != null)
                        ((TreeNode<K,V>)xpn).prev = x;
                    // 插入新節點後可能會破壞紅黑樹結構，所以需要呼叫balanceInsertion(root, x)進行修復紅黑樹結構
                    moveRootToFront(tab, balanceInsertion(root, x));
                    return null;
                }
            }
        }

treeifyBin()，判斷是否需要把連結串列轉為紅黑樹

 final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        // MIN_TREEIFY_CAPACITY = 64
        // 判斷table的長度是否小於MIN_TREEIFY_CAPACITY 
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
       		// 呼叫 resize()進行擴容
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {        	
            TreeNode<K,V> hd = null, tl = null;
            // 建立一條以TreeNode為節點的連結串列，方便以後紅黑樹轉為連結串列
            do {                        	
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
            	// 把TreeNode的連結串列轉為紅黑樹
                hd.treeify(tab);
        }
    }

treeify()，把TreeNode的連結串列轉為紅黑樹，原理很簡單，就不解釋，不懂的可以看這篇文章講紅黑樹的

        final void treeify(Node<K,V>[] tab) {
            TreeNode<K,V> root = null;
            for (TreeNode<K,V> x = this, next; x != null; x = next) {
                next = (TreeNode<K,V>)x.next;
                x.left = x.right = null;
                if (root == null) {
                    x.parent = null;
                    x.red = false;
                    root = x;
                }
                else {
                    K k = x.key;
                    int h = x.hash;
                    Class<?> kc = null;
                    for (TreeNode<K,V 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    Java集合原始碼解析：HashMap
      
							
							
							本文概要

HashMap概述
HashMap資料結構
HashMap的原始碼解析

HashMap概述
在官方文件中是這樣描述的:
Hash table based implementation of the Map interface. This imple 

  
 

    

    
    Java集合原始碼解析：TreeMap
      
							
							
							本文概要

二叉查詢樹的用處
二叉查詢樹，以及二叉樹帶來的問題
平衡二叉樹的好處
紅黑樹的定義以及構造
紅黑樹在TreeMap的運用

二叉樹的好處
可能許多人會有疑問，為什麼要使用二叉樹，有那麼多的資料結構，比如陣列、連結串列等
簡單看下陣列和連結串列的優缺點 

  
 

    

    
    Java集合類原始碼解析：HashMap (基於JDK1.8)
      目錄 
 
 前言 
 HashMap的資料結構 
 深入原始碼
   
   兩個引數 
   成員變數 
   四個構造方法 
   插入資料的方法：put() 
   雜湊函式：hash() 
   動態擴容：resize() 
   節點樹化、紅黑樹的拆分
     
     節點樹化 
      

  
 

    

    
    JAVA常用集合原始碼分析：HashMap
       
 
 我們這篇文章就來試著分析下 HashMap 的原始碼，由於 HashMap 底層涉及到太多方面，一篇文章總是不能面面俱到，所以我們可以帶著面試官常問的幾個問題去看原始碼： 
 
  瞭解底層如何儲存資料的 
  HashMap 的幾個主要方法 
  HashMap 是如何確定元素儲存位置的以及如何處 

  
 

    

    
    Java 集合原始碼解析（1）：Iterator
      
                Java 提供的 集合類都在 Java.utils 包下，其中包含了很多 List, Set, Map, Queue… 它們的關係如下面這張類圖所示：



可以看到，Java 集合主要分為兩類：Collection 和 Map. 而 Collection 又繼承了 Iter 

  
 

    

    
    深入理解JAVA集合系列三：HashMap的死循環解讀
      現在   最新   star   and   場景   所有   image   cap   時也   由於在公司項目中偶爾會遇到HashMap死循環造成CPU100%，重啟後問題消失，隔一段時間又會反復出現。今天在這裏來仔細剖析下多線程情況下HashMap所帶來的問題：
1、多線程put操作後，get操作導 

  
 

    

    
    java集合原始碼解析（三）--List
       
 
 
 今天給大家帶來有序集合的介面List，我想也應該是大家在工作中用的比較多的 
 先來看看介面的定義： 
 
 public interface List<E> extends Collection<E>可以看出介面List直接繼承於介面Collection，並且一樣使用了 

  
 

    

    
    java集合原始碼解析（二）--AbstractCollection
       
 
 
 今天帶來的是java單列頂層介面的第一個輕量級實現：AbstractCollection 
 我們直接進入正題，先來看看它的宣告： 
  
 package java.util;

//可以從名字上同樣看到 AbstractCollection 是一個抽象類，所以並不能例項化，
//這個類只是作 

  
 

    

    
    JAVA集合原始碼解析 Hashtable探索（基於JDK1.8）
      
							
							
							JDK1.8Hashtable探索


  本文的討論分析是基於JDK1.8進行的


依舊是採用前幾篇文章的大綱來進行介紹






1.簡介

Hashtable 採用陣列+單鏈表來實現的，Hashtable 實現了一個雜湊表，它將鍵對映到值。任何非 nu 

  
 

    

    
    java集合原始碼解析:collection
      
                
JAVA集合的框架圖:


從圖中可以看出集合分為collection 和 map 兩大類, 其中collection內部主要以陣列或者連結串列的形式存放一系列集合物件,map則是以系列鍵值對的集合

collection主要包含list 和 set 兩個部分,是list和 

  
 

    

    
    深入Java集合學習系列：HashMap的實現原理
      
                

1.    HashMap概述：

   HashMap是基於雜湊表的Map介面的非同步實現。此實現提供所有可選的對映操作，並允許使用null值和null鍵。此類不保證對映的順序，特別是它不保證該順序恆久不變。


2.    HashMap的資料結構：

   在jav 

  
 

    

    
    java集合原始碼解析:map
      
                

map裡面用的最多的就是HashMap了, 如果需要對key進行排序的話,會用到 TreeMap

先看看HashMap的原始碼
HashMap內部還是用陣列的方式實現的
transient Node<K,V>[] table;
//Node的定義,除了key 

  
 

    

    
    jdk1.8原始碼解析：HashMap底層資料結構之連結串列轉紅黑樹的具體時機
      前言
　　本文從三個部分去探究HashMap的連結串列轉紅黑樹的具體時機：
　　　　一、從HashMap中有關“連結串列轉紅黑樹”閾值的宣告；
　　　　二、【重點】解析HashMap.put(K key, V value)的原始碼；
　　　　三、測試；
 
一、從 

  
 

    

    
    Java集合系列(四)：HashMap、Hashtable、LinkedHashMap、TreeMap的使用方法及區別
      本篇部落格主要講解Map介面的4個實現類HashMap、Hashtable、LinkedHashMap、TreeMap的使用方法以及三者之間的區別。

注意：本文中程式碼使用的JDK版本為1.8.0_191

值得注意的是，Map介面是獨立的介面，並沒有繼承Collection介面（這裡是重點，面試常問）：
 

  
 

    

    
    Java集合類原始碼解析：AbstractMap
      目錄 
 
 引言 
 原始碼解析
   
   抽象函式entrySet() 
   兩個集合檢視 
   操作方法 
   兩個子類 
   
 參考： 
 
引言 
今天學習一個Java集合的一個抽象類 AbstractMap ，AbstractMap 是Map介面的 實現類之一，也是HashMap、T 

  
 

    

    
    Java集合類原始碼解析：Vector
      引言 
之前的文章我們學習了一個集合類 ArrayList，今天講它的一個兄弟 Vector。 為什麼說是它兄弟呢？因為從容器的構造來說，Vector 簡直就是 ArrayList 的翻版，也是基於陣列的資料結構，不同的是，Vector的每個方法都加了 synchronized 修飾符，是執行緒安全的。 
類 

  
 

    

    
    Java集合類原始碼解析：ArrayList
      目錄

前言
今天學習一個Java集合類使用最多的類 ArrayList , ArrayList 繼承了 AbstractList，並實現了List 和 RandomAccess 等介面，
public class ArrayList<E> extends AbstractList<E> 

  
 

    

    
    Java集合類原始碼解析：LinkedHashMap
      前言
今天繼續學習關於Map家族的另一個類 LinkedHashMap 。先說明一下，LinkedHashMap 是繼承於 HashMap 的，所以本文只針對 LinkedHashMap 的特性學習，跟HashMap 相關的一些特性就不做進一步的解析了，大家有疑惑的可以看之前的博文。
深入解析
LinkedH 

  
 

    

    
    Java 集合系列10之 HashMap詳細介紹(原始碼解析)和使用示例
      
							
							
							概要
這一章，我們對HashMap進行學習。
我們先對HashMap有個整體認識，然後再學習它的原始碼，最後再通過例項來學會使用HashMap。內容包括：
第1部分 HashMap介紹
第2部分 HashMap資料結構
第3部分 HashMap原始碼解析(基於J 

  
 

    

    
    JAVA常用集合原始碼分析：HashSet
       
 
 序言 
 在上一篇文章中，我們介紹了HashMap，其實本來想自己完成原始碼分析的一系列文章的，但是HashMap的原始碼著實是複雜，看的我腦殼疼。。於是就自己去找了找大牛們的文章反覆看，後面總算有了點門道了，大致知道了HashMap的原理，然後轉載了一篇我認為總結的比較好的文章到我的部落格裡，供大