1. 程式人生 > >JAVA集合框架的特點及實現原理簡介

JAVA集合框架的特點及實現原理簡介

1.集合框架總體架構

  • 集合大致分為Set、List、Queue、Map四種體系,其中List,Set,Queue繼承自Collection介面,Map為獨立介面
  • Set的實現類有:HashSet,LinkedHashSet,TreeSet...
  • List下有ArrayList,Vector,LinkedList...
  • Map下有Hashtable,LinkedHashMap,HashMap,TreeMap...
list 有序,可重複 ArrayList:陣列,查詢快,增刪慢。執行緒不安全. Vector:陣列,查詢快,增刪慢。執行緒安全. LinkedList:連結串列,查詢慢,增刪快。執行緒不安全
set 無序(不嚴謹),唯一 HashSet:無序,唯一,雜湊表實現,通過hashCode()和equals()保證唯一。 LinkedHashSet:繼承自hashset,底層是連結串列和雜湊表。(FIFO插入有序,唯一) TreeSet:底層是紅黑樹。(唯一,有序)
map KV形式的鍵值對 TreeMap:有序,不是執行緒安全的。 HashMap:無序,不是執行緒安全的,HashMap允許null值(key和value都允許) HashTable:無序,執行緒安全的,不允許null值,

2. Set

Set 介面繼承Collection,用於儲存不含重複元素的集合。

HashSet

底層是雜湊表,當插入元素時,HashSet會呼叫該物件的hashCode()方法得到hashCode,然後根據hashCode決定該物件在雜湊表中的儲存位置。 (這裡有個問題,如果hashcode不是均勻分佈的,而是集中在一個區域,極端情況下,hash表會變成連結串列)

HashSet去重原理:通過equals()方法比較,且其hashCode()方法返回值也相等。 (可以通過覆寫hashCode和equals方法改變其去重規則,進行自定義去重)

TreeSet

TreeSet底層是紅黑樹;加入元素時,必須加入同類型的物件,否則會發生ClassCastException異常,因為TreeSet會呼叫集合元素的compareTo()方法來比較元素之間的大小關係(自然排序)。

compareTo()方法的返回值決定了順序:

  • -1 表示放在紅黑樹的左邊,即逆序輸出;
  • 1 表示放在紅黑樹的右邊,即順序輸出;
  • 0 表示元素相同,僅存放第一個元素自然排序(treeset去重的原理);

其次,TreeSet也可以通過比較器排序。

LinkedHashSet

繼承自HashSet,底層是連結串列和雜湊表。

  • 由連結串列保證元素有序(插入順序)。
  • 由雜湊表保證元素唯一

TreeSet, LinkedHashSet and HashSet 的區別

  • 都實現Set介面,不包含重複元素
  • 都不是執行緒安全的,如果要使用執行緒安全可以Collections.synchronizedSet()
  • TreeSet的主要功能用於排序
  • LinkedHashSet的主要功能用於保證FIFO,即有序的集合(先進先出)
  • HashSet只是通用的儲存資料的集合
  • 插入速度: HashSet>LinkHashSet>TreeSet(內部實現排序)
  • HashSet不保證順序,LinkHashSet保證FIFO(先進先出),TreeSet安裝內部實現排序,也可以自定義排序規則
  • HashSet和LinkHashSet允許null, (只能有一個null) 但TreeSet中插入null時會報NullPointerException

3. List

list的實現類有ArrayList,Vector,LinkedList...其中ArrayList和Vector很相似,均是以陣列作為底層實現,不同之處在於Vector是執行緒安全的。

ArrayList

ArrayList基於陣列實現,不是執行緒安全的,內部維護了一個可變長的物件陣列,集合內所有元素儲存於這個陣列中,並實現該陣列長度的動態伸縮。

ArrayList使用陣列拷貝來實現指定位置的插入和刪除。

LinkedList

LinkedList內部以連結串列的形式來儲存元素,因此隨機訪問集合時效能較差,但插入,刪除元素時效能較好。

LinkedList不僅實現了List介面,還實現了Deque介面,可以被當成雙端佇列來使用,即可被當成“棧”來使用,也可以當成佇列使用。

ArrayList 和LinkedList比較

  • 兩者都是List介面的實現類,都不是執行緒安全。List的另外一個實現類vector是執行緒安全的。
  • ArrayList是基於動態陣列的資料結構,而LinkedList是基於連結串列的資料結構。
  • 對於隨機訪問get和set(查詢操作),ArrayList要優於LinkedList.(LinkedList要移動指標)
  • 對於增刪操作(add和remove),LinkedList優於ArrayList。

4. Map

Map集合用於儲存對映關係的資料,Map集合中儲存了兩組值,一組是 key, 一組是 value。

Map的key不能重複。

key和value之間存在單向一對一的關係, 通過key,能找到唯一確定的value。

Map將key和value封裝至一個叫做Entry的物件中,Map中儲存的元素實際是Entry。只有在keySet()和values()方法被呼叫時,Map才會將keySet和values物件例項化。

HashMap

key 是通過hash表來儲存,value是通過連結串列來儲存。

HashMap將Entry物件儲存在一個數組中,並通過雜湊表來實現對Entry的快速訪問。 (通過key的雜湊值計算Entry在陣列中的index,以此訪問value) (拉鍊法,解決hash碰撞)

HashTable

幾乎和HashMap一樣,都是通過陣列儲存Entry,以key的雜湊值計算Entry在陣列中的index,用拉鍊法解決雜湊衝突。二者最大的不同在於, Hashtable是執行緒安全的,其提供的方法幾乎都是同步的。

ConcurrentHashMap

ConcurrentHashMap是HashMap的執行緒安全版,提供比Hashtable更高效的併發效能。

Hashtable 在進行讀寫操作時會鎖住整個Entry陣列,這就導致資料越多效能越差。

ConcurrentHashMap使用分離鎖的思路解決併發效能,其將 Entry陣列拆分至16個Segment中,以雜湊演算法決定Entry應該儲存在哪個Segment。這樣就可以實現在寫操作時只對一個Segment 加鎖,大幅提升了併發寫的效能。

在進行讀操作時,ConcurrentHashMap在絕大部分情況下都不需要加鎖,其Entry中的value是volatile的,這保證了value被修改時的執行緒可見性,無需加鎖便能實現執行緒安全的讀操作。

ConcurrentHashMap它不能保證讀操作的絕對一致性。ConcurrentHashMap保證讀操作能獲取到已存在Entry的value的最新值,同時也能保證讀操作可獲取到已完成的寫操作的內容,但如果寫操作是在建立一個新的Entry,那麼在寫操作沒有完成時,讀操作是有可能獲取不到這個Entry的。

HashMap和HashTable,ConcurrentHashMap的區別

  • 三者在資料儲存層面的機制原理基本一致
  • HashMap不是執行緒安全的
  • Hashtable是執行緒安全的,能保證絕對的資料一致性
  • ConcurrentHashMap 也是執行緒安全的,使用分離鎖和volatile等方法極大地提升了讀寫效能,同時也能保證在絕大部分情況下的資料一致性。但其不能保證絕對的資料一致性,在一個執行緒向Map中加入Entry的操作沒有完全完成之前,其他執行緒有可能讀不到新加入的Entry
  • HashTable不允許使用null作為key和value,如果放入null將引發NullPointerException異常,但HashMap可以使用null作為key或value(只能有一個key為null,可以多個value為null)。
  • 如果在遍歷的同時,修改HashTable的大小,容易應發異常。可以用代替,ConcurrentHashMap是HashMap的執行緒安全版,提供比Hashtable更高效的併發效能

參考資料

https://blog.csdn.net/sdgihshdv/article/details/72566485

https://blog.csdn.net/wangwei_620/article/details/82049502