JAVA集合框架的特點及實現原理簡介
1.集合框架總體架構
- 集合大致分為Set、List、Queue、Map四種體系,其中List,Set,Queue繼承自Collection介面,Map為獨立介面
- Set的實現類有:HashSet,LinkedHashSet,TreeSet...
- List下有ArrayList,Vector,LinkedList...
- Map下有Hashtable,LinkedHashMap,HashMap,TreeMap...
list | 有序,可重複 | ArrayList:陣列,查詢快,增刪慢。執行緒不安全. Vector:陣列,查詢快,增刪慢。執行緒安全. LinkedList:連結串列,查詢慢,增刪快。執行緒不安全 |
set | 無序(不嚴謹),唯一 | HashSet:無序,唯一,雜湊表實現,通過hashCode()和equals()保證唯一。 LinkedHashSet:繼承自hashset,底層是連結串列和雜湊表。(FIFO插入有序,唯一) TreeSet:底層是紅黑樹。(唯一,有序) |
map | KV形式的鍵值對 | TreeMap:有序,不是執行緒安全的。 HashMap:無序,不是執行緒安全的,HashMap允許null值(key和value都允許) HashTable:無序,執行緒安全的,不允許null值, |
2. Set
Set 介面繼承Collection,用於儲存不含重複元素的集合。
HashSet
底層是雜湊表,當插入元素時,HashSet會呼叫該物件的hashCode()方法得到hashCode,然後根據hashCode決定該物件在雜湊表中的儲存位置。 (這裡有個問題,如果hashcode不是均勻分佈的,而是集中在一個區域,極端情況下,hash表會變成連結串列)
HashSet去重原理:通過equals()方法比較,且其hashCode()方法返回值也相等。 (可以通過覆寫hashCode和equals方法改變其去重規則,進行自定義去重)
TreeSet
TreeSet底層是紅黑樹;加入元素時,必須加入同類型的物件,否則會發生ClassCastException異常,因為TreeSet會呼叫集合元素的compareTo()方法來比較元素之間的大小關係(自然排序)。
compareTo()方法的返回值決定了順序:
- -1 表示放在紅黑樹的左邊,即逆序輸出;
- 1 表示放在紅黑樹的右邊,即順序輸出;
- 0 表示元素相同,僅存放第一個元素自然排序(treeset去重的原理);
其次,TreeSet也可以通過比較器排序。
LinkedHashSet
繼承自HashSet,底層是連結串列和雜湊表。
- 由連結串列保證元素有序(插入順序)。
- 由雜湊表保證元素唯一
TreeSet, LinkedHashSet and HashSet 的區別
- 都實現Set介面,不包含重複元素
- 都不是執行緒安全的,如果要使用執行緒安全可以Collections.synchronizedSet()
- TreeSet的主要功能用於排序
- LinkedHashSet的主要功能用於保證FIFO,即有序的集合(先進先出)
- HashSet只是通用的儲存資料的集合
- 插入速度: HashSet>LinkHashSet>TreeSet(內部實現排序)
- HashSet不保證順序,LinkHashSet保證FIFO(先進先出),TreeSet安裝內部實現排序,也可以自定義排序規則
- HashSet和LinkHashSet允許null, (只能有一個null) 但TreeSet中插入null時會報NullPointerException
3. List
list的實現類有ArrayList,Vector,LinkedList...其中ArrayList和Vector很相似,均是以陣列作為底層實現,不同之處在於Vector是執行緒安全的。
ArrayList
ArrayList基於陣列實現,不是執行緒安全的,內部維護了一個可變長的物件陣列,集合內所有元素儲存於這個陣列中,並實現該陣列長度的動態伸縮。
ArrayList使用陣列拷貝來實現指定位置的插入和刪除。
LinkedList
LinkedList內部以連結串列的形式來儲存元素,因此隨機訪問集合時效能較差,但插入,刪除元素時效能較好。
LinkedList不僅實現了List介面,還實現了Deque介面,可以被當成雙端佇列來使用,即可被當成“棧”來使用,也可以當成佇列使用。
ArrayList 和LinkedList比較
- 兩者都是List介面的實現類,都不是執行緒安全。List的另外一個實現類vector是執行緒安全的。
- ArrayList是基於動態陣列的資料結構,而LinkedList是基於連結串列的資料結構。
- 對於隨機訪問get和set(查詢操作),ArrayList要優於LinkedList.(LinkedList要移動指標)
- 對於增刪操作(add和remove),LinkedList優於ArrayList。
4. Map
Map集合用於儲存對映關係的資料,Map集合中儲存了兩組值,一組是 key, 一組是 value。
Map的key不能重複。
key和value之間存在單向一對一的關係, 通過key,能找到唯一確定的value。
Map將key和value封裝至一個叫做Entry的物件中,Map中儲存的元素實際是Entry。只有在keySet()和values()方法被呼叫時,Map才會將keySet和values物件例項化。
HashMap
key 是通過hash表來儲存,value是通過連結串列來儲存。
HashMap將Entry物件儲存在一個數組中,並通過雜湊表來實現對Entry的快速訪問。 (通過key的雜湊值計算Entry在陣列中的index,以此訪問value) (拉鍊法,解決hash碰撞)
HashTable
幾乎和HashMap一樣,都是通過陣列儲存Entry,以key的雜湊值計算Entry在陣列中的index,用拉鍊法解決雜湊衝突。二者最大的不同在於, Hashtable是執行緒安全的,其提供的方法幾乎都是同步的。
ConcurrentHashMap
ConcurrentHashMap是HashMap的執行緒安全版,提供比Hashtable更高效的併發效能。
Hashtable 在進行讀寫操作時會鎖住整個Entry陣列,這就導致資料越多效能越差。
ConcurrentHashMap使用分離鎖的思路解決併發效能,其將 Entry陣列拆分至16個Segment中,以雜湊演算法決定Entry應該儲存在哪個Segment。這樣就可以實現在寫操作時只對一個Segment 加鎖,大幅提升了併發寫的效能。
在進行讀操作時,ConcurrentHashMap在絕大部分情況下都不需要加鎖,其Entry中的value是volatile的,這保證了value被修改時的執行緒可見性,無需加鎖便能實現執行緒安全的讀操作。
ConcurrentHashMap它不能保證讀操作的絕對一致性。ConcurrentHashMap保證讀操作能獲取到已存在Entry的value的最新值,同時也能保證讀操作可獲取到已完成的寫操作的內容,但如果寫操作是在建立一個新的Entry,那麼在寫操作沒有完成時,讀操作是有可能獲取不到這個Entry的。
HashMap和HashTable,ConcurrentHashMap的區別
- 三者在資料儲存層面的機制原理基本一致
- HashMap不是執行緒安全的
- Hashtable是執行緒安全的,能保證絕對的資料一致性
- ConcurrentHashMap 也是執行緒安全的,使用分離鎖和volatile等方法極大地提升了讀寫效能,同時也能保證在絕大部分情況下的資料一致性。但其不能保證絕對的資料一致性,在一個執行緒向Map中加入Entry的操作沒有完全完成之前,其他執行緒有可能讀不到新加入的Entry
- HashTable不允許使用null作為key和value,如果放入null將引發NullPointerException異常,但HashMap可以使用null作為key或value(只能有一個key為null,可以多個value為null)。
- 如果在遍歷的同時,修改HashTable的大小,容易應發異常。可以用代替,ConcurrentHashMap是HashMap的執行緒安全版,提供比Hashtable更高效的併發效能
參考資料
https://blog.csdn.net/sdgihshdv/article/details/72566485
https://blog.csdn.net/wangwei_620/article/details/82049502