1. 程式人生 > >collection array hashMap list set ConcurrentHashMap詳解

collection array hashMap list set ConcurrentHashMap詳解

一、集合與陣列

陣列(可以儲存基本資料型別)是用來存現物件的一種容器,但是陣列的長度固定,不適合在物件數量未知的情況下使用。

集合(只能儲存物件,物件型別可以不一樣)的長度可變,可在多數情況下使用。

二、層次關係

Collection介面是集合類的根介面,Java中沒有提供這個介面的直接的實現類。但是卻讓其被繼承產生了兩個介面,就是Set和List。Set中不能包含重複的元素。List是一個有序的集合,可以包含重複的元素,提供了按索引訪問的方式。

Map是Java.util包中的另一個介面,它和Collection介面沒有關係,是相互獨立的,但是都屬於集合類的一部分。Map包含了key-value對。Map不能包含重複的key,但是可以包含相同的value。

三、幾種重要的介面和類簡介

1、List(有序、可重複) List裡存放的物件是有序的,同時也是可以重複的,List關注的是索引,擁有一系列和索引相關的方法,查詢速度快。因為往list集合裡插入或刪除資料時,會伴隨著後面資料的移動,所有插入刪除資料速度慢。

2、Set(無序、不能重複) Set裡存放的物件是無序,不能重複的,集合中的物件不按特定的方式排序,只是簡單地把物件加入集合中。

3、Map(鍵值對、鍵唯一、值不唯一) Map集合中儲存的是鍵值對,鍵不能重複,值可以重複。根據鍵得到值,對map集合遍歷時先得到鍵的set集合,對set集合進行遍歷,得到相應的值。

對比如下:

是否有序

是否允許元素重複

Collection

List

Set

AbstractSet

HashSet

TreeSet

是(用二叉排序樹)

Map

AbstractMap

使用key-value來對映和儲存資料,key必須唯一,value可以重複

HashMap

TreeMap

是(用二叉排序樹)

四、遍歷

 在類集中提供了以下四種的常見輸出方式:

1)Iterator:迭代輸出,是使用最多的輸出方式。

2)ListIterator:是Iterator的子介面,專門用於輸出List中的內容。

3)foreach輸出:JDK1.5之後提供的新功能,可以輸出陣列或集合。

4)for迴圈

程式碼示例如下:

 for的形式:for(int i=0;i<arr.size();i++){...}

 foreach的形式: for(int i:arr){...}

 iterator的形式: Iterator it = arr.iterator(); while(it.hasNext()){ object o =it.next(); ...}

五、ArrayList和LinkedList

ArrayList和LinkedList在用法上沒有區別,但是在功能上還是有區別的。LinkedList經常用在增刪操作較多而查詢操作很少的情況下,ArrayList則相反。

六、Map集合

實現類:HashMap、Hashtable、LinkedHashMap和TreeMap

HashMap 

HashMap是最常用的Map,它根據鍵的HashCode值儲存資料,根據鍵可以直接獲取它的值,具有很快的訪問速度,遍歷時,取得資料的順序是完全隨機的。因為鍵物件不可以重複,所以HashMap最多隻允許一條記錄的鍵為Null,允許多條記錄的值為Null,是非同步的

Hashtable

Hashtable與HashMap類似,是HashMap的執行緒安全版,它支援執行緒的同步,即任一時刻只有一個執行緒能寫Hashtable,因此也導致了Hashtale在寫入時會比較慢,它繼承自Dictionary類,不同的是它不允許記錄的鍵或者值為null,同時效率較低。

ConcurrentHashMap

執行緒安全,並且鎖分離。ConcurrentHashMap內部使用段(Segment)來表示這些不同的部分,每個段其實就是一個小的hash table,它們有自己的鎖。只要多個修改操作發生在不同的段上,它們就可以併發進行。

LinkedHashMap

LinkedHashMap儲存了記錄的插入順序,在用Iteraor遍歷LinkedHashMap時,先得到的記錄肯定是先插入的,在遍歷的時候會比HashMap慢,有HashMap的全部特性。

TreeMap

TreeMap實現SortMap介面,能夠把它儲存的記錄根據鍵排序,預設是按鍵值的升序排序(自然順序),也可以指定排序的比較器,當用Iterator遍歷TreeMap時,得到的記錄是排過序的。不允許key值為空,非同步的;

map的遍歷

第一種:KeySet() 將Map中所有的鍵存入到set集合中。因為set具備迭代器。所有可以迭代方式取出所有的鍵,再根據get方法。獲取每一個鍵對應的值。 keySet():迭代後只能通過get()取key 。 取到的結果會亂序,是因為取得資料行主鍵的時候,使用了HashMap.keySet()方法,而這個方法返回的Set結果,裡面的資料是亂序排放的。 典型用法如下: Map map = new HashMap(); map.put("key1","lisi1"); map.put("key2","lisi2"); map.put("key3","lisi3"); map.put("key4","lisi4");   //先獲取map集合的所有鍵的set集合,keyset() Iterator it = map.keySet().iterator();  //獲取迭代器 while(it.hasNext()){ Object key = it.next(); System.out.println(map.get(key)); }

第二種:entrySet() Set<Map.Entry<K,V>> entrySet() //返回此對映中包含的對映關係的 Set 檢視。(一個關係就是一個鍵-值對),就是把(key-value)作為一個整體一對一對地存放到Set集合當中的。Map.Entry表示對映關係。entrySet():迭代後可以e.getKey(),e.getValue()兩種方法來取key和value。返回的是Entry介面。 典型用法如下: Map map = new HashMap(); map.put("key1","lisi1"); map.put("key2","lisi2"); map.put("key3","lisi3"); map.put("key4","lisi4"); //將map集合中的對映關係取出,存入到set集合 Iterator it = map.entrySet().iterator(); while(it.hasNext()){ Entry e =(Entry) it.next(); System.out.println("鍵"+e.getKey () + "的值為" + e.getValue()); } 推薦使用第二種方式,即entrySet()方法,效率較高。 對於keySet其實是遍歷了2次,一次是轉為iterator,一次就是從HashMap中取出key所對於的value。而entryset只是遍歷了第一次,它把key和value都放到了entry中,所以快了。兩種遍歷的遍歷時間相差還是很明顯的。

七、主要實現類區別小結

Vector和ArrayList 1,vector是執行緒同步的,所以它也是執行緒安全的,而arraylist是執行緒非同步的,是不安全的。如果不考慮到執行緒的安全因素,一般用arraylist效率比較高。 2,如果集合中的元素的數目大於目前集合陣列的長度時,vector增長率為目前陣列長度的100%,而arraylist增長率為目前陣列長度的50%。如果在集合中使用資料量比較大的資料,用vector有一定的優勢。 3,如果查詢一個指定位置的資料,vector和arraylist使用的時間是相同的,如果頻繁的訪問資料,這個時候使用vector和arraylist都可以。而如果移動一個指定位置會導致後面的元素都發生移動,這個時候就應該考慮到使用linklist,因為它移動一個指定位置的資料時其它元素不移動。 ArrayList 和Vector是採用陣列方式儲存資料,此陣列元素數大於實際儲存的資料以便增加和插入元素,都允許直接序號索引元素,但是插入資料要涉及到陣列元素移動等記憶體操作,所以索引資料快,插入資料慢,Vector由於使用了synchronized方法(執行緒安全)所以效能上比ArrayList要差,LinkedList使用雙向連結串列實現儲存,按序號索引資料需要進行向前或向後遍歷,但是插入資料時只需要記錄本項的前後項即可,所以插入數度較快。

arraylist和linkedlist 1.ArrayList是實現了基於動態陣列的資料結構,LinkedList基於連結串列的資料結構。 2.對於隨機訪問get和set,ArrayList覺得優於LinkedList,因為LinkedList要移動指標。 3.對於新增和刪除操作add和remove,LinedList比較佔優勢,因為ArrayList要移動資料。 這一點要看實際情況的。若只對單條資料插入或刪除,ArrayList的速度反而優於LinkedList。但若是批量隨機的插入刪除資料,LinkedList的速度大大優於ArrayList. 因為ArrayList每插入一條資料,要移動插入點及之後的所有資料。

HashMap與TreeMap 1、 HashMap通過hashcode對其內容進行快速查詢,而TreeMap中所有的元素都保持著某種固定的順序,如果你需要得到一個有序的結果你就應該使用TreeMap(HashMap中元素的排列順序是不固定的)。 2、在Map 中插入、刪除和定位元素,HashMap是最好的選擇。但如果您要按自然順序或自定義順序遍歷鍵,那麼TreeMap會更好。使用HashMap要求新增的鍵類明確定義了hashCode()和 equals()的實現。 兩個map中的元素一樣,但順序不一樣,導致hashCode()不一樣。 同樣做測試: 在HashMap中,同樣的值的map,順序不同,equals時,false; 而在treeMap中,同樣的值的map,順序不同,equals時,true,說明,treeMap在equals()時是整理了順序了的。

HashTable與HashMap 1、同步性:Hashtable是執行緒安全的,也就是說是同步的,而HashMap是執行緒序不安全的,不是同步的。 2、HashMap允許存在一個為null的key,多個為null的value 。 3、hashtable的key和value都不允許為null。

如何解決HashMap的執行緒不安全問題?

1.替換成Hashtable,Hashtable通過對整個表上鎖實現執行緒安全,因此效率比較低

2.使用Collections類的synchronizedMap方法包裝一下。方法如下:

public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m)  返回由指定對映支援的同步(執行緒安全的)對映

3.使用ConcurrentHashMap,它使用分段鎖來保證執行緒安全

通過前兩種方式獲得的執行緒安全的HashMap在讀寫資料的時候會對整個容器上鎖,而ConcurrentHashMap並不需要對整個容器上鎖,它只需要鎖住要修改的部分就行了

https://img-blog.csdn.net/20161201115302548?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center

ArrayList擴容機制

發生擴容的條件:

根據傳入的最小需要容量minCapacity來和陣列的容量長度對比,若minCapactity大於或等於陣列容量,則需要進行擴容。(如果實際儲存陣列是空陣列,則最小需要容量就是預設容量)

實現擴容: jdk7中採用>>位運算,()增加量)右移動一位。 容量相當於擴大了1.5倍;

舉例說明:新增20個元素到ArrayList中 

當第一次插入元素時才分配10(預設)個物件空間。之後擴容會按照1.5倍增長。

也就是當新增第11個數據的時候,Arraylist繼續擴容變為10*1.5=15;

當新增第16個數據時,繼續擴容變為15 * 1.5 =22個;

HashMap擴容機制

1.三個常量

 static final int DEFAULT_INITIAL_CAPACITY = 16;

 static final int MAXIMUM_CAPACITY = 1 << 30;

 static final float DEFAULT_LOAD_FACTOR = 0.75f;

三個常量中可以看出,預設的容器大小是16,最大長度是2的30次方,load factor預設是0.75,擴充的臨界值是16*0.75=12 

2.HashMap什麼時候進行擴容呢?

當HashMap中的元素個數超過陣列大小乘以負載因子(loadFactor)時,就會進行陣列擴容,loadFactor的預設值為0.75,

也就是說,預設情況下,陣列大小為16,

那麼當HashMap中元素個數超過16*0.75=12的時候,

就把陣列的大小擴充套件為2*16=32,即擴大一倍,

然後重新計算每個元素在陣列中的位置。