1.HashMap的資料結構
陣列的特點是:定址容易,插入和刪除困難;而連結串列的特點是:定址困難,插入和刪除容易。那麼我們能不能綜合兩者的特性,做出一種定址容易,插入刪除也容易的資料結構?答案是肯定的,這就是我們要提起的雜湊表,雜湊表有多種不同的實現方法,我接下來解釋的是最常用的一種方法—— 拉鍊法,我們可以理解為“連結串列的陣列” ,如圖:
從上圖我們可以發現雜湊表是由陣列+連結串列組成的,一個長度為16的陣列中,每個元素儲存的是一個連結串列的頭結點。那麼這些元素是按照什麼樣的規則儲存到陣列中呢。一般情況是通過hash(key)%len獲得,也就是元素的key的雜湊值對陣列長度取模得到。比如上述雜湊表中,12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都儲存在陣列下標為12的位置。
HashMap其實也是一個線性的陣列實現的,所以可以理解為其儲存資料的容器就是一個線性陣列。這可能讓我們很不解,一個線性的陣列怎麼實現按鍵值對來存取資料呢?這裡HashMap有做一些處理。
1.首先HashMap裡面實現一個靜態內部類Entry,其重要的屬性有 key , value, next,從屬性key,value我們就能很明顯的看出來Entry就是HashMap鍵值對實現的一個基礎bean,我們上面說到HashMap的基礎就是一個線性陣列,這個陣列就是Entry[],Map裡面的內容都儲存在Entry[]裡面。
2.HashMap的存取實現
既然是線性陣列,為什麼能隨機存取?這裡HashMap用了一個小演算法,大致是這樣實現:
//儲存時:
int hash = key.hashCode();// 這個hashCode方法這裡不詳述,只要理解每個key的hash是一個固定的int值
int index = hash % Entry[].length;
Entry[index] = value; //取值時:
int hash = key.hashCode();
int index = hash % Entry[].length;
return Entry[index];
到這裡我們輕鬆的理解了HashMap通過鍵值對實現存取的基本原理
3.疑問:如果兩個key通過hash%Entry[].length得到的index相同,會不會有覆蓋的危險?
這裡HashMap裡面用到鏈式資料結構的一個概念。上面我們提到過Entry類裡面有一個next屬性,作用是指向下一個Entry。打個比方, 第一個鍵值對A進來,通過計算其key的hash得到的index=0,記做:Entry[0] = A。一會後又進來一個鍵值對B,通過計算其index也等於0,現在怎麼辦?HashMap會這樣做:B.next = A,Entry[0] = B,如果又進來C,index也等於0,那麼C.next = B,Entry[0] = C;這樣我們發現index=0的地方其實存取了A,B,C三個鍵值對,他們通過next這個屬性連結在一起。所以疑問不用擔心。也就是說陣列中儲存的是最後插入的元素。到這裡為止,HashMap的大致實現,我們應該已經清楚了。
當然HashMap裡面也包含一些優化方面的實現,這裡也說一下。比如:Entry[]的長度一定後,隨著map裡面資料的越來越長,這樣同一個index的鏈就會很長,會不會影響效能?HashMap裡面設定一個因素(也稱為因子),隨著map的size越來越大,Entry[]會以一定的規則加長長度。
3.解決hash衝突的辦法
- 開放定址法(線性探測再雜湊,二次探測再雜湊,偽隨機探測再雜湊)
- 再雜湊法
- 鏈地址法
- 建立一個公共溢位區
Java中hashmap的解決辦法就是採用的鏈地址法。
4.實現自己的HashMap
MapTest.java
package General;
import java.util.*;
public class MapTest {
public static void main(String[] args){
Map<String,Employee> staff=new HashMap<>();
staff.put("144-25-5456",new Employee("Amy Lee"));
staff.put("567-24-2456",new Employee("Harry Hacker"));
staff.put("157-62-7935",new Employee("Gary Cooper"));
staff.put("465-62-5537",new Employee("Francesca Cruz")); //print all entries
System.out.println(staff); //remove an entry
staff.remove("567-24-2456"); //replace an entry
staff.put("456-62-5527",new Employee("Francesca Miller")); //look up a value
System.out.println(staff.get("157-62-7935")); //iterate through all entries
for(Map.Entry<String, Employee>entry:staff.entrySet()){
String key=entry.getKey();
Employee value=entry.getValue();
System.out.println("Key="+key+", value="+value);
}
}
}
class Employee{
private String name;
public Employee(String n){
name=n;
}
public String getName(){
return name;
}
}
{157-62-7935=Amy Lee,
567-24-2456=Harry Hacker,
144-25-5456=Gary Cooper,
465-62-5537=Francesca Cruz}
Francesca Miller
Key=157-62-7935, value=Amy Lee
Key=144-25-5456, value=Harry Hacker
Key=465-62-5537, value=Gary Cooper
Key=456-62-5527, value=Francesca Cruz