1. 程式人生 > >【演算法】雜湊表法四部曲

【演算法】雜湊表法四部曲

# 雜湊表 散列表(Hash table,也叫雜湊表),是**根據關鍵碼值(Key value)而直接進行訪問**的資料結構。也就是說,它**通過把關鍵碼值對映到表中一個位置來訪問記錄**,以加快查詢的速度。這個對映函式叫做雜湊函式,存放記錄的陣列叫做散列表。 給定表M,存在函式f(key),對任意給定的關鍵字值key,代入函式後若能得到包含該關鍵字的記錄在表中的地址,則稱表M為雜湊(Hash)表,函式f(key)為雜湊(Hash) 函式。 關鍵碼值與地址一一對映 # 適用場景 適用於**關鍵字與某一值一一對應**,即 可使用鍵值對map,而hashmap是鍵值對中較好的實現類 關鍵詞:一一對應 # 遍歷雜湊表的四種方式 ``` public static void main(String[] args) { Map map=new HashMap(); map.put("1", "value1"); map.put("2", "value2"); map.put("3", "value3"); map.put("4", "value4"); //第一種:普通使用,二次取值 // 遍歷鍵,取出值 System.out.println("\n通過Map.keySet遍歷key和value:"); for(String key:map.keySet()) { System.out.println("Key: "+key+" Value: "+map.get(key)); } //第二種 // 使用Map.entrySet()的迭代器 System.out.println("\n通過Map.entrySet使用iterator遍歷key和value: "); Iterator map1it=map.entrySet().iterator(); while(map1it.hasNext()) { Map.Entry entry=(Entry) map1it.next(); System.out.println("Key: "+entry.getKey()+" Value: "+entry.getValue()); } //第三種:推薦,尤其是容量大時 // foreach System.out.println("\n通過Map.entrySet遍歷key和value"); for(Map.Entry entry: map.entrySet()) { System.out.println("Key: "+ entry.getKey()+ " Value: "+entry.getValue()); } //第四種 // 遍歷value System.out.println("\n通過Map.values()遍歷所有的value,但不能遍歷key"); for(String v:map.values()) { System.out.println("The value is "+v); } } ``` 輸出結果: ``` 通過Map.keySet遍歷key和value: Key: 1 Value: value1 Key: 2 Value: value2 Key: 3 Value: value3 Key: 4 Value: value4 通過Map.entrySet使用iterator遍歷key和value: Key: 1 Value: value1 Key: 2 Value: value2 Key: 3 Value: value3 Key: 4 Value: value4 通過Map.entrySet遍歷key和value Key: 1 Value: value1 Key: 2 Value: value2 Key: 3 Value: value3 Key: 4 Value: value4 通過Map.values()遍歷所有的value,但不能遍歷key The value is value1 The value is value2 The value is value3 The value is value4 ``` 【推薦】使用entrySet遍歷Map類集合KV,而不是keySet方式進行遍歷。 說明:keySet 其實是遍歷了2次,一次是轉為Iterator物件,另一次是從hashMap中取出key所對應的value。而entrySet只是遍歷了一次就把key和value都放到了entry中,效 率更高。如果是JDK8,使用Map.foreach方法。 正例:values()返回的是V值集合,是一個list集合物件; keySet()返回的是K值集合,是一個Set集合物件; entrySet()返回的是K-V值組合集合。 # 記錄陣列中元素出現頻數 遍歷nums1,使用雜湊表儲存關鍵字,以及他們出現的次數 方法一:遇到空的就賦初值,非空就+1 ``` // 1. 遍歷nums1,使用雜湊表儲存關鍵字,以及他們出現的次數 Map map = new HashMap<>(); for (int i = 0; i < nums1.length; i++) { if (map.get(nums1[i]) != null) { map.put(nums1[i], map.get(nums1[i])+1); } else { map.put(nums1[i], 1); } } ``` --- 方法二:使用`getOrDefault()` ``` Map map = new HashMap(); for (int num : nums1) { int count = map.getOrDefault(num, 0) + 1; map.put(num, count); } ``` --- 方法三:如果元素固定,那麼我們可以就使用一個一維陣列來儲存他們出現的頻數。這也是雜湊表法。 遍歷字串 p,記錄字元頻數 ``` int[] sArr = new int[26]; for (int i = 0; i < p.length(); i++) { sArr[s.charAt(i) - 'a']++; } ``` 方法四:如果要求元素只出現一次 或者判斷是否有重複元素,那就可以用雜湊集合 ``` Set set = new HashSet(); for (int num : nums1) { // 新增此元素至 Set,加入失敗那就代表有重複 if(!set.add(num)) { return false; } } ``` # 例項 ## [1. 兩數之和](https://leetcode-cn.com/problems/two-sum/) 給定一個整數陣列 nums 和一個整數目標值 target,請你在該陣列中找出 和為目標值 的那 兩個 整數,並返回它們的陣列下標。 你可以假設每種輸入只會對應一個答案。但是,陣列中同一個元素不能使用兩遍。 你可以按任意順序返回答案。   示例 1: 輸入:nums = [2,7,11,15], target = 9 輸出:[0,1] 解釋:因為 nums[0] + nums[1] == 9 ,返回 [0, 1] 。 示例 2: 輸入:nums = [3,2,4], target = 6 輸出:[1,2] 示例 3: 輸入:nums = [3,3], target = 6 輸出:[0,1] 答案 ``` class Solution { public int[] twoSum(int[] nums, int target) { // 雜湊表用來存放(關鍵字,下標) Map map = new HashMap<>(); // 遍歷陣列,每次遇到一個元素判斷雜湊表裡面有沒有與其對應的target - nums[i]元素 // 如果有就返回下標,如果沒有就把它的關鍵字和下標放進去, for (int i = 0; i < nums.length; i++) { Integer index = map.get(target - nums[i]); if (index != null) { return new int[]{index, i}; } else { map.put(nums[i], i); } } return null; } } ``` ## [有效的字母異位詞](https://leetcode-cn.com/problems/valid-anagram) 給定兩個字串 s 和 t ,編寫一個函式來判斷 t 是否是 s 的字母異位詞。 示例 1: 輸入: s = "anagram", t = "nagaram" 輸出: true 示例 2: 輸入: s = "rat", t = "car" 輸出: false 說明: 你可以假設字串只包含小寫字母。 進階: 如果輸入字串包含 unicode 字元怎麼辦?你能否調整你的解法來應對這種情況? ## 答案 ### 方法一:排序 t 是 s 的異位詞等價於「兩個字串排序後相等」。因此我們可以對字串 s 和 t 分別排序,看排序後的字串是否相等即可判斷。此外,如果 s 和 t 的長度不同,t 必然不是 s 的異位詞。 Java ``` class Solution { public boolean isAnagram(String s, String t) { if (s.length() != t.length()) { return false; } char[] str1 = s.toCharArray(); char[] str2 = t.toCharArray(); Arrays.sort(str1); Arrays.sort(str2); return Arrays.equals(str1, str2); } } ``` 複雜度分析 - 時間複雜度:$O(n \log n)$,其中 n 為 s 的長度。排序的時間複雜度為 $O(n\log n)$,比較兩個字串是否相等時間複雜度為 $O(n)$,因此總體時間複雜度為 $O(n \log n+n)=O(n\log n)$。 - 空間複雜度:$O(\log n)$。排序需要 $O(\log n)$ 的空間複雜度。注意,在某些語言(比如 Java & JavaScript)中字串是不可變的,因此我們需要額外的 $O(n)$ 的空間來拷貝字串。但是我們忽略這一複雜度分析,因為: 這依賴於語言的細節; 這取決於函式的設計方式,例如,可以將函式引數型別更改為 char[]。 ### 方法二:雜湊表 >
前面我們說過了關鍵碼值與地址一一對映,就可以稱為雜湊表(即 散列表),所以此處的方法也可以稱為雜湊表法。 從另一個角度考慮,t 是 s 的異位詞等價於「兩個字串中字元出現的種類和次數均相等」。由於字串只包含 26 個小寫字母,因此我們可以維護一個長度為 26 的頻次陣列 $\textit{table}$,先遍歷記錄字串 s 中字元出現的頻次,然後遍歷字串 t,減去 $\textit{table}$ 中對應的頻次,如果出現 $\textit{table}[i]<0$,則說明 t 包含一個不在 s 中的額外字元,返回 $\text{false}$ 即可。 Java ``` class Solution { public boolean isAnagram(String s, String t) { if (s.length() != t.length()) { return false; } int[] table = new int[26]; for (int i = 0; i < s.length(); i++) { table[s.charAt(i) - 'a']++; } for (int i = 0; i < t.length(); i++) { table[t.charAt(i) - 'a']--; if (table[t.charAt(i) - 'a'] < 0) { return false; } } return true; } } ``` 對於進階問題,$\text{Unicode}$ 是為了解決傳統字元編碼的侷限性而產生的方案,它為每個語言中的字元規定了一個唯一的二進位制編碼。而 $\text{Unicode}$ 中可能存在一個字元對應多個位元組的問題,為了讓計算機知道多少位元組表示一個字元,面向傳輸的編碼方式的 $\text{UTF}-8$ 和 $\text{UTF}-16$ 也隨之誕生逐漸廣泛使用,具體相關的知識讀者可以繼續查閱相關資料拓展視野,這裡不再展開。 回到本題,進階問題的核心點在於「字元是離散未知的」,因此我們用雜湊表維護對應字元的頻次即可。同時讀者需要注意 $\text{Unicode}$ 一個字元可能對應多個位元組的問題,不同語言對於字串讀取處理的方式是不同的。 Java ``` class Solution { public boolean isAnagram(String s, String t) { if (s.length() != t.length()) { return false; } Map table = new HashMap(); for (int i = 0; i < s.length(); i++) { char ch = s.charAt(i); table.put(ch, table.getOrDefault(ch, 0) + 1); } for (int i = 0; i < t.length(); i++) { char ch = t.charAt(i); table.put(ch, table.getOrDefault(ch, 0) - 1); if (table.get(ch) < 0) { return false; } } return true; } } ``` 複雜度分析 - 時間複雜度:$O(n)$,其中 n 為 s 的長度。 - 空間複雜度:$O(S)$,其中 S 為字符集大小,此處 $S=26$。 ## [劍指 Offer 61. 撲克牌中的順子](https://leetcode-cn.com/problems/bu-ke-pai-zhong-de-shun-zi-lcof/) 從撲克牌中隨機抽5張牌,判斷是不是一個順子,即這5張牌是不是連續的。2~10為數字本身,A為1,J為11,Q為12,K為13,而大、小王為 0 ,可以看成任意數字。A 不能視為 14。 示例 1: ``` 輸入: [1,2,3,4,5] 輸出: True ``` 示例 2: ``` 輸入: [0,0,1,2,5] 輸出: True ``` ### 答案 ``` class Solution { public boolean isStraight(int[] nums) { Set repeat = new HashSet<>(); int max = 0, min = 14; for(int num : nums) { if(num == 0) continue; // 跳過大小王 max = Math.max(max, num); // 最大牌 min = Math.min(min, num); // 最小牌 // 新增此牌至 Set,加入失敗那就代表有重複 if(!repeat.add(num)) return false; // 若有重複,提前返回 false } return max - min + 1 <= 5; // 最大牌 - 最小牌 + 1 <= 5 則可構成順子,因為包含有0、0、0、9、11的情況