【Python算法】哈希存儲、哈希表、散列表原理

阿新 • • 發佈：2017-08-02

blank images 去掉常用 ack 個數 style middle 1=1

哈希表的定義：

　　哈希存儲的基本思想是以關鍵字Key為自變量，通過一定的函數關系（散列函數或哈希函數），計算出對應的函數值（哈希地址），以這個值作為數據元素的地址，並將數據元素存入到相應地址的存儲單元中。

　　查找時再根據要查找的關鍵字采用同樣的函數計算出哈希地址，然後直接到相應的存儲單元中去取要找的數據元素即可。

哈希表的應用：

　　哈希表(hash table)是實現字典操作的一種有效的數據結構。

　　盡管最壞的情況下，散列表中查找一個元素的時間與鏈表中查找的時間相同，達到了O(n)。

　　然而實際應用中，散列的查找的性能是極好的。在一些合理的假設下，在散列表中查找一個元素的平均時間是O(1)。

建立哈希表操作步驟：

　　1) step1 取數據元素的關鍵字key，計算其哈希函數值（地址）。若該地址對應的存儲空間還沒有被占用，則將該元素存入；否則執行step2解決沖突。

　　2) step2 根據選擇的沖突處理方法，計算關鍵字key的下一個存儲地址。若下一個存儲地址仍被占用，則繼續執行step2，直到找到能用的存儲地址為止。

常用的哈希函數：

　　構造哈希函數的方法有很多，總的原則是盡可能將關鍵字集合空間均勻的映射到地址集合空間中，同時盡可能降低沖突發生的概率。

1、除留余數法：

　　H(Key) = key % p (p ≤ m)

　　取關鍵字除以p的余數作為哈希地址，p最好選擇一個小於或等於m（哈希地址集合的個數）的某個最大素數

哈希表長度	8	16	32	64	128	256	512
最大素數	7	13	31	61	127	251	503

2、直接地址法

　　H(Key) = a * Key + b；這個“a，b”是常量。

3、數字分析法

　　比如有一組key1=112233，key2=112633，key3=119033，

　　針對這樣的數我們分析數中間兩個數比較波動，其他數不變。那麽我們取key的值就可以是 key1=22,key2=26,key3=90。

4、平方取中法

　　此處忽略，見名識意。

5、折疊法

　　比如key=135790，要求key是2位數的散列值。那麽我們將key變為13+57+90=160，然後去掉高位“1”,此時key=60，

　　這就是他們的哈希關系，這樣做的目的就是地址與每一位的key都相關，來做到“散列地址”盡可能分散的目地。

沖突處理方法：

　　影響哈希查找效率的一個重要因素是哈希函數本身。當兩個不同的數據元素的哈希值相同時，就會發生沖突。為減少發生沖突的可能性，哈希函數應該將數據盡可能分散地映射到哈希表的每一個表項中。

　　解決沖突的方法有以下兩種：　

　　(1) 開放地址法　　

　　　　如果兩個數據元素的哈希值相同，則在哈希表中為後插入的數據元素另外選擇一個表項。

　　　　當程序查找哈希表時，如果沒有在第一個對應的哈希表項中找到符合查找要求的數據元素，程序就會繼續往後查找，直到找到一個符合查找要求的數據元素，或者遇到一個空的表項。　　

　　　　①.線性探測法

　　　　　　這種方法在解決沖突時，依次探測下一個地址，直到有空的地址後插入，若整個空間都找遍仍然找不到空余的地址，產生溢出。

　　　　　　H_i =( H(Key) + d_i) % m ( i = 1,2,3,...,k , k ≤ m-1 )

　　　　　　地址增量 d_i= 1,2,...,m-1 , 其中 i 為探測次數

　　　　②.二次探測法

　　　　　　地址增量序列為：d_i= 1²，-1²，2²，-2² ，...，q²，-q² （q ≤ m/2）

　　　　③.雙哈希函數探測法

　　　　　　H_i =( H(Key) + i * RH(Key)) % m ( i = 1,2,3,..., m-1 )

　　　　　　H(Key) , RH(Key)是兩個哈希函數，m為哈希表長度。

　　　　　　先用第一個哈希函數對關鍵字計算哈希地址，一旦產生地址沖突，再用第二個函數確定移動的步長寅子，最後通過步長因子序列由探測函數尋找空余的哈希地址。

　　　　　　H₁ = ( a+b )%m , H₂ = ( a + 2b )%m , ... , H_m-1 = ( a+(m-1)*b )%m

　　(2) 鏈地址法

　　　　將哈希值相同的數據元素存放在一個鏈表中，在查找哈希表的過程中，當查找到這個鏈表時，必須采用線性查找方法。

　　　　技術分享

Python字典dict的實現是使用開放尋址法中的二次探查來解決沖突的。

?? 參考鏈接

【Python算法】哈希存儲、哈希表、散列表原理

blank images 去掉常用 ack 個數 style middle 1=1 哈希表的定義：　　哈希存儲的基本思想是以關鍵字Key為自變量，通過一定的函數關系（散列函數或哈希函數），計算出對應的函數值（哈希地址），以這個值作為數據元素的地址，並將數據元素存入到相

【Python算法】圖與樹的實現

com 遍歷 alt self. als .com 字典分享 def 鄰接列表及其類似結構　　對於圖結構的實現來說，最直觀的方式之一就是使用鄰接列表。下面我們來實現一個最簡單的：假設現在我們有n個節點，編號分別為0，...，n-1。　　然後，每個鄰接列表就是一個數

【貪心算法】背包問題

大小 bag gin sin 相同 ng- lis ron ons 題目：有一個背包，背包容量是M=150。有7個物品，物品可以分割成任意大小。要求盡可能讓裝入背包中的物品總價值最大，但不能超過總容量。物品 A B C D E F G 重量 35 30

【每日算法】高速冪

-1 addclass function -a con 偶數斐波那契數列設置復雜數值的整數次方實現函數 double Power(double base, int n) 求base的n次方，不得使用庫函數。同一時候不須要考慮大數問題。

【Java算法】獲得一個隨機字符串

ring get exti class oid imp brush tint 類型 package suanfa; import java.util.Random; public class RandomStr { public static String get

【Dijkstra算法】Roadblocks

int 長度 print describe lang line plm same paths Time Limit: 2000MS Memory Limit: 65536K Description Bessie has moved

【DLX算法】poj2676 Sudoku

times def char s blog space n) light spa scan DLX算法求解精確覆蓋問題模板。賽場上可以參見白書。 #include<cstdio> #include<cstring> #include<

【二分圖最大匹配】【匈牙利算法】zoj3988 Prime Set

奇數動態 space () print ret min name mes 題意：給你n個正整數，一對和為素數的數為一個合法數對。你選不超過K個合法數對，使得你選的數對涉及到的數的數量最大化。輸出這個值。所有1之間是可以任意兩兩配對的。把奇數放在左側，偶數放在右側。

【基礎算法】位運算-基本運算

-c 我們 stat 掌握 log == led clas pre 上一篇中我們分析了位的定義，這一篇中我們分析一下位的基本運算 1. 移動左移n位：乘以2的n

【初級算法】11.旋轉圖像

clas 另一個 ID () amp rotate size swa 說明題目：給定一個 n × n 的二維矩陣表示一個圖像。將圖像順時針旋轉 90 度。說明：你必須在原地旋轉圖像，這意味著你需要直接修改輸入的二維矩陣。請不要使用另一個矩陣來旋轉圖像。

【初級算法】14. 字符串中的第一個唯一字符

字符串如果 str 英文字母 turn size span div UC 題目：給定一個字符串，找到它的第一個不重復的字符，並返回它的索引。如果不存在，則返回 -1。案例: s = "leetcode" 返回 0. s = "loveleetcode", 返回

【初級算法】15. 有效的字母異位詞

color isa 算法 pre 返回 bool 一個 () AS 題目：給定兩個字符串 s 和 t ，編寫一個函數來判斷 t 是否是 s 的一個字母異位詞。例如， s = "anagram"，t = "nagaram"，返回 true s = "rat"，t =

【簡單算法】19.數數並說

整數 else 其中統計一個數輸出 AR 題目新的題目：數序列是指一個整數序列，按照其中的整數的順序進行報數，得到下一個數。其前五項如下： 1. 1 2. 11 3. 21 4. 1211 5. 111221 1 被讀

【簡單算法】20.最長公共前綴

div false span lower color bre 簡單包含 turn 題目：編寫一個函數來查找字符串數組中的最長公共前綴。如果不存在公共前綴，返回空字符串 ""。示例 1: 輸入: ["flower","flow","flight"] 輸出: "

【初級算法】16. 驗證回文字符串

回文串定義 man art pla bool 回文字符串驗證和數題目：給定一個字符串，驗證它是否是回文串，只考慮字母和數字字符，可以忽略字母的大小寫。說明：本題中，我們將空字符串定義為有效的回文串。示例 1: 輸入: "A man, a plan, a

【簡單算法】32.第一個錯誤的版本

查找好的有意思 HA for vector size 新版本之前題目：你是產品經理，目前正在領導一個團隊開發一個新產品。不幸的是，您的產品的最新版本沒有通過質量檢查。由於每個版本都是基於之前的版本開發的，所以錯誤版本之後的所有版本都是不好的。假設你有 n 個

【簡單算法】33.爬樓梯

公式算法 color 不同遞推公式 for AI 每次 ++ 假設你正在爬樓梯。需要 n 步你才能到達樓頂。每次你可以爬 1 或 2 個臺階。你有多少種不同的方法可以爬到樓頂呢？註意：給定 n 是一個正整數。示例 1：輸入： 2 輸出： 2 解釋：有

【簡單算法】36.打家劫舍

一個如果同時金額計劃 for 不能能夠推公式題目：你是一個專業的小偷，計劃偷竊沿街的房屋。每間房內都藏有一定的現金，影響你偷竊的唯一制約因素就是相鄰的房屋裝有相互連通的防盜系統，如果兩間相鄰的房屋在同一晚上被小偷闖入，系統會自動報警。給定一個代表每個房

【簡單算法】39.最小棧

spa tor min HERE data 示例 ctu 最小 nbsp 題目：設計一個支持 push，pop，top 操作，並能在常數時間內檢索到最小元素的棧。 push(x) -- 將元素x推入棧中。 pop() -- 刪除棧頂的元素。 top() -- 獲取棧頂

【簡單算法】43.羅馬數字轉整數

style nbsp 輸入題目 ring 適用於包含整數 man 題目：羅馬數字包含以下七種字符：I， V， X， L，C，D 和 M。字符數值 I 1 V 5 X 1

【Python算法】哈希存儲、哈希表、散列表原理

相關推薦