KMP(MP)演算法詳解

阿新 • • 發佈：2019-01-17

Written with StackEdit.
由於CSDN伺服器的維護，我迫不得已地用了和CSDN版本相近的StackEdit

KMP演算法，是一種字串匹配的演算法。當然，我們已經學過了一兩種字串匹配演算法，先來稍微回顧一下。
首先是暴力匹配，也就是將串中每一個長度等於另一串的子串和另一串進行匹配。若兩串的長度為n和m，那麼其的時間複雜度顯然是O(nm)。
然後是雜湊。雜湊在本質上是一種概率演算法，實際上是採用了一種對映的方法，如果將所有被雜湊之前的字串的集合設為A，而被雜湊之後的字串的雜湊值集合設為B，那麼也就相當於定義了一個對映Hash:A→B，注意這不是一個單射，因為在大多數的情況下，有|

A|<|B|。當然，有很多方法改進，但是隻有完美雜湊使得它不再算一個概率演算法，然而完美雜湊本身的操作過於繁瑣，一般適用於字串不變的情況，如編譯器中的指令。實際上，雜湊演算法的本質和暴力是一致的，但是由於對映的存在，使得雜湊演算法要比較的東西就不那麼多了，就像暴力演算法中只抽樣比幾位一樣，但是雜湊演算法相當於是在每一位中都抽一點點的樣（有些時候不是這樣），所以更為準確一些。其的時間複雜度為Θ(n+mlogvMod)，其中v是計算機所採用的進位制（如現在的一般採用二進位制，不排除以後有更高進位制的計算機，或者要求相關的互動題:)），Mod則是你所使用的模數（因為我們當時只學了一種雜湊:-(）。
好吧，回顧完了，我們來稍微瞭解一些關於K

MP的東西。KMP的本質是暴力匹配的優化，而其有一個較為簡單的版本，MP。本文介紹時將先介紹MP演算法，再比較KMP與MP之間那一個′K′的不同。
考慮暴力演算法，其思路大致是用指標i和j分別遍歷兩個串，然後當失配（即兩個指標對應的字元不相等時）回到兩個串“前面的位置”，也就是像回溯一樣不斷嘗試。
但是，這樣單純地找，有時是不會有好結果的。如下所示，兩個串A和B：

A:abababcB:ababc
其中，若在串A中找串B，那麼第一次嘗試匹配到ababa時，只有最後一位的a和c不一樣。但是，這時我們注意到，串B中有兩個ab，所以當回溯時，我們並不用將串A中的指標i前移，而只需將B中的指標j

前移到開頭即可。若設A=a1a2a3a4…，B=b1b2b3b4…，那麼因為已經比較，所以自然有a1=b1,a2=b2,a3=b3,a4=b4，於是又由於我們已知b1=b3,b2=b4，那麼就有b1=a3,b2=a4。所以，只需從原位置繼續開始即可。
MP演算法正是基於這樣的一種思想。倘若存在某個[1,j]=[i−j,i]，那麼我們定義j=next(i)，表示當在i位置的字元失配時應當跳到哪裡。其的求法我們先不管，但是這樣一來匹配就很好寫了，程式碼這裡略去，請自行查詢資料。
那麼，next(i)的求法又應當是怎樣的呢？答案是：幾乎和匹配一樣！想想看，next(i)的求解，不正相當於是用自己匹配自己嗎？假如我們知道next(i)，那麼我們能找到一個j，使得串S中有Si+1=Sj+1（當然，有時找不到，這時只需要設為一個特殊值就行了:)）那麼這樣的話，就應當有next(i+1)=j+1。
這，就是MP演算法的全套，至於KMP演算法，請自行查閱資料。

KMP(MP)演算法詳解

KMP(MP)演算法詳解

KMP演算法詳解及各種應用

（轉載）KMP演算法詳解（原創）詳解KMP演算法

KMP演算法詳解

轉自知乎-我見過最通俗易懂的KMP演算法詳解

小白之KMP演算法詳解及python實現

KMP字串匹配演算法詳解

模式串匹配之KMP演算法詳解

【模式匹配】之 —— KMP演算法詳解及證明

拓展KMP演算法詳解

KMP演算法詳解，關於NEXT陣列及其改進

KMP演算法詳解以及程式碼實現

通俗易懂的KMP演算法詳解（嚴蔚敏版C語言）

KMP算法詳解

KMP算法詳解（轉）

字符串kmp算法詳解

拓展KMP算法詳解

KMP算法詳解V1

php openssl_sign() 語法+RSA公私鑰加密解密,非對稱加密演算法詳解

Show, attend and tell演算法詳解及原始碼

KMP(MP)演算法詳解

相關推薦