KMP字串匹配演算法詳解

阿新 • • 發佈：2019-01-02

　　KMP演算法利用匹配失敗後的資訊，儘量減少模式串與主串的匹配次數以達到快速匹配的目的。具體實現就是實現一個next()函式，函式本身包含了模式串的區域性匹配資訊。時間複雜度O(m+n)。

Next()函式的詳解

把將要進行next計算的字串S分成 k ，j 前後兩串，k代表前串開頭所在的序號，j代表後串開頭所在的序號，起始的時候j=1，k=0。
我們比較一下前串後串是否相等，要怎麼比較呢，肯定是比較S[j]==S[k],如果相等，那麼next[j+1]=k+1，然後j++，k++。關鍵就是理解這個next[j+1]=k+1（為什麼k+1？）：簡單說就是S串中的第j+1個字元的next函式值由他前面的字元與前串相等的個數來決定，就是說串中的第j+1個字元的next函式值，是由他前面的字串決定的。

當S[j]！=S[k],即不相等的時侯，那麼j不動，k返回到開頭（因該是next[k]位置，便於理解先假設是返回k=0處），即從頭比較S[0]與S[j]，S[1]與S[j+1]。

　　例如：第 j+1 個字元的next函式值next[j+1]等於3，意味著它的前三個字串，S[j-2]S[j-1]S[j] =S[0]S[1]S[2]。

例一：模式串：abcaabcba

下標

模式串

next值

-1

1.第一個字元的next值令為-1。令第二個字元b的next值為0。初始k=0，j=1。開始比較S[k] 和S[j]。

2.比較S[0] !=S[1]，所以j++，k不變，next[j=2]=k=0。

3.比較S[0] !=S[2]，所以j++，k不變，next[j=3]=k=0。

4.比較S[0]==S[3]，所以j++，k++，next[j=4]=k=1。

5.k=1了，所以比較S[1] !=S[4]，k返回到next[k]位置，即k=next[1]=0，然後比較S[k=0] == S[4]，所以 j++，k++，next[j=5]=k=1。

6.比較S[1]==S[5]，所以j++，k++，next[6]=k=2。

7.比較S[2]==S[6]，所以j++，k++，next[7]=k=3。

8.比較S[3] !=S[7]，所以k返回到next[k=3]位置，即k=next[3]=0，然後比較S[k=0] !=S[7]，所以j++，k=0不變，next[8]=k=0。

在例一中，每次不相等時返回的都是k=next[k]=0，都是返回到了開頭，下面一個不是返回到開頭0的情況：

例二：模式串：aabcaaabaac

下標	0	1	2	3	4	5	6	7	8	9	10
模式串	a	a	b	c	a	a	a	b	a	a	c
next值	-1	0	1	0	0	1	2	2	3	1	2

從 j=5，k=1的時候開始

5．比較S[1]==S[5]，所以j++，k++，next[j=6]=k=2。

6．比較S[2] !=S[6]，所以k返回到next[k=2]位置，即k=next[2]=1,然後比較S[k=1]==S[6]，所以 j++，k++，next[7]=k=2。

……

因此，發現K的退回是退回到next[k]的位置，即S[j]!=S[k]時，k=next[k]。

KMP的演算法思想

和BF演算法相比，KMP演算法主要是在模式串上下功夫，通過先求得模式串對應的next[ ]陣列，當兩個字串中字元匹配失敗時候將模式串的下標回溯到next[ ]中儲存的下標位置，而BF演算法是直接回溯到模式串的0下標，即開始第一個字元。所以KMP演算法的時間複雜度要比BF演算法好。

KMP演算法程式碼

 1 #include<stdio.h>
 2 #include<string.h>
 3 
 4 char* s = "aabcaaabaac";
 5 char* t = "aac";
 6 
 7 int next[100];  //定義next陣列 
 8 
 9 void getNext(char *s, int next[])
10 {
11     int k=-1;   / /k代表前串起始位置
12     int j=0;    //後串起始位置，一直增加
13     next[0] = -1;   //令第一個字元的next值為-1
14     
15     while(j < strlen(s) - 1)    //當後串小於最大下標-1 
16     {
17         if(k == -1 || s[j] == s[k]) //匹配的情況下,即s[j]==s[k]，next[j+1]=k+1;
18         {
19             ++j;
20             ++k;
21             next[j] = k;
22         }
23         else                   //若不匹配，即p[j]!=p[k]，k=next[k]
24             k = next[k];
25     }
26 }
27 
28 int KMP(char* s, char* t)
29 {
30     int i = 0;  //i從s串開始 
31     int j = 0;  //j從t串開始 
32     int sLength = strlen(s);    //s串的長度 
33     int tLength = strlen(t);    //t串的長度 
34     while((i < sLength) && (j < tLength))   //當下標i和j都不越界時
35     {
36         if(j == -1 || s[i] == t[j])     //當模式串t中第一個字元與目標串s中某個字元匹配失敗時，i應該移動到目標串s的下一個目標，再和模式串t的第一個字元進行比較，或者s的第i個字元和t的第j個字元相等，則將i++和j++ 
37         {
38             i++;
39             j++;
40         }
41         else
42         {
43             //i=i-j+1;j=0;  //這是普通的BF演算法,將模式串的下標從0開始 
44             j = next[j];    //KMP演算法是將模式串的j下標從next[j]開始 
45         }
46     }
47     if(j >= tLength)
48         return i - tLength;
49     else 
50         return 0;
51 }
52 
53 int main()
54 {
55     getNext(s, next);
56     printf("%d", 1 + KMP(s, t));
57     return 0;
58 }

KMP字串匹配演算法詳解

　　KMP演算法利用匹配失敗後的資訊，儘量減少模式串與主串的匹配次數以達到快速匹配的目的。具體實現就是實現一個next()函式，函式本身包含了模式串的區域性匹配資訊。時間複雜度O(m+n)。 Next()函式的詳解把將要進行next計算的字串S分成 k ，j 前後兩串，k代表前串開頭所在的序號，j

詳解KMP字串匹配演算法

字串匹配字串匹配一般是指在較長的一個字串A中查詢是否含有較短字串B、B在A中的位置的過程。最容易想到、也是最長用的一種辦法是暴力匹配。String.contains() 用的就是這種方法，應該說這種簡單的方法用的還是特廣泛的。 KMP演算法 KMP演算法俗稱“看毛

KMP字串匹配演算法

寫在前面 KMP演算法典型例題輸入第一行一個整數N，表示測試資料組數。接下來的N*2行，每兩行表示一個測試資料。在每一個測試資料中，第一行為模式串，由不超過10^4 個大寫字母組成，第二行為原串，由不超過10^6 個大寫字母組成。其中N<=20

bi-interval匹配演算法詳解

一、引數說明 T=ACGTCTCGAGACGT |T|=14 T[i]=第i個鹼基 T[i,j]=第i到第j個鹼基的字串 Ti 整個的字串 S：S（i）是第i小的陣列的位置 B[i]=尾綴陣列 C（a)共四個值，分別為C(A)C(C)C(G)C(T)

尺度不變特徵變換匹配演算法詳解Scale Invariant Feature Transform(SIFT)

對於初學者，從David G.Lowe的論文到實現，有許多鴻溝，本文幫你跨越。如果你學習SIFI得目的是為了做檢索，也許OpenSSE更適合你，歡迎使用。 1、SIFT綜述尺度不變特徵轉換(Scale-invariant feature transform

BF和KMP字串匹配演算法

我們平時在使用 java 程式設計中，判斷一個字串是否包含另一個字串可以使用 String 自帶的方法或者正則表示式，但是inde

模式串匹配之KMP演算法詳解

KMP演算法，是由Knuth，Morris，Pratt共同提出的模式匹配演算法，其對於任何模式和目標序列，都可以線上性時間內完成匹配查詢，而不會發生退化，是一個非常優秀的模式匹配演算法。但是相較於其他模式匹配演算法，該演算法晦澀難懂，第一次接觸該演算法的讀者往往會看得一頭

面試演算法之字串匹配演算法，Rabin-Karp演算法詳解

既然談論到字串相關演算法，那麼字串匹配是根本繞不過去的坎。在面試中，面試官可能會要你寫或談談字串的匹配演算法，也就是給定兩個字串，s 和 t, s是要查詢的字串，t是被查詢的文字，要求你給出一個演算法，找到s在t中第一次出現的位置，假定s為 acd, t為a

【模式匹配】之 —— KMP演算法詳解及證明

本文所述KMP演算法原始碼可在這裡下載： Name Date Reason for change Revision 超然 2013.03.19 First version 1.0 超然 2013.04.15 Added

KMP演算法詳解及各種應用

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

二分圖最大權值匹配 KM演算法模板 KM演算法詳解+模板

KM演算法詳解+模板大佬講的太好了！！！太好了！！！ http://www.cnblogs.com/wenruo/p/5264235.html KM演算法用來求二分圖最大權完美匹配。本文配合該博文服用更佳：趣寫算法系列之--匈牙利演算法 &nbs

（轉載）KMP演算法詳解（原創）詳解KMP演算法

轉自https://www.cnblogs.com/yjiyjige/p/3263858.html （原創）詳解KMP演算法作者：孤~影 KMP演算法應該是每一本《資料結構》書都會講的，算是知名度最高的演算法之一了，但很可惜，我大二那年壓根就沒看懂過~~~ 之後也在很多地方也都經常看

字串匹配演算法之KMP演算法詳情

package demo; /* 字串匹配演算法 */ public class StringKMP { //找出從第一個字元開始子串T在主串S的第一個位置如果沒有則返回-1 public static int index(String S, String T)

KMP演算法詳解

KMP演算法應該是每一本《資料結構》書都會講的，算是知名度最高的演算法之一了，但很可惜，我大二那年壓根就沒看懂過~~~ 之後也在很多地方也都經常看到講解KMP演算法的文章，看久了好像也知道是怎麼一回事，但總感覺有些地方自己還是沒有完全懂明白。這兩天花了點時間總結一下，有

字串匹配演算法---BF及KMP

字串匹配的一般演算法（BF）以 ABSABABCEF 與 ABCE 為例，求串2與串1匹配的第一個位置的下標（這裡即輸出 5），一般的，我們可以從串1的起始位置開始與串2比較，若相同則兩串都向後移，否則，串1回到第二個位置，串2回到起始位置重新比較。程式碼：（

二分圖最大匹配之Hopcroft-Karp演算法詳解

Hopcroft-Karp演算法原連結該演算法由John.E.Hopcroft和Richard M.Karp於1973提出，故稱Hopcroft-Karp演算法。原理為了降低時間複雜度，可以在增廣匹配集合M時，每次尋找多條增廣路徑。這樣就可以進一步降低時間複雜度

KMP Algorithm 字串匹配演算法KMP小結

這篇小結主要是參考這篇帖子從頭到尾徹底理解KMP，不得不佩服原作者，寫的真是太詳盡了，讓博主產生了一種讀學術論文的錯覺。後來發現原作者是寫書的，不由得更加敬佩了。博主不才，嘗試著簡化一些原帖子的內容，希望能更通俗易懂一些。博主的帖子一貫秉持通俗易懂的風格，使得非CS專業的人士也能讀懂，至少博主自己是這麼認

字串匹配演算法——KMP演算法

KMP演算法是一種改進的字串匹配演算法。KMP演算法的關鍵是利用匹配失敗後的資訊，儘量減少模式串與主串的匹配次數以達到快速匹配的目的。具體實現就是實現一個next()函式，函式本身包含了模式串的區域性匹配資訊。下面從一個例子來了解KMP演算法：字串"BBC ABCDAB ABCD

KMP演算法（字串匹配演算法）

KMP演算法主要是要計算匹配字元的字首表（prefix table），舉例：如下面字串的字首表就是陰影框框中的部分。利用字首表來進行匹配例子：(匹配字元)p=ABABCABAA, （待匹配字元）t=ABABABABCABAAB 具體主要就是求字首表，然後將

KMP演算法：O(n)線性時間字串匹配演算法

KMP演算法包括兩個子程式。其中KMP-MATCHER指字串匹配子程式，COMPUTE-PREFIX則為部分匹配表NEXT[]生成程式。《演算法導論》一書中有一句話，我認為說的非常透徹：“這兩個程式有很多相似之處，因為它們都是一個字串對模式P的匹配：KMP-MATCHER是文字T針對模式P的

KMP字串匹配演算法詳解

Next()函式的詳解

KMP的演算法思想

KMP演算法程式碼

相關推薦