KMP的個人向總結（面向自己）--by wxj

阿新 • • 發佈：2018-11-10

之前學過KMP演算法，但是當時學的時候就是比較模糊，對於它的認知也處在會用，會寫的層次，但是對於它的內部的實現原理，仍是似懂非懂的狀態，現在老師講到字串匹配演算法的時候，我就重新學了一遍KMP，感覺之前有所疑惑的地方清晰了許多，趁現在對KMP仍有比較清晰的認知（個人覺得），趕緊記錄下來，便於以後溫習；

KMP，字串的匹配演算法，複雜度O(n+m)，母串n+子串m，也就是說遍歷一遍就可得出答案，相對傳統的暴力匹配O(n*m)快了不是一星半點，~~當然也繞的不是一星半點；~~

KMP演算法就是跳過重複的或著必定不會是答案的那段字串，來節省不必要的時間；

例如：（存在返回首個下標，不存在返回-1）母串中查詢子串；

母串：abdabcabda

子串：abcab；

這麼簡單的我們當然可以肉眼直接看了，但是計算機是不會直接看的，正常情況下，一個一個比較（暴力m*n）比較簡單，也容易實現，就不寫了，沒什麼意思，下面我們用KMP的方法查詢母串：

首先我們要處理出子串的回溯陣列，回溯陣列是KMP的靈魂，它的作用就是在子串失配時直接跳轉到失配字元的上一個配對字元的位置；

子串的處理結果如下：（下標從0開始）

a b c a b

-1 0 0 0 1

這些數字的含義就是該位置的字元可回溯的位置；

看不懂沒關係，我們可以先這樣寫回溯陣列：（下標從1開始）

a b c a b

0 0 0 1 2

這個意思很容易看懂吧，就是第i個字元是從頭開始的第幾位（和前面的那個位置的字元時相等的）

很明顯，abc是第一組，ab可以在前面找到abc中的ab，因此對應的是1,2

將這個陣列向右移動一位，前面補-1，即可得出回溯的陣列；

得到了回溯陣列，接下來就可以根據回溯陣列進行快速匹配了；

首先，比較：（以後我預設以下標從0開始）

abdabcabda

abcab

-1 0 0 0 1

很顯然，在第2處不一樣，因為c的前面沒有重複的元素（回溯到0），因此直接就可以跳到0的位置：

abdabcabda

abcab

這樣就相當於跳過了母串1位置元素的匹配了（因為這個位置是必定不可能匹配到的，~~可證明但我不證明~~）；

然後再次比較：再往後移動

abdabcabda

abcab

然後發現，匹配成功！

當然這個只是簡單的例子，原理就是這個了，下面開始介紹如何求解回溯陣列；

KMP的靈魂是回溯陣列的應用（個人感覺）

程式碼鎮樓：（下面解釋）

//            p子串  lp子串長度  nxt回溯陣列儲存的陣列
void get_nxt(char *p,int lp,int nxt[])
{//對於一個子串 ，nxt陣列記錄的是第i位置的字元他之前重複出現的字元的位置(如果在首位置，則全面的字元為-1) 
	nxt[0]=-1;//第0個元素沒有前面相同的字元，初始化-1 
	int k=-1,j=0;//k(前面元素的位置)， 
	while(j<lp)
	{
		if(k==-1||p[j]==p[k])//該字元在首位置||字元相等（可回溯到前面）
		{
			++k;
			++j;
			nxt[j]=k;//該位置能夠回溯的位置
		}
		else
			k=nxt[k];//如果字元不等，繼續向前回溯
	}
}

附帶一個樣例：

i：ababdababc

j：ababc

-1 0 0 1 2

第一次位移：

i：ababdababc

j： ababc

j=2；p[j]='a';比較a和d，

i：ababdababc

j： ababc

然後繼續j=0比較a個d，

i：ababdababc

j： ababc

之後j=-1，向後移動。

~~反正我看了這個樣例之後很清楚~~

KMP比較的程式碼比較簡單，就是按照上面的跑一邊即可：

//          s母串  p子串  ls母串長度 lp子串長度  nxt陣列儲存回溯位置
void KMP(char *s,char *p,int ls,int lp,int nxt[])
{
	int ans=-1,i=0,j=0;
	while(i<ls)
	{
		//cout<<i<<" "<<j<<endl;
		if(j==-1||s[i]==p[j])//配對繼續走
		{
			++i;
			++j;
		}
		else//失配回溯
			j=nxt[j];
		if(j==lp)//檢視是否匹配完成
		{
			cout<<i-lp<<endl;//返回母串的下標
			return ;
		}
	}
	cout<<"NO FIND!"<<endl;//母串中沒有子串
}

這樣就比較清楚了，寫完之後覺得比較清晰了。還是太菜啊！一個KMP拖到現在......

最後的是我的測試程式碼：

//#pragma comment(linker, "/STACK:1024000000,1024000000") 

#include<stdio.h>
#include<string.h>  
#include<math.h>  
  
//#include<map>   
//#include<set>
#include<deque>  
#include<queue>  
#include<stack>  
#include<bitset> 
#include<string>  
#include<fstream>
#include<iostream>  
#include<algorithm>  
using namespace std;  

#define ll long long  
//#define max(a,b) (a)>(b)?(a):(b)
//#define min(a,b) (a)<(b)?(a):(b) 
#define clean(a,b) memset(a,b,sizeof(a))// 水印 
//std::ios::sync_with_stdio(false);
const int MAXN=1e5+10;
const int INF=0x3f3f3f3f;
const ll mod=1e9+7;

void get_nxt(char *p,int lp,int nxt[])
{//對於一個子串 ，nxt陣列記錄的是第i位置的字元他之前重複出現的字元的位置(如果在首位置，則全面的字元為-1) 
	nxt[0]=-1;//第0個元素沒有前面相同的字元，初始化-1 
	int k=-1,j=0;//k(前面元素的位置)， 
	while(j<lp)
	{
		if(k==-1||p[j]==p[k])//如果第一次出現 
		{
			++k;
			++j;
			nxt[j]=k;
		}
		else
			k=nxt[k];
	}
}

void KMP(char *s,char *p,int ls,int lp,int nxt[])
{
	int ans=-1,i=0,j=0;
	while(i<ls)
	{
		//cout<<i<<" "<<j<<endl;
		if(j==-1||s[i]==p[j])
		{
			++i;
			++j;
		}
		else
			j=nxt[j];
		if(j==lp)
		{
			cout<<i-lp<<endl;
			return ;
		}
	}
	cout<<"NO FIND!"<<endl;
}
/*
3
abdbababcadd
abcab
abdbbcabcbab
abcab

*/
int main()
{
	int T;
	cin>>T;
	while(T--)
	{
		char s[MAXN],p[MAXN];
		//s母串，p子串 
		int nxt[MAXN];
		//子串中記錄前驅字元的位置陣列 
		clean(nxt,0);//初始化 
		cin>>s>>p;
		int lp=strlen(p),ls=strlen(s);
		get_nxt(p,lp,nxt);//獲取nxt陣列 
//		for(int i=0;i<=lp;++i)
//			cout<<nxt[i]<<" ";
//		cout<<endl; 
		KMP(s,p,ls,lp,nxt);
	}
}

KMP的個人向總結（面向自己）--by wxj

個人作業3——個人總結（Alpha階段）

view 做成名詞估算支持多語言擴展常用模塊不同的日誌 1.說到軟件工程作業，很多同學都曾經苦惱過，想放棄。可是，當你堅持寫完的時候，突然間心情大好，發現原來自己能做得到。我也是這樣，缺乏自信心了，沒有人在後面推一把，就很難前進。框架吧，是用來打破的。我們不能

個人作業3--個人總結（Alpha階段）

target 愛好項目 leader 平衡構建個人總結 spa 發的我們也算是經過了一次軟件開發的人了，在Alpha階段過程和結果都不太理想，我們在寫事後諸葛亮會議的時候也感慨了很多，在小組會議的時候也討論了很多，為了完成這次作業，我又翻了翻《構建之法》這本書。這本

個人沖擊階段總結（第一階段）

發生通過 ron center enter 組件今天 and 總結第一沖刺階段：第一天昨天做了什麽：無今天準備做什麽：學習配置安卓開發環境。遇到的困難：不太適應Android Studio的編程環境。第二天昨天做了什麽：學習配置安卓開發環境。今天準備

2018年浙江網新恒天軟件公司秋季校招宣講會個人經歷總結（測試崗-應屆生）

軟件公司英文小菜公司區別企業路線題目教室筆者是一名溫州大學的大四學生，有幸在前幾天收到浙江網新恒天的OFFER，投遞得是軟件測試一崗。說起面試經歷，現在想起仍感覺這是自己是比較幸運的一次經歷，用我那位帶我一同參加宣講會的室友的話說，就是“無心插柳柳成蔭”吧

畢向東—Java基礎知識總結（超級經典）

Java基礎知識總結（超級經典）　　寫程式碼：　　　　1，明確需求。我要做什麼？　　　　2，分析思路。我要怎麼做？1,2,3。　　　　3，確定步驟。每一個思路部分用到哪些語句，方法，和物件。　　　　4，程式碼實現。用具體的java語言程式碼把思路體現出來。 &nbs

2018 年騰訊前端一面總結（面向 2019 屆學生）

前言騰訊一面，相比阿里一面來說，騰訊一面先給打電話預定時間，這也給了我們這些面試者去準備的時間。但是也正是因為這種確定性，也有在等待電話的時候的心情的忐忑。背景我是一名大三學生，大一在學校acm集訓隊，後來轉向學習java，又去開發Android，在期間，學會怎麼

Java個人技術知識點總結（框架篇）

框架篇 Struts1的執行原理在啟動時通過前端總控制器ActionServlet載入struts-config.xml並進行解析，當用戶在jsp頁面傳送請求被struts1的核心控制器ActionServlet接收，ActionServlet在使用者請求時將請求引數放

java設計模式個人總結（第一篇）

java設計模式可將其分為三種類型：建立型、結構型、行為型。建立型有：工廠模式（Factory）單例模式（singleton）Builder模式(生成器模式)原型模式（Prototype）壹.工廠模式（Factory）（典型案例：製造商品流水）

Nobleman__ ACM 比賽模板（C++ && Java）個人總結（不斷更新）（自用）

宣告：本人剛學演算法一年，都是自己做題常用的模板，不時總結下。大致分為：亂七八糟，數論，圖論，動態規劃，幾何，Java 還有一些奇葩定理，奇葩定理：【1】高效求出n的約數的個

鳥哥私房菜shell和shell指令碼總結（僅自己看）

1、 cat 顯示內容，和echo寫入區別 2、 $0 為返回值 3、 &後臺執行命令，例子：程式名& 4、 echo 後邊什麼也不接當做回車使用 5、 bash是shell的一種。 6、不打#！/bin/sh 將不能使用內建命令 7、 ec

android ble藍芽開發總結（附帶自己專案中提取整理的demo地址）

一些基本的知識我就不寫了，很多其他部落格都可以查到。我主要寫幾點我在其他部落格沒有看到的東西以及我在實際開發中遇到的問題。最後我會貼上程式碼的地址。 1.需要設定2個或3個uuid。通常連線裝置後會得

個人對nandflash驅動的總結（ok6410版）

1，首先說明要用nandflash的原因，當你從nand啟動時，6410中的硬體會自動將nand中的8k內容拷貝到開發板中記憶體空間的iRAM中，然後iRAM再將這8k內容拷貝到內從中進行執行，一旦nand中的內容大於8k則多餘的那些將無法被拷貝機執行，因此需要一個驅動程

C++常用小技巧個人總結（持續更新）

求任意陣列長度 sizeof(array) / sizeof(array[0]), ※c++多關鍵字排序： struct node { int a;int b;int c;//三重引數 friend bool operator<(const node &am

2011的總結（感謝自己，感恩他人）【轉自我的新浪部落格】

從小學開始，我就夢想著一個舞臺，是個大舞臺，總有一天，我會駕著七彩祥雲走上去，獲得一個光榮的獎項。只是，我夢到了開頭，卻不知道結局。我從來沒有走上過這樣一個舞臺，也沒有獲得這樣一個光榮的獎項。中學以前學習成績一般，大學學習好了，但也不流行頒獎

常見的瀏覽器相容性問題總結（有自己遇到的還有網上大神總結的）

opacity:0.5; This is the “most important” one because it is the currentstandard in CSS. This will work in most versions of Firefox, Safari, andOpera.This

springboot學習總結（十二）BeanDefinitionRegistryPostProcessor向spring容器中註冊bean

strac autowired true all 方法 brush autowire tee sync （一）功能實現了BeanDefinitionRegistryPostProcessor接口的類，可以在覆寫的postProcessBeanDefinitionRegi

spring原始碼個人總結（待完成）

一、模組劃分 Core Container Core 核心工具類 B

深入理解Java虛擬機器--個人總結（持續更新）

# 深入理解Java虛擬機器--個人總結（持續更新） **每天按照書本學一點，會把自己的總結思考寫下來，形成輸出，持續更新，立帖為證** ```java -- 2020年7月7日開始第一次學習 -- 2020年7月8日今天在百忙Rush B中抽出時間，學了點習，計劃明天把本地方法棧和Java堆看完總結

FFmpeg總結（十二）用ffmpeg與nginx實現直播多路流並發播放

xxx 開源 conf ref itl rect arc med rtm 圖：撒哈拉沙漠下載 nginx 和 nginx-rtmp源碼： http://nginx.org/download/nginx-1.5.10.tar.gz https://github.com/a

KMP的個人向總結（面向自己）--by wxj

母串：abdabcabda

子串：abcab；

a b c a b

-1 0 0 0 1

a b c a b

0 0 0 1 2

abdabcabda

abcab

abdabcabda

abcab

abdabcabda

abcab

i：ababdababc

j：ababc

i：ababdababc

j： ababc

i：ababdababc

j： ababc

i：ababdababc

j： ababc

相關推薦