資料結構——串的樸素模式和KMP匹配演算法

阿新 • • 發佈：2019-02-02

一、樸素模式

假設我們要從主串S=”goodgoogle"中找到子串T=“google"的位置，步驟如下：

i表示主串的當前位置下標，j表示子串的當前位置下標，如上圖在第一輪比較（i=1開始）中j=4和i=4的位置不匹配，接下來就要指標回退，從i=2開始比較，如下：

如此反覆直到比較到 i =（主串長度-子串長度+1）的位置或者 j = 子串的長度就退出比較迴圈，上面的主串和子串在比較到i=5的位置就完全匹配了。

#include <stdio.h>

int Index(const char S[], const char T[], int pos){
	int i = pos; //主串當前下標
	int j = 1;	 //子串當前下標
	//S[0]是主串的長度，T[0]是子串的長度
	while(i <= S[0] && j <= T[0]){
		//如果相等則繼續向下比較
		if(S[i] == T[j]) {
			++i;
			++j;
		//如果不等則指標回退
		}else{
			i = i - j + 2; //主串回退
			j = 1;
		}
	}
	//j>T[0]則說明子串被完全匹配
	if( j > T[0]) return i - T[0];
	else return 0;
}

int main(){
	char S[] = {10, 'g', 'o', 'o', 'd', 'g', 'o', 'o',
		'g', 'l', 'e'};	
	char T[] = {6, 'g', 'o', 'o', 'g', 'l', 'e'};
	int i =	Index(S, T, 1);
	printf("%d\n", i);

	return 0;
}

分析一下這種匹配演算法最好的情況時間複雜度是O(1)只需要一次比較，最壞的情況是每次最後一個字元不匹配，時間複雜度是O(m*n) m是主串長度n是子串的長度。

二、KMP演算法

像二進位制這樣的多個0和1重複的字串，上面的模式匹配需要挨個遍歷是非常慢的，KMP演算法可以大大避免重複遍歷的情況。

下面我們來看看KMP演算法的基本原理

如上，可以看到主串S和子串T在第一輪比較的時候，前面5個相等，只有i=6和j=6的位置不等。由於子串T中abcde這5個字元本身互不相等，可以知道子串T中a就不可能和j=2、3、4、5的位置的字元相等。所以可以直接跳到i=6的位置進行比較。

再看上圖，如果子串T中存在重複的元素（比如j=1,2和j=4,5處的字元），按照上面的分析，我們可以直接跳到i=4的位置比較，但是我們已經知道j=1,2和j=4,5相等，並且i=4,5和j=4,5相等，所以可以不用比較i=4,5和j=1,2。

KMP模式匹配演算法就是為了不讓i指標回退，既然i值不回退，我們就要考慮變化j的值了。通過上面的觀察可以發現，j值的變化與主串其實沒有什麼關係，而是取決於子串T中是否有重複問題。

我們把T串各個位置的j值的變化定義為一個數組next,那麼next的長度就是T串的長度，可以得到下面函式：

#include <stdio.h>

void get_next(const char T[], int *next){
	
	int i,j;
	i = 1;
	j = 0;
	next[1] = 0;
	//T[0]是子串T的長度
	while(i < T[0]){
		//T[i]表示字尾的單個字元
		//T[j]表示字首的單個字元
		if( j==0 || T[i] == T[j]){
			++i;
			++j;
			next[i] = j;
		}else{
			j = next[j];
		}
	}
}

int Index_KMP(const char S[], const char T[], int pos){
	int i = pos;
	int j = 1;
	int next[255];
	get_next(T, next);

	while(i <= S[0] && j <= T[0]){
		//相對於樸素演算法，增加了一個j==0的判斷
		if( j==0 || S[i] == T[j]){
			++i;
			++j;
		}else{
			//j回退到合適的位置，i的值不變
			j = next[j];
		}
	}
	if( j>T[0]){
		return i-T[0];
	}else{
		return 0;
	}
}
int main(){

	return 0;
}

資料結構——串的樸素模式和KMP匹配演算法

資料結構——串的樸素模式和KMP匹配演算法

資料結構- 串的模式匹配演算法 BF和 KMP演算法

資料結構- 串的模式匹配演算法： KMP演算法

資料結構——串的模式匹配演算法

資料結構---串的模式匹配演算法介紹

[從今天開始修煉資料結構]串、KMP模式匹配演算法

資料結構——串—串的模式匹配演算法

資料結構串的順序表示和實現

資料結構-串- BF（樸素）演算法

資料結構實現順序表和多項式計算

資料結構——第二章樹和森林：04哈夫曼樹與哈夫曼編碼

資料結構串的應用，實驗

資料結構筆記_棧和佇列

JAVA基礎（61）---資料結構的基本概念和邏輯結構以及儲存結構

大資料的主要分析模式和分析技術

資料結構——有關於棧和佇列的小歸納

資料結構樹求深度和葉子節點數

資料結構基礎02-棧和佇列

資料結構：中綴表示式和字尾表示式

經典資料結構：B樹和B+樹詳細解析

資料結構——串的樸素模式和KMP匹配演算法

相關推薦