資料結構筆記：KMP子串查詢演算法

阿新 • • 發佈：2018-11-14

發現

-匹配失敗時的右移位數與子串本身相關，與目標串無關

-移動位數=已匹配的字元數-對應的部分匹配值

-任意子串都穿在一個唯一的部位匹配表

字首

-除了最後一個字元以外，一個字串的全部頭部組合

字尾

-出了第一個字元以外，一個字串的全部尾部組合

部分匹配值

-字首和字尾最長共有元素的長度

	字元	字首	字尾	交集	匹配
1	A	空	空	空	0
2	AB	A	B	空	0
3	ABC	A，AB	BC，C	空	0
4	ABCD	A，AB，ABC	BCD，CD，D	空	0
5	ABCDA	A，AB，ABC，ABCD	BCDA，CDA，DA，A	A	1
6	ABCDAB	A，AB，ABC，ABCD，ABCDA	BCDAB，CDAB，DAB，AB，B	AB	2
7	ABCDABD	A，AB，ABC，ABCD，ABCDA， ABCDAB	BCDABD，CDABD，DABD，ABD，BD，D	空	0

實現關鍵

-PMT[1] = 0（下標為0的元素匹配值為0）

-從2個字元開始遞推（從下標為1的字元開始遞推）

-假設PMT[n] = PMT[n-1] +1（最長共有元素的長度）

-當假設不成立，PMT[n] 在PMT[n-1]的基礎上減小

部分匹配表的使用（KMP演算法）

#include <iostream>

int* make_pmt(const char* p)
{
    int len = strlen(p);
    int* ret = static_cast<int*>(malloc(sizeof(int) * len));

    if( ret != NULL)
    {
        int ll = 0;

        ret[0] = 0;

        for(int i = 1;i<len;i++)
        {
            while((ll > 0) && p[ll] != p[i])
            {
                ll = ret[ll -1];
            }
            if(p[ll] == p[i])
            {
                ll++;
            }

            ret[i] = ll;
        }
    }
    return ret;
}

int kmp(const char* s,const char* p)
{
    int ret = -1;
    int sl = strlen(s);
    int pl = strlen(p);
    int* pmt = make_pmt(p);

    if((pmt != NULL)&&(0 < pl) &&(pl <= sl))
    {
        for(int i = 0,j = 0;i<sl;i++)
        {
            while((j > 0) && (s[i] != p[j]))
            {
                j = pmt[j-1];

            }

            if(s[i] == p[j])
            {
                j++;
            }

            if( j == pl )
            {
                ret = i  + 1 - pl;
                break;
            }
        }
    }
    free(pmt);

    return ret;
}

int main()
{
    cout << kmp("sfshdfuweihrfwshfuiwehfuwefiwhe","sfshdfuweihrfwshfuiwehfuwefiwhes") << endl;


    return 0;
}

總結：

-部分匹配表示提高子串查詢效率的關鍵

-部分匹配值定義為字首和字尾最長共有元素的長度

-可以用遞推的方法產生部分匹配表

-KMP利用部分匹配值與子串移動位數的關係提高查詢效率

資料結構筆記：KMP子串查詢演算法

發現 -匹配失敗時的右移位數與子串本身相關，與目標串無關 -移動位數=已匹配的字元數-對應的部分匹配值 -任意子串都穿在一個唯一的部位匹配表字首 -除了最後一個字元以外，一個字串的全部頭部組合字尾 -出了第一個字元以外，一個字串的全部尾部組合部分匹配值 -字

資料結構開發(14)：KMP 子串查詢演算法

0.目錄 1.KMP 子串查詢演算法 2.KMP 演算法的應用 3.小結 1.KMP 子串查詢演算法問題：如何在目標字串S中，查詢是否存在子串P？樸素解法：樸素解法的一個優化線索：示例：偉大的發現：匹配失敗時的右移位數與子串本身相關，與目標串無關移動位數 =

資料結構筆記：KMP演算法的應用

成員函式功能描述 indexOf(s) 查詢子串s在字串中的位置 remove(s) 將字串中的子串s刪除 operator-(s) 定義字串減法

資料結構筆記：樹中結點的查詢操作

查詢的方式 -基於資料元素值的查詢 ·GTreeNode<T>* find(const T& value) const -基於結點的查詢 ·GTreeNode<T>* find(TreeNode<T>* node) const 基於資料

資料結構筆記：二叉樹中的結點查詢操作

查詢的方式 -基於資料元素值的查詢 ·BTreeNode<T>* find(const T& value) const -基於結點的查詢 ·BTreeNode<T>* find(TreeNode<T>* node) const 基於資料

資料結構筆記：程式演算法的選擇

如果兩個演算法都滿足功能性需求，那工程中最關心的其他特性是什麼？如何比較評判呢？ ps：價效比（效率）是工程中最關注的演算法附加特性！事後統計法 -比較不同演算法對同一組輸入資料的執行處理時間 -缺陷 ·為了獲得不同演算法的執行時間必須編寫相應程式 ·執行時間嚴重依賴硬體以

資料結構筆記：程式的靈魂

資料結構靜態的描述了資料元素之間的掛你高效的程式需要在資料結構的基礎上設計和選擇演算法演算法是特定問題求解步驟的描述在計算機中表現為指令的有限序列算是獨立存在的一種解決問題的方法和思想，對於演算法而言，語言並不重要，重要的是思想。演算法的特性： -輸入：演算法具有0

資料結構筆記：資料的藝術

資料的概念 -程式的操作物件，用於描述客觀事物資料的特點 -可以輸入到計算機 -可以被計算機程式處理資料中的新概念 -資料元素 ·組成資料的基本單位 -資料項 ·一個數據元素由若干資料項組成 -資料物件 ·性質相同的資料元素的結合資料結構指資料物

資料結構筆記：線性表的順序儲存結構

順序儲存的定義線性表的順序儲存結構，指的是用一段地址連續的儲存單元一次儲存線性表中的資料元素。順序儲存結構的元素插入操作 -判斷目標位置是否合法 -將目標位置之後的所有元素後移一個位置 -將新元素插入目標位置 -線性長度加1 順序儲存結構的元素插入示例 bool

資料結構筆記：線性表的本質和操作

線性表（List）的表現形式 -零個或多個數據元素組成的集合 -資料元素在位置上是有序排列的 -資料元素的個數是有限的 -資料元素的型別必須相同線性表（List）的抽象定義線性表是具有相同型別的n( >= 0)個數據元素的有限序列線性表（List）的性質

資料結構筆記：演算法效率的度量

演算法的空間複雜度（space Complexity） -定義：S(n) = S(f(n)) ·n為演算法的問題規模 ·f(n)為空間使用函式，與n相關推導時間複雜度的方法同樣適用於空間複雜度空間與時間的策略 -多數情況下，演算法的時間複雜度更令人關注 -如果有必要，

資料結構筆記：演算法的事件複雜度

判斷一個演算法的效率時，運算元量中的常數項和其他次要項常常可以忽略，只需要關注最高階項就能得出結論演算法的複雜度 -時間複雜度 ·演算法執行後對時間需求量的定性描述 -空間複雜度 ·演算法執行後對空間需求量的定性描述大O表示法 -演算法效率嚴重依賴於操作（Operat

資料結構筆記：單鏈表的具體實現

LinkList設計要點 -類模板，通過頭結點訪問後繼結點 -定義內部結點型別Node，用於描述資料域和指標域 -實現線性表的關鍵操作（增，刪，查，等） template<typename T> class LinkList : public List<T>

資料結構筆記：線性表的鏈式儲存結構

鏈式儲存的定義為了表示每個資料元素與其直接後繼元素之間的邏輯關係；資料元素出了儲存本身的資訊外，還需要儲存直接後繼的資訊。 ps：在邏輯上，元素之間是相鄰的；在實體記憶體中元素之間並無相鄰關係。鏈式儲存邏輯結構 -基礎鏈式儲存結構的線性表中，每個節點都包含資料域和指標域 ·資

資料結構筆記：陣列類的建立

需求分析 -建立陣列類代替原生陣列的使用 ·陣列類包含長度資訊 ·陣列類能夠主動發現越界訪問 Array設計要點 -抽象類模板，儲存空間的位置和大小由子類完成 -過載陣列操作符，判斷訪問下標是否合法 -提供陣列長度的抽象訪問函式 -提供陣列物件間的複製操作 Arr

資料結構筆記：順序儲存結構的抽象實現

SeqList設計要點 -抽象類模板，儲存空間的位置和大小由子類完成 -實現順序儲存結構線性表的關鍵操作（增，刪，查，等） -提供陣列操作符，方便快速獲取元素 template <typename T> class SeqList : public List<T&g

資料結構筆記：靜態單鏈表的實現

單鏈表的一個缺陷 -觸發條件 ·長時間使用單鏈表物件頻繁增加和刪除資料元素 -可能的結果 ·堆空間產生大量的記憶體碎片，導致系統執行緩慢新的線性表設計思路：在單鏈表的內部增加一片預留的空間，所有Node物件都在這片空間中動態建立和動態銷燬。靜態單鏈表的實

資料結構筆記：單鏈表的遍歷與優化

如何遍歷單鏈表中的每一個數據元素？為單鏈表提供新的方法，線上性時間內完成遍歷設計思路（遊標） -在單鏈表的內部定義一個遊標（Node* m_current） -遍歷開始前將遊標指向位置為0的資料元素 -獲取遊標指向的資料元素 -通過結點中的next指標移動遊標提供一

資料結構筆記：順序表和單鏈表的對比分析

如何判斷某個資料元素是否存在於線性表中？ find -可以為線性表（List）增加一個查詢操作 -int find(const T& e)const; ·引數： ~待查詢的資料元素 ·返回值： ~>= 0：資料元素線上性表中第一次出現的位置 ~-1：資料

資料結構筆記：迴圈連結串列的實現

什麼事迴圈連結串列？ -概念上 ·任意資料元素都有一個前驅和一個後繼 ·所有的資料元素的關係構成一個邏輯上的環 -實現上 ·迴圈連結串列是一種特殊的單鏈表 ·尾結點的指標域儲存了首結點的地址迴圈連結串列的實現思路 -通過模板定義CircleList類，繼承自L

資料結構 筆記：KMP子串查詢演算法

相關推薦

資料結構筆記：KMP子串查詢演算法