最長公共子序列針對小字符集的算法

阿新 • • 發佈：2017-12-31

但是公共子序列 ext 每一個一個 post div span min

一般對於兩個字符串，長度分別為n和m，其時間復雜度為O(nm)。

但是針對小字符集的情況，可以把復雜度降低到O(n^2+km)，其中n為兩個字符串較短的長度。這種方法對於兩個字符串長度相差很大的情況比O(nm)要優化很多。

就假設所有的字符都是小寫字母，這樣就符合小字符集的前提了。設較短的字符串為S1，較長的字符串為S2。字符串下標從1開始。

S2字符串每個位置右邊第一個字符是可以通過O(km)預處理得到的。其中k為小字符集的字符個數，m為較長的那個字符串的長度。

用next[i][j]表示S2[i]右邊第一個(char)(‘a‘+j)的位置。

設dp[i][j]表示S1匹配了前i位，長度為j的最長公共子序列與S2匹配到的最靠左的位置。如果不存在則為length(S2)+1。

dp[i][0] = 0

如果S2的dp[i-1][j-1]這個位置右邊第一個與S1[i]相等的位置存在，那麽dp[i][j] = min{ dp[i-1][j], next[dp[i-1][j-1]][S1[i]] }。

否則dp[i][j] = dp[i-1][j]。

對於每一個不是-1的dp，記錄下j，最後取一個最大就是最長公共子序列了。

因此，總的復雜度為O(n^2+km)。

具體實現：

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;

const int INF=0x3f3f3f3f;
const int maxn=1005;
const int maxm=1000005;
char s1[maxn],s2[maxm];
int dp[maxn][maxn];
int next[maxm][26]; 

int main()
{
    scanf("%s%s",s1+1,s2+1);  
    int l1=strlen(s1+1);
    int l2=strlen(s2+1);
    for (int i=0;i<maxm;i++)
        for (int j=0;j<26;j++)
            next[i][j]=l2+1;
    for (int i=0;i<maxn;i++)
        for (int j=0;j<maxn;j++)
            dp[i][j]=l2+1;
    for (int i=l2-1;i>=0;i--)
    {
        for (int j=0;j<26;j++)
        {
            char cc=‘a‘+j;
            if (s2[i+1]==cc) next[i][j]=i+1;
            else next[i][j]=next[i+1][j];
        }
    }
    for (int i=1;i<=l1;i++) dp[i][0]=0;
    int ans=0;
    for (int i=1;i<=l1;i++)
    {
        for (int j=1;j<=i;j++)
        {
            if (next[dp[i-1][j-1]][s1[i]-‘a‘]!=l2+1) dp[i][j]=min(dp[i-1][j],next[dp[i-1][j-1]][s1[i]-‘a‘]);
            else dp[i][j]=dp[i-1][j];
            if (dp[i][j]!=l2+1) ans=max(ans,j);
        }
    }
    printf("%d\n",ans);
    return 0;
}

最長公共子序列針對小字符集的算法

但是公共子序列 ext 每一個一個 post div span min 一般對於兩個字符串，長度分別為n和m，其時間復雜度為O(nm)。但是針對小字符集的情況，可以把復雜度降低到O(n^2+km)，其中n為兩個字符串較短的長度。這種方法對於兩個字符串長度相差很大的情

哈爾濱理工大學軟體與微電子學院第八屆程式設計競賽同步賽（高年級） E 小樂樂匹配字串【最長公共子序列】

傳送門：https://ac.nowcoder.com/acm/contest/301/E 求最長公共子序列。立個 flag 搞dp。 AC code： #include <cstdio> #include <iostream> #inc

小樂樂匹配字串（最長公共子序列）

連結：https://ac.nowcoder.com/acm/contest/301/E 來源：牛客網小樂樂匹配字串時間限制：C/C++ 1秒，其他語言2秒空間限制：C/C++ 32768K，其他語言65536K 64bit IO Format: %lld 題目描述

最長公共子序列LCS (DP)

mem main amp code bcd max std pan ems 題意：求兩個字符串的公共子序列，如“abcd” 與 “becd”的公共子序列是 “bcd” 分析：設兩個字符串為串s 和串tdp[i][j]:= s1..si和t1...tj對應的LCS長度

【HackerRank】Common Child (LCS)最長公共子序列

lin ring def imp sep content hat jin ted Given two strings a and b of equal length, what’s the longest string (S) that can be construct

【DP】最長公共子序列

amp 給定 scrip ros script print 最長去掉 != Description 　　字符序列的子序列是指從給定字符序列中隨意地（不一定連續）去掉若幹個字符（可能一個也不去掉）後所形成的字符序列。令給定的字符序列X=“x0，x1，…，xm-1”，序列Y

最長公共子序列（LCS）

公共子序列一個 clas style == ++ 字符串 tro 我們最長公共子序列: LIS是一個典型的用動規解決的問題。給出兩個字符串，求出兩串的最長公共子序列的長度。我們可以構造出他的結構特征。f(i，j)表示str1[1]~str1[i]和str2[1]~s

最長公共子序列

pac str 描述 pid scan div gre max ems 1619: P1050 時間限制: 1 Sec 內存限制: 128 MB提交: 38 解決: 28[提交][狀態][討論版] 題目描述一個字符串A的子串被定義成從A中順次選出若幹個字符構成的串

[C++] 動態規劃之矩陣連乘、最長公共子序列、最大子段和、最長單調遞增子序列

每次種子 () return 避免 amp 可能 text com 一、動態規劃的基本思想　　動態規劃算法通常用於求解具有某種最優性質的問題。在這類問題中，可能會有許多可行解。每一個解都對應於一個值，我們希望找到具有最優值的解。　　將待求解問題分解成若幹個子問題，先求

動態規劃最長公共子序列

一個 then mda 偽代碼 n-2 msu csdn static 證明最長公共子序列（LCS）問題下面通過一個具體的例子來學習動態規劃方法 —— 最長公共子序列問題。最長公共子串（Longest Common Substring）與最

Human Gene Functions POJ 1080 最長公共子序列變形

cee diff print bmi ces -s compare %d determine Description It is well known that a human gene can be considered as a sequence, consisting

最長公共子序列--【算法導論】

pan end art blog src http size ret bdc 最長公共子序列：一個序列 S 。假設各自是兩個或多個已知序列的子序列，且是全部符合此條件序列中最長的，則 S 稱為已知序列的最長公共子序列。其核心非常easy：這樣，構造子結構就比較簡

求最長公共子序列

ade empty 全部 str2 comm star 要求 longest strlen 最長公共子序列，英文縮寫為LCS（Longest Common Subsequence）。其定義是。一個序列 S 。假設各自是兩個或多個已知序列的子序列。且是全部符合此條件序列中

C++求解漢字字符串的最長公共子序列動態規劃

esp style mes else if c++ char 那種 size 公共子序列近期，我在網上看了一些動態規劃求字符串最長公共子序列的代碼。可是無一例外都是處理英文字符串，當處理漢字字符串時。常常會出現亂碼或者不對的情況。我對代碼進行了改動。使用wc

【動態規劃】最長公共子序列問題

clas == 搜索 ios for 參考 pan 公式是否題目描述：給定兩個字符串s1s2……sn和t1t2……tn。求出這兩個字符串最長的公共子序列的長度。字符串s1s2……sn的子序列指可以表示為si1si2……sim（i1<i2<……<im）

NYOJ 36 最長公共子序列 (還是dp)

memset nbsp inpu 3.3 style cpp output 連續表示這個好多算法書上都有，不僅限於《算法導論》時間限制：3000 ms | 內存限制：65535 KB 難度：3 描寫敘述咱們

51nod 1006 最長公共子序列Lcs(dp+string,無標記數組實現)

轉移 opened mes star 字符 tex src 表示 logs 1006 最長公共子序列Lcs 基準時間限制：1 秒空間限制：131072 KB 分值: 0 難度：基礎題收藏關註取消關註給出兩個字符串A B，求A與B的最長公共子序

1006 最長公共子序列Lcs

scan gray 16px 最長公共子序列 pre std pri 第一個 put 給出兩個字符串A B，求A與B的最長公共子序列（子序列不要求是連續的）。比如兩個串為： abcicba abdkscab ab是兩個串的子序列，abc也是，abca也是，其中ab

[poj 2274]後綴數組+最長公共子序列

max %d eight har 題目 while color sca 鏈接題目鏈接：http://poj.org/problem?id=2774 後綴數組真的太強大了，原本dp是n^2的復雜度，在這裏只需要O(n+m)。做法：將兩個串中間夾一個未出現過的字符接起來，然

HDU 1513 Palindrome：LCS（最長公共子序列）or 記憶化搜索

ble urn size rom str 個數 blog using reverse 題目鏈接：http://acm.hdu.edu.cn/showproblem.php?pid=1513 題意：　　給你一個字符串s，你可以在s中的任意位置添加任意字符，問你將s變成一個回

最長公共子序列針對小字符集的算法

相關推薦