1. 程式人生 > >[SPOJ] (1812) Longest Common Substring II ---- SAM(多個串的最長公共子串)

[SPOJ] (1812) Longest Common Substring II ---- SAM(多個串的最長公共子串)

題目傳送門

做法:

  • 類似求兩個串的最長公共子串。
  • 我們對第一個串建立自動機,然後把剩餘的n-1個串放進自動機上匹配。
  • 每個串都儲存它們在每個狀態上的匹配的最大長度ml, 然後對於每個狀態,維護一個數組mn[p],表示當前串在此狀態的LCS。對於每個狀態我們要取mn[p]中的最小值。然後答案就是所有狀態中最小值的最大值。
  • 注意,如果當前狀態存在祖先,那麼它的祖先的ml要更新其length,為什麼呢?
  • 因為孩子結點匹配過了,那麼長度一定大於祖先的匹配長度。我們在匹配的過長中,如果只是找到了一個子串,可能遺漏了祖先沒有匹配到,這樣導致祖先的ml為0,在更新狀態去min的時候,會去到0,這樣就錯了。所以我們可以把祖先的ml賦值為祖先的length。因為當前結點的length一定大於其祖先。

AC程式碼:

#include<bits/stdc++.h>
using namespace std;

#define IO          ios_base::sync_with_stdio(0),cin.tie(0),cout.tie(0)
#define pb(x)       push_back(x)
#define sz(x)       (int)(x).size()
#define sc(x)       scanf("%d",&x)
#define abs(x)      ((x)<0 ? -(x) : x)
#define all(x)      x.begin(),x.end()
#define mk(x,y) make_pair(x,y) #define fin freopen("in.txt","r",stdin) #define fout freopen("out.txt","w",stdout) typedef long long ll; const int mod = 1e9+7; const double PI = 4*atan(1.0); const int maxm = 1e8+5; const int maxn = 1e5+5; const int INF = 0x3f3f3f3f; const ll LINF =
1ll<<62; int ml[maxn<<1]; int mn[maxn<<1]; char s[maxn],b[maxn]; struct SuffixAutoMation{ int root,cnt,last,len; int trans[maxn<<1][26],slink[maxn<<1],l[maxn<<1],num[maxn<<1]; int c[maxn<<1],rk[maxn<<1]; inline void init() { root = cnt = last = 1; memset(trans,0,sizeof(trans)); slink[1] = l[1] = 0; } inline void add(int x) { int p = last,np = ++cnt;last = np;l[np] = l[p]+1; for(;p && !trans[p][x];p = slink[p]) trans[p][x] = np; if(!p) slink[np] = 1; else{ int q = trans[p][x]; if(l[p]+1 == l[q]) slink[np] = q; else{ int nq = ++cnt;l[nq] = l[p]+1; memcpy(trans[nq],trans[q],sizeof(trans[q])); slink[nq] = slink[q]; slink[q] = slink[np] = nq; for(;trans[p][x] == q; p = slink[p]) trans[p][x] = nq; } } } inline void build() { init(); scanf("%s",s+1); len = strlen(s+1); for(int i=1;i<=len;i++) add(s[i]-'a'); } inline void toposort()//拓撲排序是對每個狀態的最長 { for(int i=1;i<=cnt;i++) c[l[i]]++; for(int i=1;i<=len;i++) c[i]+=c[i-1]; for(int i=1;i<=cnt;i++) rk[c[l[i]]--] = i; } inline void Find() { int m = strlen(b+1); int res = 0,ans = 0,p = root; for(int i=1;i<=m;i++) { int x = b[i]-'a'; if(trans[p][x]) res++,p = trans[p][x]; else{ for(;p && !trans[p][x];p = slink[p]); if(!p) res = 0,p = root; else res = l[p]+1, p = trans[p][x]; } ml[p] = max(ml[p],res); } for(int i=cnt;i>=1;i--) { int x = rk[i]; mn[x] = min(mn[x],ml[x]); if(ml[x] && slink[x]) ml[slink[x]] = l[slink[x]]; ml[x] = 0; } } }sam; int main() { // fin; // IO; memset(mn,INF,sizeof(mn)); //初始化為無限大 sam.build(); sam.toposort(); // for(int i=sam.cnt;i>=1;i--) cout<<sam.rk[i]-1<<" "<<sam.slink[sam.rk[i]]-1<<endl;//**! // cout<<endl; while(~scanf("%s",b+1)) { sam.Find(); } int res = 0; for(int i=1;i<=sam.cnt;i++) res = max(res,mn[i]); printf("%d\n",res); return 0; }