[SPOJ] (1812) Longest Common Substring II ---- SAM(多個串的最長公共子串)
阿新 • • 發佈:2019-02-04
做法:
- 類似求兩個串的最長公共子串。
- 我們對第一個串建立自動機,然後把剩餘的n-1個串放進自動機上匹配。
- 每個串都儲存它們在每個狀態上的匹配的最大長度ml, 然後對於每個狀態,維護一個數組mn[p],表示當前串在此狀態的LCS。對於每個狀態我們要取mn[p]中的最小值。然後答案就是所有狀態中最小值的最大值。
- 注意,如果當前狀態存在祖先,那麼它的祖先的ml要更新其length,為什麼呢?
- 因為孩子結點匹配過了,那麼長度一定大於祖先的匹配長度。我們在匹配的過長中,如果只是找到了一個子串,可能遺漏了祖先沒有匹配到,這樣導致祖先的ml為0,在更新狀態去min的時候,會去到0,這樣就錯了。所以我們可以把祖先的ml賦值為祖先的length。因為當前結點的length一定大於其祖先。
AC程式碼:
#include<bits/stdc++.h>
using namespace std;
#define IO ios_base::sync_with_stdio(0),cin.tie(0),cout.tie(0)
#define pb(x) push_back(x)
#define sz(x) (int)(x).size()
#define sc(x) scanf("%d",&x)
#define abs(x) ((x)<0 ? -(x) : x)
#define all(x) x.begin(),x.end()
#define mk(x,y) make_pair(x,y)
#define fin freopen("in.txt","r",stdin)
#define fout freopen("out.txt","w",stdout)
typedef long long ll;
const int mod = 1e9+7;
const double PI = 4*atan(1.0);
const int maxm = 1e8+5;
const int maxn = 1e5+5;
const int INF = 0x3f3f3f3f;
const ll LINF = 1ll<<62;
int ml[maxn<<1];
int mn[maxn<<1];
char s[maxn],b[maxn];
struct SuffixAutoMation{
int root,cnt,last,len;
int trans[maxn<<1][26],slink[maxn<<1],l[maxn<<1],num[maxn<<1];
int c[maxn<<1],rk[maxn<<1];
inline void init()
{
root = cnt = last = 1;
memset(trans,0,sizeof(trans));
slink[1] = l[1] = 0;
}
inline void add(int x)
{
int p = last,np = ++cnt;last = np;l[np] = l[p]+1;
for(;p && !trans[p][x];p = slink[p]) trans[p][x] = np;
if(!p) slink[np] = 1;
else{
int q = trans[p][x];
if(l[p]+1 == l[q]) slink[np] = q;
else{
int nq = ++cnt;l[nq] = l[p]+1;
memcpy(trans[nq],trans[q],sizeof(trans[q]));
slink[nq] = slink[q];
slink[q] = slink[np] = nq;
for(;trans[p][x] == q; p = slink[p]) trans[p][x] = nq;
}
}
}
inline void build()
{
init();
scanf("%s",s+1);
len = strlen(s+1);
for(int i=1;i<=len;i++) add(s[i]-'a');
}
inline void toposort()//拓撲排序是對每個狀態的最長
{
for(int i=1;i<=cnt;i++) c[l[i]]++;
for(int i=1;i<=len;i++) c[i]+=c[i-1];
for(int i=1;i<=cnt;i++) rk[c[l[i]]--] = i;
}
inline void Find()
{
int m = strlen(b+1);
int res = 0,ans = 0,p = root;
for(int i=1;i<=m;i++)
{
int x = b[i]-'a';
if(trans[p][x]) res++,p = trans[p][x];
else{
for(;p && !trans[p][x];p = slink[p]);
if(!p) res = 0,p = root;
else res = l[p]+1, p = trans[p][x];
}
ml[p] = max(ml[p],res);
}
for(int i=cnt;i>=1;i--)
{
int x = rk[i];
mn[x] = min(mn[x],ml[x]);
if(ml[x] && slink[x]) ml[slink[x]] = l[slink[x]];
ml[x] = 0;
}
}
}sam;
int main()
{
// fin;
// IO;
memset(mn,INF,sizeof(mn)); //初始化為無限大
sam.build();
sam.toposort();
// for(int i=sam.cnt;i>=1;i--) cout<<sam.rk[i]-1<<" "<<sam.slink[sam.rk[i]]-1<<endl;//**!
// cout<<endl;
while(~scanf("%s",b+1))
{
sam.Find();
}
int res = 0;
for(int i=1;i<=sam.cnt;i++) res = max(res,mn[i]);
printf("%d\n",res);
return 0;
}