1. 程式人生 > >[POJ1743]Musical Theme(字尾陣列||字尾自動機)

[POJ1743]Musical Theme(字尾陣列||字尾自動機)

題目描述

傳送門
題意:給出一個序列,問重複出現兩次的、不重疊的、長度至少為5的子串長度最大是多少。注意這裡的“重複出現”指的是趨勢相同,即1,2,3,4,5和11,12,13,14,15是相同的,重複出現的。

題解

以為是趨勢相同,所以做個差然後加個base,就變成了長度至少為4的一模一樣的兩個子串。
用height搞事情。。。
某個子串一定是一個字尾的字首。
兩個字尾的最長公共字首是在 height 陣列上的區間最小值。
先二分答案,把題目變成判定性問題:判斷是否存在兩個長度為mid的子串是相同的,且不重疊。把排序後的字尾分成若干組,其中每組的字尾之間的 height 值都不小於 k 。有希望成為最長公共字首不小於 k 的兩個字尾一定在同一組。 然後對於每組字尾,只須判斷每個字尾的 sa 值的最大值和最小值之差是否不小於 k 。如果有一組滿足,則說明存在,否則不存在。
如下圖所示。
這裡寫圖片描述


摘自集訓隊論文 。

UPD-2017.3.29
學習了一下sam,然後又用sam寫了一發
主要還是利用字尾自動機的性質
首先同樣是做差,然後建立字尾自動機
然後,對於某一個點s的right集合,處理出right集合中最靠左的點和最靠右的點,如果這兩個點的距離不小於Min(s),就說明是有合法的不重疊的子串的
對於最靠左和最靠右的點可以按照拓撲序在parent樹上由兒子到父親更新過來,初始時主鏈上的點的左右端點都是step,因為其表示了原串的一個字首,對於一個點的Min的計算即為step(pre(s))+1

程式碼

sa

#include<iostream>
#include<cstring> #include<cstdio> using namespace std; #define N 20005 #define base 100 int n,m; int s[N],*x,*y,X[N],Y[N],c[N]; int sa[N],height[N],rank[N]; void clear() { m=200; memset(s,0,sizeof(s));memset(X,0,sizeof(X));memset(Y,0,sizeof(Y));memset(c,0,sizeof(c)); memset(height,0,sizeof
(height));memset(sa,0,sizeof(sa));memset(rank,0,sizeof(rank)); } void build_sa() { x=X,y=Y; for (int i=0;i<m;++i) c[i]=0; for (int i=0;i<n;++i) ++c[x[i]=s[i]]; for (int i=1;i<m;++i) c[i]+=c[i-1]; for (int i=n-1;i>=0;--i) sa[--c[x[i]]]=i; for (int k=1;k<=n;k<<=1) { int p=0; for (int i=n-k;i<n;++i) y[p++]=i; for (int i=0;i<n;++i) if (sa[i]>=k) y[p++]=sa[i]-k; for (int i=0;i<m;++i) c[i]=0; for (int i=0;i<n;++i) ++c[x[y[i]]]; for (int i=1;i<m;++i) c[i]+=c[i-1]; for (int i=n-1;i>=0;--i) sa[--c[x[y[i]]]]=y[i]; swap(x,y);p=1,x[sa[0]]=0; for (int i=1;i<n;++i) x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&((sa[i-1]+k>=n?-1:y[sa[i-1]+k])==(sa[i]+k>=n?-1:y[sa[i]+k]))?p-1:p++; if (p>n) break; m=p; } } void build_height() { for (int i=0;i<n;++i) rank[sa[i]]=i; int k=0;height[0]=0; for (int i=0;i<n;++i) { if (!rank[i]) continue; if (k) --k; int j=sa[rank[i]-1]; while (i+k<n&&j+k<n&&s[i+k]==s[j+k]) ++k; height[rank[i]]=k; } } bool check(int mid) { int Max=-1,Min=n; for (int i=1;i<n;++i) { if (height[i]<mid) { if (Max-Min>=mid) return true; Max=-1,Min=n; } else { Max=max(Max,sa[i]); Min=min(Min,sa[i]); Max=max(Max,sa[i-1]); Min=min(Min,sa[i-1]); } } if (Max-Min>=mid) return true; else return false; } int find() { int l=4,r=n,mid,ans=-1; while (l<=r) { mid=(l+r)>>1; if (check(mid)) ans=mid,l=mid+1; else r=mid-1; } return ans; } int main() { while (~scanf("%d",&n)) { if (!n) break; clear(); for (int i=0;i<n;++i) scanf("%d",&s[i]); for (int i=1;i<n;++i) s[i-1]=s[i]-s[i-1]+base; --n; build_sa(); build_height(); int ans=find(); printf("%d\n",ans+1); } }

sam

#include<algorithm>
#include<cstring>
#include<cstdio>
using namespace std;
#define N 40003
#define base 87

int n,root,sz,last,p,np,q,nq,ans;
int a[N],c[N],mn[N],mx[N],ch[N][175],pre[N],step[N],pt[N];

void clear()
{
    root=sz=last=p=np=q=nq=ans=0;
    memset(a,0,sizeof(a));
    memset(c,0,sizeof(c));
    memset(ch,0,sizeof(ch));
    memset(pt,0,sizeof(pt));
    memset(pre,0,sizeof(pre));
    memset(step,0,sizeof(step));
}
void extend(int x)
{
    p=last;np=++sz;last=np;
    step[np]=step[p]+1;
    while (p&&!ch[p][x])
    {
        ch[p][x]=np;
        p=pre[p];
    }
    if (!p) pre[np]=root;
    else
    {
        q=ch[p][x];
        if (step[q]==step[p]+1) pre[np]=q;
        else
        {
            nq=++sz;
            step[nq]=step[p]+1;
            memcpy(ch[nq],ch[q],sizeof(ch[q]));
            pre[nq]=pre[q];
            while (p&&ch[p][x]==q)
            {
                ch[p][x]=nq;
                p=pre[p];
            }
            pre[np]=pre[q]=nq;
        }
    }
}
int main()
{
    while (~scanf("%d",&n))
    {
        if (!n) break;
        clear();
        for (int i=1;i<=n;++i) scanf("%d",&a[i]);
        root=last=++sz;
        for (int i=2;i<=n;++i) extend(a[i-1]=a[i]-a[i-1]+base);
        for (int i=1;i<=sz;++i) ++c[step[i]];
        for (int i=1;i<=sz;++i) c[i]+=c[i-1];
        for (int i=sz;i>=1;--i) pt[c[step[i]]--]=i;
        p=root;memset(mx,0,sizeof(mx));memset(mn,127,sizeof(mn));
        for (int i=1;i<n;++i)
            p=ch[p][a[i]],mx[p]=mn[p]=step[p];
        for (int i=sz;i>=1;--i)
        {
            p=pt[i];
            mx[pre[p]]=max(mx[pre[p]],mx[p]);
            mn[pre[p]]=min(mn[pre[p]],mn[p]);
        }
        for (int i=1;i<=sz;++i)
            if (mx[i]-mn[i]>=step[pre[i]]+1)
                ans=max(ans,min(step[i],mx[i]-mn[i]));
        if (ans<4) puts("0");
        else printf("%d\n",ans+1);
    }
}