1. 程式人生 > >SPOJ-694-求字串中不同子串個數(字尾陣列)

SPOJ-694-求字串中不同子串個數(字尾陣列)

http://www.spoj.com/status/ns=17418952

【每一個子串必然是某個字尾的字首】,因此我們統計出所有的字尾中有多少個不同的字首,就是所有不重複子串的數量了

而這個相同的字首個數,當然就是所有height之和啦。

所以答案就是n*(n-1)/2-∑height[i]

#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<vector>
#include<algorithm>
using namespace std;
const int N = 1050;
int cmp(int *r,int a,int b,int l)
{
    return (r[a]==r[b]) && (r[a+l]==r[b+l]);
}
// 用於比較第一關鍵字與第二關鍵字,
// 比較特殊的地方是,預處理的時候,r[n]=0(小於前面出現過的字元)
/*
    DA(aa,sa,n+1,200);
    calheight(aa,sa,n);
*/
int wa[N],wb[N],ws[N],wv[N];
int rank[N],height[N];
void DA(int *r,int *sa,int n,int m)  //此處N比輸入的N要多1,為人工新增的一個字元,用於避免CMP時越界
{
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0; i<m; i++) ws[i]=0;
    for(i=0; i<n; i++) ws[x[i]=r[i]]++;
    for(i=1; i<m; i++) ws[i]+=ws[i-1];
    for(i=n-1; i>=0; i--) sa[--ws[x[i]]]=i; //預處理長度為1
    for(j=1,p=1; p<n; j*=2,m=p) //通過已經求出的長度J的SA,來求2*J的SA
    {
        for(p=0,i=n-j; i<n; i++) y[p++]=i; // 特殊處理沒有第二關鍵字的
        for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j; //利用長度J的,按第二關鍵字排序
        for(i=0; i<n; i++) wv[i]=x[y[i]];
        for(i=0; i<m; i++) ws[i]=0;
        for(i=0; i<n; i++) ws[wv[i]]++;
        for(i=1; i<m; i++) ws[i]+=ws[i-1];
        for(i=n-1; i>=0; i--) sa[--ws[wv[i]]]=y[i]; //基數排序部分
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;  //更新名次陣列x[],注意判定相同的
    }
}

void calheight(int *r,int *sa,int n)  // 此處N為實際長度
{
    int i,j,k=0;        // height[]的合法範圍為 1-N, 其中0是結尾加入的字元
    for(i=1; i<=n; i++) rank[sa[i]]=i; // 根據SA求RANK
    for(i=0; i<n; height[rank[i++]] = k ) // 定義:h[i] = height[ rank[i] ]
        for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++); //根據 h[i] >= h[i-1]-1 來優化計算height過程
}

int n;
char ss[N];
int aa[N];
int sa[N];
int solve()
{
    DA(aa,sa,n+1,128);
    calheight(aa,sa,n);
    int ans=0;
    for (int i=1;i<=n;i++)
    {
        ans+=n-sa[i]-height[i];
    }
    return ans;
}
int main ()
{
    int t;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%s",&ss);
        n=strlen(ss);
        for (int i=0; i<n; i++)
            aa[i]=ss[i];
        aa[n]=0;
        int ans=solve();
        printf("%d\n",ans);
    }

    return 0;
}