1. 程式人生 > >字尾陣列 poj3693

字尾陣列 poj3693

羅大神論文裡的題目……

設 $ 為一個字串, str = abcd$$$$cdef, 則可以看出答案是 $$$$

 那用 $$$$... 與 $$$... 比較最長字首,肯定能得到$$$

所以列舉 $ 的長度len和位置i,找以從 i 開始的字尾和以 i+len 開始的字尾的最長字首

但如果每個位置都列舉就太慢了,所以只列舉len, 2*len, 3*len 的位置。

如果 $ 被這些位置切斷了呢?那我們一定能得到一個不能除盡 len 的最長字首長度k

那我們就檢測一下前面的一個可能整的位置 i - (len - k%len) 

但這個題目還要按字典序輸出……會出現這樣的情況 xababa , 對於這個字串的解應該是abab

但按上述所說,在 len=2 ,i=2 時的最長字首 k 是可以除盡len的,不會向前檢測 len=2 和 i=1 的情況。

所以本菜很無奈……就直接不管什麼都向前檢測到 k/len 不如當前解為止……

自己寫的模板感覺有點繁瑣而且不是很明確,就跟隨大神的腳步了……

解題的那部分程式碼寫的不是很好……可以再簡化和優化下,AC後也懶的管了……

/*
** 字尾陣列模板,直接用,很難理解
** poj 3693 (附帶rmq模板)
*/
#include <stdio.h>
#include <math.h>
#include <string.h>

const int maxn = 100001;
struct SuffixArr{
	int wa[maxn], wb[maxn], wv[maxn], ws[maxn], rank[maxn];
	int cmp(int *r, int a, int b, int l){
		return r[a]==r[b] && r[a+l]==r[b+l];
	}
	void DA(int *r, int *sa, int *h, int n, int m){//排序後編號從1開始
		int i, j, p, k=0, *x=wa, *y=wb, *t;
		r[n++] = 0;//在尾部新增一個0字元
		// 先對sa排序
		for(i=0; i<m; i++) ws[i]=0;
		for(i=0; i<n; i++) ws[x[i]=r[i]]++;
		for(i=0; i<m; i++) ws[i]+=ws[i-1];
		for(i=n-1; i>=0; i--) sa[--ws[x[i]]]=i;
		// 倍增法求sa
		for(j=1,p=1; p<n; j*=2,m=p){
			for(p=0,i=n-j; i<n; i++) y[p++]=i;
			for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
			for(i=0; i<m; i++) ws[i]=0;
			for(i=0; i<n; i++) ws[wv[i]=x[y[i]]]++;
			for(i=1; i<m; i++) ws[i]+=ws[i-1];
			for(i=n-1; i>=0; i--) sa[--ws[wv[i]]]=y[i];
			for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
				x[sa[i]] = cmp(y,sa[i-1],sa[i],j) ? p-1:p++;
		}
		// 求height陣列
		if (!h) return ; else n--;
		for(i=1; i<=n; i++) rank[sa[i]]=i;
		for(i=0; i<n; h[rank[i++]]=k)
			for(k?k--:0, j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++);
	}
}SA;

struct RMQ{
	void init(int *key, int n){
		for(int i=1; i<=n; i++) f[i][0]=key[i];
		for(int j=1; j<20; j++)
			for(int i=1; i+(1<<j)-1<=n; i++)
				f[i][j] = min(f[i][j-1], f[i+(1<<(j-1))][j-1]);
	}
	int getmin(int a, int b){
		if (a>b) {int t=a; a=b; b=t;}
		a++;//題目需要
		int k = (int)(log(double(b-a+1))/log(2.0));
		return min(f[a][k], f[b-(1<<k)+1][k]);
	}
	int min(int x, int y){return x<y ? x:y;}
	int f[maxn][20];
}rmq;


// 以下為解題所需資料
int sa[maxn], height[maxn];
int arr[maxn], n;
char ss[maxn];
bool Input(){
	scanf("%s", ss);
	if (ss[0] == '#') return false;
	n = strlen(ss);
	for (int i=0; i<n; i++)
		arr[i] = ss[i];
	return true;
}

void Solve(int testn){
	SA.DA(arr, sa, height, n, 128);
	rmq.init(height, n);
	// solve
	int maxloop=0, beg, span;
	for (int len=1; len<n/2; len++){
		for (int i=0; i+len<=n; i+=len){
			int k = rmq.getmin(SA.rank[i], SA.rank[i+len]);
			int lp= k/len + 1;
			if (lp > maxloop){
				maxloop = lp;
				span = lp*len;
				beg = i;
			}else if (lp == maxloop){
				if (SA.rank[i] < SA.rank[beg]){
					span = lp*len;
					beg = i;
				}
			}

			for (int t=i-(len-(k%len)); t>i-len; t--){
				if (t < 0) continue;
				k = rmq.getmin(SA.rank[t], SA.rank[t+len]);
				if (k/len+1 < lp) break;
				lp = k/len + 1;
				if (lp > maxloop){
					maxloop = lp;
					span = lp*len;
					beg = t;
				}else if (lp == maxloop){
					if (SA.rank[t] < SA.rank[beg]){
						span = lp*len;
						beg = t;
					}
				}
			}
		}
	}
	// output
	printf("Case %d: ", testn);
	//printf("loop %d beg %d ", maxloop, beg);
	for (int i=beg; i<beg+span; i++)
		printf("%c", (char)arr[i]);
	printf("\n");
}

int main()
{
	int t=1;	
	while (Input()){
		Solve(t++);
	}

	return 0;
}