1. 程式人生 > >bzoj1264 [AHOI2006]基因匹配Match 樹狀數組+lcs

bzoj1264 [AHOI2006]基因匹配Match 樹狀數組+lcs

clu 時間復雜度 -- nlogn 最長公共子序列 n) tdi cstring 問題

1264: [AHOI2006]基因匹配Match

Time Limit: 10 Sec Memory Limit: 162 MB
Submit: 1255 Solved: 835
[Submit][Status][Discuss]

Description

基因匹配(match) 卡卡昨天晚上做夢夢見他和可可來到了另外一個星球,這個星球上生物的DNA序列由無數種堿基排列而成(地球上只有4種),而更奇怪的是,組成DNA序列的每一種堿基在該序列中正好出現5次!這樣如果一個DNA序列有N種不同的堿基構成,那麽它的長度一定是5N。 卡卡醒來後向可可敘述了這個奇怪的夢,而可可這些日子正在研究生物信息學中的基因匹配問題,於是他決定為這個奇怪星球上的生物寫一個簡單的DNA匹配程序。 為了描述基因匹配的原理,我們需要先定義子序列的概念:若從一個DNA序列(字符串)s中任意抽取一些堿基(字符),將它們仍按在s中的順序排列成一個新串u,則稱u是s的一個子序列。對於兩個DNA序列s1和s2,如果存在一個序列u同時成為s1和s2的子序列,則稱u是s1和s2的公共子序列。 卡卡已知兩個DNA序列s1和s2,求s1和s2的最大匹配就是指s1和s2最長公共子序列的長度。 [任務] 編寫一個程序: ? 從輸入文件中讀入兩個等長的DNA序列; ? 計算它們的最大匹配; ? 向輸出文件打印你得到的結果。

Input

輸入文件中第一行有一個整數N,表示這個星球上某種生物使用了N種不同的堿基,以後將它們編號為1…N的整數。 以下還有兩行,每行描述一個DNA序列:包含5N個1…N的整數,且每一個整數在對應的序列中正好出現5次。

Output

輸出文件中只有一個整數,即兩個DNA序列的最大匹配數目。

Sample Input

2
1 1 2 2 1 1 2 1 2 2
1 2 2 2 1 1 2 2 1 1

Sample Output

7

HINT

[數據約束和評分方法]
60%的測試數據中:1<=N <= 1 000
100%的測試數據中:1<=N <= 20 000

Source

給定n個數和兩個長度為n*5的序列,每個數恰好出現5次,求兩個序列的LCS

n<=20000,序列長度就是10W,樸素的O(n^2)一定會超時

所以我們考慮LCS的一些性質

LCS的決策+1的條件是a[i]==b[j] 於是我們記錄a序列中每個數的5個位置

掃一下b[i] 對於每個b[i]找到b[i]在a中的5個位置 這5個位置的每個f[pos]值都可以被b[i]更新 於是找到f[1]到f[pos-1]的最大值+1 更新f[pos]即可

這個用樹狀數組維護 時間復雜度O(nlogn)

 1 #include<cstdio>
 2
#include<cstring> 3 #include<iostream> 4 #include<algorithm> 5 #include<cstdio> 6 7 #define M 200007 8 using namespace std; 9 inline int read() 10 { 11 int x=0,f=1;char ch=getchar(); 12 while(ch<0||ch>9){if (ch==-)f=-1;ch=getchar();} 13 while(ch>=0&&ch<=9){x=(x<<3)+(x<<1)+ch-0;ch=getchar();} 14 return x*f; 15 } 16 17 int n,ans; 18 int a[M*5],b[M*5],c[M*5],f[M*5],pos[M][6]; 19 20 void Update(int x,int y) 21 { 22 for(;x<=n*5;x+=x&-x) 23 c[x]=max(c[x],y); 24 } 25 int Get_Ans(int x) 26 { 27 int re=0; 28 for(;x;x-=x&-x) 29 re=max(re,c[x]); 30 return re; 31 } 32 int main() 33 { 34 n=read(); 35 for(int i=1;i<=n*5;i++) 36 { 37 a[i]=read(); 38 pos[a[i]][++pos[a[i]][0]]=i; 39 } 40 for(int i=1;i<=n*5;i++)b[i]=read(); 41 for(int i=1;i<=n*5;i++) 42 for(int j=5;j;j--) 43 { 44 int k=pos[b[i]][j]; 45 f[k]=max(f[k],Get_Ans(k-1)+1); 46 Update(k,f[k]); 47 ans=max(ans,f[k]); 48 } 49 printf("%d\n",ans); 50 }

bzoj1264 [AHOI2006]基因匹配Match 樹狀數組+lcs