1. 程式人生 > >【bzoj3555】[Ctsc2014]企鵝QQ 字符串hash

【bzoj3555】[Ctsc2014]企鵝QQ 字符串hash

sample def 數字 最大 cts mes 哪些 前綴 sizeof

題目描述

PenguinQQ是中國最大、最具影響力的SNS(Social Networking Services)網站,以實名制為基礎,為用戶提供日誌、群、即時通訊、相冊、集市等豐富強大的互聯網功能體驗,滿足用戶對社交、資訊、娛樂、交易等多方面的需求。
小Q是PenguinQQ網站的管理員,他最近在進行一項有趣的研究——哪些賬戶是同一個人註冊的。經過長時間的分析,小Q發現同一個人註冊的賬戶名稱總是很相似的,例如Penguin1,Penguin2,Penguin3……於是小Q決定先對這種相似的情形進行統計。
小Q定義,若兩個賬戶名稱是相似的,當且僅當這兩個字符串等長且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在給定的 個賬戶名稱中,有多少對是相似的。

為了簡化你的工作,小Q給你的n個字符串長度均等於m,且只包含大小寫字母、數字、下劃線以及‘@’共64種字符,而且不存在兩個相同的賬戶名稱。

輸入

第一行包含三個正整數 n,m,s 。其中n表示賬戶名稱數量,m表示賬戶名稱長度,s用來表示字符集規模大小,它的值只可能為2或64。
若s等於2,賬戶名稱中只包含字符‘0’和‘1’共2種字符;
若s等於64,賬戶名稱中可能包含大小寫字母、數字、下劃線以及‘@’共64種字符。
隨後n行,每行一個長度為m的字符串,用來描述一個賬戶名稱。數據保證n個字符串是兩兩不同的。

輸出

僅一行一個正整數,表示共有多少對相似的賬戶名稱。

樣例輸入

4 3 64
Fax
fax
max
mac

樣例輸出

4


題解

字符串hash

先預處理每個字符串的前綴的hash值,然後枚舉多余字符的位置,計算出每個字符串剩下串的hash值,判斷有多少個相同即可。

註意不要把n和m弄混。

註意不要把n和m弄混。

註意不要把n和m弄混。

#include <cstdio>
#include <cstring>
#include <algorithm>
#define N 30010
#define M 210
using namespace std;
unsigned long long hash[N][M] , base[M] , a[N];
int v[N];
char str[M];
int main()
{
	int n , m , i , j , top;
	long long ans = 0;
	scanf("%d%d%*d" , &n , &m);
	for(i = 1 ; i <= n ; i ++ )
	{
		scanf("%s" , str + 1);
		for(j = 1 ; j <= m ; j ++ ) hash[i][j] = hash[i][j - 1] * 131 + str[j]; 
	}
	base[0] = 1;
	for(i = 1 ; i <= m ; i ++ ) base[i] = base[i - 1] * 131;
	for(i = 1 ; i <= m ; i ++ )
	{
		for(j = 1 ; j <= n ; j ++ ) a[j] = hash[j][m] - hash[j][i] * base[m - i] + hash[j][i - 1] * base[m - i];
		sort(a + 1 , a + n + 1);
		memset(v , 0 , sizeof(v)) , top = 1 , v[1] = 1;
		for(j = 2 ; j <= n ; j ++ )
		{
			if(a[j] != a[j - 1]) top ++ ;
			v[top] ++ ;
		}
		for(j = 1 ; j <= top ; j ++ ) ans += (long long)v[j] * (v[j] - 1) / 2;
	}
	printf("%lld\n" , ans);
	return 0;
}

【bzoj3555】[Ctsc2014]企鵝QQ 字符串hash