首页 > 代码库 > BZOJ 3555 CTSC 2014 企鹅QQ Hash

BZOJ 3555 CTSC 2014 企鹅QQ Hash

题目大意:为了分辨那些qq是一个人的小号,我们需要写一套程序来判定哪些名称是相似的。相似的定义是有且只有一个位置的字符不同。


思路:数据范围不算太大,很明显的Hash,二分都不用。听老师说今年去CTSC考试的学长中有一个人没AC这个题是因为想多了。他当时写了Hash,然后闲的没事自己出一组数据卡掉了自己的hash,然后就不敢交hash了,最后交了一个Trie树,结果T了。。血的教训告诉我们,不要想太多。。

先预处理每个字符串,得到hash值。然后枚举每一位,在O(1)的时间中吧这一位去掉的Hash取出来,然后判重。本来我想手写哈希表来着,看了网上的题解之后发现果断快排就能过。。。


CODE:

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#define MAX 30010
#define BASE 137
using namespace std;

int points,length;

char src[MAX][210];
unsigned long long hash[MAX][210],power[MAX];

unsigned long long _hash[MAX];

void Pretreatment()
{
	power[0] = 1;
	for(int i = 1; i <= length; ++i)
		power[i] = power[i - 1] * BASE;
}

inline void GetHash(char *s,unsigned long long hash[])
{
	for(int i = 1; i <= length; ++i)
		hash[i] = hash[i - 1] * BASE + s[i];
}

inline unsigned long long CalcHash(unsigned long long hash[],int i)
{
	unsigned long long re = hash[length];
	re = re - hash[i] * power[length - i] + hash[i - 1] * power[length - i + 1];
	return re;	
}

int main()
{
	scanf("%d%d%*d",&points,&length);
	Pretreatment();
	for(int i = 1; i <= points; ++i) {
		scanf("%s",src[i] + 1);
		GetHash(src[i],hash[i]);
	}
	int ans = 0;
	for(int i = 1; i <= length; ++i) {
		for(int j = 1; j <= points; ++j)
			_hash[j] = CalcHash(hash[j],i);
		sort(_hash + 1,_hash + points + 1);
		_hash[points + 1] = 0;
		int start = 1;
		for(int j = 1; j <= points + 1; ++j)
			if(_hash[j] != _hash[start]) {
				int cnt = j - start;
				ans += cnt * (cnt - 1) >> 1;
				start = j; 
			}
	}
	cout << ans << endl;
	return 0;
}


BZOJ 3555 CTSC 2014 企鹅QQ Hash