首页 > 代码库 > POJ 1035 Spell Check 字符串处理

POJ 1035 Spell Check 字符串处理

被这样的题目忽悠了,一开始以为使用Trie会大大加速程序的,没想到,一不小心居然使用Trie会超时。
最后反复试验,加点优化,终于使用Trie是可以过的,不过时间大概难高于1500ms,一不小心就会超时。
看来这是一道专门卡Trie的题目,只好放弃不使用Trie了。
也得出点经验,如果字符串很多,如本题有1万个字符串的,那么还是不要使用Trie吧,否则遍历一次这样的Trie是十分耗时的,2s以上。


于是使用暴力搜索法了,这里的技巧是可以使用优化技术:

1 剪枝:这里直接分组搜索,分组是按照字符串的长度分组

2 对比查找是合法字符的时候不要使用Edit Distance,而是使用计算字符差别的方法判断是否是合法字符的。

有了这两个技巧就不算纯粹的暴力法了,最后速度还是挺快的。


#include <stdio.h>
#include <string.h>
#include <string>
#include <vector>
#include <algorithm>
using namespace std;

const int MAX_N = 10001;
const int ALP_SIZE = 26;
const int WORD_SIZE = 18;
inline int min(int a, int b) { return a < b ? a : b; }
inline int max(int a, int b) { return a > b ? a : b; }

struct strNode
{
	int num;
	char str[WORD_SIZE];
	bool operator<(const strNode &str) const
	{
		return num < str.num;
	}
};

char word[WORD_SIZE];
vector<strNode> dict[WORD_SIZE];
vector<strNode> res;
int num;

inline bool getReplacing(int len, char di[])
{
	int k = 0;
	for (int j = 0; j < len; j++)
	{
		if (di[j] != word[j])
		{
			k++;
			if (k > 1) break;
		}
	}
	if (k < 2) return true;
	return false;
}

inline bool getDel(int len, char di[])
{
	int k = 0;
	for (int j = 0, w = 0; j < len; j++, w++)
	{
		if (di[w] != word[j])
		{
			k++;
			if (k > 1) break;
			j--;
		}
	}
	if (k < 2) return true;
	return false;
}

inline bool getIns(int len, char di[])
{
	int k = 0;
	for (int j = 0, w = 0; w < len-1; j++, w++)
	{
		if (di[w] != word[j])
		{
			k++;
			if (k > 1) break;
			w--;
		}
	}
	if (k < 2) return true;
	return false;
}

int main()
{
	strNode W;
	while (gets(W.str))
	{
		for (int i = 0; i < WORD_SIZE; i++)
		{
			dict[i].clear();
		}

		num = 0;
		int len = strlen(W.str);
		W.num = num++;
		dict[len].push_back(W);

		while (gets(W.str) && W.str[0] != '#')
		{
			len = strlen(W.str);
			W.num = num++;
			dict[len].push_back(W);
		}
out: 
		while (gets(word) && word[0] != '#')
		{
			len = strlen(word);
			int N = (int)dict[len].size();
			for (int i = 0; i < N; i++)
			{
				if (!strcmp(word, dict[len][i].str))
				{
					printf("%s is correct\n", word);
					goto out;
				}
			}

			printf("%s:", word);
			res.clear();

			for (int i = 0; i < N; i++)
			{
				if (getReplacing(len, dict[len][i].str))
				{
					res.push_back(dict[len][i]);
				}
			}
			N = (int)dict[len-1].size();
			for (int i = 0; i < N; i++)
			{
				if (getIns(len, dict[len-1][i].str))
				{
					res.push_back(dict[len-1][i]);
				}
			}
			N = (int)dict[len+1].size();
			for (int i = 0; i < N; i++)
			{
				if (getDel(len, dict[len+1][i].str))
				{
					res.push_back(dict[len+1][i]);
				}
			}

			sort(res.begin(), res.end());
			for (int i = 0; i < (int)res.size(); i++)
			{
				printf(" %s", res[i].str);
			}			
			putchar('\n');
		}
	}
	return 0;
}