首页 > 代码库 > KMP 算法
KMP 算法
- 文件夹
- 题目描写叙述
- 算法核心
- 代码
文件夹
1.题目描写叙述
题目来自于hihocoder:http://hihocoder.com/problemset/problem/1015
1015 : KMP算法
时间限制:1000ms
单点时限:1000ms
内存限制:256MB
描写叙述
小Hi和小Ho是一对好朋友。出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助。在编程的学习道路上一同前进。
这一天。他们遇到了一仅仅河蟹。于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不可以推断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?”
小Hi和小Ho细致思考了一下。认为仅仅能想到非常easy的做法。可是又认为既然河蟹先生这么说了,就肯定不会这么easy的让他们回答了。于是他们仅仅能说道:“抱歉,河蟹先生,我们仅仅能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开推断,然后依次枚举起始位置并检查是否可以匹配,可是这不是您想要的方法是吧?”
河蟹点了点头。说道:”看来你们的水平还有待提高。这样吧,假设我说仅仅有一个特殊文字,你能不能做到呢?“
小Ho这时候还有点晕晕乎乎的。可是小Hi非常快开口道:”我知道!这就是一个非常经典的模式匹配问题!可以使用KMP算法进行求解。“
河蟹惬意的点了点头。对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“
”保证完毕任务!”小Hi点头道。
提示一:KMP的思路
提示二:NEXT数组的使用
提示三:怎样求解NEXT数组
输入
第一行一个整数N,表示測试数据组数。
接下来的N*2行,每两行表示一个測试数据。在每个測试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。
当中N<=20
输出
对于每个測试数据。依照它们在输入中出现的顺序输出一行Ans。表示模式串在原串中出现的次数。
例子输入
5
HA
HAHAHA
WQN
WQN
ADA
ADADADA
BABABB
BABABABABABABABABB
DAD
ADDAADAADDAAADAAD
例子输出
3
1
3
1
0
2.算法核心
本题目求得是模式串在原串中出现的次数。
我们通过在模式串的最后一位加入一个特殊字符$当模式串走到最后一位时候退回到新的位置进行比較
3.代码
#include<iostream>
#include<vector>
#include<string>
using namespace std;
void NextArrayCal(string &str,vector<int> &next)
{
int j=0,k=-1;
next[0]=-1;
while(j<str.size()-1)
{
if(k==-1||str[j]==str[k])
{
j++,k++;
if(str[j]!=str[k])
next[j]=k;
else
next[j]=next[k];
next[j]=k;
}
else
k=next[k];
}
}
int KMPindex(string &str,string&pat)
{
vector<int>next(pat.size());
NextArrayCal(pat,next);
int i=0,j=0;
int res=0;
int strsize=str.size(),patsize=pat.size();
while(i<strsize)
{
if(j==-1||str[i]==pat[j])
{
i++;j++;
}
else{
j=next[j];
}
if(j>=patsize-1)
{
++res;
j=next[patsize-1];
}
}
return res;
}
int main()
{
int tn;
cin>>tn;
string str;
string pat;
str.reserve(1000008);
pat.reserve(10008);
for(int ye=0;ye<tn;++ye)
{
cin>>pat;
pat+="$";
cin>>str;
cout<< KMPindex(str,pat)<<endl;
}
}
KMP 算法