首页 > 代码库 > KMP

KMP

字符串匹配广泛用于各类工程、研究。朴素的字符串匹配像极了两条履带,小的履带先和大的履带对齐,逐个验证上下是否一致。如果不一致,小的履带右移一格,继续上下比对。最坏复杂度是O(nm),实在难以让人满意。

实际上,小履带没必要每次都从头开始和大履带匹配,假设小履带已经匹配了好多,失配后右移一位从头开始走,有一大半点都是和小履带自己在匹配。这不坑爹么,根本没有用到大履带,为何要放到大履带的循环里呢?这部分完全可以做个预处理,下次直接跳到和大履带比对的点就行了。这就是KMP的getfail函数。
 
void getFail(string str){    f[0]=0;f[1]=0;    for(int i=1;i<str.size();i++)    {        int j=f[i];        while(j&&str[i]!=str[j]) j=f[j];        f[i+1]=(str[i]==str[j]?j+1:0);    }}
getfail函数

getfail函数采用类似动态规划的思想,记录每次应该跳跃到的点。

int KMP(string obj,string ask,int pos){    getFail(ask);    int j=0;    int n=obj.size();    for(int i=pos;i<n;i++)    {        while(j&&ask[j]!=obj[i]) j=f[j];        if(ask[j]==obj[i]) j++;        if(j==ask.size())        {            res++;            return i-j+1;        }}
KMP函数

匹配的时候直接从f记录的点开始,省去不少麻烦。

@练习题

HDU 3336

POJ 1961

KMP