首页 > 代码库 > POJ 3415 Common Substrings(后缀数组+单调栈)

POJ 3415 Common Substrings(后缀数组+单调栈)

 

【题目链接】 http://poj.org/problem?id=3415

 

【题目大意】

  求出两个字符串长度大于k的公共子串的数目。

 

【题解】

  首先,很容易想到O(n2)的算法,将A串和B串加拼接符相连,
  做一遍后缀数组,把分别属于A和B的所有后缀匹配,LCP-k+1就是对答案的贡献,
  但是在这个基础上该如何优化呢。
  我们可以发现按照sa的顺序下来,每个后缀和前面的串的LCP就是区间LCP的最小值,
  那么我们维护一个单调栈,将所有单调递减的LCP值合并,
  保存数量和长度,对每个属于B串的后缀更新前面A串的后缀的贡献,
  对属于A串的后缀更新属于B串的后缀的贡献即可。

 

【代码】

#include <cstdio>#include <cstring>#include <algorithm> using namespace std;typedef long long ll;const int N=400010;int n,rank[N],sa[N],h[N],tmp[N],cnt[N];char s[N];void suffixarray(int n,int m){    int i,j,k;n++;    for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;    for(i=0;i<m;i++)cnt[i]=0;    for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;    for(i=1;i<m;i++)cnt[i]+=cnt[i-1];    for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;    for(k=1;k<=n;k<<=1){        for(i=0;i<n;i++){            j=sa[i]-k;            if(j<0)j+=n;            tmp[cnt[rank[j]]++]=j;        }sa[tmp[cnt[0]=0]]=j=0;        for(i=1;i<n;i++){            if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;            sa[tmp[i]]=j;        }memcpy(rank,sa,n*sizeof(int));        memcpy(sa,tmp,n*sizeof(int));        if(j>=n-1)break;    }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)    while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];}int na[N],nb[N],K,st[N],top;int main(){    while(~scanf("%d",&K),K){        scanf(" %s",s);        int len=strlen(s); s[len]=‘#‘;        scanf(" %s",s+len+1);        n=strlen(s);        suffixarray(n,128);        for(int i=2;i<=n;i++)h[i]=max(0,h[i]-K+1);        ll ans=0,w1=0,w2=0; top=0;        for(int i=2;i<=n;i++){            st[++top]=h[i];            if(sa[i-1]<len)na[top]=1,nb[top]=0,w1+=h[i];            else na[top]=0,nb[top]=1,w2+=h[i];            while((top>1)&&st[top]<=st[top-1]){                w1-=na[top-1]*(st[top-1]-st[top]);                w2-=nb[top-1]*(st[top-1]-st[top]);                na[top-1]+=na[top]; nb[top-1]+=nb[top];                st[top-1]=st[top--];            }if(sa[i]<len)ans+=w2;            else ans+=w1;        }printf("%lld\n",ans);    }return 0;}

  

POJ 3415 Common Substrings(后缀数组+单调栈)