首页 > 代码库 > bzoj3473字符串&bzoj3277串

bzoj3473字符串&bzoj3277串

题意:给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串.注意本质相同的子串多次出现算多次,如1 1 aaa这组数据答案为6,贡献1WA.代码里有些部分是为了处理子串本质不同,可能没删干净.

因为字符串的总长不超过10^5,那么后缀的个数也不超过10^5。一个长为x的后缀可以产生x个子串,其中在至少k个串中出现的子串一定是长度从1 开始递增的连续几个.那么对每个后缀可以二分找出最多能够产生多么长的在至少k个串中出现的子串.把所有串连起来求后缀数组,二分一个长度mid之后可以找出有哪些后缀和当前后缀的lcp>=mid,那么长度为mid的子串就可以在这些位置出现(即这些后缀所在的字符串包含了这个长度为mid的子串)。这些后缀一定是排名连续的一段区间,预处理每个后缀属于哪个字符串,判断这段区间中出现的不同的归属种数是否大于等于k,那么主席树(参考HH的项链)就可以做了。时间复杂度O(nlog^2n)=O(跑得出)。

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=200005;
int str[maxn];int tot=0;
int tmp[2][maxn],sum[maxn],key[maxn];int sa[maxn],rank[maxn],height[maxn];
int st[maxn][20],qlog[maxn];
void getsa(int n,int m){
  int i,j,k,p,*rk=tmp[0],*res=tmp[1];
  for(i=0;i<m;++i)sum[i]=0;
  for(i=0;i<n;++i)sum[rk[i]=str[i]]++;
  for(i=1;i<m;++i)sum[i]+=sum[i-1];
  for(i=n-1;i>=0;--i){
    sa[--sum[rk[i]]]=i;
  }
  for(j=1,p=0;p<n;j<<=1,m=p){
    for(i=0;i<m;++i)sum[i]=0;
    for(p=0,i=n-j;i<n;++i)res[p++]=i;
    for(i=0;i<n;++i)if(sa[i]>=j)res[p++]=sa[i]-j;
    for(i=0;i<n;++i)sum[key[i]=rk[res[i]]]++;
    for(i=1;i<m;++i)sum[i]+=sum[i-1];
    for(i=n-1;i>=0;--i)sa[--sum[key[i]]]=res[i];
    for(res[sa[0]]=0,p=1,i=1;i<n;++i)
      res[sa[i]]=(rk[sa[i]]==rk[sa[i-1]]&&rk[sa[i]+j]==rk[sa[i-1]+j])?p-1:p++;
    swap(res,rk);
  }
  for(i=1;i<n;++i)rank[sa[i]]=i;
  for(i=0,k=0;i<n-1;height[rank[i++]]=k)
    for(k?k--:0,j=sa[rank[i]-1];str[j+k]==str[i+k];++k);
  for(int i=1;i<n;++i)st[i][0]=height[i];
  for(int j=1;(1<<j)<n;++j){
    for(int i=1;i<n;++i){
      st[i][j]=st[i][j-1];
      if(i+(1<<j-1)<n&&st[i+(1<<j-1)][j-1]<st[i][j])st[i][j]=st[i+(1<<j-1)][j-1];
    }
  }
  for(int j=0;(1<<j)<n;++j)qlog[1<<j]=j;
  for(int i=3;i<n;++i)if(!qlog[i])qlog[i]=qlog[i-1];
}
int lcp(int a,int b){
  if(a==b)return 0x7f7f7f7f;
  a=rank[a];b=rank[b];
  if(a>b)swap(a,b);
  a++;int j=qlog[b-a+1];
  return min(st[a][j],st[b-(1<<j)+1][j]);
}
char buf[maxn];
int len[maxn],sumlen[maxn];
int belong[maxn];
struct node{
  int sum;node* ch[2];
  node(){}
  node(int x){sum=x;ch[0]=ch[1]=0;}
}t[maxn*35];int szoftree=0;
node* newnode(int x){
  t[++szoftree]=node(x);return t+szoftree;
}
void Insert(node* rt0,node* &rt,int l,int r,int k){
  rt=newnode(rt0->sum+1);
  if(l==r)return;
  int mid=(l+r)>>1;
  if(k<=mid){Insert(rt0->ch[0],rt->ch[0],l,mid,k);rt->ch[1]=rt0->ch[1];}
  else {Insert(rt0->ch[1],rt->ch[1],mid+1,r,k);rt->ch[0]=rt0->ch[0];}
}
int query(node* rt0,node* rt1,int l,int r,int ql,int qr){
  if(ql>qr)return 0;
  if(ql<=l&&r<=qr)return rt1->sum-rt0->sum;
  int mid=(l+r)>>1,ans=0;
  if(ql<=mid)ans+=query(rt0->ch[0],rt1->ch[0],l,mid,ql,qr);
  if(qr>mid) ans+=query(rt0->ch[1],rt1->ch[1],mid+1,r,ql,qr);
  return ans;
}
int last[maxn];
node* root[maxn];
typedef long long ll;
ll ans[maxn];
int lastsuf[maxn];
int pos;
int binary2(int l,int r,int x){
  while(l<=r){
    int mid=(l+r)>>1;
    if(lcp(pos,sa[mid])>=x)r=mid-1;
    else l=mid+1;
  }
  return r+1;
}
int binary3(int l,int r,int x){
  while(l<=r){
    int mid=(l+r)>>1;
    if(lcp(pos,sa[mid])>=x)l=mid+1;
    else r=mid-1;
  }
  return l-1;
}
int n,k;
int binary1(int suf,int l,int r){
  pos=sa[suf];
  while(l<=r){
    int mid=(l+r)>>1;
    int left=binary2(1,suf,mid),right=binary3(suf,tot,mid);//printf("%d %d %d\n",suf,left,right);
    if(query(root[left-1],root[right],1,tot,1,left)>=k)l=mid+1;
    else r=mid-1;
  }
  return l-1;
}
bool vis[maxn];
int main(){
  scanf("%d%d",&n,&k);
  for(int i=1;i<=n;++i){
    scanf("%s",buf);len[i]=strlen(buf);
    for(int j=0;j<len[i];++j){
      str[tot++]=buf[j];
    }
    str[tot++]=256+i;sumlen[i]=tot;
  }
  str[tot++]=0;
  getsa(tot,256+n+1);
  for(int i=1;i<=n;++i){
    for(int j=sumlen[i-1];j<sumlen[i]-1;++j)belong[rank[j]]=i;
  }
  root[0]=t+0;root[0]->ch[0]=root[0]->ch[1]=t+0;root[0]->sum=0;
  for(int i=1;i<tot;++i){
    root[i]=root[i-1];
    if(belong[i]){
      Insert(root[i],root[i],1,tot,last[belong[i]]+1);
      last[belong[i]]=i;
    }
  }//printf("tot==%d\n",tot);
  for(int i=1;i<tot;++i){
    if(belong[i]){//printf("%d\n",sa[i]);
      int lo=1,hi=sumlen[belong[i]]-sa[i]-1;//长度上下界
      // if(vis[belong[i]]){//printf("!");
      //     lo=max(lo,lcp(lastsuf[belong[i]],sa[i])+1);
      // }
      // lastsuf[belong[i]]=sa[i];vis[belong[i]]=true;
      hi=binary1(i,lo,hi);//printf("%d %d\n",lo,hi);
      ans[belong[i]]+=(hi-lo+1);
    }
  }
  for(int i=1;i<=n;++i)printf("%lld ",ans[i]);
  return 0;
}

 

bzoj3473字符串&bzoj3277串