首页 > 代码库 > hdu 4416 Good Article Good sentence (后缀数组)

hdu 4416 Good Article Good sentence (后缀数组)

题目大意:

给出一个A串和很多个B串,求出A中有多少个子串,是所有的B中没有出现的。


思路分析:

后缀数组的作用很容易的求出来整个串中不同的子串个数。

现在要求的是A中不同的,且在B中没有出现过的。


先把AB 串全部连接,跑一遍suffix array。然后求出有多少个不同的子串。

然后再单独用B 串跑 suffix array。再求出单独在B 中有多少个不同的 子串。

然后结果就是 ans1 - ans2 ...

需要注意的问题就是,连接的时候需要把每一个串后面加一个特殊符。但是求不同串的时候是不能算进去的。

所以要进行一些判断。

#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#include <vector>
#define lson num<<1,s,mid
#define rson num<<1|1,mid+1,e
#define maxn 311005
#define inf 0x3f3f3f3f
using namespace std;
typedef long long ll;

int str[maxn<<1];
int sa[maxn],t1[maxn],t2[maxn],c[maxn];
void suffix(int n,int m)
{
    int *x=t1,*y=t2;
    for(int i=0; i<m; i++)c[i]=0;
    for(int i=0; i<n; i++)c[x[i]=str[i]]++;
    for(int i=1; i<m; i++)c[i]+=c[i-1];
    for(int i=n-1; i>=0; i--)sa[--c[x[i]]]=i;
    for(int k=1; k<=n; k<<=1)
    {
        int p=0;
        for(int i=n-k; i<n; i++)y[p++]=i;
        for(int i=0; i<n; i++)if(sa[i]>=k)y[p++]=sa[i]-k;
        for(int i=0; i<m; i++)c[i]=0;
        for(int i=0; i<n; i++)c[x[y[i]]]++;
        for(int i=0; i<m; i++)c[i]+=c[i-1];
        for(int i=n-1; i>=0; i--)sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;
        x[sa[0]]=0;
        for(int i=1; i<n; i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        if(p>=n)break;
        m=p;
    }
}
int rank[maxn],height[maxn];
void getheight(int n)
{
    int k=0;
    for(int i=0; i<n; i++)rank[sa[i]]=i;
    for(int i=0; i<n; i++)
    {
        if(k)k--;
        if(!rank[i])continue;
        int j=sa[rank[i]-1];
        while(str[i+k]==str[j+k])k++;
        height[rank[i]]=k;
    }
}

char tmp[maxn];
int dex[maxn];
int len[maxn];
int main()
{
    int T,CASE=1;
    scanf("%d",&T);
    int tp;
    while(T--)
    {
        memset(dex,0x3f,sizeof dex);
        memset(len,0,sizeof len);
        tp=0;

        int N;
        scanf("%d",&N);

        scanf("%s",tmp);

        len[1] = strlen(tmp);

        for(int j=0;j<len[1];j++)
        {
            dex[tp]=1;
            str[tp++]=tmp[j];
        }

        str[tp++]=1+128;

        for(int i=2;i<=N+1;i++)
        {
            scanf("%s",tmp);
            len[i]=strlen(tmp);
            for(int j=0;j<len[i];j++)
            {
                dex[tp]=i;
                str[tp++]=tmp[j];
            }
            str[tp++]=i+128;
            len[i]=tp-1;
        }

        str[tp-1]=0;
        suffix(tp,N+200);
        getheight(tp);//对AB串进行处理

        ll ans=0;

        for(int i=1;i<tp;i++)
        {
            if(dex[sa[i]]!=inf)
                ans+=len[dex[sa[i]]]-sa[i]-height[i];
        }

        for(int i=len[1]+1;i<tp;i++)
        {
            str[i-len[1]-1]=str[i];
            dex[i-len[1]-1]=dex[i];
        }

        for(int i=2;i<=N+1;i++)
            len[i]-=len[1]+1;

        tp-=len[1]+1;

        suffix(tp,N+200);
        getheight(tp);//对B串单独进行处理
        ll tans = 0;
        for(int i=1;i<tp;i++)
        {
                if(dex[sa[i]]!=inf)
                tans+=len[dex[sa[i]]]-sa[i]-height[i];
        }

        printf("Case %d: %I64d\n",CASE++,ans-tans);
    }
    return 0;
}