首页 > 代码库 > 【SPOJ】8222. Substrings(后缀自动机)
【SPOJ】8222. Substrings(后缀自动机)
http://www.spoj.com/problems/NSUBSTR/
题意:给一个字符串S,令F(x)表示S的所有长度为x的子串中,出现次数的最大值。求F(1)..F(Length(S))
这题做法:
首先建立字符串的后缀自动机。
因为自动机中的每个状态都代表一类子串前缀,且任意状态的最长的|max|所对应的子串是唯一的。
所以我们算出每个子串(即找到的状态是end态),他们的right值为++(即保证长度为当前子串的出现次数为1),然后自底向上在parent树中更新right值(parent树中right值就是出现次数,所以包含子树的要加上子树的right)。
那么可以得到所有长度的right值。right值就是子串的出现次数。
此时可以更新出长度为每个状态长度为|max|的出现次数。
因为我们求出的只是max,可是因为:长子串中一定有短子串那么多个(parent树中就是祖先),那么可以用长串来更新短串。
更新right值时要从长度长的更新(因为长度从长到短,对应了parent树上的叶节点和内节点的关系,状态的right值的数目单调不减),所以我们先基排一次,然后从大到小更新。
这样就求出了所有子串的出现次数。
#include <cstdio>#include <cstring>#include <cmath>#include <string>#include <iostream>#include <algorithm>#include <queue>#include <set>#include <map>using namespace std;typedef long long ll;#define rep(i, n) for(int i=0; i<(n); ++i)#define for1(i,a,n) for(int i=(a);i<=(n);++i)#define for2(i,a,n) for(int i=(a);i<(n);++i)#define for3(i,a,n) for(int i=(a);i>=(n);--i)#define for4(i,a,n) for(int i=(a);i>(n);--i)#define CC(i,a) memset(i,a,sizeof(i))#define read(a) a=getint()#define print(a) printf("%d", a)#define dbg(x) cout << (#x) << " = " << (x) << endl#define error(x) (!(x)?puts("error"):0)#define rdm(x, i) for(int i=ihead[x]; i; i=e[i].next)inline const int getint() { int r=0, k=1; char c=getchar(); for(; c<‘0‘||c>‘9‘; c=getchar()) if(c==‘-‘) k=-1; for(; c>=‘0‘&&c<=‘9‘; c=getchar()) r=r*10+c-‘0‘; return k*r; }struct sam { static const int N=1000005; int c[N][26], l[N], f[N], root, last, cnt; sam() { cnt=0; root=last=++cnt; } void add(int x) { int now=last, a=++cnt; last=a; l[a]=l[now]+1; for(; now && !c[now][x]; now=f[now]) c[now][x]=a; if(!now) { f[a]=root; return; } int q=c[now][x]; if(l[q]==l[now]+1) { f[a]=q; return; } int b=++cnt; memcpy(c[b], c[q], sizeof c[q]); l[b]=l[now]+1; f[b]=f[q]; f[q]=f[a]=b; for(; now && c[now][x]==q; now=f[now]) c[now][x]=b; } void build(char *s) { int len=strlen(s); rep(i, len) add(s[i]-‘a‘); }}a;const int N=250005;char s[N];int f[N], r[1000005], t[N], b[1000005];void getans(int len) { int *l=a.l, *p=a.f, cnt=a.cnt; for(int now=a.root, i=0; i<len; ++i) now=a.c[now][s[i]-‘a‘], ++r[now]; for1(i, 1, cnt) ++t[l[i]]; for1(i, 1, len) t[i]+=t[i-1]; for1(i, 1, cnt) b[t[l[i]]--]=i; for3(i, cnt, 1) r[p[b[i]]]+=r[b[i]]; for1(i, 1, cnt) f[l[i]]=max(f[l[i]], r[i]); for3(i, len, 1) f[i]=max(f[i+1], f[i]); for1(i, 1, len) printf("%d\n", f[i]);}int main() { scanf("%s", s); a.build(s); getans(strlen(s)); return 0;}
8222. SubstringsProblem code: NSUBSTR |
You are given a string S which consists of 250000 lowercase latin letters at most. We define F(x) as the maximal number of times that some string with length x appears in S. For example for string ‘ababa‘ F(3) will be 2 because there is a string ‘aba‘ that occurs twice. Your task is to output F(i) for every i so that 1<=i<=|S|.
Input
String S consists of at most 250000 lowercase latin letters.
Output
Output |S| lines. On the i-th line output F(i).
Example
Input:
ababa
Output:
3
2
2
1
1
【SPOJ】8222. Substrings(后缀自动机)