首页 > 代码库 > 【BZOJ 2038】 [2009国家集训队]小Z的袜子(hose)

【BZOJ 2038】 [2009国家集训队]小Z的袜子(hose)

2038: [2009国家集训队]小Z的袜子(hose)

Time Limit: 20 Sec  Memory Limit: 259 MB
Submit: 2839  Solved: 1269
[Submit][Status]

Description

作为一个生活散漫的人,小Z每天早上都要耗费很久从一堆五颜六色的袜子中找出一双来穿。终于有一天,小Z再也无法忍受这恼人的找袜子过程,于是他决定听天由命……
具体来说,小Z把这N只袜子从1N编号,然后从编号LR(L 尽管小Z并不在意两只袜子是不是完整的一双,甚至不在意两只袜子是否一左一右,他却很在意袜子的颜色,毕竟穿两只不同色的袜子会很尴尬。
你的任务便是告诉小Z,他有多大的概率抽到两只颜色相同的袜子。当然,小Z希望这个概率尽量高,所以他可能会询问多个(L,R)以方便自己选择。

Input

输入文件第一行包含两个正整数N和M。N为袜子的数量,M为小Z所提的询问的数量。接下来一行包含N个正整数Ci,其中Ci表示第i只袜子的颜色,相同的颜色用相同的数字表示。再接下来M行,每行两个正整数L,R表示一个询问。

Output

包含M行,对于每个询问在一行中输出分数A/B表示从该询问的区间[L,R]中随机抽出两只袜子颜色相同的概率。若该概率为0则输出0/1,否则输出的A/B必须为最简分数。(详见样例)

Sample Input

6 4
1 2 3 3 3 2
2 6
1 3
3 5
1 6

Sample Output

2/5
0/1
1/1
4/15
【样例解释】
询问1:共C(5,2)=10种可能,其中抽出两个2有1种可能,抽出两个3有3种可能,概率为(1+3)/10=4/10=2/5。
询问2:共C(3,2)=3种可能,无法抽到颜色相同的袜子,概率为0/3=0/1。
询问3:共C(3,2)=3种可能,均为抽出两个3,概率为3/3=1/1。
注:上述C(a, b)表示组合数,组合数C(a, b)等价于在a个不同的物品中选取b个的选取方案数。
【数据规模和约定】
30%的数据中 N,M ≤ 5000;
60%的数据中 N,M ≤ 25000;
100%的数据中 N,M ≤ 50000,1 ≤ L < R ≤ N,Ci ≤ N。

HINT

Source

版权所有者:莫涛


莫队算法。


使用莫队算法的前提


如果我们已知[l,r]的答案,能在O(1)时间得到[l+1,r]的答案以及[l,r-1]的答案,即可使用莫队算法。

时间复杂度为O(n^1.5)。如果那个只能在logn的时间求,则时间复杂度是O(n^1.5*log n)。

说白了,就是用一个“神奇的数据结构”维护插入、删除操作。


这道题的话我们很容易用“数组”来实现那个“神奇的数据结构”,做到O(1)的从[l,r]转移到[l,r+1]与[l+1,r]


那么莫队算法怎么做呢?以下都是在转移为O(1)的基础下讨论的时间复杂度。另外由于n与m同阶,为了书写方便,我就全部写成n了……


如果已知[l,r]的答案,要求[l‘,r‘]的答案,我们很容易在O( | l - l‘ + | r - r‘ | )的时间复杂度内求得。


莫涛大神是这么说的:把询问[l,r]抽象成一个点(l,r),题目就转化为求n个点的最小曼哈顿哈密尔顿路(详细说明见这里)由于这是个NP问题,所以我们希望找到一个稍微劣一点又不是很劣的但是能快速求得方案。

莫涛大神在他的论文里使用了二维曼哈顿距离最小生成树。


二维曼哈顿距离最小生成树可以用区域划分法+树状数组/线段树维护区间极值在nlogn的时间复杂度内完成构图,并用Kruskal在O(nlogn)内求得,但是代码比较繁琐。


这里介绍一个优美的替代品——分块。


将n个数分成sqrt(n)块。


按区间排序,以左端点所在块内为第一关键字,右端点为第二关键字,进行排序,也就是以( pos [l],r )排序。


然后设颜色k在区间(l,r)内出现的次数为s[k],抽出两只袜子相同的概率由乘法原理可知为

sigma[s[k]*(s[k]-1)]/[(r-l+1)*(r-l)]


为什么分块的时间是O(n^1.5)?

一、i与i+1在同一块内,r单调递增,所以r是O(n)的。由于有n^0.5块,所以这一部分时间复杂度是n^1.5。

二、i与i+1跨越一块,r最多变化n,由于有n^0.5块,所以这一部分时间复杂度是n^1.5

三、i与i+1在同一块内时变化不超过n^0.5,跨越一块也不会超过2*n^0.5,不妨看作是n^0.5。由于有n个数,所以时间复杂度是n^1.5

于是就变成了O(n^1.5)了

(以上参考自hzwer,有修改)


#include <iostream>
#include <cstring>
#include <algorithm>
#include <cmath>
#include <cstdio>
#define maxn 50005
#define LL long long
using namespace std;
LL s[maxn],ans;
int n,m,pos[maxn],c[maxn];
struct data
{
	int l,r,id;
	LL a,b;
}q[maxn];
bool cmp(data a,data b)
{
	if (pos[a.l]==pos[b.l]) return a.r<b.r;
	return a.l<b.l;
}
bool cmp_id(data a,data b)
{
	return a.id<b.id;
}
LL Gcd(LL a,LL b)
{
	return b==0?a:Gcd(b,a%b);
}
LL Mult(LL x)
{
	return x*(x-1);
}
void Update(int p,int val)
{
	ans-=Mult(s[c[p]]);
	s[c[p]]+=val;
	ans+=Mult(s[c[p]]);
}
void Solve()
{
	for (int i=1,l=1,r=0;i<=m;i++)
	{
		for (;r<q[i].r;r++)     //以下循环都是由当前询问变到下一个询问的处理
			Update(r+1,1);
		for (;r>q[i].r;r--)
			Update(r,-1);
		for (;l<q[i].l;l++)
			Update(l,-1);
		for (;l>q[i].l;l--)
			Update(l-1,1);
		if (q[i].l==q[i].r)
		{
			q[i].a=0,q[i].b=1;
			continue;
		}
		q[i].a=ans;
		q[i].b=(LL)(q[i].r-q[i].l+1)*(q[i].r-q[i].l);
		LL k=Gcd(q[i].a,q[i].b);   //化成最简分数
		q[i].a/=k,q[i].b/=k;
	}
}
int main()
{
        scanf("%d%d",&n,&m);
	for (int i=1;i<=n;i++)
		scanf("%d",&c[i]);
	int block=int(sqrt(n));
	for (int i=1;i<=n;i++)
		pos[i]=(i-1)/block+1;
	for (int i=1;i<=m;i++)
	{
		scanf("%d%d",&q[i].l,&q[i].r);
		q[i].id=i;
	}
	sort(q+1,q+1+m,cmp);
	Solve();
        sort(q+1,q+1+m,cmp_id);
	for (int i=1;i<=m;i++)
		printf("%lld/%lld\n",q[i].a,q[i].b);
	return 0;
}


(如果先离散y坐标再用树状数组时间会少很多。。)


感悟:

莫队算法是离线来做,改变询问的顺序,在当前询问的基础上来计算下一个询问,同时使得从一个询问变换到下一个询问的时间总和最少。

(感觉和CDQ分治有某些相似之处。。)

【BZOJ 2038】 [2009国家集训队]小Z的袜子(hose)