首页 > 代码库 > 【bzoj4198】[Noi2015]荷马史诗 贪心+堆

【bzoj4198】[Noi2015]荷马史诗 贪心+堆

题目描述

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

输出

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

样例输入

4 2
1
1
2
2

样例输出

12
2


题解

贪心+堆

感觉这题和哈夫曼树的关系并不是很大啊~

先来说我的思考方法:

题目要求任意两个串不能有前缀关系,因此它们在Trie树上不能是祖先关系。

也就是说只有Trie树上的叶子结点才可以使用。

然后每个单词的长度就是它的深度。

现在要找出一种方式,使得所有单词的出现次数*长度的和最小。

我们把长度拆成一段一段的,即对于Trie树上的每一条边考虑,它增加的是它子树中叶子结点的出现次数之和。对于一棵子树,由它的儿子到达它,需要它所有子孙节点的出现次数之和。

我们把这个想象成儿子节点的合并过程,容易发现它与合并果子极为相似。当k=2时完全就是合并果子。

那么当k>2时也是一样的,优先挑k短的合并。然而可能存在一种情况:(n-1)%(k-1)>0,使得无法完美合并,这样无法保证答案的正确性。

考虑在其中加入出现次数为0的单词,答案一定不変,所以我们可以补0,直到能整除为止。

这样每次挑出堆中权值最小的点,权值相同则挑深度最小的,把它们合并即可。

然后网上的题解:

裸的k-哈夫曼树~

感觉自己完全是被骗了 = =

#include <cstdio>#include <queue>#define N 100010using namespace std;typedef long long ll;typedef pair<ll , int> pr;priority_queue<pr> q;int main(){	int n , k , i , d;	ll s , ans = 0;	scanf("%d%d" , &n , &k);	for(i = 1 ; i <= n ; i ++ ) scanf("%lld" , &s) , q.push(pr(-s , 0));	while((n - 1) % (k - 1)) q.push(pr(0 , 0)) , n ++ ;	while(q.size() > 1)	{		s = 0 , d = 0;		for(i = 1 ; i <= k ; i ++ )			s += q.top().first , d = min(d , q.top().second) , q.pop();		ans -= s , q.push(pr(s , d - 1));	}	printf("%lld\n%d\n" , ans , -q.top().second);	return 0;}

 

 

【bzoj4198】[Noi2015]荷马史诗 贪心+堆