首页 > 代码库 > 求哈夫曼的带权路径长度

求哈夫曼的带权路径长度

【问题描述】
 已知输入两行正整数,第二行正整数之间用空格键分开,请建立一个哈夫曼树,以输入的数字为叶节点,求这棵哈夫曼树的带权路径长度。

【输入形式】
 首先第一行为输入正整数的个数,然后接下来的一行正整数,代表叶结点,正整数个数不超过1000个

【输出形式】
 输出相应的权值

【样例输入】

 5

 4 5 6 7 8

【样例输出】

 69

关于哈夫曼树——

1、 路径长度

从树中一个结点到另一个结点之间的分支构成两个结点之间的路径,路径上的分支数目称做路径长度。

技术分享

图1  从根节点到D节点的路径长度为4


1、 树的路径长度

路径长度就是从树根到每一结点的路径长度之和。

技术分享

图2 树的路径长度为1+1+2+2+3+3+4+4=20


1、 哈夫曼树:

带权路径长度WPL(Weighted Path Length)最小的二叉树,也称为最优二又树.

例: 上图的WPL=1*5 + 2*15 + 3*40 + 4*30 + 4*10= 315

 

先了解通过刚才的步骤,我们可以得出构造哈夫曼树的算法描述。

1、根据给定的n个权值{w[1],w[2],…,w[n]}构成n棵二叉树的集合F={T[1],T[2],…T[n]},    其中每棵二叉树T[i];中只有一个带权为w[i]的根结点,其左右子树均为空。


2、在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的.二叉树,且置新的二叉树的根结点的权值为其左右子树上根结点的权值之和,


3、在F中删除这两棵树,同时将新得到的二义树加入F中。


4重复2和3步骤,直到F只含一棵树为止。这棵树便是哈夫曼树.

结合例题说明一下这个算法


技术分享

技术分享

技术分享

技术分享

技术分享

图3 哈夫曼树的构造过程示意图



技术分享

图4 最终结果


那么可以由上面的哈夫曼树计算出最小带权路径长度

WPL = 1*9 + 2*5 + 3*2 + 4*1 + 4*2 =37

 

另外还可以有另外一个方法,结合算法描述仔细观察发现最小带权路径长度为非叶子结点的和 ,即

WPL= 19 + 10 +5 +3=37


至于算法的正确性,一下子也想不到什么好的办法来证明,不过应该是可以逻辑推导过来的。


那么要实现这段程序,由上面的算法描述图我们已经知道差不多了,主要分为三步:

一、排序,直到数组中只有一个数则退出

二、最小两个数加起来,即为非叶子节点,累加到累加器中

三、把最小两个数加起来作为一个新的值保存在数组中,去掉最小两个值,跳回第一步


#include<stdio.h>
#include<stdlib.h>                          //qsort();

#define N 1010

int rising(const void *a, const void *b)    
{
    return *(int*)a - *(int*)b;
}

int main()
{
    int leaf[N] = {0}, n, i, sum = 0;

    scanf("%d", &n);
    for(i=0; i<n; i++)
        scanf("%d", leaf+i);

    for(i=0; i<n-1; i++)
    {
        qsort(leaf+i, n-i, sizeof(leaf[0]), rising);    //排序并剔除已使用的叶结点
        leaf[i+1] += leaf[i];     //合并两个最小的叶结点成一新的节点(放在leaf[i+1]中)
        sum += leaf[i+1];         //总路径长 = 所有非叶结点之和
    }
    printf("%d\n", sum);
    
    return 0;
}

求哈夫曼的带权路径长度