首页 > 代码库 > 第三次作业

第三次作业

1、 参考书《数据压缩导论(第4版)》  Page 66   2(a),4 

 说明:

    -- 第2题的(a)请用表格的形式给出对应文件压缩前后的大小(单位用字节表示),格式如下所示:

   图像文件名               压缩前             压缩后

 

    Sena                      64kb              56kb

    Sinan                     64kb              59kb

    Omaha                   64kb              57kb

4.一个信源从符号集A{a1,a2,a3,a4,a5}中选择字母,概率为p(a1)=0.15,p(a2)=0.04,p(a3)=0.26,p(a4)=0.05,p(a5)=0.50。

(a)计算这个信源的熵。

(b)求这个信源的霍夫曼码。

(c)求(b)中代码的平均长度及其冗余度。

解:  (a)H=-Σp(xi)log2p(xi)

                  =-(0.15×log2 0.15+0.04×log2 0.04+0.26×log2 0.26

                        +0.05×log2 0.05+0.50×log2 0.50)

                  =1.818

         (b)a1     001

                 a2     0000

                 a3     01

                 a4     0001

                 a5     1

            (c)l=3×0.15+4×0.04+2×0.26+4×0.05+1×0.50

                     =1.83

                  r=l-H=1.83-1.818=0.012

3.为什么压缩领域中的编码方法总和二叉树联系在一起呢?

    答:编码时,单个字母的码长不一定,则编码会符合“前缀编码”(短编码不会是长编码的前缀)。而这种编码形势又完全符合二叉树模型。所以编码方法和二叉树总联系在一起。

第三次作业