首页 > 代码库 > 第三次作业

第三次作业

2.利用程序huff_enc和huff_dec进行以下操作(在每种情下,利用由被压缩生成的码本)。

(a)对Sena、Sensin和Omaha图像进行编码。

解:用表格的形式给出对应文件压缩前后的大小为(单位用字节表示)

图像名称

压缩前

压缩后

压缩率

Sena

64k(65536Byte)

57k(58368Byte)

89%

Sensin

64k(65536Byte)

61K(62464Byte)

95%

Omaha  

64k(65536Byte)

57K(58368Byte)

91%

 

4.一个信源从符号集A={a1,a2,a3,a4,a5}中选择字母,概率为P(a1)=0.15,P(a2)=0.04,P(a3)=0.26,P(a4)=0.05,P(a1)=0.50.

(a)计算这个信源的熵。

(b)求这个信源的霍夫曼码。

(c)求(b)中代码的平均长度及其冗余度。

答:

(a)H=-[p(a1)*log2p(a1)+p(a2)*log2p(a2)+p(a3)*log2p(a3)+p(a4)*log2p(a4)+p(a5)*log2p(5)]

  =-(0.15*log20.15+0.04*log20.04+0.26*log20.26+0.05*log20.05+0.50*log20.50)

=0.4105+0.1858+0.5053+0.2161+0.5

=1.8177 bits/symbol

(b) 这个信源的霍夫曼码为:

技术分享

a1的编码为:001

a2的编码为:0000

a3的编码为:01

a4的编码为:0001

a5的编码为:1 

 

(c)平均长度

l=p(a1)*l(a1)+p(a2)*l(a2)+p(a3)*l(a3)+p(a4)*l(a4)+p(a5)*l(a5)

          =0.15*3+0.04*4+0.26*2+0.05*4+0.50*1

=1.83bit

冗余度r=Hmax(x)-H(X)=logm=H(X)=1.83-0.8177=1.0123

 

2、 思考:为什么压缩领域中的编码方法总和二叉树联系在一起呢?

答:因为为了使用不固定的码长表示单个字符,编码必须符合前缀编码的要求,即较短的编码决不能是较长编码的前缀。要构造符合这一要求的二进制编码体系,二叉树是最理想的选择。

举例如下:

       技术分享 

要编码的字符总是出现在树叶上,假定从根向树叶行走的过程中,左转为0,右转为 

1,则一个字符的编码就是从根走到该字符所在树叶的路径。正因为字符只能出现在 

树叶上,任何一个字符的路径都不会是另一字符路径的前缀路径,所以得出符合要求的前缀 

编码为: 

a : 00

b : 010 

c :011 

d :10 

e :11

 

第三次作业