首页 > 代码库 > 二进制哈夫曼编码

二进制哈夫曼编码

现有一段文言文,要通过二进制哈夫曼编码进行压缩。假设这段文言文只由4个汉字“之”“乎”“者”“也”组成,它们出现的次数分别为700、600、300、200。那么,“也”字的编码长度是( )。

 

哈弗曼编码的原理需要你自己研究再看看其思想。本题解如图:

汉字    概率      编码

之:    700            00

乎:    600            011

者:    300            0101

也:    200            0100

(编码数如图这个二叉树得到,左边为0,右边为1,每一个字符都从根节点数)

可以看出:出现次数越多的字符,编码越短;出现次数越少的字符,编码越长。这样就能让编码后的文件大小能够最短。

技术分享

 

 

字符串 "alibaba" 的二进制哈夫曼编码有多少位 ?

技术分享

 

二进制哈夫曼编码