首页 > 代码库 > 赫夫曼编码(优先队列实现)

赫夫曼编码(优先队列实现)

/*
Name: 赫夫曼编码(优先队列实现) 
Copyright:
Author: 巧若拙 
Date: 28/09/14 12:17
Description: 
采用优先队列把一个普通线性表改造成赫夫曼树,再进行赫夫曼编码,得到一个同时记录了明文和对应编码的密码本。
使用优先队列(最小堆)构造赫夫曼树是一种高效的方法,比每次都遍历整个线性表要快很多。
我在构造密码本时确保密码本数组递增排序,这样每次插入新结点时可以折半查找插入,效率较高。
有序的密码本在把明文编码成密文时也可以大大提高查找效率。 
*/


#include<stdio.h>
#include<stdlib.h>
#include<malloc.h>
#include<math.h>
#include<time.h>


#define MAXSIZE 300
#define OK 1
#define ERROR 0
#define TRUE 1
#define FALSE 0 


typedef char ElemType;
typedef int Status; //函数类型,其值是函数结果状态代码,如OK等 


typedef struct {
ElemType data;
int weight;
int parent;
int lchild;
int rchild;
} HNodeType;    //结点结构体


typedef struct {
ElemType data; //明文信息 
char *code;    //密文信息 
} HCodeType;    //编码结构体


void BuildMinHeap(HNodeType Hf[], int n);//将线性表Hf改造成一个最小堆 
void MinHeapSiftDown(HNodeType Hf[], int n, int pos);//向下调整二叉堆的第pos个元素,使其满足最小堆的特征 
void HuffmanTree (HNodeType Hf[], int n);//将线性表改造成赫夫曼树
void DisplayCodebook(HCodeType Cb[], int n);//显示密码本中的明码和对应密码信息 
int InsertCodeLib(HCodeType Cb[], int n, ElemType x, char *s, int len);//将新结点插入到密码本的编码线性表中 
int HfCoding(HCodeType Cb[], HNodeType Hf[], int n);//根据赫夫曼树进行赫夫曼编码,生成密码本


int main(void)
{
HNodeType Hf[MAXSIZE*2];   //赫夫曼树 
HCodeType codebook[MAXSIZE]; //密码本 
int lenHf = 5; //赫夫曼树叶子结点个数 
int lenCb;    //密码本长度(等于lenHf) 
int i;

for (i=0; i<lenHf; i++) //随机产生数据和权值 
{
Hf[i].data = http://www.mamicode.com/‘A‘ + i;
Hf[i].weight = rand() % 10 + 1;
printf("%c : %d\n", Hf[i].data, Hf[i].weight);
}


    HuffmanTree (Hf, lenHf); //将线性表改造成赫夫曼树

    lenCb = HfCoding(codebook, Hf, lenHf*2-1);//根据赫夫曼树进行赫夫曼编码,生成密码本
    puts("密码本:"); 
    DisplayCodebook(codebook, lenCb);//显示密码本中的明码和对应密码信息 
    
    return 0;
}


/*
函数功能:将线性表改造成赫夫曼树
初始条件:非递减线性表Hf已经存在 
操作结果:先将原线性表改造成最小堆(优先队列),然后按照如下顺序处理该最小堆:
删除权重最小的两个结点,并将他们加入到队列尾部,将该两个最小结点的权值相加,生成一个新结点,并将新结点加入到优先队列。
不断调整该最小堆,直到只剩下一个结点,即得到赫夫曼树。 
注意:每次产生新结点时,只需设置新结点的权重及孩子结点信息,双亲结点信息等赫夫曼树构造完毕后再统一计算。  
*/
void HuffmanTree (HNodeType Hf[], int n)
{
int i;
int len = 2*n - 1;
int front = n -1;
int rear = len - 1;

BuildMinHeap(Hf, n);

for (i=0; i<len; i++) //初始化孩子结点位置 
{
Hf[i].lchild = Hf[i].rchild = -1;
}

while (front > 0)
{
//删除权重最小的两个结点,并将他们加入到队列尾部 
Hf[rear] = Hf[0];
Hf[0] = Hf[front];
MinHeapSiftDown(Hf, front+1, 1);//向下调整二叉堆的第1个元素,使其满足最小堆的特征 
Hf[rear-1] = Hf[0];
//设置新结点的权重及孩子结点信息 
Hf[0].weight = Hf[rear].weight + Hf[rear-1].weight;
Hf[0].lchild = rear;
Hf[0].rchild = rear - 1;
MinHeapSiftDown(Hf, front, 1);//向下调整二叉堆的第1个元素,使其满足最小堆的特征 
rear -= 2; //由于有两个结点加入新队列,队尾指示前移2位 
front--;//由于有(2-1 = 1)结点出列,队头指示前移1位  
}

//计算父亲结点位置 
Hf[0].parent = -1;
for (i=0; i<len; i++)
{
Hf[Hf[i].lchild].parent = Hf[Hf[i].rchild].parent = i;
}
}


/*
函数功能:将新结点插入到密码本的编码线性表中 
初始条件:每个编码的明文和密文信息分别记录在x和s中,len是字符串s的长度 
操作结果:先折半查找插入位置,然后插入新结点,将x和s的信息复制给新结点,注意s中存储的结点编码的路径是从叶子到根,存储到密码本时需要逆序复制 。 
*/
int InsertCodeLib(HCodeType Cb[], int n, ElemType x, char *s, int len)//采用二分查找插入排序 
{
int i, mid;
int left = 0, right = n-1;

while (left <= right)//折半查找插入位置
{
mid = (left + right) / 2;

   if (x > Cb[mid].data)
{
left = mid + 1;
}
else
{
right = mid -1;
}
}
//新数据,执行插入操作 
for (i=n; i>left; i--)
{
Cb[i] = Cb[i-1];
}

Cb[left].code = (char*)malloc(sizeof(char)*(len+1));
if (!Cb[left].code) 
{
printf("Out of space!");
exit(0);
}

for (i=len-1; i>=0; i--) //把s的字符串逆序复制到code 
{
Cb[left].code[len-1-i] = s[i];
}
Cb[left].code[len] = ‘\0‘;
Cb[left].data = http://www.mamicode.com/x;


return n+1;
}


/*
函数功能:根据赫夫曼树进行赫夫曼编码,生成密码本 
初始条件:赫夫曼树Hf已经存在,n是赫夫曼树的长度 
操作结果:对赫夫曼树的叶子结点进行编码,并存储到密码本,返回密码本长度。
对密码本中的各个结点采用二分查找插入,构造非递减序列,以便于查找和编码。 
*/
int HfCoding(HCodeType Cb[], HNodeType Hf[], int n)
{
int i, j, k, f;
int top = 0; //为编码结构体构造一个栈,top指示栈顶 
char str[MAXSIZE]; //存储编码的临时字符串 


for (i=0; i<n; i++)
{
if (Hf[i].lchild == -1)//是叶子结点
{
j = i;
f = Hf[j].parent;
k = 0;

while (f != -1) //逆序存储该结点的编码,注意结点编码的路径是从叶子到根,存储到密码本时需要逆序复制 
{  
if (j == Hf[f].lchild)
{
str[k++] = ‘0‘;
}
else
{
str[k++] = ‘1‘;
}

j = f;
f = Hf[j].parent;
}
str[k] = ‘\0‘;

top = InsertCodeLib(Cb, top, Hf[i].data, str, k);//采用二分查找插入排序 

}

return top;
}


/*
函数功能:显示密码本中的明码和对应密码信息 
初始条件:密码本已经存在 
操作结果:显示密码本中的明码和对应密码信息。 
*/
void DisplayCodebook(HCodeType Cb[], int n)
{
int i, j;

for (i=0; i<n; i++)
{
printf("%c: ", Cb[i].data);
puts(Cb[i].code);
}
}


/*
函数功能:向下调整二叉堆的第pos个元素,使其满足最小堆的特征 
初始条件:最小堆Hf已经存在,只有第pos个元素不满足特征 
操作结果:向下调整二叉堆的第pos个元素,使其满足最小堆的特征。 
*/
void MinHeapSiftDown(HNodeType Hf[], int n, int pos)
{
HNodeType temp = Hf[pos-1];
int child = pos * 2; //指向左孩子 

while (child <= n)
{
if (child < n && Hf[child-1].weight > Hf[child].weight) //有右孩子,且右孩子更小些,定位其右孩子 
child += 1;

if (Hf[child-1].weight < temp.weight) //通过向上移动孩子结点值的方式,确保双亲大于孩子 
{
Hf[pos-1] = Hf[child-1]; 
pos = child;
child = pos * 2;
}
else
break;
}

Hf[pos-1] = temp; //将temp向下调整到适当位置 
}


/*
函数功能:将线性表Hf改造成一个最小堆 
初始条件:线性表Hf已经存在
操作结果:将线性表Hf改造成一个最小堆 
*/
void BuildMinHeap(HNodeType Hf[], int n)
{
int i;

for (i=n/2; i>0; i--)
{
MinHeapSiftDown(Hf, n, i);
}
}

赫夫曼编码(优先队列实现)