首页 > 其他分享> > 电文的编码与编译

电文的编码与编译

2021-12-19 14:33:08 作者：互联网

内容：

从键盘接受一串电文字符，输出对应的Huffman编码，同时，能翻译由Huffman编码生成的代码串，输出对应的电文字符串。

设计要求：

(1).构造一棵Huffman树;

(2).实现Huffman编码，并用Huffman编码生成的代码串进行译码；

(3).程序中字符和权值是可变的，实现程序的灵活性。

步骤：

算法分析

本设计使用结构体数组存储Huffman树。

程序中设计了两个函数：

函数HuffmanTree()用来构造一个Huffman树；

函数HuffmanCode()用来生成Huffman编码并输出。

在电报通信中，电文是以二进制代码传送的。在发送时，需要将电文中的字符转换成二进制代码串，即编码；在接受时，要将收到的二进制代码串转化为对应的字符序列，即译码。由于字符集中的字符被使用的频率是非均匀的，在传送电文时，要想将电文总长尽可能短。因此，若对某字符集进行不等长编码的设计，则要求任意一个字符的编码都不是其他字符编码的前缀，这种编码称作前缀编码。由Huffman树求得的编码是最优前缀码，也叫Huffman编码。给出字符集和各个字符的概率分布，构造Huffman树，将Huffman树中每个分支结点的左分支标为0，右分支标为1，将根到每个叶子路径上的标号连起来，就是该叶子所代表字符的编码。

程序中主函数根据提示输入一些字符和字符的权值，则程序输出哈夫曼编码；若输入电文，则可以输出哈夫曼译码。

1.构造Huffman树的算法

主程序中输入不同字符，统计不同字符出现的次数作为该字符的权值，存于data[]数组中。假设有n种字符，则有n个叶子结点，构造的哈夫曼树有2n-1个结点。具体步骤如下：

将n个字符（叶结点）和其权值存储在HuffNode数组的前n个数组元素中，将2n-1个结点的双亲和左右孩子均置-1.

在所有结点中，选择双亲为-1，并选择具有最小和次小权值的结点m1和m2，用x1和x2指示这两个结点在数组中的位置，将根为HuffNode[x1]和HuffNode[x2]的两棵树合并，使其成为新结点HuffNode[n+i]的左右孩子，其权值为m1+m2.

重复上述过程，共进行n-1次合并就构造了一棵Huffman树。产生的n-1个结点依次放在数组HuffNode[]的n~2n-2的单元中。

2.Huffman编码和译码算法

从Huffman树的叶子结点HuffNode[i](0<=i<n)出发，通过HuffNode [c].parent找到其双亲，通过lchild和rchild域可知HuffNode[c]是左分支还是右分支，若是左分支则bit[n-1-i]=0;否则bit[n-1-i]=1.

将HuffNode[c]作为出发点，重复上述过程，直到找到树根所在位置，即进行了Huffman编码。

译码时首先输入二进制代码串，放在数组code中，以回车结束输入。

将代码与编码表进行比较，如果为0，则转向左子树；如果为1，则转向右子树，直到叶结点结束。输出叶子结点的数据域，即所对应的字符。

概要设计：

HuffmanTree（）	构造一个哈夫曼树
HuffmanCode（）	生成huffman编码并输出

运行结果：

源代码：

#include<stdio.h>
#include<conio.h>
#define MAXVALUE 10000
#define MAXLEAF 30
#define MAXNODE MAXLEAF*2-1
#define MAXBIT 50
#define NULL 0
typedef struct node {
	char letter;
	int weight;
	int parent;
	int lchild;
	int rchild;
} HNodeType;
typedef struct {
	char letter;
	int bit[MAXBIT];
	int start;
} HCodeType;
typedef struct {
	char s;
	int num;
} Message;
//哈夫曼树的构造算法
void HuffmanTree(HNodeType HuffNode[],int n,Message a[]) {
	int i,j,m1,m2,x1,x2,temp1;
	char temp2;
	for(i=0; i<2*n-1; i++) { //HuffNode[]初始化
		HuffNode[i].letter=NULL;
		HuffNode[i].weight=0;
		HuffNode[i].parent=-1;
		HuffNode[i].lchild=-1;
		HuffNode[i].rchild=-1;
	}
	for(i=0; i<n-1; i++)
		for(j=i+1; j<n-1; j++)
			if(a[j].num>a[i].num) {
				temp1=a[i].num;
				a[i].num=a[j].num;
				a[j].num=temp1;
				temp2=a[i].s;
				a[i].s=a[j].s;
				a[j].s=temp2;
			}
	for(i=0; i<n; i++) {
		HuffNode[i].weight=a[i].num;
		HuffNode[i].letter=a[i].s;
	}
	for(i=0; i<n-1; i++) { //构造哈夫曼树
		m1=m2=MAXVALUE;
		x1=x2=0;
		for(j=0; j<n+i; j++) { //找出的两棵权值最小的子树
			if(HuffNode[j].parent==-1&&HuffNode[j].weight<m1) {
				m2=m1;
				x2=x1;
				m1=HuffNode[j].weight;
				x1=j;
			} else if(HuffNode[j].parent==-1&&HuffNode[j].weight<m2) {
				m2=HuffNode[j].weight;
				x2=j;
			}
		}
		//将找出的两棵子树合并为一棵子树
		HuffNode[x1].parent=n+i;
		HuffNode[x2].parent=n+i;
		HuffNode[n+i].weight=HuffNode[x1].weight+HuffNode[x2].weight;
		HuffNode[n+i].lchild=x1;
		HuffNode[n+i].rchild=x2;
	}
}
//生成哈夫曼编码
void HuffmanCode(int n,Message a[]) {
	HNodeType HuffNode[MAXNODE];
	HCodeType HuffCode[MAXLEAF],cd;
	int i,j,c,p;
	char code[30],*m;
	HuffmanTree(HuffNode,n,a);//建立哈夫曼树
	for(i=0; i<n; i++) { //求每个叶子结点的哈夫曼编码
		cd.start=n-1;
		c=i;
		p=HuffNode[c].parent;
		while(p!=-1) { //由叶结点向上直到树根
			if(HuffNode[p].lchild==c)
				cd.bit[cd.start]=0;
			else
				cd.bit[cd.start]=1;
			cd.start--;
			c=p;
			p=HuffNode[c].parent;
		}
		for(j=cd.start+1; j<n; j++) //保存求出的每个叶结点的哈夫曼编码和编码的起始位
			HuffCode[i].bit[j]=cd.bit[j] ;
		HuffCode[i].start=cd.start;
	}
	printf("输出每个叶子的哈夫曼编码：\n");
	for(i=0; i<n; i++) { //输出每个叶子结点的哈夫曼编码
		HuffCode[i].letter=HuffNode[i].letter;
		printf("%c",HuffCode[i].letter);
		for(j=HuffCode[i].start+1; j<n; j++)
			printf("%d",HuffCode[i].bit[j]);
		printf("\n");
	}
	printf("请输入电文（1/0）：\n");
	for(i=0; i<30; i++)code[i]=NULL;
	scanf("%s",&code);
	m=code;
	c=2*n-2;
	printf("输出哈夫曼译码：\n");
	while(*m!=NULL) {
		if(*m=='0') {
			c=i=HuffNode[c].lchild;
			if(HuffNode[c].lchild==-1&&HuffNode[c].rchild==-1) {
				printf("%c",HuffNode[i].letter);
				c=2*n-2;
			}
		}
		if(*m=='1') {
			c=i=HuffNode[c].rchild;
			if(HuffNode[c].lchild==-1&&HuffNode[c].rchild==-1) {
				printf("%c",HuffNode[i].letter);
				c=2*n-2;
			}
		}
		m++;
	}
	printf("\n");
}
int main() {
	Message data[30];
	char s[100],*p;
	int i,count=0;
	printf("\n 请输入一些字符：");
	scanf("%s",&s);
	for(i=0; i<30; i++) {
		data[i].s=NULL;
		data[i].num=0;
	}
	p=s;
	while(*p) {
		for(i=0; i<=count+1; i++) {
			if(data[i].s==NULL) {
				data[i].s=*p;
				data[i].num++;
				count++;
				break;
			} else if(data[i].s==*p) {
				data[i].num++;
				break;
			}
		}
		p++;
	}
	printf("\n");
	printf("不同的字符数：%d\n",count);
	for(i=0; i<count; i++) {
		printf("%c",data[i].s);
		printf("权值：%d",data[i].num);
		printf("\n");
	}
	HuffmanCode(count,data);
	getch();
}

标签：字符,结点,编码,int,HuffNode,编译,电文,Huffman
来源： https://blog.csdn.net/weixin_54474126/article/details/122023577