[问题描述]
利用哈夫曼编码进行信息通讯可以大大提高信道利用率,缩短信息传输时间,降低传输
成本。但是,这要求在发送端通过一个编码系统对待传数据预先编码;在接收端将传来的数
据进行译码(复原)。对于双工信道 (即可以双向传输信息的信道),每端都需要一个完整的编
/译码系统。试对于任意的一段文本(可能是直接输入的,也可能是保存在本地文件中或者
网络上的),写一个哈夫曼码的编译码系统。
[基本要求]
一个完整的系统应具有以下功能:
(l)I:初始化 (Initialization)。从终端读入字符集大小n,及 n 个字符和 m 个权值,建立哈
夫曼树,并将它存于文件 hfmtree 中。
(2)C:编码 (Coding)。利用已建好的哈夫曼树(如不在内存,则从文件 hfmtree 中读入),
对文件 tobetrans 中的正文进行编码,然后将结果存入文件 codefile 中。
(3)D:解码(Decoding)。利用已建好的哈夫曼树将文件 codefile 中的代码进行译码,结果
存入文件 textfile 中。
(4)P:打印代码文件 (Print)。将文件 codefile 以紧凑格式显示在终端上,每行 50 个代码。
同时将此字符形式的编码文件写入文件 codeprint 中。
(5)T:打印哈夫曼树 (Tree printing)。将已在内存中的哈夫曼树以直观的方式 (树或凹入
表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件treeprint 中。
[实现提示]
可以根据题目要求把程序划成 5 个模块,设计成菜单方式,每次执行一个模块后返回菜
单。
除了初始化(I)过程外,在每次执行时都经过一次读取磁盘文件数据。这是因为如果在程
序执行后一直没有进行初始化(I)过程,为了能使后面的操作顺利进行,可以通过读取旧的数
据来进行工作。比如:如果程序的工作需要的字符集和权值数据是固定的,只要在安装程序
时进行一次初始(I)化操作就可以了。再次运行程序时,不管进行哪项操作都可以把需要的数
据读入到内存。
[算法分析]
本程序主要用到了三个算法。
(1)哈夫曼编码
在初始化(I)的过程中间,要用输入的字符和权值建立哈夫曼树并求得哈夫曼编码。先将
输入的字符和权值存放到一个结构体数组中,建立哈夫曼树,将计算所得的哈夫曼编码存储
到另一个结构体数组中。
(2)串的匹配
在编码(D)的过程中间,要对已经编码过的代码译码,可利用循环,将代码中的与哈夫
曼编码的长度相同的串与这个哈夫曼编码比较,如果相等就回显并存入文件。
(3)二叉树的遍历
在打印哈夫曼树(T)的过程中,因为哈夫曼树也是二叉树,所以就要利用二叉树的先序
遍历将哈夫曼树输出。
[测试数据]
根据实验要求,在 tobetrans.dat 中输入"THIS PROGRAM IS MY FAVORITE",字符集和
其频度如表 1 所示。
表 1 字符集频度表
字符
频度
字符
频度
__
N
20
A
O
B
P
C
Q
2
D
R
50
E
S
51
F
T
G
U
H
V
I J
1
K
5
L
Z
2
M
186 64 23 22 32 103 21 15 47 57
56 19 55 30 10 11
32 20
W X Y
2 21
评论0
最新资源