哈夫曼压缩与解压缩完整源码.zip资源-CSDN文库

共8个文件

bmp：2个

c：2个

ycyhuf：1个

版权申诉

项目源码

课程设计

学习资料

199 浏览量 2024-03-27 00:22:23 上传评论收藏 2.93MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

哈夫曼压缩与解压缩源码.zip （8个子文件）

code_30312

.gitattributes 378B

.gitignore 574B

哈夫曼压缩与解压缩

ycyEncode.c 9KB

lz.bmp 40.05MB

lz.ycyHuf 6.03MB

lzTmp.bmp 40.05MB

ycy.h 422B

ycyDecode.c 8KB

#pragma pack(push) #pragma pack(1) //内存对其改为1个字节对齐模式 #include <stdio.h> #include <string.h> #include <stdlib.h> #include "ycy.h" typedef struct HUF_FILE_HEAD { unsigned char flag[3]; //压缩二进制文件头部标志 ycy unsigned char alphaVariety; //字符种类 unsigned char lastValidBit; //最后一个字节的有效位数 unsigned char unused[11]; //待用空间 } HUF_FILE_HEAD; //这个结构体总共占用16个字节的空间 typedef struct ALPHA_FREQ { unsigned char alpha; //字符,考虑到文件中有汉字，所以定义成unsigned char int freq; //字符出现的频度 } ALPHA_FREQ; typedef struct HUFFMAN_TAB { ALPHA_FREQ alphaFreq; int leftChild; int rightChild; boolean visited; char *code; } HUFFMAN_TAB; boolean isFileExist(char *fileName); ALPHA_FREQ *getAlphaFreq(char *sourceFileName, int *alphaVariety); void showAlphaFreq(ALPHA_FREQ *alphaFreq, int alphaVariety); HUFFMAN_TAB *initHuffmanTab(ALPHA_FREQ *alphaFreq, int alphaVariety, int *hufIndex); void destoryHuffmanTab(HUFFMAN_TAB *huffmanTab, int alphaVariety); void showHuffmanTab(HUFFMAN_TAB *huffmanTab, int count); int getMinFreq(HUFFMAN_TAB *huffmanTab, int count); void creatHuffmanTree(HUFFMAN_TAB *huffmanTab, int alphaVariety); void makeHuffmanCode(HUFFMAN_TAB *huffmanTab, int root, int index, char *code); void huffmanEncoding(HUFFMAN_TAB *huffmanTab, char *sourceFileName, char *targetFileName, int *hufIndex, int alphaVariety, ALPHA_FREQ *alphaFreq); int getlastValidBit(HUFFMAN_TAB *huffmanTab, int alphaVariety); //取最后一个字节的有效位数 int getlastValidBit(HUFFMAN_TAB *huffmanTab, int alphaVariety) { int sum = 0; int i; for(i = 0; i < alphaVariety; i++) { sum += strlen(huffmanTab[i].code) * huffmanTab[i].alphaFreq.freq; //如果不执行这一步，当数据长度超过int的表示范围，就会出错 sum &= 0xFF; //0xFF化为二进制位1111 1111，这样做sum始终是最后一个字节,8位 } //举例：若最后生成7位二进制，划分为一个字节，那么，这一个字节只有7位为有效位，其余都是垃圾位。 //我们只需要取出这个字节的那7个有效位，所以sum和8取余即可 //sum = sum % 8 <=> sum = sum & 0x7 //返回最后一个字节的有效位数 sum &= 0x7; return sum == 0 ? 8 : sum; } //hufIndex下标为字符的ASCII码，其值为该字符在哈夫曼表中的下标，形成键值对。在把字符串转换为哈夫曼编码时可以实现快速查找 void huffmanEncoding(HUFFMAN_TAB *huffmanTab, char *sourceFileName, char *targetFileName, int *hufIndex, int alphaVariety, ALPHA_FREQ *alphaFreq) { FILE *fpIn; FILE *fpOut; int ch; unsigned char value; int bitIndex = 0; int i; char *hufCode = NULL; HUF_FILE_HEAD fileHead = {'y', 'c', 'y'}; fpIn = fopen(sourceFileName, "rb"); fpOut = fopen(targetFileName, "wb"); fileHead.alphaVariety = (unsigned char) alphaVariety; fileHead.lastValidBit = getlastValidBit(huffmanTab, alphaVariety); // size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream) // ptr -- 这是指向要被写入的元素数组的指针。 // size -- 这是要被写入的每个元素的大小，以字节为单位。 // nmemb -- 这是元素的个数，每个元素的大小为 size 字节。 // stream -- 这是指向 FILE 对象的指针，该 FILE 对象指定了一个输出流。 //给文件头部写入元数据 fwrite(&fileHead, sizeof(HUF_FILE_HEAD), 1, fpOut); //给元数据后写字符种类和频度，解压缩时需要用这些生成一模一样新的哈夫曼树 fwrite(alphaFreq, sizeof(ALPHA_FREQ), alphaVariety, fpOut); ch = fgetc(fpIn); while(!feof(fpIn)) { hufCode = huffmanTab[hufIndex[ch]].code; //把每个字符的哈夫曼编码一个一个过。 //如果是字符'0'，就转换为二进制的0 //如果是字符'1'，就转换为二进制的1 for(i = 0; hufCode[i]; i++) { if('0' == hufCode[i]) { //value为一个字节 //从第1位依次赋值，若大于八位（一个字节）了，就写入文件中 CLR_BYTE(value, bitIndex); } else { SET_BYTE(value, bitIndex); } bitIndex++; if(bitIndex >= 8) { bitIndex = 0; fwrite(&value, sizeof(unsigned char), 1, fpOut); } } ch = fgetc(fpIn); } //如果最后一次不满一个字节，依然需要写到文件中，注意：写入的最后一个字节可能会存在垃圾位 if(bitIndex) { fwrite(&value, sizeof(unsigned char), 1, fpOut); } fclose(fpIn); fclose(fpOut); } void makeHuffmanCode(HUFFMAN_TAB *huffmanTab, int root, int index, char *code) { if(huffmanTab[root].leftChild != -1 && huffmanTab[root].rightChild != -1) { code[index] = '1'; makeHuffmanCode(huffmanTab, huffmanTab[root].leftChild, index + 1, code); code[index] = '0'; makeHuffmanCode(huffmanTab, huffmanTab[root].rightChild, index + 1, code); } else { code[index] = 0; strcpy(huffmanTab[root].code, code); } } void creatHuffmanTree(HUFFMAN_TAB *huffmanTab, int alphaVariety) { int i; int leftChild; int rightChild; //huffmanTab使用剩下的 alphaVariety - 1个空间 for(i = 0; i < alphaVariety - 1; i++) { leftChild = getMinFreq(huffmanTab, alphaVariety + i); rightChild = getMinFreq(huffmanTab, alphaVariety + i); huffmanTab[alphaVariety + i].alphaFreq.alpha = '#'; huffmanTab[alphaVariety + i].alphaFreq.freq = huffmanTab[leftChild].alphaFreq.freq + huffmanTab[rightChild].alphaFreq.freq; huffmanTab[alphaVariety + i].leftChild = leftChild; huffmanTab[alphaVariety + i].rightChild = rightChild; huffmanTab[alphaVariety + i].visited = FALSE; } } //在哈夫曼表中找没有访问过的最小频度下标 int getMinFreq(HUFFMAN_TAB *huffmanTab, int count) { int index; int minIndex = NOT_INIT; for(index = 0; index < count; index++) { if(FALSE == huffmanTab[index].visited) { if(NOT_INIT == minIndex || huffmanTab[index].alphaFreq.freq < huffmanTab[minIndex].alphaFreq.freq) { minIndex = index; } } } huffmanTab[minIndex].visited = TRUE; return minIndex; } void showHuffmanTab(HUFFMAN_TAB *huffmanTab, int count) { int i; printf("%-4s %-4s %-4s %-6s %-6s %-6s %s\n", "下标", "字符", "频度", "左孩子", "右孩子", "visited", "code"); for (i = 0; i < count; i++) { printf("%-5d %-4c %-5d %-6d %-7d %-4d %s\n", i, huffmanTab[i].alphaFreq.alpha, huffmanTab[i].alphaFreq.freq, huffmanTab[i].leftChild, huffmanTab[i].rightChild, huffmanTab[i].visited, (huffmanTab[i].code ? huffmanTab[i].code : "无")); } } void destoryHuffmanTab(HUFFMAN_TAB *huffmanTab, int alphaVariety) { int i; for(i = 0; i < alphaVariety; i++) { free(huffmanTab[i].code); } free(huffmanTab); } HUFFMAN_TAB *initHuffmanTab(ALPHA_FREQ *alphaFreq, int alphaVariety, int *hufIndex) { int i; HUFFMAN_TAB *huffmanTab = NULL; huffmanTab = (HUFFMAN_TAB *) calloc(sizeof(HUFFMAN_TAB), 2 * alphaVariety - 1); //huffmanTab申请了 2 * alphaVariety - 1大小的空间，在这只用了 alphaVariety个，还剩alphaVariety - 1个 for(i = 0; i < alphaVariety; i++) { hufIndex[alphaFreq[i].alpha] = i; //把哈夫曼表中的字符和其对应的下标形成键值对,存到hufIndex中 huffmanTab[i].alphaFreq = alphaFreq[i]; huffmanTab[i].leftChild = huffmanTab[i].rightChild = -1; huffmanTab[i].visited = FALSE; huffmanTab[i].code = (char *) calloc(sizeof(char), alphaVariety); } return huffmanTab; } void showAlphaFreq(ALPHA_FREQ *alphaFreq, int alphaVariety) { int i; for(i = 0; i < alphaVariety; i++) { int ch = alphaFreq[i].alpha; //字符超出了ASCII码表示范围 if(ch > 127) { printf("[%d]: %d\n", ch, alphaFreq[i].freq); } else { printf("[%c]: %d\n", ch, alphaFreq[i].freq); } } } //从sourceFileName文件中读取字符串 //feof()函数不是“文件结束标志”函数，而是一个“动作标志”函数 //表示的是上一次的文件读写操作是否成功。 //刚刚打开文件，feof()函数的初始值为0; 当上一次文件操作失败时，返回非0 ALPHA_FREQ *getAlphaFreq(char *sourceFileName, int *alphaVariety) { int freq[256] = {0}; int i; int index; ALPHA_FREQ *alphaFreq = NULL; FILE *fpIn; int ch; fpIn = fopen(sourceFileName, "rb"); /*统计所有字符的频度*/ ch = fgetc(fpIn); while(!feof(fpIn)) { freq[ch]++; ch = fgetc(fpIn); } fclose(fpIn); /*统计所有字符的种类*/ for(i = 0; i < 256; i++) { if(freq[i]) { (*alphaVariety)++; } } alphaFreq = (ALPHA_FREQ *) calloc(sizeof(ALPHA_FREQ), *alphaVariety); for(i = index = 0; i < 256; i++) { if(freq[i]) { alphaFreq[index].alpha = i; alphaFreq[index].freq =

评论收藏

内容反馈

版权申诉