【C语言】C语言 哈夫曼编码传输(源码+数据文件)【独一无二】

请添加图片描述


👉博__主👈:米码收割机
👉技__能👈:C++/Python语言
👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。


C语言 哈夫曼编码传输(源码+数据文件)【独一无二】


目录

  • C语言 哈夫曼编码传输(源码+数据文件)【独一无二】
  • 一、设计要求
  • 二、设计思路
    • 2. 核心数据结构与辅助函数
      • 2.1 数据结构定义
      • 2.2 最小堆辅助函数
    • 3. 哈夫曼树的构建与编码生成
      • 3.1 构建哈夫曼树
      • 3.2 生成哈夫曼编码表
    • 4. 文件编码、解码与验证
      • 4.1 编码文件
      • 4.2 解码文件
      • 4.3 文件一致性对比
    • 5. 主函数及整体工作流程


一、设计要求

问题4:某系统在通信联络中需要传送一个英文文件,该文件包含26个英文字母和空格等字符。请自行准备一个文本文件,要求这个文件中总符号数不少于10000个。要求运用哈夫曼编码方法,对该文本文件进行编码和解码,并校验解码后的文本正确性。请编写具体的计算机程序

在这里插入图片描述


二、设计思路

在这里插入图片描述

整个程序可以分为以下几个主要部分:

  1. 文件操作与预处理

    • 获取文件大小(getFileSize())。
    • 统计输入文件中每个字符的出现频率,为构建哈夫曼树做准备。
  2. 核心数据结构与辅助工具

    • 定义哈夫曼树节点(HuffmanTreeNode)和最小堆(MinHeap)的数据结构。
    • 实现最小堆的基本操作:插入、交换、向下调整(minHeapify())与提取最小节点(extractMin())。
  3. 哈夫曼树构建与编码表生成

    • 根据字符频率构建哈夫曼树,采用贪心策略不断合并频率最低的两个节点。
    • 遍历哈夫曼树生成每个字符的二进制编码(buildCodes()),并存入全局编码表 huffmanCode 中。
  4. 文件编码与解码

    • 通过编码表对原始文件进行编码(encodeFile()),将字符转换成由 0 和 1 组成的字符串保存到输出文件中。
    • 利用构建好的哈夫曼树对编码后的文件进行解码(decodeFile()),还原出原始文本信息。
  5. 验证与性能统计

    • 对比原始文件和解码后的文件(compareFiles())确保解码准确性。
    • 计算文件压缩率,展示压缩效果。

2. 核心数据结构与辅助函数

2.1 数据结构定义

程序中定义了两个核心数据结构,在哈夫曼编码中起到重要作用:

  • 哈夫曼树节点(HuffmanTreeNode)

    每个节点存储一个字符及其出现频率,同时包含左右孩子指针。例如:

    typedef struct HuffmanTreeNode {unsigned char ch;   // 字符unsigned freq;      // 字符频率struct HuffmanTreeNode *left, *right;
    } HuffmanTreeNode;
    
  • 最小堆(MinHeap)

    最小堆用于快速找到频率最小的节点,在构建哈夫曼树过程中非常关键:

    typedef struct MinHeap {int size;int capacity;HuffmanTreeNode** array;
    } MinHeap;
    

2.2 最小堆辅助函数

程序实现了常用的最小堆操作,包括节点交换、向下调整(minHeapify())、插入节点(insertMinHeap())和提取最小节点(extractMin())。
例如,向下调整函数保证了堆的性质:

void minHeapify(MinHeap* minHeap, int idx) {int smallest = idx;int left = 2 * idx + 1;// 代码略....if (right < minHeap->size &&minHeap->array[right]->freq < minHeap->array[smallest]->freq) {smallest = right;}if (smallest != idx) {swapNode(&minHeap->array[smallest], &minHeap->array[idx]);minHeapify(minHeap, smallest);}
}

在这里插入图片描述


3. 哈夫曼树的构建与编码生成

3.1 构建哈夫曼树

函数 buildHuffmanTree() 根据统计好的字符频率构建哈夫曼树,其基本流程如下:

  1. 统计有效字符数量
    遍历频率表,统计每个出现过的字符个数以确定最小堆的容量。

  2. 构建最小堆并插入所有字符节点
    为每个出现的字符创建一个节点,并插入到最小堆中。

  3. 合并最小节点
    循环执行以下操作:

    • 提取两个最小频率的节点。
    • 创建一个新节点,其频率为两节点频率之和,新节点左右指针指向这两个节点。
    • 将新节点重新插入堆中,直到堆中只剩下一个节点,该节点即为哈夫曼树的根。

部分代码示例如下:

while (minHeap->size > 1) {HuffmanTreeNode* left = extractMin(minHeap);HuffmanTreeNode* right = extractMin(minHeap);HuffmanTreeNode* top = createNode('\0', left->freq + right->freq);top->left = left;top->right = right;insertMinHeap(minHeap, top);
}

3.2 生成哈夫曼编码表

利用已经构建好的哈夫曼树,通过递归方式生成每个字符的编码:

  • 当递归向左(代表二进制“0”)或右(代表二进制“1”)不断累积编码,直到遇到叶子节点;
  • 到达叶子节点后,将生成的二进制字符串保存到全局编码表 huffmanCode 中。

函数示例:

void buildCodes(HuffmanTreeNode* root, char* code, int length) {if (!root) return;// 代码略....code[length] = '0';buildCodes(root->left, code, length + 1);code[length] = '1';buildCodes(root->right, code, length + 1);
}

在这里插入图片描述


4. 文件编码、解码与验证

4.1 编码文件

函数 encodeFile() 打开原始文件,并对每个字符用对应的哈夫曼编码替换后写入到编码文件中。
关键代码:

while ((ch = fgetc(fin)) != EOF) {fputs(huffmanCode[ch], fout);
}

4.2 解码文件

函数 decodeFile() 根据编码文件中的 0/1 流,利用哈夫曼树反向遍历解码还原每个字符,直到完整还原出原始文本:

HuffmanTreeNode* curr = root;
while ((bit = fgetc(fin)) != EOF) {if (bit == '0')curr = curr->left;else if (bit == '1')curr = curr->right;// 到达叶子节点,输出字符if (!curr->left && !curr->right) {fputc(curr->ch, fout);curr = root;}
}

4.3 文件一致性对比

函数 compareFiles() 将原始文件和解码后的文件进行字节级对比,确保解码过程没有任何错误:

do {c1 = fgetc(f1);c2 = fgetc(f2);if (c1 != c2) { /* 不同 */fclose(f1);fclose(f2);return 0;}
} while (c1 != EOF && c2 != EOF);

在这里插入图片描述


5. 主函数及整体工作流程

主函数 main() 整合了上述所有步骤,其主要流程如下:

  1. 预处理与频率统计

    • 判断原始文件是否存在,读取文件大小。
    • 遍历文件,统计每个字符的出现频率,填充频率表 freqTable
  2. 构建哈夫曼树与生成编码表

    • 调用 buildHuffmanTree() 构建哈夫曼树;
    • 通过 buildCodes() 生成用于编码的哈夫曼编码表。
  3. 执行编码与解码

    • 使用 encodeFile() 对原始文件进行编码;
    • decodeFile() 将编码后文件解码为还原文件。
  4. 结果验证与性能评估

    • 调用 compareFiles() 检查解码文件与原文件是否一致;
    • 计算压缩率,并打印原始大小、压缩后大小及压缩率。

主函数示例代码:

int main() {const char* inputFile    = "input.txt";    // 原始文件const char* encodedFile  = "encoded.txt";  // 编码结果(0/1串)const char* decodedFile  = "decoded.txt";  // 解码结果// 1) 读取原文件大小// 代码略....// 3) 构建哈夫曼树HuffmanTreeNode* root = buildHuffmanTree(freqTable);// 代码略....printf("原文件大小:%ld 字节\n", originalSize);printf("压缩后文件大小:%ld 字节\n", compressedSize);printf("压缩率:%.2f%%\n", ratio);printf("解压后文本与原文本相同:%s\n", isSame ? "True" : "False");// 释放哈夫曼树freeHuffmanTree(root);return 0;
}

运行结果:
在这里插入图片描述

---

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20808.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

撕碎QT面具(6):调节窗口大小后,控件被挤得重叠的解决方法

问题&#xff1a;控件重叠 分析原因&#xff1a;因为设置了最小大小&#xff0c;所以界面中的大小不会随窗口的变化而自动变化。 处理方案&#xff1a;修改mimumSize的宽度与高度为0&#xff0c;并设置sizePolicy为Expanding&#xff0c;让其自动伸缩。 结果展示&#xff08;自…

Leetcode - 周赛436

目录 一、3446. 按对角线进行矩阵排序二、3447. 将元素分配给有约束条件的组三、3448. 统计可以被最后一个数位整除的子字符串数目四、3449. 最大化游戏分数的最小值 一、3446. 按对角线进行矩阵排序 题目链接 本题可以暴力枚举&#xff0c;在确定了每一个对角线的第一个元素…

玩转SpringCloud Stream

背景及痛点 现如今消息中间件(MQ)在互联网项目中被广泛的应用&#xff0c;特别是大数据行业应用的特别的多&#xff0c;现在市面上也流行这多个消息中间件框架&#xff0c;比如ActiveMQ、RabbitMQ、RocketMQ、Kafka等&#xff0c;这些消息中间件各有各的优劣&#xff0c;但是想…

解决 Mac 只显示文件大小,不显示目录大小

前言 在使用 mac 的时候总是只显示文件的大小&#xff0c;不显示文件夹的大小&#xff0c;为了解决问题可以开启“计算文件夹”。 步骤 1.进入访达 2.工具栏点击“显示”选项&#xff0c;点击 “查看显示选项” 3.勾选 显示“资源库"文件夹 和 计算所有大小 或者点击…

STM32 定时器产生定周期方法

目录 背景 程序 第一步、使能PCLK1外设时钟​编辑 第二步、时基单元配置 第三步、配置NVIC&#xff08;设置定时中断优先级&#xff09;​编辑 第四步、使能溢出中断 第五步、使能定时器 第六步、填写中断处理函数&#xff08;ISR&#xff09; 背景 在单片机开发当中&…

【DeepSeek系列】04 DeepSeek-R1:带有冷启动的强化学习

文章目录 1、简介2、主要改进点3、两个重要观点4、四阶段后训练详细步骤4.1 冷启动4.2 推理导向的强化学习4.3 拒绝采样和有监督微调4.4 针对所有场景的强化学习 5、蒸馏与强化学习对比6、评估6.1 DeepSeek-R1 评估6.2 蒸馏模型评估 7、结论8、局限性与未来方向 1、简介 DeepS…

Compose常用UI组件

Compose常用UI组件 概述Modifier 修饰符常用Modifier修饰符作用域限定Modifier Modifier 实现原理Modifier.Element链的构建链的解析 常用基础组件文字组件图片组件按钮组件选择器对话框进度条 常用布局组件线性布局帧布局 列表组件 概述 Compose 预置了很多基础组件&#xff…

Ansys EMC Plus:HIRF 与飞机耦合演示

在本篇博文中&#xff0c;我们将深入探讨 EMC Plus 高强度辐射场 (HIRF) 与软件示例中提供的飞机演示的耦合。本概述将指导您完成整个工作流程&#xff0c;从设置问题空间到基本后处理&#xff0c;包括材料属性分配和创建探针。 概述 在本演示中&#xff0c;下图所示的预先简化…

DeepSeek + Mermaid编辑器——常规绘图

下面这张图出自&#xff1a;由清华大学出品的 《DeepSeek&#xff1a;从入门到精通》。 作为纯文本生成模型&#xff0c;DeepSeek虽不具备多媒体内容生成接口&#xff0c;但其开放式架构允许通过API接口与图像合成引擎、数据可视化工具等第三方系统进行协同工作&#xff0c;最终…

红蓝对抗之常见网络安全事件研判、了解网络安全设备、Webshell入侵检测

文章目录 ​​研判&#xff08;入侵检测&#xff09;​​ ​​设备​​ ​​经典网络​​​​云网络​​ ​​异常HTTP请求​​​​Webshell分析​​ ​​Webshell 的分类​​​​Webshell 的检测​​ ​​主机层面​​​​流量层面​​ ​​附录​​ ​​常见端口漏洞…

基于levmar(Levenberg-Marquardt 非线性最小二乘优化库)的椭圆拟合

1. 包含必要的头文件 #include <opencv2/core.hpp> #include <opencv2/imgproc.hpp> #include <opencv2/highgui.hpp> #include <vector> #include <cmath>2. 定义生成椭圆点的函数 编写一个函数&#xff0c;接受椭圆的中心坐标、长轴半径、短…

Fastgpt学习(5)- FastGPT 私有化部署问题解决

1.☺ 问题描述&#xff1a; Windows系统&#xff0c;本地私有化部署&#xff0c;postgresql数据库镜像日志持续报错" data directory “/var/lib/postgresql/data” has invalid permissions "&#xff0c;“ DETAIL: Permissions should be urwx (0700) or urwx,gr…

基于SpringBoot+vue粮油商城小程序系统

粮油商城小程序为用户提供方便快捷的在线购物体验&#xff0c;包括大米、面粉、食用油、调味品等各种粮油产品的选购&#xff0c;用户可以浏览商品详情、对比价格、下单支付等操作。同时&#xff0c;商城还提供优惠活动、积分兑换等福利&#xff0c;让用户享受到更多实惠和便利…

Python编程之数据分组

有哪些方式可以进行数据分组利用Pandas库进行分组使用itertools库的groupby分组操作构建Python字典方式实现(小规模数据,不适用数量特别大的情况,不需要依赖其它python库)利用NumPy的groupby函数分组操作利用Python的Dask库提供的函数进行分组下面看一个如何去实现坐标数据…

【Linux】认识协议、Mac/IP地址和端口号、网络字节序、socket套接字

⭐️个人主页&#xff1a;小羊 ⭐️所属专栏&#xff1a;Linux 很荣幸您能阅读我的文章&#xff0c;诚请评论指点&#xff0c;欢迎欢迎 ~ 目录 1、初识协议2、Mac、IP地址3、端口号4、网络字节序5、socket 1、初识协议 协议就是一种约定。如何让不同厂商生产的计算机之间能…

ubuntu 安装docker

ubuntu 安装docker 官网地址 https://docs.docker.com/engine/install/ubuntu/ 尽量根据官网的来&#xff0c;网上找的很多都是一大堆各种报错 卸载旧版本 新机器不需要操作 卸载的非官方包是&#xff1a; docker.iodocker-composedocker-compose-v2docker-docpodman-docker…

环境变量2

目录 环境变量PATH 如何改变PATH 我们今天继续来学习环境变量2&#xff01;&#xff01;&#xff01; 环境变量PATH PATH的作用是知道命令的搜索路径&#xff0c;我们都知道Linux上的命令行指令&#xff0c;ll&#xff0c;pwd什么的为什么我们写出来系统就知道是什么并且运…

网络安全中的机器学习

当涉及到网络安全时&#xff0c;技术一直是保护系统免受攻击和数据泄露的关键。在这篇论文中&#xff0c;我将介绍一些当前在网络安全领域使用的关键技术&#xff0c;包括加密&#xff0c;身份验证和防火墙。 首先&#xff0c;加密是网络安全中最常见的技术之一。加密是指使用算…

sass报错:[sass] Undefined variable. @import升级@use语法注意事项

今天创建vue3项目&#xff0c;迁移老项目代码&#xff0c;使用sass的时候发现import语法已经废弃&#xff0c;官方推荐使用use替换。 这里我踩了一个坑找半天的问题&#xff0c;原因是sass升级到1.85之后 定义变量前加上 - 就是表示变量私有&#xff0c;即使使用use导出 在新的…

嵌入式经常用到串口,如何判断串口数据接收完成?

说起通信&#xff0c;首先想到的肯定是串口&#xff0c;日常中232和485的使用比比皆是&#xff0c;数据的发送、接收是串口通信最基础的内容。这篇文章主要讨论串口接收数据的断帧操作。 空闲中断断帧 一些mcu&#xff08;如&#xff1a;stm32f103&#xff09;在出厂时就已经在…