信息熵通俗易懂的例子

信息熵通俗易懂的例子

news/2024/12/23 11:19:22/文章来源:https://blog.csdn.net/u012033832/article/details/81476498

转自知乎 https://www.zhihu.com/question/22178202/answer/223017546

本科学的时候是院长教的，当时他说这个东西很有用，也仔细听了没懂什么意思，现在回过头来看，还真有用。

信息熵的定义与上述这个热力学的熵，虽然不是一个东西，但是有一定的联系。熵在信息论中代表随机变量不确定度的度量。一个离散型随机变量 $X$ 的熵 $H(X)$ 定义为：

$H(X)=-\sum\limits_{x\in\mathcal{X}}p(x)\log p(x)$

这个定义的特点是，有明确定义的科学名词且与内容无关，而且不随信息的具体表达式的变化而变化。是独立于形式，反映了信息表达式中统计方面的性质。是统计学上的抽象概念。

所以这个定义如题主提到的可能有点抽象和晦涩，不易理解。那么下面让我们从直觉出发，以生活中的一些例子来阐述信息熵是什么，以及有什么用处。

直觉上，信息量等于传输该信息所用的代价，这个也是通信中考虑最多的问题。比如说：赌马比赛里，有4匹马 $\{A,B,C,D\}$ ，获胜概率分别为 $\{\frac{1}{2},\frac{1}{4},\frac{1}{8},\frac{1}{8}\}$ 。

接下来，让我们将哪一匹马获胜视为一个随机变量 $X\in\{A,B,C,D\}$ 。假定我们需要用尽可能少的二元问题来确定随机变量 $X$ 的取值。

例如：问题1：A获胜了吗？问题2：B获胜了吗？问题3：C获胜了吗？最后我们可以通过最多3个二元问题，来确定 $X$ 的取值，即哪一匹马赢了比赛。

如果 $X=A$ ，那么需要问1次（问题1：是不是A？），概率为 $\frac{1}{2}$ ；

如果 $X=B$ ，那么需要问2次（问题1：是不是A？问题2：是不是B？），概率为 $\frac{1}{4}$ ；

如果 $X=C$ ，那么需要问3次（问题1，问题2，问题3），概率为 $\frac{1}{8}$ ;

如果 $X=D$ ，那么同样需要问3次（问题1，问题2，问题3），概率为 $\frac{1}{8}$ ；

那么很容易计算，在这种问法下，为确定 $X$ 取值的二元问题数量为：

$E(N)=\frac{1}{2}\cdot1+\frac{1}{4}\cdot2+\frac{1}{8}\cdot3+\frac{1}{8}\cdot3=\frac{7}{4}$

那么我们回到信息熵的定义，会发现通过之前的信息熵公式，神奇地得到了：

$H(X)=\frac{1}{2}\log(2)+\frac{1}{4}\log(4)+\frac{1}{8}\log(8)+\frac{1}{8}\log(8)=\frac{1}{2}+\frac{1}{2}+\frac{3}{8}+\frac{3}{8}=\frac{7}{4}\mathrm{bits}$

在二进制计算机中，一个比特为0或1，其实就代表了一个二元问题的回答。也就是说，在计算机中，我们给哪一匹马夺冠这个事件进行编码，所需要的平均码长为1.75个比特。

平均码长的定义为： $L(C)=\sum\limits_{x\in\mathcal{X}}p(x)l(x)$

很显然，为了尽可能减少码长，我们要给发生概率 $p(x)$ 较大的事件，分配较短的码长 $l(x)$ 。这个问题深入讨论，可以得出霍夫曼编码的概念。

那么 $\{A,B,C,D\}$ 四个实践，可以分别由 $\{0,10,110,111\}$ 表示，那么很显然，我们要把最短的码 $0$ 分配给发生概率最高的事件 $A$ ，以此类推。而且得到的平均码长为1.75比特。如果我们硬要反其道而行之，给事件 $A$ 分配最长的码 $111$ ，那么平均码长就会变成2.625比特。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/54669.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

一文看懂信息熵的本质——谈谈自己对信息熵的理解

一文看懂信息熵的本质——谈谈自己对信息熵的理解

一、序言初次看到信息熵的公式有很多不理解的地方，只知道信息熵如何进行计算，却不懂得公式背后的原理，我通过查阅了一些资料，加深了对信息熵的理解，现在将这些理解分享给大家。如有疑问欢迎评论，若对你有帮…

阅读更多...

传闻中能取代90%人工作的chatGPT，不值得让软测人恐慌

传闻中能取代90%人工作的chatGPT，不值得让软测人恐慌

ChatGPT的横空出世，在业界掀起了惊涛骇浪。很多人开始担心，自己的工作岗位是否会在不久的将来被ChatGPT等人工智能技术所取代。软件测试与先进技术发展密切相关，基于人工智能的AI助手已经得到很多的应用机会，那么未来是否更加可期…

阅读更多...

该来的总会来，EDG厂长宣布退役！

该来的总会来，EDG厂长宣布退役！

眼看LPL的转会期就要结束了，但是现在EDG这个传统战队还是没有太多的消息，只听说花费了50万买了一个青训的选手，而IBOY也被传出，有很大概率离开战队，最主要是厂长也退役了。其实我们都知道厂长是LPL中年纪最大的选手了…

阅读更多...

C语言入门这一篇就够了，厂长推荐学习

C语言入门这一篇就够了，厂长推荐学习

C语言入门这一篇就够了，⭐厂长推荐学习关于作者作者介绍 🍓 博客主页：作者主页 🍓 简介：JAVA领域优质创作者🥇、一名在校大三学生🎓、在校期间参加各种省赛、国赛，斩获一系列荣誉…

阅读更多...

2021年危险化学品生产单位安全生产管理人员最新解析及危险化学品生产单位安全生产管理人员证考试

2021年危险化学品生产单位安全生产管理人员最新解析及危险化学品生产单位安全生产管理人员证考试

题库来源：安全生产模拟考试一点通公众号小程序安全生产模拟考试一点通：危险化学品生产单位安全生产管理人员最新解析参考答案及危险化学品生产单位安全生产管理人员考试试题解析是安全生产模拟考试一点通题库老师及危险化学品生产单位安全生产管理人员…

阅读更多...

添加小度在家显示无法连接服务器,小度在家突然连不上网了

添加小度在家显示无法连接服务器,小度在家突然连不上网了

有个小伙伴说：‘家里有一台小度在家智能音箱，用了大概一年多了，型号是小度最开始那一款智能音箱，价格不到百十块，使用期间也没啥问题，但是最近想再用的时候，发现一直连不上网了，这要…

阅读更多...

在与 SQL Server 建立连接时出现与网络相关的或特定于实例的错误。未找到或无法访问服务器

在与 SQL Server 建立连接时出现与网络相关的或特定于实例的错误。未找到或无法访问服务器

今早开机发现，打开SQL Server 2008 的 SQL Server Management Studio，输入sa的密码发现，无法登陆数据库?提示以下错误： “在与 SQL Server 建立连接时出现与网络相关的或特定于实例的错误。未找到或无法访问服务器。请验证实例名…

阅读更多...

pycharm连接远程mysql_【已解决】用PyCharm的MongoDB插件连接远程MongoDB数据库

pycharm连接远程mysql_【已解决】用PyCharm的MongoDB插件连接远程MongoDB数据库

折腾： 后，继续去试试，用之前可以正常连接本地的mongo的PyCharm的mongodb插件，去连接远程的mongo数据库 PyCharm中mongo插件中测试连接，失败： 再去测试： 然后在Mongo shell options中的arguments…

阅读更多...

37 | 个人成长：学习安全，哪些资源我必须要知道？

37 | 个人成长：学习安全，哪些资源我必须要知道？

安全涉及的知识面非常广，更新速度也很快，前辈们很难有足够的时间和精力来言传身教。这个时候就需要我们具备良好的自学能力，通过持续的学习来掌握新的知识，应对新的变化和挑战。优质的学习资源是自学的重要基础。今天&#xff0…

阅读更多...

Java连接MySQL数据库——含步骤和代码

Java连接MySQL数据库——含步骤和代码

原文地址为： Java连接MySQL数据库——含步骤和代码工具：eclipse MySQL5.6 MySQL连接驱动：mysql-connector-java-5.1.27.jar 加载驱动： 1. 在工程目录中创建lib文件夹，将下载好的JDBC放到该文件夹下，如下…

阅读更多...

2022广西最新八大员之（安全员）模拟试题题库及答案

2022广西最新八大员之（安全员）模拟试题题库及答案

百分百题库提供建筑施工八大员之安全员考试试题、建筑施工八大员考试预测题、八大员考试真题、安全员证考试题库等,提供在线做题刷题，在线模拟考试，助你考试轻松过关。 1.安全生产领导小组由总承包企业,专业承包企业和劳务分包企业项目经理、技术负责人和…

阅读更多...

2023最新Python国内镜像源，亲测可用

2023最新Python国内镜像源，亲测可用

1、镜像源 pip包管理工具可以下载第三方库到本地使用，第三方库的来源地址称之为镜像源，镜像源中存放了大量的开源库供我们下载使用。pip的默认镜像源地址在国外，下载很慢，本文收集了当前国内常用的镜像源，速率由快到慢…

阅读更多...

Red Hat下载ISO镜像的方法

Red Hat下载ISO镜像的方法

目录一、Red Hat介绍二、进入Red Hat官方网站三、步骤一、Red Hat介绍 Red Hat 是一家全球领先的开源技术解决方案提供商，总部位于美国北卡罗来纳州罗利。该公司成立于1993年，其主要产品是 Red Hat Enterprise Linux (RHEL) 操作系统。Red Hat 还…

阅读更多...

seata搭建 1.4.2

seata搭建 1.4.2

1.下载源码下载服务器端 https://github.com/seata/seata/releases 找到1.4.2的zip下载 2.修改配置文件解压后需要修改config文件路径\seata\seata-server-1.4.2\conf 针对自己项目所使用的服务注册和配置文件的中间件决定使用哪一个（当前举例nacos&#x…

阅读更多...

已解决——“搜狗输入法如何进行候选页翻页”

已解决——“搜狗输入法如何进行候选页翻页”

搜狗输入法候选翻页打开搜狗输入法后（不同版本可能页面会有差异）： 点击鼠标右键选择更多设置。选择属性设置，点击按键栏，找到候选键翻页。效果简述（以逗号句号为例）： 打字一…

阅读更多...

搜狗拼音带来的俩个烦人的弹窗解决方法

搜狗拼音带来的俩个烦人的弹窗解决方法

文章目录 1、搜狐的新闻2、提示安装搜狗浏览器清理垃圾解决办法，按ctrl alt 就会关闭了。 1、搜狐的新闻进入你安装的搜狗拼音的目录下，进入数字的文件夹，把SohuNews 这个选中它，shiftdelete，将它彻底删除。直接del…

阅读更多...

和府捞面跨界合作《脱口秀小会》，探索娱乐文化营销

和府捞面跨界合作《脱口秀小会》，探索娱乐文化营销

上海2021年8月27日 /美通社/ -- 8月10日晚，新一季《脱口秀大会》正式开播，李诞、杨笠、王建国等知名脱口秀演员及一众新星齐亮相，邀请了来自不同行业、从事不同职业、拥有广泛背景的跨界选手加入，通过跨界选手对日常生活内容的讲述…

阅读更多...

搜狗手机输入法 for MeeGo 平台今日独家登场

搜狗手机输入法 for MeeGo 平台今日独家登场

搜狗手机输入法 for MeeGo 平台今日独家登场！支持拼音、英文九键；内置两款精美皮肤；划动切换键盘模式等众多特性，完美继承搜狗体验！N9输入，依然搜狗~有兴趣的朋友可以试一下 1.1 支持拼音9键，拼…

阅读更多...

黑马程序员万人开学季！美女班主任甚至即兴rap了一段脱口秀~

黑马程序员万人开学季！美女班主任甚至即兴rap了一段脱口秀~

各位黑马同学你们好欢迎乘坐黑马号K1024次列车祝您旅途愉快 8月开学季传智黑马又迎来一大批“未来的技术侠客” 他们揣着梦想铿锵而来这个夏天，骄阳似火但每个学生求知的心情比火更热烈尽管，大家来黑马之前的身份各有不同应届大学生、销售、客服…

阅读更多...

小狼毫(RIME)输入法入门使用详细教程

小狼毫(RIME)输入法入门使用详细教程

官网 https://rime.im 百度云链接链接永久有效，有window版，mac版，安卓apk，教程小视频链接：https://pan.baidu.com/s/1a-z1wYwyZ50A6x92lXIgWg 提取码：asdf 下面开始教程，安装就不说了手…

阅读更多...

最新文章

推荐文章