学习笔记之信息量、熵、KL散度、交叉熵的一些介绍

文章目录

  • 信息量
  • KL散度(相对熵)
  • 交叉熵
  • 参考

信息量

以前我也一直只是知道信息量的计算公式,也有想过为什么会是这样,但是因为要学的东西太多了,就没怎么深究,直到看了“交叉熵”如何做损失函数?打包理解“信息量”、“比特”、“熵”、“KL散度”、“交叉熵”王木头的视频,才有了比较值观且深刻的理解了。

接下来看这么一幅图:
在这里插入图片描述
如何衡量信息量呢

我们看图可以发现,阿根廷进入决赛+阿根廷赢了决赛 = 阿根廷夺冠
这二者再说一件事情,理应信息量一样大,这应该比较好理解。

那么我们就能够推出信息量的定义了
在这里插入图片描述
因为需要满足上面的式子,我们容易看出,式子里得带着log
在这里插入图片描述
这里以2为底,可以用比特来作为计算出的信息量的单位。
这里取个-因为概率都是<1的,计算出来的都是负数,因为原来概率小的事情发生了,给我们直观的感受应该是信息量越大,因此取个-来迎合我们的感受。

信息量衡量的是一个事件从原来的不确定到确定,他的难度有多大,信息量越大,说明难度就越高。

前面说到信息量是衡量一个事件从不确定到确定的花费,那么熵就是高一级,衡量一个系统从不确定到确定的花费,就称之为熵了。
下面再看这么一幅图:
在这里插入图片描述
左右两边分别看成一个系统。
我们可以发现左边系统的熵=1
右边系统的熵=0.08左右
这说明左边系统从不确定到确定的难度远高于右边的系统。
这样符合我们直观的感受,两个势均力敌的人区分胜负,在没看到结局之前,谁也不敢妄下定论,说明从不确定到确定的难度会很大。

那么规范一下,我们系统熵的定义可以写成如下形式:
在这里插入图片描述
这样我们便得到了信息熵的定义,数学建模里客观评价中的熵权法中的信息熵的方式就是基于此,因为是根据数据中信息确定性程度(信息量包含的大小)来衡量权重。

KL散度(相对熵)

在这里插入图片描述
其中
在这里插入图片描述
分别代表两个概率系统的信息量。

这里的KL散度式子是以P为基准去考虑Q变成P的分布相差有多少信息量。

在这里插入图片描述
这一部分很容易看出,是P系统的信息熵。
在这里插入图片描述
这一部分就是交叉熵了,可以用H(P,Q)来表达。

当KL散度=0时,说明两个概率分布情况时一样的。

根据:
在这里插入图片描述
可以说明,这里KL散度一定是大于等于0的

因此,如果我希望Q和P越接近,就是需要寻找交叉熵的最小值就行了,因为后面的式子是恒定的(因为以P为基准了,可以认为P相当于真实值,那么我需要的就是调整Q去接近P)。

对于连续性随机变量也可以定义KL散度:
在这里插入图片描述

交叉熵

通过KL散度的推导,我们发现,当以P为基准的时候,计算Q拟合P分布的差距其实就是考虑交叉熵最小即可。
那么放到神经网络中,当P为真实样本标签,Q为预测值的时候,我们就可以通过交叉熵来计算损失,从而进行反向传播,训练模型,从而使得预测值的Q与P的分布越来越近,从而达到比较好的一个效果。

在这里插入图片描述
将KL散度推出交叉熵进行展开,我们可以发现就比较熟悉了。
假设xi表示预测值,yi表示预测值xi正确的概率
那么1-xi表示预测出来不是xi,1-yi表示预测出来不是xi的概率

这也就是我们分类问题中经常使用的交叉熵损失函数了。

参考

KL散度超详细讲解
“交叉熵”如何做损失函数?打包理解“信息量”、“比特”、“熵”、“KL散度”、“交叉熵”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39670.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI产品经理是如何理解机器学习的(附注释)

本期目的&#xff1a;回顾之前敲代码的日常&#xff0c;利用生活场景帮助AI产品经理认识机器学习及学习过程中常用算法和评价指标。 适用读者&#xff1a;AI/数据产品经理。 阅读重点&#xff1a;品&#xff0c;细品&#xff0c;结合班级故事再品。 最近看了很多关于机器学习…

卢伟冰称小米今年库存会回到更健康水位 将加大门店整合调整

雷递网 乐天 3月25日 小米集团&#xff08;股票代码为&#xff1a;1810&#xff09;今日发布财报&#xff0c;财报显示&#xff0c;小米集团2022年营收为2800亿元&#xff0c;较上年同期的3283亿元下降14.7%。小米2022年经调净利为85亿元。 小米2022年第四季度营收为660.47亿元…

小米年营收2800亿:经调整利润85亿 电动汽车业务投入31亿

雷递网 雷建平 3月24日 小米集团&#xff08;股票代码为&#xff1a;1810&#xff09;今日发布财报&#xff0c;财报显示&#xff0c;小米集团2022年营收为2800亿元&#xff0c;较上年同期的3283亿元下降14.7%。 2022年&#xff0c;小米集团的境外市场收入为1378亿元&#xff0…

什么是低代码开发平台(apaas)?低代码开发平台的价值有哪些

手码6500字&#xff0c;带你快速看懂&#xff1a;什么是低代码开发平台&#xff08;apaas&#xff09;&#xff0c;低代码有哪些价值&#xff0c;以及低代码平台的使用逻辑和心得。 一、什么是低代码开发平台&#xff08;apaas&#xff09;&#xff1f; 低代码开发平台是一种a…

详解如何在ChatGPT内构建一个Python解释器

这篇文章主要为大家详细介绍了如何在ChatGPT内构建一个Python解释器&#xff0c;文中的示例代码讲解详细&#xff0c;具有一定的学习价值&#xff0c;需要的可以参考一下 目录 引用&#xff1a;Art Kulakov 《How to Build a Python Interpreter Inside ChatGPT》 这个灵感来自…

如何画各种“图”?

我们在写文档过程中&#xff0c;多多少少都会画一些图来说明程序的功能&#xff0c;这篇文章就来说明一些常用的"图"怎么画。 1&#xff0c;画图工具 常用的有这么几种 Visio&#xff1a;这是很常用的&#xff0c;基本上的图都可以用这个来画。StarUML&#xff1a…

patreon cg人物插画作品合集分享

1、wlop大神作品4K-8K精选无水印图片http://theme.chengxuz.com/265.html 2、加拿大女画师sakimi chan作品1-98期插画http://theme.chengxuz.com/250.html 3、画师Mirco Cabbia插画作品合集欣赏http://theme.chengxuz.com/306.html 4、画师Sciamano240插画作品分享http://th…

如何画场景插画?场景插画的起稿、构图技巧!

如何画场景插画&#xff1f;绘画初学者如何构图&#xff1f;绘画初学者如何起稿&#xff1f;学习绘画难吗&#xff1f;怎样才能学好绘画&#xff1f;想必这些都是绘画初学者们经常在想的问题吧&#xff0c;就是不知道如何才能绘画好一个场景&#xff0c;不知道如何起稿也不知道…

手把手教你实现手绘风格图形

大家好&#xff0c;我是 漫步&#xff0c;今天分享一篇高难度的图形绘制文章。 Rough.js[1]是一个手绘风格的图形库&#xff0c;提供了一些基本图形的绘制能力&#xff0c;比如&#xff1a;虽然笔者是个糙汉子&#xff0c;但是对这种可爱的东西都没啥抵抗力&#xff0c;这个库的…

Python自动绘制UML类图、函数调用图(Call Graph)

文章目录 1. 引言2. 绘制UML类图2.1 安装graphviz2.2 安装pyreverse2.3 绘制UML类图 3. 绘制函数调用图3.1 安装graphviz3.2 安装pycallgraph3.3 使用示例第一种&#xff1a;从命令行调用第二种&#xff1a;从API调用 小结 1. 引言 在设计软件、分析代码时&#xff0c;我们常常…

房价预测2

学习&#xff1a; https://blog.csdn.net/u012063773/article/details/79349256 https://www.cnblogs.com/massquantity/p/8640991.html https://zhuanlan.zhihu.com/p/39429689 详解stacking过程 之前在房价预测1中对一些异常值进行了drop处理 后来在分割train和test的时候…

深圳二手房房价分析及预测

分析目标&#xff1a; 通过处理后的房价数据&#xff0c;筛选对房价有显著影响的特征变量。确定特征变量&#xff0c;建立深圳房价预测模型并对假设情景进行模拟 数据预处理 import pandas as pd import os file_path"D:\Python数据分析与挖掘实战\深圳二手房价分析\…

波士顿房价预测

目录 前言一、波士顿房价预测实战1-1、数据集介绍&数据集导入&分割数据集1-2、数据标准化1-3、构建网络1-4、K折交叉验证&取出所有的训练损失、训练平均绝对误差、验证损失、验证平均绝对误差1-5、计算平均mae&绘制验证mae分数&绘制验证loss分数1-6、找到最…

房价多特征预测

2019.11.18 首先非常感谢这位作者&#xff0c;写的很棒&#xff01;你们就不要看我的啦&#xff0c;看他的⬇️⬇️ 学习来自 https://blog.csdn.net/sinat_29957455/article/details/79255675 下面的内容为自己学习笔记: 学习Kaggle&#xff5e;ing 这次给出的特征有点儿多啊…

北京房价预测图说

前言 曾听人说过&#xff0c;中国经济是房地产市场&#xff0c;美国经济是股票市场。中国房地产市场超过400万亿&#xff0c;房地产总值是美国、欧盟、日本总和&#xff0c;但是股市才50万亿&#xff0c;不到美欧日的十分之一。可见房地产对于中国来说地位尤其明显&#xff01…

苹果App Store商店中国区如何改为美国区

苹果App Store商店中国区如何改为美国区 Hello大家好&#xff01;苹果外区id是每个苹果手机必不可少的啦&#xff01;不是国外有多好而是国内的大部分软件都有限制&#xff0c;一开始我百度了一下内容太乱太杂了真的都是“bullshit”,下面直接上教程。 第一首先要一个国内的苹…

二手平台淘的明星同款穿搭?上95分看看

作为一个喜欢穿搭的潮流人士&#xff0c;我拥有许多明星同款&#xff0c;但拥有的越多&#xff0c;我的钱包就越扁。 但尽管是在这样的情况下&#xff0c;我依然不能放弃给它们&#xff08;指衣服鞋子&#xff09;一个家&#xff0c;所以我知道了95分&#xff0c;认识了95分&a…

《VogueMe》手写问答新鲜出炉!这字体很李易峰!

爱豆新闻讯 昨日晚间&#xff0c;《VogueMe》官博送上端午小福利――我们小哥哥的手写问答新鲜出炉啦&#xff01;蜜蜂们纷纷表示&#xff0c;瞧这字体一看就知道是出自我方木哥~ 最后&#xff0c;期待我哥在电影《心理罪》里的表现&#xff0c;小编表示已经迫不及待想见方木了…

pythonif语句怎么换行输入_李沁和李易峰演的电视剧叫什么名字

第一现纠在出掌握证据录音录像历印病常会存复纷后、封时间&#xff0c;的维权意强患方来越由于识越。 每月李女养费0元付抚士支&#xff0c;女由达成高先协议最终养&#xff1a;长双方生抚。他又女儿带着悄悄亲子做了鉴定&#xff0c;为了打消的疑自己虑&#xff0c;对恩高先妻…

有时间BB,不如想想怎么让别人闭嘴吧

1. 经过上次「SKR&#xff01;虎扑66万JRS大战3300万吴亦凡护卫队&#xff0c;别逼我拿Python」一事&#xff0c;我发现观众里有很多JRs&#xff0c;「这就是灌篮」一定不陌生。 我不是做广告&#xff0c;所以对该节目的评论暂时不讨论&#xff0c;今天要说的是球场外的另一件事…