【学习】torch.nn.CrossEntropyLoss交叉熵损失函数

【学习】torch.nn.CrossEntropyLoss交叉熵损失函数

news/2024/11/15 0:52:09/文章来源:https://blog.csdn.net/qq_46110320/article/details/136517622

交叉熵损失函数torch.nn.CrossEntropyLoss

交叉熵主要是用来判定实际的输出与期望的输出的接近程度，为什么这么说呢，举个例子：

在做分类的训练的时候，如果一个样本属于第K类，那么这个类别所对应的输出节点的输出值应该为1，而其他节点的输出都为0，即[0,0,1,0,….0,0]，这个数组也就是样本的Label，是神经网络最期望的输出结果。也就是说用它来衡量网络的输出与标签的差异，利用这种差异经过反向传播去更新网络参数。

损失函数计算原理

交叉熵损失，是分类任务中最常用的一个损失函数。在Pytorch中是基于下面的公式实现的。
在这里插入图片描述
其中x 是真实标签, x ^是预测值。
取单个样本举例，假设x = [ 0 , 1 , 0 ] , 模型预测样本x ^的概率为[ 0.1 , 0.5 , 0.4 ] 。(因为是分布, 所以属于各个类的和为1)。则样本的损失计算如下所示：

需要注意的点：

torch.nn.CrossEntropyLoss(input,target)中的标签target使用的是类别的序号，而不是one-hot形式。
假设现在共有5个候选类别，当前标签是第三个。故类别序号如：2，（下标从0开始），而one-hot编码表示为：[0,0,1,0,0]。

在torch中，输入的target只需要是类别序号即可，torch.nn.CrossEntropyLoss(input,target)会自动进行one-hot编码。这是因为在target中只会有一个类别为真，最终得到loss也只是会和真的这个类别相乘，故自动编码很容易。
torch.nn.CrossEntropyLoss(input, target)的input是没有归一化的每个类的得分，而不是softmax之后的分布。即input是直接模型的输出即可，不需要进行softmax操作。
对于推理阶段，需要使用torch.argmax() 或者softmax等函数来找出概率最大的类别。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/270844.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

计讯物联环保数采仪TS910全力打造绿色宜居生态环境

计讯物联环保数采仪TS910全力打造绿色宜居生态环境

植树造林自古以来就有调节气候、涵养水源、减轻大气污染的益处。如今，随着科技的迅速发展，我们除了能够以植树造林来改善生活环境，保持生态系统，还能通过物联网、大数据、云计算、边缘计算、人工智能等新一代信息技术集成应用于监…

阅读更多...

使用 Docker 部署 Fiora 在线聊天室平台

使用 Docker 部署 Fiora 在线聊天室平台

一、Fiora 介绍 Fiora 简介 Fiora 是一款开源免费的在线聊天系统。 GitHub：https://github.com/yinxin630/fiora Fiora 功能注册账号并登录，可以长久保存你的数据加入现有群组或者创建自己的群组，来和大家交流和任意人私聊，并添…

阅读更多...

探索SRM软件：了解SRM在企业中的作用

探索SRM软件：了解SRM在企业中的作用

作为供应商，对于SRM软件并不陌生，但对于刚刚进入采购行业的新手来说，就可能不太了解这个软件的作用了。现在让我们来科普一下：通常，我们将SRM称为供应商关系管理，其全称为Supplier Relationship Management…

阅读更多...

让照片说话唱歌的软件，盘点这3款！

让照片说话唱歌的软件，盘点这3款！

在数字时代，我们总是渴望找到新的方式来表达自我、分享生活。近年来，随着人工智能和图像处理技术的飞速发展，一种新型的软件应运而生，它们能够让照片“说话”甚至“唱歌”，给我们的生活带来了无限乐趣和创意空间。那么…

阅读更多...

如何在Linux系统Docker本地部署SimpleMindMap并实现远程访问？

如何在Linux系统Docker本地部署SimpleMindMap并实现远程访问？

文章目录 1. Docker一键部署思维导图2. 本地访问测试3. Linux安装Cpolar4. 配置公网地址5. 远程访问思维导图6. 固定Cpolar公网地址7. 固定地址访问 SimpleMindMap 是一个可私有部署的web思维导图工具。它提供了丰富的功能和特性，包含插件化架构、多种结构类型&…

阅读更多...

卷积神经网络的原理

卷积神经网络的原理

前面介绍了卷积运算的基本原理和概念，从本质上来说，卷积神经网络就是将图像处理中的二维离散卷积运算和神经网络相结合。这种卷积运算可以用于自动提取特征，而卷积神经网络也主要应用于二维图像的识别。下面我们将采用图示的方法直观地介绍卷…

阅读更多...

Windows安装MySQL详细教程

Windows安装MySQL详细教程

1.1 下载MySQL压缩包官网下载链接[点击跳转] 按图中选择，然后点击【Download】点击图中箭头所指方向直接下载 1.2 解压下载好的压缩包后找到【bin】文件夹，并记下文件路径（下文将以路径 D:\mysql-8.0.36-winx64\bin 为例） 1.…

阅读更多...

自学新标日第七课（未完结）

自学新标日第七课（未完结）

第七课单词单词假名声调词义コーヒーコーひー３咖啡コーラーコーラー１可乐お茶おちゃ０茶ワインわいん１葡萄酒パンぱん１面包ケーキけーき１蛋糕お粥おかゆ０粥昼ごはんひるごはん３午…

阅读更多...

JS 对象数组排序方法测试

JS 对象数组排序方法测试

输出一.Array.prototype.sort() 1.默认排序 sort() sort() 方法就地对数组的元素进行排序，并返回对相同数组的引用。默认排序是将元素转换为字符串，然后按照它们的 UTF-16 码元值升序排序。由于它取决于具体实现，因此无法保证排序的时…

阅读更多...

编写dockerfile挂载卷、数据容器卷

编写dockerfile挂载卷、数据容器卷

编写dockerfile挂载卷编写dockerfile文件 [rootwq docker-test-volume]# vim dockerfile1 [rootwq docker-test-volume]# cat dockerfile1 FROM centosVOLUME ["volume01","volume02"]CMD echo "------end------" CMD /bin/bash [rootwq dock…

阅读更多...

高级控件

高级控件

1.下拉列表 package com.tiger.chapter08;import androidx.appcompat.app.AppCompatActivity;import android.os.Bundle; import android.view.View; import android.widget.AdapterView; import android.widget.ArrayAdapter; import android.widget.Spinner;public class Spi…

阅读更多...

【系统学习】2-Java进阶知识总结-3-集合-1-补充【泛型、树、数据结构】

【系统学习】2-Java进阶知识总结-3-集合-1-补充【泛型、树、数据结构】

文章目录泛型什么是泛型？常见的泛型标识符泛型类泛型方法泛型接口通配符树树的基本概念什么是二叉树？二叉树--普通二叉树二叉树--二叉查找树定义规则优缺点二叉树--平衡二叉树定义规则旋转机制二叉树--红黑树定义规则红黑规则常见数据结构总体特点结…

阅读更多...

【北京迅为】《iTOP-3588开发板网络环境配置手册》第3章开发板直连电脑配置方法（不能上外网）

【北京迅为】《iTOP-3588开发板网络环境配置手册》第3章开发板直连电脑配置方法（不能上外网）

RK3588是一款低功耗、高性能的处理器，适用于基于arm的PC和Edge计算设备、个人移动互联网设备等数字多媒体应用，RK3588支持8K视频编解码，内置GPU可以完全兼容OpenGLES 1.1、2.0和3.2。RK3588引入了新一代完全基于硬件的最大4800万像素ISP&…

阅读更多...

Vue：双token无感刷新

Vue：双token无感刷新

文章目录初次授权与发放Token：Access Token的作用：Refresh Token的作用：无感刷新：安全机制：后端创建nest项目AppController 添加login、refresh、getinfo接口创建user.dto.tsAppController添加模拟数据前端Hbuilder创…

阅读更多...

20240306-1-大数据的几个面试题目

20240306-1-大数据的几个面试题目

面试题目 1. 相同URL 题目: 给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url？ 方案1：估计每个文件的大小为50G64320G，远远大于内存限制的4G。所以…

阅读更多...

【UE 材质 Niagara】爆炸效果

【UE 材质 Niagara】爆炸效果

目录效果步骤一、材质部分二、Niagara部分效果步骤一、材质部分 1. 创建一个材质，这里命名为“M_Burst” 打开“M_Burst”，设置混合模式为半透明，设置着色模型为无光照，勾选双面显示在材质图表中首先创建扰动效果其…

阅读更多...

【center-loss 中心损失函数】参数与应用

【center-loss 中心损失函数】参数与应用

文章目录前言简单总结一下参数对比解释参数权重衰减（L2正则化）动量其他参数运行前言之前我们已经完全弄明白了中心损失函数里的代码是什么意思，并且怎么用的了，现在我们来运行它。论文：https://ydwen.github.io/…

阅读更多...

如何配置通过Steam启动SMAPI

如何配置通过Steam启动SMAPI

想要通过Steam启动SMAPI需要两个步骤： 获取启动选项文本在steam中填写启动选项文本 1 获取启动选项文本 1.1 如果你是通过小火星露谷管理器安装的SMAPI 如果你是通过小火星露谷管理器安装的SMAPI，你可以在SMAPI管理的扩展卡片里面看见一个【小贴士】…

阅读更多...

【Web】浅聊JDBC的SPI机制是怎么实现的——DriverManager

【Web】浅聊JDBC的SPI机制是怎么实现的——DriverManager

目录前言分析前言【Web】浅浅地聊JDBC java.sql.Driver的SPI后门-CSDN博客上篇文章我们做到了知其然，知道了JDBC有SPI机制，并且可以利用其Driver后门这篇文章希望可以做到知其所以然，对JDBC的SPI机制的来源做到心里有数分析先是…

阅读更多...

VS2022打包C#安装包(最新、最全)

VS2022打包C#安装包(最新、最全)

开发c#的一个小工具到打包环境碰壁了，在网上找了很多资料耶踩了很多坑，耗时1hour才打包完毕，避免以后碰到类似的问题再次记录，自认为步骤比较全面，如果有帮助麻烦点个赞呗！！！ 一、Mi…

阅读更多...

最新文章

推荐文章