深度学习-基础网络组件介绍(六)

深度学习基础网络组件介绍

  • 网络组件
    • 网络结构-全连接层
    • 激活函数
      • 常见激活函数-Sigmoid
      • 常见激活函数-tanh
      • 常见激活函数-Relu
      • 常见激活函数-Gelu
      • 常见激活函数-Softmax
    • 损失函数
      • 损失函数-均方差
      • 损失函数-交叉熵(Cross Entropy)

网络组件

**释义:**一个大的人工智能模型,可以理解为搭积木,通过不同的组件组合构建成整个模型。本质上可以通过深度学习的流程图去划分,只是不同的部分,进行了不同层度的丰富而已。
在这里插入图片描述

网络结构-全连接层

介绍:

1.又叫线性层
2.计算公式: y = w*x +b
3.w、b都是可以训练的参数,并且不是简单的数字,而是矩阵或者是向量
4.w的维度决定了隐含层输出的维度,一般称为隐含层单元个数(hidden size)
举例:
输入:x (维度1 x 3)
隐含层1:w (维度3 x 5)
隐含层2:w (维度5 x 2)

在这里插入图片描述
代码示例:(待后续补充)

激活函数

作用:

1.前面的线性函数,我们知道图像是一个直线,这样的图像对于很多曲线的情况,没有办法去模拟这个规律,所以由激活函数
2.激活函数使得,模型通过前面的线性函数后,在进行激活函数,就可以模拟曲线的规律,即拟合非线性函数的能力
无激活函数时 y = w1(w2(w3 * x + b3) +b2) + b1 仍然是线性函数

举例: 例如原来的孩子学习理科的天赋不强,那么我通过给他装一个计算机,使得他的计算天赋增加,就和我们这里加激活函数一样。

如下图示例:
在这里插入图片描述

常见激活函数-Sigmoid

图像如下图:
在这里插入图片描述
公式为:
在这里插入图片描述
释义: 可以很明确的看到,线性层计算后,带入到激活函数中,即待入到公式中的x中,图像就是一个曲线。

常见激活函数-tanh

示意图:
在这里插入图片描述
公式如下:
在这里插入图片描述

常见激活函数-Relu

释义: 虽然看起来上述的激活函数,是由两条直线构成的,但是在较大的模型中,由于神经元层数较多,经过多轮的激活后,就能达到意想不到的效果。
举例: 就像没有锻炼和每天都锻炼10分钟,虽然看起来锻炼的不多,但是时间久了,与不锻炼却会有天壤之别;就和有上面的激活函数和没有一样。
在这里插入图片描述

常见激活函数-Gelu

在这里插入图片描述

常见激活函数-Softmax

释义: Softmax激活函数呢,又叫归一化操作,简单来说,就是把上一个输入的向量,通过归一化后,使得向量中的每一个数字的和为1;这就可以和概率结合了。

举例: 原来这个孩子只有讲中文的天赋,于是给他加了一个翻译器,使得他讲的中文可以转化为英文,这样就可以满足说英文的情况了;这个翻译器就是 Softmax。

作用:

归一化操作常用于涉及到概率的相关操作,因为有下面的公式可以知道,通过归一化后,值的和为一
应用场景: 当出现输出的向量中,每一个数字代表的是一种可能性时,比如[2,4,3];向量中第1号数字代表男、第2代表女、第3代表不男不女,那么模型判断结果更倾向于女,因为数字更大;但是不够准确,我们可以通过归一化,得到模型判断为三类的具体概率,这就是具体的作用

在这里插入图片描述
公式如下
在这里插入图片描述

损失函数

释义: 损失函数,就是计算loss值得,即模型得预测值和真实值之间得差距。
举例: 简单理解就是孩子得反思能力,让他去做一件事,他会比较一下完成之后的结果和要求达到的效果之间的差距。好方便他调整以后做相同事的方案。

损失函数-均方差

释义: 即模型预测值和真实值之间的差,进行平方;然后根据样本数量,求平均。有时候会求和而不是求平均,具体根据情况而定。对均方差开根号,可以得到根方差。

适合场景: 输出结果为浮点数的情况。

公式如下:
在这里插入图片描述

损失函数-交叉熵(Cross Entropy)

适用场景: 适用于分类任务,即分类任务中,网络输出的经常是所有类别上的概率。比如上面说的,使用了激活函数Softmax,那么得到的就是一个向量各个元素和为1的输出,即分别代表各位置的概率。

举例说明:

1.我们说的一个分类任务,区分的类型分别为男、女、不男不女;那么我们可以理解其输出肯定会通过Softmax,得到例如:[0.5,0.4,0.1]这样的情况。
2.那么如果这个真实的结果就是女,那么我们的真实值就是:[1,0,0];这个时候,我们就需要通过交叉熵去计算,预测值和输出值之间的差距了

公式:

在这里插入图片描述
上述例子的计算详情:
在这里插入图片描述
注意
在pytroch框架中,进行交叉熵计算前,会自动先进行softmax。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/372502.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于docker的prometheus+grafana+altermanager+prometheus-webhook-dingtalk钉钉报警

一、各软件功能简介 prometheus:Prometheus(是由go语言(golang)开发)是一套开源的监控&报警&时间序列数 据库的组合。主要优点:外部依赖安装使用超简单、系统集成 多等 grafana:Grafana 是一款采用 go 语言编写的开源应用&#xff0…

电脑如何进行屏幕录制?快来看看这3种方法

在数字化浪潮席卷而来的今天,屏幕录制已不再是简单的视频记录,它演变成了一种表达、传播与创新的工具。传统的屏幕录制方法虽然经典简单,但已逐渐无法满足现代人对效率、品质和创意的追求。 所以,在这个充满变革与创新的时代&…

新能源汽车充电站远程监控系统S275钡铼技术无线RTU

新能源汽车充电站的远程监控系统在现代城市基础设施中扮演着至关重要的角色,而钡铼技术的S275无线RTU作为一款先进的物联网数据监测采集控制短信报警终端,为充电站的安全运行和高效管理提供了强大的技术支持。 技术特点和功能 钡铼S275采用了基于UCOSI…

上位机图像处理和嵌入式模块部署(mcu项目2:串口日志记录器)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 淘宝上面有一个商品蛮好玩的,那就是日志记录器。说是记录器,其实就是一个模块,这个模块的输入是一个ttl串口&am…

基于Java+SpringMvc+Vue技术的智慧校园系统设计与实现

博主介绍:硕士研究生,专注于信息化技术领域开发与管理,会使用java、标准c/c等开发语言,以及毕业项目实战✌ 从事基于java BS架构、CS架构、c/c 编程工作近16年,拥有近12年的管理工作经验,拥有较丰富的技术架…

PHP工单预约表单系统小程序源码

🔧【高效办公新利器】工单预约表单系统大揭秘 💼【一键提交,工单管理新高度】 你还在为繁琐的工单提交流程头疼吗?工单预约表单系统,让你的工单管理步入高效时代!只需简单几步,填写必要信息&a…

机器学习中的可解释性

「AI秘籍」系列课程: 人工智能应用数学基础 人工智能Python基础 人工智能基础核心知识 人工智能BI核心知识 人工智能CV核心知识 为什么我们需要了解模型如何进行预测 我们是否应该始终信任表现良好的模型?模型可能会拒绝你的抵押贷款申请或诊断你患…

高性能Python网络框架实现网络应用详解

概要 Python作为一种广泛使用的编程语言,其简洁易读的语法和强大的生态系统,使得它在Web开发领域占据重要位置。高性能的网络框架是构建高效网络应用的关键因素之一。本文将介绍几个高性能的Python网络框架,详细描述它们的特点、使用场景及具体示例代码,帮助高效实现网络应…

【linux高级IO(二)】多路转接之select详解

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:Linux从入门到精通⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学更多操作系统知识   🔝🔝 Linux高级IO 1. 前言2. 初识s…

基于vue的可视化大屏

要提前准备一个xinyang.json文件 可以在这个网站下载 DataV.GeoAtlas地理小工具系列 (aliyun.com) 代码结构 总框架代码&#xff1a; <template><div><div class"center"><center-left /><center-map /><center-right /><…

Xterminal工具的安装与使用体验

Xterminal工具的安装与使用体验 一、Xterminal简介二、Xterminal核心特性三、Xterminal使用场景四、Xterminal下载地址五、Xterminal的基本使用5.1 设置仓库密码5.2 SSH连接5.3 Windows远程桌面5.4 笔记功能5.5 AI工具 六、总结 一、Xterminal简介 Xterminal是一款专为开发者设…

FastReport 指定sql 和修改 数据库连接地址的 工具类 :FastReportHelper

FastReport 指定sql 和修改 数据库连接地址的 工具类 &#xff1a;FastReportHelper 介绍核心代码&#xff1a;完整代码&#xff1a; 介绍 在FastReport中&#xff0c;经常会遇到需要给 sql 加条件的情况&#xff0c;或者给数据库地址做更换。 &#xff08;废话不多说&#x…

达梦数据库的系统视图v$auditrecords

达梦数据库的系统视图v$auditrecords 在达梦数据库&#xff08;DM Database&#xff09;中&#xff0c;V$AUDITRECORDS 是专门用来存储和查询数据库审计记录的重要系统视图。这个视图提供了对所有审计事件的访问权限&#xff0c;包括操作类型、操作用户、时间戳、目标对象等信…

1.DDR3 SO-DIMM 内存条硬件总结

最近在使用fpga读写DDR3&#xff0c;板子上的DDR3有两种形式与fpga相连&#xff0c;一种是直接用ddr3内存颗粒&#xff0c;另一种是通过内存条的形式与fpga相连。这里我们正好记录下和ddr3相关的知识&#xff0c;先从DDR3 SO-DIMM 内存条开始。 1.先看内存条的版本 从JEDEC下载…

如果你想手写Linux系统

哈喽&#xff0c;我是子牙老师。今天咱们聊聊这个话题吧&#xff0c;Linux作为当今科技世界的地基&#xff0c;我们越来越接近真理了&#xff0c;有木有&#xff1f; 这个文章的角度&#xff0c;你可能全网都很难找到第二篇如此系统讲透这个问题的文章 你可能想问&#xff1a…

强化学习编程实战-2马尔可夫决策过程

2.1 从多臂赌博机到马尔可夫决策过程 如图2-1&#xff0c;图中A为多臂赌博机&#xff0c;B为一堆鸳鸯&#xff0c;其中左上角为雄性鸳鸯&#xff0c;右上角为雌性鸳鸯&#xff0c;B展示的任务是雄性鸳鸯绕过障碍物找到词性鸳鸯。跟多臂赌博机不同的是&#xff0c;雄性鸳鸯经过一…

【SpringCloud应用框架】Nacos集群配置

第八章 Spring Cloud Alibaba Nacos之集群配置 文章目录 一、Linux版NacosMySql生产环境配置具体配置&#xff1a; 二、Nacos集群配置更改Nacos启动命令配置原理具体配置测试启动总结 一、Linux版NacosMySql生产环境配置 上一篇博客中已经了解了Nacos生产环境下需要搭建集群配…

angular 请求响应拦截

在module中provide 对请求做一些操作 对响应做一些操作 import { Injectable } from angular/core; import { HttpInterceptor, HttpRequest, HttpHandler, HttpEvent, HttpResponse } from angular/common/http; import { Observable, throwError } from rxjs; import { catc…

[ControlNet] Adding Conditional Control to Text-to-Image Diffusion Models

1、目的 让预训练好的大型DDPM模型支持额外的输入条件&#xff08;如Canny edges、Hough lines、user scribbles、segmentation maps、human key points、shape normals、depths等&#xff09; 不同于image-to-image translation致力于学习不同domain之间的映射&#xff0c;Con…

【Mac】Folder Icons for mac(文件夹个性化图标修改软件)软件介绍

软件介绍 Folder Icons for Mac 是一款专为 macOS 设计的应用程序&#xff0c;主要用于个性化和定制你的文件夹图标。以下是它的主要特点和使用方法&#xff1a; 主要特点&#xff1a; 个性化文件夹图标 Folder Icons for Mac 允许用户为 macOS 上的任何文件夹定制图标。你…