机器学习-感知机-神经网络-激活函数-正反向传播-梯度消失-dropout

文章目录

  • 感知机
    • 工作流程
  • 神经网络
    • 区别
    • 各种各样的神经网络
  • 激活函数
    • 激活函数类型
      • Sigmoid 函数
      • ReLU函数
      • Leaky ReLU 函数
      • Tanh 函数
  • 正向传播
  • 反向传播
  • 梯度消失(gradient vanish)
    • 如何解决
  • Dropout
    • 使用
  • PyTorch实战神经网络算法(手写MNIST数字识别)
    • view
    • softmax和log-softmax
    • cross-entropy loss
    • nll_loss
    • batch size底层运算机制

感知机

感知机是神经网络的起点
在这里插入图片描述
在这里插入图片描述

工作流程

在感知机模型中,step function起到了一个 分类决策 的作用。

在这里插入图片描述
学习调整权重
在这里插入图片描述

神经网络

在这里插入图片描述

区别

无需自己选择特征,传统感知机人工手动提取选择特征,深度学习特征提取的过程是自动完成的。只需要输入各种数据即可
在这里插入图片描述
提取特征可以通过最后输出层的前一层隐藏层的输出特征可以看出来,与一开始的输入层的特征不一样
在这里插入图片描述
可以用作多分类
在这里插入图片描述
或者目标检测
在这里插入图片描述

各种各样的神经网络

DNN 深度神经网络(ANN 人工神经网络 /MLP 多层感知机)、CNN、RNN
在这里插入图片描述
在这里插入图片描述

激活函数

在这里插入图片描述
激活函数是一种非线性函数,它可以把输入的数据映射到一个新的输出值,这个输出值可以在下一层被用作输入。
在这里插入图片描述

在这里插入图片描述

激活函数类型

在这里插入图片描述

Sigmoid 函数

在这里插入图片描述
在这里插入图片描述

ReLU函数

在这里插入图片描述

Leaky ReLU 函数

在这里插入图片描述

Tanh 函数

虽然两者都是非线性的,但 Tanh 函数在输入接近零时提供了更强烈的非线性映射,这是因为其曲线在这个区域内更为陡峭。这使得它能够在某些任务中捕捉到更复杂的模式。
在这里插入图片描述

正向传播

在这里插入图片描述
在这里插入图片描述

反向传播

在这里插入图片描述
负责多少就是对损失值影响多少,就是梯度
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

梯度消失(gradient vanish)

在这里插入图片描述
在这里插入图片描述

如何解决

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Sigmoid函数导函数区间在0到0.25之间,Tanh函数导函数区间在0到1之间,它们输出的数值一直很小。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Dropout

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
消除特征间的依赖关系:不依赖其他特征通过一部分学习的特征就能判断

使用

深度学习框架中会封装有 Dropout 层,这样需要将哪一层输出随机的丢弃一些,那么就在哪一层后面跟 Dropout 层即可。

自行实现如下

p = 0.5  # 激活的概率。p越高,Dropout 越少。
def train_step(X):""" X 是输入数据 """# 第 1 层的前向传播H1 = np.maximum(0, np.dot(W1, X) + b1)  # ReLU 激活U1 = np.random.rand(*H1.shape) < p  # 随机生成 Dropout maskH1 *= U1  # 应用 Dropout,丢弃一些神经元# 第 2 层的前向传播H2 = np.maximum(0, np.dot(W2, H1) + b2)  # ReLU 激活U2 = np.random.rand(*H2.shape) < p  # 随机生成 Dropout maskH2 *= U2  # 应用 Dropout,丢弃一些神经元# 输出层out = np.dot(W3, H2) + b3  # 不对输出层应用 Dropoutreturn out

在这里插入图片描述
在这里插入图片描述

PyTorch实战神经网络算法(手写MNIST数字识别)

https://pytorch.org/

inputs.view(-1, 28*28)

view

在这里插入图片描述

softmax和log-softmax

在这里插入图片描述

cross-entropy loss

在这里插入图片描述

nll_loss

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

batch size底层运算机制

https://blog.csdn.net/weixin_44986037/article/details/144216069

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/500927.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生态碳汇涡度相关监测与通量数据分析实践技术应用

1.以涡度通量塔的高频观测数据为例&#xff0c;基于MATLAB开展上机操作&#xff1a; 2.涡度通量观测基本概况&#xff1a;观测技术方法、数据获取与预处理等 3.涡度通量数据质量控制&#xff1a;通量数据异常值识别与剔除等 4.涡度通量数据缺失插补&#xff1a;结合气象数据…

Win11电脑Cursor默认打开markdown文件,如何修改markdown文件默认打开方式为Typora?

问题 Windows 11电脑上最近新装了cursor&#xff0c;导致我的markdown文件的默认打开方式被自动设置为cursor&#xff0c;那么我想将默认打开方式设置为Typora&#xff0c;应该怎么做呢&#xff1f; 解决方法 选中一个markdown文件&#xff0c;右击&#xff0c;选择属性。 …

基本算法——回归

目录 创建工程 加载数据 分析属性 创建与评估回归模型 线性回归 回归树 评估 完整代码 结论 本节将通过分析能源效率数据集&#xff08;Tsanas和Xifara&#xff0c;2012&#xff09;学习基本的回归算法。我们将基 于建筑的结构特点&#xff08;比如表面、墙体与屋顶面…

PP模块部分BAPI函数

工艺路线 BAPI_ROUTING_CREATE 创建工艺路线 BAPI_ROUTING_EXISTENCE_CHECK 检查工艺路线是否存在 参考操作集 BAPI_REFSETOFOPERATIONS_CREATE 创建参考操作集 BAPI_REFSETOFOPR_EXISTENCE_CHK 检查参考操作集是否存在 计划订单 BAPI_PLANNEDORDER_CREATE 创建计划订单 BAPI…

【SpringBoot】多数据源事务卡死@DSTransactional,当某一个数据库挂掉了,系统卡死问题解决

记录最近发生并解决的一个问题 原因 在一个事务内&#xff0c;操作多个数据库&#xff0c;当其中一个数据库挂掉后&#xff0c;默认无限重连&#xff0c;导致事务无法正常结束&#xff0c;导致系统卡死 解决 将无限重连改成有限次数即可 datasource:db1:driver-class-name…

迅为RK3568开发板编译Android12源码包-设置屏幕配置

在源码编译之前首先要确定自己想要使用的屏幕并修改源码&#xff0c;在编译镜像&#xff0c;烧写镜像。如下图所示&#xff1a; 第一步&#xff1a;确定要使用的屏幕种类&#xff0c;屏幕种类选择如下所示&#xff1a; iTOP-3568 开发板支持以下种类屏幕&#xff1a; 迅为 LV…

重装操作系统后 Oracle 11g 数据库数据还原

场景描述&#xff1a; 由于SSD系统盘损坏&#xff0c;更换硬盘后重装了操作系统&#xff0c;Oracle数据库之前安装在D盘(另一个硬盘)&#xff0c;更换硬盘多添加一个盘符重装系统后盘符从D变成E&#xff0c;也就是之前的D:/app/... 变成了现在的 E:/app/...&#xff0c;重新安装…

企业二要素如何用C#实现

一、什么是企业二要素&#xff1f; 企业二要素&#xff0c;通过输入统一社会信用代码、企业名称或统一社会信用代码、法人名称&#xff0c;验证两者是否匹配一致。 二、企业二要素适用哪些场景&#xff1f; 例如&#xff1a;信用与金融领域 1.信用评级&#xff1a;信用评级…

丢弃法hhhh

一个好的模型需要对输入数据的扰动鲁棒 丢弃法&#xff1a;在层之间加入噪音&#xff0c;等同于加入正则 h2和h5变成0了 dropout一般作用在全连接隐藏层的输出上 Q&A dropout随机置零对求梯度和求反向传播的影响是什么&#xff1f;为0 dropout属于超参数 dropout固定随…

shell学习数学运算符和字符串(三)

这里写目录标题 一、数学运算符1、基本语法2、expr运算3、(())4、let运算5、bc命令6、中括号[] 二、字符串1、单双引号2、字符串拼接3、获取字符串长度4、字符串提取 一、数学运算符 1、基本语法 ( ( ) ) 或者 (())或者 (())或者{}expr ,-,*,/,%加减乘除取余 2、expr运算 ex…

【Java设计模式-1】单例模式,Java世界的“独苗”

今天咱们要一起探秘Java设计模式中的一个超级有趣又超级实用的家伙——单例模式。想象一下&#xff0c;在Java的代码王国里&#xff0c;有这么一类特殊的存在&#xff0c;它们就像独一无二的“独苗”&#xff0c;整个王国里只允许有一个这样的家伙存在&#xff0c;这就是单例模…

无人机飞手培训机构大量新增,考取飞手证参军入伍还有优势吗?

尽管无人机飞手培训机构大量新增&#xff0c;考取飞手证参军入伍仍然具有显著优势。以下是对这一观点的详细阐述&#xff1a; 一、无人机飞手证在军队中的通用优势 1. 法规遵从与安全保障&#xff1a; 根据《民用无人驾驶航空器系统驾驶员管理暂行规定》等相关法规&#xff0…

计算机网络原理(一)

嘿&#xff01; 新年的第一篇博客&#xff0c;大家新年快乐呀&#xff01;希望大家新的一年要多多进步噢&#xff01; 1.TCP/IP的四层/五层参考模型有哪些层&#xff0c;各层的特点是&#xff1f;计算机网络分层的好处是&#xff1f; TCP/IP 四层参考模型 应用层:直接为用户…

大模型Weekly 03|OpenAI o3发布;DeepSeek-V3上线即开源!

大模型Weekly 03&#xff5c;OpenAI o3发布&#xff1b;DeepSeek-V3上线即开源&#xff01;DeepSeek-V3上线即开源&#xff1b;OpenAI 发布高级推理模型 o3https://mp.weixin.qq.com/s/9qU_zzIv9ibFdJZ5cTocOw?token47960959&langzh_CN 「青稞大模型Weekly」&#xff0c;持…

【C++】B2089 数组逆序重存放

博客主页&#xff1a; [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 &#x1f4af;前言&#x1f4af;问题描述题目&#xff1a;数组逆序重排输入格式输出格式输入输出样例 &#x1f4af;我的代码实现**代码分析****优化建议** &#x1f4af;老师的做法与分析方法1&#xff1…

dfs复习

dfs前置知识 0小朋友崇拜圈 - 蓝桥云课 通过深搜,去找到该点指向的下一个点,然后返回所成的环的大小,保留最大的环的大小 通过添加时间戳,记录该点被遍历的时间,如果下一个点有被添加过时间戳,如果时间戳是大于等于我们的最小时间戳的(等于说明该点自成环),那么成环,…

QT---------自定义插件和库

自定义界面组件 设计和使用自定义界面组件 (以 TBattery 为例) 假设我们要创建一个自定义的电池显示组件 TBattery&#xff0c;我们可以从 QWidget 派生一个新的类&#xff1a; #include <QWidget> #include <QPainter>class TBattery : public QWidget {Q_OBJE…

物理知识1——电流

说起电流&#xff0c;应该从电荷说起&#xff0c;而说起电荷&#xff0c;应该从原子说起。 1 原子及其结构 常见的物质是由分子构成的&#xff0c;而分子又是由原子构成的&#xff0c;有的分子是由多个原子构成&#xff0c;有的分子只由一个原子构成。而原子的构成如图1所示。…

数据挖掘——支持向量机分类器

数据挖掘——支持向量机分类器 支持向量机最小间隔面推导基于软间隔的C-SVM非线性SVM与核变换常用核函数 支持向量机 根据统计学习理论&#xff0c;学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小…

Unity 对Sprite或者UI使用模板测试扣洞

新建两个材质球&#xff1a; 选择如下材质 设置如下参数&#xff1a; 扣洞图片或者扣洞UI的材质球 Sprite或者UI的材质球 新建一个单独Hole的canvas&#xff0c;将SortOrder设置为0&#xff0c;并将原UI的canvans的SortOrder设置为1 对2DSprite则需要调整下方的参数 hole的O…