深度学习(前馈神经网络)知识点总结

news/2024/12/26 0:05:35/文章来源:https://blog.csdn.net/weixin_45526117/article/details/132604662

用于个人知识点回顾，非详细教程

1.梯度下降

前向传播

特征输入—>线性函数—>激活函数—>输出

在这里插入图片描述

反向传播

根据损失函数反向传播，计算梯度更新参数

在这里插入图片描述

在这里插入图片描述

2.激活函数(activate function)

什么是激活函数？

在神经网络前向传播中，每一层的输出还需要经过激活函数再作为下一层的输入，即 $a^{[1]}=\sigma(z^{[1]})$

为什么需要激活函数？

如果没有非线性激活函数，模型的最终输出实际上只是输入特征x的线性组合
在这里插入图片描述

激活函数的分类

（1）sigmoid函数：除了输出层是一个二分类问题基本不会用
$a=\sigma(z)=\frac{1}{1+e^{-z}}$
（2）tanh函数：数据平均值更接近0，几乎所有场合都适用
$a=tanh(z)=\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}}$

sigmoid函数和tanh函数两者共同的缺点是，在z特别大或者特别小的情况下，导数梯度或者函数斜率会变得特别小，最后就会接近于0，导致降低梯度下降的速度。

（3）Relu函数：修正线性单元，最常用的默认函数
$a = ma x (0, z)$
（4）Leaky Relu函数：进入负半区
$a = ma x (0.01 z, z)$

sigmoid函数和tanh函数在正负饱和区的梯度都会等于0，而Relu和Leaky Relu可以避免梯度弥散现象，学习速度更快

在这里插入图片描述

3. 正则化

偏差和方差

高方差过拟合，高偏差欠拟合

在这里插入图片描述

L1/L2正则化

在损失函数加上正则化，L1正则化更稀疏

在这里插入图片描述

dropout正则化

根据概率随机删除节点

在这里插入图片描述

其它正则化方法

在这里插入图片描述

4.优化算法

mini-batch梯度下降法

数据集分成多个子集来更新梯度

在这里插入图片描述

动量梯度下降(momentum)

参数更新时的梯度微分值计算方式采用指数加权平均

在这里插入图片描述

RMSprop(root mean square prop)

在这里插入图片描述

Adam

momentum+RMSprop

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/113708.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

git使用

git使用

1、在码云上注册账号 2、git官网下载git客户端 3、右键进入git bash进行配置 4、配置用户名，邮箱（码云上的邮箱） 5、配置ssh免密连接（xxxxxx.com就是码云上注册的邮箱） 使用命令得到密钥 cat~/.ssh/id_rsa.pub 复制…

阅读更多...

【python爬虫】3.爬虫初体验（BeautifulSoup解析）

【python爬虫】3.爬虫初体验（BeautifulSoup解析）

文章目录前言BeautifulSoup是什么BeautifulSoup怎么用解析数据提取数据对象的变化过程总结前言上一关，我们学习了HTML基础知识，知道了HTML是一种用来描述网页的语言，又了解了HTML的基本结构。认识了HTML中的常见标签和常见属性&#x…

阅读更多...

11、监测数据采集物联网应用开发步骤(8.2)

11、监测数据采集物联网应用开发步骤(8.2)

监测数据采集物联网应用开发步骤(8.1) 新建TCP/IP Client线程类com.zxy.tcp.ClientThread.py #! python3 # -*- coding: utf-8 -Created on 2017年05月10日 author: zxyong 13738196011 import datetime import socket import threading import timefrom com.zxy.adminlog.Us…

阅读更多...

交换机端口安全

交换机端口安全

文章目录一、802.1X认证1. 定义和起源2. 认证方式本地认证远程集中认证 3. 端口接入控制方式基于端口认证基于MAC地址认证二、端口隔离技术1. 隔离组2. 隔离原理3. 应用场景首先可以看下思维导图，以便更好的理解接下来的内容。一、802.1X认证 1. 定义和起源 8…

阅读更多...

国标GB28181安防视频平台EasyGBS角色设备分配功能优化

国标GB28181安防视频平台EasyGBS角色设备分配功能优化

视频流媒体安防监控国标GB28181平台EasyGBS视频能力丰富，部署灵活，既能作为业务平台使用，也能作为安防监控视频能力层被业务管理平台调用。国标GB28181视频监控EasyGBS平台可提供流媒体接入、处理、转发等服务，支持内网、公网的安…

阅读更多...

OpenCV基础知识（9）— 视频处理（读取并显示摄像头视频、播放视频文件、保存视频文件等）

OpenCV基础知识（9）— 视频处理（读取并显示摄像头视频、播放视频文件、保存视频文件等）

前言：Hello大家好，我是小哥谈。OpenCV不仅能够处理图像，还能够处理视频。视频是由大量的图像构成的，这些图像是以固定的时间间隔从视频中获取的。这样，就能够使用图像处理的方法对这些图像进行处理，进而达到…

阅读更多...

视频云存储/安防监控视频/智能分析网关V3裸土未覆盖/苫盖算法功能详解

视频云存储/安防监控视频/智能分析网关V3裸土未覆盖/苫盖算法功能详解

随着经济的发展和建筑工地的增多，对于土堆的裸露情况实时监测和管理变得尤为重要。为了解决这一问题，TSINGSEEE青犀AI智能分析网关V3的裸土未苫盖算法就能很好地解决。 AI算法模型可以实时识别路面/建筑工地中的土堆是否裸露，将工地、道路等…

阅读更多...

idea2023项目上传到gitee

idea2023项目上传到gitee

1、按照gitee插件 File——>Settings plugins——>Marketplace下面搜索gitee,然后按照gitee插件 2、上传项目 VCS_——>Share Project on Gitee 如果第一次没登录的需要先登录，登录完后就可以上传了

阅读更多...

CCF HPC China2023 | 盛大开幕，邀您关注澎峰科技

CCF HPC China2023 | 盛大开幕，邀您关注澎峰科技

2023年8月24日，以“算力互联智领未来”为主题的第十九届全国高性能计算学术年会（CCF HPC China 2023）在青岛红岛国际会议展览中心拉开帷幕。特邀嘉宾涵盖行业大咖，主持阵容同样是“重量级”——来自国家并行计算机工程技术研究中心…

阅读更多...

CSS魔术师Houdini，用浏览器引擎实现高级CSS效果

CSS魔术师Houdini，用浏览器引擎实现高级CSS效果

开门见山，直接上货 🔍 CSS Houdini是什么？ “Houdini”一词引用自“Harry Houdini”，他是一位20世纪的著名魔术师，亦被称为史上最伟大的魔术师、逃脱术师及特级表演者。我们都知道，浏览器在渲染网页显示样…

阅读更多...

luckfox pico 使用记录

luckfox pico 使用记录

连接使用USB转TTL 连接 USB 也要一起插上在显示控制台窗口上会显示板子的IP地址 USB接上后会在网络和共享中心发现以太网2（通过RNDIS 通过USB 将板当网卡用,但使用网络共享，无法ping 通外部网） 可以不关闭防火墙（WIN10 6…

阅读更多...

对分库分表进行批量操作

对分库分表进行批量操作

对ShardingJDBC基础了解：https://blog.csdn.net/m0_63297646/article/details/131894472 对批量操作案例：https://blog.csdn.net/m0_63297646/article/details/131843517 分为db0和db1两个库，每个库都有三张订单表，分表键根据年份…

阅读更多...

unity 物体至视图中心以及新对象创建位置

unity 物体至视图中心以及新对象创建位置

如果游戏对象不在视野中心或在视野之外， 一种方法是双击Hierarchy中的对象名称另一种是选中后按F 新建物体时对象的位置不是在坐标原点，而是在当前屏幕的中心

阅读更多...

信息技术02--初/高中--分类选择题(377道题与解析)

信息技术02--初/高中--分类选择题(377道题与解析)

文章目录第一章办公软件 1-96第二章信息技术基础 1-41第三章计算机系统基础 1-28第四章多媒体技术 1-115第五章计算机网络技术 1-50第六章信息安全 1-3第七章算法与程序简介 1-13第八章数据结构 1-2第九章数据库技术 1-20第十章练习 1-9 第一章办公软件 1-96 1、某…

阅读更多...

ABB PCD231B101励磁控制模块

ABB PCD231B101励磁控制模块

电磁励磁控制： PCD231B101 模块专门设计用于电磁励磁设备的控制，以确保发电机的励磁电流和电压维持在合适的水平。多通道控制： 这种模块通常具有多个控制通道，可用于同时监测和控制多台电力发电机。通讯接口： PCD2…

阅读更多...

0829【综述】面向时空数据的区块链研究综述

0829【综述】面向时空数据的区块链研究综述

摘要:时空数据包括时间和空间2个维度,常被应用于物流、供应链等领域。传统的集中式存储方式虽然具有一定的便捷性,但不能充分满足时空数据存储及查询等要求,而区块链技术采用去中心化的分布式存储机制,并通过共识协议来保证数据的安全性。研究现有区块链1.0、2.0和以Block-DAG为…

阅读更多...

taro 支付宝/微信小程序的chooseImage真机和开发工具上的区别

taro 支付宝/微信小程序的chooseImage真机和开发工具上的区别

支付宝小程序微信小程序

阅读更多...

【CicadaPlayer】getPlayerBufferDuration分析

【CicadaPlayer】getPlayerBufferDuration分析

https://github.com/alibaba/CicadaPlayer/blob/release/0.4.4/mediaPlayer/SuperMediaPlayer.cpp核心关键函数int64_t SuperMediaPlayer::getPlayerBufferDuration(bool gotMax, bool internal)17个地方出现： getPlayerBufferDuration的durations 数组分别对音频、视频、字…

阅读更多...

阿里云配置MySQL-server 8.0远程登录

阿里云配置MySQL-server 8.0远程登录

Ubuntu 22.04 LTS 安装MySQL-Server 8.0 # apt search mysql-server # apt install mysql-server重建服务 # service mysql stop # vi /etc/mysql/mysql.conf.d/mysqld.cnf ... bind-address 0.0.0.0 ... # service mysql start # lsof -i:3306 COMMAND PID USER FD …

阅读更多...

JDK源码解析-ArrayList

JDK源码解析-ArrayList

1. ArrayList类 1.1 ArrayList类结构图 ArrayList 是一个用数组实现的集合，支持随机访问，元素有序且可以重复。 （1）ArrayList 是一种变长的集合类，基于定长数组实现。 （2）ArrayList 允许空值…

阅读更多...

最新文章

推荐文章