深度学习基本概念

1.全连接层

        全连接层就是该层的所有节点与输入节点全部相连,如图所 示。假设输入节点为X1, X 2, X 3,输出节点为 Y 1, Y 2, Y 3, Y 4。令 矩阵 W 代表全连接层的权重, W 12也就代表 X 2对 Y 1的贡献,令 b 为全 连接层的偏置项,b 1代表 Y 1的偏置,有如下关系。
Y 1= W 11× X 1+ W 12× X 2+ W 13 X 3+ b 1
Y 2= W 21× X 1+ W 22× X 2+ W 23× X 3+ b 2
Y 3= W 31× X 1+ W 32× X 2+ W 33× X 3+ b 3
Y 4= W 41× X 1+ W 42× X 2+ W 43× X 3+ b 4
        完全使用全连接层搭建的网络称为全连接网络。但一般而言,全 连接层通常是在深度神经网络最后阶段使用,用来将卷积网络或者循 环神经网络提取得到的局部或全局信息,进行综合考量,将总体信息 映射到分类空间。全连接层的缺点是参数量较大,例如,当输入层维 度为1024,输出层维度为100时,那么全连接层拥有的参数量为 1024×100+100=102500。

2.卷积层

        在数字信号处理中,卷积常被用来进行低通滤波和高通滤波的操 作,因此在神经网络中卷积层也常常与滤波器和过滤器这两个名词混 用。在深度学习中,卷积层的计算是使用一个预定义大小的卷积核在 输入数据上做滑动相乘处理,将所得乘积之和加上偏置项作为当前位置的响应,如图1.8所示。令输入信号的高和宽为6,卷积核的高和宽 为3时,左上方的计算过程为(0×0)+(1×1)+(0×0)+(1×1)+(0×0)+ (0×1)+(0×0)+(0×1)+(0×0)=2,将卷积核进行图1.8所示的横纵向移动,重复对应位置相乘并求和的操作,得到剩下的三个值为3,1, 2。加上偏置项,在下例中偏置项为1,所以卷积操作最终得到的结果 为[3,4,2,3]。

        下面引入卷积步长的概念,在上图中,无论是横向还是纵向移 动,卷积核与上次所在位置的距离均为3,这就是所谓的卷积步长。 对于本例来说,卷积步长为3,横纵向均只需要移动两次即可完成对 输入信号的卷积。若卷积步长为1,则横纵向分别需要移动4次。这里 给出一般形式下的表达,令输入信号的大小为H× W ,卷积核的大小 为k × k ,卷积步长为 s ,那么完成卷积需要的移动次数也就是[( H- k ) /s +1]×[( W-k ) /s +1]。因为每移动一次就会得到一个结果,所 以卷积后的特征大小也就为[(H-k ) /s +1]×[( W-k ) /s +1]。在深度 学习中常见的卷积步长为1和2。
        上面的计算公式中存在一个细节问题,即得到的移动次数为小数时如何处理?比如当本例中输入大小变为7×7,其他条件不变,上式 得到的移动次数为2.33×2.33。最简单的方法是取整,只移动两次, 剩余的数据不处理,但是这样会造成数据丢失。在深度学习中,一般 采用边缘填充的方法,可以在输入特征的四周填上一圈数值,令输入特征的大小变为9×9,重复之前的运算过程可以得到大小为3×3的 卷积结果。因此上面的公式中一般还需要引入边缘填充,令边缘填充 的大为p ,卷积后的大小可以表示为[( H-k +2× p ) /s +1]×[( W- k +2× p ) /s +1]。 事实上,在深度学习中,特征除了高和宽外,还有通道维度,令 特征通道数为C ,则输入特征的维度可表示为 C × H × W 。举例来说, 当输入特征维度为3×7×7时,可以认为上图仅代表三个通道中第一 个通道上的计算过程,实际上还有两个通道在进行类似的运算,如下图所示。可以看到卷积核需要和输入特征拥有相同的通道数,这样才 能满足输入特征和卷积核在对应通道上相乘的要求。最后所有通道的
运算结果相加在一起,形成输出[6,7,5,4]。

        然而上图中存在一个问题,即无论输入特征通道数为多少,输出 特征通道数一定为1,如上图中卷积运算后得到的输出特征维度为 1×2×2。如何改变输出特征的通道数呢?深度学习中采用的方法是堆叠卷积核,即一个卷积层存在多个卷积核,卷积核的数目对应了输出特征的通道数。举例来说,若需要一个维度为3×2×2的输出,则该卷 积层需要有3个上图中的卷积核,如下图所示。 总结来说,卷积层中卷积核的数目等于输出特征的通道数,卷积核的通道数等于输入特征的通道数。现在给出一般性的表达,若输入 特征的维度为C×H × W ,输出特征通道数为 D ,卷积核大小为 K × K , 则该卷积层的权重维度为D × C × K × K ,偏置维度为 D × C ,总参数量为两者之和,即
D × C ×( K × K +1)。

        从上面的计算过程可以得到卷积层相对于全连接层的一些优势, 比如卷积层保留了空间位置信息,充分利用了自然图片中空间局部的相关性。在卷积操作中通过参数共享的方式大大减小了参数量。此外 卷积层能够很好地表达多种特征,可以将卷积层中的多个卷积核视为不相关的特征提取器。假设存在一个人脸识别模型,其第一个卷积核判断该人物是否为女性,第二个卷积核判断其是否为长发,第三个卷积核判断其肤色,多个卷积核结合在一起,综合得到该人物不同属性的输出特征,其可以作为身份判别的依据。值得注意的是,上例只是理想情况,实际上卷积层会存在信息冗余,导致输出特征在两个不同的通道上具有高度的相关性。
        在实际应用中,卷积核的大小一般为3,5,7等奇数,小尺寸卷 积在网络中更为常见。小卷积将会导致卷积层看到的输入范围变小 了,比如对于人脸图像而言,可能3×3的大小内所有像素的颜色都是一样的,卷积核看到的也就是一个单纯的色块,而不包含有助于分类 的信息。相反的,如果卷积的尺寸变大,它能够看到整张人脸,这时 候才可以学习到一些有价值的信息,这就是感受野的重要性。但小卷 积带来的感受野问题可以通过堆叠卷积层来实现。举例来说,如下图所示分别是一个大小为5×5的卷积核和两个大小为3×3的卷积核。可以看到,它们的运算结果尺寸相同,因此最后两者输出特征的感受野是相同的,所以堆叠小卷积能够取得和大卷积相同的感受野
但是小卷积的优势在于其参数量更小,比如在不考虑偏置项时,大小为5×5的卷积核的参数为25个,两个大小为3×3的卷积核的参数一共为18个。随着深度的堆叠,小卷积参数量的优势将体现得更加明显,所以采用小尺寸卷积是非常常见的做法。

3.池化层

        池化层又被称为下采样层,它一般处于连续的卷积层之间, 用来降低信息冗余,实现特征压缩 。常见的池化操作分为最大池化和平均池化两种,如下图所示。图中选用的池化窗口大小为2×2,步长为2。池化层和卷积层同理,在宽和高为6×6的输入特征上,横纵向只需要移动3次即可完成池化操作。平均池化是选择窗口中所有值的平均值作为当前位置的响应,最大池化是选择当前窗口中的最大值作为当前位置的响应,所以池化层是一个无参数的层。在池化步长方面,一般取2较为常见,池化窗口的大小可按需设定。当池化窗口大小等于输入信号的大小时,又被称为全局池化。
        值得注意的是,在图像上常使用的池化为二维池化,即不对通道维进行池化。举例来说,当输入特征大小为4×6×6,池化窗口大小为2×2,池化步长为2时,得到的输出特征大小为4×3×3,输出特征的通道维数仍然和输入特征保持一致。
        除上述下采样和降维的作用外,池化层也引入了不变性。这里的不变性代指平移不变性和旋转不变性等。举例来说,假设存在两张图片,它们的内容一致,但第二张图片相对第一张图片向右平移了一 些。对于卷积特征来说,其结果就是第一张图片的特征相对于第二张图片的特征也向右平移了一些。但如果应用最大池化,虽然最大值向右平移了,但只要它仍然位于池化窗口的范围内,那么经过池化层,第一张图片的特征能够和第二张图片保持一致。同时因为深度特征的感受野比较大,对大感受野的输入特征进行平均池化或最大池化,一 定程度上相当于允许了输入图片在经过平移和旋转后仍能获得相对固定的表达。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/218707.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

初级数据结构(五)——树和二叉树的概念

文中代码源文件已上传&#xff1a;数据结构源码 <-上一篇 初级数据结构&#xff08;四&#xff09;——队列 | NULL 下一篇-> 1、树结构&#xff08;Tree&#xff09; 1.1、树结构的特点 自然界中的树由根部开始向上生长&#xff0c;随机长出分支&…

ArcGIS Pro SDK文件选择对话框

文件保存对话框 // 获取默认数据库var gdbPath Project.Current.DefaultGeodatabasePath;//设置文件的保存路径SaveItemDialog saveLayerFileDialog new SaveItemDialog(){Title "Save Layer File",OverwritePrompt true,//获取或设置当同名文件已存在时是否出现…

鸿蒙开发编辑器设置

首先需要知道如何打开设置页面&#xff0c;以下所有设置都需要在设置界面中进行修改&#xff0c;有三种方式可以打开&#xff0c; 1、编辑器左上角file菜单下的Setting菜单。 2、编辑器右上角的设置按钮 3、按快捷键 ctrlalts 注意不要和其他软件案件重复。 一、设置每次打开…

Netty常见的设计模式

简介 设计模式在软件开发中起着至关重要的作用&#xff0c;它们是解决常见问题的经过验证的解决方案。而Netty作为一个优秀的网络应用程序框架&#xff0c;同样也采用了许多设计模式来提供高性能和可扩展性。在本文中&#xff0c;我们将探讨Netty中使用的一些关键设计模式&…

记录一次API报文替换点滴

1. 需求 各位盆友在日常开发中&#xff0c;有没有遇到上游接口突然不合作了&#xff0c;临时需要切换其他接口的情况&#xff1f;这不巧了&#xff0c;博主团队近期遇到了&#xff0c;又尴尬又忐忑。 尴尬的是临时通知不合作了&#xff0c;事前没有任何提醒&#xff1b; 忐忑…

CentOS关闭 swap分区

临时关闭swap分区: swapoff -a # 永久关闭swap分区: sed -ri s/.*swap.*/#&/ /etc/fstab 或者 vim /etc/fstab free -m

MyBatis 四大核心组件之 ParameterHandler 源码解析

&#x1f680; 作者主页&#xff1a; 有来技术 &#x1f525; 开源项目&#xff1a; youlai-mall &#x1f343; vue3-element-admin &#x1f343; youlai-boot &#x1f33a; 仓库主页&#xff1a; Gitee &#x1f4ab; Github &#x1f4ab; GitCode &#x1f496; 欢迎点赞…

深入理解JVM设计的精髓与独特之处

这是Java代码的执行过程 从软件工程的视角去深入拆解&#xff0c;无疑极具吸引力&#xff1a;首个阶段仅依赖于源高级语言的细微之处&#xff0c;而第二阶段则仅仅专注于目标机器语言的特质。 不可否认&#xff0c;在这两个编译阶段之间的衔接&#xff08;具体指明中间处理步…

Python函数和模块的使用

我的博客 文章首发于公众号&#xff1a;小肖学数据分析 在开发过程中&#xff0c;函数和模块帮助我们将复杂的代码逻辑分解为可管理的部分&#xff0c;提升代码的可读性、可维护性和重用性。 本文将介绍如何在Python中有效利用函数和模块&#xff0c;提供详细的示例。 函数的…

el-date-picker 选择一个或多个日期

el-date-picker可选择多个日期 type“dates” 加个s即可 <div><span>el-date-picker选择多个日期</span><el-date-pickertype"dates"v-model"dateList"placeholder"选择一个或多个日期"></el-date-picker></di…

Graphics Profiler 使用教程

GraphicsProfiler 使用教程 1.工具简介&#xff1a;2.Navigation介绍2.1.打开安装好的Graphics Profiler。2.2.将手机连接到计算机&#xff0c;软件会在手机中安装一个GraphicsProfiler应用(该应用是无界面的&#xff09;。2.3.Show files list2.4.Record new trace2.4.1.Appli…

AcWing 1250. 格子游戏(并查集)

题目链接 活动 - AcWing本课程系统讲解常用算法与数据结构的应用方式与技巧。https://www.acwing.com/problem/content/1252/ 题解 当两个点已经是在同一个连通块中&#xff0c;再连一条边&#xff0c;就围成一个封闭的圈。一般用x * n y的形式将&#xff08;x, y&#xff0…

linux性能优化-上下文切换

如何理解上下文切换 Linux 是一个多任务操作系统&#xff0c;它支持远大于 CPU 数量的任务同时运行&#xff0c;这是通过频繁的上下文切换、将CPU轮流分配给不同任务从而实现的。 CPU 上下文切换&#xff0c;就是先把前一个任务的 CPU 上下文&#xff08;CPU 寄存器和程序计数…

【网络安全技术】电子邮件安全PGP,SMIME

一、PGP&#xff08;Pretty Good Privacy&#xff09; PGP是一种邮件加密手段&#xff0c;他在发邮件一方加密&#xff0c;然后发给发送方邮件服务器&#xff0c;发送方邮件服务器再发送给接收方邮件服务器&#xff0c;然后接收方再从接收方邮件服务器pop出来&#xff0c;这整…

docker-compose单机容器编排

Dockerfile:先配置好文件&#xff0c;然后build&#xff0c;镜像-------->容器。 docker-conpose 既可以基于dockerfile,也可以基于镜像&#xff0c;一键式拉起镜像和容器。 docker-compose核心就是yml文件&#xff0c;可以定义容器的一切。通过yml配置&#xff0c;直接运行…

labelme标注json文件检查标注标签(修改imageWidth,imagePath,imageHeight)

# !/usr/bin/env python # -*- encoding: utf-8 -*- #---wzhimport os import json# 这里写你自己的存放照片和json文件的路径 json_dir =rC:\Users\Lenovo\Desktop\json3 json_files = os.listdir(json_dir

Python+Appium自动化测试之元素等待方法与重新封装元素定位方法

在appium自动化测试脚本运行的过程中&#xff0c;因为网络不稳定、测试机或模拟器卡顿等原因&#xff0c;有时候会出现页面元素加载超时元素定位失败的情况&#xff0c;但实际这又不是bug&#xff0c;只是元素加载较慢&#xff0c;这个时候我们就会使用元素等待的方法来避免这种…

flutter 代码混淆

Flutter 应用混淆&#xff1a; Flutter 应用的混淆非常简单&#xff0c;只需要在构建 release 版应用时结合使用 --obfuscate 和 --split-debug-info 这两个参数即可。 –obfuscate --split-debug-info 用来指定输出调试文件的位置&#xff0c;该命令会生成一个符号映射表。目前…

Idea执行bat使用maven打包springboot项目成docker镜像并push到Harbor

如果执行以下命令失败&#xff0c;先把mvn的-q参数去掉&#xff0c;让错误输出到控制台。 《idea配置优化、Maven配置镜像、并行构建加速打包、解决maven打包时偶尔几个文件没权限的问题》下面的使用company-repo私有仓库和阿里云镜像仓库同时使用的配置参考。 bat echo off …

超详细!大模型面经指南(附答案)

大模型应该算是目前当之无愧的最有影响力的AI技术。它正在革新各个行业&#xff0c;包括自然语言处理、机器翻译、内容创作和客户服务等&#xff0c;成为未来商业环境的重要组成部分。 截至目前大模型已超过100个&#xff0c;大模型纵横的时代&#xff0c;不仅大模型越来越卷&…