023:到底什么是感受野?

本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。

合集完整版请查看这里。

在前面介绍卷积算法时,一直在强调一个内容,那就是卷积算法的运算过程是——

卷积核在输入图像上滑动扫描的过程。

在每一次扫描时,可以把卷积核看做一个窗口,透过这个窗口可以看到的输入图像的范围,就被称为感受野,也就是卷积核在每一次扫描过程中覆盖到的图像视野。

这个概念很好理解,但是有必要对这个概念再深入介绍一下,因为感受野这一概念,和很多神经网络结构和特性都有着千丝万缕的关系。

重温卷积的计算过程

你应该可以从上图中找到感受野的位置了。
在这里插入图片描述

在上图中,感受野就是每次卷积核移动时,投影在图片的一个 3x3 的正方形范围,透过他,你可以看到输出图像中的每一个像素与输入图像中的哪些像素有关。

换句话说,它表示一个输出像素透过卷积核“看到”的输入图像中区域的大小,注意是从输出来看的。

上图右侧图像是输出特征图,其输出最左上角的像素点为12.0,它透过3x3的矩阵看到的是输入图像左上角的3x3的像素矩阵;最后一个输出14.0,透过3x3的矩阵看到的是输入图像右下角的3x3的像素矩阵,这个3x3的像素矩阵就是这个卷积的感受野。

感受野的意义

可以这么说,感受野影响了神经网络对于图像的理解和图像特征的提取。

一个大的感受野可以使卷积看到输入图像上更大的像素范围,更好地理解图像的全局信息,从而提取全局特征,如物体的形状和轮廓。

而较小的感受野只能捕捉到图像的局部特征,如边缘或纹理。

因此,在很多神经网络中,往往会出现不同大小的卷积核,比如有 3x3 的卷积核,也有5x5的卷积核。

不同大小的卷积核的目的,就是为了提取不同尺度范围内的特征,让神经网络既可以学到图像的细节、又可以看到图像的轮廓。

就和人眯着眼睛看细节,张大眼睛看全局图像一样。

为什么2个3x3的卷积可以替换一个5x5的卷积

如果你看过一些论文,可能经常会看到一个操作——为了优化神经网络的性能,可以将其中一个大的卷积核用几个小的卷积核来代替。
在这里插入图片描述

比如,一个5x5的卷积就可以用两个3x3的卷积来代替。

之所以可以这样做,是因为从输出像素来看,两个3x3的卷积和一个5x5的卷积,在最初的输入上具有相同的感受野。

而这样做,除了感受野相同,实现的效果类似之外,还有其他的好处:

好处1

两个3x3的卷积所需要的参数量要比一个5x5的卷积参数量少。这里忽略通道的存在,两个3x3的卷积核参数量为 3x3 + 3x3 = 18,而一个 5x5 的参数量则为25。所以将一个5x5的卷积替换为两个3x3的卷积,有利于加快卷积运算,减少卷积参数的内存占用。

好处2

一个卷积变为两个卷积,可以加深神经网络的层数,从而在卷积后面引入非线性层(比如 Relu层),增加卷积神经网络的非线性能力。

总的来说,卷积的感受野就像是一扇窗户:

你站在小窗户前,就只能看到窗外的一小部分景色,此时你就是一个局部感知。但如果你站在大窗户前,你可以看到更广阔的景色,此时你拥有一个更大的感受野,你就拥有一个全局感知。

Resnet50 模型提取图像特征,就是通过网络中或大或小尺寸的卷积核提取出不同尺度的下的特征,最后通过全连接层的操作将提取到的特征进一步融合,达到图像识别的目的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6523.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

BGP(1)邻居建立,路由宣告

拓扑如图,配置地址,配置ospf并宣告相应地址 1、观察bgp邻居的建立 a R1和R3建立bgp邻居 抓包可以看到TCP的三次握手,端口号179 可以看到R1和R3成功建立了IBGP邻居 b 缺省情况下,BGP使用报文出接口作为TCP连接的本地接口&#x…

Python 预训练:打通视觉与大语言模型应用壁垒——Python预训练视觉和大语言模型

大语言模型是一种由包含数百亿甚至更多参数的深度神经网络构建的语言模型,通常使用自监督学习方法通过大量无标签文本进行训练,是深度学习之后的又一大人工智能技术革命。 大语言模型的发展主要经历了基础模型阶段(2018 年到2021年)、能力探索阶段(2019年…

【数据库】详解MySQL数据库中的事务与锁

目录 1.数据库事务 1.1.事务的四大特性 1.2.事务开启的方式 1.3.读一致性问题及其解决 2.MVCC解决读一致性问题原理 2.1.MVCC概念 2.2.准备环境 3.MySQL中的锁 3.1.行锁之共享锁 3.2.行锁之排它锁 1.数据库事务 数据库事务(Transaction)是一种…

C语言文件操作

本文重点: 什么是文件 文件名 文件类型 文件缓冲区 文件指针 文件的打开和关闭 文件的顺序读写 文件的随机读写 文件结束的判定 什么是文件 磁盘上的文件是文件。 但是在程序设计中,我们一般谈的文件有两种:程序文件、数…

Ubuntu24.04初始化MySQL报错 error while loading shared libraries libaio.so.1

Ubuntu24.04初始化MySQL报错 error while loading shared libraries: libaio.so.1 问题一:libaio1不存在 # 提示libaio1不存在 [rootzabbix-mysql-master.example.com x86_64-linux-gnu]#apt install numactl libaio1 Reading package lists... Done Building depe…

『 实战项目 』Cloud Backup System - 云备份

文章目录 云备份项目服务端功能服务端功能模块划分客户端功能客户端模块划分 项目条件Jsoncpp第三方库Bundle第三方库httplib第三方库Request类Response类Server类Client类搭建简单服务器搭建简单客户端 服务端工具类实现 - 文件实用工具类服务器配置信息模块实现- 系统配置信息…

No.36 学习 | Python 函数:从基础到实战

最近我在学 Python 编程,今天可算是狠狠钻研了一把 Python 里的函数,感觉脑袋里的知识又充实了不少,赶紧来记一记。 一、Python函数基础概念 (一)pass语句:代码块的“占位符” 在编写代码时,有…

easyexcel读取写入excel easyexceldemo

1.新建springboot项目 2.添加pom依赖 <name>excel</name> <description>excelspringboot例子</description><parent> <groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId&…

Qt 5.14.2 学习记录 —— 십유 布局管理器

文章目录 1、QVBoxLayout2、QHBoxLayout3、QGridLayout4、QFormLayout5、QSpacerItem 布局管理器是为了让程序员不需要自己决定控件的绝对位置&#xff0c;而是通过布局管理器方便地放置 1、QVBoxLayout 垂直布局管理器 #include <QPushButton> #include <QVBoxLayo…

Markdown Viewer 浏览器, vscode

使用VS Code插件打造完美的MarkDown编辑器&#xff08;插件安装、插件配置、markdown语法&#xff09;_vscode markdown-CSDN博客 右键 .md 文件&#xff0c;选择打开 方式 &#xff08;安装一些markdown的插件) vscode如何预览markdown文件 | Fromidea GitCode - 全球开发者…

每日十题八股-2025年1月23日

1.快排为什么时间复杂度最差是O&#xff08;n^2&#xff09; 2.快排这么强&#xff0c;那冒泡排序还有必要吗&#xff1f; 3.如果要对一个很大的数据集&#xff0c;进行排序&#xff0c;而没办法一次性在内存排序&#xff0c;这时候怎么办&#xff1f; 4.面试官&#xff1a;你的…

H3C-无线WLAN配置案例(二层隧道转发)

目录 1.无线wlan产生背景:2.网络拓扑:3.网络简述:4.网络配置:4.1 网络基础配置4.2 无线wlan二层隧道转发配置4.3 无线wlan验证: 1.无线wlan产生背景: 无线WLAN&#xff08;无线局域网&#xff09;的产生背景主要源于以下几个方面的需求和技术发展&#xff1a;移动性和便捷性需…

HarmonyOS Next构建工具 lycium 原理介绍

HarmonyOS Next构建工具 lycium 原理介绍 背景介绍 HarmonyOS Next中很多系统API是以C接口提供&#xff0c;如果要使用C接口&#xff0c;必须要使用NAPI在ArkTS与C间交互&#xff0c;这种场景在使用DevEco-Studio中集成的交叉编译工具&#xff0c;以及cmake构建工具就完全够用…

设计模式的艺术-职责链模式

行为型模式的名称、定义、学习难度和使用频率如下表所示&#xff1a; 1.如何理解职责链模式 最常见的职责链是直线型&#xff0c;即沿着一条单向的链来传递请求。链上的每一个对象都是请求处理者&#xff0c;职责链模式可以将请求的处理者组织成一条链&#xff0c;并让请求沿着…

js学习笔记(2)

一、函数 1.JavaScript 函数语法 函数就是包裹在花括号中的代码块&#xff0c;前面使用了关键词 function&#xff1a; function functionname() {// 执行代码 } 当调用该函数时&#xff0c;会执行函数内的代码。 可以在某事件发生时直接调用函数&#xff08;比如当用户点…

洛谷刷题1-3

比较巧妙&#xff0c;求最小公倍数&#xff0c;看多少个数一次循环&#xff0c;直接求解就好了&#xff0c;N的数量级比较大&#xff0c;一层循环也会超时&#xff0c;也用了点双指针的想法&#xff08;归并排序&#xff09; 这里很大的问题&#xff0c;主要是cin输入的时候遇到…

2025年数学建模美赛:A题分析(1)Testing Time: The Constant Wear On Stairs

2025年数学建模美赛 A题分析&#xff08;1&#xff09;Testing Time: The Constant Wear On Stairs 2025年数学建模美赛 A题分析&#xff08;2&#xff09;楼梯磨损分析模型 2025年数学建模美赛 A题分析&#xff08;3&#xff09;楼梯使用方向偏好模型 2025年数学建模美赛 A题分…

云原生时代,如何构建高效分布式监控系统

文章目录 一.监控现状二.Thanos原理分析SidecarQuerierStoreCompactor 三.Sidecar or ReceiverThanos Receiver工作原理 四.分布式运维架构 一.监控现状 Prometheus是CNCF基金会管理的一个开源监控项目&#xff0c;由于其良好的架构设计和完善的生态&#xff0c;迅速成为了监控…

每天五分钟深度学习pytorch:基于VGG神经网络完成CAFIR10的识别

本文重点 前面的所有模型我们都是使用VGG跑了mnist数据集,本次我们换一个数据集,我们使用CAFIR数据集,这个数据集我们前面介绍过,它和mnist不一样了,mnist是灰度图,这个是彩色图,所以它的通道数是3,这样我们再构建卷积神经网路的时候,第一个卷积层的输入通道数就应该…

力扣707题(2)——设计链表

#题目 #3,5和6的代码 今天看剩下几个题的代码&#xff0c;1,2,4的代码已经在上篇博客写过了想看的小伙伴移步到&#xff1a; 力扣707题——设计链表-CSDN博客 //第3题头插法 void addAtHead(int val){ //记录头结点ListNode nhead; //新节点的创建,并让它指向原本头结点的后…