【数之道 08】走进“卷积神经网络“，了解图像识别背后的原理

【数之道 08】走进“卷积神经网络“，了解图像识别背后的原理

news/2024/12/23 19:20:20/文章来源:https://blog.csdn.net/weixin_46050242/article/details/133913585

卷积神经网络

CNN模型的架构
Cnn 的流程
- 第一步提取图片特征
- - 提取特征的计算规则
- 第二步最大池化
- 第三步扁平化处理
- 第四步数据条录入全连接隐藏层

b站视频

CNN模型的架构

图片由像素点组成，最终成像效果由背后像素的颜色数值所决定的

在这里插入图片描述
有这样的一个66的区域，0设置为黑色，1设置为白色，最终呈现的效果就很像数字7

cnn模型可以告诉我们这样一个 66的像素图是不是数字7，或者返回它属于0-9的概率分别为多少

Cnn 的流程

第一步提取图片特征

在这个过程中，我们需要使用卷积核，也可以称为特征过滤器
在这里插入图片描述

提取特征的计算规则

在这里插入图片描述
垂直特征很好的被提取，而垂直特征没被提取
原因是像素图从66，降维成44，边缘特征丢失了

在这里插入图片描述
为了解决边缘特征提取的问题，可以使用padding的扩充方法，66扩充为88，扩充部分的像素值设为0，

第二步最大池化

目的是将图片的数据进一步压缩，仅反应图中最突出的特点
在这里插入图片描述
66，用22的网格分成3*3，然后提取每一部分的最大值

第三步扁平化处理

在这里插入图片描述
把两个3*3的像素图叠加，转化成一维的数据条

第四步数据条录入全连接隐藏层

最终产生输出结果，扁平化之后的流程与ANN模型完全一致

在这里插入图片描述
全连接隐藏层：任意一个神经元都与前后层的所有神经元相连接，来保证最终的输出值是基于图片整体信息的结果

再输出阶段：可以使用sigmoid激活函数返回0，1代表该图片是否是7的概率
也可以使用Softmax函数返回它分别属于0-9的概率

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/165457.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

YOLOv5改进实战 | 更换主干网络Backbone（三）之轻量化模型Shufflenetv2

YOLOv5改进实战 | 更换主干网络Backbone（三）之轻量化模型Shufflenetv2

前言轻量化网络设计是一种针对移动设备等资源受限环境的深度学习模型设计方法。下面是一些常见的轻量化网络设计方法：网络剪枝：移除神经网络中冗余的连接和参数，以达到模型压缩和加速的目的。分组卷积：将卷积操作分解为若干个较小的卷积操作，并将它们分别作用于输入的不…

阅读更多...

2023年中国纸箱机械优点、市场规模及发展前景分析[图]

2023年中国纸箱机械优点、市场规模及发展前景分析[图]

纸箱机械行业是指涉及纸箱生产和加工的机械设备制造、销售和相关服务的产业。这个行业的主要任务是设计、制造和提供用于生产各种类型和规格纸箱的机械设备，以满足包装行业对纸箱的不同需求。纸箱机械行业优点资料来源：共研产业咨询（共研网…

阅读更多...

SpringBoot + MyBatis 在 jar 中可以启动但是 Idea中无法启动的原因

SpringBoot + MyBatis 在 jar 中可以启动但是 Idea中无法启动的原因

现象在idea中启动始终卡住，查看线程堆栈发现一直在mybatis的处理过程中，细究了一下堆栈发现mybatis有使用远程方式加载类的情况，并且此时cpu会飙升， 在命令行中使用java -jar 的形式可以正常启动，但是在idea中启动始…

阅读更多...

在 Visual Studio Code (VS Code) 中设置

在 Visual Studio Code (VS Code) 中设置

在 Visual Studio Code (VS Code) 中设置代理服务器的详细教程如下： 打开 Visual Studio Code。在顶部菜单栏中，点击 "File"（文件） > "Preferences"（首选项） > "Settings…

阅读更多...

解剖—单链表相关OJ练习题

解剖—单链表相关OJ练习题

目录一、移除链表元素二、找出链表的中间节点三、合并两个有序链表四、反转链表五、求链表中倒数第k个结点六、链表分割七、链表的回文结构八、判断链表是否相交九、判断链表中是否有环(一) 十、判断链表中是否有环(二) 注：第六题和第七题牛…

阅读更多...

win11快速打开蓝牙设置的方法

win11快速打开蓝牙设置的方法

win11快速打开蓝牙设置的方法 Windows 11 中快速连接蓝牙设备的 3 种方法！_哔哩哔哩_bilibili 如何为Windows设置快捷键？_百度知道 (baidu.com) Win11怎么隐藏文件夹?Win11通过命令隐藏文件夹的方法_windows11_Windows系列_操作系统_脚本之家 (jb51.net…

阅读更多...

《动手学深度学习 Pytorch版》 9.5 机器翻译与数据集

《动手学深度学习 Pytorch版》 9.5 机器翻译与数据集

机器翻译（machine translation）指的是将序列从一种语言自动翻译成另一种语言，基于神经网络的方法通常被称为神经机器翻译（neural machine translation）。 import os import torch from d2l import torch as d2l9.5.1 …

阅读更多...

Kotlin(七) 接口

Kotlin(七) 接口

接口是用于实现多态编程的重要组成部分。我们都知道，Java是单继承结构的语言，任何一个类最多只能继承一个父类，但是却可以实现任意多个接口，Kotlin也是如此。首先创建一个Study接口，在创建文件窗口选择“Interface…

阅读更多...

面对DDoS和APT攻击，我们该如何有效防御？

面对DDoS和APT攻击，我们该如何有效防御？

关于DDoS（Distributed Denial of Service）分布式拒绝服务攻击，是指攻击者通过技术手段，在很短的时间内对目标攻击网站发出大量请求，极大地消耗相关网站的主机资源，导致其无法正常服务。打个比方来说&#…

阅读更多...

AI驱动的未来：探索人工智能的无限潜力 | 开源专题 No.39

AI驱动的未来：探索人工智能的无限潜力 | 开源专题 No.39

这一系列开源项目代表着多个领域的最新技术成果，包括深度学习、自然语言处理、计算机视觉和分布式训练。它们共同的特点是致力于教育、资源分享、开源精神、多领域应用以及性能和效率的追求，为广大开发者、研究者和学生提供了宝贵的工具和知识&#xff0…

阅读更多...

开源网安受邀参加数字安全高峰论坛，为数字经济发展保驾护航

开源网安受邀参加数字安全高峰论坛，为数字经济发展保驾护航

10月19日，“提升数字安全技术，护航数字经济发展”高峰论坛在常州创意产业园圆满完成。本次论坛由常州国家高新区管委会、常州市工业和信息化局、常州市大数据管理中心主办，聚焦“数据安全”主题，邀请了超百位专家及企业代表共同…

阅读更多...

工业交换机定制化解决方案：光路科技的工业PoE交换机

工业交换机定制化解决方案：光路科技的工业PoE交换机

PoE交换机能代替普通工业交换机使用吗？ Power over Ethernet (PoE)交换机和普通工业交换机在某些情况下可以互相替代，但有些情况下则不太适合。PoE交换机具有额外的供电能力，用于同时为网络设备提供数据和电力。如果您的应用中只需要传输数据…

阅读更多...

opencv入门到精通——图片，视频，摄像头的读取与保存

opencv入门到精通——图片，视频，摄像头的读取与保存

简介 OpenCV是一个流行的开源计算机视觉库，由英特尔公司发起发展。它提供了超过2500个优化算法和许多工具包，可用于灰度、彩色、深度、基于特征和运动跟踪等的图像处理和计算机视觉应用。OpenCV主要使用C语言编写，同时也支持Python、Java、C等…

阅读更多...

C++ 友元函数和友元类

C++ 友元函数和友元类

前言在本文中，您将学习在C 中创建友元函数和友元类，并在程序中有效地使用它们。OOP的重要概念之一是数据隐藏，即非成员函数无法访问对象的私有或受保护的数据。但是，有时这种限制可能迫使程序员编写冗长而复杂的代码。因此&#…

阅读更多...

AJAX: 对话框大全

AJAX: 对话框大全

AJAX:$.ajax({url: "/admin/cutting/getDataWeek",type: "GET",data:{},dataType:json,success: function (res) {if (res.code 1) {}},error:function (error) {console.log(请求失败);console.log(error);}}); $(.sub).unbind(click).click(funct…

阅读更多...

Note——torch.size() umr_maximum() array.max() itertools.product()

Note——torch.size() umr_maximum() array.max() itertools.product()

torch.size Problem TypeError: ‘torch.Size’ object is not callable Reason Analysis torch.Size函数不可调用因为torch只可以.size() 或 shape Solution 将y.shape()替换为y.size() 或 y.shape ytorch.normal(0,0.01,y.size())2 return umr_maximum(a, axis, None…

阅读更多...

【斗罗二】天梦哥告白冰帝，唐三再返场，雨浩通过冰帝考验，觉醒新武魂

【斗罗二】天梦哥告白冰帝，唐三再返场，雨浩通过冰帝考验，觉醒新武魂

Hello,小伙伴们，我是小郑继续为大家深度解析斗罗大陆2绝世唐门国漫资讯。斗罗大陆动画第二部绝世唐门第19集已经更新了，全都是霍雨浩与天梦哥在极北之地，吸引冰帝加入造神计划的过程。不仅有天梦哥的爱情宣言告白，唐三也再次限时…

阅读更多...

Python学习笔记——类、魔术方法

Python学习笔记——类、魔术方法

食用说明：本笔记适用于有一定编程基础的伙伴们。希望有助于各位！ 类类的运用很常见：在大部分情况下，对一些特有的对象，可以使用特定的类来指向它： class Person:name unknownage -1sex 0partner No…

阅读更多...

逗号表达式

逗号表达式

#include<stdio.h> int cmp() {return(2,1); } int main() {int z cmp();printf("%d",z);return 0; } 逗号表达式括号里的优先级是自左向右，最后一个值为最终的结果。

阅读更多...

反向传播back propagation

反向传播back propagation

深度学习概述决定要怎么连接这些neuron的时候就已经确定了function set 相比于之前做logistic regression，linear regression的时候，换一个方式来决定function set 比较大，包含了logistic regression，linear regression没法包含…

阅读更多...

最新文章

推荐文章