卷积、卷积图像操作和卷积神经网络

好多内容直接看书确实很难坚持,就比如这个卷积,书上的一大堆公式和图表直接把人劝退,我觉得一般的学习流程应该是自顶向下,先整体后局部,先把握大概再推敲细节的,上来就事无巨细地展示对初学者来说很痛苦。
所以我先把我学习的结果通俗总结一下,卷积是将输入结合其他的节点进行一定处理,从而得到想要的结果,卷积操作多用于图像中,可以实现图像的平滑,特征的提取等。

卷积

数学上表达为积分公式(积分号)f(x)g(n-x)dx
其中f表示为输入,g表示为输出,可以结合问题理解该式的物理意义:
一个人一直进食,其进食数量的曲线就可以表示为f,与此同时也在一直消化食物,且消化速度只按比例,表示为g;问任意时间t胃部食物数量。
一个时刻进食剩余为f(x)g(n-x)//x时刻的进食量乘经过n-x时间的消化率,故在t时刻胃部食物剩余量为上式的积分,f与g的对应关系如下图:
f(x)与g(x)对应关系
卷积的卷应该体现在g的反转上
卷积体现
即,卷积可以用于一个输入不稳定但输出稳定的系统求任意时刻的存量。

图像卷积操作

卷积在实践中的应用主要是用于识别图像内容,在识别之前需要先对图像进行卷积操作,但该操作步骤与上面提到的不同;图像卷积操作是用3×3矩阵与图像进行先乘再加,图像经过处理会缩小一圈,外部直接赋0,过程展示如下:
图像卷积操作
该矩阵称为卷积核,该步骤的作用是将一个像素点与其他的像素点通过卷积核关联起来。
比如每个元素均为1/9也就是平滑卷积核,使用平滑卷积核卷积后的图像会使图像整体更平滑,因为他缩小了像素直接的差距,用平均数来代替。

卷积的另一个作用

通过这个例子我们看出卷积不知用于系统的求存量,在图像中也能通过卷积核时相邻像素点产生关联,此时的f是像素点,卷积核是g,即周围的像素点共同影响当前像素点,而g决定具体如何影响。

图像识别

本来这部分应该叫卷积神经网络的,但是一想神经网络没讲到,只是单单写了最前的一步,还是该叫图像识别吧。
现在的图像验证码们人眼看来识别很简单,但是为什么能防住计算机呢?就是因为他们难以从图像中识别出物体,但随着人工智能的发展,图像识别对计算机来说也是洒洒水了。

图像识别原理

计算机不能像人一样感性推断出图像内容,它们识别物体主要是依赖特征值,比如A上的“尖或者三角”、Z的两个大折线、老虎头上的“王”字等等,甚至目前的人脸识别也是如此,计算机通过特征识别出我们的五官后,对我们的眼距,鼻梁等特征再进行对比从而判断身份。
说着很简单,但每次判断都不简单,不同的字符和事物可能有不同的和相同的特征,这时又该如何是好呢?我看过一篇论文,里面说到每个特征对应一个“特征鬼”,当特征被满足时,该“特征鬼”就会尖叫,又有最上层的决策系统看哪个事物的“鬼”叫的最响来作出判断。

卷积操作提取特征

说白了还是利用卷积核进行操作,只是卷积核的取值发生了变化,比如:

1	  1   1
0	  0	0
-1 -1 -1

作为卷积核,就只提取水平上的特征值,此时卷积核称为水平/垂直过滤器,起到过滤图片保存特征的作用,同理

1  -1  -1
-1  1  -1 
-1  -1  1

可以判断图像是否为一条对角线,等等,从而生成特征矩阵交由后续算法判断。

图像识别卷积总结

实质还是卷积和也就是g的选取,如果g选的合适,就可以把对我们有用的特征保存下来。

总结

归根到底就是f×g,通过对g不同形式不同值的选取,在多角度多维度上筛选f,得到我们想要角度的特征值,再加上求和加权平均消除误差。也难怪人工智能喜欢用,这一个方法就能提取出一个特征值发一篇文章,基于人工智能的······研究,其实就是用个CNN跑出一组数据处理一下,找找关系,下个结论。
讲到这我又要喷人工智能了,在我目前来看,我们对自己意识的研究和脑科学尚不充足完备的情况下,所谓人工智能根本名不副实,现在已有的这些模型不过是基于大数据的统计分类的机器而已。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/200110.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2021年03月 Scratch(二级)真题解析#中国电子学会#全国青少年软件编程等级考试

Scratch等级考试(1~4级)全部真题・点这里 一、单选题(共25题,每题2分,共50分) 第1题 小猫在沙漠中旅行好不容易找到了一杯水,初始位置如下图所示,下面哪个程序可以帮助它成功喝到水? A: B: C: D:

OpenLayers实战,WebGL图层根据Feature要素的变量动态渲染多种颜色的三角形,适用于大量三角形渲染不同颜色

专栏目录: OpenLayers实战进阶专栏目录 前言 本章使用OpenLayers根据Feature要素的变量动态渲染不同颜色的三角形。 通过一个WebGL图层生成四种不同颜色的图形要素,适用于WebGL图层需要根据大量点要素区分颜色显示的需求。 更多的WebGL图层使用运算符动态生成样式的内容将会…

手机弱网测试工具:Charles

我们在测试app的时候,需要测试弱网情况下的一些场景,那么使用Charles如何设置弱网呢,请看以下步骤: 前提条件: 手机和电脑要在同一局域网内 Charles连接手机抓包 一、打开Charles,点击代理,…

黑马React18: 基础Part II

黑马React: 基础2 Date: November 16, 2023 Sum: 受控表单绑定、获取DOM、组件通信、useEffect、Hook、优化B站评论 受控表单绑定 受控表单绑定 概念:使用React组件的状态(useState)控制表单的状态 准备一个React状态值 const [value, se…

万界星空科技QMS质量管理系统功能

QMS质量管理系统结合质量决策、综合质量管理、过程质量控制三个层次要素,帮助企业实现产品全寿命周期质量数据的及时、灵活、准确和全面采集。 通过质量管理软件能够实现质量数据科学处理和应用,包括数据的系统化组织、结构化存贮、便捷式查询、定制化统…

不夸张地说,这是我见过最通俗易懂的,pytest入门基础教程!

Pytest简介 Pytest is a mature full-featured Python testing tool that helps you write better programs.The pytest framework makes it easy to write small tests, yet scales to support complex functional testing for applications and libraries. 通过官方网站介绍…

京东大数据(京东数据采集):2023年Q3线上投影仪品类销售数据分析报告

11月初,某知名投影仪企业发布了2023年三季度财报。数据显示,今年第三季度,公司营收依然不客观,连续第五个季度业绩持续下滑。 从鲸参谋数据也可以看出,今年Q3,京东平台上该品牌的销量环比下滑约35%&#x…

OpenAI宫斗,尘埃落定,微软成最大赢家

周末被OpenAI董事会闹剧刷屏,ChatGPT之父Sam Altman前一天被踢出董事会,免职CEO,后一天重返OpenAI,目前结局未知。 很多同学想要围观,缺少背景知识,这里老章为大家简单介绍前因后果及涉及的人物,时间线,让大家轻松围观。 备好瓜子,开始。 1、主角 先看一张图,看一…

flink 查看写入starrocks的数据量 总行数

针对该connector: https://github.com/StarRocks/docs.zh-cn/blob/main/loading/Flink-connector-starrocks.md

深入解析Windows操作系统——概念和工具

文章目录 Windows操作系统的版本Windows NT和Windows 95基础概念和术语内核调试用户模式调试 Windows操作系统的版本 Windows NT和Windows 95 Windows NT和Windows 95之间的一些结构性差异,以及Windows NT优于Windows 95及其后续版本的一些方面: Wind…

机器学习:十大算法快速回顾

一、说明 对于机器学习的是个经典算法,本篇将展示一个回顾,注意,本篇不是具体原理信息介绍,没有代码,但是对于初学者是一个有益的导读。 二. 线性回归 2.1 算法描述 有没有想过数据奇才如何预测未来?输入线…

react 手机端 rc-table列隐藏(根据相关条件是否隐藏)、实现图片上传操作

最近公司某一项目的手机端,新增需求:table中的附件要可以编辑,并且是在特定条件下可编辑,其他仅做展示效果。 查阅官方文档,没有发现是否隐藏这一属性,通过css控制样式感觉也比较麻烦,后面发现可…

全球首款容器计算产品重磅发布,激活上云用云新范式

云布道师 10 月 31 日,杭州云栖大会上,阿里云云原生应用平台负责人丁宇宣布,阿里云容器计算服务 ACS 正式发布!ACS 将大幅降低企业和开发者用云门槛,真正将 Serverless 理念大规模落地。 容器计算服务 ACS&#xff0c…

hologres 索引与查询优化

hologres 优化部分 1 hologres 建表优化1.1 建表中的配置优化1.1 字典索引 dictionary_encoding_columns1.2 位图索引 bitmap_columns1.2.2 Bitmap和Clustering Key的区别 1.3 聚簇索引Clustering Key 1 hologres 建表优化 1.1 建表中的配置优化 根据 holo的 存储引擎部分的知…

关于在3dsmax中制作的模型导入UE后尺寸大小不对的问题

现象 在3dsmax中的基本单位为毫米 在UE中基本单位是厘米 我在3dsmax中创建一个长宽高均为1000mm的方块 然后导入到UE中的世界坐标原点 方块向X轴正方向移动100个单位100cm1000mm,按理来说,新方块的此时应该和旧方块是贴着的,但是现象确是两者…

深度学习入门:自建数据集完成花鸟二分类任务

自建数据集完成二分类任务(参考文章) 1 图片预处理 1 .1 统一图片格式 找到的图片需要首先做相同尺寸的裁剪,归一化,否则会因为图片大小不同报错 RuntimeError: stack expects each tensor to be equal size, but got [3, 667…

【VRTK】【VR开发】【Unity】7-配置交互能力和向量追踪

【前情提要】 目前为止,我们虽然设定了手模型和动画,还能够正确根据输入触发动作,不过还未能与任何物体互动。要互动,需要给手部设定相应的Interactor能力。 【配置Interactor的抓取功能】 在Hierarchy中选中[VRTK_CAMERA_RIGS_SETUP] ➤ Camera Rigs, Tracked Alias ➤ …

VBA技术资料MF85:将工作簿批量另存为PDF文件

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。我的教程一共九套,分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的入门,到…

UE4 基础篇十四:自定义插件

文末有视频地址和git地址 一、概念 虚幻里插件都是用C++写的,C++包括.h文件和.cpp文件,.h头文件通常包含函数类型和函数声明,cpp文件包含这些类型和函数的实现, 你为项目编写的所有代码文件都必须位于模块中,模块就是硬盘里的一个文件夹,包含名为“Build.cs”的C#文件…

BGP笔记实验

IGP(Interior Gateway Protocol)——内部网关协议 OSPF RIP IS-IS IGRP EIGRP EGP(External Gateway Protocol)——外部网关协议 EGP BGP——边界网关协议 AS——自治系统 由单一组织or机构独立维护的网络设备&网络资源的集合 网络范围太大 自治 AS号 为了区分不同…