吴恩达深度学习笔记(8)

计算机视觉

包括:图像分类也叫做图像识别、目标检测等

一个小的图像可能1M,但是他的像素是一个超级大向量,如果直接深度学习那么运算量会很大,因此需要运用卷积运算

卷积运算是卷积神经网络的基础单元之一。下面用边缘检测理解卷积如何进行运算。

过滤器又称为核,对于复杂的图像我们可以将其设为为参数,通过后向传播学习,自动获得。

填充

是构建深度神经网络时,需要对基本卷积进行的操作。

进行卷积的两个缺陷:

  • 1、每次卷积计算过后图像都会变小。
  • 2、图像角落或者边缘的像素在输出过程中只会被使用一次,中间像素会用到很多次,丢失了许多图片靠近边界的信息。

一种是不填充,另一种是保持输入和输出一致,所以过滤器一般都是奇数。

卷积步长

带步长的卷积是在卷积神经网络中组成基础卷积模块的另一个部分。

步长等于2时:

输入与输出的维度(向下取整)

实际真正的卷积都是将核矩阵针对水平和垂直方向做一个镜面对称(反转),因此上述的过程用的是核矩阵本身,故上述计算过程应该称为交叉相关,但是多数深度学习网络都称其为卷积

三维卷积

一个体积核可以检测一个特征,两个核检测两个特征,,,,(深度/通道)

卷积网络中的一层:

单层卷积神经网络:
利用两个不同的过滤器对三维输入进行卷积运算,的到不同的输出,最终我们要将这些输出变成单程卷积神经网络,还需要对每一个输出添加一个偏差(是一个实数,应用广播机制,对矩阵中的每一个元素添加一个偏差),可以继续添加非线性转换ReLU,最终通过添加偏差与非线性转换得到一个矩阵输出。最后将不同的输出矩阵放在一起得到一个体积输出,就是卷积神经网络的一层

将其与非卷积单层前向传播神经网络对应,卷积核类似于权矩阵,上述例子中有两个过滤器,也就是两个特征,特征使得卷积神经网络不太容易过拟合。

深度卷积神经网络ConvNet:

池化层:

深度卷积神经网络通常还使用池化层减少展示量,提高计算速度,使一些特征的检测功能更强大。

如果把4X4的区域看作某个特征的集合,即神经网络某个层中的激活状态,一个大的数字,意味着它或许检测到了一个特定的特征。池化层做的其实是,如果在过滤器中任何地方检测到了这些特征,就保留最大值,如果特征没有被检测到,可能左侧上方的四分之一区域就没有这个特征,于是那些数值的最大值仍然相当小。

池化层有一套超参(步长、尺寸),但是没有任何参数需要学习,没有需要梯度下降算法学习的东西。还有均值采样,但是没有最大化采样使用频率高。

CNN示例

受到经典神经网络的启发(LeNet-5),网络中存在很多超参数,不要试着创造自己的超参数组,而是要阅读文献,看看其他人使用的超参数。去学习一定数量的神经网络的实例,去看看别人如何做的,从中获得灵感将这些构件组合在一起

为什么卷积在神经网络中如此有用,如何将卷积放在神经网络中,如何用有标签的数据训练卷积神经网络:

卷积层相较于只有完全连接的神经层优势:参数共享与连接的稀疏性

卷积神经网络参数很少的原因有两个:

  • 参数共享:在特征检测器中,例如垂直边缘检测对于图像的一部分是有用的,那么对于另一部分可能也是有用的,所有一个卷积核循环检测图像所有位置,找到垂直的边缘
  • 避免只有相对少的参数的方法建立稀疏的联系

卷积神经网络会被用来捕捉平移不变,当一张图片移动了几个像素格,它还应该产生非常相似的特征,给他相同的标签;同时,因为使用了相同的滤网,图片的各个部分,平移之前与平移之后的图层,帮助神经网络自然而然的学会更稳定或者更佳的捕捉到平移不变需要的特性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/451378.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FastGPT本地开发 之 通过Navicat管理MongoDB、PostgreSQL数据库

1. 背景 前期已经完成FastGPT的本地化部署工作,通过Docker启动FastGPT的相关容器即可运行。(共6个容器) 2.本地化开发 2.1 前置依赖 2.2 源码拉取 git clone gitgithub.com:labring/FastGPT.git2.3 数据库管理 本地化运行的FastGPT使用…

leetcode73矩阵置零

给定一个 m x n 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 示例 1: 输入:matrix [[1,1,1],[1,0,1],[1,1,1]] 输出:[[1,0,1],[0,0,0],[1,0,1]]示例 2: 输入&…

【含开题报告+文档+PPT+源码】基于SpringBoot和Vue的编程学习系统

开题报告 随着信息技术的迅猛发展和数字化转型的深入推进,编程技能已经成为现代社会中不可或缺的一项基本能力。无论是软件开发、数据分析还是人工智能等领域,编程都扮演着至关重要的角色。因此,培养和提高编程技能对于个人职业发展和社会创…

eNSP静态路由

1、实现全网通,考虑环形拓扑的优势。 R12: [Huawei]interface GigabitEthernet 0/0/0 [Huawei-GigabitEthernet0/0/0]ip address 192.168.1.1 24[Huawei]interface GigabitEthernet 0/0/1 [Huawei-GigabitEthernet0/0/1]ip address 192.168.2.1 24[Huawei]interfa…

软件设计模式------工厂方法模式

工厂方法模式(Factory Method Pattern),又称工厂模式,也叫虚拟构造器模式(Virtual Constructor Pattern)或多态工厂模式(Polymorphic Pactory Pattern),属于类创建型模式。 我们知道…

Spring数据源对象管理:基于XML配置文件的第三方bean管理

前言 第三方资源配置管理 ioc容器和依赖管理,我们大多数管理的是自己创建的bean,如果是第三方提供的bean是如何管理,我们以数据源对象的ioc管理为例子进行说明。 步骤 第一步: 需要导入相应的依赖包(导入坐标&#xf…

解构OpenAI swarm:利用Cursor进行框架分析与示例运行

解构OpenAI SWARM:利用Cursor进行框架分析与示例运行 1. 引言 在AI技术日新月异的今天,OpenAI再次为我们带来了惊喜。SWARM框架作为其最新研究成果,正在开创多智能体协作的新纪元。本文将带您深入探索这一框架,通过Cursor工具进行代码分析,并手把手教您安装运行SWARM。无论您…

Data+AI下的数据湖和湖仓一体发展史

DataAI下的数据湖和湖仓一体发展史 前言数据湖的“前世今生”AI时代的救星:湖仓一体湖仓一体实践演进未来趋势:智能化、实时化结语 前言 数据湖?湖仓一体?这是什么高科技新名词? 别急,我们慢慢聊。想象一…

机器学习:opencv--风格迁移

目录 前言 一、代码及步骤解释 1.图片与处理 2.加载模型 3.输出图像 前言 风格迁移(Style Transfer)是一种计算机视觉技术,旨在将一种图像的艺术风格应用到另一种图像上,同时保持其内容。 一、代码及步骤解释 1.图片与处理 …

从Apple Intelligence到远程机器人手术:更快、更安全的网络成企业业务关键

过去,企业的业务模式和网络架构相对简单,数据传输量不大,远程访问需求也不多。企业对网络的要求主要集中在确保基本的连通性和可用性。如今,企业通过将产品与各项高新技术深度融合,赋予传统产品活力和竞争力。以苹果公…

web3D越来越普及来,在站显示效果上没说的

Web3D 技术为网站带来了全新的视觉体验。它能够以逼真的三维形式展示产品、场景或数据,让用户仿佛身临其境。 无论是展示复杂的机械结构、精美的艺术品,还是模拟真实的自然环境,Web3D 都能以其出色的表现力吸引用户的注意力。 在显示效果上…

国产大模型基础能力大比拼 - 计数:通义千文 vs 文心一言 vs 智谱 vs 讯飞-正经应用场景的 LLM 逻辑测试

在大语言模型(LLM)不断涌现的时代,如何评估这些国产大模型的逻辑推理能力,尤其是在处理基础计数问题上的表现,成为了一个备受关注的话题。随着越来越多的国产大模型进入市场,比较它们在不同任务中的表现尤为…

mysql数据同步ES方案---DTS

在上一篇文章中,我通过一个简单的例子实现了如何通过 Canal 实现 MySQL 数据到 Elasticsearch 的同步,以满足增量捕获和实时同步的需求。然而实际情况中,比如在我之前工作的公司,为了减少运维工作量和代码操作的复杂性&#xff0c…

Android OpenGL粒子特效

在本篇,我们将开启一个新的项目,探索粒子的世界。粒子是一种基本的图形元素,它们通常被表示为一组点。通过巧妙地组合一些基础的物理效果,我们能够创造出许多令人惊叹的视觉效果。想象一下,我们可以模拟一个水滴从喷泉…

Xcode使用Instruments的dsym还原符号堆栈问题

文章目录 设置符号表的步骤参考资料 设置符号表的步骤 instruments 的 Settings 中,可以设置符号表的搜索路径 没有生效的话,继续看 File 里面的 Symbols - 出现弹窗后点击 Add Symbols - 然后再点击 Apply。 参考资料 https://xjkstar.github.i…

Unity URP shader ———魔系符文宝石是如何练成的

各位同学大家好 我已经很久没有没有写教程了,最近项目比较忙。各种加班各种带小孩儿,不过,老师一有机会也在给尽可能服务大家,今天来一个硬菜:移动端高效魔系符文如何制作,国庆起来,老师抽了点…

汽车免拆诊断案例 | 2013款宝马116i车偶尔加速不良

故障现象  一辆2013款宝马116i车,搭载N13B16A 发动机,累计行驶里程约为12.1万km。车主反映,该车行驶中偶尔加速无反应,且发动机故障灯异常点亮。 故障诊断 接车后试车,故障现象无法再现。用故障检测仪检测&#xff…

RestClient查询文档match查询、精确查询和布尔查询

目录 match查询 精确查询 布尔查询 match查询 全文检索的match和multi_match查询与match_all的API基本一致。差别是查询条件,也就是query的部分。 因此,Java代码上的差异主要是request.source().query()中的参数了。同样是利用QueryBuilders提供的方法…

解决在Windows中安装tensorflow2.10无法检测到GPU的问题

解决在Windows中安装tensorflow2.10无法检测到GPU的问题 官方给出的Windows本地安装方式 更新显卡驱动到最新。安装anaconda或miniconda作为python环境的管理工具。创建新的环境tf:conda create --name tf python3.9,然后进入改环境:conda …