(下:补充——五个模型的理论基础)深度学习——图像分类篇章

目录

1.1 卷积神经网络基础

3.1 AlexNet网络结构详解与花分类数据集下载

4.1 VGG网络详解及感受野的计算

5.1 GoogLeNet网络详解

6.1 ResNet网络结构,BN以及迁移学习详解

总结(可以直接看总结)


1.1 卷积神经网络基础

视频讲解:
1.1 卷积神经网络基础_哔哩哔哩_bilibili

发展不是一帆风顺的

全连接层:

卷积层()

目的:进行图像特征提取

特性:拥有局部感知机制,权值共享

扩展到多维

 特征总结:

  1. 卷积核的channel与输入特征层的channek相同
  2. 输出的特征矩阵channel与卷积核个数相同

sigmoid/Relu  两个激活函数  各有缺点:

Sigmoid:饱和时梯度值小,网络层数较深时易出现梯度消失
Relu:反向传播时出现非常大的梯度更新后导致权重分布中心小于零,导致该处导数始终为零,反向传播无法更新权重,即进入失活状态。

出现越界情况用padding处理(增补)

池化层()

和卷积层类似 但是要更简单

目的:对特征图像进行稀疏处理,减少数据运算量

(补充)反向传播(后面跳过了)

说明:本节理论较多,会枯燥,尽管内容不需要完全掌握,但是要大致理解,留有印象

误差的计算:

softmax:让结果满足概率分布(即概率和为1)  (猫/狗)

sigmoid:(人类/男人)

误差的反向传播:

3.1 AlexNet网络结构详解与花分类数据集下载

视频讲解:
3.1 AlexNet网络结构详解与花分类数据集下载_哔哩哔哩_bilibili

AlexNet(2012冠军)

该网络的亮点在于:

  • (1)首次利用 GPU进行网络加速训练。
  • (2)使用了 ReLu 激活函数,而不是传统的 sigmoid 激活函数以及 Tanh 激活函数。
  • (3)使用了 LRN 局部响应归一化。
  • (4)在全连接层的前两层中使用了 Dropout随机失活神经元操作,以减少过拟合。

中间的图像很好的诠释了AlexNet的好处,减少了过拟合的现象

解决方法:使用Dropout的方式在网络正传播过程中随机失活一部分神经元

经卷积后的矩阵尺寸大小计算公式为:N=(W-F+2P)/S+1
输入图片大小 W*W
Filter大小F*F
步长 S
padding的像素数P

4.1 VGG网络详解及感受野的计算

视频讲解:
4.1 VGG网络详解及感受野的计算_哔哩哔哩_bilibili

网络结构:

网络亮点: 

  • 通过堆叠多个3*3的卷积核来替代大尺度卷积核(减少所需参数 )
  • 通过堆善两个3x3的卷积核替代5x5的卷积核
  • 通过堆叠三个3x3的卷积核替代7x7的卷积核。

为什么这么干?
效果相同的情况下,参数更少。

5.1 GoogLeNet网络详解

网络结构:

网络中的亮点:

  • 引入了Inception结构(融合不同尺度的特征信息)
  • 使用1x1的卷积核进行降维以及映射处理    减少参数/特征矩阵深度
  • 添加两个辅助分类器帮助训练
  • 丢弃全连接层,使用平均池化层(大大减少模型参数)

注意:AlexNet和VGG都只有一个输出层,GooLeNet有三个输出层

6.1 ResNet网络结构,BN以及迁移学习详解

视频讲解:
6.1 ResNet网络结构,BN以及迁移学习详解_哔哩哔哩_bilibili

网络结构:

网络中的亮点:

  • 超深的网络结构(突破1000层)
  • 提出residual模块  
  • 使用Batch Normalization加速训练(丟奔dropout)

随着网络加深,梯度消失&&梯度爆炸现象越来越明显     BN等方式解决

Batch Normalization原理:
要让整个训练样本的数据集满足分布规律(均值为0方差为1)
退化问题,通过残差解决

迁移学习:
常见的迁移学习方式:

  • 1.载入权重后训练所有参数
  • 2.载入权重后只训练最后几层参数
  • 3.载入权重后在原网络基础上再添加一层全连接层,仅训练最后一个全连接层

总结(可以直接看总结):

综上呢,其实就是延续上一篇文章(上)基于机器学习的图像识别——遥感图像分类(LeNet-5;AlexNet;VGGNet;GoogLeNet;ResNet)-CSDN博客

五种”神经网络模型“的进一步讲解,偏向于理论层面

但两篇文章整理的是不同博主的讲解视频,讲的都蛮好的,通过”对比学习“可以发现,二者间会有一部分共通之处——这些共同之处一定是基础/重点,当然我已经帮大家整理好了,请各位放心食用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27339.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

批量给 Word 添加文字和图片水印

在 Word 中添加水印是非常常见的一个需求,当我们需要将 Word 文档发送给第三方,或者需要将 Word 文档打印出来的时候,给 Word 文档加上水印是一个很重要的操作,可以声明版权,也可以起到广告标识作用。如果少量 Word 文…

数据挖掘工程师的技术图谱和学习路径

数据挖掘工程师的技术图谱和学习路径: 1.基础知识 数据挖掘工程师是负责从大量数据中发现潜在模式、趋势和规律的专业人士。以下是数据挖掘工程师需要掌握的基础知识: 数据库知识:熟悉关系数据库和非关系数据库的基本概念和操作,掌握SQL语言。 统计学基础:了解统计学的基…

JavaSE-4方法 递归 数组

一、方法 public static 返回值类型 方法名{ 方法体; } 1)修饰符:public static 2)形参返回值类型和实参返回值类型一致 3)方法名字:小驼峰 4)参数列表:如果方法没有参数就不写…

快瞳通用文档解析技术是怎样赋能下游各类大语言模型任务?

、为什么不直接用大模型去解析文档? 在文档、票据结构化识别这个赛道上,大语言模型存在天然的局限性: 1.结构化数据生成效率低 大模型在处理表格、公式等结构化内容时,需消耗大量计算资源,生成速度慢且成本高昂。例如…

Microk8s Ingress实现七层负载均衡

Microk8s Ingress是什么 Ingress是k8s的一种资源对象,用于管理外部对集群内服务的访问, 它通过提供一个统一的入口点,将外部流量路由到集群内部的不同服务。 Microk8s Ingress用于解决什么问题 k8s集群中服务默认只能在集群内访问。 如果需要从外部访…

C语言(19)----------->函数(2)

本文介绍了C语言的return语句及其它在C语言函数中的作用,以及介绍了二维数组和一维数组传参时的一些注意事项和使用数组传参时的方法。 若没有学习过C语言的一维数组和二维数组,建议参考如下文章: C语言(15)--------…

数据结构——单调栈

一.单调栈简介 1.1单调栈定义与特性 本质:单调栈是一种特殊的栈结构,其内部元素始终保持单调递增或单调递减的顺序。核心规则:当新元素入栈时,会通过弹出破坏单调性的栈顶元素来维持有序性。单调方向: 单调递增栈&…

知微传感3D相机上位机DkamViewer使用:设置相机的静态IP

写在前面 本人从事机器视觉细分的3D相机行业。编写此系列文章主要目的有: 1、便利他人应用相机,本系列文章包含公司所出售相机的SDK的使用例程及详细注释;2、促进行业发展及交流。 知微传感Dkam系列3D相机可以应用于定位分拣、焊接焊缝提取、…

DeepSeek掘金——DeepSeek-R1微调指南

DeepSeek掘金——DeepSeek-R1微调指南 在这篇博文中,我们将逐步指导你在消费级 GPU 上使用 LoRA(低秩自适应)和 Unsloth 对 DeepSeek-R1 进行微调。 微调像 DeepSeek-R1 这样的大型 AI 模型可能需要大量资源,但使用正确的工具,可以在消费级硬件上进行有效训练。让我们探索…

GPT-4.5来了

https://chat.xutongbao.top/

从 JVM 源码(HotSpot)看 synchronized 原理

大家好,我是此林。 不知道大家有没有这样一种感觉,网上对于一些 Java 框架和类的原理实现众说纷纭,看了总是不明白、不透彻。常常会想:真的是这样吗? 今天我们就从 HotSpot 源码级别去看 synchronized 的实现原理。全…

下载b站视频音频

文章目录 方案一:jjdown如何使用 方案二:bilibili哔哩哔哩下载助手如何使用进入插件网站插件下载插件安装 使用插件下载视频音频:复制音频下载地址 方案三:bat命令下载单个音频下载单个视频下载单个音视频 方案一:jjdo…

快速在本地运行SpringBoot项目的流程介绍

目录 前言 一、环境配置 1.1Java环境 1.2Maven环境 1.3IntelliJ IDEA安装 1.4MySql安装 二、项目导入与启动的过程 2.1Maven镜像和本地仓库 2.1.2镜像配置 2.1.3配置本地仓库 2.2导入项目与启动 2.2.1加载Maven设置 2.2.2配置jdk与java版本 2.2.3创建数据库 2.2…

分类预测 | Matlab实现CPO-SVM冠豪猪算法优化支持向量机多特征分类预测

分类预测 | Matlab实现CPO-SVM冠豪猪算法优化支持向量机多特征分类预测 目录 分类预测 | Matlab实现CPO-SVM冠豪猪算法优化支持向量机多特征分类预测分类效果基本描述程序设计参考资料 分类效果 基本描述 1.Matlab实现CPO-SVM冠豪猪算法优化支持向量机多特征分类预测&#xff…

not support ClassForName

com.alibaba.fastjson2.JSONException: not support ClassForName : java.lang.String, you can config JSONReader.Feature.SupportClassForName 官方说明中提到默认关闭, 可通过配置开启 JSON.config(JSONReader.Feature.SupportClassForName);

(贪心 跳跃游戏)leetcode 55

题解思路&#xff1a;代码随想录--代码随想录本题题解 本题不考虑每个结点走几步只考虑范围 在nums[0]2&#xff0c;也就是在nums[1]和nums[2]找到最大范围&#xff08;for(int i0;i<cover;i)) nums[1]3,也就是在nums[2]和nums[4]这个区间范围找到最大范围&#xff0c;而因…

Unity中动态切换光照贴图LightProbe的方法

关键代码&#xff1a;LightmapSettings.lightmaps lightmapDatas; LightmapData中操作三张图&#xff1a;lightmapColor,lightmapDir,以及一张ShadowMap 这里只操作前两张&#xff1a; using UnityEngine; using UnityEngine.EventSystems; using UnityEngine.UI;public cl…

leetcode 238. 除自身以外数组的乘积

题目如下 数据范围 使用两个辅助数组分别存从前乘到后面和从后到前后面再计算就行。 &#xff08;f数组没处理好还包含了本不能乘于的数所以要向后移动一位&#xff09;。通过代码 class Solution { public:vector<int> productExceptSelf(vector<int>& n…

以太坊基金会换帅,资本市场砸盘

Vitalik力挺Aya升任EF主席&#xff0c;理想主义冬日发芽&#xff1f; 作者&#xff1a;Wenser&#xff1b;编辑&#xff1a;秦晓峰 出品 | Odaily星球日报&#xff08;ID&#xff1a;o-daily&#xff09; 2 月 27 日&#xff0c;Bybit 15 亿资金被盗事件的最新调查结果将以太坊…

[含文档+PPT+源码等]精品基于Python实现的微信小程序的在线医疗咨询系统

基于Python实现的微信小程序的乡村医疗咨询系统背景&#xff0c;可以从以下几个方面进行阐述&#xff1a; 一、社会背景 医疗资源分布不均&#xff1a;在我国&#xff0c;城乡医疗资源分布不均是一个长期存在的问题。乡村地区由于地理位置偏远、经济条件有限&#xff0c;往往…