AlexNet论文精读

AlexNet论文精读

news/2024/12/24 0:31:17/文章来源:https://blog.csdn.net/warren103098/article/details/135511198

1:该论文解决了什么问题？

图像分类问题

2：该论文的创新点？

使用了大的深的卷积神经网络进行图像分类；
采用了两块GPU进行分布式训练；
采用了Relu进行训练加速；
采用局部归一化提高模型泛化能力；
重叠池化，充分利用信息，提高精度；
dropout减少神经元之间的依赖性，提高模型泛化能力；

3：训练策略？

使用SGD（随机梯度下降）来训练，每个batch128，动量为0.9，权重衰减为0.0005（防止过拟合，在损失函数中添加一个惩罚项，对网络的权重进行约束，使其趋向于较小的值）；
使用方差为0.1 均值为0的分布来初始化权重，用常数1来初始化第二、四、五层卷积和全连接隐藏层的偏置；
学习率初始化为0.1，当验证集的精度不再提高时，将学习率除以10；

4：代码地址？

无

5：论文还有什么改进之处？

1）对视频流进行处理，利用时间特征

摘要

1：训练了一个很大很深的卷积神经网络在ImageNet上进行1000个种类的分类任务；

2：top1的精度达到了62.5%；

3：该网络包含了五个卷积层以及全连接层；

4：采用了两块gpu进行分布式训练；

5：对于overfitting问题采用了dropout。

介绍

1：现实物体的识别需要较大的数据集，例如LabelMe 和ImagNet；

2：卷积网络可以通过深度和宽度来控制其识别能力；

3：编写了一个高性能程序让gpu可以很好的训练2D卷积；

4:经过实验，发现卷积网路的深度很重要；

数据集

1：ImageNet有1.5亿张高达22000个种类并且由人工进行标注的图片；

2）并没有对图像进行预处理，在原始的RGB上进行网络的训练。

结构

relu可以大大减少神经网络的训练时间；
如图所示训练时间对比，实线为relu，虚线为tanh;

4)relu(x)=Max(0,x)

在当时，单块gpu的显存仅3GB，这无法训练一个大型的神经网络，因此采用了两块GPU进行分布式训练；
并行化方案采用的是讲一半的卷积核各放到一块gpu上，gpu仅在某些层进行交流,并且gpu之间可以先相互读取内存而不经过主机;
带来的结果就是降低了top1和top5的错误率，加快了训练。
虽然Relu不需要归一化来防止饱和，但依然发现了一种归一化方法来提高模型的泛华能力；（泛华：模型在未见过的数据集的能力）
仅在某些层使用Relu后使用该归一化，因此称为局部响应归一化，这一操作同样降低了top1和5的错误率；

池化通常用来降低卷积层之后结果的维度；
不仅可以提升精度，还可以防止过拟合；
池化步长小于池化窗口，再池化的过程中添加相邻像素的信息以重新或得非重叠部分失去的特征；

结构如图所示，包含了五个卷积和三个全连接；

2）网络被分为两个部分，各自训练各自的；

3）第二个卷积层的输出进行了一个交叉，也就是第三个卷积层的输入，此时两个GPU互相交换参数；

4）第一个、第二个卷积层使用了LRN（局部归一化）；

5）第一个、第二个、第五个卷积层使用了最大池化。

降低过拟合的方法之一就是人为的进行数据集扩充；
从256*256的图里随机提取224*224的块，这也是为什么结构里的输入为224*224；
对图片进行PCA（高维数据转换为低维数据，保留数据中的主要变化方向。在这里，PCA应用于RGB像素值，以找到它们之间的主要方向。）

为了减少误差，降低训练成本，采用了dropout（随机失活法）；

2）在学习的过程中进行神经元的随机失活，以降低各个模块的依赖性，提高鲁棒性。

使用SGD（随机梯度下降）来训练，每个batch128，动量为0.9，权重衰减为0.0005（防止过拟合，在损失函数中添加一个惩罚项，对网络的权重进行约束，使其趋向于较小的值）；
使用方差为0.1 均值为0的分布来初始化权重，用常数1来初始化第二、四、五层卷积和全连接隐藏层的偏置；
学习率初始化为0.1，当验证集的精度不再提高时，将学习率除以10；

卷积神经网络的精度和深度有关；
对于视频，希望用大的深度神经网络去预测并利用好时间结构。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/235438.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

docker 容器添加指定网络地址

docker 容器添加指定网络地址

docker 容器添加指定网络地址在搭建halo博客时，准备让 halo、mysql8.1、nginx 三个容器在同一个网段中，并指定IP。实现docker内部容器之间网络互通。查看容器网络信息命令 docker inspect 容器名各容器部署成功后网络效果如下： nginx …

阅读更多...

Qt/C++摄像头采集/二维码解析/同时采集多路/图片传输/分辨率帧率可调/自动重连

Qt/C++摄像头采集/二维码解析/同时采集多路/图片传输/分辨率帧率可调/自动重连

一、前言本地摄像头的采集可以有多种方式，一般本地摄像头会通过USB的方式连接，在嵌入式上可能大部分是CMOS之类的软带的接口，这些都统称本地摄像头，和网络摄像头最大区别就是一个是通过网络来通信，一个是直接本地通信…

阅读更多...

Camunda Rest API

Camunda Rest API

客户端像调用本地方法一样调用引擎中的接口。 https://docs.camunda.org/manual/7.17/reference/rest/ 一：pom.xml <dependency><groupId>org.camunda.community.rest</groupId><artifactId>camunda-platform-7-rest-client-spring-boot-…

阅读更多...

通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践

通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践

作者：熊兮、求伯、一耘引言通义千问-72B（Qwen-72B）是阿里云研发的通义千问大模型系列的720亿参数规模模型。Qwen-72B的预训练数据类型多样、覆盖广泛，包括大量网络文本、专业书籍、代码等。Qwen-72B-Chat是在Qwen-72B的基础上…

阅读更多...

一起玩儿物联网人工智能小车（ESP32）——24. 变量与函数（二）

一起玩儿物联网人工智能小车（ESP32）——24. 变量与函数（二）

摘要：本文介绍变量和函数的基本知识在前面一篇中了解了变量，接着就来了解一下函数。函数是程序中的一个关键概念，它可以简化程序的编写，使代码更加模块化、可复用，提高程序的可读性。其实在之前已经多次遇到函数了&am…

阅读更多...

Android AAudio

Android AAudio

文章目录基本概念启用流程基本流程HAL层对接数据流计时模型调试基本概念 AAudio 是 Android 8.0 版本中引入的一种音频 API。 AAudio 提供了一个低延迟数据路径。在 EXCLUSIVE 模式下，使用该功能可将客户端应用代码直接写入与 ALSA 驱动程序共享的内存映射缓冲区…

阅读更多...

Thingsbaord采用redis缓存（自用）

Thingsbaord采用redis缓存（自用）

在CentOS系统上，您可以通过以下步骤使用yum安装Redis： 添加EPEL仓库： 首先，需要添加EPEL（Extra Packages for Enterprise Linux）仓库，因为Redis可能不在默认的CentOS仓库中。使用以下命令添加EP…

阅读更多...

iOS 应用上架指南：资料填写及提交审核

iOS 应用上架指南：资料填写及提交审核

摘要本文提供了iOS新站上架资料填写及提交审核的详细指南，包括创建应用、资料填写-综合、资料填写-IOS App和提交审核等步骤。通过本指南，您将了解到如何填写正确的资料，并顺利通过苹果公司的审核。引言在开发iOS应用后，将其…

阅读更多...

在IntelliJ IDEA上使用通义灵码(TONGYI Lingma)

在IntelliJ IDEA上使用通义灵码(TONGYI Lingma)

参考链接： 通义灵码产品介绍_智能编码助手_AI编程_云效(Apsara Devops)-阿里云帮助中心【IDEA如何使用通义灵码？】_idea 通义灵码-CSDN博客 1. 简介 1.1 定义通义灵码，是阿里云出品的一款基于通义大模型的智能编码辅助工具，提…

阅读更多...

【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax类图

【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax类图

【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax概述【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax快速入门【大数据进阶第三阶段之Datax学习笔记】阿里云开源离线同步工具Datax类图【大数据进阶第三阶段之Datax学习笔记】使用…

阅读更多...

密码学（一）

密码学（一）

文章目录前言一、Cryptographic Primitives二、Cryptographic Keys2.1 Symmetric key cryptography2.2 asymmetric key cryptography 三、Confidentiality3.1 Symmetric key encryption algorithms3.2 asymmetric key block ciphers3.3 其他四、Integrity4.1 secure hashing …

阅读更多...

【安卓模拟器】雷电模拟器9 v9.0.64 绿色版（免安装版，一键绿化）

【安卓模拟器】雷电模拟器9 v9.0.64 绿色版（免安装版，一键绿化）

下载地址极核GetShell 简介雷电模拟器9是一款安卓模拟器，支持安卓9版本。安卓模拟器除了能够运行游戏娱乐，对于渗透测试&移动安全测试也有举足轻重的作用。软件截图绿化教程视频教程下载地址提供了视频绿化教程，有需要的可以…

阅读更多...

微信小程序Burp抓包

微信小程序Burp抓包

方法有很多，工具也各有差异，主要是学代理流量的思路 Burp流量代理工具小程序一、Burp证书导入 1、开启代理开启浏览器的代理，火狐推荐FoxyProxy，Google推荐SwitchyOmega，设置代理为127.0.0.1:8080。 2、下载证书…

阅读更多...

GSEQ行为序列分析软件学习汇总

GSEQ行为序列分析软件学习汇总

0、问题描述： 1、GSEQ软件是做什么的？2、GSEQ软件如何使用？2、GSEQ软件前期需要在“记事本”中编写“程式码”需要将所有行为数据编码之后，将编码行为序列粘贴到GSEQ软件中去，如果数据量很大，这个过程就非…

阅读更多...

构建中国人自己的私人GPT

构建中国人自己的私人GPT

创作不易，请大家多鼓励支持。在现实生活中，很多人的资料是不愿意公布在互联网上的，但是我们又要使用人工智能的能力帮我们处理文件、做决策、执行命令那怎么办呢？于是我们构建自己或公司的私人GPT变得非常重要。先看效果一、…

阅读更多...

C语言之扫雷小游戏的实现【含递归展开】

C语言之扫雷小游戏的实现【含递归展开】

文章目录前言一、扫雷游戏代码设计思路二、设计扫雷代码1.创建菜单函数2.实现9x9扫雷3.初始化棋盘4.打印棋盘5.随机布置雷的位置6.排查雷的信息7.递归展开三、源码1.新建一个test.c源文件2.新建一个game.c源文件3.创建一个game.h头文件前言扫雷游戏是1992年发行的一款大众类…

阅读更多...

Salesforce生态系统2024年就业趋势

Salesforce生态系统2024年就业趋势

对于Salesforce专业人士来说，新一年的开始都是激动人心的。但2023年仍存在显著挑战，经济技术低迷导致裁员，以及Salesforce生态系统增长放缓等等，这些挑战将延续到2024年。回顾2023年 2023年，Salesforce生态系统以及…

阅读更多...

ant design vue Tree组件叶子节点横向排列

ant design vue Tree组件叶子节点横向排列

antdesignvue的树形组件要实现组件叶子节点横向排列有点坑，没有配置属性，需要自己想办法。要实现的效果看tree组件的dom结构，父元素flex竖向布局，子项不论节点层级都在同一层！！！ 难点在于想…

阅读更多...

windows下使用PowerShell切割大数据文件

windows下使用PowerShell切割大数据文件

测试文件为24.4G文件打开PowerShell窗口，使用以下命令 $filePath 为指向文件路径 $outputPath 输出到指定文件夹 $chunkSize 单个文件控制切割大小将命令修改完后，直接粘贴到powershell窗口，点击回车即可进行切割 $filePath "D:\…

阅读更多...

使用metricbeat 监控多ES集群

使用metricbeat 监控多ES集群

背景 ES 本身自带监控，属于xpack 中的内容，为商业版，需要收费； 并且 monitor 功能必须要在security开启后才能使用，还有就是集群监控自己，将采集到的性能数据保存到本集群，这是一个比较差的设…

阅读更多...

最新文章

推荐文章