李沐读论文-启发点记录2：Resnet--残差连接--kaiming老师神作

李沐读论文-启发点记录2：Resnet--残差连接--kaiming老师神作

news/2024/12/25 13:06:35/文章来源:https://blog.csdn.net/xiao_ZHEDA/article/details/143246301

（一）可以借鉴：

1. 计算机视觉的论文，都会在第一页的右上角，放上一张好看的图！

2.bottleNet的设计——很大程度上节省了计算FLOPs开销，这是Resnet50及其更大版本都会用到的设计。

3.Resnet在detection任务中也做得很好，所以，其实很多任务都可以先用resnet作为baseline，嘻嘻！

（二）启发点：

1. 李沐讲解的时候，其实无意中告诉了我们如何真正去看这中训练迭代error曲线图：

（1）首先是这个“断崖下降点”，欸，我在第二点好像就讲到了原因，嘻嘻。

（2）然后是整个曲线，你要理解的一点是，有时候虽然error一直没有降下去，但是，只要一直在动，你想想，有时候就是因为learning_rate设置得比较大，所以一直在各个“山顶”跳来跳去，所以error可能一直比较高，但是没关系，至少它还在不断的在“找”在优化。而一旦断崖式的调整了learning rate，error能够较快的下降，就是因为它决定在“某一座”山上开始望“这座山”的脚下跑了。！！！

2. 其实残差连接的设计，在90年代就已经在用了，它就叫shortcut —— 所以，大部分工作其实前人都是做过的，想过的，但是，如果你能够做好就是好工作，原创新的设计现在已经很少很少了。

3.对了，李沐还讲到一件事情，

为什么这里比赛的点还要更底一些呢？

答：没错，就是因为

比赛，为了分数更高一些，大家都会做很多不同的设计，比如这里的不同crop，然后使用“超级大招”——merge，也就是我们经常在比赛的决胜阶段用到的融合绝技，很可惜，这并不是什么好的创新点，只能算作一个工程性的做法，merge融合本身有点像是朝着test数据集fitting，这样做的泛化性会差，不过比赛的话就只看你有多接近了。

4.对残差网络更多理论解释与分析：

（1）首先，是梯度方向传播的时候，因为多加了一个x，每次的偏导-梯度更加不容易趋近于0

——这个可以保证训练速度更快（趋于收敛）

（2）其实，一般更deeper的网络后面层如果都是identity作用，也是可以的，但是就是因为复杂度过高，导致了这样的结果很难出现。而残差连接很大程度是降低了原来的复杂度的

（3）评论区这位说的也有道理

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/456766.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

[RK3566-Android11] 使用SPI方式点LED灯带-JE2815/WS2812，实现呼吸/渐变/随音量变化等效果

[RK3566-Android11] 使用SPI方式点LED灯带-JE2815/WS2812，实现呼吸/渐变/随音量变化等效果

问题描述之前写了一篇使用GPIO方式点亮LED灯带的文章 https://blog.csdn.net/jay547063443/article/details/134688745?fromshareblogdetail&sharetypeblogdetail&sharerId134688745&sharereferPC&sharesourcejay547063443&sharefromfrom_link 使用GPIO…

阅读更多...

OceanBase 首席科学家阳振坤：大模型时代的数据库思考

OceanBase 首席科学家阳振坤：大模型时代的数据库思考

2024年 OceanBase 年度大会即将于10月23日，在北京举行。欢迎到现场了解更多“SQL AI ” 的探讨与分享！ 近期，2024年金融业数据库技术大会在北京圆满举行，聚焦“大模型时代下数据库的创新发展”议题，汇聚了国内外众多…

阅读更多...

详细尝鲜flutter

详细尝鲜flutter

flutter 161由于官方的汉化文档感觉还是有很多没有汉化的地方 ，所以自己打一遍的同时写下了以下笔记社区生态官方文档所有的控件:Widget 目录 | Flutter 中文文档 - Flutter 中文开发者网站 - Flutter 官方论坛的教程 Flutter Widget框架概述 - Flutter中文网…

阅读更多...

微信小程序中关闭默认的 `navigationBar`，并使用自定义的 `nav-bar` 组件

微信小程序中关闭默认的 `navigationBar`，并使用自定义的 `nav-bar` 组件

要在微信小程序中关闭默认的 navigationBar，并使用自定义的 nav-bar 组件，你可以按照以下步骤操作： 1. 关闭默认的 navigationBar 在你的页面的配置文件 *.json 中设置 navigationBar 为 false。你需要在页面的 JSON 配置文件中添加以下代码…

阅读更多...

JS 中 reduce()方法及使用

JS 中 reduce()方法及使用

摘要： 开发中经常会遇到求合计的状况！比如和，积等！这次遇到的是求合计的和！ reduce()方法是JavaScript中Array对象的一种高阶函数，用于对数组中的每个元素执行一个由您提供的reducer函数（回调函…

阅读更多...

内置数据类型、变量名、字符串、数字及其运算、数字的处理、类型转换

内置数据类型、变量名、字符串、数字及其运算、数字的处理、类型转换

内置数据类型 python中的内置数据类型包括：整数、浮点数、布尔类型（以大写字母开头）、字符串变量名命名变量要见名知意，确保变量名称具有描述性和意义，这样可以使得代码更容易维护，使用_可以使得变量名…

阅读更多...

STM32-Modbus协议(一文通)

STM32-Modbus协议(一文通)

Modbus协议原理 RT-Thread官网开源modbus RT-Thread官方提供 FreeModbus开源。野火有移植的例程。 QT经常用 libModbus库。 Modbus是什么？ Modbus协议，从字面理解它包括Mod和Bus两部分，首先它是一种bus，即总线协议，和…

阅读更多...

学习threejs，利用THREE.ExtrudeGeometry拉伸几何体实现svg的拉伸

学习threejs，利用THREE.ExtrudeGeometry拉伸几何体实现svg的拉伸

👨‍⚕️ 主页： gis分享者 👨‍⚕️ 感谢各位大佬点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏：threejs gis工程师文章目录一、🍀前言1.1 ☘️THREE.ExtrudeGeometry拉伸…

阅读更多...

通过ssh端口反向通道建立并实现linux系统的xrdp以及web访问

通过ssh端口反向通道建立并实现linux系统的xrdp以及web访问

Content 1 问题描述2 原因分析3 解决办法3.1 安装x11以及gnome桌面环境查看是否安装x11否则使用下面指令安装x11组件查看是否安装gnome否则使用下面指令安装gnome桌面环境 3.2 安装xrdp使用下面指令安装xrdp（如果安装了则跳过）启动xrdp服务 3.3 远程服务…

阅读更多...

C2W4.LAB.Word_Embedding.Part1

C2W4.LAB.Word_Embedding.Part1

理论课：C2W4.Word Embeddings with Neural Networks 文章目录 Word Embeddings First Steps: Data PreparationCleaning and tokenizationSliding window of wordsTransforming words into vectors for the training setMapping words to indices and indices to w…

阅读更多...

七，Linux基础环境搭建（CentOS7）- 安装Scala和Spark

七，Linux基础环境搭建（CentOS7）- 安装Scala和Spark

Linux基础环境搭建（CentOS7）- 安装Scala和Spark 大家注意以下的环境搭建版本号，如果版本不匹配有可能出现问题！ 一、Scala下载及安装 Scala是一门多范式的编程语言，一种类似java的编程语言，设计初衷是实现…

阅读更多...

合并数组的两种常用方法比较

合并数组的两种常用方法比较

在 JavaScript 中，合并数组的两种常用方法是使用扩展运算符 (...) 和使用 push 方法。使用扩展运算符 this.items [...this.items, ...data.items]; 优点： 易于理解：使用扩展运算符的语法非常直观，表达了“将两个数组合并成一个…

阅读更多...

24.redis高性能

24.redis高性能

Redis的单线程和高性能 Redis是单线程吗？ Redis 的单线程主要是指 Redis 的网络 IO 和键值对读写是由一个线程来完成的，这也是 Redis 对外提供键值存储服务的主要流程。 Redis 的多线程部分，比如持久化、异步删除、集群数据同步等&#xff…

阅读更多...

合合信息亮相PRCV大会，探讨生成式AI时代的内容安全与系统构建加速

合合信息亮相PRCV大会，探讨生成式AI时代的内容安全与系统构建加速

一、前言在人工智能技术的飞速发展下，生成式AI已经成为推动社会进步的重要力量。然而，随着技术的不断进步，内容安全问题也日益凸显。如何确保在享受AI带来的便利的同时，保障信息的真实性和安全性，已经成为整个行业待解…

阅读更多...

C#/.NET/.NET Core全面的自学入门指南

C#/.NET/.NET Core全面的自学入门指南

自学入门建议确认学习目标：自学C#/.NET首先你需要大概了解该门语言和框架的发展、前景和基本特点，从自身实际情况和方向出发确认学习的必要性。制定学习计划：制定一个详细的学习计划（比如每天学习一个C#/.NET知识点、小技能&am…

阅读更多...

【web安全】缓慢的HTTP拒绝服务攻击详解

【web安全】缓慢的HTTP拒绝服务攻击详解

文章目录前言一、攻击原理二、攻击类型三、攻击特点四、HTTP慢速攻击实战工具简介使用参数介绍五、修复建议前言缓慢的HTTP拒绝服务攻击是一种专门针对于Web的应用层拒绝服务攻击,攻击者操纵网络上的肉鸡,对目标Web服务器进行海量http request攻击,直到服务器带宽被打满,造成…

阅读更多...

微服务网关Zuul

微服务网关Zuul

一、Zuul简介 Zuul是Netflix开源的微服务网关，包含对请求的路由和过滤两个主要功能。 1）路由功能：负责将外部请求转发到具体的微服务实例上，是实现外部访问统一入口的基础。 2）过滤功能：负责对请求的过程…

阅读更多...

入侵检测算法平台部署LiteAIServer视频智能分析平台行人入侵检测算法

入侵检测算法平台部署LiteAIServer视频智能分析平台行人入侵检测算法

在当今科技日新月异的时代，行人入侵检测技术作为安全防护的重要组成部分，正经历着前所未有的发展。入侵检测算法平台部署LiteAIServer作为这一领域的佼佼者，凭借其卓越的技术实力与广泛的应用价值，正逐步成为守护公共安全的新利器…

阅读更多...

R5：天气预测-探索式数据分析

R5：天气预测-探索式数据分析

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊一、实验目的： 根据数据对 RainTomorrow 进行预测，熟悉探索式数据分析（EDA） 二、实验环境： 语言环境…

阅读更多...

QT:MaintenanceTool 模块安装工具

QT:MaintenanceTool 模块安装工具

QT的MaintenanceTool 工具对已安装的 Qt 进行卸载、修复等其他操作时提示At least one valid and enabled repository required for this action to succeed 解决方式：在设置中添加一个临时的仓库 https://mirrors.tuna.tsinghua.edu.cn/qt/online/qtsdkrepositor…

阅读更多...

最新文章

推荐文章