机器学习之SGD, Batch, and Mini Batch的简单介绍

机器学习之SGD, Batch, and Mini Batch的简单介绍

news/2024/12/26 21:13:36/文章来源:https://blog.csdn.net/weixin_74850661/article/details/133470687

文章目录

总述
SGD(Stochastic Gradient Descent)(随机梯度下降）
Batch （批量）
mini Batch (迷你批量）

在这里插入图片描述

总述

SGD, Batch, and Mini Batch是可用于神经网络的监督学习计算权重更新的方案，即∆wij。

SGD(Stochastic Gradient Descent)(随机梯度下降）

随机梯度下降（SGD）计算每个训练数据的误差，并立即调整权重。如果我们有100个训练数据点，SGD将调整权重100次。

在这里插入图片描述

SGD调整每个数据点的权重，执行的神经网络的性能在训练过程中是弯曲的。“随机”这个名字暗示了训练过程中的随机行为。
SGD计算的权重更新为：
上面的公式与增量规则是一样的，对啦，增量规则就是用了SGD 方法啦

Batch （批量）

在批处理方法中，对训练数据的所有误差计算每次权重更新，并使用权重更新的平均值来调整权重。该方法使用了所有的训练数据，并且只更新了一次。
权重改变的计算公式：
其中，∆wij(k)为第k个训练数据的权重更新，N为训练数据的总数。

缺点：由于平均权重更新计算，批处理方法消耗了大量的训练时间。

mini Batch (迷你批量）

小批处理方法是SGD和批处理方法的混合。它选择训练数据集的一部分，并使用它们以批处理方法进行训练。因此，它计算所选数据的权值更新，并使用平均权值更新来训练神经网络。例如，如果从100个训练数据点中选择20个任意数据点，则将批量方法应用于20个数据点。在这种情况下，总共执行了5次重量调整，以完成所有数据点的训练过程（5 = 100/20）。
可以说，mini Batch结合了SGD 和Batch 的优点：SGD的速度和批处理的稳定性。因此，它经常被用于深度学习，它处理大量的数据。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/145993.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

竞赛基于设深度学习的人脸性别年龄识别系统

竞赛基于设深度学习的人脸性别年龄识别系统

文章目录 0 前言1 课题描述2 实现效果3 算法实现原理3.1 数据集3.2 深度学习识别算法3.3 特征提取主干网络3.4 总体实现流程 4 具体实现4.1 预训练数据格式4.2 部分实现代码 5 最后 0 前言 🔥 优质竞赛项目系列，今天要分享的是基于深度学习机器视觉的…

阅读更多...

市场调研的步骤与技巧：助你了解市场需求

市场调研的步骤与技巧：助你了解市场需求

在当今快速发展的市场中，进行有效的市场研究对于了解消费者的行为、偏好和趋势至关重要。适当的市场研究可以帮助公司获得对目标受众的有价值的见解，创造更好的产品和服务，并提高客户满意度。今天，小编和大家一起讨论一下怎么做市…

阅读更多...

[Linux] 6.VMware虚拟机网络配置

[Linux] 6.VMware虚拟机网络配置

在VMware虚拟机下可以在虚拟网络编辑器看到三种模式一、Bridged（桥接模式） 桥接模式就是将主机网卡与虚拟机虚拟的网卡利用虚拟网桥进行通信。真机、虚拟机都有自己的ip地址，能互相通讯，而且能上网。功能齐全，但…

阅读更多...

Arduino ESP32/ESP8266 +ST7735 1.8“tft中秋小时钟

Arduino ESP32/ESP8266 +ST7735 1.8“tft中秋小时钟

Arduino ESP32 ST7735 1.8"tft中秋小时钟 🌼原作者B站视频： ESP32中秋小时钟，表盘自动切换，代码开源，原图可下载（案例应用） 🎞tft ST7735 128160 1.8" 显示效果:(由于原作…

阅读更多...

MD5 绕过第二式：数组绕过

MD5 绕过第二式：数组绕过

文章目录参考环境推荐阅读强类型比较运算符雾来哈希碰撞目标王小云院士与白宫密码王小云院士两度破译白宫密码白宫密码亮剑十年磨一剑雾散曲径通幽WarningPHP 中的数组与 md5()尝试绕过PHP8 下的致命错误参考项目描述搜索引擎Bing、GoogleAI 大模型文心一言、通义千问、讯…

阅读更多...

JavaScript中如何确定this的值？如何指定this的值？

JavaScript中如何确定this的值？如何指定this的值？

🎀JavaScript中的this 在绝大多数情况下，函数的调用方法决定了this的值（运行时绑定）。this不能在执行期间被赋值，并且在每次函数呗调用时this的值也可能会不同。 🍿如何确定this的值： 在非严格…

阅读更多...

【React】React组件生命周期以及触发顺序（部分与vue做比较）

【React】React组件生命周期以及触发顺序（部分与vue做比较）

最近在学习React，发现其中的生命周期跟Vue有一些共同点，但也有比较明显的区别，并且执行顺序也值得讨论一下，于是总结了一些资料在这里，作为学习记录。 v17.0.1后生命周期图片初始化阶段由ReactDOM.render()触发 —…

阅读更多...

【Axure】元件库和母版、常见的原型规范、静态原型页面制作

【Axure】元件库和母版、常见的原型规范、静态原型页面制作

添加现有元件库点击元件库——载入当然也可以创建元件库，自己画自己保存建立京东秒杀母版静态原型页面的制作框架选择以iphone8的界面大小为例，顶部状态栏高度为20 左侧类似于标尺，因为图标、文字离最左侧的间距是不一样的信…

阅读更多...

Nat. Commun. | 大规模高分辨单光子成像

Nat. Commun. | 大规模高分辨单光子成像

本文由论文作者团队（课题组）投稿单光子雪崩二极管（Single Photon Avalanche Diode，简称SPAD）阵列因其极佳的单光子灵敏度而受到广泛关注，已广泛应用于量子通信与计算、荧光寿命成像、时间飞行成像等各个领域。与同样具有较高灵敏度的EMCCD和sCMOS相比，SPAD阵列能够在极…

阅读更多...

车载ADB环境搭建

车载ADB环境搭建

ADB是什么 ADB，即 Android Debug Bridge 是一种允许模拟器或已连接的 Android 设备进行通信的命令行工具，它可为各种设备操作提供便利，如安装和调试应用，并提供对 Unix shell（可用来在模拟器或连接的设备上运行各种命…

阅读更多...

SimpleCG动画示例--汉诺塔动画演示

SimpleCG动画示例--汉诺塔动画演示

前言 SimpleCG的使用方法在前面已经介绍了许多，有兴趣的同学如果有去动手，制作一些简单动画应该没多大问题的。所以这次我们来演示一下简单动画。我们刚学习C语言的递归函数时，有一个经典例子相信很多同学都写过，那就是汉诺塔。那…

阅读更多...

【C++】多线程的学习笔记——白话文版（bushi

【C++】多线程的学习笔记——白话文版（bushi

目录为什么要使用多线程例子代码结果首先要先学的库——thread库 thread的简介 thread的具体使用方法基本变量的定义注意（小重点） join函数的解读（重点） detach函数的解读注意关于vector和thread是联合使用 …

阅读更多...

【DLoopDetector（C++）】DBow2词袋模型loop close学习

【DLoopDetector（C++）】DBow2词袋模型loop close学习

0.前言最近读了两篇论文，论文作者开源了一种基于词袋模型DBoW2库的DLoopDetector算法，自己运行demo测试一下对应论文介绍：Bags of Binary Words for Fast Place Recognition in Image Sequences 开源项目Github地址：https://gi…

阅读更多...

P1541 [NOIP2010 提高组] 乌龟棋（4维背包问题）

P1541 [NOIP2010 提高组] 乌龟棋（4维背包问题）

[NOIP2010 提高组] 乌龟棋题目背景小明过生日的时候，爸爸送给他一副乌龟棋当作礼物。题目描述乌龟棋的棋盘是一行 N N N 个格子，每个格子上一个分数（非负整数）。棋盘第 1 1 1 格是唯一的起点，第 N N N 格是…

阅读更多...

C++代码示例：排列数简单生成工具

C++代码示例：排列数简单生成工具

文章目录前言代码仓库内容代码（有详细注释）编译和运行命令结果总结参考资料作者的话前言 C代码示例：排列数简单生成工具。代码仓库 yezhening/Programming-examples: 编程实例 (github.com)Programming-examples: 编程实例 (gitee.com) …

阅读更多...

GEO生信数据挖掘（四）数据清洗（离群值处理、低表达基因、归一化、log2处理）

GEO生信数据挖掘（四）数据清洗（离群值处理、低表达基因、归一化、log2处理）

检索到目标数据集后，开始数据挖掘，本文以阿尔兹海默症数据集GSE1297为例目录离群值处理删除低表达基因函数归一化，矫正差异数据标准化—log2处理完整代码上节围绕着探针ID和基因名称做了一些清洗工作，还做了重复值检查…

阅读更多...

牛客网_HJ2_计算某字符出现次数

牛客网_HJ2_计算某字符出现次数

HJ2_计算某字符出现次数原题思路代码运行截图收获原题 HJ2_计算某字符出现次数思路把输入的字符串和字符都变成大写或小写，然后逐一计数代码 #include <cctype> #include <iostream> #include <string> #include <algorithm> usi…

阅读更多...

java多线程相关介绍

java多线程相关介绍

1. 线程的创建和启动在 Java 中创建线程有两种方式。一种是继承 Thread 类并重写其中的 run() 方法，另一种是实现 Runnable 接口并重写其中的 run() 方法。创建完线程对象后，调用 start() 方法可以启动线程。 2. 线程的状态 Java 的线程在不同阶段会处于…

阅读更多...

C++八股

C++八股

1、简述一下C中的多态在面向对象中，多态是指通过基类的指针或引用，在运行时动态调用实际绑定对象函数的行为，与之相对应的编译时绑定函数称为静态绑定。静态多态静态多态是编译器在编译期间完成的，编译器会根据实参类型来选择…

阅读更多...

自动驾驶技术：现状与未来

自动驾驶技术：现状与未来

自动驾驶技术：现状与未来文章目录引言自动驾驶技术的现状自动驾驶技术的挑战自动驾驶技术的未来结论结论 2023星火培训【专项营】Apollo开发者社区布道师倾力打造，包含PnC、新感知等的全新专项课程上线了。理论与实践相结合，全新的PnC培训不…

阅读更多...

最新文章

推荐文章