机器学习笔记：RNN值Teacher Forcing

机器学习笔记：RNN值Teacher Forcing

news/2024/12/26 9:30:59/文章来源:https://blog.csdn.net/qq_40206371/article/details/134203207

1 基本介绍

Teacher forcing是一种在训练循环神经网络（RNN）时使用的技术，尤其是在序列生成任务中，如机器翻译、文本生成或语音合成。
这种方法的目的是更有效地训练网络预测下一个输出，给定一系列先前的观察结果。

1.1 标准RNN训练过程的问题

当训练一个用于序列生成的RNN时，通常会让网络预测序列中的下一个元素。（这种模式又被称为free-running mode / autoregressive mode）
- 在标准的训练过程中，网络的预测会被送回作为下一个时间步骤的输入。
- 但是，在初始阶段，由于网络的参数还没有很好的调整，这些预测可能会相当不准确。
- 这种不准确性可以在网络中累积，并可能导致训练过程变得低效。
  - （某一个单词预测错了，后面会跟着错，导致模型很难收敛）

1.2 Teacher Forcing的工作原理

为了克服这个问题，teacher forcing在训练期间不使用模型自己的预测作为下一步的输入，而是使用真实的输出序列的当前元素。
换句话说，在训练时刻t，模型预测时间t的输出后，不是将这个预测值用作时间t+1的输入，模型而是使用真实的数据，即目标序列在时间t+1的真实值。
这样，即使前一个预测不准确，网络也可以在准确的数据指导下继续学习。

2 优点

快速收敛： 由于网络接收到准确的信息，它通常可以更快地学习正确的参数。
稳定训练： 防止错误的累积和传播，使得整个训练过程更加稳定
并行保证：保证 Transformer 模型能够在训练过程中完全并行计算所有token

3 缺点

露珠效应（Exposure Bias）： 在真实应用（推理阶段）中，网络只能依赖于它自己的预测来生成序列，这可能导致在训练时没有遇到的错误。
不一致的学习信号： 训练和推理时的行为不一致，可能会导致推理时性能下降。

4 teacher forcing ratio

Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks 2015

模型在训练过程中的每一个steps，有 p的概率选择使用 teachering-forcing，有 1−p 的概率选择使用 Autoregressive。
模型在训练前期，p应该尽可能的大，这样能够加速收敛；而在快要结束训练的时候， p 尽可能的小，让模型在 Autoregressive 的方案中尽可能的修复自身生成的错误。
- p可以随着训练的Epoch 进行衰减：Exponential Decay, Inverse Sigmoid decay 和 Linear decay

上面的这个概率 p ，是针对一个token而言的，而不是针对整句话。
- 也就是说在解码过程中，每个token的生成，都要进行着这么一次概率的选择。
- 论文中指出，如果是整句话进行概率选择的话，效果会比较差

Always Sampling：相当于在训练过程只使用Autoregressive 方案（每次使用上一步的预测单词），可以发现模型效果非常差，收敛有问题。
Uniform Scheduled Sampling：每次都有0.5的概率选择 Teacher-Forcing，0.5的概率选择Autoregressive，效果也比 Scheduled-Sampling 要差

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/183262.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

11.4-GPT4AllTools版本已开始对小部分GPT3.5用户内测推送

11.4-GPT4AllTools版本已开始对小部分GPT3.5用户内测推送

OpenAI已经开始小规模推送GPT4 AllTools功能，部分GPT博主已经第一时间体验了此功能，此功能特色是整合目前的多模态功能以及文件上传和联网模块，无需切换，更要全面综合可上传包括 PDF、数据文件在内的任意文档，并进行分…

阅读更多...

YOLOv8优化：block系列篇 | Neck系列篇 |可重参化EfficientRepBiPAN优化Neck

YOLOv8优化：block系列篇 | Neck系列篇 |可重参化EfficientRepBiPAN优化Neck

🚀🚀🚀本文改进：可重参化EfficientRepBiPAN优化Neck 如何在YOLOv8下使用：1）结合neck； 🚀🚀🚀EfficientRepBiPAN在各个领域都有ying 🚀🚀🚀YOLOv8改进专栏：http://t.csdnimg.cn/hGhVK 学姐带你学习YOLOv8，从入门到创新，轻轻松松搞定科研； 1.原理…

阅读更多...

AI：63-基于Xception模型的服装分类

AI：63-基于Xception模型的服装分类

🚀 本文选自专栏：AI领域专栏从基础到实践，深入了解算法、案例和最新趋势。无论你是初学者还是经验丰富的数据科学家，通过案例和项目实践，掌握核心概念和实用技能。每篇案例都包含代码实例，详细讲解供大家学习。 📌📌📌在这个漫长的过程，中途遇到了不少问题，但是…

阅读更多...

猫头虎分享从Python到JavaScript传参数：多面手的数据传递术

猫头虎分享从Python到JavaScript传参数：多面手的数据传递术

🌷🍁 博主猫头虎带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~🌺 &a…

阅读更多...

qt报错permission denied

qt报错permission denied

写fk项目的时候，报这个错，然后网上查，说的是因为之前运行的qt进程没有关闭，然后我在任务管理器上查看，却没有看见有我正在运行的qt程序，我再出现清除 qmake也不可以，然后我再去删除out目录下的所…

阅读更多...

【Linux】vim

【Linux】vim

文章目录一、vim是什么？二、命令模式三、插入模式四、底行模式五、vim配置一、vim是什么？ Vim是一个强大的文本编辑器，它是Vi的增强版，支持多种语法高亮、插件扩展、多模式操作等功能。Vim有三种基本的工作模式：命…

阅读更多...

apachesolr启动带调试

apachesolr启动带调试

这里solr.cmd报错，报错原因是java版本问题，后面发现这是因为多个java版本导致读取java_home失败， 那么我们修改solr.cmd中的JAVA_HOME为SOLR_JAVA_HOME IF DEFINED SOLR_JAVA_HOME set "JAVA_HOME%SOLR_JAVA_HOME%"环境变量将SOLR…

阅读更多...

k8s提交spark应用消费kafka数据写入elasticsearch7

k8s提交spark应用消费kafka数据写入elasticsearch7

一、k8s集群环境 k8s 1.23版本，三个节点，容器运行时使用docker。 spark版本时3.3.3 k8s部署单节点的zookeeper、kafka、elasticsearch7 二、spark源码 https://download.csdn.net/download/TT1024167802/88509398 命令行提交方式 /opt/module/spark…

阅读更多...

Educational Codeforces Round 157 （A--D）视频详解

Educational Codeforces Round 157 （A--D）视频详解

Educational Codeforces Round 157 （A--D）视频详解视频链接A题代码B题代码C题代码D题代码视频链接 Educational Codeforces Round 157 （A–D）视频详解 A题代码 #include<bits/stdc.h> #define endl \n #define deb(x)…

阅读更多...

turtle绘制分形树-第10届蓝桥杯省赛Python真题精选

turtle绘制分形树-第10届蓝桥杯省赛Python真题精选

[导读]：超平老师的Scratch蓝桥杯真题解读系列在推出之后，受到了广大老师和家长的好评，非常感谢各位的认可和厚爱。作为回馈，超平老师计划推出《Python蓝桥杯真题解析100讲》，这是解读系列的第5讲。 turtle绘制分形树&…

阅读更多...

百度上线“文心一言”付费版本，AI聊天机器人市场竞争加剧

百度上线“文心一言”付费版本，AI聊天机器人市场竞争加剧

原创 | 文 BFT机器人百度不愧是我国AI技术领域的先行者，每年致力于人工智能领域取得技术产品的突破和创新。据爆料称，百度的文心一言有突破了新境界，开创了文心大模型4.0会员版本。从线上的to C产品到试水商业化，百度都是争先走…

阅读更多...

python爬取Web of science论文信息

python爬取Web of science论文信息

一、python爬取WOS总体思路 (一)拟实现功能描述 wos里面，爬取论文的名称，作者名称，作者单位，引用数量要求：英文论文、期刊无论好坏检索关键词：zhejiang academy of agricultural sciences、 xianghu lab…

阅读更多...

Android 多点触控

Android 多点触控

三种类型 :接力型 /配合型 /单独型单点触控 package com.example.myapplication.viewimport android.content.Context import android.graphics.Canvas import android.graphics.Paint import android.util.AttributeSet import android.view.MotionEvent import android.vi…

阅读更多...

优思学院｜诺桑比亚大学精益六西格玛大会 2023

优思学院｜诺桑比亚大学精益六西格玛大会 2023

国际精益六西格玛研究所（ILSSI）今年将赞助诺桑比亚大学（Northumbria University）的第九届国际精益六西格玛大会，大会将于2023年11月13日和14日在英国新卡斯尔市，诺桑比亚大学举行。这次大会的核心主题是&a…

阅读更多...

埃隆·马斯克的 AI 聊天机器人 Grok 已经上线

埃隆·马斯克的 AI 聊天机器人 Grok 已经上线

昨天，埃隆马斯克 (Elon Musk) 通过他的公司 xAI 推出了一款名为 Grok 的新型人工智能聊天机器人。这款新的聊天机器人将通过 Twitter 更新实时获取世界知识，使其成为最新的对话 AI 系统。 Grok 的独特和基本优势在于它可以通过 𝕏 平台实时了…

阅读更多...

四.pyqt5 登录界面和功能

四.pyqt5 登录界面和功能

一.使用qt creator 设置登录界面主界面为之前设计的界面 from123.py 文章地址：三.listview或tableviw显示二.导出ui文件为py文件 # from123.py 为导出 py文件 form.ui 为 qt creator创造的 ui 文件 pyuic5 -o x:\xxx\Fromlogin20230809.py form.ui三.python 显…

阅读更多...

Nacos-2.2.2源码修改集成高斯数据库GaussDB，postresql

Nacos-2.2.2源码修改集成高斯数据库GaussDB，postresql

一 ，下载代码 Release 2.2.2 (Apr 11, 2023) alibaba/nacos GitHub 二， 执行打包 mvn -Prelease-nacos -Dmaven.test.skiptrue -Drat.skiptrue clean install -U 或 mvn -Prelease-nacos ‘-Dmaven.test.skiptrue’ ‘-Drat.skiptrue’ clean instal…

阅读更多...

网络运维Day05

网络运维Day05

文章目录实验环境用户与组概述用户账号创建查看用户-查创建用户-增修改用户属性-改删除用户-删用户密码管理交互式修改密码非交互式修改密码用户初始配置文件基本权限和归属基本权限的类别权限适用对象(归属)查看权限修改权限设置基本权限如何判断用户对某目录所具备怎样的…

阅读更多...

研发管理用什么软件？

研发管理用什么软件？

研发管理用什么软件研发管理用的软件有：1、JIRA；2、Confluence；3、彩虹PDM软件。彩虹PDM软件是由南宁市二零二五科技有限公司自主研发，为用户提供“产品全生命周期管理解决方案”。产品结构管理、BOD管理、零部件管理、工艺管理…

阅读更多...

SS928开发板开发记录三： nfs 挂载

SS928开发板开发记录三： nfs 挂载

1.创建nfs文件 1.安装nfs sudo apt-get install nfs-kernel-server 2.创建文件 sudo mkdir /home/nfsroot 3.给权限 sudo chmod 777 nfsroot 4.设置 vim /etc/exports 最后一行加入 /nfsroot *(rw,sync,no_root_squash)5. 重启nfs sudo service nfs-kernel-server r…

阅读更多...

最新文章

推荐文章