「深度学习」循环神经网络RNN

「深度学习」循环神经网络RNN

news/2024/12/29 16:54:47/文章来源:https://blog.csdn.net/qq_52063383/article/details/136009054

一、序列模型的例子

二、数学符号定义

X^{(i)<t>}：训练样本 i 的输入序列的第 t 个元素。

T_{X}^{i}：训练样本 i 的输入序列的长度。

Y^{(i)<t>}：训练样本 i 的输出序列的第 t 个元素。

T_{Y}^{i}：训练样本 i 的输出序列的长度。

三、举例：识别人名

【输入和输出序列长度相同】

1、数据表示

准备 Vocabulary/Dictionary

将所有要用到的单词放在一起，做成清单 —— 将每个单词用一位 one-hot 表示

遇见没见过的单词，常见新标记 Unknown Word，使用 <UNK> 来表示

2. 标准神经网络存在的问题

对于不同的例子，输入和输出会有不同的长度
不共享从文本的不同位置学到的特征

3. 循环神经网络 (RNN)

(1) 构建 RNN

循环神经网络从左向右扫描数据，每一步所用的参数是共享的

缺点：只使用当前输入之前的序列信息来做预测 —— 解决方法：双向循环神经网络(BRNN)

(2) 前向传播

损失函数：

用向量简化符号：

(3)通过时间的反向传播

四、不同类型的循环神经网络

多对多型（如机器翻译）、多对一型、一对一型（标准的小型神经网络）、一对多型、注意力结构

如音乐生成：、机器翻译：

五、RNN 构建语言模型

1. 定义语言模型

用 y^{<i>} 来表示输入的文本序列 x^{<i>} = y^{<i-1>}

训练集: 大量的英文文本 语料库 (large corpus)

句子结尾：增加额外的标记 EOS (可选)

未知词：增加额外的标记 UNK

2. 建立 RNN 模型

通过前面输入的单词，预测下一个输出单词的概率。

定义代价函数 (softmax)：

L (\overline{y}^{<t>}, y^{<t>}) = -\sum{y_{i}^{<t>} log\overline{y}_{i}^{<t>}}

L = \sum{L^{<t>} (\overline{y}^{<t>}, y^{<t>})}
给定新句子输出的概率：

P(y^{<1>}, y^{<2>},...,y^{<n>}) = P(y^{<1>})P(y^{<2>}|y^{<1>})...P(y^{<n>}|y^{<1>}y^{<2>}...y^{<n-1>})

3. 新序列采样

序列模型：模拟了任意特定单词序列的概率

新序列采样：对上述概率分布进行采样，根据训练好的模型，生成新的单词序列/随机的句子。

绝大多数使用基于词汇的语言模型，基于字母的语言模型将得到太长的序列，消耗算力。

六、双向循环神经网络 (BRNN)

两个前向传播：一个从前往后、一个从后往前 —— 既可知道以前的信息，也可以知道未来的信息

基本单元可以是标准 RNN 单元，也可以是 GRU 单元或 LSTM 单元

常见：带有 LSTM 单元的双向 RNN 模型

缺点：需要完整的数据序列

七、深层循环神经网络 (DRNNs)

a^{[l]<t>}：第 l 层 t 时刻的激活值

基本单元可以是标准 RNN 单元，也可以是 GRU 单元或 LSTM 单元

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/253644.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

[大厂实践] Netflix容器平台内核panic可观察性实践

[大厂实践] Netflix容器平台内核panic可观察性实践

在某些情况下，K8S节点和Pod会因为出错自动消失，很难追溯原因，其中一种情况就是发生了内核panic。本文介绍了Netflix容器平台针对内核panic所做的可观测性增强，使得发生内核panic的时候，能够导出信息，帮助排…

阅读更多...

Linux（二）

Linux（二）

远程登录 Linux大多应用于服务器，而服务器不可能像PC一样放在办公室，它们是放在IDC机房的，所以我平时登录linux系统都是通过远程登录的。 Linux系统中是通过ssh服务实现的远程登录功能。默认ssh服务开启了22端口，而且当我们安装…

阅读更多...

计划任务功能优化，应用商店上架软件超过100款，1Panel开源面板v1.9.6发布

计划任务功能优化，应用商店上架软件超过100款，1Panel开源面板v1.9.6发布

2024年2月7日，现代化、开源的Linux服务器运维管理面板1Panel正式发布v1.9.6版本。在v1.9.5和v1.9.6这两个小版本中，1Panel针对计划任务等功能进行了多项优化和Bug修复。此外，1Panel应用商店新增了3款应用，上架精选软件应用超过1…

阅读更多...

基于大规模连续多目标优化的共轭梯度-进化集成算法

基于大规模连续多目标优化的共轭梯度-进化集成算法

声明：文章题目字数有限，翻译水平有限，仅供参考！ 原题目: Integrating Conjugate Gradients Into Evolutionary Algorithms for Large-Scale Continuous Multi-Objective Optimization 引：这么久了，又捡起…

阅读更多...

C++之std::tuple(一) : 使用精讲(全)

C++之std::tuple(一) : 使用精讲(全)

相关系列文章 C之std::tuple(一) : 使用精讲(全) C三剑客之std::variant(一) : 使用 C三剑客之std::variant(二)：深入剖析深入理解可变参数(va_list、std::initializer_list和可变参数模版) std::apply源码分析目录 1.简介 2.std::ignore介绍 3.创建元组 3.1.…

阅读更多...

spring boot打完jar包后使用命令行启动，提示xxx.jar 中没有主清单属性

spring boot打完jar包后使用命令行启动，提示xxx.jar 中没有主清单属性

在对springBoot接口中间件开发完毕后，本地启动没有任何问题，在使用package命令打包也没异常，打完包后使用命令行：java -jar xxx.jar启动发现报异常：xxx.jar 中没有主清单属性，具体解决方法如下：…

阅读更多...

华为云账号注销之后账号下的域名丢了怎么办？记录一次域名转移权限的经历

华为云账号注销之后账号下的域名丢了怎么办？记录一次域名转移权限的经历

背景我之前在阿里云上买了个域名，有效期10年的，然后在2023年1月末转移到华为云了，交了一年的域名费用，买了一个一年的华为云服务器一年之后，华为云的服务器也到期了，我就想着参加新用户计划&#xff0c…

阅读更多...

vscode 无法远程连接waiting the server log

vscode 无法远程连接waiting the server log

使用版本报错信息相关日志 [17:32:59.765] > Waiting for server log... [17:32:59.801] > Waiting for server log... [17:32:59.831] > > * > * Visual Studio Code Server > * > * By using the software, you agree to > * the Visual Studio…

阅读更多...

[算法前沿]--059-大语言模型Fine-tuning踩坑经验之谈

[算法前沿]--059-大语言模型Fine-tuning踩坑经验之谈

前言由于 ChatGPT 和 GPT4 兴起，如何让人人都用上这种大模型，是目前 AI 领域最活跃的事情。当下开源的 LLM（Large language model）非常多，可谓是百模大战。面对诸多开源本地模型，根据自己的需求，选择适合自己的基座模型和参数量很重要。选择完后需要对训练数据进行预处…

阅读更多...

MySQL篇----第十四篇

MySQL篇----第十四篇

系列文章目录文章目录系列文章目录前言一、MySQL 数据库作发布系统的存储，一天五万条以上的增量，预计运维三年,怎么优化？二、锁的优化策略三、索引的底层实现原理和优化四、什么情况下设置了索引但无法使用前言前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽…

阅读更多...

BGP协议

BGP协议

1.BGP相关概念 1.1 BGP的起源不同自治系统（路由域）间路由交换与管理的需求推动了EGP的发展，但是EGP的算法简单，无法选路，从而被BGP取代。自治系统：（AS） IGP：自治系统…

阅读更多...

【Linux】gdb调试与make/makefile工具

【Linux】gdb调试与make/makefile工具

目录导读 1. make/Makefile 1.1 引入 1.2 概念 1.3 语法规则 1.4 示例 2. Linux调试器-gdb 2.1 引入 2.2 概念 2.3 使用导读我们在上次讲了Linux编辑器gcc\g的使用，今天我们就来进一步的学习如何调试，以及makefile这个强大的工具。 1. mak…

阅读更多...

OpenCV-32 膨胀操作

OpenCV-32 膨胀操作

膨胀是与腐蚀相反的操作，基本原理是只要保证卷积核的锚点是非0值，周边无论是0还是非0值，都变为0。使用API---dilate（img， kernel， iterationms 1） 示例代码如下： import cv2 imp…

阅读更多...

【图论】基环树

【图论】基环树

基环树其实并不是树，是指有n个点n条边的图，我们知道n个点n-1条边的连通图是树，再加一条边就会形成一个环，所以基环树中一定有一个环，长下面这样： 由基环树可以引申出基环内向树和基环外向树基环内向树如…

阅读更多...

学习VR全景拍摄，如何选择适合的VR全景设备？

学习VR全景拍摄，如何选择适合的VR全景设备？

随着VR全景技术的不断成熟和发展，VR全景已经成为摄影爱好者、地产行业、中介经纪人、广告、企业宣传等行业从业者们乐于尝试的新领域、新手段。如何选择合适的VR全景设备成为了一个重要的问题。今天，和大家聊一聊，不同行业、人群和用途更适合…

阅读更多...

【Qt】Android上运行keeps stopping, Desktop上正常

【Qt】Android上运行keeps stopping, Desktop上正常

文章目录问题 & 背景背景问题解决方案One More ThingTake Away 问题 & 背景背景在文章【Qt】最详细教程，如何从零配置Qt Android安卓环境中，我们在Qt中配置了安卓开发环境，并且能够正常运行。但笔者在成功配置并完成上述文章…

阅读更多...

【蓝桥杯冲冲冲】[NOIP2017 提高组] 宝藏

【蓝桥杯冲冲冲】[NOIP2017 提高组] 宝藏

蓝桥杯备赛 | 洛谷做题打卡day29 文章目录蓝桥杯备赛 | 洛谷做题打卡day29[NOIP2017 提高组] 宝藏题目背景题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1样例 #2样例输入 #2样例输出 #2提示题解代码我的一些话[NOIP2017 提高组] 宝藏题目背景 NOIP2017 D2T2 题目描…

阅读更多...

ChatGPT辅助编程，一次有益的尝试

如果大家想学习PCIe，搜索网上的信息，大概率会看到chinaaet上Felix的PCIe扫盲系列的博文 Felix-PCIe扫盲每次看这个系列博文的时候，我都在想有没有什么方法可以把这个系列的博文都保存到一个pdf文件中，这样方便阅读。于是有了下…

阅读更多...

tkinter绘制组件（41）——菜单按钮

tkinter绘制组件（41）——菜单按钮

tkinter绘制组件（41）——菜单按钮引言布局函数结构按钮部分菜单显示完整代码函数效果测试代码最终效果 github项目pip下载结语引言 TinUI5的新控件，菜单按钮，menubutton。这是一个与TinUI菜单（menubar&#xff0…

阅读更多...

算法之双指针系列1

算法之双指针系列1

目录一：双指针的介绍 1：快慢指针 2：对撞指针二：对撞指针例题讲述一：双指针的介绍在做题中常用两种指针，分别为对撞指针与快慢指针。 1：快慢指针简称为龟兔赛跑算法，它的基…

阅读更多...

最新文章

推荐文章