文本生成论文阅读 Towards Implicit Content-Introducing for Generative Short-Text Conversation Systems

本篇论文实际上是对上一篇论文的优化(seq2BF),使用关键词作为软约束,即关键词不一定出现在生成文本中。

一、模型框架

本框架有三个部分组成:标准GRU;提示词GRU和融合单元。(标准GRU和提示词GRU不共享信息,标准GRU操作一个一般的解码过程,提示词GRU模仿这个过程,但将预测的提示词作为当前输入。 对于融合单元,它结合标准GRU和提示字GRU的隐藏状态以生成当前输出字。 实验结果证明了该方法的有效性。)
GRU(Gate Recurrent Unit)和LSTM(Long-Short Term Memory)一样,是循环神经网络(Recurrent Neural Network, RNN)的一种。目的为了解决长期记忆和反向传播中的梯度等问题而提出来的。
实际上GRU和LSTM的效果差别不大,但是GRU更容易进行训练,能够很大程度上提高训练效率,因此很多时候会更倾向于使用GRU。
本篇论文引入线索词作为生成过程中的附加信息。 关键点在于如何纳入此类信息。 目前常用的方法之一是通过多种门控机制对神经细胞进行修饰。 然而,这些方法都是专门为特定的场景设计的,当它们被用于其他任务时,效果并不像预期的那样好。 为了解决这个问题,我们提出了另一个独立的神经细胞–线索词GRU来处理辅助信息。 由于这种神经细胞可以很容易地被其他单元替换,因此极大地提高了灵活性和可重用性

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
本地信息初始化由蓝色表示,全局信息初始化包括蓝色箭头和绿色箭头。
第一步预测关键字;第二步将提示词纳入解码过程,各自生成响应。
 该模型设计了cue word gru单元,将关键词信息加入到每一步的状态更新。利用设计的fusion unit结构融合普通的GRU和cue word gru单元。关键词的选取与Seq2BF一样都是用PMI来计算。

注意此模型与Seq2BF的区别,该模型是把cue word的信息融合进了每次的循环,而不是像Seq2BF一样使用将cue word插入到forward阶段保证了cue word一定出现。

rGRU和SCGRU通过门控机制整合额外的信息,而SLGD和FGRU直接将信息融合到神经网络的的各个门中。(rGRU和SCGRU都是专门设计的门,对标准神经网络进行扩充来控制提示词但是结果相差很大,)

新知

作者在最后提到了矩形脉冲,矩形脉冲也是相关性的一个重要表现,表示融合单元的K门是如何平衡了Hy和Hw的影响的。信号是一种离散信号,形状多种多样,与普通模拟信号(如正弦波)相比,波形之间在时间轴不连续(波形与波形之间有明显的间隔)但具有一定的周期性是它的特点。最常见的脉冲波是矩形波(也就是方波)。脉冲信号可以用来表示信息,也可以用来作为载波,比如脉冲调制中的脉冲编码调制(PCM),脉冲宽度调制(PWM)等等,还可以作为各种数字电路、高性能芯片的时钟信号。


总结

**优点:**将cue word加入到了每一步的循环,有利于信息的充分利用

**缺点:**软约束导致cue word并不一定出现了生成文本,导致漏翻;仍然只适用于短文本;cue word选择不好,结果也可能不流畅

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5743.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

写文章、改句子、文章生成、AI生成器网址汇总

易撰: 易撰自媒体工具_让内容创作更高效 有免费有收费部分 免费金句吧 下面来介绍免费内容吧 易撰自媒体工具_让内容创作更高效 1.标题生成 2.搜索出现留下的网络用语、优美文句 3.质量检测 有免费次数限制 收费功能更强大 完美韵脚 免费使用,未发…

如何利用ChatPDF快速阅读英文论文,帮你写文章

如何利用ChatPDF快速阅读英文论文,帮你写文章 英语渣狂喜~确实惊艳到我了! 使用平台:https://www.chatpdf.com/ 1、上传PDF 访问官网:https://www.chatpdf.com/,界面很美,点击直接上传 PDF&…

如何用ChatGPT写一篇惊艳论文?!

作为一项人工智能技术,ChatGPT正在以飞快的速度向前发展,其强大的学习能力甚至可以用超乎想象来形容。 OpenAI公司带着最新的GPT-4开始“大杀四方”了~OpenAI推出GPT-4文本生成AI系统。紧随其后百度发布文心一言,开启智能对话新时代。 那么作为目前NLP领…

微信公众号客服功能对接【附带源码】

其实如果你之前做过对接微信公众号其它接口,那做起来就简单很多。如果和我一样是第一次对接微信接口就有点难了。(看了文档无从下手) 一、基本配置 1-1:准备一个认证的微信号,然后添加客服功能插件 1-2:配…

微信公众号对接流程说明

微信公众号对接流程说明 一、关于获取授权code 前端请求https://open.weixin.qq.com/connect/oauth2/authorize?appidAPPID&redirect_uriREDIRECTURI&response_typecode&scopesnsapi_base&stateSTATE#wechat_redirect 注意:redirect_uri的域名必…

让你的公众号拥有AI能力--微信对话开放平台

前段时间,微信上线了一个「微信对话开放平台」,旨在以对话交互为核心, 为有客服需求的个人、企业和组织提供智能业务服务与用户管理能力的技能配置平台,可利用提供的工具自主完成客服机器人的搭建。今天就来介绍一下这个对话开放平台&#xf…

chatgpt赋能python:Python读取扫描形成的PDF文件

Python读取扫描形成的PDF文件 PDF(Portable Document Format,便携式文档格式)是一种流行的文件格式,用于在不同操作系统和设备上的文档共享。与其他文档文件格式不同的是,PDF文件的内容无法编辑或修改,这使…

ChatGPT读PDF、生成思维导图的几种方案

大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、读书和自媒体。 日常办公,我们离不开pdf文档读取,思维导图制作,那么ChatGPT能够给我们什么帮助呢? 通常的方法是:我们…

ChatGPT提示词分享(2/100)翻译助手

我希望你能充当英语翻译、拼写纠正者和改进者。我将用任何语言与你交谈,你将检测语言,翻译它,并在我的文本的更正和改进版本中用英语回答。我希望你用更漂亮、更优雅、更高级的英语单词和句子来取代我的简化 A0 级单词和句子。保持意思不变&a…

利用chatGPT+剪映高效制作中英双语字幕(其它语言以此类推)

目 录 前 言 一、导出中文字幕 二、利用提示词在chatGPT上快速翻译 三、导入中英文字幕到剪映 四、展示效果 五、参考资料 前 言 ChatGPT可以帮助用户快速生成中英文对照的脚本,解决了在剪映中一个一个翻译中文的痛点,从而提高字幕制作的效率。这…

ChatGPT常见术语清单;大厂ChatGPT混战汇总;提示工程技巧完全指南(中译);真机会VS假机会 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『OpenAI/ChatGPT 高频常见词解释清单』一份速查表搞懂最热门 AI 术语 OpenAI 和 ChatGPT 的爆火,以超高的频率将大量AI术…

谈谈ChatGPT 背后的核心技术论文

以这两名工程师的争辩为代表,很多被辞退的Twitter员工宣称马斯克不懂技术。他们的争辩反映出硅谷大型互联网企业工程师的一个普遍趋势 输入几个简单的关键词,AI能帮你生成一篇短篇小说甚至是专业论文。作为上知天文下知地理对话语言模型,最近…

ChatGPT科研阅读论文应用插件(txyz.ai)使用初探

前言 ChatGPT没有办法直接阅读论文,但使用txyz.ai插件可以使用ChatGPT来帮助快速得到论文中想要的信息,特别是对于专业名词较多的文章,而且可以问它关于这篇文章的问题,能够加快研究的进程。刚开始了解到这个应用是一个ChatGPT插件…

不写代码、年薪百万,带你玩赚ChatGPT提示工程-基本提示

文章目录 前言一、文本摘要二、信息抽取三、问答四、文本分类五、对话六、代码生成七、推理总结 前言 随着ChatGPT的大火,提示工程在大模型中的重要性不言而喻,本文参考国外Prompt Engineering Guide完成国内中文版本的《提示工程指南》,希望…

测试人员可以用chatgpt做什么

作为一名测试人员,一用上chatgpt就迫不及待想要看它的“测试水平”如何。 1、测试人员每个迭代都离不开的编写测试用例 下面是对话截图: 有经验的测试人员一眼就能看出它只把核心流程覆盖了,不过不要紧,这类用例可以为自己节省了…

ChatGPT和Claude 对比测试(以Review MLIR Codegen代码为例)

Claude在MLIR代码分析上完全超越了ChatGPT并表现十分惊艳,请阅读全文或者自己注册感受它的强大。结论:在本文的任务中,Claude > ChatGPT >> NewBing 0x0. 前言 这里将以oneflow IR部分中的一个Codegen任务(目标是在mlir…

Z-library 官方正式回归!

上一次写 Z-library 这个网站,还是在年前,当时 Z-lib 的主域名被美国官方搞了后,被迫转移到了深层网络。 但关于 Z-lib 的故事并没有结束,而是在压力重重下,这个神仙站里的内容被国内外的无数团队、无数项目续上了命。…

阿里云轻量服务器 利用宝塔面板 为域名部署SSL证书

除了在Lets Encrypt网站制作服务器SSL证书以外,阿里云上申请SSL证书的步骤更加的简单。以下先给出前者的教程博客,感兴趣的可以移步观看 申请Let‘s Encrypt永久免费SSL证书_栗少的博客-CSDN博客_letsencrypt 一、在阿里云平台进行域名置购和备案&…

Linux 禁用23端口

禁用23端口 文章目录 前言检查23端口是否被占用正常情况:23端口是没有被使用的。特殊情况:不排除个别系统使用了23端口。 看看 ChatGpt 是怎么处理的?步骤一:vim /etc/services 编辑,禁用23端口是必要的。:wq保存修改。…

Docker翻脸暂停账户,强制收费,不再开源!

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 作者 | 王瑞平 来自:51CTO技术栈 前几日,Docker Hub出了一件大事!但凡创建了“organisation”的用户都收到了一封含有简短PDF链接的邮件。邮件的内容“金钱味”十足&…