Chatgpt如何引入新的知识?我们来看下ACL2023 预训练模型能否对新注入的知识进行推理这篇文章

一、概述

title:Can LMs Learn New Entities from Descriptions? Challenges in Propagating Injected Knowledge

论文地址:https://arxiv.org/abs/2305.01651

相关代码:

  1. EKP数据和代码:GitHub - yasumasaonoe/entity_knowledge_propagation
  2. MEND: Model Editing Networks using Gradient Decomposition:GitHub - eric-mitchell/mend: MEND: Fast Model Editing at Scale

1.1 Motivation

  1. 如何在预训练模型中引入最新的知识并验证模型能否对注入的知识进行推理呢?之前的模型编辑的方法注入知识只评估模型是否能复现原有知识,没有评估是否能对注入的知识进行推理。

1.2 Methods

  1. 通过两个完型填空任务来做这个实验
    1. 存在真实世界的的一个新实体数据集ECBD,以及简化版本easy-ECBD。
    2. 一个新的人工设置的模板的benchmark,需要对注入的知识进行各种级别的推理。
  1. 通过参数更新的方法以及非参数更新的方法来对比有效性
    1. 参数更新
      1. fine-tuning(全部参数 or 最后一层)
      2. MEND:通过新数据,一次性更新参数的方法
      3. ROME:先拿到某个新实体k的特征v,然后按照新实体的信息修改v,对其进行参数更新,学习新的知识
    1. 非参数更新
      1. in-context learning方法:不改变模型参数,直接将信息拼接到probe探针上

1.3 Conclusion

  1. 基于梯度的fine-tuning方法对注入的知识推理能力比较差,只当lexical重叠比较大才有提升。
  2. 直接将实体定义信息预先加到上下文(in-context-learning)获得了持续的提升,说明通过参数更新来注入知识还有很大的研究空间。

1.4 limitation

  1. 实验还考虑的不够全,因为某些实体的更新可能会牵扯到非常多其他实体,这里没有考虑这类实体。
  2. 只在英语上做了实验。
  3. 还需要尝试更大的模型和最新的一些参数更新的方法。

二、大纲

三、详细内容

1 评估是否能对引入的知识进行推理

  • 参数说明
    • <e, de, xe, ye>
    • e: 新实体
    • de: 新实体e定义的句子
    • xe:probe 探针,用于检查是否注入知识
    • ye: xe的理想答案
    • 知识编辑的方法是在原来的参数上,通过添加e,de来更新新的参数,即: θ′ ← update(θ, e, d )
  • prior work
    • 直接对注入的知识进行提问
  • this work
    • 不直接提问,根据注入的知识进行推理性质的提问

2 评测数据集说明

  • ECBD
    • 重新根据更新时间来组织ECBD数据集,这样来评估知识的的更新情况
    • e:wikipedia的实体词
    • definition:一般是wikipedia的第一句话
    • xe:探针句子,在wikipedia页面里main选出来的
    • goldspan:target span
  • ECBD-EASY
    • 从ECBD中挑选了一个简单的子集,其他definition句子de包含了target masked span y
    • 之前的MEND方法就是这种方式来做的,任务更简单
    • 评估方法:困惑度(由于tokenizer的不同,不同模型不好比较困惑度)
  • ENTITY INFERENCES
    • ECBD任务还是非常难,人类来做都非常难,需要非常多的知识和推理,为了更好控制的研究知识推理,构建了该数据集
    • 该数据集选择正确的span变得简单,相对于直接生成span,这里把它作为多选题
    • 两种推理类型
      • explicit:比较明确的,问的问题就在definition中
      • implicit:需要一些commonsense信息
    • 评估方法:accuracy 准确率 + specificity score 特异性

3 对比实验(参数更新方法以及incontext learning方法)

不同的模型架构可能对注入的知识也有影响,所以考虑了left-to-right以及seq-to-seq的架构,使用了GPT-Neo(1.3B)、T5-large、GPT2-XL(和ROME做比较)。

  • Finetuing
    • left-to-right模型(GPT-Neo):在de(定义描述)的数据上做next token prediction
    • filling models(T5):随机选择span来mask,注意不与entity重叠
    • 采用两种fine-tuning模式,更新全部参数或者last layer的参数
  • MEND(没咋看懂)
    • MEND(Mitchell et al., 2022)可以被视为一种超网络,它有效地将原始微调梯度转换为一次成功编辑基础模型参数的参数更新。这种方法旨在注入或编辑关于实体的单个事实,而不是一组关于实体的事实(即,一个完整的定义所包含的实体知识)。MEND参数在编辑数据集上进行训练,其中每个示例都包括输入-输出对、修改后的输出和局部性示例(用于测量敏感性)。MEND训练的目标是学习一个网络,该网络可以在不影响未修改的事实的情况下修改目标事实。
    • 爱可可AI前沿推介(10.23) - 知乎解读:大规模模型快速编辑。虽然大型预训练模型在各种下游任务上取得了令人印象深刻的结果,但最大的现有模型仍然会出错,甚至准确的预测也会随着时间的推移而变得过时。因为在训练时检测出所有这些错误是不可能的,所以让这些模型的开发者和终端用户能够纠正不准确的输出,同时保持模型的完整性是很有意义的。然而,大型神经网络所学习的表示的分布式、黑箱性质使得产生这种有针对性的编辑很困难。如果只有一个有问题的输入和新的期望输出,微调方法往往会过拟合;其他的编辑算法要么在计算上不可行,要么在应用于非常大的模型时根本没有效果。为了大规模实现简单的事后编辑,本文提出梯度分解模型编辑网络(MEND),一种小型辅助编辑网络的集合,使用单一期望输入-输出对,对预训练模型进行快速的局部编辑。MEND学习对通过标准微调获得的梯度进行转换,用梯度的低秩分解来使这种转换的参数化变得可行。即使是100亿以上的参数模型,MEND也可以在一天之内在单GPU上完成训练;一旦训练完成,MEND就可以快速应用新的编辑到预训练的模型上。对T5、GPT、BERT和BART模型的实验表明,MEND是唯一能对具有几千万到一百多亿参数的模型进行有效编辑的方法。
  • ROME
    • 通过将MLP视为键值存储年龄来执行知识编辑:它使用一个主题(如埃菲尔铁塔)来提取MLP中与该主题相关的“价值”。然后,它使用对MLP权重的一级修改来“重写”这个键值对。
  • in-context
    • 将definition加在probe的后面

4 实验结论

  • 总结:
    • finue-tuning方法,参数修改的方法,整体比较拉垮,MEND,ROME方法的模型在准确率有一定提升,但是有一些也牺牲了特异性,困惑度MEND方法甚至在GPT-Neo上还上升了
    • (in-context learning)输入增强的方法,也只有在输入相关的文本下有提升,输入不相关的文本下效果也是变差的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/47396.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机SCI期刊审稿人,一般关注论文的那些问题? - 易智编译EaseEditing

编辑主要关心&#xff1a; &#xff08;1&#xff09;文章内容是否具有足够的创新性&#xff1f; &#xff08;2&#xff09;文章主题是否符合期刊的受众读者&#xff1f; &#xff08;3&#xff09;文章方法学是否合理&#xff0c;数据处理是否充分&#xff1f; &#xff08;…

让AI替你打工?GPT提升开发效率指南

&#x1f449;导读 开发者日常的整个工作流中&#xff0c;AI 大模型能做什么&#xff1f;ChatGPT 等 AI 大模型能不能通过开发者的指引&#xff0c;一步步完成从技术方案输出、编码、测试、发布到运营维护的整套流程&#xff1f;使用中有什么避坑点&#xff1f;本文从实际研发流…

开源协议,曝出重大问题,目前无解

出品 | OSC开源社区&#xff08;ID&#xff1a;oschina2013) 《The Register》发布了探讨更新开源许可证的文章。作者的观点正如文章标题所言&#xff1a;开源许可证需要摆脱 20 世纪 80 年代的束缚&#xff0c;并不断发展以应对人工智能。 他指出&#xff0c;自由软件和开源许…

网课录屏用什么软件好?Camtasia极简操作,课程重点一目了然

后疫情时代&#xff0c;线上线下相结合的课程形式越来越火。身为人名教师这两年明显感觉压力倍增啊&#xff0c;以前同事之间聊工作都是你的备课笔记拿来看看呢&#xff0c;现在都变成了你的录课视频让我参考参考呢。 为了给学生输出高质量的课堂内容&#xff0c;一款好用的录…

解码聊天机器人技术:权威指南

关键词&#xff1a;聊天机器人、跨境电商客户服务 作为一个跨境电商品牌您需要知道&#xff0c;当品牌在一分钟内回答客户的问题时&#xff0c;59% 的客户更有可能完成购买。 Business Insider 的一项研究还发现&#xff0c;只要您提供的客户服务有效、方便、快捷&#xff0c;…

全球首个AI合成主播发布,效果以假乱真!揭秘背后技术原理

边策 李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI 搜狗又在乌镇世界互联网大会上搞了大新闻。 2016年&#xff0c;王小川在正式论坛里秀出AI同传&#xff0c;那是机器实时翻译技术&#xff0c;首次在高规格国际会议上实战应用。 而这一次&#xff0c;依然世界互联网大会&…

Python控制AI虚拟主播说话聊天源码分享

Python是非常简单可用的脚本语言,本次我们将介绍如何实用Python控制一个AI虚拟主播说话聊天。通过分析目前市场上可用的虚拟主播软件,发现Motionface是一个简单可用的虚拟主播软件,它提供简单的http接口,是实时响应的,不像其他虚拟主播软件(baidu,xunfei等)需要很高的算…

AI虚拟主播软件系统 搭建24小时不间断运营的数字人直播间的操作教程分享

现在直播都必须真人直播&#xff0c;没法做到24小时不间断直播。虚拟人直播系统&#xff0c;一天24小时在线直播&#xff0c;不要吃饭&#xff0c;也不要工资&#xff0c;每时每刻都在赚音浪&#xff0c;带货&#xff0c;那么具体AI虚拟主播软件是怎么操作的呢&#xff1f;今天…

虚拟主播怎么做出来的?今日安利:AI虚拟人物怎么弄?

某天&#xff0c;一位品牌店的老板向我寻求帮助&#xff0c;大概内容就是&#xff1a;“他最近要开拓线上店铺的直播渠道&#xff0c;直播时间较长&#xff0c;雇一位主播又费钱又辛苦&#xff0c;想制作一个符合品牌调性的AI虚拟人物来带货。”于是我跟他分享了制作虚拟主播的…

一文了解虚拟人主播

这两年&#xff0c;相信很多人都能在抖音、快手、微视等平台看到虚拟人主播的视频&#xff0c;形象逼真&#xff0c;表情动作自然&#xff0c;语言流畅&#xff0c;乍一看&#xff0c;就是一位真人&#xff01;那为什么会有这么多人或者企业选择用虚拟人来做主播呢&#xff1f;…

AI虚拟主播数字人技术实现Wav2Lip【附完整版教程】及【效果评测】

前言 建议直接阅读飞书文档&#xff1a;Docshttps://yv2c3kamh3y.feishu.cn/docx/S5AldFeZUoMpU5x8JAuctgPsnfg 近期很多饱子私信&#xff0c;想知道关于AI数字人主播的技术实现。现本篇就AI数字人虚拟主播的Wav2Lip技术进行实现与评测&#xff0c;后续还会有其他的相关技术实现…

什么是虚拟主播?虚拟数字人直播,不用出镜,不用露脸的直播方式

“虚拟主播”&#xff08;Virtual Youtuber&#xff0c;简称Vtuber&#xff09;是于2016年在Youtube等视频平台新出现的一类非真实视频主播。此类主播无需真人露脸&#xff0c;视频主体角色多为3D建模&#xff0c;是以依靠数字技术、人声、动作结合后的新产物。截止2018年7月&a…

虚拟主播频繁爆火,想了解虚拟主播的制作过程看这里

随着元宇宙概念的火热&#xff0c;以及我国经济向全面数字化发展转型&#xff0c;作为元宇宙入口的虚拟数字人是目前相关产业中最接地气、最先落地的产业。如果说虚拟人是一座冰山&#xff0c;那么我们看到的部分就是冰山水面以上的部分&#xff0c;而看不到的水面以下则是支撑…

基于大模型的虚拟数字人__虚拟主播实例

基于大模型的虚拟数字人__虚拟主播实例 本文目录&#xff1a; 一、技术的背景&#xff1a; 二、创意名称&#xff1a; 三、创意背景 四、创意目标 五、创意设计 六、技术实现路径 七、完整代码实现 八、创意总结 九、人工智能虚拟人物的一些优秀代表作品及其特点 十、…

科大讯飞今日发布“星火”认知大模型;谷歌一名高级软件工程师跳楼身亡;InsCode 支持 AI 编程|极客头条...

「极客头条」—— 技术人员的新闻圈&#xff01; CSDN 的读者朋友们早上好哇&#xff0c;「极客头条」来啦&#xff0c;快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 一分钟速览新闻点&#…

用Chat GPT来处理工作问题、Chat GPT处理重启auditd服务后/etc/audit/audit.rules文件内容消失和openssl对文件的加解密的使用说明

文章目录 说明Chat GPT处理重启auditd服务后/etc/audit/audit.rules文件内容消失Chat GPT咨询openssl对文件的加解密的使用说明【1&#xff0c;对文件的加解密&#xff08;示例&#xff0c;需输入口令&#xff09;&#xff1a;]【2&#xff0c;通过内核模块ecryptfs和软件包ecr…

【小尘送书-第一期】自动化办公应用大全(ChatGPT版):从零开始教编程小白一键搞定烦琐工作

大家好&#xff0c;我是小尘&#xff0c;欢迎关注&#xff0c;一起交流学习&#xff01;欢迎大家在CSDN后台私信我&#xff01;一起讨论学习&#xff0c;讨论如何找到满意的实习&#xff01; 本文目录 一、前言二、作者简介三、内容简介四、抽奖方式 一、前言 在现代社会&…

前沿重器[35] | 提示工程和提示构造技巧

前沿重器 栏目主要给大家分享各种大厂、顶会的论文和分享&#xff0c;从中抽取关键精华的部分和大家分享&#xff0c;和大家一起把握前沿技术。具体介绍&#xff1a;仓颉专项&#xff1a;飞机大炮我都会&#xff0c;利器心法我还有。&#xff08;算起来&#xff0c;专项启动已经…

【活动总结】0723-COC深圳社区职言职语第1季活动总结之第1视角

0723-COC深圳社区职言职语第1季活动总结 地球有自转&#xff0c;活动不能断&#xff0c;话题不能停。一场愉快的户外职场的畅谈交流会&#xff0c;就这样落下了帷幕…请大家跟随我的第一视角&#xff0c;一起看看我们的活动现场吧。 文章目录 1 活动简介2 活动过程2.1 活动宣传…

手把手教你如何微信公众号开发

最近的话&#xff0c;发现微信开发其实也有很多挺有意思的地方&#xff0c;比如最近很火的一款游戏“跳一跳”&#xff0c;也让我如此着迷。。但是&#xff0c;今天我所要讲的并不是对于小程序的开发&#xff0c;而是要说一下&#xff0c;关于微信开发的另外一个内容&#xff0…