WebGLM综述以及相关工作

清华唐杰新作WebGLM:参数100亿、主打联网搜索,性能超OpenAI WebGPT
github仓库地址:https://github.com/THUDM/WebGLM
上周五在WAIC 上的论坛报告回放。先放两个供大家参考,另外的报告会陆续放在 B 站。另外还有一个贴近落地实践的 prompt 课程,近期会发在 B 站上。

模型地址:https://huggingface.co/THUDM/WebGLM
【报告】ChatGLM 的路径探索
https://www.bilibili.com/video/BV1cm4y1E7uV

【报告】WebGLM: 检索增强的大规模预训练模型
https://www.bilibili.com/video/BV1f94y1q7pU/
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Atlas :归根结底,检索增强模型的目标是期望模型不仅学会记忆数据,同时希望模型学会自己找到数据,这点特性在许多知识密集型的任务中具有极大的优势并且检索增强模型也在这些领域取得了巨大的成功,但是检索增强是否适用于小样本学习却不得而知。回到 Meta AI 的这篇论文,便成功试验了检索增强在小样本学习中的应用,Atlas 便应运而生。https://zhuanlan.zhihu.com/p/564646449
在这里插入图片描述Atlas 拥有两个子模型,一个检索器与一个语言模型。当面对一个任务时,Atlas 依据输入的问题使用检索器从大量语料中生成出最相关的 top-k 个文档,之后将这些文档与问题 query 一同放入语言模型之中,进而产生出所需的输出。在这里插入图片描述
Atlas 模型的基本训练策略在于,将检索器与语言模型使用同一损失函数共同训练。检索器与语言模型都基于预训练的 Transformer 网络,其中:

检索器基于 Contriever 设计,Contriever 通过无监督数据进行预训练,使用两层编码器,query 与 document 被独立的编码入编码器中,并通过相应输出的点乘获得 query 与 document 的相似度。这种设计使得 Atlas 可以在没有文档标注的情况下训练检索器,从而显著降低内存需求。
语言模型基于 T5 进行训练,将不同文档与 query 相互拼接,由编码器分别独立处理,最后,解码器对于所有检索的段落串联进行 Cross-Attention 得到最后的输出。这种 Fusion-in-Decoder 的方法有利于 Atlas 有效的适应文档数量的扩展。
值得注意的是,作者对比试验了四种损失函数以及不做检索器与语言模型联合训练的情况,结果如下图:
在这里插入图片描述

可以看出,在小样本环境下,使用联合训练的方法所得到的正确率显著高于不使用联合训练的正确率,因此,作者得出结论,检索器与语言模型的这种共同训练是 Atlas 获得小样本学习能力的关键。

  1. 实验结果
    在大规模多任务语言理解任务(MMLU) 中,对比其他模型,Atlas 在参数量只有 11B 的情况下,具有比 15 倍于 Atlas 参数量的 GPT-3 更好的正确率,在引入多任务训练后,在 5-shot 测试上正确率甚至逼近了 25 倍于 Atlas 参数量的 Gopher。
    在这里插入图片描述

在开放域问答的两个测试数据——NaturalQuestions 以及 TriviaQA 中,对比了 Atlas 与其他模型在 64 个例子上的表现以及全训练集上的表现如下图所示,Atlas 在 64-shot 中取得了新的 SOTA,在 TrivuaQA 上仅用 64 个数据便实现了 84.7% 的准确率。

在这里插入图片描述

在事实核查任务(FEVER)中,Atlas 在小样本的表现也显著优于参数量数十倍于 Atlas 的 Gopher 与 ProoFVer,在 15-shot 的任务中,超出了 Gopher 5.1%。
在这里插入图片描述

在自家发布的知识密集型自然语言处理任务基准 KILT 上,在一些任务里使用 64 个样本训练的 Atlas 的正确率甚至接近了其他模型使用全样本所获得的正确率,在使用全样本训练 Atlas 后,Atlas 在五个数据集上都刷新了 SOTA。
在这里插入图片描述

  1. 可解释性、可控性、可更新性
    根据这篇论文的研究,检索增强模型不仅兼顾了更小与更好,同时在可解释性方面也拥有其他大模型不具备的显著优势。大模型的黑箱属性,使得研究者很难以利用大模型对模型运行机理进行分析,而检索增强模型可以直接提取其检索到的文档,从而通过分析检索器所检索出的文章,可以获得对 Atlas 工作更好的理解。

譬如,论文发现,在抽象代数领域,模型的语料有 73% 借助了维基百科,而在道德相关领域,检索器提取的文档只有3%来源于维基百科,这一点与人类的直觉相符合。如下图左边的统计图,尽管模型更偏好使用 CCNet 的数据,但是在更注重公式与推理的 STEM 领域,维基百科文章的使用率明显上升。
在这里插入图片描述

而根据上图右边的统计图作者发现,随着检索出的文章中包含正确答案的次数的升高,模型准确率也不断上升,在文章不包含答案时正确只有 55%,而在答案被提到超过 15 次时,正确率来到了 77%。除此之外,在人为检查了 50 个检索器检索出的文档时,发现其中有 44% 均包含有用的背景信息,显然,这些包含问题背景信息的资料可以为研究者扩展阅读提供很大的帮助。

一般而言,我们往往会认为大模型存在训练数据“泄露”的风险,即有时大模型针对测试问题的回答并非基于模型的学习能力而是基于大模型的记忆能力,也就是说在大模型学习的大量语料中泄露了测试问题的答案,而在这篇论文中,作者通过人为剔除可能会发生泄露的语料信息后,模型正确率从56.4%下降到了55.8%,仅仅下降0.6%,可以看出检索增强的方法可以有效的规避模型作弊的风险。

最后,可更新性也是检索增强模型的一大独特优势,检索增强模型可以无需重新训练而只需更新或替换其依托的语料库实现模型的时时更新。作者通过构造时序数据集,如下图所示,在不更新 Atlas 参数的情况下,仅仅通过使用 2020 年的语料库 Atlas 便实现了 53.1% 的正确率,而有趣的是即使是用2020年的数据微调 T5 ,T5 也没有很好的表现,作者认为,原因很大程度上是由于 T5 的预训练使用的数据是 2020 年以前的数据。

在这里插入图片描述

  1. 结论
    我们可以想象有三个学生,一个学生解题只靠死记硬背,一道数学题可以把答案分毫不差的背诵下来,一个学生就靠查书,遇到不会先去翻找资料找到最合适的再一一作答,而最后一个学生则天资聪明,简单的学习一些教科书上的知识便可以自信去考场挥毫泼墨指点江山。

显然,小样本学习的理想是成为第三个学生,而现实却很可能停留在了第一个学生之上。大模型很好用,但“大”绝不是模型最终的目的,回到小样本学习期望模型具有与人类相似的推理判断与举一反三能力的初心,那么我们可以看到,这篇论文是换个角度也好是前进一步也罢,至少是让那个学生可以轻松一点不往脑袋里装那么多可能大量冗余的知识,而可以拎起一本教科书轻装上阵,或许哪怕允许学生开卷考试带着教科书不断翻查,也会比学生生搬硬套死记硬背更接近智能吧!

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
检索器:搜索引擎检索器,打分器 无人工标注
在这里插入图片描述

大模型采用作为标签,大模型的结果90.2%是正确的
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
提出一套用于评价带引用长文本问答的指标
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/57522.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

预测超级计算机排名2020,足球超级计算机预测2019/2020英超联赛排名

原标题:足球超级计算机预测2019/2020英超联赛排名 英超联赛很快就将拉开帷幕,人们都在急切地等待着。球迷们已经开始猜测他们俱乐部的最终排名怎么样了。但是光凭人们自己要想 预测英超联赛的最终结果是不可能的。但是在赛季开始之前,有一个足…

超级计算机预测英超 新闻,超级计算机预测英超最终排名:利物浦卫冕成功,热刺进入前四...

直播吧10月14日讯 在英超结束了前四轮比赛之后(曼城、曼联、维拉及伯恩利目前只赛三场),外媒talkSPORT利用自己的超级计算机对本赛季的英超最终排名进行了一次预测,结果显示利物浦将卫冕成功,曼城、切尔西及热刺分列二至四位,伯恩…

计算机学院转会,2020年英超冬窗转会汇总,你主队的操作让你满意吗?

虎扑2月1日讯 本赛季英超冬窗已经正式关闭,我们将各支俱乐部的转会交易情况进行了汇总,你主队的操作有没有让你感到满意呢? 1、利物浦 转入:南野拓实(萨尔茨堡红牛)、乔-哈迪(布伦特福德) 转出:赫比-凯恩(赫尔城/租借)…

英国G5名校入学考试加分项目有哪些?

申请英本的同学都知道,学校不仅单纯考量申请者的学科成绩,还考察申请者某一学科的综合实力。随着竞争不断加剧,升学压力也越来越大,如何精准把握学校的“入学考试加分项”,是许多学生和家长都非常关心的问题。今天L老师…

【模电知识总结】三极管

文章目录 一、三极管是什么?二、发展历史三、结构与原理1、内部结构2、工作原理 四、伏安特性1、三极管输入特性2、三极管的输出特性 五、答疑1、把两个二极管背靠背焊接在一起,能否当三极管用?2、为什么VB要大于一个电压阈值,三极…

深度神经网络是谁发明的,神经网络是谁发明的人

神经网络的历史是什么? 沃伦麦卡洛克和沃尔特皮茨(1943)基于数学和一种称为阈值逻辑的算法创造了一种神经网络的计算模型。这种模型使得神经网络的研究分裂为两种不同研究思路。 一种主要关注大脑中的生物学过程,另一种主要关注…

人工智能 ---(02.相关书籍)

前言:小编开始进入人工智能的学习了,写博客的原因是想记录一下自己的学习日常,将博客内容作为自己的一份笔记。由于小编也是初学者,对于相关理论可能理解的不是很透彻,自身的理解可能不充分,望各位读者见谅…

巴西超级联赛足球俱乐部推出加密“粉丝代币”

点击上方 “蓝色字” 可关注我们! 暴走时评: Cointelegraph巴西于12月14日星期五报道称,巴西超级联赛足球俱乐部Atletico Mineiro推出了一个名为“GaloCoin”的粉丝代币。GaloCoin以该队的吉祥物,一只公鸡(葡萄牙语中的…

在UE5中创建一个受战锤启发的角色

Giulio Marrone Dittli谈到了Arbennian项目背后的工作流程,解释了实时布料模拟是如何制作的,并分享了他们对UE5的看法。 1、介绍 大家好,我是Giulio Marrone Dittli,我是一名角色艺术家,为游戏和电影工作。我来自意大…

航空发动机中的传热

目录 航空发动机中的传热01 航空发动机的热防护(一)航空发动机热防护问题的提出(二)航空发动机主要热防护技术内部对流冷却冲击冷却气膜冷却发散冷却 (三)空气冷却造成的影响 02 热端部件冷却的几个指标&am…

计算机历史博物馆观后感:阿达·洛芙莱斯生平7

"The Analytical Engine has no pretensions whatever to originate anything. It can do whatever we know how to order it to perform." 分析引擎算不上是完全原创的东西。它可以做任何我们命令它去执行的事情。 "The thinking machine" In 1833 Lady…

2019 AI顶会时间表

欢迎关注微信公众号【计算机视觉联盟】 获取更多前沿AI、CV资讯 收集到量子位整理的2019 AI顶会时间表,包含会议举办的时间、地点、投稿截止日期、官方网址/社交媒体地址,还有H5指数(谷歌学术的期刊会议评判标准,即过去5年内有至多…

【收藏】计算机视觉领域全球顶级高校研究所团队总结

点上方蓝字计算机视觉联盟获取更多干货 在右上方 设为星标 ★,与你不见不散 本文来源于联盟成员笔记总结 亚琛工业大学 - 技术计算机科学系 专门研究人类媒体技术以及基于知识和可训练的系统(计算机视觉和计算智能)亚琛工业大学 - 语言处理和…

伦敦地铁介绍

关于日本、伦敦的地铁经历, 《我经历的日本东京交通》 《英超之旅-伦敦地铁篇》 碰巧看见这个,关于伦敦地铁站台介绍,非常细致,有需要的朋友,可以参考:https://bbs.qyer.com/thread-2969169-1.html 伦敦的火…

英超:热刺2-1逆转布莱顿 凯恩补射扳平阿里破门反超

英超:热刺2-1逆转布莱顿 凯恩补射扳平阿里破门反超 热刺2-1布莱顿 北京时间12月26日晚20:30,英超联赛第19轮一场比赛在热刺和布莱顿之间展开争夺。上半场凯恩进球被吹,韦伯斯特头球破门。下半场凯恩补射破门,阿里破门完成反超。最…

布莱顿制造!

Unity was in full effect at the Made in Brighton games conference yesterday – getting a mention right off the bat in the first talk. The south coast town has become a Mecca for games developers and digital arts with it’s beguiling beach life, hipster han…

布莱顿大学有计算机游戏研究生或者动画研究生么,布莱顿大学研究生申请条件...

布莱顿大学研究生申请条件:雅思总平均分6.5分,作文部分6分。托福575(机考233)(MBA要求590/243分),作文部分5分。 布莱顿大学研究生专业 介绍,布莱顿大学研究生专业主要有工程,自然科学与数学,环境建设&…

布莱顿大学有计算机游戏研究生或者动画研究生么,布莱顿大学研究生学费

布莱顿大学研究生学费差不多是12330英镑左右一年,同时学费会因为专业的不同所有所改变,不过差距不大。除了学费外还需带上足够的伙食费。 布莱顿大学研究生申请流程 首先、准备申请材料,这个部分非常关键,通过你的申请材料布莱顿大…

特殊球衣亮相,对阵布莱顿,纽卡的球衣亮点十足

北京时间8月10日,纽卡斯尔官方宣布将会在得到英超联赛官方批准的情况下,本周末客场挑战布莱顿的英超联赛第二轮中球队将身着特别版球衣亮相。 来自英超联赛官方裁定,纽卡斯尔2022/23赛季的三套球衣都将与布莱顿的主场蓝白条纹球衣发生冲突&am…

软件测试AI初体验-龙测AI-TestOps云平台

部门领导说今年要做自动化测试,我立马想到了selenium,但接着就是自动化测试框架,工作量巨大的测试用例编写工作,想想就头疼。后来chatGPT出现了,感觉可以和软件测试结合一下,还没开始研究,最近看…