GLM 大加强,清华团队推出 GLM 联网加强版 WebGLM!

夕小瑶科技说 原创
作者 | 小戏、ZenMoore

大模型生成答案不可靠?一种很直接的思路就是结合传统的搜索引擎的“知识”来对大模型进行一次检索增强

其实早在 InstructGPT 面世以前,OpenAI 就发布了可以用作搜索结果聚合的模型 WebGPT,WebGPT 基于 GPT-3 试图模仿人类的“搜索行为”以使用搜索引擎获得聚合的搜索答案,从而在比如开放域长问答上收获了非常不错的结果

大模型AI全栈手册

行业首份AI全栈手册开放下载啦!!

长达3000页,涵盖大语言模型技术发展、AIGC技术最新动向和应用、深度学习技术等AI方向。微信公众号关注“夕小瑶科技说”,回复“789”下载资料
[图片]

借鉴 WebGPT 结合搜索引擎能力的思路,清华大学唐杰老师团队为目前国内开源大模型的佼佼者 ChatGLM 接上了网线,推出了 ChatGLM 的联网加强版 WebGLM,作为一个基于 GLM-10B 的联网增强版问答系统,WebGLM 可以更加精确高效的完成问答与检索的任务,甚至在实验中可以以 10B 的参数量性能逼近 175B 的 WebGPT 的表现


目前,WebGLM 公布了代码地址如下,想体验的朋友可以戳链接到达~

论文题目:

WebGLM: Towards An Efficient Web-Enhanced Question
Answering System with Human Preferences

论文链接:

https://arxiv.org/pdf/2306.07906.pdf

项目主页:

https://github.com/THUDM/WebGLM

大模型研究测试传送门

GPT-4能力研究传送门(遇浏览器警告点高级/继续访问即可):
https://gpt4test.com

一个官方的使用介绍如下图所示:

譬如,如果询问疫情何时结束,WebGLM 会“引经据典”的援引不同的网页链接对问题进行回答,可以看到回复还是相当专业,并且也都列出了真实的参考链接,大大增强了模型回复的可信度。

而再看一个例子,关于更“软”一点的问题“如何平衡工作与生活”,WebGLM 也可以很好的处理。

对标 WebGPT,一个网络增强的问题系统一般涉及三个组件,分别是 Retriever,Generator 与 Scorer。Retriever 主要使用大模型来作为一个增强的检索器,在整个 WebGLM 中,检索器的使用分为了两个阶段:

  • 粗粒度搜索:整体分为搜索、获取与提取三个阶段,搜索通过使用用户输入的问题,使用 Google API 获取主要候选网页的 URL,获取阶段根据得到的 URL 并行爬取相应的 HTML 的内容,在提取阶段基于 HTML2TEXT 得到页面的文本内容分为段落列表。
  • 细粒度搜索:在粗粒度搜索中,仍然有可能会有大量内容与搜索问题无关,因此 WebGLM 综合预训练的 Contriever 检索器与 ChatGLM 对粗粒度搜索的内容进行“提纯”。

在整个过程中,时间主要消耗在获取网页的步骤中,因此 WebGLM 通过使用并行异步的技术大幅加快了页面的加载时间。

而 Generator 部分主要负责从检索器得到的参考页面中生成出高质量的问题答案,这也是作为基于 Web 增强的 GLM 的核心功能。在 WebGPT 中,OpenAI 聘请了一组全职的专家构造包含问题、答案以及有效参考链接的三元组数据集,而在 WebGLM 中,作者团队使用大模型的上下文学习能力构造了一个包含四万五千条过滤数据与八万三千条未过滤数据的问答数据集 WebGLM-QA。

数据集生成应用了大模型出色的上下文学习能力,作者称为 Bootstrapped Generator,步骤方法如上图所示。生成主要分为 Prompt Formulation、Instruction Inducting 以及 Few-shot In-Context Learning 三个阶段,在 Prompt Formulation 中,作者比较了几种 Prompt 方法确定了最优 Prompt,在 Instruction Inducting 中作者采用了 LLM 自我设计指示的方法,以生成问题答案,而在 Few-shot In-Context Learning 中,利用一次学习的方法选择一次展示进行推理,完成数据集的构建。

最后,为了与人类的目标与偏好对齐,WebGLM 又构建了 Scorer 部分,通过使用人类反馈的强化学习来为 WebGLM 生成的答案进行评分,并依据评分对模型进行微调与舍弃了部分样本。整体模型架构如下图所示:

在实验部分,通过主要对答案与参考链接进行评估。在答案评估部分,主要使用流畅性、正确性、真实性、客观性、冗余性与引证准确度六个指标进行评估,在参考链接评估部分,主要使用相关性、密度、真实性、有毒性以及社会偏差五个指标进行评估

通过 15 位人类专家在 272 个问题上进行打分,可以得到:

对标 WebGPT-175B,WebGLM 仅仅略显逊色,但其性能远高于 Perplexity.ai 与 WebGPT-13B,甚至在流畅性、真实性与冗余度方面均取得了最高的性能,并在正确率得分中接近了 WebGPT-175B

此外,作者为了检验 WebGLM 答案的质量,通过将 WebGLM、WebGPT-175B、WebGPT-13B 和 Perplexity.ai 生成的答案进行打乱,再混入人类编写的答案寻找真实人类评估者对答案的质量进行评估,评估以“擂台赛”的方式进行,直接比较得到 A 答案与 B 答案的优劣,构建了一次问答生成的“图灵测试”。结果显示,WebGLM 对标人类也具有 43% 的胜率,几乎与 WebGPT-175B 的 45% 胜率打成平手

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9950.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT除了模型, 各个大厂、中厂、小厂们还在卷什么?

ChatGPT 问世后,各大公司都在「大模型」上下了苦功,模型能力也成为大家最关注的话题。ChatGPT 虽直接定义了基于大模型的生成式对话机器人这个产品类型,其模型的强大也导致大家都忽略了它在产品使用上的问题。 其实不管是底层模型开发的大厂…

GPT小指南

GPT小指南 个人总结,补充找我,打个广告,CHATGPT plus 143 , Midjourney 也可以找我,私信就可以 总结的遗漏很多,你可以通过评论或者私信我补充每一个细节 首先建议学习https://www.deeplearning.ai/short-courses/c…

2023 美赛数学建模 | D 题 确定联合国可持续发展目标的优先级 思路、分析

文章目录 一、前言二、主要内容三、总结 一、前言 你能搜索到这篇博客,无疑你是幸运的! 2023 美赛数学建模 D 题:确定联合国可持续发展目标的优先级 关键词: 17 个可持续发展目标、复杂网络关系、相互作用、因果关系和干预、定…

“我有个周入百万的项目:教人用ChatGPT。”

一门课卖到 279 元, 17 天招了 1 万个学员,赚了 270 万。 第一批靠 ChatGPT 赚大钱的人,既不是研发人员,也不是国内大厂,又是这群卖课的? 不知道大家有没有刷到过下面这张图,有人统计了知识星…

吴军:ChatGPT不算新技术革命,带不来什么新机会

转载自 | 学人Scholar 吴军,1967年出生,毕业于清华大学和约翰霍普金斯大学,计算机专业博士,前Google高级资深研究员、原腾讯副总裁、硅谷风险投资人。 4月3日晚上,得到直播间邀请到了计算机科学家、自然语言模型专家吴…

ChatGPT 有什么新机会?坦率来讲,你没机会!

4月3日晚上,得到直播间邀请到了计算机科学家,自然语言模型专家吴军,就人工智能和ChatGPT等当下热议的话题展开了一次直播。 在直播中,吴军老师从历史的角度,带着大家一起回顾 ChatGPT 从诞生到发展的历史,你…

吴军博士:ChatGPT不算新技术革命,带不来什么新机会

Datawhale干货 作者:吴军博士,来源:学人Scholar 吴军,1967年出生,毕业于清华大学和约翰霍普金斯大学,计算机专业博士,前Google高级资深研究员、原腾讯副总裁、硅谷风险投资人。 4月3日晚上&…

ChatGPT 不算新技术革命,带不来什么新机会

转载自 | 学人Scholar 吴军,1967年出生,毕业于清华大学和约翰霍普金斯大学,计算机专业博士,前Google高级资深研究员、原腾讯副总裁、硅谷风险投资人。 4月3日晚上,得到直播间邀请到了计算机科学家、自然语言模型专家吴…

ChatGPT写作AI绘画社群,全新上线!

近半年来,ChatGPT 一路高歌,成为科技界炙手可热的“明星”,甚至一度被公认为可以改变世界的又一科技革命的里程碑。不得不说 AI 正在真正地改变世界,强人工智能时代或许真的要到来了! 大家或多或少从各个渠道都听说过 …

人工智能基础

什么是人工智能?很多人能举出很多例子说这就是人工智能,但是让我们给它定义一个概念大家又觉得很难描述的清楚。实际上,人工智能并不是计算机科学领域专属的概念,在其他学科包括神经科学、心理学、哲学等也有人工智能的概念以及相…

ChatGPT:解锁人工智能的无限可能

在数字时代,人工智能的应用已经渗透到我们生活的方方面面,特别在人机交互方面,ChatGPT是人工智能研究公司OpenAI推出的一种基于对话的「人工智能聊天机器人模型」全名为ChatGPT(GenerativePretrainedTransformer)&…

【Unity3D】人体模型及动画

1 前言 2D动画 中初步了解了 Animation 和 Animator,本文将进一步学习 3D 动画,并介绍 人体模型相关内容。 模型制作软件主要有:3DMax、Maya,模型存储格式主要有:*.max、*.fbx、*.obj,动画存储格式&#xf…

Unity 3D项目 - 02 - 角色动画应用

Unity 3D项目 - 02 - 角色动画应用 一、常用代码 0.枚举 enum;和C语言类似,属于整形,自动累加。和C语言不一样,不同种类的枚举元素可以重名!! enum MoveStatus_E // 枚举,运动状态 { Bac…

Unity3D - 【Animator】骨骼动画的实现

利用Animator实现骨骼动画: 1> 确保人物能够正常移动、Camera能够正常跟随 2> 使用WSAD对人物不同运动状态进行切换与连接 3> LeftShift:加速、Space:跳跃 4> 对于移动所产生的场景旋转以及视野跟随问题解决,可以参考…

Unity-动画系统_Avatar系统

利用Avatar系统,我们可以通过对骨胳操控实现动画的重利用效果,这也就是Mecanim系统中的动画重定向功能。 Avatar工作原理 对于人类角色来说,都包含着相同或者类似的骨骼。而Avatar,可以对角色中包含的骨骼结构或者角色模型进行分…

Unity之人物骨骼动画

一、导入 a、先把主模型以下面这种形式导入:在Project面板下右键空白地方->选择import new assert->选择主模型导入 b、把其他非主模型的资源包括动画等直接复制然后黏贴到工程目录下相关目录下 c、在b黏贴的过程中会出现是否覆盖已有资源,选择…

animation动画及3D

一、animation动画 animation动画简介 animation实现动画主要由两个部分组成 通过类似Flash动画的关键帧来声明一个动画 在animation属性中调用关键帧声明的动画实现一个更为复杂的动画效果 浏览器支持 属 性 名 IE Firefox Chrome Opera Safari anim…

3D模型在unity中实现动画效果

将资源拖放到Create中。如图我的资源是Ani,放到我的Resources文件中。 将模型ZebraLP拖到Scene面板上,这样Hierarchy面板上,就会出现ZebraLP文件. 二:创建 Avatar,(一般动物可以共用同一个,人物可以共用同一个&#xf…

Unity2D 官方骨骼动画Anima2D使用方法

Anima2D是一款Unity官方出的骨骼动画制作插件。使用方法如下: 1.下载插件 我们可以从unity编辑器内的AssetStore内下载到Anima2D插件,并导入到Unity编辑器中。记住,下载该插件需要将Unity版本升级到5.60以上。 2.导入我们自己需要创作的素材…

Unity动画☀️一、通过 StringToHash ,控制Animator

目录 🟥 本节效果展示 🟧 Unity基础配置 🟨 配置人物的Animator组件 1️⃣将人物放置到场景 2️⃣ 创建AnimatorController 3️⃣ 配置AnimatorController 🚩 添加AnimationClip 🚩 设置切换AnimationClip的条…