哈工大车万翔:自然语言处理范式正在变迁

 Datawhale干货 

作者:车万翔,哈工大教授,编辑:李rumor

最近几天被OpenAI推出的ChatGPT[1]刷屏了,其影响已经不仅局限于自然语言处理(NLP)圈,就连投资圈也开始蠢蠢欲动了,短短几天ChatGPT的用户数就超过了百万。通过众多网友以及我个人对其测试的结果看,ChatGPT的效果可以用惊艳来形容,具体结果我在此就不赘述了。不同于GPT-3刚推出时人们的反应,对ChatGPT大家发出更多的是赞叹之词。聊天、问答、写作、编程等等,样样精通。因此也有人惊呼,“通用人工智能(AGI)即将到来”、“Google等传统搜索引擎即将被取代”,所以也对传说中即将发布的GPT-4更加期待。

从技术角度讲,ChatGPT还是基于大规模预训练语言模型(GPT-3.5)强大的语言理解和生成的能力,并通过在人工标注和反馈的大规模数据上进行学习,从而让预训练语言模型能够更好地理解人类的问题并给出更好的回复。这一点上和OpenAI于今年3月份推出的InstructGPT[2]是一致的,即通过引入人工标注和反馈,解决了自然语言生成结果不易评价的问题,从而就可以像玩儿游戏一样,利用强化学习技术,通过尝试生成不同的结果并对结果进行评分,然后鼓励评分高的策略、惩罚评分低的策略,最终获得更好的模型。

不过说实话,我当时并不看好这一技术路线,因为这仍然需要大量的人工劳动,本质上还是一种“人工”智能。不过ChatGPT通过持续投入大量的人力,把这条路走通了,从而更进一步验证了那句话,“有多少人工,就有多少智能”。

不过,需要注意的是,ChatGPT以及一系列超大规模预训练语言模型的成功将为自然语言处理带来新的范式变迁,即从以BERT为代表的 预训练+精调(Fine-tuning)范式,转换为以GPT-3为代表的 预训练+提示(Prompting)的范式[3]。所谓提示,指的是通过构造自然语言提示符(Prompt),将下游任务转化为预训练阶段的语言模型任务。例如,若想识别句子“我喜欢这部电影。”的情感倾向性,可以在其后拼接提示符“它很    ”。如果预训练模型预测空格处为“精彩”,则句子大概率为褒义。这样做的好处是无需精调整个预训练模型,就可以调动模型内部的知识,完成“任意”的自然语言处理任务。当然,在ChatGPT出现之前,这种范式转变的趋势并不明显,主要有两个原因:

第一,GPT-3级别的大模型基本都掌握在大公司手里,因此学术界在进行预训练+提示的研究时基本都使用规模相对比较小的预训练模型。由于规模规模不够大,因此预训练+提示的效果并不比预训练+精调的效果好。而只有当模型的规模足够大后,才会涌现(Emerge)出“智能”[4]。最终,导致之前很多在小规模模型上得出的结论,在大规模模型下都未必适用了。

第二,如果仅利用预训练+提示的方法,由于预训练的语言模型任务和下游任务之间差异较大,导致这种方法除了擅长续写文本这种预训练任务外,对其他任务完成得并不好。因此,为了应对更多的任务,需要在下游任务上继续预训练(也可以叫预精调),而且现在的趋势是在众多的下游任务上预精调大模型,以应对多种、甚至未曾见过的新任务[5]。所以更准确地说,预训练+预精调+提示将成为自然语言处理的新范式。

不同于传统预训练+精调范式,预训练+预精调+提示范式将过去一个自然语言处理模型擅长处理一个具体任务的方式,转换为了用一个模型处理多个任务,甚至未曾见过的通用任务的方式。所以从这个角度来讲,通用人工智能也许真的即将到来了。这似乎也和我几年前的预测相吻合,我当时曾预测,“结合自然语言处理历次范式变迁的规律(图1),2018年预训练+精调的范式出现之后5年,即2023年自然语言处理也许将迎来新的范式变迁”。

15c915fb119a39d8f3dae7f511179d40.jpeg

那么,接下来如何进一步提升预训练+预精调+提示新范式的能力,并在实际应用中将其落地呢?

首先,显式地利用人工标注和反馈仍然费时费力,我们应该设法更自然地获取并利用人类的反馈。也就是在实际应用场景中,获取真实用户的自然反馈,如其回复的语句、所做的行为等,并利用这些反馈信息提升系统的性能,我们将这种方式称为交互式自然语言处理。不过用户的交互式反馈相对稀疏,并且有些用户会做出恶意的反馈,如何克服稀疏性以及避免恶意性反馈都将是亟待解决的问题。

其次,目前该范式生成的自然语言文本具有非常好的流畅性,但是经常会出现事实性错误,也就是会一本正经地胡说八道。当然,使用上面的交互式自然语言处理方法可以一定程度上解决此类问题,不过对于用户都不知道答案的问题,他们是无法对结果进行反馈的。此时又回到了可解释性差,这一深度学习模型的老问题上。如果能够像写论文时插入参考文献一样,在生成的结果中插入相关信息的出处,则会大大提高结果的可解释性。

最后,该范式依赖超大规模预训练语言模型,然而这些模型目前只掌握在少数的大公司手中,即便有个别开源的大模型,由于其过于庞大,小型公司或研究组也无法下载并使用它们。所以,在线调用是目前使用这些模型最主要的模式。在该模式下,如何针对不同用户面对的不同任务,使用用户私有的数据对模型进行进一步预精调,并且不对公有的大模型造成影响,成为该范式实际应用落地所迫切需要解决的问题。此外,为了提高系统的运行速度,如何通过在线的大模型获得离线的小模型,并且让离线小模型保持大模型在某些任务上的能力,也成为模型能实际应用的一种解决方案。

未来已来,让我们共同期待!

注:有幸在车老师的朋友圈学习到了他对于最近ChatGPT的一些见解,征得老师同意后分享给大家,转载请注明作者。

参考文献:

[1] https://chat.openai.com/

[2] Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan Leike, Ryan Lowe. Training language models to follow instructions with human feedback. https://arxiv.org/abs/2203.02155

[3] Pengfei Liu, Weizhe Yuan, Jinlan Fu, Zhengbao Jiang, Hiroaki Hayashi, Graham Neubig. Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing. https://arxiv.org/abs/2107.13586

[4] Jason Wei, Yi Tay, Rishi Bommasani, Colin Raffel, Barret Zoph, Sebastian Borgeaud, Dani Yogatama, Maarten Bosma, Denny Zhou, Donald Metzler, Ed H. Chi, Tatsunori Hashimoto, Oriol Vinyals, Percy Liang, Jeff Dean, William Fedus. Emergent Abilities of Large Language Models. https://arxiv.org/abs/2206.07682

[5] Jason Wei, Maarten Bosma, Vincent Y. Zhao, Kelvin Guu, Adams Wei Yu, Brian Lester, Nan Du, Andrew M. Dai, Quoc V. Le. Finetuned Language Models Are Zero-Shot Learners. https://arxiv.org/abs/2109.01652

7a3d201c9fa8791c4ef8ed02315bc254.png

整理不易,三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17403.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机用户账户已禁用,windows 7系统 您的账户已被停用 Administrator帐户已停用如何开启...

类型:数据库类大小:2.1M语言:多国语言[中文] 评分:3.8 标签: 立即下载 平时一般使用Ghost安装系统,这次换了系统安装盘装windows系统时,必须创建一个用户才能安装,安装后我们希望用超…

windows账户被停用,如何启动账户?

找到“计算机管理”(可以win键,输入计算机管理就出现了) 出现这个情况主要是因为administrator账户被禁用,原因主要是用户对系统进行设置的过程中不小心将administrator属性里的“账户已禁用”进行了勾选 把账户已禁用进行不勾选就可以了

命令行版 ChatGPT,支持代码高亮,流式输出

开源地址: https://github.com/evilpan/gptcli 前两天 OpenAI 公开了 gpt-3.5-turbo 的接口,于是想着能不能用命令行实现一个简单的版本。一方面是对于程序员而言命令行非常常用,另一方面也是因为 Web 版本的比较难部署,需要额外的服务器。 …

【微软亚洲研究院交流20191031】周明博士(自然语言处理导论)

周明博士现任微软亚洲研究院首席研究员,同时担任中国计算机学会理事、中文信息技术专委会主任、术语工作委员会主任、以及中国中文信息学会常务理事,并且在哈尔滨工业大学、天津大学、南开大学、山东大学等多所院校兼任博士导师。他是中国第一个中英翻译…

只有程序猿才能看懂的搞笑段子

目录 一、PHP是最好的语言 二、你需要客户端吗 三、 大爷年轻的秘诀 四、 神特马的注释 五、对联 六、凑整 七、你的今天就是我的明天 八、好像没买错 九、 婚礼誓言 十、永生 一、PHP是最好的语言 女:你能让这个论坛的人都吵起来,我今晚就跟你走.男&am…

解决鼠标光标圆圈一直闪烁问题

问题 今天早上开机之后,电脑鼠标小圈圈就一直闪烁,百度了半天,从网上一直搜索,怎么解决。最终我发现他在后台其实有一个东西一直在跑。是搜狗的一个服务。 1.按住shiftctrlesc打开任务管理器,找到搜狗服务 2.右键结束…

离职两年后,程序员遭前东家索赔:Bug 是你写的

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 问:身为一名程序员,你能确保至今写的代码中没有一个 Bug 吗? 程序员:当然不能。 问:那你不怕这些 Bug 导致重大损失,然后公司起…

对话投资人:我们已经不看虚拟数字人赛道了

被新概念迷花眼,热闹过后,投资人们的思考开始趋于冷静。 数科星球 原创 作者丨数数 编辑丨十里香 在定义上,数字人、虚拟人或数字替身都是将人物进行虚拟仿真。其三者概念略有不同,其中,虚拟人以抖音平台中的虚拟网红&…

离职两年的程序员,被前东家索赔:bug是你写的.....

问:身为一名程序员,你能确保至今写的代码中没有一个 Bug 吗? 程序员:当然不能。 问:那你不怕这些 Bug 导致重大损失,然后公司起诉你吗? 程序员:哈,还有这样的事&#xff…

最小化动态编程语言的缺点

本文介绍了动态语言的优缺点,倡导大家在享受动态语言的自由度时,也要尽可能地像静态语言那样思考,遵循一些规范和原则,避免一些隐患和错误。 原文链接:https://stackoverflow.blog/2023/01/19/adding-structure-to-dyn…

盘点微服务架构下的诸多身份验证方式

身份认证是授予用户访问系统并授予使用系统的必要权限的过程。而提供了这一功能的服务,就是身份认证服务。 作者 | 罗泽轩, 赵士瑞 责编 |梦依丹 出品 | CSDN(ID:CSDNnews) 在传统的单体软件应用程序中&#xff0…

第5章信息系统工程

信息系统工程是用系统工程的原理、方法来指导信息系统建设与管理的一门工程技术学科,它是信息科学、管理科学、系统科学、计算机科学与通信技术相结合的综合性、交叉性、具有独特风格的应用学科。当前信息系统工程的主要任务是研究信息处理过程内在的规律&#xff0…

离职两年后,程序员遭前东家索赔:Bug是你写的

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇 整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 问:身为一名程序员,你能确保至今写的代码中没有一个 Bug 吗&…

ChatGPT 过时了,Auto-GPT才是未来

Auto-GPT概述 AutoGPT 是一项卓越的 AI 技术,一个实验性开源应用程序,它通过 API 利用 GPT-4 和 GPT-3.5 通过迭代自己的提示并在每次迭代中构建它们来创建成熟的项目。Auto-GPT是 GPT-4 完全自主运行并突破 AI 可能性界限的首批示例之一。它可以读写文件…

【PPT】《挑战用chatgpt完成流水线操作的ppt,再也不用担心每周肝组会报告ppt了#人工智能 #chatgpt应用领域 快学起来!!!》- 知识点目录

《挑战用chatgpt完成流水线操作的ppt,再也不用担心每周肝组会报告ppt了#人工智能 #chatgpt应用领域 快学起来!!!》 1. PPT文字模板说明(Prompt) 我的名字叫做【haozi】,帮我制作一篇内容为《如何做好一名…

如何通过ChatGPT快速生成PPT?ChatGPT搭配闪击PPT生成PPT,你只需要输入一个标题

了解闪击PPT的【文字转PPT】功能 闪击PPT有一个文本转PPT功能,这也是今天的主角 我的名字叫做芝士不吃,帮我制作一篇内容为《秦朝为什么会灭亡》PPT,要求如下: 第一、一定要使用中文。 第二、页面形式有3种,封面、目…

【3分钟高效制作PPT】ChatGPT搭配闪击PPT生成PPT,你只需要输入一个标题

Hello,大家好,我是你的好伙伴AI博士 今天我来分享一下,怎么用ChatGPT配合闪击PPT,只输入一个标题,怎么生成一份高颜值的PPT。 第一步:了解闪击PPT的【文字转PPT】功能 闪击PPT有一个文本转PPT功能&#x…

如何使用ChatGPT的API(一)大语言模型如何工作

这篇文章介绍大语言模型的一些概念,包括它是如何工作的,什么是Token等等。 大语言模型如何工作 我们从一个示例开始说起。 当我们写一个提示“我喜欢吃”,然后要求一个大型语言模型根据这个提示填写后面可能的内容。它可能会说&#xff0c…

IP-Guard能否限制PC端微信登录?

能否限制PC端微信登录? 不能限制微信登录,但可以通过应用程序控制策略,禁止微信程序启动。 在控制台-【策略】-【应用程序】,添加以下策略: 动作:禁止 应用程序:wechat.exe 可以实现禁止微信启…

七年老程序员的三四月总结:三十岁、准备婚礼、三次分享

你好,我是 shixin,一名工作七年的安卓开发。 每两个月我会做一次总结,记下这段时间里有意义的事和值得反复看的内容,为的是留一些回忆、评估自己的行为、沉淀有价值的信息。 一转眼 2023 年过去了三分之一,这两个月经历…