车万翔:ChatGPT时代,NLPer 的危与机

来自:智源社区

要点速览:

  • ChatGPT的诞生,源于研究者「暴力美学」的手段。

  • 如果大胆预测,ChatGPT能火几年,我猜可能是2到3年的时间,到2025年大概又要更新换代了。

  • 工业界相较于学术界拥有巨大优势。这种「AI 的马太效应」会造成胜者通吃的局面。更加危急的是,任务、甚至研究领域之间的壁垒被打破了,所有的问题都可以转化为一个「Seq2Seq」问题,计算机视觉等领域的研究者也会逐渐涌入该领域。

  • 与搜索引擎时代类似,如果将 OpenAI 比作当年的 Google,国内也一定会出现 ChatGPT 时代的「百度」。在这之前,许多机构和企业都有机会放手一搏,做出自己的大模型。相较于其它领域的研究者,NLPer 的真正优势可能在于更加了解语言。

7ac9c404df8520486743affa0e890153.png

车万翔

车万翔博士,哈尔滨工业大学计算学部长聘教授、博士生导师,人工智能研究院副院长,社会计算与信息检索研究中心副主任。国家级青年人才,黑龙江省“龙江学者”青年学者,斯坦福大学访问学者。现任中国中文信息学会计算语言学专业委员会副主任兼秘书长;国际计算语言学学会亚太分会(AACL)执委兼秘书长;中国计算机学会高级会员、曾任YOCSEF哈尔滨主席(2016-2017年度)。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文100余篇,其中AAAI 2013年的文章获得了最佳论文提名奖,论文累计被引6,000余次(Google Scholar数据)。

从NLPer视角大胆预测:ChatGPT还能火多久

自然语言处理领域的发展历史大致可以分为四个阶段:

  • 基于规则的小规模专家知识(1950-1990)

  • 浅层机器学习算法(1990-2010)

  • 深度学习算法(2010-2017)

  • 大规模预训练模型(2018-2023)

ChatGPT正是遵循着这样一条路,时间线上有一个有趣的预测,每一个阶段的发展的时间,大概是上一个阶段发展时间的一半,基于规则发展了40年,浅层学习做了20年,之后深度学习做了10年,所以预测大规模训练模型发展的时间是5年,恰好到2022年底2023年初,产生了ChatGPT,以及GPT-4即将发布,标志着一个时代的结束。如果大胆预测,ChatGPT能火几年,我猜可能是2到3年的时间,到2025年大概又要更新换代了。当然这是半开玩笑的说法。

6a3e76a4e3d1992d13e6e6f1f8e243f0.png

ChatGPT效果惊艳的原因:

暴力美学的胜利

大规模预训练模型依赖于大模型,大数据、大算力。以 GPT-3 为例,该模型在没有经受过任何特定任务训练的情况下,可以通过样例学习完成十余种文本生成任务。

9323b30980cff563341b75b77791225b.png

然而,相较于 ChatGPT,OpenAI 两年前发布的GPT-3 并没有引起如此之大的关注度。究其原因,其中之一可能是该模型缺乏知识推理能力,可解释性也欠佳。该模型的原始论文指出,该模型在「故事结尾选择」任务上的能力比哈工大丁效老师等人所提出的具有知识推理能力的模型性能低 4.1%。GPT-3 此类预训练语言模型在深层次语义理解能力上与人类认知水平还有很大差距。

为了解决该问题,一些研究者考虑向模型中引入知识;另一些研究者则采取「暴力美学」的手段,并发展出了如今的 ChatGPT。

f12b161900b5f7d70f4306a17b99fec0.png

如上图所示,ChatGPT 的效果惊艳,不仅能够给出正确的答案,还具有一定的可解释性。

2287061ff41f0ed994b95faa028f3d6b.jpeg

ChatGPT 的成功本质上反映了人们对知识的表示和调用方式产生了重大变革。

在关系型数据库时代,符号化的知识表示精度很高,但是需要使用 SQL 语句调用,较为复杂且不自然,代表性的应用为 DBMS,代表公司为Oracle和微软。

在互联网时代,知识以文字、图像、音频、视频等形式存在,我们通过输入查询关键词来调用知识,代表性的应用为搜索引擎,这个阶段代表公司有谷歌和微软。

在大模型时代,知识表示为大模型及其参数,大模型相当于一个知识库,其知识表示精度较低。在 GPT-3 刚出现时,尽管蕴含大量的知识,但是其调用方式并不自然(构建 Prompt)。ChatGPT 则实现了使用自然语言指令调用知识,这种知识的表示和调用方式是一种根本性的变革。代表公司为OpenAI,微软谷歌以及百度等国内公司也在陆续发力。

ChatGPT的核心技术

eb0d31f5c13e5426278101efc37d024e.png

细数语言技术的四个阶段,以 Bert 为代表的预训练语言模型主要解决了语义匹配的问题;ChatGPT 相对较好地解决了推理任务;下一阶段,自然语言处理算法需要考虑语用问题,对于同样的语言输入,模型需要理解不同语气、表情、语音、语调所蕴含的不同意义。

具体技术进展方面,ChatGPT 的核心技术主要包含以下四点:

  1. 大规模预训练模型:涌现出推理能力;

  2. Prompt/Instruction Tuning:通过 Prompt 统一各种任务,在众多类型任务的标注数据上精调语言模型,处理未见任务;

  3. 在代码上进行继续预训练:涌现出逐步推理能力,代码分步骤、分模块解决问题,代码语言模型需要更长的上下文;

  4. 基于人类反馈的强化学习 RLHF:结果更符合人类预期,利用真实用户的反馈。这些技术的融合形成了惊艳的效果。

6b498e9b9aeb1d8adc152331b07db357.png

NLP学术界如何应对

ChatGPT的挑战

在 ChatGPT 时代,自然语言处理领域的发展趋势与早年间的信息检索领域类似。随着搜索引擎的出现,这种系统级别的研究为学术界带来了巨大的危机,学术界可做的研究越来越少。信息检索领域的顶会 SIGIR 相较于其它 AI 顶级会议的论文发表数量要少得多。与此同时,工业界由于掌握了大量的计算资源、用户数据、用户反馈,相较于学术界拥有巨大的优势。这种「AI 的马太效应」会造成胜者通吃的局面。更加危急的是,任务、甚至研究领域之间的壁垒被打破了,所有的问题都可以转化为一个「Seq2Seq」问题,计算机视觉等领域的研究者也会逐渐涌入该领域。

6c779f5796b5a27b2a34f03dc03af840.png

为了应对当前的挑战,自然语言领域的研究者可以借鉴信息检索研究者的经验。首先,学术界可能不再进行系统级别的研究,主要集中在相对边缘的研究方向上;其次,使用工业界巨头提供的数据进行实验,并不一定能得出可靠的结论,由于存在隐私问题,数据的真实性存疑;通过调用公司提供的 API 进行研究,一旦模型被调整,其结论有可能也会改变。

与搜索引擎时代类似,如果将 OpenAI 比作当年的 Google,国内也一定会出现 ChatGPT 时代的「百度」。在这之前,许多机构和企业都有机会放手一搏,做出自己的大模型。相较于其它领域的研究者,NLPer 的真正优势可能在于更加了解语言。

本文整理自「青源Workshop(第20期)|LLM and Chatbot: Endgame, Worse is Better, How to Win Big 」闭门研讨会的引导报告环节,哈尔滨工业大学教授车万翔介绍了ChatGPT效果惊艳的原因,以及ChatGPT时代NLP研究者面临的机遇与挑战。


进NLP群—>加入NLP交流群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5807.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT研究分享:插件模式的利与弊

目录 1、插件的实现方式 1.1 Toolformer 1.2 OpenAI插件文档 1.3 个人感想 2、一些有意思的点 2.1 知识和价值观 2.2 算法的研究方向 OpenAI近期公开了GPT-4,除了各方面性能的大幅度提升,最大的惊喜应该来自于插件模式的引入,GPT-4可以…

Ursina随笔(一)—— Chatgpt帮忙解决Ursina中文显示为方块的问题

去年使用Ursina来替代Unity 3D做了一个项目,用Python比c#爽,但程序的中文的显示问题一直没解决,临时的解决方法是翻译成英文或者用图片。Ursina的国内用户很少,网上也没搜索到解决方案,对这个问题一直念念不忘。 # -*…

一招,提高 Github 成员微信群运营效率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来上传(img-tvqbdR3w-1663327883339)(https://img-blog.csdnimg.cn/img_convert/b90a5642bc5aa322d23157e5fb5762ad.png)] 01 #学习是未来人工智能的基础石 外媒TechUp 3月1日,几…

微信中如何接入机器人才比较安全(不会收到警告或者f号)之第三步正式接入

大家好,我是雄雄,欢迎关注微信公众号:雄雄的小课堂。 前言 前面两篇文章分别介绍了下chatgpt接入方式: 微信中如何接入chatgpt机器人才比较安全(不会收到警告或者f号)之第一步登录微信 微信中如何接入chatgpt机器人才比较安全(不会收到警告或者f号)之第二步注入dll文件…

解决微信后台禁用url问题

解决微信后台禁用url问题 由于目前用的平台,域名都没有在微信授权,所以被微信给禁用了,我们现在用一个接口可以绑定域名的平台转发一下,演示选择使用vscode工具,其它有终端的工具亦可。 1. 安装vercel 全局安装verce…

智能面板小程序如何实现跨端开发,并无缝引入ChatGPT?

如何让开发者更便捷高效地开发面板小程序? 全球化 IoT 开发平台服务商涂鸦智能(NYSE:TUYA,HKEX:2391)原先提供的是一套基于 React Native (简称 RN) 的面板 SDK,但是随着面板规模的不断增长&am…

Onekey Card实测:绑定微信日常使用,可帮助开通 ChatGPT Plus

著名硬件钱包 OneKey 推出的 OneKey Card 是一个虚拟 Visa 卡,支持微信、支付宝等支付渠道。注册过程非常丝滑,而且可帮助开通 ChatGPT Plus。属实是Crypto Holder们的福音。我们在这里介绍如何注册使用OneKey Card。 01. OneKey Card是什么 OneKey Car…

ChatGPT会取代律师这份职业吗?

如今,一种新型的人工智能威胁再次来袭,律师们可能会感到似曾相识的感觉。有人警告称,类似于ChatGPT的软件,因为具有类似于人类的语言流畅性,可能会取代大部分法律工作。 人工智能​的进步曾让人们预测,法律…

ChatGPT 存在很大的隐私问题

当 OpenAI 发布时 2020 年 7 月的 GPT-3,它提供了用于训练大型语言模型的数据的一瞥。 根据一篇技术论文,从网络、帖子、书籍等中收集的数百万页被用于创建生成文本系统。 在此数据中收集的是您在网上分享的一些关于您自己的个人信息,这些数据现在让 O…

再聊ChatGPT(关于安全,隐私和法律方面的风险)

我在上一篇博文中有谈到ChatGPT 发展可能会经历的一些阶段。ChatGPT的必经阶段:野蛮生长时代-管理层监管与风险提示-号召国产化-规范化常态化。 昨天刚好看到监管部门发文 说明监管部门已经意识到到ChatGPT野蛮生长阶段,其实是存在很多漏洞和问题的。 …

ChatGPT创业潮来了,我既兴奋又焦虑

最近一段时间,ChatGPT从AI领域破圈,成了互联网领域的新风口。创业者和投资人也兴奋起来了。 创业的方向已经很明了。做中国版对标ChatGPT的大模型,是显而易见的一条路。目前百度的“文心一言”已经呼之欲出,原美团联合创始人王慧…

入坑ChatGPT创业!顶级VC认购2.3亿美元,75%股份用于招研发人才

来源:新智元 继「美团大佬自掏5000万美元入坑ChatGPT」之后。 如今,又有新后续了! 王慧文表示下轮融资已有顶级VC认购2.3亿美元,所以广邀各路英雄,放心施展才华,一同打造中国的OpenAI。 「不必为资金忧心」…

牛逼啊,阿里版 ChatGPT 要来了!中文聊天截图曝光,还能画图。。

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 谷歌硬刚ChatGPT消息一出,科技圈全坐不住了。阿里百度网易京东一众公司全宣布要推出类ChatGPT新产品,战况那叫一个激烈。 阿里内测中的达摩院版ChatGPT,也被提前曝光。 竟然连画画技能都具备了&#…

一个参数让ChatGPT的回答更有创意

你是不是发现ChatGPT的回答有时看上去太理性了,像是在写说明文。 怎样让它的回答更有创意,更有活力呢? 在提问时,加上 温度(temperature)这个参数就可以了。这个参数可以控制生成文本的多样性和创造性。较低…

OpenAI 正式发布 ChatGPT API,所有开发者都可集成到自己产品中,加量还打折

公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! ​ 现在,第三方可以通过 API 将对话模型 ChatGPT 和语音转文本模型 Whisper 集成到自己的应用程序和服务中了。 2022 年 11 月,OpenAI 上线 ChatGPT&#xf…

ChatGPT在编程方面的用例:节省时间并提高工作效率

除非您一直住在树林里的小屋里,远离电网,否则您可能听说过ChatGPT。AI 聊天机器人于 2022 年 11 月发布并引起了不小的轰动,这引出了一个问题:这项激动人心的新技术究竟能为您、您的企业和您的行业做什么? ChatGPT 在…

强的离谱!别玩啥 Bing 了!我把 Google 和 ChatGPT4 合二为一!

跟大家说一个好消息,我们的星球【ChatGPT中文社区】已经 700 多人了。这 700 多名球友属于第一波在星球里学习到如何注册 ChaGPT、如何升级 GPT-4,如何进行 AI 绘画等实操。真的印证了那句话:早就是优势! 之前有一个球友问我&…

医疗金融法律大模型:从ChatDoctor到BloombergGPT/FinGPT/FinBERT、ChatLaw/LawGPT_zh

第一部分 各种医疗类ChatGPT:或中英文数据微调LLaMA、或中文数据微调ChatGLM 1.1 基于LLaMA微调的国内外医疗问答模型 1.1.1 ChatDoctor:通过self-instruct技术提示API的数据和医患对话数据集微调LLaMA Github上有一个基于LLaMA模型的医疗微调模型&am…

集简云上线ChatGPT文档问答,基于文档实现智能问答训练

过去,我们想要让ChatGPT结合自身业务进行针对性回答,只能通过输入大量的prompt提示,或使用官方原生Fine-Tuning模型训练。 然而,过多的prompt提示词一方面提高了使用成本,另一方面,提示词的信息量有限&…

【ChatGPT】ChatGPT 背后的 AI 时代大背景、技术门道和商业应用 (万字长文|建议收藏)

目录 引言 我和聊天机器人的小故事 一、AI 背景 1.1 ChatGPT 的出圈和能力圈