LeCun:ChatGPT无法实现通用人工智能,但ALM技术路线可以!

7d89f6e45492fd83c1e5a2efdc1ed166.jpeg

文 | 天于刀刀

ChatGPT 将加速通用人工智能的实现。—— 邱锡鹏

在上周刚刚结束的 2023 全球人工智能开发者先锋大会(GAIDC)上,作者有幸亲身参与大模型技术与应用分论坛,并在现场聆听了来自业界和学界一众大佬的精彩讲座。

在会上,毫无疑问地大家所聚焦的核心还是 ChatGPT 相关的技术和应用,在这里我借用当时发表讲座的邱锡鹏教授的一个观点,来引出本文的主题。

邱老师认为,当前 ChatGPT 拥有了三大能力,分别是强大的情景学习能力(In-Context Learning)、思维链能力(Chain-of-Thought,CoT)和自然指令学习能力(Instructions)。

对于业界较为关心的“ ChatGPT 输出结果中的事实性错误”的问题,邱老师将模型随机生成的结果比作人类的随口一说。

对于随口一说的回答,要么作为提问者无需太过在意,要么提问者可以要求回答者用心再答一遍。

可以说在现阶段,人们表现出对模型生成内容中错误的极大包容,大家更关心的是人机交互方式的改变。

过去刻板印象中傻大笨粗的机器人一夜之间被一个常常为我们带来惊喜(或惊吓)的 Chat 所取代,对于剩下的那些小问题当然就算是“瑕不掩瑜”嘛!

可是总有人并不完全这么看。“瑕疵”真的可以被随意放过吗?

78cde5cd839c01f7307345fd98b5582e.png

概率论难以支撑通用人工智能技术的诞生。—— Yann LeCun

作为 META 首席人工智能科学家、图灵奖获得者、“人工智能三教父之一”,杨立昆(Yann LeCun)对人工智能技术的前期极度乐观,但是对于当前 AI 的能力表示非常悲观。

当前 AI 的“智能”甚至比不上一只猫的思维。

虽然 ChatGPT 在这段时间里带来了巨大的社会效应,但其实它背后的技术并不算是革命性地,甚至都不算是一种创新。

在这篇论文 Augmented Language Models: a Survey [1](后简称为“调查”)中,杨立昆教授团队提出了他设想中的迈向通用人工智能的一个优质解——增强语言模型(Augmented Language Models,ALM)。

作者个人认为,增强语言模型 ALM 的提出旨在兼顾当前 ChatGPT 强于意图理解、强于文本生成优点的同时,也解决了它最大的产品落地痛点:事实性错误通过外部信息进行补全。

在这里我们首先先定义一下什么是增强语言模型 ALM:

  1. ALM 作为一个语言模型,具备和外部数据交互和多轮推理的能力,模型所需要的所有信息不再是完全存在于模型参数中;

  2. 推理:ALM 在推理过程中将复杂任务分解为多个简单任务,然后通过模型或工具进行解决;

  3. 工具:ALM 的输出中会包含特定的 token,通过它激活调用规则和接口的行为;

  4. 行为:ALM 的工具会对世界进行影响,包含虚拟空间和现实空间。

也就是说,咱和那个靠不住的 ChatGPT 不一样,ALM 设计出来可是为了更好地改造世界的!

011242b8a1d66ce66b61f66adb26e4be.png

学界已经意识到了当前的大语言模型(LLM)的一些基本缺陷:

例如常看到有人在社交媒体上吐槽,当年期望 AI 能够帮我们工作、处理家务,而人类只需要从事创作类职业,而现在的事实上是反了过来;

例如只有一个参数模型进行处理势必会导致在任务细节上无法兼顾过多;

又例如纵使训练数据已经到达海量级别,相对于几乎是无限的应用场景来说,要么大模型的复用成本太高,要么无法获得较好的效果。

因此一个自然而然的想法就是,我们需要一个模型能够随时补充请求相关的外部数据,或是能够自动调用一些已有的可靠接口进行推理服务。

LaMDA 模型[2]就是一个成功的 ALM 样例。作为一个基于 transformer 结构的对话大模型,拥有 137B 个参数的它不但在 1.56T 的公共对话数据上进行了微调,同时还能够自己调用计算器、翻译和信息检索工具,并且引入了一套严格的评价指标,在一定程度上彻底杜绝错误和似是而非的生成结果。

如下图,你可以试图向它询问当前的股票价格,它会帮你进行检索并返回。

50d7576ef617fd43c78bdb9bae646645.png

但是与此同时他也不是全能百分百完全正确的一个机器助手,例如在下图的对话中 LaMDA 顺利回答了前四个问题,在第五轮中依旧回答错误。

dc8e0f94fa50f3727d796e6ffad4a341.jpeg

此外 WebGPT[3] 也是一个非常典型的 ALM 样例。早在 2022 年 1 月,这篇论文就使用了人类反馈训练奖励模型优化模型质量的强化学习技术,同时允许了模型进行上网搜索。

通过预先设定文本命令的方式,WebGPT 模型可以执行包括但不限于搜索网页、引用文献、返回并输出文本等操作。(命令详情和demo展示请 见下图)

a2e041152bff70512f2835bb3625b489.jpeg 0b59d41eac378be5e96f59b613e0b52a.jpeg

也许有的同学会觉得,当一个模型的输出不完全是自然语言,而是参杂了一些特殊字符之后,那么这还算是一个标准的语言模型吗?

杨立昆教授的团队在最后的结论部分提到,ALM 的输入即使包含了一些特殊 token,但是它仍旧算是一个语言模型。

虽然我们希望所有信息都能存储在模型的参数中,减少系统的复杂性,但是目前我们认为这样的模式顶多只是在概率论意义上拟合了一个分布,并非具备了真正的智能

为了体现模型输出的准确性,我们需要一个非参数的架构来存储更多的信息。或许 ALM 就是一条通往通用人工智能的道路,因为它具有以下的特点:

  1. 真实性(Truthfulness)

  2. 减少不确定性(Reducing uncertainty)

  3. 可解释性(Interpretability)

  4. 增强能力(Enhance capabilities)

其实对于通用人工智能的要求可能不同人也有各自不同的看法。

有的人觉得还是必须将 AI 看作工具(AI as agent),它必须代表更先进的生产力,为此标准化、精细化和智能化就是最优先的需求。

还有的人随着 ChatGPT 的成功觉得应该允许 AI 在一些产品中像人类一样天马行空(AI as human),因此意图理解和内容生成的能力反倒成了重点。

这其中其实伴随着非常多的人工智能伦理问题,但是受限于本文篇幅原因暂时按下不表。

无论如何,最终我们总归希望通用人工智能能够真正具备一般意义上的认知能力、推理能力和创作能力。而作为语言模型来说,输出的文本就是模型隐含思想的一种直观体现

940321515df3fcca3c19eae151aefbd5.jpeg

我们在这篇调查中可以看到,这些我们熟悉的 ChatGPT 所使用的“尖端技术”早在 2022 年之前就有许多团队提出并使用了,甚至同样是采用了对话的形式进行演示。

因此我们确实应该承认,ChatGPT 的技术的确并不算是最创新的,但作为一个 AI 产品这绝对是最炒作 HYPE 最大的一波。

但是不论是 ALM 还是 ChatGPT,作为语言模型我们最终的目的都是生成一个优质的内容。

《夕小瑶的卖萌屋》建立的初衷旨在专注于人工智能领域持续不断地产出相应的优质内容。

本次杨立昆教授团队的“调查”是一篇非常有阅读价值的综述文章。受制于公众号篇幅有限,我们整理了文中所有的技术路径和相关的代表论文,集成了一个思维导图作为福利给到各位读者。

后台回复“ALM”即可获得 Augmented Language Models: a Survey 文献综述思维导图。

思维导图部分展示:895f58bdc43c8b2a21eec6105addda8e.jpeg

87944d4c9e059687b425f6eceefd0a23.png

卖萌屋作者:天于刀刀

注重 WLB 的工业界反卷斗士,未进化的 NLP 咸鱼一条。专注于研究在各个场景中算法模型的落地情况,希望自己编写的算法有朝一日可以改变世界。目前的兴趣点在于:假新闻检测、深度学习模型可解释性等。

作品推荐

1.腾讯薪酬改革来了!晋升≠加薪?员工到底为何工作?

2.从 Google AI 离职了,这里让我爱不起来

3.想通这点,治好 AI 打工人的精神内耗

4.谷歌要完,百度也危了

85208708e95b8bc335d5d34703b20d69.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 8214ee19d62820d031a40008218ca5af.png

[1] Augmented Language Models: a Survey, https://arxiv.org/abs/2302.07842

[2] LaMDA: Language Models for Dialog Applications, https://arxiv.org/abs/2201.08239

[3] WebGPT: Browser-assisted question-answering with human feedback, https://arxiv.org/abs/2112.09332

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/1322.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatgpt的历史问答记录消失的解决之道

刚刚使用发现我的历史会话记录都没有了,我旁边的一个朋友也没有了。 网上查了一下,很多网友,居然也没有历史记录了。 这是故意而为之,还是误操作删除记录,更有可能是不是装了插件引起的。无意当中发现了一个方法&…

ChatGPT报错解决

背景:登录后无法正常交流,报错内容为: Something went wrong. If this issue persists please contact us through our help center at help.openai.com 如图所示: 解决方法: 1. 不关闭代理的情况下Log out再Log in&a…

chatGPT Access denied访问被拒绝(已解决)

这个网站可以直接进入ai聊天,但是功能只有语言模块,我试用了一下作为文字训练可以使用。ChatGPT Online - AI Chat GPThttps://chatgpt.org/chat 然后是网站尚Access denied 解决办法 首先要使用海外的原生IP进行全局代理,不要使用各大云平…

这20种职业ChatGPT无法取代!

李开发在《AI未来进行式》一书中分析了AI存在明显不足的三大短板,即便到了2042年,AI可能仍然无法完全掌握这些能力。 第一、创造力。AI不具备进行创造、构思以及战略性规划的能力。尽管AI非常擅长针对单一领域的任务进行优化,使目标函数达到最…

聊聊ChatGPT无法取代的7个工作

ChatGPT——全世界都在谈论的非常流行的人工智能工具。自从 2022 年 11 月 30 日推出以来,ChatGPT 就被证明是执行复杂任务并简化它们的一体式工具。无论是通过 UPenn 的沃顿商学院 MBA 考试,撰写常春藤盟校入学论文,还是完成简单的任务&…

OpenAI 宣布部分解除 ChatGPT 无法联网限制,引入插件策略,会带来什么变化?

OpenAI 发布 ChatGPT Plugins (ChatGPT 插件集) 昨天凌晨,OpenAI 发布 ChatGPT Plugins (ChatGPT 插件集),它能将 ChatGPT 连接到第三方应用程序) 这是 AI 的 App Store 时刻,AI 经历了「iPhone」时刻后,如今也有了应用商店。 这…

我破除了 ChatGPT 无法联网的魔咒!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 前阵子我写过一篇文章,介绍了几种无需安装 ChatGPT Plugin,即可让其轻松破除无法联网的魔咒。 最近看到不少同学对此感兴趣,因此我把这几个方案汇总完善…

解决ChatGPT 总是打不开,显示不可用,网站崩溃,聊几句话就报错,plus会员无法升级始终不成功的问题

为什么你的chat gpt总是打不开,显示不可用,网站崩溃,聊几句话就报错,plus会员无法升级始终不成功? 首先第一个问题open ai服务不可用 那么这个问题很显然,你所在的位置不提供chat gpT的服务,解…

ChatGPT - 根据写作进行调整,总结长文并加速学习

文章目录 Prompt Prompt “将以下文本总结为500字或更少。为每个重要点创建部分,并简要总结该点。” [文本]

ACL2023论文写作竟允许使用ChatGPT 了!

文|HFL源|HFL实验室 随着以ChatGPT为代表的生成式AI的火热,近期人工智能领域的顶级会议相继推出相关政策以进一步规范这类工具在科学文献撰写中的使用。ACL 2023程序委员会主席在近期的一篇博客中披露了ACL 2023大会的相关政策。 原文&#x…

首篇ChatGPT辅助写作的论文,已在arXiv发表!

编|LRS源|新智元 虽然ChatGPT写的论文错误太多,但掠夺性期刊应该会接收。(错误尝试!!) ChatGPT以其强大的文本创作能力,直接问鼎地表最强问答模型。 但强大的AI也会带来一些负面影响…

ChatGpt结合Google文档完成自动化写作流程--1

GPT机器人可以通过API连接谷歌文档,让我们进行文字创作和编辑。可以通过它,提供写作思路,创建标题,起草文章介绍和大纲,编写段落,最后总结全文。同时,在一篇文章里,还能帮我们插入图…

使用ChatGPT最新版实现批量写作,打造丰富多彩的聚合文章

随着人工智能的迅猛发展,ChatGPT最新版作为一种自然语言处理模型,可以为我们提供强大的文本生成能力。在这篇文章中,我们将探讨如何利用ChatGPT最新版来实现批量写作,从而打造丰富多彩的聚合文章。 一、ChatGPT最新版简介 Chat…

玩转ChatGPT:论文辅助写作(附Claude测评)

一、写在前面 嘿!嘿!嘿!大家好,今天我们来聊一下使用GPT们进行论文辅助写作。不过,我要先交代一下,GPT的使用门槛比较高,不少童鞋都用不上。所以,我极力推荐一个平替产品——Claude…

ChatGPT写程序如何?

前言 ChatGPT最近挺火的,据说还能写程序,感到有些惊讶。于是在使用ChatGPT有一周左右后,分享一下用它写程序的效果如何。 1、对于矩阵,把减法操作转换加法? 感觉不错的,能清晰介绍原理,然后写示…

ChatGPT写新闻-ChatGPT写文章

ChatGPT写新闻 ChatGPT可以用于生成新闻稿件,但需要注意的是,由ChatGPT生成的新闻稿件可能存在语义、逻辑、事实准确性等方面的问题,因此需要进行人工审核和编辑,确保其准确性。 下面是一个示例过程,大致了解如何使用…

ChatGPT初学者写作教程

ChatGPT初学者写作教程 ChatGPT Quickstart for the ChatGPT Curious 和 Beginners – 了解这个 OpenAI 聊天机器人革命,即 ChatGPT! 课程英文名:ChatGPT for Beginners - Get Up & Running with ChatGPT Now 此视频教程共8.0小时&#x…

想用ChatGPT写作?或许没你想的那么神奇...

ChatGPT让AI进化到了新高度,它不但懂你还能够回答问题。这与传统中的网络检索、语义识别不太一样。核心是基于自然语言处理(NLP)的聊天机器人技术。 说简单点,就是可以直接打字和机器人聊天,并且得到你想要的答案。 网…

ChatGPT如何写作-chatGpt自动写文章

ChatGPT如何写作 使用 ChatGPT 进行写作一般可以遵循以下步骤: 定义写作主题和目的。确定写作主题和目的,包括要解决的问题、目标读者群体以及需要涵盖的主要内容。 收集文献和资料。收集与主题相关的文献和资料,可以从互联网、书籍、报刊杂…

OpenAI Translator | 基于ChatGPT API全局翻译润色解析及ORC上传图像翻译插件

简介 OpenAI Translator,一款基于 ChatGPT API 的划词翻译的浏览器插件和跨平台桌面端应用,使用 ChatGPT API 进行划词翻译和文本润色,借助了 ChatGPT 强大的翻译能力,帮助用户更流畅地阅读外语和编辑外语,允许跨 55 …