图灵奖得主LeCun评ChatGPT不算创新,被网友骂柠檬精

“ChatGPT并不算创新。”

“OpenAI做的这个东西跟其他实验室相比,根本算不上什么进步。”

这两天,图灵奖得主LeCun公开和大热趋势“唱反调”,瞬间引发网友围观。

b7621f02a100be365e4bfd198eeb9e81.jpeg

要知道,ChatGPT功能强大又好玩,火爆全网,任谁看了都得感叹一句“技术也太强了吧”,AI大佬对此却“不敢苟同”?

对此,不少网友称LeCun就是在“酸”OpenAI的成就:

“OpenAI现在让谷歌和Meta都处于ChatGPT的阴影之下。这就是为什么它不算革命性的创新。”

5e78b5533e548ec20ed2c040637317e2.jpeg

但也有学者为他撑腰,称“ChatGPT就是一年前的InstructGPT的改进版本,我必须同意LeCun的这个说法”。

4cbd09722b069c863a892ee5ed2cd642.jpeg

具体是怎么回事儿?

“ChatGPT不算技术创新,只是组合得很好罢了”

LeCun是在上周于Zoom的媒体和高管小型聚会上发表了这些观点。

说ChatGPT不创新,是就底层技术而言。

他表示,过去许多公司和实验室都建立了ChatGPT这种数据驱动的人工智能系统,因此OpenAI的这个作品算不上独树一帜。

尽管ChatGPT在这里面可能最强大,公众都被它的能力所折服,觉得它能给大家的工作和生活带来非常大的变化,但它也真的算不上革命性的科学。

他指出,除了谷歌Meta,还有6家初创公司都拥有着非常相似的技术。

“这些技术都是公开的,算不上rocket science,如果你愿意一探究竟的话,可以发现它背后没有任何秘密可言。”

(Ps. rocket science即火箭科学,指特别困难的事情。)

他称ChatGPT仅仅是“组合得很好”。

具体都“组合”了以下这些关键技术:

首先,它的核心就是以自监督学习的方式预训练的Transformer架构。

其中,自监督学习是“我LeCun”早就提倡的。有多早?那时OpenAI都还没诞生呢。

Transformer呢,更不用多说。是谷歌2017年就提出的,GPT-3等大量语言模型都是基于它。

而说起语言模型,它的历史就更早了。

第一个神经网络语言模型,是Yoshua Bengio在大约20年前提出的。(注意力机制的概念最早也是Bengio发明的,然后被谷歌采纳用于Transformer,然后成为所有语言模型中的关键元素)。

也就是说,ChatGPT不仅用的都是别人的技术,还是很早就有的技术。

另外,LeCun还指出OpenAI的程序都用到了强化学习,也就是通过人类agent对机器的输出进行的排名(就像谷歌的网页排名一样),来改善系统性能。

而这种方法不是OpenAI,而是谷歌的DeepMind部门首创。

总而言之,LeCun认为,ChatGPT并非“凭空而来”,而是在此前这么多年这么多项技术的积累上组合出来的。

所以,它算不上底层技术上的创新:

与其说是科学突破的案例,不如说是体面的工程案例。

有趣的是,LeCun还给ChatGPT找到了同样的例子。

那就是赢得了DARPA 2005年挑战赛的自动驾驶汽车,来自企业家Sebastian Thrun。

他表示,该获奖项目用到的这个技术也是在基础科学方面并不是特别创新,只是设计得非常好。

好了,不管是现场听众还是屏幕前的你,现在肯定会问了:

你说OpenAI的ChatGPT“没什么大不了的”,那为什么谷歌和Meta等公司都没人做出来呢?

对此,LeCun“有备而来”,笑着自问自答道:

它们不是不能,是不想,因为做这种东西太费钱了,得不到什么收益。

c1e7564e5696205fe7dd7a1e78dcb23b.jpeg

网友:你就酸吧

媒体ZDNet将LeCun的这些观点整理成文章进行了发表,得到了LeCun本人的亲自转发。

并在转发语中再次强调ChatGPT和其他大型语言模型LLM并非凭空而来,而是数十年来不同人贡献的成果。

因此,没有AI实验室已经明显领先于其他实验室。(也就是说OpenAI还是那个OpenAI,没有因为ChatGPT就比别人更牛了)

8cd582cf7d7442fc0a200b6c55b87969.jpeg

对于此番言论,有网友的评价却是:

LeCun,你在嫉妒在“酸”。

具体be like:

“LeCun这个观点多有意思啊,就是想说Meta的技术与其他实验室不相上下,没有产品只是因为Meta领导层不愿意做。”

93f054d43d6b27e6b021e88a18f04f89.jpeg

“如果Galactica(Meta的语言模型)也获得了类似ChatGPT的成功,你就不会说这仅仅是几十年来各种人的贡献的结果。你的观点听起来让人觉得是你很嫉妒。我认为如果你能衷心祝贺OpenAI,大家可能还会对你赞许有加。”

572a16125cc56a73d157208c507bf508.jpeg

言辞可以算是很犀利了。

于是,就在今天,LeCun又作出了这样一个公开说明:

我不是在批评OpenAI的工作或他们的主张。

而是想纠正一下公众和媒体的看法,大家说它是一个“全新的突破”这样评价真的太高了。

4c12fb2d8eb890508f0a244c60ae0dc4.jpeg

你认为ChatGPT究竟配不配得上这样的评价呢?

参考链接:

[1]https://www.zdnet.com/article/chatgpt-is-not-particularly-innovative-and-nothing-revolutionary-says-metas-chief-ai-scientist/

[2]https://twitter.com/ylecun/status/1617921903934726144

[3]https://twitter.com/ylecun/stat

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15052.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

本地化部署大语言模型 ChatGLM

本地化部署大语言模型 ChatGLM 本地化部署大语言模型 ChatGLM前期筹备GitHub 基础包语言模型文件基础配置显存查看方法 Anaconda 模块ChatGLM-6B 网页部署Anaconda 环境创建根目录操作基础依赖加载transformers 和 protobuf 库加载Pytorch 源修改依赖库补充补充依赖 pypi 配置c…

麻将AI 不完全信息博弈学习笔记(完结)

前言 在这学期的数据结构必修课中,老师向我们提供了两道题: 其一是六子棋问题; 其二是麻将AI问题; 前者是经典的完全信息博弈问题,根据我已有的知识,利用博弈树和合理的剪枝可以提供一种高效的解法&#x…

数据库入门教程--01建库建表插入数据以及数据的修改

if exists(select * from sysdatabases where name Datatest) Drop database Datatest go--判断是否已存在数据库Datatest,并删除 create database Datatest--创建数据库 on--创建数据文件 (nameDatatest,--数据库中文件名filenameD:\数据库练习文件夹\Datatest.mdf…

医疗版ChatGPT直播评测!治疗方案与真人医生96%一致

杨净 发自 凹非寺量子位 | 公众号 QbitAI 国内首个医疗大模型,已经在“接诊”患者了。 最近,一组AI医生医院真实站岗数据曝光: 共接诊120多名患者,从问诊、检查到诊疗方案全流程覆盖;涉及心内科、消化内科、呼吸内科、…

利用ChatGPT思维分析硬科技创新趋势

2015年初夏,我去参加了在北京举办的联想科技大会。在会上,联想、英特尔、微软三位CEO第一次并肩上台发言,他们的演讲中都透露出对移动互联网行业的苦恼和无奈。尤其是微软的新CEO萨提亚纳德拉(Satya Nadella)&#xff…

微软为ChatGPT打造专用超算!砸下几亿美元,上万张英伟达A100打造

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 微软砸下大几亿美元,专门为训练ChatGPT打造了一台超算—— 上万张英伟达A100芯片打造,甚至专门为此调整了服务器架构,只为给ChatGPT和新必应AI提供更好的算力。 △图源:微软 不仅如此&…

一次只要0.003美元,比人类便宜20倍!ChatGPT让数据标注者危矣

作者丨好困 来源丨学术头条 编辑丨新智元 点击进入—>3D视觉工坊学习交流群 【导读】最近,来自苏黎世大学的研究团队发现,ChatGPT在多个NLP标注任务上胜过众包工作者,具有较高一致性,且每次标注成本仅约0.003美元,比…

第2章信息技术发展

信息技术是在信息科学的基本原理和方法下,获取信息、处理信息、传输信息和使用信息的应用技术总称。从信息技术的发展过程来看,信息技术在传感器技术、通信技术和计算机技术的基础上,融合创新和持续发展,孕育和产生了物联网、云计…

ES+Redis+MySQL,这个高可用架构设计太顶了!

大家好,我是宝哥! 背景 会员系统是一种基础系统,跟公司所有业务线的下单主流程密切相关。如果会员系统出故障,会导致用户无法下单,影响范围是全公司所有业务线。所以,会员系统必须保证高性能、高可用&#…

私有云到底是不是云?

私有云是不是云?这是一个问题。 大部分认为私有云不是云的人都是出于自身利益的立场,试图抹黑私有云。虽然私有云在某些场景下功能不如公有云强大,但否定私有云就像否定残疾人的人类地位,或者否认个人电脑是计算机一样。 尽管私有…

借由Net5.5G,看到运营商的新沧海

我们都记得这样一句诗:“东临碣石,以观沧海”。 想要看到沧海的壮阔波澜,就先要抵达碣石山这样可以看到大海的地方。在数字化的发展过程中,往往一个技术或产业趋势就是一座碣石山,借由它可以看到描绘着未来机遇的新沧海…

面向对象编程之父 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 5 月 17 日,在 1969 年的今天,国际电信联盟第二十四届行政理事会正式通过决议,决定把国际电信联盟的成立日—5 月 17 日定为…

通过chatGPT学习:L2网络和L3网络?

下面的总结是通过chatGPT4进行的。 1、 L2网络和L3网络 L2网络和L3网络是计算机网络中的两种不同的网络类型,它们有一些不同的特点和应用场景。 L2网络,也被称为数据链路层网络, 主要是通过物理地址(MAC地址)来转发…

【NLP文章阅读】Zero-Shot Information Extraction via Chatting with ChatGPT

【NLP文章阅读】Zero-Shot Information Extraction via Chatting with ChatGPT 1 模型创新2 前期调研2.1 难以解决的问题 3 Method3.1 方法3.2 数据集3.2.1 RE3.2.2 NER3.2.3 EE 3.3 评价指标3.3.1 RE3.3.2 NER3.3.3 EE 4 效果 转载和使用规则:更多论文解读请关注&a…

OSI模型七层

【ChatGPT】前些天发现了一个巨牛的人工智能学习电子书,通俗易懂,风趣幽默,无广告,忍不住分享一下给大家。(点击查看学习资料) OSI将计算机网络体系结构(architecture)划分为以下七层&#xff…

【时间之外】系统管人,能行?(冷眼旁观连载之三)

这次是这个系列的第三篇。最近一直在搞chatGPT的应用,在写代码这方面,GPT真的很牛,几乎没有它不会的问题,简直比雇了一个高级程序员还好,而且是724小时,永不休息! 回到主题,下面继续…

在群晖中部署VoceChat

一、简介 VoceChat 是一款支持独立部署的个人云社交媒体聊天服务。15MB 的大小可部署在任何的服务器上,部署简单,很少需要维护。前端可以内嵌到自己的网站下,数据完全由用户自己掌握,传输过程加密。VoceChat 从 Slack, Discord, …

Midjourney AI绘画中文教程详解(完整版)模型、命令、参数与各种高级用法

我有一种预感,您一下子看不完这篇内容,您得【收藏】一下,以便下次接着看~~ Midjourney AI绘画中文教程,Midjourney是一款2022年3月面世的AI绘画工具,创始人是David Holz。 只要输入想到的文字,就能通过人…

Midjourney Discord的使用手册

探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南2.Prompts-提示指令3.Explore Prompting-提示指令的探索4.Blend-叠加5.Midjourney Discord的使用手册6.Versions-版本…

ChatGLM-6B 部署与 P-Tuning 微调实战

自从 ChatGPT 爆火以来,树先生一直琢磨想打造一个垂直领域的 LLM 专属模型,但学习文本大模型的技术原理,从头打造一个 LLM 模型难度极大,所以这事儿就一直搁置了。 但最近一个月,开源文本大模型如雨后春笋般接踵而至&…