谷歌推出PaLM-E,能超越ChatGPT么?

42556ff4bb90c512428c9f352c9d86af.png

202caf511af584a281b153910a275263.png

d62e5622ea6d117f782db0cbb26c3445.png




‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业


ChatGPT的横空出世,打的老牌科技巨头谷歌措手不及。在OpenAI+微软的双重压力下,自赋“红码”的谷歌亮出“大招”。

近日,谷歌和柏林工业大学的团队重磅推出史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。集成语言、视觉,用于机器人控制。相比大语言模型(LLM),它被称为视觉语言模型(VLM)。VLM与LLM不同之处,在于VLM对物理世界是有感知的。

谷歌着急了?

在AI领域,面对微软的步步紧逼,谷歌显然已经开始慌了。人工智能本应该是谷歌的优势。

多年来,谷歌一直在进行各种长远的技术投资,涉及自然语言处理、机器学习、计算机视觉、自主驾驶、量子计算等多个方面,并取得了一系列重要的科技成果和商业应用。

然而OpenAI推出的ChatGPT爆火,让谷歌不免紧张了起来。一般来说,谷歌和微软在不同的领域有着不同的竞争优势,但是,就ChatGPT而言,其可以自行生成文本。因此ChatGPT被一些人视为谷歌搜索引擎的终极挑战者。而考虑到OpenAI与微软的密切关系,ChatGPT似乎带来了双重威胁。

它的突然成功让谷歌不得不加快速度,试图在这个领域迎头赶上。 

谷歌在内部提出要求,在几个月时间里将“生成式人工智能”技术集成到所有主要产品中。根据谷歌在职员工、前员工,以及其他与该公司关系密切的人士的说法,目前谷歌的感觉是,自己在一个关键的优势领域处于落后位置,因此在公司内部引发了不小的焦虑。

因此,其步伐不免加快。除了上述的PaLM-E模型。

2022年2月,谷歌推出了一款名为"Switch Transformer"的新型自然语言处理模型。该模型采用了一种新颖的自适应计算方法,可以根据数据的不同特征自动适应计算,从而在各种自然语言处理任务上取得了更好的性能表现。

2022年3月,谷歌宣布推出了一种多语言语言模型(Multilingual Language Model, MLM),可以支持超过100种语言的自然语言处理任务。该模型在包括文本分类、命名实体识别、情感分析等任务中取得了优异的性能。

2022年3月,谷歌发布了一款自然语言生成引擎(Natural Language Generation, NLG),可以根据用户提供的信息自动生成符合语法规则和语义要求的自然语言文本。该引擎可以应用于多种场景,如客服对话、自动回复、摘要生成等。

秉持着“AI虐我千百遍,我待AI如初恋”的心理,谷歌在日前推出史上最大“通才”AI模型——PaLM-E。谷歌PaLM-E的成功或许可以为其打赢一场漂亮的战役。

目前外界对谷歌的这些举动评价较为积极。一方面,谷歌的这些新模型和引擎在自然语言处理领域都取得了优异的性能,体现了谷歌在技术研发和创新方面的实力。另一方面,谷歌在多语言处理和自然语言生成等领域的研究和应用,为构建更加智能和全球化的语言技术体系提供了重要的支持和推动。但同时,这些新模型和引擎也面临着一些挑战,如模型复杂度高、计算资源需求大、数据隐私等问题,需要进一步研究和解决。

那么谷歌的PaLM-E模型到底是什么?与ChatGPT模型相比,有哪些优劣势?我们一起来看下面的分析。

谷歌想靠着PaLM-E模型翻盘?

先来看看这个PaLM-E模型究竟是什么?

据目前的信息,谷歌PaLM-E是谷歌在自然语言处理领域中开发的一种语言模型。PaLM-E代表“Pre-training and Language Model-Enhanced”,它是基于谷歌的Bert(Bidirectional Encoder Representations from Transformers)模型的进一步改进。

相比于Bert模型,PaLM-E模型引入了一些额外的技术和改进。其中一项重要的改进是“瓶颈层”,它可以通过使用较小的瓶颈层减少模型的计算负担,并提高模型的训练和推理效率。另外,PaLM-E还增加了一种新的训练目标,称为“语言模型增强(Language Model-Enhanced)目标”,它可以帮助模型更好地处理长序列和未知单词等情况。

但其实,无论是谷歌PaLM-E模型还是BERT模型都是基于Transformer架构的预训练语言模型。这与OpenAI所推出的ChatGPT所使用的预训练模型相同,也就是基础架构是相同的。

而这个基础架构Transformer 正是由谷歌发布,一些人把它带来的人工智能领域方面的进步称作transformer AI。外界对Transformer拥有强大的表征能力和并行计算优势也十分看好。斯坦福大学的研究人员在2021年8月的一篇论文中将Transformer称作“基础模型”,认为它推动了AI的范式转变。

谷歌团队将Transformer模型概括为一句话:Attention is All You Need. 这是一个完全基于注意力机制的编解码器模型,完全抛弃了之前其他模型引入注意力机制后仍然保留的循环与卷积结构,在任务表现、并行能力和易于训练性方面都有大幅提升,因此也成为了后续机器翻译和其他许多文本理解任务的重要基准模型。

Transformer可以读取许多单词或句子来训练模型,充分理解词之间的相互关联,并预测接下来出现的词。Transformer架构不断发展并扩展到多种不同的变体,从语言任务扩展到其他领域。该模型应用相当广泛,可以实时翻译文本和语音,保证听障者也可以顺利参会;可以帮助研究人员了解DNA中的基因链和蛋白质中的氨基酸链,加快药物设计进程等等。

可以说,在初期,谷歌在人工智能方面的实力不容小觑。

而PaLM-E的推出是为了让AI同时具备“理解文字”和“读懂图片”的能力,不仅能够输出文字,还能输出指令使得机器人的智能化跃上一个新的台阶。

据谷歌介绍称,当得到一个高级命令,如“把抽屉里的米片拿给我”,PaLM-E可以为带有手臂的移动机器人平台(由谷歌机器人公司开发)生成一个行动计划,并自行执行这些行动。

2cf5b45d1d4ddb39edf59dc12457a704.png

PaLM-E 通过分析来自机器人摄像头的数据来实现这一目标,而无需对场景进行预处理。这消除了人类对数据进行预处理或注释的需要,使机器人控制更加自主。

PaLM-E 还很有弹性,能够对环境做出反应。例如,PaLM-E 模型可以引导机器人从厨房里拿一袋薯片,由于PaLM-E 集成到了控制回路中,它对任务中可能发生的中断有了抵抗力。在一个视频例子中,一名研究人员从机器人手中抓起薯片并移动它们,但机器人找到了薯片并再次抓起它们。

另外,PaLM-E模型也可控制机器人自主完成原需人类指导的复杂任务。除了机器人技术外,谷歌研究人员还观察到使用大型语言模型作为PaLM-E核心的几个有趣效果,其中一个是PaLM-E能表现出“正向转移”,这意味其可将从一个任务中学到的知识和技能转移到另一个任务中,相较单任务机器人模型能有更好的表现。

值得注意的是,身为谷歌 AI 劲敌的微软近期也发表了“ChatGPT for Robotics”的论文,以类似的方式结合视觉数据和大型语言模型来控制机器人。

大战开场,究竟谁能称王?

谷歌PaLM-E模型和ChatGPT模型都是在自然语言处理领域中非常有代表性的语言模型。其中,谷歌此次公布的PaLM-E参数量高达5620亿,而GPT-3的参数量为1750亿。谁会更胜一筹?

相比ChatGPT模型,谷歌PaLM-E模型实现的一定突破:

如更好的处理长序列,谷歌PaLM-E模型采用了语言模型增强技术,可以更好地处理长序列,使得模型能够更好地理解上下文信息。而ChatGPT模型并没有采用这种技术,因此在处理长文本时可能会存在一些限制。

在训练效率方面,谷歌PaLM-E模型在瓶颈层的设计上采用了更小的隐藏层和更高的批处理大小,从而提高了训练和推理的效率。而ChatGPT模型在训练时需要更大的批处理大小,因此训练效率相对较低。

在应用场景方面,谷歌PaLM-E模型在各种自然语言处理任务上都表现出了优秀的性能,如文本分类、命名实体识别、情感分析、机器翻译等。而ChatGPT模型更多地应用于对话生成等任务。

尽管谷歌PaLM-E模型在一些方面取得了突破,但相对于ChatGPT模型,它仍存在一些不足之处,

首先,PaLM-E模型语言生成能力较弱,PaLM-E模型虽然在各种自然语言处理任务上表现出了优秀的性能,但在语言生成任务上的表现相对较弱。相比之下,ChatGPT模型专注于对话生成等任务,具有更好的生成能力。

其次,PaLM-E模型缺乏预训练模型的公开。虽然PaLM-E模型在学术界广受好评,但它没有公开预训练模型,这限制了它在实际应用中的使用范围和便利性。相比之下,ChatGPT模型已经公开了多个预训练模型,可以方便地应用于各种自然语言处理任务。

最后,PaLM-E模型需要更多的计算资源来训练和推理,因此在部署和应用方面可能需要更高的成本和投入。

综上所述,虽然谷歌PaLM-E模型在某些方面具有优势,但在语言生成、公开预训练模型和计算资源等方面仍存在一些不足。

人工智能诞生之初,社会各界对AI无比乐观,专家甚至表示机器将在20年内完成人类的所有工作。很快,研究成果的匮乏直接带来了资金支持的削减和大批项目的流产,极度的乐观被极度的悲观取代,AI寒冬到来。接着,新技术、新发现又再次点燃了人们对于AI的热情,使得资金重新注入、进展再次到来。如此循环往复,人们对AI的情绪在悲观和乐观之间反复震荡,AI就这样螺旋式上升发展。

在AI的螺旋式上升发展过程中,挑战和机遇并存,惊喜和意外同在,人们的乐观和悲观情绪更是时常转换。在人工智能发展这条快车道上,谁都有可能暂时超车。

文:媛媛 余小鱼 / 数据猿

44081899e7b8b2a7ad3d245f11ec529f.jpeg

ChatGPT+Martech双选题月

开启无限可能!

点击查看详情↓↓↓

6b9b6452b43613d3798f36d37637fd5b.png

9fc4a13d4de41da5fb8132c149b23c95.png

8c92ebd0dd9f5999c0d41bb5b70bd3ee.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9591.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

“文心一言”和“ChatGPT”两者有何差距?

如果说现阶段火遍全球应用是什么,绝大多数人会脱口而出——ChatGPT。当然最近我们国内版也出来了,就是百度的“文心一言”,文心一言和ChatGPT都是当下以语言模型为核心的人工智能平台,这两者对比之下有何不一样呢?下面…

ChatGPT+Midjourney

一键部署属于你的ChatGPTMidjourney网页,目前已实现: 1.imagin 想象 2.upscale 放大 3.variation 变幻 4.describe 识图 5.blend 混图 6.垫图 开源地址:https://github.com/Licoy/ChatGPT-Midjourney 欢迎大家访问:http://…

ChatGPT 的议论文究竟写的怎么样?111 位高中教师告诉你答案

夕小瑶科技说 原创 作者 | 小戏、Python 在 OpenAI GPT-4 发布时发布的《GPT-4 Technical Report》中,其中很吸引人眼球的一部分是 GPT-4 应用于教育领域的出色表现,通过让 GPT-4 去完成美国的 AP 课程及考试,来评估 GPT-4 在多个学科中的性…

刚刚!ChatGPT演示即将上线王炸功能!不仅推出官方版AutoGPT,还能联网,支持处理Excel,发推购物一条龙!...

转载自量子位 OpenAI官方AutoGPT,要来了! 就在AutoGPT项目破10万Star之际,OpenAI也放出重磅炸弹,由联合创始人格雷格布洛克曼(Greg Brockman)亲自现场演示了ChatGPT即将上线的新功能。 比如要一张这样有氛围…

【历史上的今天】7 月 10 日:iOS App Store 问世;台积电创始人出生;第一台被“越狱”的 iPhone

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 7 月 10 日,在 1856 年的今天,交流电的发明者尼古拉特斯拉(Nikola Tesla)出生。特斯拉被认为是电力商业化的重要…

沙龙|AI iPhone时刻来临!如何获得登上类ChatGPT的船票?

出品|网易科技数字星球 作者|袁宁 编辑|丁广胜 兴奋麻了!还没从ChatGPT带来的震撼中回过神来,过去几天GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言相继引爆,互联网巨头纷纷抢…

来自 ChatGPT 的威胁?谷歌、百度纷纷入局,苹果被迫“开卷”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 近年来,AIGC 应用可谓是多处开花,成为了科技巨头的“必争之地”。 随着 ChatGPT 在互联网上“高热不下”,除了拍案叫绝的聊天能力以及惊人的准确率备…

苹果 App Store 出现山寨ChatGPT;Anthropic宣布获得4.5亿美元C轮融资

🚀 中国互联网协会提醒公众警惕“AI换脸”的新骗局 中国互联网协会提醒公众警惕“AI换脸”的新骗局,不法分子利用AI技术通过声音合成、伪造面部表情等实施诈骗。 公众应加强个人信息安全与防范措施,如加强个人信息保护、防止信息泄露、安装…

论文阅读 A Survey of Large Language Models 3

文章目录 能力评估基础任务语言生成知识利用率复杂推理 高级能力评估人类对戏与外部环境的交互作用扩展能力范围 公共基准测试和经验分析评价基准对LLM的能力进行全面分析 结论和未来方向 能力评估 为了检验LLM的有效性和优越性,大量的任务和基准被用来进行实证评估…

【NLP】大模型综述来了!一文带你理清全球AI巨头的大模型进化史

夕小瑶科技说 原创 作者 | 小戏,Python 如果自己是一个大模型的小白,第一眼看到 GPT、PaLm、LLaMA 这些单词的怪异组合会作何感想?假如再往深里入门,又看到 BERT、BART、RoBERTa、ELMo 这些奇奇怪怪的词一个接一个蹦出来&#xf…

LLMs模型速览(GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca)

文章目录 一、 GPT系列1.1 GPTs(OpenAI,2018——2020)1.2 InstructGPT(2022-3)1.2.1 算法1.2.2 损失函数 1.3 ChatGPT(2022.11.30)1.4 ChatGPT plugin1.5 GPT-4(2023.3.14&#xff0…

【人工智能】大模型综述 —— 一文带你理清全球AI巨头的大模型进化史

目录 导读 家谱树——大模型的前世今生 数据——大模型的力量源泉

山东大学软件学院2022-2023第二学期自然语言处理期末考试回忆版

山东大学软件学院2022-2023第二学期自然语言处理期末考试回忆版 前言 1、考试时间:2023/6/13 14:00 – 16:00 2、考试科目:自然语言处理(老师:SunYuQing) 3、考题语言:中文 4、考试形式:闭卷 …

ICLR 2023 | Self-Consistency: Google超简单方法改善大模型推理能力

大家好,我是HxShine。 今天分享一篇Google Research, Brain Team的一篇文章,SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS[1]:利用自洽性提高语言模型中的思维链推理效果 这篇文章方法非常简单但是效果非常好…

【ChatGPT 翻译】Language Models are Few-Shot Learners

【ChatGPT 翻译】Language Models are Few-Shot Learners 摘要 Abstract1 引言 Introduction2 方法2.1 模型和体系结构2.2 训练数据集2.3 训练过程2.4 评估 3 结果3.1 语言建模、完形填空和完成任务3.1.1 语言模型3.1.2 LAMBADA3.1.3 HellaSwag3.1.4 StoryCloze 3.2 闭卷问答翻…

ChatGPT的今天,早已被这本书预言了|文末赠书

最近,ChatGPT大火了!推出之后,ChatGPT只用了两个月就积累了1亿用户,随着越来越多的人开始用ChatGPT,发现他能做的东西越来越多,写论文、写作业、写文案、写代码都不在话下。 于是,各种稀奇古怪的…

OpenAI ChatGPT 3.5模型和清华开源ChatGLM-6B模型的对比,到底ChatGPT强在哪里(内含几个国内GPT可用途径)

目录 前言: (1)环境 (2)比较用例 (a)中文提问:用java写冒泡排序算法 (b)中文提问:a10,b6,不新增变量,怎么交换a和b的值&#xff…

当ChatGPT的子弹射中知乎

题图|视觉中国 毫无疑问,ChatGPT 已然成为 2023 上半年最有影响力的商业话题。 ChatGPT 横空出世仅百余天便让整个互联网都为之躁动,心有猛虎的公司都在寻找向上攀爬的入口——“文心一言”之于百度、“通义千问”之于阿里、百川智能之于王小…

OpenAI Translator - 基于 ChatGPT的最强开源 AI 划词翻译工具

为啥要造这个轮子? 我开发了一个 Bob 的插件 bob-plugin-openai-translator 使用 ChatGPT API 在 macOS 上进行全局划词翻译。 但是由于很多用户并不是 macOS 用户,所以特此开发了一个浏览器插件方便非 macOS 用户使用 ChatGPT 进行划词翻译。 既是浏…

Mac最先进的API工具-RapidAPI for Mac

一、前言 当使用 Mac 进行接口测试的时候,一般都会想到接口测试工具 Postman、Jmeter。 Postman 以其页面友好,功能简单,可以快速上手进行接口测试。而 Jmeter 除了测接口外,还可以进行接口自动化测试、性能测试等。 本篇将介绍…