声称或超越GPT-4!谷歌PaLM 2:全面向ChatGPT微软开炮

明敏 丰色 发自 凹非寺  量子位 | 公众号 QbitAI

万众瞩目,谷歌的反击来了。

现在,谷歌搜索终于要加入AI对话功能了,排队通道已经开放。

38b67267eb80de524fbe0a0b5f8c868e.gif

当然这还只是第一步。

大的还在后面:

全新大语言模型PaLM 2正式亮相,谷歌声称它在部分任务超越GPT-4。

Bard能力大更新,不用再排队等候,并支持新语言。

谷歌版AI办公助手也一并推出,将在Gmail中抢先亮相。

谷歌云也上线多个基础大模型,为行业提供更进一步的生成式AI服务……

在最新一届I/O开发者大会上,谷歌的大放送真的太震撼。

有网友直呼:

AI大战全面开启。

58bea3df28f565296695d37a6e3aceea.png

有人甚至表示:

现在我后悔为ChatGPT付费了。

323ba6032444045220c0db7744970946.png

一场发布会结束,谷歌股价上涨超4%。

26dcc9db873368d7e3d950a84dcf575e.png

PaLM 2部分任务超越GPT-4

毫无疑问,PaLM 2是今年I/O大会的重中之重,由皮查伊亲自做介绍。

af57c33089cca5cab34f46b30dd3d0e3.png

目前的Bard以及谷歌超过25个AI产品和功能,现在都由PaLM 2作为底层技术支持。

作为谷歌目前最先进的大模型,PaLM 2基于Pathways架构,是PaLM的升级版,通过JAX在TPU v4上构建。

据介绍,PaLM 2接受了100多种语言的训练,这使得它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。

谷歌表示,PaLM 2的数据集中有海量论文和网页,其中包含非常多数学表达式。在这些数据的训练后,PaLM 2能轻松解决数学问题,甚至是制作图表。

编程方面,PaLM 2现在支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。

b83971b09cfc7a3f17641983715fae98.png

这一次谷歌一并推出了四种不同size的PaLM 2。

他们用不同的动物来体现规模大小。最小的是“壁虎”,最大的是“独角兽”。

c0113ba0ad052d580c3c9c1a04a625f5.png

其中“壁虎”版本是非常轻量级的,能在移动设备上快速运行,包括离线状态;每秒可处理20个token。

c99420a3b74e324e1560fed49dfefda3.png

DeepMind副总裁在I/O大会前的新闻发布会上表示:

我们发现模型并不总是越大越好,这也是为什么我们决定提供一系列不同规模的模型。

这意味着微调PaLM 2会更加方便,由此它也能支持更多产品和应用。

在I/O大会上,谷歌就宣布了现在已经有超过25个产品和应用正在使用PaLM 2的能力。

具体的表现形式,就是Duet AI

3ac9a9476e8965e8202315b755788b6d.png

可以将它理解为微软365 Copilot的对标产品,是一个能够内嵌在各种办公软件中的AI助手。

谷歌在发布会现场已经展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。

包括根据提示补充邮件内容、生成PPT、根据提示生成图片素材、一键生成表格等。

7fb5e4687eab6068d1f454cfc6bda6b0.gif

同样,这个AI助手也能提供编程帮助。基于谷歌云,它能实时推荐、纠错代码块,并且以对话方式解答编程问题,目前支持Go、JavaScript、Python和SQL。

另外基于PaLM 2,谷歌还推出了一些专业领域大模型。

谷歌的健康团队打造了Med-PaLM 2。它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

a1a13e5988443edc812c1ab4d7ce3207.png

目前谷歌正在尝试让它具备多模态能力,比如自己检查X光片后给出诊断。在今年夏天晚些时候,这个模型将对一小部分谷歌云用户开放。

de07ba5565efa5d6430790b519cfab73.gif

另一个专业大模型是Sec-PaLM 2。

这是一个面向网络安全维护的大模型,它能分析和解释潜在的恶意脚本,并检测脚本的危险性。

那么,在展示了PaLM 2一众卓越能力后,就该聊聊怎么开放使用了。

谷歌表示,现在可以通过PaLM API接口、Firebase和Colab使用PaLM 2。

Bard全面开放,支持图片、集成自家地图等应用

对标ChatGPT的Bard终于取消排队试用,在全球180+国家和地区进行全面开放了。

新增黑暗模式,备受程序员好评:(手动狗头)

7bcece18777d5642e3f260b550041d7d.png

除了扩大访问范围,Bard也在英文之外,新增直接用日语和韩语对话的功能。中文看起来还得再等下一波——谷歌表示,很快就会新增到40种语言版本。

20b43188a4293fc3c4dbe9072e4959ec.png

由于从今天起,Bard将全面接入PaLM 2,所以它在编程和推理上面的能力也有了很大的提升,代码生成、调试和解释都更加专业(获得程序员认可的那种)。

当你让它用python写一段国际象棋中的“四步杀”(scholar’s mate)招式,里面参考了别的代码,它会给出相关链接,方便你查看。

315943e0aea3106a677976f21939a46a.png

你可以就它给出代码中某个不懂的函数进行进一步提问,问它能否再改善一下,或者是要求它将所有内容都合并的一个代码块中。

3abcb38da7b584a13ba755e6b9e8eebf.gif

不过,最惊喜的当属应广大开发者要求,加入了一键导入功能

现在,你可以将Bard生成的代码直接导出到Colab。

c7bd6fa4f4e0b5966ee20a5693b48759.png

除了代码,你用Bard生成的任何内容,比如电子邮件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。

对了,Bard现在的回答中也支持图片了。拿来问旅游攻略最方便不过:

8efae2bb29f0f79c7a7c8e4847b7f7ab.gif

除了它能用图片回答你,你也能直接丢给它图片,比如上传一张两只狗狗的照片,让它来帮你编点好玩的故事:

82862f07ce31eb56d1e24fae83ab9d38.gif

这个功能由Google Lens(一款能让机器学会“看图说话”的AI应用)提供支持。

除了Google Lens,Docs、Drive、Gmail、地图等多个谷歌自家的应用能力也整合到了Bard之中。

比如在Bard的回答中直接用谷歌地图查看几所大学的地理位置:

5eecd19b6dbae57903f6716e069b922c.png

有种现在要用谷歌的各种产品,只用Bard一个入口就够了的感觉。

除了自家应用,Bard这次还把Adobe Firefly给搬了上来,各种有版权的创意图像用对话就可以“信手拈来”:

ece88e6e5795ea61f2fa7ca1fe8566d1.gif

搜索重构,加入AI对话

千呼万呼,谷歌搜索终于开启了AI对话的能力。

“一家带有一个不到3岁孩子和一只狗的家庭来说,去布莱斯峡谷还是拱门国家公园游玩更好?”

对于这个问题,搁以前,你可能需要自己把它拆成各种小问题去搜索引擎整理大量信息,最终才能找到答案。

现在谷歌让你尽量一步到位。

如图所示,谷歌搜索没有简单地搬运搜出来的答案,而是将孩子和狗这两个因素都考虑进去给出整理后的回答,比如它说:

布莱斯峡谷有两条狗能进入的环路,对婴儿车也十分友好;拱门国家公园则大部分路段都不允许宠物进入;两个地方都要求宠物拴上皮带等。

6841bbd2a3e2711f682299dc90511106.png

每句话都有具体的依据链接供查看:

080bdbb3f46607ef9330000123b7a1f6.png

除此之外,它还会显示了来自不同网站网友发布的攻略链接。

最重要的是,你可以对它的回答进行进一步对话式的提问,点击“ask for a follow up”按钮即可。

用新的谷歌搜索进行购物也非常有趣,它号称可以帮你迅速做出理性的购买决定。

比如当你想要一辆“适合5英里山地通勤的自行车”,它会先告诉你挑选之前需要考虑的重要因素,比如:

一看设计:电动自行车、公路自行车和混合动力自行车等适合通勤;

二看电机和电池,三看减震用的悬架,有山路的通勤需要应对裂纹和颠簸带来的冲击等。

然后再给你推荐合适的车,推荐时还会给出具体产品说明、最新评价、价格和图片等全面信息。

27f0148847f6cc3031bebcab353ce1c2.png

你也可以进行进一步提问,比如只要红色电动自行车,它会进一步优化回答。

c406ce5074903db5cd247268acbaa95f.png
dc934ed815fbeb8699c40943ea71baf1.png

这个功能由谷歌的购物比价产品Shopping Graph提供支持,它可以搜集并不断更新来自全世界的产品列表。

值得一提的是,谷歌直言更新后的AI搜索界面照样会植入广告,但放心:它只会在专用广告位中出现,不会混进你的搜索结果中。

最后,这个新功能目前还只能在谷歌Search Labs中申请试用,且仅限美国地区的用户体验。

三大基础模型上线谷歌云

今年I/O大会,谷歌云的内容也同样抢眼。

在更新了一大波AI能力后,谷歌为自家云端机器学习平台Vertex AI,上新了三款大模型:

  • Codey:text-to-code,帮助程序员写代码

  • Imagen:text-to-image,生成高质量图像

  • Chirp:speech-to-text,方便沟通

c04abad96c6e8f66cae55aaaf5ad7aa6.gif

这三种模型的能力其实在今天的发布会上都有展示过,比如生成代码、谷歌照片智能编辑等。

7dbb82495220b4208861e2010a61fb09.gif

除此之外,在Vertex AI上现在还能使用文本和图像的嵌入式API。它支持将文本和图像数据转换为多维数值向量、映射语义关系,从而允许开发者创建出更加有意思的应用。

另一个重大更新则在RLHF上,谷歌表示他们是首个将此功能作为托管服务放到端到端机器学习平台行的。好处是能让企业结合RLHF快速训练奖励模型,用于微调基础模型,这对于大模型在行业应用中的准确性提升非常关键。

除了模型方面,谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和Nvidia H100结合,谷歌云能够提供更大的计算吞吐量和带宽,能够让企业更快开发机器学习模型。

除了这些,谷歌这次还带来售价1799美元(合人民币约1万2)的首款折叠屏手机等新硬件产品,以及接入AI功能的Android 14系统(比如提供信息回复建议什么的),这里就不一一展示了。

总的来看,作为第15届I/O大会,谷歌这次着实给大家带来了非常多的干货。

值得一提的是,这次上台介绍的发言嘉宾,已不见Jeff Dean的身影,他前几日刚刚职级变动。

作为从前Google AI最代表性发言的高管,在AI 2.0浪潮里,将何在?

谷歌是否还能在大模型和AI搜索领域中奋起追上,也值得期待。

你对这次谷歌的反击,满意吗?

关注公众号【机器学习与AI生成创作】,更多精彩等你来读:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet,一种可控生成的AIGC绘画生成算法! 

经典GAN不得不读:StyleGAN

9d17c397891a2243b29b659711943e6f.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

5de18c0c240971d6dca91c46c048399f.jpeg

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15383.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Prompt Engineering 写作准则与应用示例集

文章目录 0 优质Prompt 模版网站0.1 aimappro0.2 AI Short 1 写作规范与准则1.1 定界符的应用:分割指令与素材1.2 ChatGPT 保存对话框,保留历史信息1.3 通过Prompt让llm反思1.4 明确告诉LLM你需要正确的答案1.5 控制输出内容格式1.6 Prompt安全策略1.6.1…

用AI帮助小学一年级记住常用字

这几天娃就要一年级毕业放假了,感觉时间过得太快了。再开学就要上二年级,可汉字表上的区区三四百字,咋就那么的难读?难记?喊他们来认字,拉都拉不过来。哎,愁啊,替他们焦虑。突发奇想…

GPT中的temperature参数不是用在对话的而是用在调用OPEN API过程中的

前言 自从吴恩达OPENAI《ChatGPT 提示工程》放出后,各个层面反响热列。很多人看到了temperature这个参数,都以为在对话中或者说对话的末尾放上一个temperature=0-2的值就可以达到让GPT极大的发挥出自我创造能力、甚至写文章天马行空。 笔者这边觉得有义务指出这种用法是完全…

ChatGPT引AI大牛新老之争?谷歌钢铁侠速归救火;Prime Air首飞业绩捉急

本周AI业界有哪些新鲜事? AI开发者 ChatGPT大火,引发AI大牛新老之争? ChatGPT大火之后,AI大牛团又喜提一位传奇少年:Sam Altman。除了16岁出柜,20岁和男友一同当上CEO这样的轶事,这位大佬近日还…

unapp微信小程序转发分享、携带参数

一、第一种方式: // 开启小程序原生右上角分享按钮uni.showShareMenu({// https://developers.weixin.qq.com/miniprogram/dev/framework/open-ability/share.htmlwithShareTicket: true,menus: [shareAppMessage, shareTimeline]//开启转发好友和转发朋友圈按钮});…

暂停GPT-5研发呼吁引激战!吴恩达、LeCun带头反对,Bengio站队支持

【导读】千人签名的AI不扩散条约发布一天后,各路大佬纷纷有了后续回应,言谈间耐人寻味。「AI吹哨人」:不封杀超强AI研发,我们都得死! 昨天,千位大佬写的暂停超强AI训练六个月的联名信,如同一枚…

Yann LeCun:ChatGPT缺乏创新,没什么革命性;

来源:机器之心 在外界看来,ChatGPT 是一项巨大突破,但图灵奖得主、Meta 首席人工智能科学家 Yann LeCun 不这么认为。 自从去年底推出以来,对话式 AI 模型 ChatGPT 火遍了整个社区。 用过 ChatGPT 的人都能体会到,它是…

LeCun和马库斯齐喷ChatGPT:大语言模型果然是邪路?

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【计算机视觉】微信技术交流群 转载自:新智元 【导读】大语言模型在祛魅,媒体忽然开始追捧起了LeCun,而马库斯跳出来说,他的观…

LeCun再爆金句:ChatGPT?连条狗都比不上!语言模型喂出来的而已

【导读】LeCun昨天在一场辩论中再贬ChatGPT!形容这个AI模型的智力连狗都不如。 图灵三巨头之一的LeCun昨日又爆金句。 「论聪明程度,ChatGPT可能连条狗都不如。」 这句话来自本周四LeCun在Vivatech上和Jacques Attalie的一场辩论,可谓精彩…

提高工作效率 | ChatGPT效率神器推荐

司马阅(SmartRead) 基于ChatGPT技术的PDF解读工具可以让用户像与人类交互一样与PDF文档进行交互。这款解读工具利用ChatGPT技术,可以实现对PDF文档的自然语言处理和理解。用户可以直接对话式地与PDF文档进行交互,获得更加直观和深入的文件解读和分析。 …

ChatGPT和New Bing两大神器在手,天下我有

ChatGPT和New Bing两大神器在手,天下我有 终于搞定了两个神器,极大的解放生产力 ! 从中可以看到两个工具的区别

李开复:我亲自筹组Project AI 2.0 不仅仅要做中文版ChatGPT

雷递网 乐天 3月19日 创新工场董事长、CEO李开复今日称,其正在亲自筹组 Project AI 2.0,一个致力打造 AI 2.0全新平台和 AI-first 生产力应用的全球化公司。 这是一家由技术愿景驱动,拥有卓越中国工程底蕴的创新企业,在全球范围号…

ChatGPT-4 表现不佳(变笨)?开发者解释原因并承认存在不稳定性

最近,OpenAI 开发的大模型 GPT-4 出现了一些问题,被质疑是否变笨了。根据 Hacker News 上的一篇帖子,发帖人称 GPT-4 生成的代码错误更多了,给出的答案不再有深度了。这个帖子引发了许多人对 GPT-4 的怀疑和不信任。 然而&#xf…

chatgpt赋能python:Python截图快捷键:让你的截图过程更高效简便

Python截图快捷键:让你的截图过程更高效简便 作为一名Python工程师,你时常需要对自己编写的程序进行调试和测试,有时需要将程序的运行结果截图给同事或客户看。除此之外,你可能也经常需要截取网页、软件界面等信息。不论场景如何…

chatgpt赋能python:Python屏幕截图:完美的方法记录你的屏幕

Python屏幕截图:完美的方法记录你的屏幕 Python作为一种高级编程语言,被广泛用于开发各种应用程序和游戏,其中之一就是屏幕截图。 在本文中,我们将介绍使用Python进行屏幕截图的方法和技巧。 什么是屏幕截图? 屏幕截…

chatgpt赋能python:Python自动截屏教程

Python 自动截屏教程 介绍 Python 是一种高级程序设计语言,已广泛用于各种应用中,从 Web 开发到机器学习都有很多案例。其中,Python 的截屏功能得到了越来越多的关注,因为在很多应用场景中,自动截屏可以帮助我们更有…

[MATLAB粒子模拟笔记]归一化输入系数

%********renormalization归一化系数ren.*实际/模拟(归一化指的是网格距归一,其他参数并不归一而是等比例变化)*********% function [prm,ren]renorm(prm)ren.xprm.dx %网格距系数ren.tprm.dt/2 %时间步长系数 ren.vr…

【活动回顾】2023 年 1 月 Scala Meetup

第八期 Scala Meetup 于上周六顺利结束,三位 Scala 资深使用者与 2000 在线用户分享了三大话题: Tubi 的 gRPC 演进之路Scala 与函数式编程交互式笔记本中的 Scala 同时,应粉丝提问,大家也对“ Scala 入门和进阶路径、Akka 在分…

3月1日第壹简报,星期三,农历二月初十

3月1日第壹简报,星期三,农历二月初十坚持阅读,静待花开1. 《2022年国民经济和社会发展统计公报》发布:全年国内生产总值超121万亿元,比上年增长3.0%,全国居民人均可支配收入中位数31370元,增长4…

“数智化 让经济复苏按下快进键” ——2023成长型企业商业创新峰会深圳第三站隆重召开

以“数智化 让经济复苏按下快进键”为主题的2023成长型企业商业创新峰会,第三站于3月10日在深圳盛大开幕。深圳不仅在经济领域具备着强大的竞争力,同时也在数智化方面拥有着巨大的发展潜力和活力。来自业界的专家学者、优秀企业家、生态伙伴及媒体代表共…