谷歌打响全面反击战:AI重构搜索、新模型比肩GPT-4

作者:xxx, 图文编辑:xj

来源:公众号「xxx」

明敏 丰色 发自 凹非寺
量子位 | 公众号 QbitAI

万众瞩目,谷歌的反击来了。

现在,谷歌搜索终于要加入AI对话功能了,排队通道已经开放。

09cc450167e4d21d64444bd877f46c3d.gif

当然这还只是第一步。

大的还在后面:

全新大语言模型PaLM 2正式亮相,谷歌声称它在部分任务超越GPT-4。

Bard能力大更新,不用再排队等候,并支持新语言。

谷歌版AI办公助手也一并推出,将在Gmail中抢先亮相。

谷歌云也上线多个基础大模型,为行业提供更进一步的生成式AI服务……

在最新一届I/O开发者大会上,谷歌的大放送真的太震撼。

有网友直呼:

AI大战全面开启。

231b05221978270447552b9bce856802.png

有人甚至表示:

现在我后悔为ChatGPT付费了。

ed146e6adfa3e9bb88476ad77f3116af.png

一场发布会结束,谷歌股价上涨超4%。

d8b5a0188703ab8efb58c5d2fb5d460c.png

PaLM 2部分任务超越GPT-4

毫无疑问,PaLM 2是今年I/O大会的重中之重,由皮查伊亲自做介绍。

5f7f34083dbc3fc3fe476786c4c31d82.png

目前的Bard以及谷歌超过25个AI产品和功能,现在都由PaLM 2作为底层技术支持。

作为谷歌目前最先进的大模型,PaLM 2基于Pathways架构,是PaLM的升级版,通过JAX在TPU v4上构建。

据介绍,PaLM 2接受了100多种语言的训练,这使得它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。

谷歌表示,PaLM 2的数据集中有海量论文和网页,其中包含非常多数学表达式。在这些数据的训练后,PaLM 2能轻松解决数学问题,甚至是制作图表。

编程方面,PaLM 2现在支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。

9f96b33f621dd434867fb88236730de3.png

这一次谷歌一并推出了四种不同size的PaLM 2。

他们用不同的动物来体现规模大小。最小的是“壁虎”,最大的是“独角兽”。

5fbaefeebdd41a4e9c1e849d67f1b6a5.png

其中“壁虎”版本是非常轻量级的,能在移动设备上快速运行,包括离线状态;每秒可处理20个token。

6d191abad2b39b94b6ab0066937eac9f.png

DeepMind副总裁在I/O大会前的新闻发布会上表示:

我们发现模型并不总是越大越好,这也是为什么我们决定提供一系列不同规模的模型。

这意味着微调PaLM 2会更加方便,由此它也能支持更多产品和应用。

在I/O大会上,谷歌就宣布了现在已经有超过25个产品和应用正在使用PaLM 2的能力。

具体的表现形式,就是Duet AI

167901d81270a43fbb7b7298b2adea7e.png

可以将它理解为微软365 Copilot的对标产品,是一个能够内嵌在各种办公软件中的AI助手。

谷歌在发布会现场已经展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。

包括根据提示补充邮件内容、生成PPT、根据提示生成图片素材、一键生成表格等。

2ea6fb27c181189c8cc4ed18da0fcd3d.gif

同样,这个AI助手也能提供编程帮助。基于谷歌云,它能实时推荐、纠错代码块,并且以对话方式解答编程问题,目前支持Go、JavaScript、Python和SQL。

另外基于PaLM 2,谷歌还推出了一些专业领域大模型。

谷歌的健康团队打造了Med-PaLM 2。它能回答各种医学问题,据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

f10fe3a9bd6d4a90a8bfedcef3baea4f.png

目前谷歌正在尝试让它具备多模态能力,比如自己检查X光片后给出诊断。在今年夏天晚些时候,这个模型将对一小部分谷歌云用户开放。

e6de25abcd508ed80ea4a0369558dd97.gif

另一个专业大模型是Sec-PaLM 2。

这是一个面向网络安全维护的大模型,它能分析和解释潜在的恶意脚本,并检测脚本的危险性。

那么,在展示了PaLM 2一众卓越能力后,就该聊聊怎么开放使用了。

谷歌表示,现在可以通过PaLM API接口、Firebase和Colab使用PaLM 2。

Bard全面开放,支持图片、集成自家地图等应用

对标ChatGPT的Bard终于取消排队试用,在全球180+国家和地区进行全面开放了。

新增黑暗模式,备受程序员好评:(手动狗头)

ece71cd1b42d7050d0721e24cbdc9c22.png

除了扩大访问范围,Bard也在英文之外,新增直接用日语和韩语对话的功能。中文看起来还得再等下一波——谷歌表示,很快就会新增到40种语言版本。

dd561fc58330b2267796ea7bfc4ac9e9.png

由于从今天起,Bard将全面接入PaLM 2,所以它在编程和推理上面的能力也有了很大的提升,代码生成、调试和解释都更加专业(获得程序员认可的那种)。

当你让它用python写一段国际象棋中的“四步杀”(scholar’s mate)招式,里面参考了别的代码,它会给出相关链接,方便你查看。

e6e273cc33cb465a993a5d913bbfaa5f.png

你可以就它给出代码中某个不懂的函数进行进一步提问,问它能否再改善一下,或者是要求它将所有内容都合并的一个代码块中。

cb84e0210ad79471d1c5dd6d5cb6f714.gif

不过,最惊喜的当属应广大开发者要求,加入了一键导入功能

现在,你可以将Bard生成的代码直接导出到Colab。

8dce13645551cb15284a1f1fb0cc5331.png

除了代码,你用Bard生成的任何内容,比如电子邮件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。

对了,Bard现在的回答中也支持图片了。拿来问旅游攻略最方便不过:

50c903f1e2393fd88071cdaa52c758d6.gif

除了它能用图片回答你,你也能直接丢给它图片,比如上传一张两只狗狗的照片,让它来帮你编点好玩的故事:

a140c4716a28c46fbc72a311769ddfaa.gif

这个功能由Google Lens(一款能让机器学会“看图说话”的AI应用)提供支持。

除了Google Lens,Docs、Drive、Gmail、地图等多个谷歌自家的应用能力也整合到了Bard之中。

比如在Bard的回答中直接用谷歌地图查看几所大学的地理位置:

e723ccbda8a8cc843948493d1542671a.png

有种现在要用谷歌的各种产品,只用Bard一个入口就够了的感觉。

除了自家应用,Bard这次还把Adobe Firefly给搬了上来,各种有版权的创意图像用对话就可以“信手拈来”:

1b99c4caa1a638fed42bb6370f321b81.gif

搜索重构,加入AI对话

千呼万呼,谷歌搜索终于开启了AI对话的能力。

“一家带有一个不到3岁孩子和一只狗的家庭来说,去布莱斯峡谷还是拱门国家公园游玩更好?”

对于这个问题,搁以前,你可能需要自己把它拆成各种小问题去搜索引擎整理大量信息,最终才能找到答案。

现在谷歌让你尽量一步到位。

如图所示,谷歌搜索没有简单地搬运搜出来的答案,而是将孩子和狗这两个因素都考虑进去给出整理后的回答,比如它说:

布莱斯峡谷有两条狗能进入的环路,对婴儿车也十分友好;拱门国家公园则大部分路段都不允许宠物进入;两个地方都要求宠物拴上皮带等。

ff6321e6897d96094ac6511b3b3c7569.png

每句话都有具体的依据链接供查看:

c6d6060001d90a2f06a0b1a9b9b4b2a6.png

除此之外,它还会显示了来自不同网站网友发布的攻略链接。

最重要的是,你可以对它的回答进行进一步对话式的提问,点击“ask for a follow up”按钮即可。

用新的谷歌搜索进行购物也非常有趣,它号称可以帮你迅速做出理性的购买决定。

比如当你想要一辆“适合5英里山地通勤的自行车”,它会先告诉你挑选之前需要考虑的重要因素,比如:

一看设计:电动自行车、公路自行车和混合动力自行车等适合通勤;

二看电机和电池,三看减震用的悬架,有山路的通勤需要应对裂纹和颠簸带来的冲击等。

然后再给你推荐合适的车,推荐时还会给出具体产品说明、最新评价、价格和图片等全面信息。

76fe12b5b95b56918171358760e4a81f.png

你也可以进行进一步提问,比如只要红色电动自行车,它会进一步优化回答。

94a14950b8e0669a9b2ba61a4911b3f9.png
75d52315474e016a0b4501c5545f6ab0.png

这个功能由谷歌的购物比价产品Shopping Graph提供支持,它可以搜集并不断更新来自全世界的产品列表。

值得一提的是,谷歌直言更新后的AI搜索界面照样会植入广告,但放心:它只会在专用广告位中出现,不会混进你的搜索结果中。

最后,这个新功能目前还只能在谷歌Search Labs中申请试用,且仅限美国地区的用户体验。

三大基础模型上线谷歌云

今年I/O大会,谷歌云的内容也同样抢眼。

在更新了一大波AI能力后,谷歌为自家云端机器学习平台Vertex AI,上新了三款大模型:

  • Codey:text-to-code,帮助程序员写代码

  • Imagen:text-to-image,生成高质量图像

  • Chirp:speech-to-text,方便沟通

d6442232c6977a7fff4919db3226500c.gif

这三种模型的能力其实在今天的发布会上都有展示过,比如生成代码、谷歌照片智能编辑等。

f5b1bc92b1cc2118bce98c7d07ed0ea8.gif

除此之外,在Vertex AI上现在还能使用文本和图像的嵌入式API。它支持将文本和图像数据转换为多维数值向量、映射语义关系,从而允许开发者创建出更加有意思的应用。

另一个重大更新则在RLHF上,谷歌表示他们是首个将此功能作为托管服务放到端到端机器学习平台行的。好处是能让企业结合RLHF快速训练奖励模型,用于微调基础模型,这对于大模型在行业应用中的准确性提升非常关键。

除了模型方面,谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和Nvidia H100结合,谷歌云能够提供更大的计算吞吐量和带宽,能够让企业更快开发机器学习模型。

除了这些,谷歌这次还带来售价1799美元(合人民币约1万2)的首款折叠屏手机等新硬件产品,以及接入AI功能的Android 14系统(比如提供信息回复建议什么的),这里就不一一展示了。

总的来看,作为第15届I/O大会,谷歌这次着实给大家带来了非常多的干货。

值得一提的是,这次上台介绍的发言嘉宾,已不见Jeff Dean的身影,他前几日刚刚职级变动。

作为从前Google AI最代表性发言的高管,在AI 2.0浪潮里,将何在?

谷歌是否还能在大模型和AI搜索领域中奋起追上,也值得期待。

你对这次谷歌的反击,满意吗?

------

我们创建了一个高质量的技术交流群,与优秀的人在一起,自己也会优秀起来,赶紧点击加群,享受一起成长的快乐。另外,如果你最近想跳槽的话,年前我花了2周时间收集了一波大厂面经,节后准备跳槽的可以点击这里领取!

推荐阅读

  • 从微服务转为单体架构、成本降低 90%!是的,你没看反!

  • Deno推出高性能键值数据库Deno KV

  • 谷歌:我们和 OpenAI 都赢不了,因为正被“开源”偷家!

··································

你好,我是程序猿DD,10年开发老司机、阿里云MVP、腾讯云TVP、出过书创过业、国企4年互联网6年。从普通开发到架构师、再到合伙人。一路过来,给我最深的感受就是一定要不断学习并关注前沿。只要你能坚持下来,多思考、少抱怨、勤动手,就很容易实现弯道超车!所以,不要问我现在干什么是否来得及。如果你看好一个事情,一定是坚持了才能看到希望,而不是看到希望才去坚持。相信我,只要坚持下来,你一定比现在更好!如果你还没什么方向,可以先关注我,这里会经常分享一些前沿资讯,帮你积累弯道超车的资本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/34513.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AutoGPT、AgentGPT、BabyAGI、HuggingGPT、CAMEL:各种基于GPT-4自治系统总结

ChatGPT和LLM技术的出现使得这些最先进的语言模型席卷了世界,不仅是AI的开发人员,爱好者和一些组织也在研究探索集成和构建这些模型的创新方法。各种平台如雨后春笋般涌现,集成并促进新应用程序的开发。 AutoGPT的火爆让我们看到越来越多的自…

恐怖的GPT4!我All In了!!

"GPT4 太恐怖了,我要All In了" "作为一个程序员,我能接受被淘汰,但是我要亲眼见证下我是怎么被淘汰的" 不止一次听到不同的人和我说类似的话了。 最近几天,chatGPT实在是太火了,火得一塌糊涂&…

chatgpt赋能python:Python新手如何兼职学习SEO技能

Python新手如何兼职学习SEO技能 随着互联网的快速发展,SEO技能已经成为了许多企业必备的能力。而Python作为一种强大的编程语言,正在被越来越多的企业所青睐。本文将介绍Python新手如何兼职学习SEO技能。 什么是SEO? SEO即搜索引擎优化&am…

微软:GPT-4下周发布,剑指多模态,可支持视频

白交 发自 凹非寺量子位 | 公众号 QbitAI GPT-4真的要来了!发布时间已确定: 就在下周。而且还是多模态,可支持视频。 听到这个消息,网友们直接炸了锅:大家都准备好了吗? 毕竟在一部分人眼中,Cha…

AI又火了,这一次云厂商能赚到钱吗?

由ChatGPT带来的AI热潮还在不断涌现并升温,我们又将进入一个“AI之夏”,到底谁能赚到第一桶金呢?最近,美国著名投资机构A16Z在一篇题为《Who Owns the Generative AI Platform?(谁能赢得生成式AI平台)》的…

国产AI大模型酣战,科大讯飞打响“智慧涌现”第一枪

配图来自Canva可画 ChatGPT问世半年之久,人与AI“你问我答”的游戏热度不降反升,AI大模型技术需求也随之水涨船高,成为科技企业重点关注的方向。 在海外,OpenAI、谷歌、微软的AI大模型战争正打得火热;在国内&#xf…

《狂飙》监控Bug及国产8K摄像头应用解析

本文将从《狂飙》监控开始,展开分析国产8K摄像头应用。 什么是监控?视频监控系统是安全防范体系中的一个重要的组成部分,是一种先进的且防范能力极强的综合性系统,可以通过遥控摄像机及辅助设备(镜头、云台等&#xff…

TCGA_生存分析

library("survival") library("survminer") 生存分析需要三个 vector,在一个dataframe中: 生存时间,以mouths或者days作单位;结局,"Dead"或者"Alive","Ali…

癌症基因图谱( TCGA)数据库(一)数据下载

在TCGA数据库中检索并下载5 种不同类型癌症(包括BRCA, BLCA, LGG, LUAD 和 LUSC)病例的 RNA转录组RNA-seq数据。一共有3329个TCGA样本,每个样本中有六万多个基因。数据下载完成后,还是一堆文件夹,接下来需要使用Python…

TCGA各种肿瘤数据的20多种不同玩法/挖掘方法

肿瘤基因组图谱 (The Cancer Genome Atlas,TCGA) 计划是由美国国家癌症研究院(National Cancer Institute,NCI)和美国国家人类基因组研究所(National Human Genome Research Institute,NHGRI)于2006年联合启动的项目,目前共计研究33种癌症类型。 TCGA利用大规模测序为…

TCGA_临床数据下载_全面数据

TCGAbiolinks (三&#xff09;获取全面的临床数据 – 璃墨的小站 library(TCGAbiolinks) 一、基础数据下载 1 下载GDC文件 query <-GDCquery(project "TCGA-PRAD", data.category "Clinical", file.type "xml") 2 组合数据 #选择要…

使用cBioPortal查看TCGA肿瘤数据

欢迎关注”生信修炼手册”! cBioPortal整合了来自TCGA,CCLE以及几个独立的大型肿瘤研究项目的数据&#xff0c;构建了一个易于使用的网站&#xff0c;不需要有深厚的计算机功底&#xff0c;也可以通过该网站查询&#xff0c;分析&#xff0c;可视化肿瘤的相关结果。 针对该网站…

TCGA临床数据整理

TCGA临床数据的整理是一个基本的操作 我们选择临床数据在Data category 中选择clinical 最重要的在Data format 中一定要选择XML的]格式 选择自己研究的TCGA肿瘤类型&#xff0c;添加到cart里面下载数据 点击download 下载 cart的内容 保存你们自己喜欢的位置。下面一步是个…

TCGA数据库与肿瘤数据分析(参考后整理)

1.INTRODUCTION&#xff08;介绍&#xff09; 1.数据来源 GDC Legacy ArchiveGDC Harmonized database 2.barcode 2.Install.packages(包安装) 3.数据下载 我们以胆管癌数据为例进行展示 下载表达数据 #数据查询&#xff08;就像你在页面网站上点来点去&#xff09; query…

原画师为什么多数不到30就不做了?

相信有很多热爱美术得人都有一个成为原画师的梦想 进入自己喜欢的项目~跟大神在一起~不断发挥自己的想象力和创意~做出真正属于自己的游戏 每天都在干自己喜欢的事情 打机画画打机画画打机画画…… 但是,当自己的爱好成为了工作,真的有那么快乐吗? 真正受欢迎的游戏…

首批因AI失业的人出现-某游戏公司裁掉半数原画师

如今各种AI爆火&#xff0c;不可避免的的会与某些功能撞车职业发生冲突&#xff0c;每一次生产力的变革&#xff0c;在带来技术进步与更高效率的同时&#xff0c;也都无可避免的会带来一波失业浪潮&#xff0c;当下的人工智能浪潮自然也不例外。 现在&#xff0c;第一批因为AI…

Home Assistant 家庭智能中心

简介 Home Assistant 是一个基于Python 3开发的开源家庭自动化平台。可以跟踪和控制家庭中的所有设备&#xff0c;并实现自动化控制。 可以完美的运行在Raspberry Pi。 1.简单介绍&#xff0c;优势: 1完全本地化&#xff0c;不受服务器限制 2.支持设备广&#xff0c;全面打…

头像更改

开发工具与关键技术&#xff1a;VS2015&#xff0c;ASP.NET MVC撰写时间&#xff1a;2019年5月7日我们平时登录账号都会有头像&#xff0c;账号&#xff0c;密码这些&#xff0c;而账号和密码是最基本的东西&#xff0c;这里就说一下更改账户号&#xff0c;密码&#xff0c;头像…

PowerShell实现双屏连接模式切换、输入法切换、软件进程开启及关闭(Quicker和uTools)ps1脚本实现

背景 最近写了个PowerShell的ps1脚本&#xff0c;方便我实现电脑打游戏&#xff08;主要是战地2042&#xff09;和工作学习打代码模式的切换。 功能 实现两个模式的切换。 模式一&#xff1a;游戏模式 双屏连接方式&#xff1a;仅第二屏幕 输入法&#xff1a;英文(en-US) 软件Q…

【GPT4】微软 GPT-4 测试报告(3)GPT4 的编程能力

欢迎关注【youcans的GPT学习笔记】原创作品&#xff0c;火热更新中 微软 GPT-4 测试报告&#xff08;1&#xff09;总体介绍 微软 GPT-4 测试报告&#xff08;2&#xff09;多模态与跨学科能力 微软 GPT-4 测试报告&#xff08;3&#xff09;GPT4 的编程能力 【GPT4】微软 GPT-…