谷歌一雪前耻,全新PaLM 2反超GPT-4,办公全家桶炸裂升级,Bard史诗进化

【新智元导读】新版PaLM 2超强进化,办公全家桶Workspace全面升级,Bard全面增强、所有人可用……可以看出,这届I/O大会,谷歌是真的憋出不少大招。

谷歌I/O 2023大会,仿佛又给谷歌的支持者们打了一针强心剂。

此前,因为微软和OpenAI的优异表现,谷歌已经被唱衰了很久。

但是,毕竟是做出了众多奠基性工作的AI老牌公司,谷歌这一轮的发力,让我们精神一振——它只是慢了,并不是噶了。

对打GPT-4的PaLM 2登台、Duet AI整进谷歌办公全家桶Workspace、Bard超强进化向所有人开放、谷歌搜索加入AI快照、AI新功能整合进Android 14、AI魔术编辑器加入谷歌相册等等。

这届I/O大会,可谓眼花缭乱,精彩纷呈。

01 PALM 2秀肌肉,手机也能跑

OpenAI的GPT-4,已经被全世界公认为最强大的语言模型。

怎么对打GPT-4?谷歌的答案,就是PaLM 2。

恰在今天,谷歌一同发布了PaLM 2技术报告。

论文地址:https://ai.google/static/documents/palm2techreport.pdf

显然,PaLM2被寄予了厚望,以缩小谷歌和微软之间在AI方面的差距。

劈柴介绍说,因为广泛的逻辑和推理训练,PaLM 2模型在逻辑和推理方面更加强大。据说,PaLM 2在超过100多种语言的多语言文本上进行了训练。

根据基准测试,对于具有思维链prompt或自洽性的MATH、GSM8K和MGSM基准评估,PaLM 2的部分结果超越了GPT-4。

据谷歌高级研究主管Slav Petrov介绍,PaLM 2在推理、编码和翻译上都表现更好,与2022年4月发布的第一代PaLM相比,PaLM 2有了明显的改进。

可以看到,PaLM 2的推理能力,得到了显著的改进

修改代码bug后,用韩语评论。

比如,PaLM 2能够理解不同语言的成语。

比起PaLM,在最新专业语言熟练度考试中的表现,PaLM 2的日语水平达到了A级,而PaLM达到了F级。PaLM 2的法语水平达到了C1级。

德语「Ich verstehe nur Bahnhof」如果直译,就是「我只理解火车站」,但如果你问它,你是不是理解错误了?

它马上就会告诉你,没错,这个德语的意思是「你说的啥?我什么都听不懂」。

再比如,和波斯谚语「Na borde ranj ganj moyassar nemishavad」(No Pain, No Gain)意思相近的中文谚语是什么?

在相关论文中,谷歌工程师声称PaLM 2的语言能力已经「足以教授这门语言」,原因是其训练数据中的非英语文本更为普遍。

PaLM 2包含了4个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。

这些微调就像给一个卡车底盘,加上一个新的发动机或前保险杠,以在某些特定任务上更好地工作。

这样的优势不言而喻,不用花费大量的时间和资源来创建,直接部署。

另外,PaLM2有一个基于健康数据训练的版本Med-PaLM 2,可以轻松通过美国医学执照考试,达到「专家」水平。

一个基于网络安全数据训练的版本Sec-PaLM 2,可以解释潜在恶意脚本的行为,检测到代码中的威胁。这两种模型都将通过谷歌云提供给特定客户。

目前,PaLM 2已经应用在25种功能和产品中,包括办公全家桶、聊天机器人Bard、搜索等等。

值得称赞的是,PaLM 2最轻量版本Gecko小到可以在手机上运行,每秒可以处理20个token,大约每秒16或17个单词。

不过,谷歌没有提及具体用什么硬件来测试这个模型,只是说在「最新的手机上」运行。

显然,这次谷歌在大语言模型的小型化上,取得了非常重要的进步。在云端运行这种AI,往往是很昂贵的,如果能在本地运行,无疑有着许多显著优势,比如隐私保护。

英伟达科学家Jim Fan对此大加赞许——

下一波LLM将是移动原生的。一个离线的、永远在线的LLM不仅可以降低服务成本,而且还为用户体验开辟了全新的途径。例如,一个元应用程序可以从你的移动工作流程中学习,并为你实现自动化。在小屏幕上节省的生产力,将比在大屏幕上多得多。

此前,谷歌一直被嘲在AI研究上已经落后于微软,PaLM 2,无疑是谷歌的一次重大回击。

但PaLM 2同样也面临着一些争议,比如训练语言模型的数据是否合法?

谷歌只是提到训练语料库来自「网络文档、书籍、代码、数学和对话数据」,但并没有进一步的细节。

而大语言模型的幻觉问题,同样无法避免。谷歌研究副总裁Zoubin Ghahramani表示,PaLM 2是对早期模型的改进,谷歌「投入了大量精力,不断改进基础性和归因指标」。

但他承认,在打击AI产生的虚假信息方面,大家都还有很长的路要走。

除了PALM 2,谷歌还宣布了正在训练的全新基础模型Gemini。这是第一个多模态模型,同样包含了参数大小不同的模型。

除了介绍模型,谷歌还特地介绍了开发 AI 技术的社会责任感,包括两个判别AI生成内容的工具:

- watermarking(嵌入水印)

- metadata(嵌入元数据)

02 Duet AI:办公全家桶新升级

此前,微软Copilot把GPT-4整进了全系办公产品,掀起了震惊全世界的办公软件革命。

怎么破?谷歌这次祭出了Duet AI,给谷歌办公全家桶Workspace来了一个全新升级。

其实呢,这也就是新瓶装旧酒,Duet AI就是Docs和Gmail等软件中AI工具的新名字。

谷歌希望,生成式AI能让Gmail、Docs、Sheets和Slides更有用,不过目前,大部分功能还在开发中。

Duet AI会涵盖谷歌的各种办公软件,包括在文档和Gmail中的写作辅助、幻灯片的图片生成、Meet的自动会议摘要等等。

在文档中,只要点「Help me write」,Duet AI就能自动帮你生成招聘启事。

好玩的是,你还可以规定任意文风,比如让它古怪的调调写出一个工作描述。

在Google Slids中,Duet AI能直接从幻灯片中的文本生成图像。

简单描述一下,合意的图片立马生成。

想做一个遛狗业务的收费表?描述一下,它就给你自动生成。

而I/O大会上一个真正的新事儿是,写作辅助也会应用在移动端的Gmail上,这是对Smart Compose的升级。

现在,如果想试用这些新工具,需要注册Workspace Labs,加入候补名单。

好消息是,现在任何人都可以申请加入候补名单了,不过目前尚不清楚用户何时可以访问。谷歌的说法是,将在未来几周内将服务扩展到「更多的用户和国家」。

目前唯一可靠的消息是,Gmail的移动程序上会出现「Help me write」AI助手,此前微软也曾推出类似产品,将必应集成到iOS和Android的SwiftKey键盘中。

likeadmin基于「Spring Boot + ThinkPHP + FastAPI + Gin + TypeScript  + Vue + Vite + Nuxt+ Element Plus + uni-app」实现的免费开源后台管理系统,拥有Java、PHP、Python、GO等多种后端语言版本,专业团队维护,值得信赖,欢迎下载体验。
开源地址:https://gitee-github.com/jXyUhKr
官网文档地址:https://www.likeadmin.cn

03 Bard又双叒叕便强了

发布会上,谷歌还宣布了一个重磅消息。

那就是,Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。

这次,Bard上新了不少功能,比如支持了两种新的语言——日语和韩语,用户目前可以更简便地把生成的文本导出到谷歌文档和Gmail,可视化搜索,以及深色模式等等。

不过,最令用户开心的,想必是谷歌决定取消Bard的等候名单——将在180个国家或地区提供服务。

此外,和Adobe的AI图像生成功能,以及Instacart和OpenTable等第三方服务的功能整合也正在路上。

总的来看,这些上新是给老Bard注入的一针强心剂。

目前,谷歌正在使Bard变得更加可视化,让Bard能够分析图像,并且能在查询结果中提供图像信息等等。

关于这一方面,谷歌在发布会上展示了一个案例。

假如用户问Bard,美国的新奥尔良有哪些必看的景点,那么Bard就能图文并茂的解答这个问题。

就像用户在谷歌搜图中问同样的问题一样。

你还可以,用Bard起草邮件,并一键导入Gmail,还有文档中。

而另一个更好玩儿的功能是用图像提示系统。该功能由Google Lens提供,它能够识别图片中的物体。

比方说,上传一张狗狗的照片,然后给一个prompt「为这两只狗写编一个有趣的标题」。Google Lens就可以识别狗狗的品种,然后Bard就能写下与这两只狗狗特征相关的内容。

该功能目前可能还不太完善,虽说潜力无限。未来如何取决于系统的整合程度。

虽说对Bard来讲,这是一个相当重大的更新,但和OpenAI的ChatGPT,以及微软的Bing之间的差距仍然是肉眼可见的。

要知道,微软在3月就给Bing增加了由OpenAI的DALL-E系统支持的AI图像生成功能。而OpenAI和微软一直在探索如何将聊天机器人与更多种的网络服务相结合。

不仅如此,OpenAI早些时候还宣布了ChatGPT将和OpenTable预订餐厅,以及Instacart订货配送的功能相结合。

谷歌表示,这些功能自己之后也会有的。

04 代码能力up

谷歌表示,升级后的Bard将会非常擅长处理有关代码的问题,包括调试和解释20多种语言的代码。

因此,今天发布会上的一些升级主要集中在这个方面上。

包括新的深色模式,改进的代码引用功能——不仅能提供来源,还能解释代码片段,以及一个新的导出功能。

用户可以把代码发送到谷歌的Colab平台,还能和另一个基于浏览器的IDE——Replit一起使用(从Python查询开始)。

只要选中代码,就可以一键导出到Colab或者Replit。

还支持20+种编程语言。基本涵盖了码农们所需的所有编程需要。

甚至还能直接询问Bard怎么用某一种语言实现某种功能。只要prompt到位,生成一串代码也就是几秒钟的事。

写完以后,还能就着某一行代码进行解释,以及完善。

如此看来,结合了PaLM2的Bard应该会在生成质量上有明显的提升。当然,具体表现如何,还得再观察。

05 对战必应,谷歌AI搜索已来

此前,整合进GPT的必应势如破竹,真正威胁到了谷歌的搜索市场。

为了与微软必应竞争,谷歌同在今天推出了由PaLM 2驱动的全新搜索引擎。

它能够提供问题回答的摘要,比如问「为什么酵母面包仍然如此受欢迎?」,谷歌搜索就给出几段详细描述酵母的味道、其益生元能力的优势等等。

另外,在生成内容旁,给出了3个链接,以证明摘要中的内容。这样以减少AI在生成内容上出现「幻觉」问题。

当你搜索蓝牙音箱,首先顶部有一个简短的摘要,详细说明了购买时应注意的事项:电池寿命、防水性、音质。

右边是三个购买指南的链接,下面是6个不错选择的购物链接,每个旁边都有一个 AI 生成的摘要。

可以看到,这是谷歌搜索结果页面的new look。把AI生成内容放在最开始。

比起重新设计的微软必应,搜索结果顶部的AI框对谷歌来说更像是,一个小小的更新。

值得注意的是,要是想要访问这一功能,你必须选择Search Generative Experience(SGE)这一新功能。

并非所有搜索都会有AI生成的答案。只有当谷歌的算法认为它比标准答案更有用时,AI内容才会出现,而像健康、财务等敏感主题完全不会有AI生成。

谷歌表示,其改进后的搜索引擎能够以对话方式跟踪原始搜索查询的选项,无需重复已经提供的上下文或细节。

然而,谷歌搜索也不是无所不能,也存在从未完全解决过的问题——结构编排(orchestration of structure)。

因为大部分数据储存在互联网上,甚至谷歌内部,但将所有这些数据放在一起形成一个连贯的答案真的很难。

目前,已经开放候补名单仅限美国,谷歌表示,未来几个月将考虑更广泛地推出这一功能。

likeadmin基于「Spring Boot + ThinkPHP + FastAPI + Gin + TypeScript  + Vue + Vite + Nuxt+ Element Plus + uni-app」实现的免费开源后台管理系统,拥有Java、PHP、Python、GO等多种后端语言版本,专业团队维护,值得信赖,欢迎下载体验。
开源地址:https://gitee-github.com/jXyUhKr
官网文档地址:https://www.likeadmin.cn

06 一键退款,智能P图,沉浸导航

一键生成退款邮件?

谷歌行。

劈柴在发布会一开始就整了个小活。航班取消了得退款?不会写申请退款的邮件?

gmail会。

只要在prompt栏里输入要求,gmail分分钟生成了一篇有理有据有节的退款申请邮件。

另外,谷歌Map现在也有了沉浸式view,你想去哪,怼脸的实景导航来了。

你还能顺便问问空气质量、天气、交通状况,都能即时演示。

Magic Editor是谷歌最新公布的照片处理功能,使用生成性AI,可以让用户在没有专业工具的情况下对照片进行各种编辑。

不会p图星人的福音来了?

发布会上,谷歌分享了几个应用了这项新功能的案例,不得不说,效果酷炸了。

比如下面这张,Magic Editor一键把瀑布前的人像挪到了侧面,还把背景中别的游客p掉了。不仅如此,本来多云的天气硬是给p蓝了。

再比如下面这张,Magic Editor一键将长凳上的小孩连着凳子一起移到了中间,自动补齐了多出来的椅子,还把原画中缺失的气球补齐了。

而且天也p蓝了。

当然,这项功能还没到最完美的地步。就比方说,仔细看看上面这张图片,凳子挪动了,可是底下的影子没动。

但总归,这项功能对照片本身的理解是革命性的。

当然,咱现在还不用太担心是不是有的图片被Magic Editor处理过。因为谷歌说了,下半年才会推出这项功能。

07 AI笔记本Project Tailwind

学生党福音来了。

不得不说,谷歌还真把学生们拿捏住了。

Project Tailwind从本质上讲,就是个笔记本,但是加了AI的能力。

一下子就不一样了。

用户可以像问导师或者学习搭子一样进行在Tailwind里进行检索。

虽说谷歌把这个功能其定位为学生服务的工具,但是对于日常需要处理大量文本的打工人来说,也是重大利好。

谷歌产品管理高级总监表示,Tailwind就像一个真正的笔记本一样,你在里面记东西,而这些内容就是AI学习的对象。

用户可以简便地从谷歌云端硬盘中挑选文件,有效创建了一个兼具个性化和私人属性的AI模型。

目前,该功能在大学校园内进行了广泛的测试。

在示例演示中,Tailwind收集了一大堆学习笔记,然后,生成了包括主题词在内的很多内容,比如,用户可以为特定主题创建术语表。

Tailwind不仅仅能为学生服务,它对任何从不同来源获取信息的人都有帮助。

隐藏在Tailwind背后的理念是,为什么我们不能为每个用户定制不同的AI语言模型呢?

当然,这里存在两个问题。

一方面是成本问题。训练语言模型所需的计算需求和微调成本都很高,谁来负担这个成本?另一方面则是信息安全性。

毕竟,捏造信息这种事可一点都不稀奇,谁能保证个性化的笔记本不会出现同样的问题呢。

不过,是骡子是马还得拉出来遛遛。用户目前可以注册Project Tailwind进行测试。该功能也是AI Labs计划的一部分。

08 安卓开发小助手

此外,谷歌I/O大会上还推出了专为Android开发的AI编码机器人Studio Bot。

不仅可以生成代码、修复BUG,甚至能够回答关于安卓应用开发的相关问题。

同时支持Kotlin和Java编程语言,并将直接嵌入到Android Studio开发工具的工具栏中。

原文作者:新智元

原文链接:谷歌一雪前耻,全新PaLM 2反超GPT-4,办公全家桶炸裂升级,Bard史诗进化-36氪

likeadmin基于「Spring Boot + ThinkPHP + FastAPI + Gin + TypeScript  + Vue + Vite + Nuxt+ Element Plus + uni-app」实现的免费开源后台管理系统,拥有Java、PHP、Python、GO等多种后端语言版本,专业团队维护,值得信赖,欢迎下载体验。
开源地址:https://gitee-github.com/jXyUhKr
官网文档地址:https://www.likeadmin.cn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28295.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里巴巴取消 CTO 一职;近半数微软员工担心被 AI 抢饭碗;Flutter 3.10 发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

Apple I 设计完成 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 4 月 11 日,在 1953 年的今天,安德鲁怀尔斯诞生。大约在 1637 年左右,法国学者费马提出了一个数学代数相关的定理&#xff0…

不跟风 ChatGPT,Google AI 2022 年都在忙什么?

作者 | Marian Croak 翻译&整理 | Carol 出品 | AI科技大本营 谷歌发布了2022年在AI领域取得的巨大突破,主要包括大语言模型 (LLM) 和文本生图两个领域。 相较多年前提出的“不作恶”口号,谷歌将今后发展人工智能的理念进一步提升至“负责任”…

Python基础语法 常见面试问题 技巧汇总

Python基础语法 & 常见面试问题 & 技巧汇总 文章目录 Python基础语法 & 常见面试问题 & 技巧汇总一、注释二、变量与常量三、输出1、格式化输出1)"~{}".format(a)2)%s,%.1f 2、转义字符 四、运算符1、幂运算 五、基本数据类型…

LeetCode刷题——贪心法(C/C++)

这里写目录标题 [中等]买卖股票的最佳时机 II[中等]移掉k位数字[中等]跳跃游戏[中等]跳跃游戏 II[中等]加油站[中等]划分字母区间[中等]去除重复字母[中等]无重叠区间[中等]用最少数量的箭引爆气球 [中等]买卖股票的最佳时机 II 原题链接题解 最简单的思路,效率不高…

云炬VB开发笔记 2可视化编程基础

源码下载(提取码:6666) 目录 1模拟小车行驶—— 控件基本属性和窗体​ 2-2简易文本编辑器—— 标签、 命令按钮、文本框​​​ 2-3模拟热气球 升空—— 图片和图像框​ 1模拟小车行驶—— 控件基本属性和窗体 2-2简易文本编辑器—— 标签、 命令按钮…

如何为现有IntelliJ IDEA项目创建GitHub存储库和本地Git存储库

IntelliJ IDEA是Java语言开发的集成环境,IntelliJ在业界被公认为优秀的Java开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE支持、Ant、JUnit、CVS整合、代码审查、 创新的GUI设计等方面的功能可以说是超常的。 点击下载IntelliJ IDEA最新试…

代码创造的欢乐世界-通用人工智能让儿童熟练应用编程

想要复杂的参考这一篇,使用云平台即可完成: 美美的圣诞树画出来-CoCube- 把圣诞树换成六一儿童节主题的就可以啦。 这一篇是使用chatgpt类应用,给出关键提示词,代码自动生成哦。 神十六发射成功,科技工作者博士学位…

统计检验分析 (本文在chatGPT辅助下完成)

1. 正态分布检验 2. 统计检验 t-test: 适用于样本数量较小(通常小于 30)的正态分布数据,用于比较两个样本的均值是否有显著差异。 Paired t-test: 确定某个总体的成对测量值之间的差异是否为 0 Two-sample t-test (independent t-test): 确…

sql 性能优化基于explain调优

文章目录 Explain分析?问题描述解决方案 Explain分析? 关于Explain具体可以干什么,有哪些优缺点,本博主的文章有写到,这是链接地址: 点击这里查看. 下面来说下Explain在项目实战中,如何去进行优化。 问题…

chatgpt在Unity里的开发和原理

chatgpt在Unity里的开发和原理 教学视频 先放上教学视频链接 https://www.reddit.com/r/unity_tutorials/comments/10aic34/chatgpt_with_unity_in_todays_video_i_show_you_a/ https://www.youtube.com/watch?vPRwfHajinSU 语音控制实现unity里的效果 或者语音控制实现Un…

搞不定高考的ChatGPT,原来只有小学4年级水平

夕小瑶科技说 原创 作者 | Python 之前,复旦大学的研究者让ChatGPT参加了中国高考,发现成绩惨不忍睹(参见推送),其中理科数学竟只有20多分。这次,小米AI lab的研究者们给模型降低一下难度,找了…

《聊聊我的故事 | 谈谈自己大学的收获,以及毕业的求职经历》

1.初进校园,实现最初的梦想 还在读高中的时候,心中就非常向往大学的生活,希望自己可以快一点进入大学。记得老师经常对我们说,你们现在辛苦一点,等到进入大学后就会轻松很多了。因此,心中便一直都有一个目…

毕业后的感言

我们毕业了,毕业季分手季。我目睹了那些不舍得眼泪。其实在那个时候我发觉嘴上说自己是一个没心没肺的人是不现实的。我居然也被赤化了。我居然也有心酸,也会难过。甚至对自己的前女友说有点不舍。毕业后祝你幸福! 回首大学,我没有遗憾&#…

毕业季心得

活动地址:毕业季进击的技术er 👉目录 前言学习背景敲下的第一行代码对未来的规划想对大家说的话最后 前言 时光荏苒,转瞬即逝,如白驹过隙一般。在这炎炎盛夏,我们又迎来了毕业季,我是一名在校生&#xff0c…

毕业感言

入学,满怀憧憬。不同的梦想,共同的行动。 大一,木头木脑。队列、口号、训练,身体是父母的,生活是队里的。 大二,徘徊迷茫。游荡在知识的海洋,寻找着未来的方向。 大三,低调做事。…

【毕业季】这四年一路走来都很值得——老学长の忠告

活动地址:毕业季进击的技术er 大家好,我是路飞! 又是一年毕业季,大学四年还没来得及好好体验校园生活,就匆忙收尾了!这四年时光里,有过目标和追求,也有过遗憾和不舍,从四…

关于毕业求职的就业经验-写给我亲爱的校友们

提示:希望下面的文章对大家能有所帮助 文章目录 前言一、毕业季的几种选择?1.考研2.就业3.其他 二、到了毕业季应该怎么去找到自己心怡的工作?三、需要掌握的基本技能(以我嵌入式开发角度)?四、该怎么去跳槽…

博士毕业答辩会上的感言——余子濠

今天余子濠终于博士毕业了! 余子濠是孙凝晖老师和我共同指导的博士生,他这个博士,读了整整八年。 今天的答辩会也是讨论得尤其热烈,答辩委员们提出了很多专业问题,子濠逐一做了解答。整个答辩会持续了130多分钟&#x…

new bing 使用出现“”]Sorry, looks like your network settings are preventing access to this feature.解决方法

1、问题 使用new bing时候如果出现“Sorry, looks like your network settings are preventing access to this feature”,请尝试用以下方案解决 2、解决 1、确保代理的节点在美国 2、在Edge dev中打开“https://www.bing.com/search?q要问的问题&setmktzh-…