谷歌打响全面反击战!全新PaLM 2反超GPT-4,谷歌Bard史诗进化

谷歌I/O 2023大会

仿佛又给谷歌的支持者们打了一针强心剂。

此前,因为微软和OpenAI的优异表现,谷歌已经被唱衰了很久。

但是,毕竟是做出了众多奠基性工作的AI老牌公司,谷歌这一轮的发力,让我们精神一振——它只是慢了,并不是噶了。

对打GPT-4的PaLM 2登台、Duet AI整进谷歌办公全家桶Workspace、Bard超强进化向所有人开放、谷歌搜索加入AI快照、AI新功能整合进Android 14、AI魔术编辑器加入谷歌相册等等。

这届I/O大会,可谓眼花缭乱,精彩纷呈。

PALM 2秀肌肉,手机也能跑

OpenAI的GPT-4,已经被全世界公认为最强大的语言模型。

怎么对打GPT-4?谷歌的答案,就是PaLM 2。

恰在今天,谷歌一同发布了PaLM 2技术报告。

 

显然,PaLM2被寄予了厚望,以缩小谷歌和微软之间在AI方面的差距。

劈柴介绍说,因为广泛的逻辑和推理训练,PaLM 2模型在逻辑和推理方面更加强大。据说,PaLM 2在超过100多种语言的多语言文本上进行了训练。

根据基准测试,对于具有思维链prompt或自洽性的MATH、GSM8K和MGSM基准评估,PaLM 2的部分结果超越了GPT-4。

 

据谷歌高级研究主管Slav Petrov介绍,PaLM 2在推理、编码和翻译上都表现更好,与2022年4月发布的第一代PaLM相比,PaLM 2有了明显的改进。

 

可以看到,PaLM 2的推理能力,得到了显著的改进

修改代码bug后,用韩语评论。

 

比如,PaLM 2能够理解不同语言的成语。

比起PaLM,在最新专业语言熟练度考试中的表现,PaLM 2的日语水平达到了A级,而PaLM达到了F级。PaLM 2的法语水平达到了C1级。

 

德语「Ich verstehe nur Bahnhof」如果直译,就是「我只理解火车站」,但如果你问它,你是不是理解错误了?

它马上就会告诉你,没错,这个德语的意思是「你说的啥?我什么都听不懂」。

 

再比如,和波斯谚语「Na borde ranj ganj moyassar nemishavad」(No Pain, No Gain)意思相近的中文谚语是什么?

 

在相关论文中,谷歌工程师声称PaLM 2的语言能力已经「足以教授这门语言」,原因是其训练数据中的非英语文本更为普遍。

PaLM 2包含了4个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。

 

这些微调就像给一个卡车底盘,加上一个新的发动机或前保险杠,以在某些特定任务上更好地工作。

这样的优势不言而喻,不用花费大量的时间和资源来创建,直接部署。

另外,PaLM2有一个基于健康数据训练的版本Med-PaLM 2,可以轻松通过美国医学执照考试,达到「专家」水平。

 

一个基于网络安全数据训练的版本Sec-PaLM 2,可以解释潜在恶意脚本的行为,检测到代码中的威胁。这两种模型都将通过谷歌云提供给特定客户。

目前,PaLM 2已经应用在25种功能和产品中,包括办公全家桶、聊天机器人Bard、搜索等等。

值得称赞的是,PaLM 2最轻量版本Gecko小到可以在手机上运行,每秒可以处理20个token,大约每秒16或17个单词。

不过,谷歌没有提及具体用什么硬件来测试这个模型,只是说在「最新的手机上」运行。

 

显然,这次谷歌在大语言模型的小型化上,取得了非常重要的进步。在云端运行这种AI,往往是很昂贵的,如果能在本地运行,无疑有着许多显著优势,比如隐私保护。

英伟达科学家Jim Fan对此大加赞许——

下一波LLM将是移动原生的。一个离线的、永远在线的LLM不仅可以降低服务成本,而且还为用户体验开辟了全新的途径。例如,一个元应用程序可以从你的移动工作流程中学习,并为你实现自动化。在小屏幕上节省的生产力,将比在大屏幕上多得多。

 

此前,谷歌一直被嘲在AI研究上已经落后于微软,PaLM 2,无疑是谷歌的一次重大回击。

但PaLM 2同样也面临着一些争议,比如训练语言模型的数据是否合法?

谷歌只是提到训练语料库来自「网络文档、书籍、代码、数学和对话数据」,但并没有进一步的细节。

而大语言模型的幻觉问题,同样无法避免。谷歌研究副总裁Zoubin Ghahramani表示,PaLM 2是对早期模型的改进,谷歌「投入了大量精力,不断改进基础性和归因指标」。

但他承认,在打击AI产生的虚假信息方面,大家都还有很长的路要走。

除了PALM 2,谷歌还宣布了正在训练的全新基础模型Gemini。这是第一个多模态模型,同样包含了参数大小不同的模型。

除了介绍模型,谷歌还特地介绍了开发 AI 技术的社会责任感,包括两个判别AI生成内容的工具:

- watermarking(嵌入水印)

- metadata(嵌入元数据)

 

Duet AI:办公全家桶新升级

此前,微软Copilot把GPT-4整进了全系办公产品,掀起了震惊全世界的办公软件革命。

怎么破?谷歌这次祭出了Duet AI,给谷歌办公全家桶Workspace来了一个全新升级。

  

其实呢,这也就是新瓶装旧酒,Duet AI就是Docs和Gmail等软件中AI工具的新名字。

谷歌希望,生成式AI能让Gmail、Docs、Sheets和Slides更有用,不过目前,大部分功能还在开发中。

Duet AI会涵盖谷歌的各种办公软件,包括在文档和Gmail中的写作辅助、幻灯片的图片生成、Meet的自动会议摘要等等。

在文档中,只要点「Help me write」,Duet AI就能自动帮你生成招聘启事。

 

而I/O大会上一个真正的新事儿是,写作辅助也会应用在移动端的Gmail上,这是对Smart Compose的升级。

现在,如果想试用这些新工具,需要注册Workspace Labs,加入候补名单。

好消息是,现在任何人都可以申请加入候补名单了,不过目前尚不清楚用户何时可以访问。谷歌的说法是,将在未来几周内将服务扩展到「更多的用户和国家」。

目前唯一可靠的消息是,Gmail的移动程序上会出现「Help me write」AI助手,此前微软也曾推出类似产品,将必应集成到iOS和Android的SwiftKey键盘中。

Bard又双叒叕便强了

发布会上,谷歌还宣布了一个重磅消息。

那就是,Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。

这次,Bard上新了不少功能,比如支持了两种新的语言——日语和韩语,用户目前可以更简便地把生成的文本导出到谷歌文档和Gmail,可视化搜索,以及深色模式等等。

不过,最令用户开心的,想必是谷歌决定取消Bard的等候名单——将在180个国家或地区提供服务。

谷歌表示,升级后的Bard将会非常擅长处理有关代码的问题,包括调试和解释20多种语言的代码。

因此,今天发布会上的一些升级主要集中在这个方面上。

包括新的深色模式,改进的代码引用功能——不仅能提供来源,还能解释代码片段,以及一个新的导出功能。

用户可以把代码发送到谷歌的Colab平台,还能和另一个基于浏览器的IDE——Replit一起使用(从Python查询开始)。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/56898.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

10秒生成网站、60秒搞定一个游戏开发!史上最强模型 GPT-4 上线

整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 平地一声雷,GPT-4 重磅来袭。 3 月 14 日,OpenAI 正式上线新一代人工智能大模型 GPT-4,它是一个大型多模态模型,可以接受图像和文本输入,同时…

史上最强模型 GPT-4 上线:一张手绘草图能生一个网站、60 秒搞定一个游戏开发!

平地一声雷,GPT-4 重磅来袭。 3 月 14 日,OpenAI 正式上线新一代人工智能大模型 GPT-4,它是一个大型多模态模型,可以接受图像和文本输入,同时返回文本输出。就像这样: 用户:这幅画有什么好笑的…

微软Bing Chat全面开放,所有人可用!官宣多项重大升级,日活用户超过1亿

来源:AI前线 作者:冬梅 当地时间 5 月 4 日,根据 The Verge 报道,微软宣布公司旗下基于 ChatGPT-4 的 Bing Chat 功能已进入开放预览(Open Preview)模式,也就是面向所有用户开放。 在此之前&…

OneFlow源码解析:Eager模式下的SBP Signature推导

作者|郑建华 更新|赵露阳 OneFlow 的 Global Tensor 有两个必要属性: Placement:决定了 tensor 数据分布在哪些设备上。 SBP:决定了 tensor 数据在这些设备上的分布方式。例如: split:将切分后…

2021考研政治腿四错题、重点题汇总

腿姐(一)(25/50) 腿姐(二)(30/50) 腿姐(三)(19/50) 腿姐(四)(34/50) 腿腿子的题好刁钻啊,做的好难…

校招选择题汇总【图形推理(1)】含答案解析

图形推理50中规律,自行阅读 1. 大小变化 2. 方向旋转 3. 笔画增减 ( 数字 , 线条数 ) 4. 图形求同 5. 相同部份去掉 6. 图形叠加 ( 简单叠加 , 合并叠加 , 去同叠加 ) 7. 图形组合变化 ( 如: 首尾两个图形中都包含中间图形 ) 8. 对应位置阴影变化 ( 两图相同或不同则…

【考研政治】2021肖八整理(时政部分)

【考研政治】2021肖八整理(时政部分) 前言 写一下肖八的笔记。之前写了《【考研政治】2021肖八整理(马克思部分)》、《【考研政治】2021肖八整理(思修部分)》。 今天结合《【考研政治】时政(…

什么是标书?有哪些类型?

标书是由发标单位编制或委托设计单位编制,向投标者提供对该工程的主要技术、质量、工期等要求的文件。 标书是招标工作时采购当事人都要遵守的具有法律效应且可执行的投标行为标准文件。它标书也是投标商投标编制投标书的依据投标商必须对标书的内容进行实质性的相…

菜鸡程序员是如何写代码的?

每个程序员都要历经从菜鸡到大牛过程蜕变胡过程。当初大家起点都差不多,工作多年后,有些人依然停留在菜鸡,有些人却已成为大牛,所有的事情,都是一点一滴习惯养成。让我们看看菜鸡程序员是如何写代码的?有可…

看完这篇文章,还不知道怎么学单片机,来打我!

大家好,我是张巧龙,今天给大家分享一篇文章,来自科岩大佬,推荐大家阅读! 经常有人问我,嵌入式该怎么入门,怎么学习,怎么精通,怎么成为专家。我前思后想掏心掏肺&#xff…

开放原子训练营(第二季)RT-Thread Nano学习营线下学习心得

前言 目前市面上有很多种RTOS(Real-time operating system,实时操作系统),还在犹豫选择学习哪种RTOS的小伙伴,推荐你们学习RT-Thread操作系统,这也是本人最喜欢的一个RTOS,喜欢的原因很简单&am…

21届本科大数据菜鸡:我是怎么在互联网寒冬拿到腾讯、华为、京东、美团、快手等大厂offer的?

YOU CAN 前言正文不要自卑,去提升实力互联网行业谁技术牛谁是爹你这么聪明,你会被游戏控制?朋友是你在玩它。 前言 学得越多,不会得越多 活着就是为了改变世界 下一阶段目标:工作第一年攒10w,在老家买房子付…

关于菜鸡在安装paddle时遇到的坑

关于解决安装paddle 遇到的困难困难的开头后续终于的终于 遇到的困难 原本希望在win环境下安装 paddle 模块,但是感觉win对于paddle不太友好,需要下载docker tool中安装Docker,然后再在其中下载paddle。所以突然想着在虚拟机中的centos7系统…

菜鸡程序员的一天都在折腾些什么?

在影视作品中,程序员多以技术大神的形象出现。 他们经常在电脑上随意插一个U盘,对着黑色的界面飞速敲下绿色的代码,10秒钟后合上电脑,冲主角邪魅一笑表示“我已经黑进五角大楼了。” 邪魅一笑.gif 别急着崇拜。当我入了这一行后&…

半路出家的菜鸡程序员,北漂五年,给刚入行朋友的一些忠告,发自肺腑

大家好,我是陈哈哈。认识我的朋友们知道,我是非科班出身,半路出家,大学也很差!这种背景来北漂,你都不知道你会经历什么🙃🙃。   如今虽没有风生水起,但在技术这块儿也算…

无监督学习 — — 聚类方法分类

无监督学习 — — 聚类方法分类 0. 聚类1. K均值聚类(1). K均值聚类存在问题:(2). K均值聚类实现代码: 2. 凝聚聚类(1). 凝聚聚类实现代码: 3. DBSCAN 聚类(1…

菜鸡教程(1):简易游戏每周推荐小程序制作

写在前面: 1. 阅读本文最好具备一定htmlcssjs基础,并已成功注册微信小程序,成功下载了开发工具   2.菜鸡菜笔,如有不正,还请大佬们不吝惜赐教 接下来开始小程序的制作 1.首先需下载小程序所需图片 2.hello world(万物的起源&…

HFSS学习日记

(纯纯菜鸡,不懂理论和专业术语,单纯记录遇到的问题,欢迎大家批评指正) 1.仿真天线模型,工作频率与预期有偏差,可能的原因有: 空气盒子的长度设置过小。当对天线在一定的频率范围内进…

菜鸡前端2022年总结

我正在参加2022年,博客之星评比,请投我一票。 点此链接,投我一票 再过两年回家种地啦,年总结,写一年,少一年。 简单回顾一下今年,有哪些遗憾,有哪些成果。 工作 今年工作上的内…

三种常见的移动底盘运动学模型分析

目录 前言 一、四轮差速运动模型 二、麦克纳姆轮运动学模型 三、两轮差速运动学模型 总结 前言 现在大三暑假,开学就要着手准备毕设了,接手了实验室师兄的激光SLAM小车项目,先从下位机学起,争取把整个项目接受下来&#xff…