谷歌I/O 2023大会
仿佛又给谷歌的支持者们打了一针强心剂。
此前,因为微软和OpenAI的优异表现,谷歌已经被唱衰了很久。
但是,毕竟是做出了众多奠基性工作的AI老牌公司,谷歌这一轮的发力,让我们精神一振——它只是慢了,并不是噶了。
对打GPT-4的PaLM 2登台、Duet AI整进谷歌办公全家桶Workspace、Bard超强进化向所有人开放、谷歌搜索加入AI快照、AI新功能整合进Android 14、AI魔术编辑器加入谷歌相册等等。
这届I/O大会,可谓眼花缭乱,精彩纷呈。
PALM 2秀肌肉,手机也能跑
OpenAI的GPT-4,已经被全世界公认为最强大的语言模型。
怎么对打GPT-4?谷歌的答案,就是PaLM 2。
恰在今天,谷歌一同发布了PaLM 2技术报告。
显然,PaLM2被寄予了厚望,以缩小谷歌和微软之间在AI方面的差距。
劈柴介绍说,因为广泛的逻辑和推理训练,PaLM 2模型在逻辑和推理方面更加强大。据说,PaLM 2在超过100多种语言的多语言文本上进行了训练。
根据基准测试,对于具有思维链prompt或自洽性的MATH、GSM8K和MGSM基准评估,PaLM 2的部分结果超越了GPT-4。
据谷歌高级研究主管Slav Petrov介绍,PaLM 2在推理、编码和翻译上都表现更好,与2022年4月发布的第一代PaLM相比,PaLM 2有了明显的改进。
可以看到,PaLM 2的推理能力,得到了显著的改进
修改代码bug后,用韩语评论。
比如,PaLM 2能够理解不同语言的成语。
比起PaLM,在最新专业语言熟练度考试中的表现,PaLM 2的日语水平达到了A级,而PaLM达到了F级。PaLM 2的法语水平达到了C1级。
德语「Ich verstehe nur Bahnhof」如果直译,就是「我只理解火车站」,但如果你问它,你是不是理解错误了?
它马上就会告诉你,没错,这个德语的意思是「你说的啥?我什么都听不懂」。
再比如,和波斯谚语「Na borde ranj ganj moyassar nemishavad」(No Pain, No Gain)意思相近的中文谚语是什么?
在相关论文中,谷歌工程师声称PaLM 2的语言能力已经「足以教授这门语言」,原因是其训练数据中的非英语文本更为普遍。
PaLM 2包含了4个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。
这些微调就像给一个卡车底盘,加上一个新的发动机或前保险杠,以在某些特定任务上更好地工作。
这样的优势不言而喻,不用花费大量的时间和资源来创建,直接部署。
另外,PaLM2有一个基于健康数据训练的版本Med-PaLM 2,可以轻松通过美国医学执照考试,达到「专家」水平。
一个基于网络安全数据训练的版本Sec-PaLM 2,可以解释潜在恶意脚本的行为,检测到代码中的威胁。这两种模型都将通过谷歌云提供给特定客户。
目前,PaLM 2已经应用在25种功能和产品中,包括办公全家桶、聊天机器人Bard、搜索等等。
值得称赞的是,PaLM 2最轻量版本Gecko小到可以在手机上运行,每秒可以处理20个token,大约每秒16或17个单词。
不过,谷歌没有提及具体用什么硬件来测试这个模型,只是说在「最新的手机上」运行。
显然,这次谷歌在大语言模型的小型化上,取得了非常重要的进步。在云端运行这种AI,往往是很昂贵的,如果能在本地运行,无疑有着许多显著优势,比如隐私保护。
英伟达科学家Jim Fan对此大加赞许——
下一波LLM将是移动原生的。一个离线的、永远在线的LLM不仅可以降低服务成本,而且还为用户体验开辟了全新的途径。例如,一个元应用程序可以从你的移动工作流程中学习,并为你实现自动化。在小屏幕上节省的生产力,将比在大屏幕上多得多。
此前,谷歌一直被嘲在AI研究上已经落后于微软,PaLM 2,无疑是谷歌的一次重大回击。
但PaLM 2同样也面临着一些争议,比如训练语言模型的数据是否合法?
谷歌只是提到训练语料库来自「网络文档、书籍、代码、数学和对话数据」,但并没有进一步的细节。
而大语言模型的幻觉问题,同样无法避免。谷歌研究副总裁Zoubin Ghahramani表示,PaLM 2是对早期模型的改进,谷歌「投入了大量精力,不断改进基础性和归因指标」。
但他承认,在打击AI产生的虚假信息方面,大家都还有很长的路要走。
除了PALM 2,谷歌还宣布了正在训练的全新基础模型Gemini。这是第一个多模态模型,同样包含了参数大小不同的模型。
除了介绍模型,谷歌还特地介绍了开发 AI 技术的社会责任感,包括两个判别AI生成内容的工具:
- watermarking(嵌入水印)
- metadata(嵌入元数据)
Duet AI:办公全家桶新升级
此前,微软Copilot把GPT-4整进了全系办公产品,掀起了震惊全世界的办公软件革命。
怎么破?谷歌这次祭出了Duet AI,给谷歌办公全家桶Workspace来了一个全新升级。
其实呢,这也就是新瓶装旧酒,Duet AI就是Docs和Gmail等软件中AI工具的新名字。
谷歌希望,生成式AI能让Gmail、Docs、Sheets和Slides更有用,不过目前,大部分功能还在开发中。
Duet AI会涵盖谷歌的各种办公软件,包括在文档和Gmail中的写作辅助、幻灯片的图片生成、Meet的自动会议摘要等等。
在文档中,只要点「Help me write」,Duet AI就能自动帮你生成招聘启事。
而I/O大会上一个真正的新事儿是,写作辅助也会应用在移动端的Gmail上,这是对Smart Compose的升级。
现在,如果想试用这些新工具,需要注册Workspace Labs,加入候补名单。
好消息是,现在任何人都可以申请加入候补名单了,不过目前尚不清楚用户何时可以访问。谷歌的说法是,将在未来几周内将服务扩展到「更多的用户和国家」。
目前唯一可靠的消息是,Gmail的移动程序上会出现「Help me write」AI助手,此前微软也曾推出类似产品,将必应集成到iOS和Android的SwiftKey键盘中。
Bard又双叒叕便强了
发布会上,谷歌还宣布了一个重磅消息。
那就是,Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。
这次,Bard上新了不少功能,比如支持了两种新的语言——日语和韩语,用户目前可以更简便地把生成的文本导出到谷歌文档和Gmail,可视化搜索,以及深色模式等等。
不过,最令用户开心的,想必是谷歌决定取消Bard的等候名单——将在180个国家或地区提供服务。
谷歌表示,升级后的Bard将会非常擅长处理有关代码的问题,包括调试和解释20多种语言的代码。
因此,今天发布会上的一些升级主要集中在这个方面上。
包括新的深色模式,改进的代码引用功能——不仅能提供来源,还能解释代码片段,以及一个新的导出功能。
用户可以把代码发送到谷歌的Colab平台,还能和另一个基于浏览器的IDE——Replit一起使用(从Python查询开始)。