大家好,我是可夫小子,关注AIGC、读书和自媒体。解锁更多ChatGPT、AI绘画玩法。加:keeepdance,备注:chatgpt,拉你进群。
5月10日周三,谷歌举办了年度开发者大会Google I/O 2023,在会上,谷歌亮出了人工智能(AI)领域开发的最新成果。
相比于今年3月份的匆忙应对,这一次的开发者大会明显是「有备而来」。特别在AI部分花费了较大的笔墨,试图一挽被OpenAI和Microsoft围攻的颓势。
我整理了一些大会重点,让我们一起来看看互联网时代的老大哥,是如何用实力来证明自己的江湖地位。
推出了自家的大语言模型PaLM2
PaLM2是在超过 100 种语言的语料库上训练的,因此它更擅长多语言任务,能够理解、生成和翻译比以往更细致和多样化的文本;对于具有思维链 prompt 或自洽性的 MATH、GSM8K 和 MGSM 基准评估,PaLM 2 的部分结果超越了 GPT-4。对标下一代OpenAI的GPT模型
PaLM 2 按照模型大小提供了四个版本,从小到大依次为 Gecko、Otter、Bison 和 Unicorn,其中轻量级的 Gecko 模型可以在移动设备上运行,速度非常快,不联网也能在设备上也能运行!因为数据安全和能源的考虑,端侧运行的大语言模型也越来越受到关注。
同时推出了基于PaLM2的两个定制化模型:基于安全的Sec-PaLM和基于医疗的Med-PaLM 2,能够达到特定领域的专家级别。同时也向大家展示了模型可定制化的能力。
整合谷歌所有的AI能力
谷歌在AI领域布局比较早,过去七年里,谷歌以「All in AI」为口号,投入了相当大的研发资源。在谷歌AI领域内,形成了Google Brain和DeepMind两大体系。像Transformer模型就是Google Brain提出来的, 前几年比较火的Alapha Go围棋机器人就是DeepMind的产品。除此之外,他们还有如下产品:
- word2vec - WaveNet - AlphaFold - Seq2Seq models - Distillation - Deep reinforcement learning
现在,这些产品融合到一个平台Google DeepMind上来了。
新的合体的Google DeepMind将利用 Google 的全部算力资源训练新的多模态基础大模型 Gemini。
发布生成式对话机器人Bard
Bard 也得到了升级,基于 PaLM 2 模型!Google 将 Bard 定义成对话式 AI,可以独立使用,它的能力也会被集成到 Search 里面,现在支持 40 多种人类语言和 20多种编程语言。
Bard 也能集成工具,例如 Google Lens、 Maps、Sheets 等等,和 ChatGPT Plugins 一样可以第三方接入。出道即巅峰,现在直接可用。我简单试了一下,能跟谷歌的办公全家桶(Gmail、Docs)无缝连接。后面有时间再专门出一期介绍Bard。
访问地址:https://bard.google.com/
Bard跟谷歌搜索还在开发中,明显是应对New Bing的出击,保住搜索老大哥的地位。现在可以通过waitlist申请试用名额,感兴趣的可以去申请一下。
申请地址:https://labs.google.com/search
其他
除此之外,谷歌还演示其他已集成AI的自家APP新特性。像Google Photo Editor,能够自动修图、补全画面。Google Map能够生成沉浸式的地址,实时预测交通情况和天气,这些都展示在地图上。
同时也推出来了类似Microsoft Office Copilot的AI办公Copilot——Duet AI for Workspace。把谷歌的办公软件、邮箱、存储都融合进来,实现去服务管理自动化。
总结
针对谷歌的大招,OpenAI也坐不住了,宣布下周就向所有ChatGPT Plus用户开发联网和插件连接功能。谷歌过去20多年建造的互联网帝国,在AI的加持下,表现出更强的战斗力。而以OpenAI、Midjourney等这些「小而美」的后起之秀,试图在新的AI时代,挑战新的秩序和规则。一场混战在所难免。理想、商业、霸权、人类、命运、安全,每个命题都以新的姿态,在这个时代交汇碰撞。就像莎士比亚的名著《哈姆雷特》中说的:“生存或者毁灭,这是一个问题“
📣通知
我的《小白玩转ChatGPT》小册上线啦,已有200多位同学在里面学习,诸多福利一起赠送。只需一杯奶茶钱,让我们联系更紧密。