谷歌CEO桑达尔·皮查伊:我们对AI的态度是又大胆又负责。
出品|网易科技智见焦点
作者|赵芙瑶
编辑|丁广胜
这回,谷歌急了!
他们这半年过得是真憋屈!近半年来AI的发展速度就像坐上了火箭,11月ChatGPT横空出世,今年2月发布的New Bing和3月发布的GPT-4,更是让许多大厂都难以望其项背。
不甘落后的谷歌立刻推出聊天机器人Bard,结果因为演示视频中的小错误而导致股价大跌(其实GPT也会失误),现在,在谷歌一年一度的I/O大会上,谷歌需要让公众以及股东们相信其在AI方面的实力,来“一雪前耻”。
值得肯定的是,谷歌在人工智能研究方面确实是领头羊。
要知道GPT的“T”就是Transformer模型,是谷歌在2017年推出的NLP经典模型。手握这么好的架构,但谷歌在开发人工智能产品方面却大大落后于OpenAI,还错过了人工智能的潮流。
那么谷歌这次能否力挽狂澜呢?来看看I/O大会上谷歌发布了哪些王炸级更新吧!
01
Bard新功能来袭
私人助理+全自动photoshop
懒得写邮件?给导师写邮件不知道用什么语气才显得更客气?
谷歌Bard全新的"Help me write"不仅利用生成式人工智能来辅助用户撰写邮件,而且还提供多种语气选项供用户选择。举个例子,如果你需要向航空公司请求退款,你只需告诉它你的需求,它就会基于你提供的航班细节为你生成一份草稿。这样说的话更加具体明了。
路痴也有福了,Bard推出了全新的沉浸式路线视图,这让你在到达目的地之前就能提前体验整个旅程。
想象一下,你想在纽约骑自行车,通过沉浸式路线视图,你可以选择沿着海边的路线,欣赏美丽的风景。你可以缩放地图,得到鸟瞰视图,甚至可以看到自行车道的细节。这绝对是一种全新的旅行方式!
沉浸式路线视图还计划在年底前在15个城市上线,包括伦敦、纽约、东京和旧金山。这意味着你可以在这些城市中提前体验你的旅行,感受到城市的魅力和景点的美景。
一键识图功能也来了!不仅仅是帮你识别图片中的人物是谁哦!你不仅可以在照片中搜索特定的人物、景物等元素,还能找到你的朋友的照片!
只需在搜索栏中输入他们的名字,相册就会帮你找到相关的照片。而且,你还可以使用编辑工具改善照片质量,比如去掉一些干扰物体,想调整光线或者改变天空的颜色,再也不用Photoshop了,这些都可以通过AI驱动的编辑器实现。
谷歌不仅相册中应用了AI技术,还在其他产品中推出了一些令人惊叹的功能。比如,谷歌在Pixel手机上推出了Magic魔法橡皮擦,利用计算摄影的AI技术,可以消除照片中的不必要的干扰物体。
大学不知道报考什么专业?害怕入错行误终生?Bard也能帮忙!假如你喜欢打游戏,对动画感兴趣,想知道宾夕法尼亚州是否有一些大学提供优秀的动画课程。接下来,你可以使用谷歌搜索找到一些师资力量优秀、在动画领域颇有建树的大学。
Bard可以将它推荐的大学以表格的形式展示,并通过谷歌地图展示这些学校的位置,这样你的父母可以更直观地了解学校的位置。Bard还能帮你标注哪些是公立学校、哪些是私立学校。
这还没服务完,Bard会用Google Sheets来创建一个表格,以清晰、有序的方式展示你选择的学校,再通过Google Docs和Google Drive与家人分享你的选择,以便他们可以帮助你进一步搜索和选择。
在接下来的几个月里,Bard还将与Adobe Firefly的工具合作,通过使用Bard,你可以立即通过你的想象力将其创造出来,并将其转化为全新的图片。
例如,如果你有一个7岁的孩子,他特别喜欢独角兽,并即将过生日,你希望发送一个有趣的生日邀请函,上面有一个独角兽和蛋糕形状的图片,那么通过与Adobe Firefly的合作,你可以将这个想法变成现实。
这个工具可以让你的想象变成可视化的图像。设计师们估计又捏了一把冷汗!
白领们的日常工作也可以解放双手了,Bard的"Help me write"不仅撰写文章、制作销售展示、写项目计划、拓展客户文案也都在行。其中一个最受欢迎的用例是编写职位描述,这对于任何规模的企业都非常重要。
在Docs中使用这个功能非常简单。举个例子,假设你经营一家时装精品店,需要招聘一名高级服装设计师。你只需输入几个提示词,如"高级服装设计师职位描述",然后Docs将发送这些提示词到后台,就能生成所需的职位描述。这样的工具可以节省大量时间和精力,简化招聘流程。
另外,Google Sheets也提供了整理信息的便捷工具。举个例子,如果你经营一家遛狗公司,需要记录客户信息、后勤安排和遛狗时间等。
在一个新的表格中,你只需输入一些描述,如"客户及遛狗业务费率"和"宠物名册",然后点击创建表格。Sheets将根据你的命令发送到经过训练的模型中,生成一个包含狗狗名字、客户信息注释等内容的表格。这样的工具大大简化了表格工作,让你能够更专注于自己喜欢的事情。
此外,Google的幻灯片工具也提供了便利的功能。人们经常使用幻灯片来讲故事,不论是工作还是个人生活中都经常用到。
举个例子,如果你的家族成员要为父母的50周年结婚纪念日制作幻灯片,每个家庭成员都可以贡献一些内容。
你可以选择一个句子作为图像生成提示,然后点击创建幻灯片。系统将根据输入命令发送到文本图像生成模型中,生成6到8张图像供选择。这样你可以随心选择,最终设计出精彩的幻灯片。
这些功能的引入为人们的工作和创作提供了巨大的便利,让他们能够更高效地完成任务和实现创意。
想要使用Bard也很简单,谷歌移除了等待名单流程,现在在180多个国家和地区可以使用了,更多地区也将很快加入!
不仅如此,谷歌还推出了Bard的日语和韩语版本,并计划很快支持全球前40种语言。
02
PaLM 2语言大模型发布
支持多模态,代码哪里不懂点哪里!
谷歌还重磅推出了最新的PaLM 2模型,它基于谷歌的基础研究和最新的基础设施。其新基础模型Gemini也一并发布,它是谷歌首个从头开始构建的多模态模型,具有不同规模的高度能力,并能有效地与其他工具和API集成。
Med-PaLM 2可以帮助回答问题并总结从各种密集医学文本中得出的见解,并在未来将添加处理医学影像的能力。
Sec-PaLM是基于安全情报进行训练的模型,为帮助组织和安全分析师检测、理解和防御威胁提供动力,并支持新的Google Cloud产品。
此外,PaLM 2的模型在特定领域的数据上进行微调时表现出色,并可以根据特定任务的要求进行训练。
值得一提的是,Google将两个团队合并成了Google DeepMind,并得到了Google的计算资源支持,以构建更具能力的系统并确保安全和负责任的部署。
据介绍,在PaLM 2的加持下,Bard的数学逻辑和推理能力得到了大幅提升,可以帮助开发者进行更好的编程。现在,它可以帮助我们在整个代码生成和代码调试过程中进行解释和协作,并且已经学会了20多种编程语言,包括C++、Go、JavaScript、Python等。
举个例子,比如有用户想学习下棋,想用Python编写一个四步杀算法。通过使用Python语言,Bard编写了一个脚本,实现了这个算法,并且格式化得非常清晰易懂。
但是如果用户不理解此算法,用户可以点击代码中的某一部分,Bard将能够将其关联到原始地址,并且能够理解代码并提供解释,比如解释chessboard代码的含义和在整行中的作用。这个解释功能非常有用,可以帮助化繁为简,让代码更加清晰易懂。
想要改进你的代码吗?Bard也能帮到你。通过一些建议,如使用压缩列表和生成器函数,用户可以将这些改进合并到一个Python代码块中。Bart在这方面的能力正在不断提高,可以重新修正代码。
英语不好?韩语不会?Bard还能帮你和韩国同事无障碍跨国协作沟通代码!假如你需要和韩国同事一起做代码调试,你可以要求他修复错误,并且通过在代码中添加韩文注释来帮助你的队友。首先它识别出这个代码其实是递归性代码,所以它会建议修复,然后会解释修复背后的原因,并且按照你的要求会添加韩文的注释。真的大发,康桑密哒了谷歌xi!
03
Google Pixel Fold
和Pixel 生态体系全面搭载AI
Google还展示了最新的Pixel系列。
Google展示了他们如何扩展Pixel系列,并推出了两款新产品:折叠屏手机Pixel Fold和平板电脑Pixel Tablet。这些新设备旨在提供更多选择和体验,丰富Pixel产品线,并加强Google在移动设备领域的地位。
Pixel Fold是一款可折叠手机,可以在需要时作为普通手机使用,或者展开成为更大的平板电脑,带来更丰富的视觉体验。通过这种设计,用户可以在不同场景中切换使用,享受到更灵活的功能。
Pixel Tablet是一款面向手持和家庭使用的平板电脑。它采用了高分辨率显示屏和内置扬声器,提供清晰的图像和音频效果。搭载了Google Tensor芯片,为用户提供出色的安卓平板体验,并支持个人AI技能。
Google强调Pixel Tablet在视频通话、照片编辑和语音识别等方面的优势。它通过优化相机功能和AI定制,使视频通话更加清晰,提供了一些方便的编辑工具。同时,采用Tensor G2芯片和PC连接,实现了更快速的语音输入体验。
为了提升大屏幕设备的应用体验,Google进行了大量的应用重新适配工作,并提供了多达50多个谷歌应用程序。Pixel Tablet还支持多个用户的切换,每个用户可以轻松访问自己的应用和内容。此外,它还具备移动设备之间的内容传输功能,方便用户在不同设备之间共享媒体。
看完整场发布会,你觉得Bard可以席卷重来,硬刚ChatGPT,重新引领AI浪潮吗?欢迎讨论。
/
/
扫码关注我们