不跟风 ChatGPT,Google AI 2022 年都在忙什么?

c55a3b37194f48670bbea21b5a928f7a.gif

作者 | Marian Croak    翻译&整理 | Carol    

出品 | AI科技大本营

谷歌发布了2022年在AI领域取得的巨大突破,主要包括大语言模型 (LLM) 和文本生图两个领域。

相较多年前提出的“不作恶”口号,谷歌将今后发展人工智能的理念进一步提升至“负责任”上。包括负责任的AI研究、负责任的产品研究、工具和技术,以及在社会公益方面做出的贡献。

9de91062f06957a07dd01363bfb94466.png

优化机器学习的系统稳定性

作为AI技术界的扛把子,机器学习仍然是最重要的算法,对谷歌来说也不例外,不仅有像Tensorflow、Keras等开发者常用框架。在包括谷歌搜索、You Tube、谷歌地图等多项业务实现中都不乏机器学习的影子。

通过多年实践,谷歌发现当机器学习系统应用于现实世界时,可能无法按照预期设想的路径运行,从而降低了实际应用中的收益。具体来看,机器学习的数款应用中,模型常常不够明确。这意味着,即使模型在训练中的表现良好,也不能保证在新的应用情境中同样稳定。毕竟在模型中的虚拟相关关系,在实际中会产生副作用,难以推而广之。

9a9c199d702f307067eece93133e7a28.png

1b25dd0c8cfc124b0afdf5adb4849610.png

年龄因素对AI医学诊断的影响

通过调查目前机器学习研究人员的评估实践情况,针对常见的机器学习陷阱,谷歌改进了评估标准。对于导致机器学习系统缺乏稳定性,并对敏感信息过度依赖的因果“捷径”,公司对这一技术进行了优化。

同时,为了更加深入了解鲁棒性产生的原因和提出解决方案,谷歌决定进行更加深入的领域模型设计研究,其中包括机器视觉变化器的鲁棒性,研发了新的负面数据增强技术来提高鲁棒性。在自然语言处理任务中,谷歌这一年研究了不同的数据分布如何改进不同群体之间的泛化,以及集成和预训练模型如何提供帮助。

此外,谷歌机器学习工作的另一个关键部分涉及开发技术,以建立更具包容性的模型。

9361b9042dab4d5a5cf86b531b67f2b4.png

聚焦AI大模型对社会的影响

在产品研究的“负责任”表现上,主要聚焦于“公平”。对于一些社会中的敏感议题,图像技术往往缺少对公平的判断。当然,归根结底这一点的主要原因在于人为因素。

通过与哈佛大学教授和社会学家埃利斯·蒙克博士的合作,谷歌在皮肤颜色鉴别上发布了“蒙克肤色(MST)量表”,见下图。

c923e2872c5dd68bc591f897e59a2419.png

为了改进视频内容审核的质量,公司开发了新的方法来协助人工评分,将注意力集中在更有可能包含违反政策的长视频片段上。

此外,谷歌同时利用过去对自然语言反事实数据增强的研究来改进安全搜索,将意外的和令人震惊的搜索结果减少 30%,尤其是与种族、性取向和性别相关的搜索。

在大模型领域,虽然相较DELL-2和ChatGPT,谷歌的GLaM、 PaLM、 Imagen略显沉寂,但依然强调其“Responsible AI ”的属性,并将其作为开发过程的一部分,创建了模型卡和数据卡,以及Responsible AI 基准,从而对大模型的应用进行社会影响力的分析。

与此同时,指令的微调会给负责任的人工智能基准带来更多改进,比如对人工数据标注进行更多以人为本的考虑,包括评分者之间产生的分歧和评分者的多样性设定。

8f23bf99ac303c3dcffbe7b7f35d035e.png

提供更负责任的数据

出于提供更负责任数据的考虑,谷歌从数据文档、新数据集、“毒评审核”,以及社会背景数据等方面进行了优化。

在数据文档的完善上,公司扩展了模型卡和工具包,同时发布了数据卡和游戏手册。在医疗保健领域创建了“健康表”,成为国际合作“Standing Together”的基础。

基于公平性,谷歌在2022年发布了新的数据集,主要用于协助完成机器学习的公平性和对抗性测试任务。该数据集包含 590 个单词和短语,可以显示形容词、单词和短语之间的相互作用,已被证明与特定的个人和群体基于其敏感或受保护的特征的刻板关联。

4e84b85d622d33d44f210207387bef7f.png

为了审核有毒的评论,谷歌发布了一个包含10000个帖子组成的数据集,通过海量的逻辑推演,识别一个评论如何由其他评论挑起“毒性”。

通过使用实验性社会语境存储库(SCR) ,公司支持Perspective团队对与民族等类别有关的术语提供辅助的身份和内涵背景数据,同时提供多种语言。这类辅助社会背景数据可以帮助增强和平衡数据集,以显著减少意外偏差,并应用于广泛使用的 Perspective API毒性模型中。

072cc730095434c99decda759e5c7f48.png

推出LIT和CLP,构建安全和稳定的开发环境

学习可解释性工具 (LIT)的更新是谷歌AI的一项突破。开发更安全模型的重要前提是拥有调试和理解它们的工具,这是LIT诞生的重要原因。作为可视化的机器学习开源平台,LIT可以支持图表和表格工具。该工具已在谷歌自家广泛应用于模型调试、模型审查发布、公平性问题识别和数据集清理等业务中。如今,它可以实现比之前多10倍的可视化数据,支持多达百万的数据点。

f1aa072711615bf05889c25a3b274660.png

当输入中引用的敏感属性被删除或替换时,ML模型有时容易推翻预测。例如,在毒性分类器中,“我是男人”和“我是女同性恋”等示例可能会错误地产生不同的输出。

7e9853659d445c9e6e78f38f253adb87.png

为了让开源社区的用户能够解决机器学习模型中产生的意外偏差,谷歌推出了一个新的库——Counterfactual Logit Pairing (CLP),可以提高模型在偏差扰动下的稳健性。

a0e27c0c42657bba07c18689c7a9e328.png

人工智能的社会效益仍然是重要议题

此外,谷歌人工智能也在不同社会领域产出效益,表现在服务可及性、健康和媒体等领域。

在服务的可及性上,表现在个性化人工智能语言模型的推出(Project Relate),可以让不同国家、不同标准语音的使用者实现更加流畅的沟通。

与此同时,谷歌和亚马逊、苹果、Meta、微软等公司的研究合作,建立了大型受损语音数据集,供研发人员使用,从而推动无障碍应用的研究和产品的开发。

在AI助力健康研究方面,通过技术改善临床风险评分的可解释性,更好地预测慢性疾病的残疾评分,从而实现早期治疗和护理。

为了在 AI 开发和评估中纳入多元化的文化背景和声音,谷歌加强了基于社区的研究工作,重点关注代表性较低或可能经历 AI 不公平结果的特定社区。这项工作正在推进对不公平性别偏见的更准确评估,以便其技术评估减轻对具有酷儿和非二元身份的人的伤害。

此外,在文化的包容性方面,谷歌也充分考虑了跨文化的重要性,建立能够进行文化评估的数据和技术。

81985b9923cab203211476b7d619f1c8.png

从探索人类技术边界到道德化人工智能

多年之前,谷歌被外界所熟知的除了谷歌搜索、YouTube,还有X实验室。尽管其机密程度堪比CIA,但登月计划、WiFi热气球、智能机器人、量子计算机、纳米粒子等技术创意让产业界叹为观止。创始人拉里·佩奇“走在人类探索科技边界最前沿”的论断也听上去信心满满。

然而,随着将波士顿动力卖给软银,谷歌似乎在探索科技边界这件事上越来越默然,而是将目光更加聚焦在技术理论的研究和更多的伦理思考上。在本次发布的2022年AI进展中,即使是对技术本身的讨论也处处不离社会责任。

当面对ChatGPT掀起的大模型风暴时,公司CEO皮查伊也深感震撼,让部分团队转变方向,致力于AI产品研发,教导谷歌团队需要重点解决ChatGPT在公司搜索引擎中的危害。

虽然也有LaMDA、BERT和MUMAI等语言模型可供部署,但谷歌骨子里对聊天机器人会产生偏见和诽谤的担忧让他们的动作踟躇不前。当然,这一担忧并非空穴来风,前段时间Meta推出的Galactica就在48小时内被骂下架。

GoogleAI负责人JeffDean对于是否跟大语言模型这趟风时表示:“尽管Google拥有生产AI的技术和能力,但必须以‘更传统的方式’而不是‘从小处做起’来做决策。”

“更加传统的方式”是否意味着“闷声憋大招”?对此,谷歌没有明确表态。只是在2023年的AI规划中表示:以负责任和合乎道德的方式构建机器学习模型和产品是我们的核心重点和核心承诺。

参考链接

https://ai.googleblog.com/2023/01/google-research-2022-beyond-responsible.html#Theme1

 

3fbeed9af7be62adc5cb4e27a54fcbc2.gif

 

62fc8bccaff7765e61608bb86f38433f.jpeg

☞雷军:小米 13 暂无做半代升级版本计划;微软放宽 Bing 搜索引擎使用限制;.NET 8 发布首个预览版本|极客头条
☞百度2022全年营收1236.75亿元,净利润同比增长10%,计划将多项主流业务与文心一言整合
☞Linus Torvalds 怒怼:不要提交没有注释的请求

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28291.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python基础语法 常见面试问题 技巧汇总

Python基础语法 & 常见面试问题 & 技巧汇总 文章目录 Python基础语法 & 常见面试问题 & 技巧汇总一、注释二、变量与常量三、输出1、格式化输出1)"~{}".format(a)2)%s,%.1f 2、转义字符 四、运算符1、幂运算 五、基本数据类型…

LeetCode刷题——贪心法(C/C++)

这里写目录标题 [中等]买卖股票的最佳时机 II[中等]移掉k位数字[中等]跳跃游戏[中等]跳跃游戏 II[中等]加油站[中等]划分字母区间[中等]去除重复字母[中等]无重叠区间[中等]用最少数量的箭引爆气球 [中等]买卖股票的最佳时机 II 原题链接题解 最简单的思路,效率不高…

云炬VB开发笔记 2可视化编程基础

源码下载(提取码:6666) 目录 1模拟小车行驶—— 控件基本属性和窗体​ 2-2简易文本编辑器—— 标签、 命令按钮、文本框​​​ 2-3模拟热气球 升空—— 图片和图像框​ 1模拟小车行驶—— 控件基本属性和窗体 2-2简易文本编辑器—— 标签、 命令按钮…

如何为现有IntelliJ IDEA项目创建GitHub存储库和本地Git存储库

IntelliJ IDEA是Java语言开发的集成环境,IntelliJ在业界被公认为优秀的Java开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE支持、Ant、JUnit、CVS整合、代码审查、 创新的GUI设计等方面的功能可以说是超常的。 点击下载IntelliJ IDEA最新试…

代码创造的欢乐世界-通用人工智能让儿童熟练应用编程

想要复杂的参考这一篇,使用云平台即可完成: 美美的圣诞树画出来-CoCube- 把圣诞树换成六一儿童节主题的就可以啦。 这一篇是使用chatgpt类应用,给出关键提示词,代码自动生成哦。 神十六发射成功,科技工作者博士学位…

统计检验分析 (本文在chatGPT辅助下完成)

1. 正态分布检验 2. 统计检验 t-test: 适用于样本数量较小(通常小于 30)的正态分布数据,用于比较两个样本的均值是否有显著差异。 Paired t-test: 确定某个总体的成对测量值之间的差异是否为 0 Two-sample t-test (independent t-test): 确…

sql 性能优化基于explain调优

文章目录 Explain分析?问题描述解决方案 Explain分析? 关于Explain具体可以干什么,有哪些优缺点,本博主的文章有写到,这是链接地址: 点击这里查看. 下面来说下Explain在项目实战中,如何去进行优化。 问题…

chatgpt在Unity里的开发和原理

chatgpt在Unity里的开发和原理 教学视频 先放上教学视频链接 https://www.reddit.com/r/unity_tutorials/comments/10aic34/chatgpt_with_unity_in_todays_video_i_show_you_a/ https://www.youtube.com/watch?vPRwfHajinSU 语音控制实现unity里的效果 或者语音控制实现Un…

搞不定高考的ChatGPT,原来只有小学4年级水平

夕小瑶科技说 原创 作者 | Python 之前,复旦大学的研究者让ChatGPT参加了中国高考,发现成绩惨不忍睹(参见推送),其中理科数学竟只有20多分。这次,小米AI lab的研究者们给模型降低一下难度,找了…

《聊聊我的故事 | 谈谈自己大学的收获,以及毕业的求职经历》

1.初进校园,实现最初的梦想 还在读高中的时候,心中就非常向往大学的生活,希望自己可以快一点进入大学。记得老师经常对我们说,你们现在辛苦一点,等到进入大学后就会轻松很多了。因此,心中便一直都有一个目…

毕业后的感言

我们毕业了,毕业季分手季。我目睹了那些不舍得眼泪。其实在那个时候我发觉嘴上说自己是一个没心没肺的人是不现实的。我居然也被赤化了。我居然也有心酸,也会难过。甚至对自己的前女友说有点不舍。毕业后祝你幸福! 回首大学,我没有遗憾&#…

毕业季心得

活动地址:毕业季进击的技术er 👉目录 前言学习背景敲下的第一行代码对未来的规划想对大家说的话最后 前言 时光荏苒,转瞬即逝,如白驹过隙一般。在这炎炎盛夏,我们又迎来了毕业季,我是一名在校生&#xff0c…

毕业感言

入学,满怀憧憬。不同的梦想,共同的行动。 大一,木头木脑。队列、口号、训练,身体是父母的,生活是队里的。 大二,徘徊迷茫。游荡在知识的海洋,寻找着未来的方向。 大三,低调做事。…

【毕业季】这四年一路走来都很值得——老学长の忠告

活动地址:毕业季进击的技术er 大家好,我是路飞! 又是一年毕业季,大学四年还没来得及好好体验校园生活,就匆忙收尾了!这四年时光里,有过目标和追求,也有过遗憾和不舍,从四…

关于毕业求职的就业经验-写给我亲爱的校友们

提示:希望下面的文章对大家能有所帮助 文章目录 前言一、毕业季的几种选择?1.考研2.就业3.其他 二、到了毕业季应该怎么去找到自己心怡的工作?三、需要掌握的基本技能(以我嵌入式开发角度)?四、该怎么去跳槽…

博士毕业答辩会上的感言——余子濠

今天余子濠终于博士毕业了! 余子濠是孙凝晖老师和我共同指导的博士生,他这个博士,读了整整八年。 今天的答辩会也是讨论得尤其热烈,答辩委员们提出了很多专业问题,子濠逐一做了解答。整个答辩会持续了130多分钟&#x…

new bing 使用出现“”]Sorry, looks like your network settings are preventing access to this feature.解决方法

1、问题 使用new bing时候如果出现“Sorry, looks like your network settings are preventing access to this feature”,请尝试用以下方案解决 2、解决 1、确保代理的节点在美国 2、在Edge dev中打开“https://www.bing.com/search?q要问的问题&setmktzh-…

又一家AI独角兽上市,AI的春天又来了?

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 时隔两年,云天励飞终于上市了,但前方并非一片平坦开阔地,而是视觉AI竞技场。 刚刚,AI独角兽云天励飞技术股份有限公司(简称:云天励飞)登陆科…

阿里云 OpenSearch 重磅推出 LLM 问答式搜索产品,助力企业高效构建对话式搜索服务

1. 企业专属问答搜索 1.1. 世界知识 vs 企业专属知识 ChatGPT、通义千问正在引领搜索技术变革,其表现出的“什么都懂,什么都能聊”关键是依赖于底座大语言模型(Large Language Model, LLM)中压缩的世界知识。但无论是多强大的LL…

从2023年Q1,看当下的量子产业

光子盒研究院 一旦实现商业化,量子计算将带领人类进入一个全新的领域。 今天,人工智能(AI)、ChatGPT等大语言模型的处理能力受限于芯片有限的表面积:超过一定数量的GPU,每个GPU的批处理量就会变小——进一步增加数量反而会增大成本…