WAIC 2023 | 拥抱大模型,助力无障碍,小米展望AI新业态

“智联世界,生成未来”,7月6日至8日,第六届世界人工智能大会(WAIC 2023)在上海举办。4位图灵奖得主与80多位国内外院士等1400位嘉宾齐聚一堂,共同探讨人工智能赋能产业发展的全新变化,展望技术新趋势。

c9ef99443e27f8dd310e66c8bd53cbe8.jpeg图1:2023世界人工智能大会

小米集团技术委员会AI实验室大模型团队负责人栾剑与小米集团技术委员会AI实验室语音专家工程师张俊博受邀出席本次大会并参与圆桌讨论。

两位专家分别就生成式AI、大语言模型;AI技术无障碍应用进行深入交流,从技术发展、企业战略等多维度,探讨在以人工智能为代表的新一轮技术浪潮之下,我们应该以何种态度迎接人工智能带来的新机遇与新挑战。

01

全力以赴、坚决拥抱

ChatGPT的诞生激起前所未有的创造浪潮,其背后的技术——生成式AI和大语言模型正在改写各行各业。

7月8日上午,在2023世界人工智能大会期间,小米集团技术委员会AI实验室大模型团队负责人栾剑出席由埃森哲与第一财经携手举办的“生成式AI:重塑企业”专题论坛,探讨在新一轮技术浪潮之下,企业应如何立足前沿、全面重塑,实现高质增长。

8aeb90a4301819276d7da2d5071629a4.png

图2:2023世界人工智能大会“生成式AI:重塑企业”专题论坛

从ChatGPT向上追溯,生成式AI已经在很多领域便利了我们的生活。比如语音合成技术,小爱同学有多款拟人度很高的音色和声音商店的定制音色可以选择,这些音色不仅可以对话还可以唱歌。又如手机拍照的各种AI功能,近几年小米发布会屡次提到的超分辨率增强、魔法换天、魔法分身、超级月亮和魔法消除等都是很好的应用案例。

生成式AI对公司内部也会带来许多变化,比如文生图的软件帮助平面设计师提高了工作效率和成品质量,代码生成软件帮助程序员提升了软件开发效率,语言大模型帮助员工写文案等。

小米集团创始人、董事长兼CEO雷军曾在微博表示:小米对大模型将“全力以赴、坚决拥抱”。我们不仅要做面向用户的应用,也要与企业内部的工作场景结合提高工作效率。大模型团队,通过内部的需求分析和提炼,抽象出两大类应用场景:一是将各团队自己积累的知识做成对话机器人,帮助新人更快上手;二是让大模型学会各团队已有的各种工具,可以通过规划组合来自动完成较复杂的任务。

不过,这些应用还处在早期阶段,需要和使用者一起不断切磋打磨才能变得真正好用。正如栾剑所言,生成式AI的宝箱刚刚打开,我们现在看到的还只是表面一层闪闪发亮的东西,它对企业的真正价值,也许深入探索之后才能发现

abb96822978063fc446b101798c8f930.jpeg

图3:小米集团技术委员会AI实验室大模型团队负责人栾剑

02

ChatGPT让通用人工智能

更深入走进大众视野

7月6日下午,栾剑出席由第一财经主办的“AI TALK 数新风”沙龙活动,与中国信息通信研究院华东分院院长廖运发、华院计算董事长创始人宣晓华、美团无人机商业战略负责人刘硕共同讨论AI技术的“颠覆”与“辅助”。

12d1b42f59f1003b935524d10d4f867c.jpeg图4:第一财经“AI TALK 数新风”沙龙,右二为栾剑

有观点认为,ChatGPT的出现标志着人工智能技术在全球实现了划时代的突破,进入了全新的发展阶段。机器学习从基于规则到基于统计再到深度学习,经历了三次变革,虽然前面两次变革不可谓不重要不深刻,但是在ChatGPT出现以前,整个行业都面临着一个问题:是否人工智能就仅限于“有多少人工就有多少智能”呢?

栾剑表示,对传统的人工智能来说,任何一项新任务都需要通过大量标注让AI学习,而通常一个AI只会一个任务,如果兼任几项,效果就会削弱。如何才能打造像人一样的人工智能一直困扰着技术专家们。

而ChatGPT的出现,让我们看到了通用人工智能的曙光——一个什么都会的AI是有可能实现的。虽然现在还只是早期阶段,但是它带来的信心比金子还要宝贵。

大模型不仅是一个产品和技术方案,它带来的是一套方法论。ChatGPT告诉我们,仅仅预测下一个字是什么这样简单的任务就蕴含着完成所有文字任务需要的智能。这一方法论很容易扩展到其他领域,从文字,到视觉,再到听觉,然后是其他传感器的数据感知。全部打通以后,AI的智能会比现在更进一步,这个意义非常深远。

aad6fe8c3da53237eb74fb91b28bf460.jpeg

图5:小米集团技术委员会AI实验室大模型团队负责人栾剑

不过深远的意义是否意味着行业的“颠覆”和对人的完全替代?面对这一问题,栾剑认为,一方面,如果我们将技术完成度看成一个进度条,左边是0,表示完全无效,右边是100%,代表完全替代,那么其实所有的技术应该都位于中间状态。ChatGPT给我们带来的看似“颠覆式”的体验,可能是由10%到50%或者由30%到60%的跨越,这是一个飞跃式的进步,但距离完全替代人类还有很长一段路

另一方面,不同应用场景对AI替代的准确度要求会十分不同。比如娱乐场景中,语音合成读错一个字的发音,歌唱合成有一句跑调可能都无伤大雅,所以AI开始大量得以应用。但在金融、安防等领域,对准确度的要求就更高,声纹识别就无法进入。而在居家多人使用的场景中,任务相对简单,对准确度的要求也不像金融、安防等场景那样严苛,小爱同学就可以用声纹技术去检测用户是谁,从而在内容上提供差异化服务。

03

AI打破障碍,助力数字平权

技术的创新总能激发更多的畅想与对于美好前景的渴望,而与此同时,技术如何应用于实际场景,使所有人都能享受平等的数字生活更是重中之重。

188c9df7ba10f5f52f0c73e599981767.jpeg

图6:2023世界人工智能大会“科技无障碍:

AI普惠数字未来”高峰论坛

在2023世界人工智能大会“科技无障碍:AI普惠数字未来”高峰论坛中,小米集团技术委员会AI实验室语音专家工程师张俊博分享了AI技术与无障碍创新的经验与应用成果,持续探索AI技术如何助力更平等的信息交互。

a22b21ee78c639ecdd3836218950ee78.jpeg

图7:小米集团技术委员会AI实验室语音专家工程师张俊博(右一)

作为一个技术开发人员,张俊博参与无障碍工作的契机是2020年首届小米集团黑客马拉松,团队成员的一位脑瘫朋友——张大奎,因其特殊的病理腔发音而无法使用现有的语音识别服务。在意识到障碍朋友的需求后,团队发现这一需求在技术解决的路径上与方言识别有异曲同工之处,便以极少的语料量就完成了针对大奎发音的自适应识别系统。张俊博说:“有时技术并不难,但只是我们之前没注意到”。

7f40117d04ffbbfaf913e4cd2723064f.png

图8:2020年首届小米集团黑客马拉松张俊博队伍与张大奎

此后,小米的语音团队持续有意识地将技术向无障碍需求上靠拢。在MIUI中上线了“小米闻声”,实现了对于听障用户语音与文字实时互转的支持;并关注到环境中的非语言信息,进行声音识别,当监测到环境中有婴儿哭声、报警声等重要环境声音信息时,声音识别功能就会以通知的形式发送到手机与可穿戴设备,让听障用户能够获取更全面的信息。

f217f9fc242c889346d5e6217c235cac.jpeg

图9:(左至右)小米闻声、手机端声音识别、音箱声音识别与摄像头声音识别使用界面

在大会中,AI技术对于无障碍带来的可能性与突破受到广泛的重视,张俊博表示,其实理解无障碍,不应只包含障碍伙伴,所有人都会有面临情境性障碍的时候,比如在厨房炒菜,就可能听不到敲门声。因此要讨论AI技术对无障碍带来的改变,理应回归到一个人接收和传达信息的过程

一个人接收与发送信息,不外乎是用耳朵听、用眼睛看、用嘴吧说、用手打字。可以将各渠道的信息形态视为一种模态。无论信息来源于哪种视觉、听觉、触觉哪种模态,最终都需经过大脑编码成人们能理解的信息。反过来,无论信息以哪种模态发送,都是把大脑中已编码的信息以某种形态解码出去。

对于残障人士,就可以看作某一个模态的输入或输出阻塞。这时AI技术就能把信息从一个模态转成另一个模态,在任意模态间互转,从而把障碍绕过去。而最近大模型和生成式AI的新能力,则是进一步让我们可以以更自然的语言与交互来实现模态转换的过程。

而在AI助力无障碍的过程中,并不是技术单向地在帮助障碍人士,相反,无障碍给技术提供了一个极致的应用场景,当我们的技术连障碍朋友的需求都可以解决,那对于普遍性需求的启不是更能满足。因此,无障碍可谓是给技术研发提供了很好的指向作用。

2371404da583c8744d738be299fbf107.png

图10:小米集团技术委员会AI实验室语音专家工程师张俊博

最后张俊博也说道:我们公司常讲小米的使命,是“让全球每个人都能享受科技带来的美好生活”,显然这里的“全球每个人”不能把障碍朋友排除在外。所以我以自己是小米的员工而感到自豪。

-

小米一直致力于让AI技术渗透到更多场景中,助力科技给每个人带来美好生活。

2020年,雷总宣布:小米的核心战略从“手机+AIoT”升级为“手机×AIoT”。手机和AIoT生态布局不再是简单的加法与并列关系,而是能引起质能转化的方程式。

在“手机×AIoT”的战略指导下,小米逐步构建起全球最大的消费级IoT平台,截至2023年3月31日,小米AIoT平台已连接的IoT设备(不含手机、平板和笔记本电脑)数首次超过6亿,创下历史新高。小米的万物互联能力还在持续增强,目前,MIUI已经实现了视觉、听觉、肢体障碍的全方面支持,并扩展至AIoT设备,更实现了第一例声音配型捐赠的案例。

随着大模型、生成式AI等新AI技术的逐步落地,AIoT设备将被更好地组织起来,更准确的感知环境状态,通过规划和联动完成更复杂的任务,构建更多丰富且实用的智能场景,让用户拥有更极致的设备互联的体验,小米的AIoT平台将更懂人、更好地服务人

小米将继续乘风破浪,以坚定的信心和坚决的态度拥抱AI,用更有温度的技术和更加智能的产品打造更加美好的未来。

202b4dcf20a08dc4421aa8004b230739.gif

fadd6ac17f0f202c538ec6a91a2491bf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14743.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

掘金AIGC时代,开发者更需要什么样的大模型?

当前,火热的AI大模型领域需要一些冷思考。 自去年年底ChatGPT掀起一轮AIGC热潮以来,国内科技企业扎堆发布大模型和类ChatGPT产品。截止2023年4月,已公开宣布发布或即将发布AI大模型的企业达数十家。多模态大模型的能力不断迭代,市…

智算领域惊现AI大变局,ChatGPT催生行业大洗牌

ChatGPT席卷而来, GPU需求过猛引发缺货涨价潮 【全球云观察 | 热点关注】百度已不是中国第一大桌面搜索引擎,这个消息来自美国数据研究机构Statcounter公布的最新统计数据分析结果。 2023年4月,微软旗下搜索引擎必应&#xff08…

Azure OpenAI 详细申请与使用教程,打造个人专属 ChatGPT 方案

Azure OpenAI 详细申请与使用教程,打造个人专属 ChatGPT 方案 原创 TitiAI TitiAI 2023-05-08 13:26 发表于湖北 前言 大家都知道,OpenAI ChatGPT是不能在中国使用的,香港也一样。最近一个月,很多人反映API调用限制&#xff0c…

14.3.16南山公园游

14.3.16班级团日活动,爬南山活动 一直以来对团日活动没太大兴趣,只是为了支持活动,积极参与。这次借着初春,阳光明媚,和同学一起去南山公园。烟台动物园就在那,我们拿了学生证,每人20元&#xf…

南山科技园的IDC机房怎么样?

南山科技园的IDC机房怎么样? 华科数据中心机房地址位于深圳市南山区粤兴三道9号华中科技大学深圳产学研基地A座1楼,总计有100G骨干网出口带宽,机房建筑面积约3000㎡,机房于2018年7月正式对外开放,机房一期1楼右侧约300…

一篇文带你从0到1了解建站及完成CMS系统编写

学习目标 了解搭建一般网站的简便方式了解最原始一般站点搭建了解内容管理站点搭建了解权限设计及完成了解使用设计模式减少代码冗余了解前端拖拽页面生成及生成了解自定义数据的创建了解动态生成的前端页如何绑定自定义数据 开发环境 Windows7 *64 SP1php5.6apache/nginxth…

《不改变的CSDN,没有未来》,前50的专家实名发文

三十年河东,三十年河西,这句话在互联网战场上,应该改为十年。很多上个时代的王,掉队了。 CSDN的历史和中国互联网产品的发展历史有一点像,更确切的说,是和某些互联网企业更像。历史歪歪斜斜的写着几个字&am…

南山科技园那边的华科数据中心(华中科技大学产学研基地机房)

深圳南山华科数据中心(华科机房)以下是南山华科机房主要介绍: 深圳华科机房:深圳市南山区粤兴三道9号华中科技大学深圳产学研基地A座1楼,总计网出口带宽100G,机房建筑面积约3000㎡,机房于2018年…

南山谷主:无人直播如何操作?这样操作还可以带货

今天刷小视频,突然看到一个全场一元的直播。 研究了一下,收益超级可观。 视频就像下图这样的。 一堆产品,然后放个手写的牌牌,直接就开播了,有声音。我听了一下,声音是在不停的循环,也就是说声…

澎湃新闻:我在南山写代码,是改变世界还是养家糊口?

2017年12月30日,欧建新的遗体告别仪式在深圳沙湾殡仪馆举行,他的妻子带着两个孩子向他做了最后的告别,随后艰难地在火化同意书上签下了自己的名字。20天前,这位研发工程师从他就职的中兴公司通讯研发大楼26层跳下,结束…

南山大环线

活动线路描述:上午:南山小木屋---黄鹤山(黄鹤亭)---观音山(圆通寺)---狮窟(访秋亭)---八公洞湖---茶叶研究所(滴翠园)---回龙水库下午:茶叶研究所…

山经·南山经:杻阳山 [niǔ yáng shān]

杻阳山 [niǔ yng shān] 简介 属于南山第一列山系鹊山山系的山,位置在猨翼山往东三百七十里。是《山海经五藏山经南山经》中第四山。 原文记载 又东三百七十里,曰杻阳之山,其阳多赤金,其阴多白金。有兽焉,其状如马而…

2021绵阳南山高考一诊成绩查询,新鲜出炉!2021届绵阳一诊官方划线公布!一本线文509分,理475分!附全科真题...

原标题:新鲜出炉!2021届绵阳一诊官方划线公布!一本线文509分,理475分!附全科真题 2021绵阳一诊划线已经正式公布!文科一本线509分,理科一本线475分!金钥匙学校为考生家长们带来此次考…

深圳学位分数计算机,深圳各区学位录取积分出炉!罗湖录取到C类,南山最高降40分……...

高考后,深圳各区小一初一也陆续公布了入学录取积分,小编为大家整理了各区的录取积分情况,供大家参考。有些学校积分小编没有收集到,欢迎家长或网友们爆料。 1 罗 湖 区 罗湖今年有点出乎意料,往年因为学位紧缺引发学区…

2021绵阳南山高考一诊成绩查询,2021届绵阳一诊成绩对应省排名及推荐大学

2021绵阳一诊官方划线已经公布,一本和二本划线分别为: 理科 文科 A:985大学录取最低分数线。 A1:一本大学录取最低分数线。 A2:一本奋斗线,此划线以上考生高考有望冲上一本大学。 B1:二本大学录…

2021绵阳南山高考成绩查询,四川省绵阳南山中学2021年招生录取分数线

提前了解学校的分数线市很重要的,很多同学对学校都是不了解的,同学们和家长在了解学校时,一定要去了解学校的录取分数线情况,当你觉得你的成绩可以达到学校的录取分数线时,同学们再详细去了解学校情况,看一…

php 58房源采集,如何用火车采集器采集二手房数据

火车采集器,一款专业的互联网数据抓取、处理、分析,挖掘软件,可以灵活迅速地抓取网页上散乱分布的数据信息,并通过一系列的分析处理,准确挖掘出所需数据。对于免费版的用户来说,用火车采集器V8版比V9版更好…

深圳南山学区房_查查吧学区房地图

目前,南山最顶尖的四所学校分别是南二外、南山实验(麒麟)、南外高新和南外文华。四所学校各有优势和侧重,但总体而言,南外文华和麒麟实验颓势渐显,南二外和南外高新成绩则更为出色也更有潜力。另外还有2017年成立的以国际化教学模式的深圳湾学校,口号是“三年后南山前三…

2021绵阳南山高考成绩查询,2021年绵阳南山中学升学率高不高?

【引语】选择学校的时候,家长们最为关心的应该是这所学校的升学率如何,四川初升高升学网网编为同学们梳理了2021年绵阳南山中学升学率高不高的相关信息,更多最新资讯可以关注四川初升高升学网公众号,绵阳南山中学2021升学率&#…