除了智能音箱,AI语音还可以用在哪里?

640?wx_fmt=png

640?wx_fmt=jpeg


作者:Echo

来源:科技树(ID:techtreex)


说起来可笑,每次我找不到眼镜的时候,我都想拿出手机,给我的眼镜“打个电话”,好听声辨位。

 

不知道有没有人,开发这种功能?

 

不得不承认,在某些场景下,声音具有很强的穿透力。也因此,智能音箱会被开发出来,一声“小爱同学”省了我们不少力气。

 

在智能语音这条赛道,可发挥的场景,待开发的空间还很大,这里列了几个例子,供君参考。

 

640?wx_fmt=png


充满“人情味儿”的声音

 

其实语音合成技术离我们很近,例如高德地图里志玲姐姐的声音,读书软件里有声朗读,科大讯飞研发的“讯飞留声”还可以满足你,10句话就可以复刻自己的声音。

 

从早期“我-是-机-器-人”的机械声,到如今我们听到的Siri的回答,无论从音质、复杂度还是自然度上,都近乎无可挑剔。但是在技术迭代的过程中,表现力一直是语音合成技术亟待解决的问题。

 

唯真性高,但是“人情味”不足。

 

而提到“人性化”的声音,最惊艳的莫过于去年惊艳亮相谷歌I/O开发者大会的智能语音助手:

 


有没有觉得,那句“Umm...”让整个对话“真”了起来。

 

我们知道,人类在说话的时候会夹杂很多语气词,用来缓冲大脑思考问题。同样,机器人进行信息检索的时候也需要时间,加入这些词汇让它们看起来更像人类。

 

一个会说人话的机器人,还是有机会杀一杀萌宠经济的锐气。

 

640?wx_fmt=png


49秒,点了34杯咖啡

 

此前,《麻省理工科技评论》评选出的2019年“全球十大突破性技术”,“阿里AI 助手”是唯一上榜的国产技术。

 

原因在于专业技能过硬,仅49秒,点了34杯咖啡。

 

用户只需要对点餐机进行与正常人一样的对话就可以完成。

 

“五个巧克力、两个香草拿铁,巧克力加奶油。”“两个中杯焦糖拿铁,一个热的一个冷的。”“算了巧克力不要了。”“再要六个小杯少冰摩卡,三杯加焦糖三杯加香草”“再加一个大的冷的拿铁,去冰半糖加脱脂奶,打包。”

 

640?wx_fmt=jpeg


在云栖大会现场,阿里语音交互首席科学家鄢志杰最快以每秒5个字的语速向一台机器点单。

 

而人类咖啡师在第一次没记住的情况下,重听之后完成了订单,用时2分37秒。

 

该系统不仅可以在公共场所强噪声环境下进行信号处理和语音识别,还融合了视频识别与面部识别、场景感知等多模态的感知技术,同时更增加了多轮多意图口语理解、业务知识图谱自适应等认知技能。

 

这项技术除了可以替代收银员之外,还被应用在地铁里。

 

据悉,上海地铁已经部署了这一技术,乘客直接说出目的地,售票机便可选择合适的站点和路线。

 

640?wx_fmt=png


“语音流”里的广告位

 

在语音助手界,最红的莫过于微软小冰,写诗、唱歌、主持、唠嗑无所不能。据悉,微软小冰作为“社交化人工智能”已经在全球积累了过亿用户,产生了300亿条的对话记录。


640?wx_fmt=jpeg


如今的第六代微软小冰,已上线全新的共感模型(即小冰可以通过自创回应,来牵引对话向她所希望的方向进行)。她可以实时预测人类即将说出的内容,实时生成回应,并控制对话节奏,从而使长程语音交互成为可能。


带节奏,牵引对话,这是导购员最擅长的事情。

 

这是一个信号。

 

品牌广告主可以凭借更具针对性、以语音为先的数字内容抢占搜索结果的位置。

 

也就是,“语音流”里的广告位。

 

这是是一片需要营销人员去探索的空白区域。想想看,当语音助手的系统中,没有数据来源或足够深度的内容为问题提供答案时,品牌可以主动参与到对话中去。

 

640?wx_fmt=png


生产力工具

 

在文章开篇,提到了给眼镜“打电话”,那如果眼镜可以自己发出声音“我在这里”会如何?


事实上,这件事情,已经有人做到了。

 

通用电气开发出了一款原型机,它可以让机车给维修技术人员发送语音信息,描述需要修理的东西。或者,它可以直接打电话给他,说“我的转子有问题了,你快来修”。


640?wx_fmt=jpeg


其实,“机器自检”这种模式,来自于通用电气的Digital Twin。

 

专业术语小贴士(来自美国国防采办大学DAU的术语):

 

Digital Twin,即数字孪生,指充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。

 

换句话说,就是在虚拟空间中对工厂进行仿真和模拟,并将真实参数传给实际的工厂建设。

 

通用电气的Digital Twin项目不仅实现了工业资产的3D显示,还可以处理从全球各个机器收集到的信息,从而更好地为决策提供信息。

 

640?wx_fmt=png


最后

 

更多的语音应用场景,还有老罗发布的TNT工作站,用声音控制电脑的操作,一度引起网友吐槽,最终寥寥收场。

 

作为对比,在今年的WWDC 2019上面世的macOS 10.15 系统,也实现了语音控制Mac 设备,不禁令人感慨:

 

语音交互会成为下一代主流交互方式吗?

 

记得科大讯飞AI产品副总裁陈亮在一次演讲中说:“AI用得好不好,关键在于用的人的想象力”。


所以,我们其实要考虑的是:如何在合适的场景,选择合适的交互方式。

 

当我在跑步的时候,如果有一个虚拟语音助手可以直接告诉我应该如何调整呼吸和步伐节奏,我是希望与“它”进行对话的。


又或许,还有“会说话”的眼镜......


640?wx_fmt=png


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png640?wx_fmt=png

- 加入社群吧 -

640?wx_fmt=png

640?wx_fmt=png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/54902.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

会唱歌、会弹琴,清华大学 AI 学生华智冰火了

整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 清华大学计算机系知识工程实验室,开发的中国首个原创虚拟学生——华智冰,与近日亮相。她的声音、肢体动作全部由人工智能完成。 今年6月,清华大学计算机系录取了一位…

清华大学数学与计算机学院院长,清华“冰冰”,今日亮相!

6月15日,清华大学计算机系举行“华智冰”成果发布会。作为我国首个原创虚拟学生,华智冰将入学清华大学计算机系,师从清华大学唐杰教授,即日起开启在清华大学的学习和研究生涯。 与一般的虚拟数字人不同,华智冰拥有持续…

AI语音技术的应用与发展前景

随着科技进步和产业变革的加速演进,人工智能(AI)已经成为兵家必争之地。甚至放眼全球,在政府、学术机构、企业等各个层面,AI都受到高度重视,其在学术研究、技术创新、人才教育等方面的发展都呈现全新态势。…

重磅!清华大学首个原创虚拟美女学生,“华智冰”唱歌好听到爆

点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 来自:清华大学 9月28日,清华大学首位AI虚拟学生“华智冰”正面出镜唱歌,其歌声、人类特征均由人工智能技术完成。 2021年 6月15日清华大学举行 计算机系“华智冰”成…

清华大学美女学霸“华智冰”是假的?--人工智能(AI)的前世今生

近期清华大学首个人工智能学生华智冰火爆全网的,虽然“她”技能爆表,但也只是“假的”。她是由北京智源人工智能研究院、智谱AI团队、小冰公司联合研发。那么我们就来看看什么是人工智能,以及人工智能的前世今生。 目录 第一章 超级学霸-华智…

EasyCVR通过GB28181级联到紫光华智综合安防应用平台无法注册成功问题排查

紫光华智云平台是以“视频AI”产品的研发、制造、销售和服务的企业,华智平台可以支持国标平台,因此也能通过级联的方式接入EasyGBS及EasyCVR平台。紫光华智云平台接入EasyGBS的注意事项我们之前为大家介绍过,大家可以翻阅或者搜索我们以前的博…

清华大学迎来中国首个原创虚拟学生华智冰:智商、情商双高,颜值出众

2021 年 6 月 1 日,清华大学计算机系知识工程实验室迎来了中国首个原创虚拟学生 — 华智冰,清华大学为她办理了学生证和邮箱。 报道称,华智冰智商和情商双高,可以作诗、作画、创作剧本杀,还具有一定的推理和情感交互的…

清华大学首个原创虚拟学生!“华智冰”入学清华!

击“凹凸域”,马上关注 更多内容、请置顶或星标 来自:清华大学 6月15日 清华大学举行 计算机系“华智冰”成果发布会 作为我国首个原创虚拟学生 华智冰将入学清华大学计算机系 师从清华大学唐杰教授 即日起开启在清华大学的 学习和研究生涯 华智冰的“诞…

人工智能|清华大学虚拟学生「华智冰」亮相能作诗绘画懂音乐

清华大学中国首个原创虚拟学生「华智冰」近日亮相,就读于计算机系知识工程实验室。 据介绍,华智冰不仅形象亲切、言语自然,更会作诗、绘画,以及有一定的音乐才艺。负责人之一清华大学教授唐杰表示,华智冰之所以聪慧动人…

中国AIGC创投现状:稀缺项目分分钟独角兽,能做大模型500万年薪,还有创业公司成了OpenAI炮灰...

衡宇 发自 凹非寺量子位 | 公众号 QbitAI GPT狂飙,AI投资突进,整个创投市场都热得发烫。 稀缺的公司分分钟独角兽,做大模型的人才出500万年薪也难招,但与此同时,有的创业公司还没来得及在市场上露出锋芒,就…

我为什么放弃了 LangChain?ChatGPT宣布将在下周推出安卓版本

🦉 AI新闻 🚀 ChatGPT宣布将在下周推出安卓版本 摘要:ChatGPT官方宣布将在下周推出安卓版本,并已在Google Play商店开放预注册。安卓版与iOS版在功能上大致相同,可能拥有现版本大部分功能,还可以跨设备同…

google运行速度最近突然变慢了!!怎么回事!!!完美解决!!

有没有发现最近google(谷歌Chrome)浏览器突然变得很卡很慢,以前秒开的日子仿佛不复存来了!! ladies and gentleman ,Here comes the perfect solution!!!! …

全网超详细的如何Ping特定的端口号,比如telnet Ping,nc Ping,nmap Ping等

文章目录 1. 文章引言2. ping特定端口2.1 使用telnet ping特定端口2.2 使用nc ping特定端口2.3 使用nmap ping端口2.4 使用Powershell Ping特定端口 3. 补充说明3.1 apt-get还是yum的区别3.2 解决sudo: apt-get: command not found的错误3.3 解决-bash: xxx: command not found…

GPT-4耗尽全宇宙数据!OpenAI接连吃官司,竟因数据太缺了,UC伯克利教授发出警告

【导读】深陷数据风波的OpenAI,背后真正原因竟是优秀的数据太少了。 穷尽「全网」,生成式AI很快无数据可用。 近日,著名UC伯克利计算机科学家Stuart Russell称,ChatGPT和其他AI工具的训练可能很快耗尽「全宇宙的文本」。 换句话…

python简单小游戏代码教程,python小游戏程序源代码

球球各位大神怎么用python写一个猜词小游戏的代码? key input(请输入一个单词:)description input(输入单词描述:)chance 5mark 5print(现在开始游戏)print(description \t 这是单词的描述,请你输入这个单词: )for i in ra…

python简单小游戏代码

前言 大家小时候都玩过贪吃蛇吧?小编小时候可喜欢拿爸妈的手机玩了,厉害着呢!今天,小编就来用100行代码实现一个简易版的贪吃蛇。 在网上,贪吃蛇教程蛮多的,但要安装蛮多库的,而且也不够清晰&…

ChatGPT最擅长完成哪些工作,学会了这些你的工作效率提高100倍

自然语言处理技术正在迅速发展,随之而来的是对于 ChatGPT 的需求也在不断增加。ChatGPT 作为一种强大的自然语言处理工具,已经被广泛应用于多个领域。在本文中,我们将会介绍一些可以借助 ChatGPT 帮忙完成的工作,让大家更好地了解…

Redis之父:找个靠谱的 C 程序员太难了!

作者 | yukang 出品 | 程序员的喵 (ID: coderscat ) 西西里岛,是位于意大利南部阳光而宁静的岛屿,正如电影《西西里岛的美丽传说》中演绎的那样,这里有着古老的历史和建筑,看起来和 IT 不沾边&#xff0…

.Net 问世 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 2 月 13 日,在 2001 年的今天,跨国科技公司谷歌(Google)进行了其历史上的第一次收购,收购对象是 Dej…

AI是一场革命,我真不是在跟风

AI是场革命,好像现在很多人都开始这么说,那么我说我不是在跟风,为什么?不好意思,又要翻翻旧贴 -> AI是一场革命,不要笑,我是认真的。2016年我就这样讲了,就如我常说的&#xff0c…