语音助手——简介与交互过程

语音助手简介

        语音助手这个产品的目的,是希望通过语音说话的方式,来实现闲聊陪伴、知识获取、设备控制等需求,对应的就有三种不同的助手类型:闲聊型、问答型、指令型。

        闲聊型助手用于实现闲聊陪伴的目的,通过AI的技术来与用户进行对话,感知用户情绪,比如微软小冰。

        问答型助手用于知识获取,通过对话的方式来获取知识,或者解决疑问,比较常见的应用则是各个平台的智能客服,比如京东、淘宝等都有对应的产品。

        指令型助手用于设备控制,通过对话的方式来控制智能设备,实现某种操作,比较常见的应用有智能音响、IOT设备等,比如,语音控制:“打开空调,然后调成25度”。

        而集成了这三个能力的语音助手,则是以一个集大成者的贴心助理的形式存在,比如vivo的Jovi语音助手、小米的小爱同学、IPhone的siri。        

语音助手交互过程

1、首先,来了解一下从用户发出指令到设备端执行,一共经历了哪些流程:

         由上图可以看出,用户发出语音指令,经过语音识别(ASR)服务器转换为文本,然后经过网关进入自然语言理解(NLU)服务器进行语义理解,理解之后经由对话管理中控(DM)进入技能工具箱得到结构化的控制指令,然后经过语音转文字(TTS)服务将文本信息转为语音信息,进入手机端执行命令并且回复用户。

2、下面我们来简单说下各个模块的作用:

        客户端:这里一般是指设备端,比如:手机、音响、智能设备等,用户通过该设备与语音助手进行交互,实现对话、控制设备等操作。 

        语音识别ASR:ASR实现的功能主要为将语音转换为文字,但其实这里还涉及很多其他技术,一个完整的ASR链路主要包括:语音唤醒、语音输入、静音检测(VAD)、信号处理、特征提取、模型转换等。

        网关服务:网关服务顾名思义,是一个网络连接到另一个网络的“关口”,承担了一些请求鉴权、服务转发、配置下发、流量控制等能力。

        语义理解NLU:语义理解的作用为根据文本信息理解句子的含义,这里包含了很多的模块和技术,一般主要分为query预处理和query理解两个部分,在query预处理中一般包含query纠错、问句改写等,在query理解中一般包含分词、依存句法分析、命名实体识别(NER)、场景识别、意图识别、槽位提取、情感分析等。

        对话管理DM:DM控制着人机对话的状态,他的输入为当前的用户输入(经过语义理解之后的内容),输出为下一步的系统行为和更新后的状态。DM中一般需要负责:BOT的分发、BOT结果排序、对话状态维护(DST),多轮会话一般就是在这里控制的,后续的文章中会详细讲解DM和多轮对话的实现。

        技能工具箱:这里存放着支持的各个技能,比如:播放音乐(play_music)、查询天气(weather_forecast)、闹钟操作(operate_alarm)等,这里的技能指的是客户端可以执行的内容,是语义内容经过技能封装、知识填充、知识校验等操作后生成的结构化的数据,客户端拿到后可以直接执行。        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22041.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STATA regress回归结果分析

对于STATA回归结果以前一直不清不楚,每次都需要baidu一波,因此今天将结果相关分析记录下: 如上图 上面左侧的表是用来计算下面数据的,分析过程中基本不会用到 右侧从上往下 1.Number of obs 是样本容量 2.F是模型的F检验值&a…

python数据分析:回归分析(regression analysis)

何为回归分析: 回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为…

你还在手撸SQL?ChatGPT笑晕在厕所

文章目录 你还在手撸SQL?ChatGPT笑晕在厕所一、背景二、面向Chat编程1. 数据库设计2. 建表语句3. 加中文注释4. 数据模拟5. 查询成绩6. 修改课程任课老师7. 删除课程8. 删除一个有关联数据的课程 总结 你还在手撸SQL?ChatGPT笑晕在厕所 一、背景 经典3…

如何使用 OpenAI API ChatGPT,通过自然语言生成 SQL 语句(简易版)

简介 Human Language to SQL Translator 是一个可以通过ChatGPT 可以生成 SQL 语句的网站。 开源地址: https://github.com/whoiskatrin/sql-translator 这里使用 python 对其进行了复现 代码 """自然语言生成 SQL """ import op…

写sql真就有手就行?ChatGPT让sql变得如此简单

前言介绍 随着数据库的应用越来越广泛,不仅仅是开发人员需要操作数据库,在日常的办公、数据分析场景,数据库的操作也变得越来越重要和普及,但是很多人面对sql增删改查的各种sql语法,又打了退堂鼓。近期ChatGPT的流行&…

人工智能中的图灵测试

大家都知道,人工智能是一个交叉性的学科,它涉及到很多的技术,比如机器学习、深度学习、人工神经网络等技术,当然还少不了图灵测试。在人工智能中,图灵测试非常实用,可以说没有图灵测试,我们现在…

【人工智能】图灵测试

图灵测试(The Turing test)由艾伦麦席森图灵发明,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。 进行多次测试后,如果有…

资讯 | 图灵测试已经无法评估现在的人工智能了!

随着人工智能成为我们技术领域中重要组成部分,每一种新的工具和技术都需要一个基准。目前位置,最广为人知的AI基准测试工具就是图灵测试。 自1950年图灵测试提出来以后,人工智能领域已经取得了长足的发展。但,越来越清楚的是&…

itchat--使用python实现与图灵机器人交互

应用场景 七夕快到了,看着那些情侣在一起腻腻歪歪,整天短消息停不下来,众多苦逼的程序猿或许只能对着电脑了。是不是羡慕嫉妒恨呢!手机另一端怎么没人和自己在一起聊天呢?是不是也想有个人可以秒回自己的消息。没事&a…

面对面的办公室——纪念艾伦•图灵百年诞辰

面对面的办公室——纪念艾伦•图灵百年诞辰 Comments>> 科学松鼠会 发表于 2012-07-07 06:44 | Tags 标签: 原创, 图灵百年诞辰 【图片出处:http://www.cs.swan.ac.uk/~csarnold/】 作者:玑衡 本文节选自作者为纪念艾伦•图灵诞辰一百…

从达特茅斯会议到图灵奖---人工智能学习分享

“无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家。教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家。点这里可以跳转到教程。” 生活在信息大爆炸的今天…

【图灵奖得主】Jeffrey D. Ullman 斯坦福大学

【图灵奖得主】Jeffrey D. Ullman,斯坦福大学名誉教授,在线学习平台 Gradiance Corporation 的首席执行官。主要研究兴趣为编译器设计和数据库系统。毕业于哥伦比亚大学,在普林斯顿大学获得计算机科学博士学位。于 1979 年加入斯坦福大学&…

【置顶】图灵近期出版和即将出版的新书

图灵近期重点新书 堪与《重构》媲美的软件实战图书Amazon 5星评价里程碑性著作 中文书名: 修改代码的艺术 英文书名: Working Effectively with Legacy Code 原书作者: Michael Feathers 译者 : 刘未鹏 原书出版公司: Prentic…

(转)图灵测试与人工智能

什么是图灵测试? 在一篇1950年发表的著名论文《Computing Machinery and Intelligence》中,数学家阿兰图灵详细讨论了“机器能否拥有智能?”的问题。有趣的是,作为计算机科学与人工智能领域共同的先驱,图灵成功定义了什…

73年后,人工智能通过了图灵测试

73年后,人工智能通过了图灵测试! 意味着进化加速… 人工智能咋起源? 又会走向何方? 趣讲大白话:知道未来有多远,就要知道过去有多久 【趣讲信息科技112期】 **************************** 1950年&#xff1…

计算机首次通过图灵测试

今天图灵测试 2014 的举办方英国雷丁大学发布新闻稿,宣称俄罗斯人弗拉基米尔维西罗夫(Vladimir Veselov)创立的人工智能软件尤金•古斯特曼(Eugene Goostman)通过了图灵测试。如果这一结论获得确认,那么这将…

重磅!图灵奖,公布!

来源:青塔 3月22日,现年76岁的以太网发明者、3Com公司创始人鲍勃梅特卡夫(Bob Metcalfe)荣获2022年图灵奖,这一计算机科学的最高荣誉,表彰他为引领大众进入超级连接时代所做的贡献。 鲍勃梅特卡夫发明的以太…

Hinton等6位图灵奖得主、百余位顶级学者邀你加入群聊,共话人工智能下一个十年...

Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。 自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。 在这波澜壮阔的…

面对面的办公室——纪念艾伦•图灵百年诞辰 1912.6.23-2012.6.23

一、左边的办公室 冯诺伊曼教授每年换一部新凯迪拉克。早上十点,他把爱车停在帕尔玛物理实验室门口,神采奕奕地走进隔壁数学系的办公室。那时候普林斯顿高等研究院才刚成立,和数学系挤在一幢叫作Fine Hall的楼—— “还不错的楼”。冯诺伊曼教…

科普两个著名人工智能思想实验:图灵测试和中文房间

导读:人工智能的字典定义是机器模仿人类智能行为的能力。那么如何定义智能? 作者:道格罗斯(Doug Rose) 来源:大数据DT(ID:hzdashuju) 01 图灵测试 艾伦图灵是一位英国计算…