市场主流智能语音音箱对话系统哪个做的更好?

市场主流智能语音音箱对话系统哪个做的更好?

如何评价智能语音音箱对话系统的好与坏呢?智能音箱的对话技能如何实现?评价指标又有哪些呢?带着一连串的问题,小君来说说自己的理解。首先,智能音箱的对话技能是可以实现多轮对话中用户需求(意图)和实现需求的关键信息(词槽)的精确理解,根据不同用户意图和词槽信息给出不同对话答复的对话场景。能够在一些特定的对话场景下高精准地理解并满足用户需求,提升用户体验和满意度。比如问天气技能、订火车票技能、听音乐技能等等;然后,对话系统的评价指标分为两大类:客观评价指标和主观评价指标。结合这些指标,小君对当前市场上主流的一些智能语音音箱的对话系统进行对比评测,看看哪家在对话系统方面做的最优秀。
本次评测主要选取了百度的小度智能音箱、天猫精灵方糖、京东叮咚Mini2智能音箱和小米AI智能音箱四款产品进行对比。另外,小君发现对话系统在手机的应用也是相当的广泛,所以这次同时找了市场上比较火的一款支持智能语音的手机评测了一下。由于本次评测没有各家音箱的SDK接口,所以本次主要是采用主观测试的方法进行评测。经过三轮的测试,四款智能音箱中小度智能音箱表现最好,而某品牌手机则表现一般,得分仅略高于京东叮咚mini2,较其他音箱产品仍有较大的提升空间。
本次评测主要是从自然语言理解能力(NLU)、自然语言生成能力(NLG)和对话管理能力(DM)进行测试,看看哪款产品做的最优秀。由于测试采取主观测试方法,为了确保测试结果的客观性,本次测试选取3个人的测试结果取平均值,并列举了部分测试用例以供大家参考。
一.自然语言理解能力
测试主要是从领域、意图、槽位的识别,语义的容错,逻辑能力等进内容进行测试,其中领域、意图、槽位的识别本应该放在客观测试中进行,但是由于没有接口,故本次采取主观的方式进行客观测试,即通过智能音箱的最终反馈结果(即音箱的最终实现了什么功能)作为评测标准。NLU部分共计30分,其中小度得到最高分16.00分,详细结果如下:
在这里插入图片描述
在该部分的测试中,小度的表现是最好的,拿多阶查询单项来看,小君问了一个问题:“明天的明天天气怎么样?”,该问题是二阶查询的问题,首先要确定明天的明天为后天,再进行后天天气的查询。小度播报了后天的天气预报,而其他四款产品均播报了明天的天气预报。

二.自然语言生成能力
该部分得测试主要是从回复语句的通顺性、回答信息的意义、回答问题的相关度等六部分进行测试,其中前三部分主观性较强,采取5分制的评分标准,每部分5分。回复能力的测试共计30分,在该部分测试中,百度小度智能音箱得到了最高分26.54分,主要是在问题回答的相关度上表现最好,比如你问她“今天天气真好”,方糖会回答:“是休假的心情好,天气也跟着好了”,回答的风趣有意思。小度回答了:“希望每天都是好天气”,也很不错。而叮咚mini2、小爱同学和某手机则播报了天气预报。
在这里插入图片描述

三.对话管理能力
对话管理能力从槽位的补充能力,问题回答的情感度两部分进行测试,该部分总计10分, 其中回复的情感程度采取5分打分制。小米AI智能音箱得到最高分5.93分。在回复问题的情感度的测试中,每款产品回答存在较大差异,例如,问题为:我想听电台,天猫方糖和叮咚mini2的回答很直接,方糖的答复为:“好的,马上为你播放中国之声,以下内容来自中国广播”,小爱和小度的回答则很俏皮,小爱音箱的回答为:“好啊,小爱为你播放北京故事广播”。而某手机貌似没有听懂问题的意思,回答了“要帮你做哪一个?”以下为对话管理能力得分和三部分总得分情况:
在这里插入图片描述
在这里插入图片描述
结合三部分的测试结果,小度在测试的四款产品中得到了最高的分数48.40分(满分70分)。由于本次测试采取的主观评测的方法,且样本数量较少,可能主观性比较强一些,最终的评分也仅仅是小君个人的主观评价。其实评价一个智能音箱对话系统的性能,还是要通过主客观结合的方式进行评测,并且主观测试尽量多的选取测试人数,这样做出来的结果会更加合理一些。最后,小君希望通过评测,可以给大家在购买智能音箱的时候提供一些建设的意见。同时,本次额外的给大家测了一款手机的对话系统性能,后续有机会的话会找几款手机进行一次评测,希望给大家在手机购买方面提供一些建议。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25112.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

语音聊天app开发——语音聊天室系统如何开发

网络直播行业近些年算得上是多元化发展,各个互联网平台陆续入驻,开发自身的短视频直播平台,像百度,腾讯,阿里等,直播也多种渠道发展,1对多视频直播,1对1直播,视频语音多人…

C语言实现扫雷游戏完整代码

文章目录 游戏整体框架游戏具体功能及实现整体代码 一、雷盘的定义 1.雷盘的定义 对于扫雷游戏,我们遇到的第一个问题就是:应该如何表示扫雷的雷盘及如何存放布雷、排雷的数据;我们发现,二维数组可以很好的解决这个问题。 #inc…

Java扫雷全代码

Java极致还原XP系统经典扫雷 前言 最近疫情在家,没有工作上的996压迫着,使我倍感无聊,不知这满头秀发该如何消耗。   闲逛着游戏社区,常常回想起和朋友一起通宵玩游戏的那种快感。   一款扫雷游戏使我眼前一亮,他…

编写代码实现简单的扫雷游戏

扫雷 菜单 比较简单,代码如下 void menu() {printf("*******************\n");printf("**** 1. play ****\n");printf("**** 0. exit ****\n");printf("*******************\n"); }效果如图 然后就是根据不同的输入…

【C语言】扫雷游戏详解及完整代码

文章目录 前言一、程序环境配置二、各种功能的实现以及逻辑关系的整理2.1 创建游戏初始界面(进入\退出 游戏)2.2 创建并初始化二维数组board[][] mine[][] (board存放棋盘的信息 mine存放雷的信息)2.3 初始化棋盘2.4 打印棋盘2.5 设置雷区2.6 扫雷 三、完…

互联网最值得加入的 173 家国企名单

大家好!我是韩老师。 今年的就业相比以往是难了不少,感受到的人都懂。有一位学妹毕业后在互联网公司工作了两年多,受到的业绩考核压力越来越大,萌发了跳去国企的念头,和她通话聊了挺久。 就是这次的起因,给…

苹果,王炸产品来了!下一个 iPhone 诞生了?

推荐阅读: 《实名举报!》 《简单,聊两句。》 1 科技界春晚 知道为什么,总称苹果发布会为科技界的春晚吗? 因为苹果总是可以结合最新工艺、制造、科技,打造出一个跨越时代的产品,或者说可以称之为…

30岁硕士拿100万在云南开启“吃利息躺平式养老” 现在年轻人在怎样规划养老?...

上一篇:阿里巴巴裁员19576人! 你考虑过养老吗?你觉得积攒多少钱,可提前退休过上安详的退休生活?在网上,一位30岁的年轻硕士拿着100万元的本金,在云南过上了吃利息的“躺平式养老”生活&#xff…

朋友,承认吧,你可能根本不懂 ChatGPT

© 2023 Conmajia 人工智能在各个行业的采用率都在上升,强大的语言模型 ChatGPT 似乎成为了一种特别受欢迎的业务开发工具。Chat 表示这是一个聊天机器人,GPT 是“Generative Pre-Training”预训练的缩写。然而,似乎多数使用者因为对方可…

2023-H1--CSDN-文库研发团队总结

目录 前言 整体数据 业务功能的迭代 1、创作者分层 2、专题上新 3、新文库-AIGC内容 4、ChatDoc 团队技术输出 多篇技术博客 技术分享直播 前言 晃眼之间,2023年已经过半,那么今天就总结一下我们团队在2023年上半年度所做的工作。2023年上半年…

windows中CMake的安装与配置

本文提供两种方法安装CMake命令,不知道自己电脑有没有CMake命令行的同学可以输入 cmake -version 查看。 如果出现类似于下图所示,则电脑中已经安装有CMake命令,安装本文方法安装后也可用该方法检查是否成功安装CMake. 如果没有出现cmake …

Electron客户端的自动升级方案-2022版

基于Electron开发了桌面应用程序,最后免不了要做安装包,还少不了“在线升级”功能。Electron号称支持自动升级,但真到动手做的时候,才发现并没有官方文档上说得那么简单。最近在网上看了不少文章,反复尝试,…

ControlNet 和 T2I-Adapter,控制Stable Diffusion的不受控制的力量,AI 图像生成精确控制的破冰解决方案(教程含免安装使用方式)

控制Stable Diffusion的不受控制的力量 人工智能艺术社区的兴奋在最近几天达到顶峰,让我想起了去年 Stable Diffusion 的首次发布。本次重点介绍基于Stable Diffusion 1.5的轻量级预训练模型ControlNet,可以检测输入图像中的边缘、深度图或姿态骨架,结合文字提示,精准指导…

chatgpt赋能python:Python免安装怎么用?

Python免安装怎么用? 什么是Python? Python是一种高级、解释型、交互式、面向对象的编程语言。它被广泛应用于Web开发、数据科学、人工智能、网络爬虫、游戏开发等领域。Python拥有简洁明了的语法,使得它易于上手,同时也具有强大…

如何用TL084制作低音炮电路

本低音电路具有适应面广、可调性强、选择性好、失真度低的特点,并可进行特性设置,与合适的扬声器 系统配有源箱,适用于重低音重放。 图1所示的是低音处理电路。4个运算放大器IClB、IClA、IClC和IClD分别承担输入放大、窄频带滤波调节、宽…

干货·Doherty功放设计

当今世界,通信技术的发展可谓日新月异(准确来说是人类的欲望日新月异...),然而当前人类所依赖的无线通信完全借由无线电,频段还大都集中在C频段以下,相当拥挤。那么,为了在有限的频谱资源内增加…

IU8689+IU5706 单声道100W/立体声60W同步升压+功放IC大功率拉杆音箱应用组合方案

引言 目前中大功率拉杆音箱主要采用12V铅酸电池为供电电源,在电源直供的时候,一般的功放芯片输出功率在20W左右(喇叭为4欧、THD10%)。超过50W的功率现阶段市场上主要采用升压芯片TPA3116的组合解决方案。 随着竞争的加剧&#x…

华为Push用户增长服务:精准触达,加速增长

速戳了解华为Push用户增长服务:通过精细化运营,助力开发者高效实现用户增长,提升用户活跃度和粘性! 合作咨询请点此链接 了解更多详情>> 访问华为开发者联盟官网 获取开发指导文档 华为移动服务开源仓库地址:G…

华为Vo5G技术EPSFB

EPS FB EPS FB即 EPS Fallback,5G NR 初期不提供语音业务,当 gNB 在 NR 上建立 IMS话音 通道时触发切换,此时 gNB 向 5GC 发起重定向或者 inter-RAT切换请求,回落到 LTE 网络,由 VoLTE提供服务,如下&#…

OpenAI最新官方ChatGPT聊天插件接口《插件示例demo》全网最详细中英文实用指南和教程,助你零基础快速轻松掌握全新技术(四)(附源码)

Example plugins 插件示例demo 前言Introduction 导言Learn how to build a simple todo list plugin with no auth 了解如何构建一个简单的待办事项列表插件,无需授权Learn how to build a simple todo list plugin with service level auth 了解如何构建一个简单的…