语音相似度评价

语音相似度评价是用于测量语音之间的相似程度,常使用的算法是动态时间规整(Dynamic time warping,DTW),其原理是通过对齐时间序列来评估它们之间相似性。DTW是一种基于对齐的度量(alignment-based metric)与常见的欧式距离不同,DTW考虑到了时间维度上的信息,因此常用在信号处理领域,比如说话人识别,语音识别等。

​下面举个例子解释为什么要用DTW而不是欧式距离,这里我们有一个时间序列的数据集,包含了一些不同的样式。如果我们要对其进行分类,简单的方法就是使用聚类算法,首先采用欧式距离作为度量,我们可以得到如下的结果:

​容易发现在第二类中存在一些格格不入的样式;我们看下采用DTW聚类后的结果:

​可以明显的发现,DTW聚类后的结果,每个类别的差别(类间聚类)比较小。

Dynamic Time Wrap

DTW是基于距离最近原则衡量两个长度不同的时间序列的相似度的方法,是一种非线性规整技术,需要满足以下几个条件:

  • 单向对应,不能回头,从前往后对齐

  • 两个序列首元素必须对应(但它不一定是唯一的匹配项)

  • 序列中的元素一一对应,中间不能有空元素

  • 对应之后,距离最近

DTW问题可以形式化的表示为

​其中π表示对齐路径。如果我们直接使用穷举法,其时间复杂度是

​为了减少计算量,我们采用动态规划的方式求解,其解法可以表示为:

​具体流程为:

​如果读者刷过Leetcode的话,应该会发现上面的描述有点像一道Hard的题目——最小编辑距离,这是比较经典的动态规划问题,因此这里就不再详细介绍了。

Experiment

下面我们做个简单的实验,首先我们有两个音频,如下所示

​然后我们对第二个音频进行一些处理,首先利用超级变变变之变声器的原理对其进行慢放,然后加入一些白噪声,最后在开始增加一些延迟得到如下的音频。

​如果直接在时域进行计算那么计算量太大了,我们提取音频的128维的melspectrum进行简化计算。最后看下结果,dtw_hospital和dtw_number如下所示,可以看到,其最终的距离非常大,并且对其的结果和对角线相差较大。

我们再看看下dtw_number和dtw_number_noise规整后的结果,可以看到,对齐路径基本接近对角线且最终的距离比上面要小很多。

​上面介绍了基本的DTW算法,除此之外还有一些改进算法,比如对规整路径进行一些限制或者增加权重等从而得到更优的结果,更详细的内容可以查阅参考文献[4]。


本文相关代码公众号语音算法组菜单栏点击Code获取


参考文献:

[1]. https://rtavenar.github.io/blog/dtw.html

[2]. https://www.kdnuggets.com/2022/05/dynamic-time-warping-algorithm-time-series-explained.html

[3]. https://blog.csdn.net/qq_36002089/article/details/115520550

[4]. Dynamic Time Warping Algorithm Review

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/55935.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图像相似度对比分析软件,图像相似度对比分析法

有什么可以对比两张图片得出相似度的软件。 谷歌人工智能写作项目:神经网络伪原创 图像怎么进行比对 有什么软件可以把两张照片进行对比 查看相似度 1、Mix滤镜大师。IX滤镜大师免费提供将近200款默认滤镜,包括景深滤镜,散景滤镜&#xff…

如何写好工作日报,周报,月报?

管理大师德鲁克曾经在《21世纪的管理挑战》中说过,“21世纪,‘管理’需要提供的最重要的贡献,就是提高知识工作和知识工作者的生产率。” 而这也是公司推行周报日报制度最核心的诉求,对于知识工作者生产率的管理,用白…

测试部门工作周报模板

转载于:https://blog.51cto.com/zdytesting/2148921

日报周报月报工作总结生成器「智能文案生成器」

在职场上,尤其是互联网公司里,“写周报”是一件麻烦的事情。理想的工作环境下,写周报能让工作内容透明化,并有助于总结工作经验和办事方法。但现实情况往往没那么理想。有些公司学习“先进经验”,突然增加周报制度&…

日报周报月报工作总结生成器【智能文案生成器】

日报周报月报工作总结生成器【智能文案生成器】 天天写日报,我真的快奔溃了! 摸了一天鱼,下班还要写日报; 划了一周的水,周末还要写周报; 啊啊啊啊… 在职场上,尤其是互联网公司里&#xff0c…

【工作周报】

内容: 了解CV领域常用评价标准BLEU、CIDEr、METEOR、ROUGE对HMN项目中涉及评分的代码进行分析将测试视频的predictions和groundtruth作为输入计算分数保存结果到excel文件中 时间: 12.14 ~ 12.20 笔记: 了解CV领域常用评价标准BLEU、CIDEr…

日报周报自动生成工具,一句简要描述,自动写出一篇工作日志总结

有了这个工具,再也不用担心每日每周每月的工作日志了,你只需要输入一段简要描述,就可以快速生成完整的工作日志内容,下面我们一起看看效果吧 微信小程序搜索【静静工具箱】免费使用 此工具打开也不需要太多复杂的操作&#xff0…

IT人员的周报应该怎么写

周报对于职场人员一定不陌生,周报既是对自己工作的总结,找到自己工作的问题,也是让老板知道你干了什么,是自己和老板之间进行沟通的桥梁。因为工种的不同,周报的样式也各不相同,作为IT人员,最看…

《花雕学AI》28:革命性的 ChatGPT for SEO——让您的排名飙升 50%!

引言: 如果您想写篇有吸引力的文章,或者您是一个博客和网站的拥有者,那么您一定知道 SEO(搜索引擎优化)的重要性。SEO 可以帮助您提高相应的流量、转化率和收入,但是 SEO 也是一个复杂和耗时的过程&#x…

chatgpt赋能python:Python文字输入的介绍

Python 文字输入的介绍 Python 是一种高级编程语言,具有易学易用、开发效率高等优点。在 Python 中,文字输入是一种非常重要的功能,可以用于很多场景,比如输入用户信息、采集网络数据等。本文将着重介绍 Python 中的文字输入功能…

chatgpt赋能python:如何在Python中输入汉字

如何在Python中输入汉字 在Python中输入汉字可能是许多开发者面临的问题。本文将介绍如何在Python中输入汉字,并提供一些使用Python进行中文处理的技巧。 输入汉字的方法 在Python中输入汉字的方法有许多种。下面我们将介绍其中三种方法。 方法一:使…

Android版ChatGPT正式上线;苹果遭千名开发者索赔10亿美元;阿里加码AR,八天连投两家公司 |极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

超简单的五种微博引流方式,教你如何引爆微博流量。

相信很多人对于微博都不陌生,从09年发布至今,已经获取了6亿巨大流量。人们在上面了解实时新闻,了解明星动态等等。但对于微博引流不知道用什么方式,这都很正常的。对于这种内容社区类的平台,需要很强大的运营能力才能保…

Android腾讯微博客户端开发六:给用户加VIP认证以及美化微博显示内容

##之间的内容是代表一个话题,和:之间的是转发这条微博的人,也高亮显示,||代表上一次转发此微博的。url地址也高亮显示。 这个是什么组件啊?是TextView,不会吧?TextView能显示图片吗?肯定能呀。 主要是用到了…

GraphChi之pagerank分析新浪微博用户

GraphChi由卡内基梅隆大学的Aapo Kyrola 博士生开发,是GraphLab项目的一个分支。该框架能够在单机上完成大数据的图计算。 项目地址:https://code.google.com/p/graphchi/ 实例地址:http://code.google.com/p/graphchi/wiki/ExampleApps 其中…

实战新浪微博、腾讯微博的分享功能

算上也是半年前做的,今天翻出来放出来,作为日志记录,也许能帮助一些人。 我做的大概界面是如下图。 主要有两个界面,一个是新浪微博,腾讯微博的分享按钮,一个是他们的绑定情况(其实就是是否授权)。点击微博分享中新浪或腾讯按钮,就进行相应的授权(若没授权),显示微…

微博第三方登录,拿捏了

什么是第三方登录? 用户登录操作不是基于自身建设账号体系,而是基于用户在第三方平台上已有的账号和密码来快速完成登录的过程。下面我列举了几点第三方登录的优点。 极大的简化登录注册的流程。 方便用户快捷登录,降低用户的登录流失率&am…

基于Chrome插件的微博超话自动签到

文章目录 前言一、准备工作二、插件安装1.插件下载2.解压并安装 三、脚本编写(手动获取参数)1.复制脚本2.获取参数3.运行测试 四、脚本编写(自动获取参数)1.复制脚本2.获取参数3.填入参数3.运行测试 总结 前言 不方便使用Chrome插件或对签到结果有通知要求的 请参考 基于Pytho…

微博话题下的数据爬取

1、前言 新浪微博中,一个话题下各个媒体或用户发表在平台发表的信息是舆情研究的一个很重要的数据来源,这里记录一下一个话题下数据的爬取方式,以“#美国疫情#”话题为例。 2、话题下数据爬取 首先参考这篇文章,分析话题下数据爬…

微信微博Facebook们,到底从你身上榨取了什么?

硅谷Live / 实地探访 / 热点探秘 / 深度探讨 如果你不再想从早到晚手机不离身,不再想每小时刷好几遍知乎微博微信 YouTube 和 Instagram,不再想每天被手机分散注意力导致碌碌无为,那这篇文章正是为你准备。 科技公司搜刮你的注意力 在那本著名…