语音质量评估 Speech quality assessment 方法与代码编写

目前常用语音相对评估指标(参考)4个,绝对评估(无参考)指标3个。简述如下所示:**

相对指标:
1、pesq:共综合以下5个方面打分,分别为音频清晰度、音量、背景噪音音频中的可变延迟或滞后、丢失、音频干扰,PESQ 评分是从 -0.5 到 4.5 的分数,分数越高表示质量越好。可根据以下分数区间进行参考:
-0.5 – 1.99:语音质量极差,完全听不清楚语音的具体内容;
2.00 – 2.39 :语音质量很差,需要集中很多精神或注意力才能听清楚具体内容;
2.40 – 2.79 :语音质量较差,需要集中较多的精神或注意力才能听到具体内容;
2.80 – 3.29 :语音质量一般,仅需要稍微集中一下注意力就能听很清楚;
3.30 – 3.79 :语音质量较好,无需集中注意力就可听的很清楚;
3.80 – 4.50 :语音质量极佳,放松简单的就可以听清楚说话内容;

2、stoi:短时客观可懂度,反映人类的听觉感知系统对语音可懂度的客观评价,STOI 值介于0~1 之间,值越大代表语音可懂度越高,越清晰。

3、bsseval:盲源分离指标,用于测试盲源分离的性能指标;

4、sisdr:标度不变源失真比,用于测试盲源分离,值越高越好。越高代表语音干扰越小、失真越小。

绝对指标(无参考):
1、nisq:基于深度学习绝对评价指标,只需入音频。其输出结果共有五个维度,共同评价语音质量:

维度1:mos_pred :语音质量指标,越高音质越好
维度2:noi_pred :噪声等级指标,越高代表噪声越小
维度3:dis_pred :语音连贯性指标,越高代表语音连贯性越好
维度4:col_pred :音色指标,越高越好听
维度5:loud_pred :语音响度指标,越高代表音量更响亮

2、mosnet:深度学习mos评分;

3、srmr:语音混响调制能量比,分数越高,混响越小,越清晰;

用法
(相对pesq、stoi、bsseval、sisdr)
备注:pesq、stoi客观指标测试,其输入的参考音频与测试音频长度必须相等;
pesq:
Windows 环境下需先安装pycharm 。 安装pypesq 库,方法:
安装方法:打开pycharm,点击Terminal,输入
$ git clone https://github.com/ludlows/python-pesq.git
$ cd python-pesq
$ pip install . # for python 2
$ pip3 install . # for python 3
$ cd …
$ rm -rf python-pesq # remove the code folder since it exists in the python package folder

程序编写可参考如下:
使用方法:
import soundfile as sf
from pypesq import pesq
path_ref = ‘gongwei_mic_mono.wav’ //参考语音
path_gen = ‘gongwei_mic_mono.wav’ //测试语音
ref,samplerate = sf.read(path_ref)
gen,samplerate = sf.read(path_gen)
peaq_score = pesq(ref ,gen ,samplerate)
print('peaq_score = ',peaq_score )

stoi:
Windows 环境下需先安装pycharm 。然后 安装stoi库,pip install pystoi ;
安装方法:打开pycharm,点击Terminal,然后输入pip install pystoi即可,具体与上步骤相似,等待安装成功;

使用方法:
程序编写可参考如下:
import soundfile as sf
from pystoi import stoi
clean, fs = sf.read(‘gongwei_mic_mono.wav’) //参考语音
denoised, fs = sf.read(‘gongwei_mic_mono.wav’) //测试语音
stoi_score = stoi(clean, denoised, fs, extended=False)
print('stoi = ’ ,stoi_score)

bsseval、sisdr:
pip install numpy
pip install git+https://github.com/aliutkus/speechmetrics#egg=speechmetrics[cpu]
完成后输入以下脚本:
import speechmetrics window_length = 15 # seconds
path_to_estimate_file = ‘test.wav’ #test audio path
path_to_reference = ‘reference.wav’ #reference audio path
metrics = speechmetrics.load([‘bsseval’, ‘sisdr’], window_length) scores = metrics(path_to_estimate_file, path_to_reference)
print(scores)

(绝对 NISQ、MOSNET、SRMR)
NISQ为基于深度学习绝对评价指标,只需入音频。其输出结果共有五个维度,共同评价语音质量:(网站: gabrielmittag/NISQA: NISQA - Non-Intrusive Speech Quality and TTS Naturalness Assessment (github.com))
维度1:mos_pred :语音质量指标,越高音质越好
维度2:noi_pred :噪声等级指标,越高代表噪声越小
维度3:dis_pred :语音连贯性指标,越高代表语音连贯性越好
维度4:col_pred :音色指标,越高越好听
维度5:loud_pred :语音响度指标,越高代表音量更响亮

使用方法:
在终端执行以下命令:
1、git clone https://github.com/gabrielmittag/NISQA.git
2、conda env create -f env.yml
3、conda activate nisqa
4、创建输出文件的文件夹(输出文件为积分记录表),如输出文件夹在outputfile,就创建一个名为outputfile的文件夹;
5、在步骤4所创建的文件夹中,创建NISQA_outputfile.csv;
6、执行 python run_predict.py --mode predict_file --pretrained_model weights/nisqa.tar --deg test.wav --output_dir outputfile
predict_file:模式选择为推理模式,默认不用改;
weights/nisqa.tar:为推理时所用到的模型,默认不用改;
test.wav:需要评估的音频;
outputfile:音频评估分数表输出目录
结果图例:
在这里插入图片描述

MOSNET、SRMR

pip install numpy
pip install git+https://github.com/aliutkus/speechmetrics#egg=speechmetrics[cpu]
完成后输入以下脚本:
import speechmetrics
window_length = 20# seconds
reference = ‘test.wav’ #audio path
metrics = speechmetrics.load(‘absolute’, window_length)
scores = metrics(reference)
print(scores)
或直接使用以下脚本;

结果图例:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/54784.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网页js版音频数字信号处理:H5录音+特定频率信号的特征分析和识别提取

文章目录 一、网页中的音频数据源二、FFT:时域转频域三、信号的特征分析四、信号的识别提取附录 音频数字信号处理 Audio DSP (Digital Signal Processing) 是一个复杂又专业的话题,本文介绍的是如何从音频中实时分析和识别出特定频率信号的一种方法&…

telegram设置中文

浏览器打开 https://t.me/setlanguage/classic-zh-cn,只要安装了tg,会自动打开tg,提示切换至中文

谷歌浏览器chrome 语言设置为英文

1.打开Chrome浏览器主界面,看到右上角的【三个点】一样的标志,鼠标左键单击,选择【设置】 2.打开【设置】之后,下拉到最底部看到【高级】两个字,我们鼠标点击一下打开它 3.打开【高级设置】之后我们继续往下拉&#xf…

Chrome浏览器 F12控制台中文改成英文

当Chrome浏览器 F12控制台是中文,怎么设置成英文? 第一步:点击控制台右上角的设置图标 第二步:“语言”选项从浏览器界面语言设置成英文 第三步:重新加载DevTools,控制台变成英文了

谷歌浏览器设置中文教程

谷歌浏览器是由谷歌公司推出的一款网页浏览器,稳定性强,运行速度快,唯一不足的应该就是它不是中文的,那要如何给谷歌浏览器设置中文?下面就一起来看看具体的设置方法吧。 谷歌浏览器怎么设置中文? 1、进入浏…

【爬虫】爬取百度图片加载不出来

图片加载不出来?(防盗链) 在img标签禁用referer 博客 https://blog.csdn.net/fRF0lw4/article/details/80105574 防盗链解决方案 https://www.cnblogs.com/lydiawork/p/7838153.html 防盗链原理

chatgpt赋能python:Python爬虫网页超链接的SEO实践指南

Python爬虫网页超链接的SEO实践指南 随着互联网的普及,新的网站层出不穷,各种搜索引擎如Google、百度也不断更新搜索算法,以提供更优质的搜索结果。在这个过程中,SEO技术成为网站推广优化的重要手段之一。Python爬虫作为一种常用…

ChatGPT和GPT-4胜出基于四个方面

作为一项人工智能技术,ChatGPT正在以飞快的速度向前发展,其强大的学习能力甚至可以用超乎想象来形容。 最近,OpenAI公司又带着最新的GPT-4开始“大杀四方”了~OpenAI推出GPT-4文本生成AI系统。 那么作为目前NLP领域最前沿的研究成果之一&…

为什么当时那么多大佬不投资阿里?雷军:马云把项目说得太大,像个骗子!

现在我们也可以看出来互联网行业的发展可以说是很热门了,并且还很多发展的潜力。那么也就向我们表明了多年以前马云关于互联网的判断是正确的。不管是现在马云的电子商务还是移动支付等等一系列的互联网产品都充分地向我们证明了阿里巴巴的发展方向是正确的。 然而我…

马云、马化腾各自性格决定投资方式,你更看好谁?

作者:大宝 编辑:竹一 图片:网络 官网:iterduo.com “未来世界即将迎来‘OMO’(Online-Merge-Offline线上与线下融合)的时代,而中国的发展速度相当惊人,将有望在全球范围内首先实现OM…

马云、马化腾要合作了?阿里传出新消息,或将支持微信支付

马云与马化腾,阿里与腾讯 马云和马化腾是国内互联网界影响力最大的两位知名人物,他们分别是阿里巴巴和腾讯的创始人,在某种意义上改变了无数国人的日常生活。虽然平时大家都喜欢把马云和马化腾并称为“二马”,对他们的各种事迹也…

支付宝要融资上市,马云大赚,不过他承诺捐了

作者|科科 出品|网易科技《态℃》栏目组 七夕节临近下班时间,蚂蚁集团来了个突然袭击,公开了备受瞩目的招股书。这是蚂蚁首次全面披露业务大盘、营收情况等核心数据及未来规划。 营收方面,蚂蚁在2017年-2019年&#xf…

马云不再是蚂蚁集团实控人

2023年1月8日,阿里巴巴集团控股有限公司发布《自愿公告》。 阿里巴巴的非并表关联方蚂蚁集团 2023 年 1 月 7 日宣布,蚂蚁集团的两个主要股东(合计持有蚂蚁集团超过 50% 的股权和投票权)的投票结构将会发生变化。在各方经济利益不…

搞定马云马化腾争执的IT界大佬---吴鹰

链接:搞定马云马化腾争执的IT界大佬,因为一两亿的事情报警了! (baidu.com) 因为这个没完成的一两亿对赌业绩,互相打官司无果后,中嘉博创直接报警说对方涉嫌挪用公司资金。至于吴鹰为啥没调停这个事,不太好…

市值登顶亚洲后,马云对话全球投资者:与未来相比阿里还是个baby

“过去影响世界的很多是欧美公司,我们希望阿里成为真正的世界前十大公司,可以作为中国公司的代表去影响世界。”6月9日,阿里巴巴投资者日大会,阿里巴巴集团董事局主席马云对全球超过350位顶级投资机构的投资人和分析师分享了他的思…

忽悠马云10亿,还阿里4500亿:做对事赢一场,跟对人赢一生!

那个忽悠马云10个亿,被阿里同事指着鼻子让他滚蛋的人,后来怎么样了? 后来,他成为阿里巴巴集团首席技术官,而且被公认为,近10年来,中国最好的首席技术官。 他叫王坚,被称为“阿里云之…

雷军、马云、马化腾控股的公司

雷军、马云、马化腾控股的公司 前言 今天看我以前写的《行业分析常用到的21个网站》的时候,点开了一个网站——CBNData。 这是第一财经的网站,第一财经已经成为阿里系的一部分。阿里欲将其打造为具有全球影响力的新型数字化财经媒体与信息服务集团&…

传闻将与马云合作,涨了7倍的正大企业国际,还能跟风吗?

1月30日周一,港股正大企业国际逆势大涨68.35%,1月31日正大企业国际继续飙升,最高点涨超275%,收盘时涨幅达251.88%,成为2023年第一只翻倍的股票。今日早盘继续近40个点,还在持续发酵中。 消息面上&#xff…

我为什么投资马云

《创业邦》_口述/F&H投资管理有限公司董事长、天使投资人吴炯 _采访整理/刘岩 _摄影/袁建敏  编者按:马云的创业伙伴、季琦的大学同学兼汉庭联合创始人、聚美优品和聚光科技的天使投资人等光环似乎遮掩了吴炯在甲骨文、雅虎的职业生涯亮点。技术出身的吴炯谦虚…

IDC大模型技术评估出炉,百度文心大模型3.5斩获7个满分、三个第一

近日,IT市场研究和咨询公司IDC发布《AI大模型技术能力评估报告,2023》,对各家大模型进行了综合测评。报告显示,百度文心大模型3.5拿下12项指标的7个满分,取得综合评分第一、算法模型第一、行业覆盖第一,三个…