语音信号处理常用语料库下载地址

Noise92噪声库

Noise92是一个噪声的语料库,包括一些语音增强中常用到的噪声,每个文件持续235秒,其中噪声的采样率均为19.98KHz,可以通过下采样得到想要采样频率的噪声,上面的文件都是.mat格式,可以利用MATLAB转成.wav格式。
下载地址:http://spib.linse.ufsc.br/noise.html
具体文件为
在这里插入图片描述

Grid Corpus

GRID是一个大型的多说话者视听句子语料库,用于支持语音感知中的联合计算行为研究。简而言之,语料库由高品质的音频和视频录音组成,由34位说话者(男性18位,女性16位)中的每个人说出1000个句子,该语料库以及转录本可免费用于研究。

下载地址:http://spandh.dcs.shef.ac.uk/gridcorpus/
具体文件为
在这里插入图片描述

Noisy Speech Corpus(NOIZEUS)

这个语料库有干净的语音和固定信噪比(0dB,5dB,10dB,15dB)的混合语音,但是没有单独的噪声。
下载地址:https://ecs.utdallas.edu/loizou/speech/noizeus/
具体文件为
在这里插入图片描述

TIMIT Corpus

TIMIT共有6300个句子,来自美国8个主要方言区的630个说话者每人说10个句子。MIT网址现在已经打不开了,不过GitHub上有下载的地址
下载地址:https://github.com/philipperemy/timit
打开界面如下
在这里插入图片描述
上面给出了两个下载地址,其中第一个地址的界面为
在这里插入图片描述
下载的是BT种子,比较快。
第二个的界面为
在这里插入图片描述
这里需要用邮箱注册账号才能下载。
另外,GitHub上也有上传的已经下载的TIMIT,地址为:https://github.com/breky/notes/releases/tag/TIMIT

Common Voice Corpus

Common Voice数据集中的每一条都包含了一组独立 MP3 录音及相应的文本文件。数据集所记录的 9,283 小时的录音中,有许多条数据同时包含了年龄、性别、口音等人口统计元数据,能够训练语音识别引擎提升其准确性。
下载地址为:https://commonvoice.mozilla.org/zh-CN/datasets
在这里插入图片描述
该语料库输入邮箱即可下载。该网页下还有提供其他语料库
在这里插入图片描述
在这里插入图片描述

爱丁堡Corpus

用于训练语音增强算法和TTS模型的噪声语音数据库
下载地址:https://datashare.ed.ac.uk/handle/10283/1942
在这里插入图片描述

可以选择使用迅雷下载,这样会快一点。另外,这里给出百度网盘的下载链接

下载链接:爱丁堡Corpus

提取码:61ot

REVERB Corpus

这个语料库来自REVERB 2014 chanllenge。挑战假设在混响的会议室中使用1声道(1ch)、2声道(2ch)或8声道(8ch)麦克风阵列捕捉单个固定的远距离说话人所说的话。它具有真实记录和模拟数据两种功能,其中一部分模拟真实记录。
下载地址:https://reverb2014.dereverberation.com/download.html
在这里插入图片描述

LibriSpeech Corpus

该语料库中有1000小时的英语演讲
下载地址:http://www.openslr.org/12
在这里插入图片描述

CHiME series Corpus

该语料库是由 CHiME语音分离和识别发布
下载地址:https://chimechallenge.github.io/chime6/
在这里插入图片描述

DEMAND Corpus

不同环境中多通道声噪声记录的集合
下载地址:https://zenodo.org/record/1227121#.Xv2VsZP7RhE
在这里插入图片描述

115 Noise Corpus

中科大团队 115个采样频率16KHz的噪声数据
下载地址:http://staff.ustc.edu.cn/~jundu/The%20team/yongxu/demo/115noises.html
在这里插入图片描述

Room Impulse Response and Noise Database

模拟和真实室内脉冲响应、各向同性和点源噪声的数据库。这些数据中的音频文件都是16kHz采样率和16位精度。
下载地址:https://www.openslr.org/28/
在这里插入图片描述

IEEE Corpus

该语料库包含IEEE-Harvard语料库中的720个句子,由男性说话人发音,其中宽带录音的采样率为25KHz,窄带的采样率为8KHz,分布存放不同文件夹中。
下载地址:https://pan.baidu.com/s/1YyCulXvPtsOcAV5oD57G4Q
提取码:v0tv

ARU speech corpus

该语料库包括IEEE-Harvard中句子的单通道的录制,由12 名以英式英语为母语的成人在无回声条件下录制,也是720个句子。
下载地址:http://datacat.liverpool.ac.uk/681/
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/54789.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

语音信号处理的过程及其应用

一、语音信号处理的过程 在信号处理领域,信息加工和处理的一般流程下图所示。 在语音信号的具体情况下,信息源就是说话的人,通过观察和测量得到的就是语音的波形。信号处理包括以下几个内容,首先根据一个给定的模型得到这一信号的…

语音质量评估 Speech quality assessment 方法与代码编写

目前常用语音相对评估指标(参考)4个,绝对评估(无参考)指标3个。简述如下所示:** 相对指标: 1、pesq:共综合以下5个方面打分,分别为音频清晰度、音量、背景噪音音频中的可…

网页js版音频数字信号处理:H5录音+特定频率信号的特征分析和识别提取

文章目录 一、网页中的音频数据源二、FFT:时域转频域三、信号的特征分析四、信号的识别提取附录 音频数字信号处理 Audio DSP (Digital Signal Processing) 是一个复杂又专业的话题,本文介绍的是如何从音频中实时分析和识别出特定频率信号的一种方法&…

telegram设置中文

浏览器打开 https://t.me/setlanguage/classic-zh-cn,只要安装了tg,会自动打开tg,提示切换至中文

谷歌浏览器chrome 语言设置为英文

1.打开Chrome浏览器主界面,看到右上角的【三个点】一样的标志,鼠标左键单击,选择【设置】 2.打开【设置】之后,下拉到最底部看到【高级】两个字,我们鼠标点击一下打开它 3.打开【高级设置】之后我们继续往下拉&#xf…

Chrome浏览器 F12控制台中文改成英文

当Chrome浏览器 F12控制台是中文,怎么设置成英文? 第一步:点击控制台右上角的设置图标 第二步:“语言”选项从浏览器界面语言设置成英文 第三步:重新加载DevTools,控制台变成英文了

谷歌浏览器设置中文教程

谷歌浏览器是由谷歌公司推出的一款网页浏览器,稳定性强,运行速度快,唯一不足的应该就是它不是中文的,那要如何给谷歌浏览器设置中文?下面就一起来看看具体的设置方法吧。 谷歌浏览器怎么设置中文? 1、进入浏…

【爬虫】爬取百度图片加载不出来

图片加载不出来?(防盗链) 在img标签禁用referer 博客 https://blog.csdn.net/fRF0lw4/article/details/80105574 防盗链解决方案 https://www.cnblogs.com/lydiawork/p/7838153.html 防盗链原理

chatgpt赋能python:Python爬虫网页超链接的SEO实践指南

Python爬虫网页超链接的SEO实践指南 随着互联网的普及,新的网站层出不穷,各种搜索引擎如Google、百度也不断更新搜索算法,以提供更优质的搜索结果。在这个过程中,SEO技术成为网站推广优化的重要手段之一。Python爬虫作为一种常用…

ChatGPT和GPT-4胜出基于四个方面

作为一项人工智能技术,ChatGPT正在以飞快的速度向前发展,其强大的学习能力甚至可以用超乎想象来形容。 最近,OpenAI公司又带着最新的GPT-4开始“大杀四方”了~OpenAI推出GPT-4文本生成AI系统。 那么作为目前NLP领域最前沿的研究成果之一&…

为什么当时那么多大佬不投资阿里?雷军:马云把项目说得太大,像个骗子!

现在我们也可以看出来互联网行业的发展可以说是很热门了,并且还很多发展的潜力。那么也就向我们表明了多年以前马云关于互联网的判断是正确的。不管是现在马云的电子商务还是移动支付等等一系列的互联网产品都充分地向我们证明了阿里巴巴的发展方向是正确的。 然而我…

马云、马化腾各自性格决定投资方式,你更看好谁?

作者:大宝 编辑:竹一 图片:网络 官网:iterduo.com “未来世界即将迎来‘OMO’(Online-Merge-Offline线上与线下融合)的时代,而中国的发展速度相当惊人,将有望在全球范围内首先实现OM…

马云、马化腾要合作了?阿里传出新消息,或将支持微信支付

马云与马化腾,阿里与腾讯 马云和马化腾是国内互联网界影响力最大的两位知名人物,他们分别是阿里巴巴和腾讯的创始人,在某种意义上改变了无数国人的日常生活。虽然平时大家都喜欢把马云和马化腾并称为“二马”,对他们的各种事迹也…

支付宝要融资上市,马云大赚,不过他承诺捐了

作者|科科 出品|网易科技《态℃》栏目组 七夕节临近下班时间,蚂蚁集团来了个突然袭击,公开了备受瞩目的招股书。这是蚂蚁首次全面披露业务大盘、营收情况等核心数据及未来规划。 营收方面,蚂蚁在2017年-2019年&#xf…

马云不再是蚂蚁集团实控人

2023年1月8日,阿里巴巴集团控股有限公司发布《自愿公告》。 阿里巴巴的非并表关联方蚂蚁集团 2023 年 1 月 7 日宣布,蚂蚁集团的两个主要股东(合计持有蚂蚁集团超过 50% 的股权和投票权)的投票结构将会发生变化。在各方经济利益不…

搞定马云马化腾争执的IT界大佬---吴鹰

链接:搞定马云马化腾争执的IT界大佬,因为一两亿的事情报警了! (baidu.com) 因为这个没完成的一两亿对赌业绩,互相打官司无果后,中嘉博创直接报警说对方涉嫌挪用公司资金。至于吴鹰为啥没调停这个事,不太好…

市值登顶亚洲后,马云对话全球投资者:与未来相比阿里还是个baby

“过去影响世界的很多是欧美公司,我们希望阿里成为真正的世界前十大公司,可以作为中国公司的代表去影响世界。”6月9日,阿里巴巴投资者日大会,阿里巴巴集团董事局主席马云对全球超过350位顶级投资机构的投资人和分析师分享了他的思…

忽悠马云10亿,还阿里4500亿:做对事赢一场,跟对人赢一生!

那个忽悠马云10个亿,被阿里同事指着鼻子让他滚蛋的人,后来怎么样了? 后来,他成为阿里巴巴集团首席技术官,而且被公认为,近10年来,中国最好的首席技术官。 他叫王坚,被称为“阿里云之…

雷军、马云、马化腾控股的公司

雷军、马云、马化腾控股的公司 前言 今天看我以前写的《行业分析常用到的21个网站》的时候,点开了一个网站——CBNData。 这是第一财经的网站,第一财经已经成为阿里系的一部分。阿里欲将其打造为具有全球影响力的新型数字化财经媒体与信息服务集团&…

传闻将与马云合作,涨了7倍的正大企业国际,还能跟风吗?

1月30日周一,港股正大企业国际逆势大涨68.35%,1月31日正大企业国际继续飙升,最高点涨超275%,收盘时涨幅达251.88%,成为2023年第一只翻倍的股票。今日早盘继续近40个点,还在持续发酵中。 消息面上&#xff…