语音信号处理共振峰

  • 窄带语谱图和宽带语谱图

首先,什么是语谱图。最通常的,就是语音短时傅里叶变换的幅度画出的2D图。之所以是通常的,是因为可以不是傅里叶变换。“窄带”,顾名思义,带宽小,则时宽大,则短时窗长,窄带语谱图就是长窗条件下画出的语谱图。“宽带”,正好相反。至于“横竖条纹”,窄带语谱图的带宽窄,那么在频率上就“分得开”,即能将语音各次谐波“看得很清楚”,即表现为“横线”。“横”就体现出了频率分辨率高。分辨率可以直观的看做“分开能力”。“频率分辨率”高就是在频率上将各次谐波分开的能力高,表现为能分辨出各次谐波的能力高,频率分辨率越高,越容易分辨各次谐波。类似的,宽带语谱图的时宽窄,那么在时间上就“分得开”,即能将语音在时间上重复的部分“看得很清楚”,即表现为“竖线”。“竖”就体现出了时间分辨率高。时间分辨率越高,谱图上的竖线看得越清楚。图1和图2分别示出了一条语音句子的窄带语谱图和宽带语谱图。短时窗长度分别是20ms和2ms。

图1

图1是一条语音及其窄带语谱图。上图是语音时间波形,下图是上图的窄带语谱图

图2

图2同一条语音及其宽带语谱图。上图是语音时间波形,下图是上图的宽带语谱图

图1虚框框住的部分就是一条横条纹,整个谱图中有非常多的这种横条纹。图2虚框框住的部分,在小图中清晰的显示出了一条一条的“竖线”,被框住的有27条竖线。

  • 从窄带语谱图和宽带语谱图看基音频率和共振峰

基音周期表示声带的震动周期,每隔这么长时间(震动周期),有一个气流通过,“每隔”就体现了周期性,这就是基音周期,那么谱图上就应该有这个频率的信号分量,而且这个频率的幅度(能量)不应该很小,因为每隔一段时间“就有”一团能量通过声带。所以基音频率所在的成分在窄带语谱图上应该是所有横条纹中频率范围最低的那条。在图1中,用虚线框框住的部分就表示基音频率成分,与其在同一水平线上的条纹都表示该时刻的基音频率成分,这条条纹对应的纵轴刻度值就表示基音频率。从图1小图可估计基音频率大约在250Hz左右,基音频率略有波动,0.5s处大约是240Hz。其他横条纹就是各次谐波,这些谐波中有些地方颜色比同时刻其附近其他横条纹颜色要深,这些颜色深的条纹表示共振峰。有些时刻,颜色较局部附近深的条纹不止一条,这些深色条纹组成了各次共振峰,如第一、第二、第三共振峰。图2,宽带语谱图的基音频率和共振峰就不清晰了。但是其仍可以看出基音周期,图2小图具有明显的竖线,两条竖线之间的时间就表示基音周期。在0.44s到0.54s时间段内大约有25条竖线,即24个间隔,则基音周期可估计为(0.54-0.44)/24=4.17ms,则基音频率估计为240Hz。

  • 从语音时域波形上估计基音周期、频谱曲线上估计基音频率

选取0.5s处的一段语音片段,长度为20ms。其时域波形和频谱如图3。
图3

图3 0.5s处语音片段时域波形及其频谱
图3左图,用红圈圈示的尖峰用于估计基音周期,双向箭头表示时间范围内5个圈共4个相似的波段,这4段就表示4个基音周期,则可估计基音周期约为4.25ms,则基音频率约为235.2941Hz。图3右图,频谱具有明显小尖峰,这些尖峰在低频部分(可认为语音频率3400Hz内)比较有规律且平滑,高频出现小幅度的“杂乱”,这些“杂乱”表示噪声,来源有录音设备及量化噪声等(虽然幅度很小,甚至根本就“听”不出来,但存在是事实)。这些尖峰就是各次谐波,从左往右一次是1次、2次、3次……谐波。其中最左边的尖峰对应基音频率,其横坐标对应的值表示基音频率,从小图可看到大约为234.83Hz。利用各次谐波可以得到更精确的估计,图中用红圈表示用于估计基频的谐波,共选取了15个,估计出基频为234.8337Hz。

  • 从语音频谱曲线上看共振峰

基音频率体现的是声源的信息,而共振峰体现的是声道的信息。为便于比较和观察,将图3这个语音片段的源和系统分离,分别展示源的频谱和声道的频谱,观察一致性。图4、5显示的是源的频谱、声道的频谱、语音的频谱及共振峰的位置信息,图5去掉了小图。粉红线是源信息的频谱,红线是语音的频谱,黑色虚线是语音频谱的包络,蓝线是声道频谱,蓝色圈圈标示出声道频谱的峰值点,粉红虚竖线显示这些峰值点的位置。根据语音产生的源-滤波器模型及源、系统的卷积解释,语音频谱的包络显示的是声道的信息,而小尖峰显示源的信息,如谐波。可看到粉红线和红线二者的峰值的位置正好一一对应,体现了源的信息,而且粉红线(源)明显没有包络峰值,说明声道的信息被滤除。同样,蓝线没有了小尖峰,即滤掉了源的信息。并且声道的峰值点位置与语音频谱包络的峰值位置也正好一一对应。蓝圈圈的个数表示共振峰的个数,共有4个,从左至右分别称为F1、F2、F3、F4,(F0是基音频率)。它们横轴值表示共振峰频率值,某共振峰带宽就表示该共振峰所占频带宽度。这个图还暗示了另一个有趣的事实,源所占的频率范围和声道所占的频率范围是一样的,在频域利用高通或低通或带通的方法分离源和系统是行不通的。

tu4

图4语音片段时域波形及其源、声道和语音频谱。

图5

图5语音片段时域波形及其源、声道和语音频谱。去掉小图(小图遮挡了部分信息)

基音频率和共振峰是能从谱图、频谱上看出来的语音的最基本的信息,当然可以看出其他更多的信息。比如,窄带语谱图上基本上可以发现,低频部分,横条纹比较直,而高频部分,条纹变“弯”了,这表示什么?图1小图可明显看到,基音频率也不是不变的,其也具有波动,我们可以人为的将基频线连接起来为一条曲线,这称为基音跟踪。共振峰表示“谐振”,频谱上表示为频谱包络(其实是上包络)的峰值,那么频谱下包络的谷值点就表示“反谐振”。频谱的“尖峰”显示的是源的信息,小尖包突起是周期性的,是有用的,那么“杂乱”的源头是非周期性的,这在语音转换中是一种很重要的信息。

PS:1、源-系统信息分离和提取参考论文:
“Glottal wave analysis with pitchsynchronous iterative adaptive inverse filtering” Paavo Alku. SpeechCommunication 11(2-3): 109-118 (1992)
2、源-系统分离代码链接:http://users.tkk.fi/~traitio/research.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24456.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

程序员表白网页特效

共五个特效 访问博客免费下载访问博客 全部代码下载 代码下载 第一个特效 第二个特效 第三个特效 第四个特效,可以点击愿意不愿意,然后后面还有多个页面 第五个特效

CSS常用特效

本文是笔者写CSS时常用的套路。不论效果再怎么华丽,万变不离其宗。 1、交错动画 有时候,我们需要给多个元素添加同一个动画,播放后,不难发现它们会一起运动,一起结束,这样就会显得很平淡无奇。那么如何将动…

Unity的一些特效和粒子特效插件

Unity的插件 Kitchen Cooking FX 厨房烹饪效果和声音Ultimate VFX 终极粒子特效资源包Advanced Dissolve高级溶解插件Translucent Image 半透明高斯模糊Teleport Effect 传送光圈特效AraTrail 拖尾SVG Importer矢量图导入插件FX Magic Circle 魔法圈特效Highlight Plus 外发光 …

html鼠标爱心特效代码,鼠标点击爱心特效代码分享

鼠标点击爱心特效代码分享 !function(e, t, a) { function r() { for (var e 0; e < s.length; e) s[e].alpha < 0 ? (t.body.removeChild(s[e].el), s.splice(e, 1)) : (s[e].y--, s[e].scale .004, s[e].alpha - .013, s[e].el.style.cssText "left:" s…

两行Python代码实现视频负片特效

☞ ░ 老猿Python博文目录&#xff1a;https://blog.csdn.net/LaoYuanPython ░ 一、引言 最近看到好几篇类似“n行Python代码…”的博文&#xff0c;看起来还挺不错&#xff0c;简洁、实用&#xff0c;传播了知识、带来了阅读量&#xff0c;撩动了老猿的心&#xff0c;决定跟…

再聊聊财务自由

前段时间有人在我星球讨论财务自由&#xff0c;说自由的本质是选择权&#xff0c;有读者觉得大受启发&#xff0c;我就翻了一下旧文&#xff0c;我2017年就说过了啊&#xff0c;谈谈财务自由 。 但时过境迁&#xff0c;其实我想改变一下之前的说法&#xff0c;所谓财务自由&…

《周易》乾卦爻辞

1. 初九.潜龙勿用 初九&#xff0c;潜龙勿用。 下爻为初。九&#xff0c;阳数之盛&#xff0c;故以名阳爻。理无形也&#xff0c;故假象以显义。乾以龙为象。龙之为物&#xff0c;灵变不测&#xff0c;故以象乾道变化&#xff0c;阳气消息&#xff0c;圣人进退。初九在一卦之下…

《光剑教教义:五信 九训 十诫 九罪》

五信 1.没有神、上帝、救世主&#xff0c;每个人就是自己的神、上帝、救世主&#xff1b;天助自助者。一个人能够在想象中创造的事情&#xff0c;没有什么是不能实现的。我们所需要的&#xff0c;只是把蕴含在我们自身的所有潜在力量激发出来。 2.神不过是世界上的一般能源&a…

德鲁克《管理的实践》笔记

谈管理时必须将三个方面都纳入考虑&#xff1a;第一是成果和绩效&#xff0c;因为这是企业存在的目的&#xff1b;第二必须考虑在企业内部共同工作的人所形成的组织&#xff1b;第三则要考虑外在的社会&#xff0c;也就是社会影响和社会责任。 第1章 管理层的角色 在每个企业中…

C++多态性分析和与Linux内核中的多态性实现的共性和差异比较

Linux内核是用C语言开发的&#xff0c;而C是面向结构&#xff0c;面向过程的语言&#xff0c;这种语言的特点是数据结构和数据操作是分离的两个部分&#xff0c;但是这并不代表面向过程的语言无法实现面向对象语言的一些机制&#xff0c;比如多态性&#xff0c;多态的本质在于其…

为什么有些 985、211 的本科学生即使在大学里混得很水,在找工作时学历却那么管用?...

学术分享&#xff0c;侵删 知乎&#xff1a;https://www.zhihu.com/question/354234322 编辑&#xff1a;AI有道 最近网上有个话题比较有争议&#xff1a;【为什么有些 985、211 的本科学生即使在大学里混得很水&#xff0c;在找工作时学历却那么管用&#xff1f;】笔者认为&am…

202324读书笔记|《一枝瘦骨写空山:金农画的金石气》——以一枝瘦骨,写空山之妙

202323读书笔记|《一枝瘦骨写空山&#xff1a;金农画的金石气》——以一枝瘦骨&#xff0c;写空山之妙 《一枝瘦骨写空山&#xff1a;金农画的金石气&#xff08;文人画的真性&#xff09;》作者朱良志。荷风四面&#xff0c;人在当中&#xff0c;消受这世界的清凉&#xff0c;…

超然!高效 MacBook 工作环境配置,超实用!

点击上方&#xff0c;选择“设为星标” 优质文章&#xff0c;及时送达 工欲善其事&#xff0c;必先利其器&#xff0c;工具永远都是用来解决问题的&#xff0c;没必要为了工具而工具&#xff0c;一切工具都是为了能快速准确的完成工作和学习任务而服务。 本文记录 MacBook 整个…

职业规划-IT方向(超详细,超具体)

前言 今天是周五&#xff0c;本来想好好休息。前天写了一篇博文《说出我的故事&#xff0c;献给正在迷茫的你》&#xff08;https://blog.csdn.net/weixin_44135121/article/details/92841610&#xff09;&#xff0c;不少读者留言不知该如何做职业规划&#xff0c;于是继续拖…

超然姐姐 Asp.net笔记 (网课笔记)

超然姐姐ASP.Net笔记 ASP ASP.net PHP&#xff1a;超文本预处理 2020/3/10 解决方案 ​ 项目 ​ 属性 ​ 引用 ​ 类 Forml.cs 体文件 .csproj 项目信息 .cs 源文件 记事本 输出 Console.WriteLine(" 要打印的内容"); ​ Console.ReadKey(); ​ 1.暂停当前…

超然姐姐 Linux网课笔记

超然姐姐 Linux笔记 1 .命令级接口 ​ 2.1脱机用户接口 2.程序级接口 3.图形界面 视频 mooc Linux 活跃的发行版本多少 视频mooc 自由软件是一种可以不受限制地自由使用、复制、研究、修改和分发但必须公开源代码的软件。可以买卖。这方面的不受限制正是自由软件最重要的…

抱一鸿蒙 超然之志什么意思,什么是超然?什么是洒脱?

满意答案 brickhu 2013.04.18 采纳率&#xff1a;58% 等级&#xff1a;12 已帮助&#xff1a;19811人 您好! 朋友&#xff0c;很高兴为你解答 真正的爱情并不一定是他人眼中的完美匹配 ?需要同时付出才会有意义&#xff0c;才会更加的完美? 爱是缘份&#xff0c;爱是感动&…

简单使用Knockout.js和Datatables.js 分页

添加与KnockoutJS绑定的表格数据的简单分页&#xff0c;排序和搜索的示例 index.html <!DOCTYPE html> <html lang"en"><head><meta charset"utf-8"><meta http-equiv"X-UA-Compatible" content"IEedge"…

Python基础之文件

输出一行一行的&#xff0c;效率更高 一个任务&#xff1a; 主函数&#xff1a;

PHP登陆/php登录--【强撸项目】

强撸项目系列总目录在000集 PHP要怎么学–【思维导图知识范围】 文章目录 本系列校训本项目使用技术 上效果图phpStudy 设置导数据库 项目目录如图&#xff1a;页面代码后台代码 这么丑的界面能忍&#xff1f;配套资源作业&#xff1a; 本系列校训 用免费公开视频&#xff0…