目录
6.1 数字信号处理的基本步骤
6.2 离散信号及其频谱分析
6.2.1 概述
6.2.2 时域采样、混叠和采样定理
6.2.3 量化和量化误差
6.2.4 截断、泄漏和窗函数
6.2.5 频域采样、时域周期延拓和栅栏效应
6.2.6 频率分辨率、整周期截断
6.3 相关分析及其应用
6.3.1 两个随机变量的相关系数
6.3.2 信号的自相关函数
例6-1
6.3.3 信号的互相关函数
例6-2
例6-3
6.3.4 相关函数估计
6.4 功率谱分析及其应用
6.4.1 自功率谱密度函数
2. 帕塞瓦尔定理
6.5 现代信号分析方法简介
6.5.1 功率谱估计的现代方法
6.5.2 时频分析
1. 短时傅里叶变换(STFT)
2. 小波变换
3. Wigner-Ville分布
6.5.3 统计信号处理
上理考研周导师的哔哩哔哩频道
我在频道里讲课哦
测试工作的目的是获取反映被测对象的状态和特征的信息。但是有用的信号总是和各种噪声混杂在一起的,有时本身也不明显,难以直接识别和利用。只有分离信号与噪声,并经过必要的处理和分析、清除和修正系统误差之后,才能比较准确地提取测得信号中所含的有用信息。因此,信号处理的目的是:①分离信、噪,提高信噪比;②从信号中提取有用的特征信号;③修正测试系统的某些误差,如传感器的线性误差、温度影响等。
信号处理可用模拟信号处理系统和数字信号处理系统来实现。
模拟信号处理系统由一系列能实现模拟运算的电路,诸如模拟滤波器、乘法器、微分放大器等环节组成。其中大部分环节在前行课程和前面几章中已有讨论。模拟信号处理也作为数字信号处理的前奏,例如滤波、限幅、隔直、解调等预处理。数字处理之后也常需进行模拟显示、记录等。 数字信号处理是用数字方法处理信号,它既可在通用计算机上借助程序来实现,也可以用专用信号处理器来完成。数字信号处理机具有稳定、灵活、快速、高效、应用范围广、设备体积小、重量轻等优点,在各行业中得到广泛的应用。
6.1 数字信号处理的基本步骤
数字信号处理的基本步骤如图6-1所示。
信号的预处理是把信号变成适于数字处理的形式,以减轻数字处理的困难。
预处理包括:
1)电压幅值调理,以便适宜于采样,总是希望电压峰-峰值足够大,以便充分利用A-D转换器的精确度。如12位的A-D转换器,其参考电压为±5V。由于212=4096,故其末位数字的当量电压为2.5mV。若信号电平较低,转换后二进制数的高位都为0,仅在低位有值,其转换后的信噪比将很差。若信号电平绝对值超过5V,则转换中又将发生溢出,这是不允许的。所以进入A-D转换的信号的电平应适当调整。
2)必要的滤波,以提高信噪比,并滤去信号中的高频噪声。
3)隔离信号中的直流分量(如果所测信号中不应有直流分量)。
4)如原信号经过调制,则应先行解调。
预处理环节应根据测试对象、信号特点和数字处理设备的能力妥善安排。
A-D转换是模拟信号经采样、量化并转化为二进制的过程。
数字信号处理器或计算机对离散的时间序列进行运算处理。计算机只能处理有限长度的数据,所以首先要把长时间的序列截断,对截取的数字序列有时还要人为地进行加权(乘以窗函数)以成为新的有限长的序列。对数据中的奇异点(由于强干扰或信号丢失引起的数据突变)应予以剔除。对温漂、时漂等系统性干扰所引起的趋势项(周期大于记录长度的频率成分)也应予以分离。如有必要,还可以设计专门的程序来进行数字滤波,然后把数据按给定的程序进行运算,完成各种分析。 运算结果可以直接显示或打印,若后接D-A转换器,还可得到模拟信号。如有需要可将数字信号处理结果送入后接计算机或通过专门程序再做后续处理。
6.2 离散信号及其频谱分析
数字信号处理首先把一个连续变化的模拟信号转化为数字信号,然后由计算机处理,从中提取有关的信息。信号数字化过程包含着一系列步骤,每一步骤都可以引起信号和其蕴含信息的失真。现以计算一个模拟信号的频谱为例来说明有关的问题。
6.2.1 概述
设模拟信号x(t)的傅里叶变换为X(f)(见图6-2)。为了利用数字计算机来计算,必须使x(t)变换成有限长的离散时间序列。为此,必须对x(t)进行采样和截断。
采样就是用一个等时距的周期脉冲序列s(t)(即S(t,Ts)),也称采样函数(见图6-3)去乘x(t)。时距Ts称为采样周期,1/Ts=fs称为采样频率。由式(2-60)可知,s(t)的傅里叶变换S(f)也是周期脉冲序列,其频率间距为fs=1/Ts。根据傅里叶变换的性质,采样后信号频谱应是X(f)和S(f)的卷积:X(f)*S(f),相当于将X(f)乘以1/Ts,然后将其平移,使其中心落在S(f)脉冲序列的频率点上,如图6-4所示。若X(f)的频带大于1/2Ts,平移后的图形会发生交叠,如图中虚线所示。采样后信号的频谱是这些平移后图形的叠加,如图中实线所示。
由于计算机只能进行有限长序列的运算,所以必须从采样后信号的时间序列截取有限长的一段来计算,其余部分视为零而不予考虑。这等于把采样后信号(时间序列)乘上一个矩形窗函数,窗宽为T。所截取的时间序列数据点数N=T/Ts。N也称为序列长度。窗函数w(t)的傅里叶变换W(f)如图6-5所示。时域相乘对应着频域卷积,因此进入计算机的信号为x(t)s(t)w(t),是长度为N的离散信号(见图6-6)。它的频谱函数是[X(f)*S(f)*W(f)],是一个频域连续函数。在卷积中,W(f)的旁瓣引起新频谱的皱波。
通过计算机实现离散傅里叶变换(DFT),将N点长的离散时间序列x(t)s(t)w(t)变换成N点的离散频率序列。
注意到,x(t)s(t)w(t)的频谱是连续的频率函数,而DFT计算后的输出则是离散的频率序列。可见DFT不仅算出x(t)s(t)w(t)的“频谱”,而且同时对其频谱[X(f)*S(f)*W(f)]实施了频域的采样处理,使其离散化。这相当于在频域中乘上图6-7中所示的采样函数D(f)。现在,DFT是在频域的一个周期
中输出N个数据点,故输出的频率序列的频率间距Δf=fs/N=1/(TsN)=1/T。频域采样函数是
计算机的实际输出是X(f)p(见图6-8)。
与X(f)p相对应的时域函数x(t)p既不是x(t),也不是x(t)s(t),而是
d(t)是D(f)的时域函数。应当注意到频域采样形成的频域函数离散化,相应地把其时域函数周期化了,因而x(t)p是一个周期函数,如图6-8所示。
图6-7 频域采样函数及其时域函数
图6-8 DFT后的频谱及其时域函数x(t)
从以上过程看到,原来希望获得模拟信号x(t)的频域函数X(f),由于输入计算机的数据是序列长为N的离散采样后信号x(t)s(t)w(t),所以计算机输出的是X(f)p。X(f)p不是X(f),而是用X(f)p来近似代替X(f)。处理过程中的每一个步骤:采样、截断、DFT计算都会引起失真或误差,必须充分注意。工程上不仅关心有无误差,而更重要的是了解误差的具体数值,以及是否能以经济、有效的手段提取足够精确的信息。只要概念清楚,处理得当,就可以利用计算机有效地处理测试信号,完成在模拟信号处理技术中难以完成的工作。 下面讨论信号数字化出现的主要问题。
6.2.2 时域采样、混叠和采样定理
采样是把连续时间信号变成离散时间序列的过程。这一过程相当于在连续时间信号上“摘取”许多离散时刻上的信号瞬时值。在数学处理上,可看作以等时距的单位脉冲序列(称其为采样信号)去乘连续时间信号,各采样点上的瞬时值就变成脉冲序列的强度。以后这些强度值将被量化而成为相应的数值。
长度为T的连续时间信号x(t),从点t=0开始采样,采样得到的离散时间序列为
式中
Ts——采样间隔; N——序列长度,N=T/Ts; fs——采样频率,fs=1/Ts。
采样间隔的选择是一个重要的问题。若采样间隔太小(采样频率高),则对定长的时间记录来说其数字序列就很长,计算工作量迅速增大;如果数字序列长度一定,则只能处理很短的时间历程,可能产生较大的误差。若采样间隔过大(采样频率低),则可能丢掉有用的信息。图6-9a中,如果按图中所示的Ts采样,将得点1、2、3等的采样值,无法分清曲线A、曲线B和C的差别,并把B、C误认为A。图6-9b中用采样间隔Ts对两个不同频率的正弦波进行采样,得到一组相同采样值,无法辨识两者的差别,将其中的高频信号误认为某种相应的低频信号,出现了所谓的混叠现象。
下面具体解释混叠现象及其避免的办法。
间距为Ts的采样脉冲序列的傅里叶变换也是脉冲序列,其间距为1/Ts,即
由频域卷积定理可知:两个时域函数的乘积的傅里叶变换等于两者傅里叶变换的卷积,即x(t)s(t)⇌X(f)*S(f) 考虑到δ函数与其他函数卷积的特性[见式(1-52)],上式可写为
此式为x(t)经过间隔为Ts的采样之后所形成的采样信号的频谱。一般地说,此频谱和原连续信号的频谱X(f)并不一定相同,但有联系。它是将原频谱X(f)依次平移1/Ts至各采样脉冲对应的频域序列点上,然后全部叠加而成(见图6-4)。由此可见,信号经时域采样之后成为离散信号,新信号的频域函数就相应地变为周期函数,周期为1/Ts=fs。
如果采样的间隔Ts太大,即采样频率fs太低,平均距离1/Ts过小,那么移至各采样脉冲所在处的频谱X(f)就会有一部分相互交叠,新合成的X(f)*S(f)图形与原X(f)不一致,这种现象称为混叠。发生混叠以后,改变了原来频谱的部分幅值(见图6-4中虚线部分),这样就不可能从离散的采样信号x(t)s(t)准确地恢复出原来的时域信号x(t)。
注意到原频谱X(f)是f的偶函数,f=0为对称轴;现在新频谱X(f)*S(f)又是以fs为周期的周期函数。因此,如有混叠现象出现,从图6-4中可见,混叠必定出现在f=fs/2左右两侧的频率处。有时将fs/2称为折叠频率。可以证明,任何一个大于折叠频率的高频成分f1都将和一个低于折叠频率的低频成分f2相混淆,将高频f1误认为低频f2。相当于以折叠频率fs/2为轴,将f1成分折叠到低频成分f2上,它们之间的关系为
(f1+f2)/2=fs/2
这也就是称fs/2为折叠频率的由来。
如果要求不产生频率混叠(见图6-10),首先应使被采样的模拟信号x(t)成为有限带宽的信号。为此,对不满足此要求的信号,在采样之前,使其先通过模拟低通滤波器滤去高频成分,使其成为带限信号,为满足下面要求创造条件。这种处理称为抗混叠滤波预处理。其次,应使采样频率fs大于带限信号的最高频率fh的2倍,即
在满足此条件下,采样后的频谱X(f)*S(f)就不会发生混叠(见图6-10)。若把该频谱通过一个中心频率为零(f=0)、带宽为±(fs/2)的理想低通滤波器,就可以把完整的原信号频谱取出,也就有可能从离散序列中准确地恢复原模拟信号x(t)。
为了避免混叠以使采样处理后仍有可能准确地恢复其原信号,采样频率fs必须大于最高频率fh的两倍,即fs>2fh,这就是采样定理。在实际工作中,考虑到实际滤波器不可能有理想的截止特性,在其截止频率fc之后总有一定的过渡带,故采样频率常选为(3~4)fc。此外,从理论上说,任何低通滤波器都不可能把高频噪声完全衰减干净,因此也不可能彻底消除混叠。
6.2.3 量化和量化误差
采样所得的离散信号的电压幅值,若用二进制数码组来表示,就使离散信号变成数字信号,这一过程称为量化。量化是从一组有限个离散电平中取一个来近似代表采样点的信号实际幅值电平。这些离散电平称为量化电平,每个量化电平对应一个二进制数码。
A-D转换器的位数是一定的。一个b位(又称数据字长)的二进制数,共有L=2b个数码。如果A-D转换器允许的动态工作范围为D(例如±5V或0~10V),则两相邻量化电平之间的差Δx为
Δx=D/2(b-1)(6-6)
其中采用2b-1而不用2b,是因为实际上字长的第一位用作符号位。
当离散信号采样值x(n)的电平落在两个相邻量化电平之间时,就要舍入到相近的一个量化电平上。该量化电平与信号实际电平之间的差值称为量化误差ε(n)。量化误差的最大值为±(Δx/2),可认为量化误差在(-Δx/2,+Δx/2)区间各点出现的概率是相等的,其概率密度为1/Δx,均值为零,其均方值为Δx2/12,误差的标准差σε为0.29Δx。实际上,和信号获取、处理的其他误差相比,量化误差通常是不大的。
量化误差ε(n)将形成叠加在信号采样值x(n)上的随机噪声。假定字长b=8,峰值电平等于2(8-1)Δx=128Δx。这样,峰值电平与σε之比为(128Δx/0.29Δx)≈450,即约近于26dB。
A-D转换器位数选择应视信号的具体情况和量化的精度要求而定。但要考虑位数增多后,成本显著增加,转换速率下降的影响。
为了讨论简便,今后假设各采样点的量化电平就是信号的实际电平,即假设A-D转换器的位数为无限多,则量化误差等于零。
6.2.4 截断、泄漏和窗函数
由于实际只能对有限长的信号进行处理,所以必须截断过长的信号时间历程。截断就是将信号乘以时域的有限宽矩形窗函数。“窗”的意思是指透过窗口能够“看见”“外景”(信号的一部分)。对时窗以外的信号,视其为零。
从采样后信号x(t)s(t)截取一段,就相当于在时域中用矩形窗函数w(t)乘采样后信号。经这些处理后,其时、频域的相应关系(见图6-6)为
x(t)s(t)w(t)⇌X(f)*S(f)*W(t)(6-7)
一般信号记录,常以某时刻作为起点截取一段信号,这实际上就是采用单边时窗,相当于将第一章例1-3的矩形窗函数右移T/2。这时矩形窗函数为
在时域右移T/2,在频域作相应的相移(见表2-3),但幅频谱的绝对值是不变的。
由于W(f)是一个无限带宽的sinc函数(见第2章例2-3),所以即使x(t)是带限信号,在截断后也必然成为无限带宽的信号,这种信号的能量在频率轴分布扩展的现象称为泄漏。同时,由于截断后信号带宽变宽,因此无论采样频率多高,信号总是不可避免地出现混叠,故信号截断必然导致一些误差。
为了减小或抑制泄漏,提出了各种不同形式的窗函数来对时域信号进行加权处理,以改善时域截断处的不连续状况。所选择的窗函数应力求其频谱的主瓣宽度窄些、旁瓣幅度小些。窄的主瓣可以提高频率分辨能力;小的旁瓣可以减小泄漏。这样,窗函数的优劣大致可从最大旁瓣峰值与主瓣峰值之比、最大旁瓣10倍频程衰减率和主瓣宽度等三方面来评价。
6.2.5 频域采样、时域周期延拓和栅栏效应
经过时域采样和截断后,其频谱在频域是连续的。如果要用数字描述频谱,这就意味着首先必须使频率离散化,实行频域采样。频域采样与时域采样相似,在频域中用脉冲序列D(f)乘信号的频谱函数(见图6-8)。这一过程在时域相当于将信号与一周期脉冲序列d(t)做卷积,其结果是将时域信号平移至各脉冲坐标位置重新构图,从而相当于在时域中将窗内的信号波形在窗外进行周期延拓。所以,频率离散化,无疑已将时域信号“改造”成周期信号。总之,经过时域采样、截断、频域采样之后的信号[x(t)s(t)w(t)]*d(t)是一个周期信号,和原信号x(t)是不一样的。
对一函数实行采样,实质上就是“摘取”采样点上对应的函数值。其效果有如透过栅栏的缝隙观看外景一样,只有落在缝隙前的少数景象被看到,其余景象都被栅栏挡住,视为零。这种现象被称为栅栏效应。不管是时域采样还是频域采样,都有相应的栅栏效应。只不过时域采样如满足采样定理要求,栅栏效应不会有什么影响。而频域采样的栅栏效应则影响颇大,“挡住”或丢失的频率成分有可能是重要的或具有特征的成分,以致于整个处理失去意义。
6.2.6 频率分辨率、整周期截断
频率采样间隔Δf也是频率分辨率的指标。此间隔越小,频率分辨率越高,被“挡住”的频率成分越少。前面曾经指出,在利用DFT将有限时间序列变换成相应的频谱序列的情况下,Δf和分析的时间信号长度T的关系是
Δf=fs/N=1/T(6-9)
这种关系是DFT算法固有的特征。这种关系往往加剧频率分辨率和计算工作量的矛盾。根据采样定理,若信号的最高频率为fh,最低采样频率fs应大于2fh。根据式(6-9),在fs选定后,要提高频率分辨率就必须增加数据点数N,从而急剧地增加了计算工作量。
在分析频率为f0的简谐信号时,需要了解某特定频率f0的谱值,希望DFT谱线落在f0上。单纯减小Δf,并不一定会使谱线落在频率f0上。从DFT的原理来看,谱线落在f0处的条件是:f0/Δf=整数。考虑到Δf是分析时长T的倒数,简谐信号的周期T0是其频率f0的倒数,因此只有截取的信号长度T正好等于信号周期的整数倍时,才可能使分析谱线落在简谐信号的频率上,从而获得准确的频谱。显然,这个结论适用于所有周期信号。
因此,对周期信号实行整周期截断是获得准确频谱的先决条件。从概念来说,DFT的效果相当于将时窗内信号向外周期延拓。若事先按整周期截断信号,则延拓后的信号将和原信号完全重合,无任何畸变。反之,延拓后将在t=kT交接处出现间断点,波形和频谱都发生畸变。其中k为某个整数。
6.3 相关分析及其应用
在测试技术领域中,无论分析两个随机变量之间的关系,还是分析两个信号或一个信号在一定时移前后之间的关系,都需要应用相关分析。例如在振动测试分析、雷达测距、声发射探伤等都用到相关分析。
6.3.1 两个随机变量的相关系数
通常,两个变量之间若存在一一对应的确定关系,则称两者存在着函数关系。当两个随机变量之间具有某种关系时,随着某一个变量数值的确定,另一变量却可能取许多不同值,但取值有一定的概率统计规律,这时称两个随机变量存在着相关关系。
图6-11表示由两个随机变量x和y组成的数据点的分布情况。
图6-11a中各点分布很散,可以说变量x和变量y之间是无关的。图6-11b中x和y虽无确定关系,但从统计结果、从总体看,大体上具有某种程度的线性关系,因此说它们之间有着相关关系。
变量x和y之间的相关程度常用相关系数ρxy表示,即
式中 E——数学期望; μx——随机变量x的均值,μx=E[x]; μy——随机变量y的均值,μy=E[y]; σx、σy——随机变量x、y的标准差
利用柯西-施瓦茨不等式,有
E[(x-μx)(y-μy)]2≤E[(x-μx)2]E[(y-μy)2](6-11)
故知|ρxy|≤1。当数据点分布越接近于一条直线时,ρxy的绝对值越接近1,x和y的线性相关程度越好,将这样的数据回归成直线才越有意义。ρxy的正负号则是表示一变量随另一变量的增加而增或减。当ρxy接近于零,则可认为x、y两变量之间完全无关。
6.3.2 信号的自相关函数
假如x(t)是某各态历经随机过程的一个样本记录,x(t+τ)是x(t)时移τ后的样本(见图6-12),在任何t=ti时刻,从两个样本上可以分别得到两个值x(ti)和x(ti+τ),而且x(t)和x(t+τ)具有相同的均值和标准差。把ρx(t)x(t+τ)简写作ρx(τ),那么有
将分子展开并注意到
从而得
对各态历经随机信号及功率信号可定义自相关函数Rx(τ)为
显然ρx(τ)和Rx(τ)均随τ而变化,而两者成线性关系。如果该随机过程的均值μx=0,则
自相关函数具有下列性质: 1)由式(6-14)有
又因为|ρx(τ)|≤1,所以
2)自相关函数在τ=0时取最大值,并等于该随机信号的均方值
3)当τ足够大或τ→∞时,随机变量x(t)和x(t+τ)之间不存在内在联系,彼此无关,故
4)自相关函数为偶函数,即Rx(τ)=Rx(-τ)(6-18)
上述4个性质可用图6-13来表示。
图6-13 自相关函数的性质
5)周期函数的自相关函数仍为同频率的周期函数,其幅值与原周期信号的幅值有关,而丢失了原信号的相位信息。
例6-1
求正弦函数x(t)=x0sin(ωt+φ)的自相关函数,初始相角φ为一随机变量。
解 此正弦函数是一个零均值的各态历经随机过程,其各种平均值可以用一个周期内的平均值表示。该正弦函数的自相关函数为
式中 T0——正弦函数的周期,
令ωt+φ=θ,则
于是
可见正弦函数的自相关函数是一个余弦函数,在τ=0时具有最大值,但它不随τ的增加而衰减至零。它保留了原正弦信号的幅值和频率信息,而丢失了初始相位信息。
表6-1是4种典型信号的自相关函数,稍加对比就可以看到自相关函数是区别信号类型的一个非常有效的手段。只要信号中含有周期成分,其自相关函数在τ很大时都不衰减,并且有明显的周期性。不包含周期成分的随机信号,当τ稍大时自相关函数就将趋近于零。宽带随机噪声的自相关函数很快衰减到零,窄带随机噪声的自相关函数则具有较慢的衰减特性。
图6-14a是某一机械加工表面粗糙度的波形,经自相关分析后所得到的自相关图(见图6-14b)呈现出周期性。这表明造成表面粗糙度的原因中包含有某种周期因素。从自相关图能确定该周期因素的频率,从而可以进一步分析其原因。
6.3.3 信号的互相关函数
两个各态历经过程的随机信号x(t)和y(t)的相互关系函数Rxy(τ)定义为
\
当时移τ足够大或τ→∞时,x(t)和y(t)互不相关,ρxy→0,而Rxy(τ)→μxμy。Rxy(τ)的最大变动范围在μxμy±σxσy之间,即
(μxμy-σxσy)≤Rxy(τ)≤(μxμy+σxσy)(6-20)
式中 μx、μy——x(t)、y(t)的均值; σx、σy——x(t)、y(t)的标准差。
如果x(t)和y(t)两信号是同频率的周期信号或者包含有同频率的周期成分,那么,即使τ→∞,互相关函数也不收敛并会出现该频率的周期成分。如果两信号含有频率不等的周期成分,则两者不相关。这就是说,同频率相关,不同频不相关。
例6-2
设有两个周期信号x(t)和y(t),即
x(t)=x0sin(ωt+θ) y(t)=y0sin(ωt+θ-φ)
式中 θ——x(t)相对t=0时刻的相位角; φ ——x(t)与y(t)的相位差。 试求其互相关函数Rxy(τ)。
解 因为信号是周期函数,可以用一个共同周期内的平均值代替其整个历程的平均值,故
由此例可见,两个均值为零且具有相同频率的周期信号,其互相关函数中保留了这两个信号的圆频率ω、对应的幅值x0和y0以及相位差值φ的信息。
例6-3
若两个周期信号的圆频率不等 x(t)=x0sin(ω1t+θ) y(t)=y0sin(ω2t+θ-φ)
试求其互相关函数。
解 因为两信号的圆频率不等(ω1≠ω2),不具有共同的周期,因此按式(6-19)计算,有
根据正(余)弦函数的正交性,可知 Rxy(τ)=0
可见,两个非同频的周期信号是不相关的。
互相关函数不是偶函数,即Rxy(τ)一般不等于Rxy(-τ);Rxy(τ)和Ryx(τ)一般是不等的,因此书写互相关函数时应注意下标符号的顺序。
互相关函数的性质可用图6-15来表示。图中表明τ=τ0时呈现最大值,时移τ0反映x(t)和y(t)之间的滞后时间。
互相关函数的这些特性,使它在工程应用中有重要的价值。它是在噪声背景下提取有用信息的一个非常有效的手段。如果我们对一个线性系统(例如某个部件、结构或某台机床)激振,所测得的振动信号中常常含有大量的噪声干扰。根据线性系统的频率保持性,只有和激振频率相同的成分才可能是由激振而引起的响应,其他成分均是干扰。因此只要将激振信号和所测得的响应信号进行互相关(不必用时移,τ=0)就可以得到由激振而引起的响应信号幅值和相位差,消除了噪声干扰的影响。这种应用相关分析原理来消除信号中噪声干扰、提取有用信息的处理方法叫作相关滤波。它是利用互相关函数同频相关、不同频不相关的性质来达到滤波效果的。
互相关技术还广泛地应用于各种测试中。工程中还常用两个间隔一定距离的传感器来不接触地测量运动物体的速度。图6-16是测定热轧钢带运动速度的示意图。钢带表面的反射光经透镜聚焦在相距为d的两个光电池上。反射光强度的波动,经过光电池转换为电信号,再进行相关处理。当可调延时τ等于钢带上某点在两个测试点之间经过所需的时间τd时,互相关函数为最大值。该钢带的运动速度v=d/τd。
图6-17是确定深埋在地下的输油管裂损位置的例子。漏损处K视为向两侧传播声响的声源,在两侧管道上分别放置传感器1和2,因为放传感器的两点距漏损处不等远,则漏油的音响传至两传感器就有时差,在互相关图上τ=τm处(τ)有最大值,这个τm就是时差。由τm就可确定漏损处的位置,即
s=vτm
式中 s——两传感器的中点至漏损处的距离; v——音响通过管道的传播速度。
由式(6-13)和式(6-19)所定义的相关函数只适用于各态历经随机信号和功率信号。对于能量有限信号的相关函数,其中的积分若除以趋于无限大时的随机时间T后,无论时移τ为何值,其结果都将趋于零。因此,对能量有限信号进行相关分析时,应按下面定义来计算,即
6.3.4 相关函数估计
按照定义,相关函数应该在无穷长的时间内进行观察和计算。实际上,任何的观察时间都是有限的,我们只能根据有限时间的观察值去估计相关函数的真值。理想的周期信号,能准确重复其过程,因此一个周期内的观察值的平均值就能完全代表整个过程的平均值。对于随机信号,可用有限时间内样本记录所求得的相关函数值来作为随机信号相关函数的估计。样本记录的相关函数,亦就是随机信号相关函数的估计值可分别由下式计算:
式中 T——样本记录长度。 为了简便,假定信号在(T+τ)上存在,则可用下两式代替式(6-23)和式(6-24),即
\
而且两种写法实际结果是相同的。
使模拟信号不失真地沿时轴平移是一件困难的工作。因此,模拟相关处理技术只适用于几种特定信号(如正弦信号)。在数字信号处理中,信号时序的增减就表示它沿时间轴平移,是一件容易做到的事。所以实际上相关处理都是用数字技术来完成的。对于有限个序列点N的数字信号的相关函数估计,仿照式(6-25)可写成
r=0,1,2,…,m<N 式中 m——最大时移序数。
6.4 功率谱分析及其应用
时域中的相关分析为在噪声背景下提取有用信息提供了途径。功率谱分析则为频域提供相关技术的信息,它是研究平稳随机过程的重要方法。
6.4.1 自功率谱密度函数
1. 定义及其物理意义
假定x(t)是零均值的随机过程,即μx=0(如果原随机过程是非零均值的,可以进行适当处理使其均值为零),那么当τ→∞,Rx(τ)→0。这样,自相关函数Rx(τ)可满足傅里叶变换的条件
利用式(2-28)和式(2-29)可得到Rx(τ)的傅里叶变换Sx(f)为
逆变换为
定义Sx(f)为x(t)的自功率谱密度函数,简称自谱或自功率谱。由于Sx(f)和Rx(τ)之间是傅里叶变换对的关系,两者是唯一对应的,Sx(f)中包含着Rx(τ)的全部信息。因为Rx(τ)为实偶函数,Sx(f)亦为实偶函数。由此常用在f=(0~∞)范围内Gx(f)=2Sx(f)来表示信号的全部功率谱,并把Gx(f)称为x(t)信号的单边功率谱(见图6-18)。
图6-18 单边谱和双边谱
若τ=0,根据自相关函数Rx(τ)和自功率谱密度函数Sx(f)的定义,可得到
由此可见,Sx(f)曲线下和频率轴所包围的面积就是信号的平均功率,Sx(f)就是信号的功率密度沿频率轴的分布,故称Sx(f)为自功率谱密度函数。
2. 帕塞瓦尔定理
在时域中计算的信号总能量,等于在频域中计算的信号总能量,这就是帕塞瓦尔定理,即
式(6-30)又叫作能量等式。这个定理可以用傅里叶变换的卷积公式导出。
设x(t)⇌X(f), h(t)⇌H(f),按照频域卷积定理有x(t)h(t)⇌X(f)*H(f),即
令q=0,得
又令h(t)=x(t),得
x(t)是实函数,则X(-f)=X*(f),所以
|X(f)|2称为能谱,它是沿频率轴的能量分布密度。在整个时间轴上信号平均功率为
因此,并根据式(6-29),自功率谱密度函数和幅值谱的关系为
利用这一种关系,就可以通过直接对时域信号进行傅里叶变换来计算功率谱。
3. 功率谱的估计
无法按式(6-31)来计算随机过程的功率谱,只能用有限长度T的样本记录来计算样本功率谱,并以此作为信号功率谱的初步估计值。现以 分别表示双边、单边功率谱的初步估计,即
对于数字信号,功率谱的初步估计为
也就是对数字信号序列{x(n)}进行DFT运算,取其模的二次方,再除以N(或乘以2/N),便可得信号的功率谱初步估计。这种计算功率谱估计的方法称为周期图法。它也是一种最简单、常用的功率谱估计算法。
可以证明:功率谱的初步估计不是无偏估计,估计的方差为
这就是说,估计的标准差和被估计量Gx(f)一样大。在大多数的应用场合中,如此大的随机误差是无法接受的,这样的估计值自然是不能用的。这也就是上述功率谱估计使用“~”符号而不是“∧”符号的原因。
为了减小随机误差,需要对功率谱估计进行平滑处理。最简单且常用的平滑方法是“分段平均”。这种方法是将原来样本记录长度T总分成q段,每段时长T=T总/q。然后对各段分别用周期图法求得其功率谱初步估计 最后求诸段初步估计的平均值,并作为功率谱估计值 ,即
不难理解,这种平滑处理实际上是取q个样本中同一频率f的谱值的平均值。
当各段周期图不相关时,
可见,所分的段数q越多,估计方差越小。但是,当原始信号的长度一定时,所分的段数q越多,则每段的样本记录越短,频率分辨率会降低,并增大偏度误差。通常应先根据频率分辨率的指标Δf,选定足够的每段分析长度T,然后根据允许的方差确定分段数q和记录总长T总。为进一步增大平滑效果,可使相邻各段之间重叠,以便在同样T总之下增加段数。
谱分析是信号分析与处理的重要内容。周期图法属于经典的谱估计法,是建立在FFT的基础上的,计算效率很高,适用于观测数据较长的场合。这种场合有利于发挥计算效率高的优点又能得到足够的谱估计精度。对短记录数据或瞬变信号,此种谱估计方法无能为力,可以选用其他方法。
4. 应用
自功率谱密度Sx(f)为自相关函数Rx(τ)的傅里叶变换,故Sx(f)包含着Rx(τ)中的全部信息。自功率谱密度Sx(f)反映信号的频域结构,这一点和幅值谱|X(f)|一致,但是自功率谱密度所反映的是信号幅值的二次方,因此其频域结构特征更为明显,如图6-19所示。
对于一个线性系统(见图6-20),若其输入为x(t),输出为y(t),系统的频率响应函数H(f),x(t)⇌X(f),y(t)⇌Y(f),则
Y(f)=H(f)X(f)(6-36)
不难证明,输入、输出的自功率谱密度与系统频率响应函数的关系为
Sy(f)=|H(f)|2Sx(f)(6-37)
通过对输入、输出自谱的分析,就能得出系统的幅频特性。但是在这样的计算中丢失了相位信息,因此不能得出系统的相频特性。
自相关分析可以有效地检测出信号中有无周期成分。自功率谱密度也能用来检测信号中的周期成分。周期信号的频谱是脉冲函数,在某特定频率上的能量是无限的。但是在实际处理时,用矩形窗函数对信号进行截断,这相当于在频域用矩形窗函数的频谱sinc函数和周期信号的频谱δ函数实行卷积,因此截断后的周期函数的频谱已不再是脉冲函数,原来为无限大的谱线高度变成有限长,谱线宽度由无限小变成有一定宽度。所以周期成分在实测的功率谱密度图形中以陡峭有限峰值的形态出现。
6.5 现代信号分析方法简介
本节简单介绍一些现代信号分析和处理方法,详细内容请参考有关书籍。
6.5.1 功率谱估计的现代方法
1. 非参数方法
(1)多窗口法(MultiTaper Methool MTM) MTM是使用多个正交窗口以获取相互独立的谱估计,然后把它们合成为最终的谱估计。这种估计方法比经典非参数谱估计法具有更大的自由度和较高的精度。
(2)子空间方法 子空间方法又称为高分辨率方法。这种方法在相关矩阵特征分析或特征分解的基础上,产生信号的频率分量估计。如多重信号分类法(Multiple Signal Classification MUSIC)或特征向量法(EV)。此法检测埋藏在噪声中的正弦信号(特别是信噪比低时)是有效的。
2. 参数方法
参数方法是选择一个接近实际样本的随机过程的模型,在此模型的基础上,从观测数据中估计出模型的参数,进而得到一个较好的谱估计值。此方法与经典功率谱估计方法相比,特别是对短信号,可以获得更高的频率分辨率。参数方法主要包括AR模型、MA模型、ARMA模型和最小方差功率谱估计等。通过模型分析的方法来做谱估计,预先要解决的是模型的参数估计问题。
6.5.2 时频分析
时域分析可以使我们了解信号随时间变化的特征,频域分析体现的是信号随频率变化的特征,两者都不能同时描述信号的时间和频率特征,这时就要用到时频分析。
对于工程中存在的非平稳信号,在不同的时刻,信号具有不同的谱特征,时频分析是非常有效的分析方法。时频分析的目的是建立一个时间-频率二维函数,要求这个函数不仅能够同时用时间和频率描述信号的能量分布密度,还能够体现信号的其他一些特征量。
1. 短时傅里叶变换(STFT)
短时傅里叶变换的基本思想:把非平稳的长信号划分成若干段小的时间间隔,信号在每一个小的时间间隔内可以近似为平稳信号,用傅里叶变换分析这些信号,就可以得到在那个时间间隔的相对精确的频率描述。
短时傅里叶变换的时间间隔划分并不是越细越好,因为划分就相当于加窗,这会降低频率分辨率并引起谱泄漏。由于短时傅里叶变换的基础仍是傅里叶变换,虽能分析非平稳信号,但更适合分析准平稳信号。
2. 小波变换
小波变换是20世纪80年代中后期发展起来的一门新兴的应用数学分支,近年来已被引入工程应用领域并得到广泛应用。小波变换具有多分辨特性,通过适当地选择尺度因子和平移因子,可得到一个伸缩窗,只要适当地选择基本小波,就可使小波变换在时域和频域都具有表征信号局部特征的能力,在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于探测正常信号中夹带的瞬态反常现象并展示其成分。
3. Wigner-Ville分布
短时傅里叶变换和小波变换本质上都是线性时频表示,它不能描述信号的瞬时功率谱密度,虽然Wigner-Ville分布也是被直接定义为时间与频率的二维函数,但它是一种双线性变换。Wigner-Ville分布是最基本的时频分布,由它可以得到许多其他形式的时频分布。
6.5.3 统计信号处理
在大多数情况下,信号往往混有随机噪声。由于信号和噪声的随机特性,需要采用统计的方法来分析处理,这就使得数学上的概率统计理论方法在信号处理中得以应用,并演化出统计信号处理这一领域。
统计信号处理涉及如何利用概率模型来描述观测信号和噪声的问题,这种信号和噪声的概率模型往往需信息的函数,而信息则由一组参数构成,这组参数是通过某个优化准则从观测数据中得来的。显然,用这种方法从数据中得到的所需信息的精确程度,取决于所采用的概率模型和优化原理。在统计信号处理中,常用的信号处理模型包括高斯随机过程模型、马尔可夫随机过程模型和α稳定分布随机信号模型等。而常用的优化准则包括最小二乘(LS)准则、最小均方(LMS)准则、最大似然(ML)准则和最大后验概率(MAP)准则等。在上述概率模型和优化准则的基础上,出现了许多统计信号处理算法,包括维纳滤波器、卡尔曼滤波器、最大熵谱估计算法和最小均方自适应滤波器等。
上理考研周导师的哔哩哔哩频道
我在频道里讲课哦