本发明属于语音处理技术领域,具体涉及到将房间混响看作数字滤波器,通过倒谱滤波将激励信号与混响参数分离的混响参数估计方法。
背景技术
当声波在室内传播时,要被墙壁、天花板、地板等障碍物反射,而且每反射一次,声波的能量都要被障碍物吸收一些。当声源停止发声后,声波在室内要经过多次反射和吸收,持续一段时间才消失。这种室内声源停止发声后,反射声仍然存在的声延续现象叫做混响,这段时间叫做混响时间。
当语音处理系统位于室内时,也会受到室内混响的影响。此时,麦克风不仅收到说话人或扬声器发出的直达语音,还会收到由房间墙壁反射得到的语音的各次反射声。这会给语音识别、说话人识别等应用系统带来不利影响。
技术实现要素:
发明目的:针对现有技术中存在的问题,本发明提供一种基于倒谱滤波的混响参数估计方法,将混响对室内声波的影响,看作是数字滤波的过程,直射声和反射声分别相当于输入信号及其时域延迟信号,各次反射声的反射系数相当于滤波器的系数。因此,只要能估计出房间滤波器的系数,就可以构建逆滤波器,消除室内混响的影响。
技术方案:一种基于倒谱滤波的混响参数估计方法,首先用内置的扬声器发出1000hz的激励信号;其次,对麦克风接收的音频信号做快速傅里叶变换(fft:fastfouriertransform)、对数运算和离散余弦变换(dct:discretecosinetransform),得到混响信号的倒谱参数;然后,对倒谱参数进行滤波,从混响信号的倒谱参数中分离出房间滤波器的倒谱参数;最后,通过逆离散余弦变换(idct:inversediscretecosinetransform)、指数变换和快速傅里叶逆变换(ifft:inversefastfouriertransform),得到房间的混响参数。
本发明的具体步骤如下:
(1)用系统内置的扬声器发出1000hz的激励信号,激励信号经过房间调制后,生成混响音频信号,激励信号可以是单频正弦信号,也可以是其他周期信号;
(2)对麦克风接收的混响音频信号加窗,分帧,得到帧信号;
(3)对每一帧混响音频信号进行快速傅里叶变换,得到其幅度谱和相位谱;
(4)对混响音频信号的幅度谱进行对数变换和离散余弦变换,得到其倒谱特征参数;
(5)对混响音频信号的倒谱特征参数进行滤波,分离出房间滤波器的倒谱参数;
(6)对房间滤波器的倒谱参数进行idct,指数变换和ifft,得到房间的混响参数。
本发明采用上述技术方案,具有以下有益效果:
本发明可以快速测量房间的混响参数,构建逆滤波器,减小室内混响对语音处理系统的影响。
附图说明
图1为本发明实施例的基于倒谱滤波的混响参数估计方法的总体框架图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,一种基于倒谱滤波的混响参数估计方法,包括预处理、fft、取对数、dct、倒谱滤波、idct、取指数和ifft几个部分。下面详细说明本发明的具体实施方案。
1、预处理
系统的采样扬声器发出1000hz的激励信号,窗口类型为海明窗,窗口长度为5000,帧移为2000。窗口长度应该与混响时间相匹配。
2、fft
对混响音频信号进行快速傅里叶变换,得到其幅度谱和相位谱。
设周期激励信号为s(n),则其经过房间滤波器h(n)滤波后,可以得到混响音频信号x(n):
x(n)=s(n)*h(n)(1)
其中,符号“*”表示离散卷积。
对x(n)做fft,可以得到混响音频信号x(n)的频谱x(k):
x(k)=s(k)·h(k)(2)
其中,s(k)和h(k)分别表示s(n)和h(n)的频谱。
3、取对数与dct
对混响音频信号的幅度谱进行对数变换和离散余弦变换,得到其倒谱特征参数。
在式(2)两边分别取模,并取对数,可得:
log|x(k)|=log|s(k)|+log|h(k)|(3)
在式(3)两边分别进行离散余弦变换,可得:
其中,
4、倒谱滤波
因为激励信号s(n)是周期信号,所以其倒谱
房间滤波器的倒谱
5、混响参数估计
首先对估得的房间滤波器的倒谱特征