本发明属于数字助听器,具体涉及一种应用于助听器的频域双通道语音增强方法。
背景技术:
1、基于双全向传声器阵列的传统频域gsc结构可以用图1表示,其方法流程描述如下:
2、假设前后传声器匹配且间距为d,声速以符号c来表示, 则前后传声器接收到的信号为语音与噪声经过混响后得到的混合信号,将时域信号分帧加窗,利用短时傅里叶变换(short-time fourier transform, stft)将每一帧输入信号转换到频域,得到的频域信号,k表示频率点数,l表示帧数:
3、
4、其中,与分别为纯净的语音信号和方向性的干扰噪声,二者的时域表示为和。与为语音源到两个传声器的传输函数,与为方向性干扰噪声到两个传声器的传输函数。与为两个传声器中不相关的本底噪声,通常情况下很小。
5、语音信号从声源至两传声器的传递函数可以分为两部分,
6、
7、等号右边第一项为直达声传递函数,主要产生时延,第二项是房间混响的传递函数,本文用表示语音信号到达两个传声器的时延,则发,假设语音信号与两传声器连线夹角为,则。
8、两通道信号经过fbf部分后得到语音参考信号,经过bm部分抵消语音信号后得到噪声参考信号,可表示为:
9、
10、其中,为fbf部分的权矢量,为bm部分的权矢量,将式(1)和式(2)带入上式可得:
11、
12、其中和表示前后传声器接收到的语音信号的混响成分,由于混响声的方向不定,产生的时延也与直达声不同,因此,中的混响成分无法完全保留,中的混响成分无法完全衰减,但总体上中的混响成分相较于更少。和为前后传声器接收到的干扰噪声,在二元阵中,fbf部分对非相关噪声有一定的抑制,但这种抑制效果很有限。由推导可知,中保留了直达语音成分,对混响语音和干扰噪声略有抑制,因此将其视为语音参考信号,中的主要成分为干扰噪声,将其视为噪声参考信号。
13、令每一帧的语音参考信号和每一帧的噪声参考信号分别表示和在所有k的取值上构成的行向量,则二者经过自适应的噪声抵消后可以得到增强后的信号,其经过短时傅里叶逆变换(inverse short-time fourier transform,istft)得到系统的最终输出,anc的权向量通过自适应方法确定。
技术实现思路
1、在助听器的日常使用环境中,干扰噪声与期望语音往往来自不同的方向,因此为了降低干扰噪声对助听器性能的影响,本发明设计一种具有指向性的语音增强方法,即应用自适应的多通道语音增强技术,以实现在复杂环境中实现指向模式的动态调整,提高助听器的消噪性能。
2、本发明提供一种应用于助听器的频域双通道语音增强方法,利用前后传声器接收语音与干扰经过混响后得到的混合信号,将时域信号分帧加窗,利用短时傅里叶变换将每一帧输入信号转换到频域,得到的频域信号,其中k表示频率点数,l表示帧数;两通道信号经过fbf部分后得到语音参考信号,,其中为fbf部分的权矢量;经过可选择的bm部分抵消语音信号后得到噪声参考信号,其中,b(k)为bm部分的权向量,其初始值设为,其中,表示语音信号到达两个传声器的时延;k表示频率点数,b(k)的实时值根据信号的相关性变化进行选择;令每一帧的语音参考信号和每一帧的噪声参考信号分别表示语音参考信号和噪声参考信号在所有的频率点数取值上构成的行向量与,根据二者的相关性进行变步长的自适应噪声抵消后得到增强后的信号,经过短时傅里叶逆变换得到最终输出;计算相关性前对语音参考信号进行信号补偿,以提升噪声部分的相关性;设置相关系数阈值,并认为相关系数小于相关系数阈值时,补偿后的语音参考信号与噪声参考信号的相关度较低,将其视为语音帧,否则为含有较多干扰成分的信号帧。
3、进一步的,还包括应用于anc部分的变步长nlms算法,策略为在噪声段选择较大的更新步长,进行权系数更新,加快滤波收敛速度,而在语音段选择较小的步长,不进行权系数更新,使算法输出与语音参考信号具有较小的稳态误差。
4、进一步的,所述信号补偿为令,以提升噪声部分的相关性,式中的为每一帧的语音参考信号,表示两通道信号经过fbf部分后得到语音参考信号在所有的频率点数取值上构成的行向量;为每一帧的噪声参考信号,表示两通道信号经过bm部分抵消语音信号后得到噪声参考信号在所有的频率点数取值上构成的行向量;为一常数;令表示第l帧的相关系数,其为与相关函数的归一化,且,则其用公式可以表示为:
5、 其中:
6、其中:
7、为一小于1的常数,是与互相关函数的平滑值,是自相关函数的平滑值,是 自相关函数的平滑值。
8、进一步的,所述相关系数阈值,并认为时与的相关度较低,将其视为语音帧,否则为含有较多噪声成分的信号帧:
9、。
10、进一步的,当时
11、其中,表示在所有k的取值上构成的行向量;为bm部分的权矢量;为将时域信号分帧加窗利用短时傅里叶变换将每一帧输入信号转换到频域得到的频域信号;表示语音信号到达两个传声器的时延;表示频率点数。
12、进一步的,步长调整过程为:
13、;其中, 表示自适应滤波器的权向量,表示第l帧的相关系数,,表示生成对角矩阵,表示转置,表示共轭转置,为一小于1的常数;为噪声参考信号经过自适应滤波器的输出信号;为语音参考信号和噪声参考信号能量和的平滑值。
14、本发明还提供一种助听器,其包括计算机程序,用于实现所述的应用于助听器的频域双通道语音增强方法。
15、有益效果:
16、与现有技术相比,本发明的应用于数字助听器的双全向传声器双通道语音增强方法,具有如下优点:
17、第一,由于语音的入射方位角未知,因此在传统gsc算法中被固定在0°,导致在系统时延估计不准确时,bm输出的语音泄露严重,影响后续的算法性能,因此,本发明提出了一种bm的改进方法,以减小时延估计不准确而产生的语音泄露。
18、第二,本发明将相关性较大的信号帧视为含有较多噪声成分的信号帧,选择较大的更新步长,加快系统收敛,反之则视为语音帧,选择较小的步长,减小系统稳态误差。
19、第三,通过实验,本发明的应用于数字助听器的双全向传声器双通道语音增强方法,输出信干比和短时客观可懂度相较于传统方法和对比方法都有一定提升,并且具有比较好的鲁棒性。
1.一种应用于助听器的频域双通道语音增强方法,其特征在于:利用前后传声器接收语音与干扰经过混响后得到的混合信号,将时域信号分帧加窗,利用短时傅里叶变换将每一帧输入信号转换到频域,得到的频域信号,其中k表示频率点数,l表示帧数;两通道信号经过fbf部分后得到语音参考信号,,其中为fbf部分的权矢量;经过可选择的bm部分抵消语音信号后得到噪声参考信号,其中,b(k)为bm部分的权向量,其初始值设为,其中,表示语音信号到达两个传声器的时延;k表示频率点数,b(k)的实时值根据信号的相关性变化进行选择;令每一帧的语音参考信号和每一帧的噪声参考信号分别表示语音参考信号和噪声参考信号在所有的频率点数取值上构成的行向量与,根据二者的相关性进行变步长的自适应噪声抵消后得到增强后的信号,经过短时傅里叶逆变换得到最终输出;计算相关性前对语音参考信号进行信号补偿,以提升噪声部分的相关性;设置相关系数阈值,并认为相关系数小于相关系数阈值时,补偿后的语音参考信号与噪声参考信号的相关度较低,将其视为语音帧,否则为含有较多干扰成分的信号帧。
2.根据权利要求1所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:还包括应用于anc部分的变步长nlms算法,策略为在噪声段选择较大的更新步长,进行权系数更新,加快滤波收敛速度,而在语音段选择较小的步长,不进行权系数更新,使算法输出与语音参考信号具有较小的稳态误差。
3.根据权利要求1所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:所述信号补偿为令,以提升噪声部分的相关性,式中的为每一帧的语音参考信号,表示两通道信号经过fbf部分后得到语音参考信号在所有的频率点数取值上构成的行向量;为每一帧的噪声参考信号,表示两通道信号经过bm部分抵消语音信号后得到噪声参考信号在所有的频率点数取值上构成的行向量;为一常数;令表示第l帧的相关系数,其为与相关函数的归一化,且,则其用公式可以表示为:
4.根据权利要求2所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:所述相关系数阈值,并认为时与的相关度较低,将其视为语音帧,否则为含有较多噪声成分的信号帧:
5.根据权利要求3所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:当时
6.根据权利要求2所述的一种应用于助听器的频域双通道语音增强方法,其特征在于:步长调整过程为:;其中, 表示自适应滤波器的权向量,表示第l帧的相关系数,,表示生成对角矩阵,表示转置,表示共轭转置,为一小于1的常数;为噪声参考信号经过自适应滤波器的输出信号;为语音参考信号和噪声参考信号能量和的平滑值。
7.一种助听器,其特征在于:包括计算机程序,用于实现如权利要求1所述的一种应用于助听器的频域双通道语音增强方法。