一种基于小波包能量的非空气传导语音增强方法

文档序号:2831985阅读:324来源:国知局
专利名称:一种基于小波包能量的非空气传导语音增强方法
技术领域
本发明属于语音信号的探测与采集及语音增强技术领域,特别涉及一 种基于小波包能量的非空气传导语音增强方法。
背景技术
语音的非空气传导探测技术是指利用除空气以外的其它介质来传导 声音。大量的实验数据表明,采用雷达波探测出来的语音信号干扰成分, 要比采用普通声学传感器复杂得多。其干扰主要来自以下几个方面(a) 目标说话时的体动干扰。如说话时的头部运动、手势、口唇运动、心跳、 呼吸等;(b)雷达波的各次谐波、信道噪声及语音探测系统硬件本身的 附加噪声;(c)外界环境噪声的干扰,这些噪声信号成份复杂,幅度更 强,且多与语音信号频谱相混叠,严重影响了语音信号的质量。因此,对 于在对所采集雷达语音信号进行特性分析的基础上,有针对性地进行语音 的去噪增强,也是一项十分重要的工作。

发明内容
本发明的目的在于基于非空气传导语音存在的缺陷与不足,提供一种 基于小波包能量的非空气传导语音增强方法,该方法能够弥补传统语音增 强方法针对性不强的弱点,且执行效率高,效果明显,因此具有较强的实 用价值和应用前景。
为达到上述目的,本发明采用的技术方案是
1)首先,对雷达非空气传导的语音信号采样并做A/D转换,进行数字 化处理得到带噪语音信号,其采样速率为5KHz 20KHz;2) 其次,对带噪语音信号进行小波包分解;
3) 然后,分别基于尺度和时间计算小波包系数的自适应阈值;
4) 最后,利用自适应阈值进行小波包系数更新,并进行小波包重构
以恢复增强后的语音信号。
所说的对带噪语音信号进行小波包分解的步骤如下
设带噪语音信号y(n)由纯净语音信号s(n)与噪声信号d(n)叠加而
成,即<formula>formula see original document page 6</formula>选择小波函数,对带噪语音信号y (n)经j层小波包变换后得到2J个子 带小波系数,j^1,其中第k个子带中第m个小波系数值为M^,并将小
波分阶层数设为4层,
<formula>formula see original document page 6</formula>
所说的基于尺度和时间计算小波包系数自适应阈值的方法如下-. 1)首先,计算全局小波消噪阈值A,其计算公式为
<formula>formula see original document page 6</formula>
式中o为噪声信号的噪声水平,N为噪声信号的信号长度,MAD为小 波系数绝对值的中值,MAD的取值由第1个尺度小波系数得到,将以上公 式扩展至小波包变换,即得到基于尺度的自适应阈值,其中小波包变换第 k个子带的阈值Ak为
式中Ok为第k个子带的噪声水平,Nk为第k个子带的信号长度,MADk 为第k个子带小波系数w^绝对值的中值;其次,根据以下公式得到小波包系数的Teager能j
,7
《m =[W(J2
(5)
经过Teager能量计算后采用二阶低通巴特沃思IIR滤波器/^附;)对 Teager能量滤波并归一化,得到时间自适应掩模M^ :
(6)
由于含有语音成分的帧其Teager能量值波动较大,因此对第k个子 带Teager能量掩模JV^分帧并作直方图分析,根据当前帧M^的偏移值《
区分语音帧和噪声帧;
血"'咖[/Z(M(』 (7) 上式中H表示M^的直方图分布,abscissa!^]函数表示直方图分布 最大值的横坐标值,即Teager能量最集中的值,若《<0. 35则第k个子 带当前帧为语音帧,禾!J用S对A^进行修正即可得到最终的时间自适应阈
《=
《-《
0
(8)
若S/<0.35 若《2 0.35
最后,禾,式(8)得到的时间自适应阈值对式(4)得到的尺度自适应阈 值进行修正,即可得到第k个子带的时间-尺度自适应阈值L :
根据小波阈值消噪原理,将由上式计算得到的阈值代入软阈值消噪公
式,
r麵卜、,"、L 其中rs(义,A)为软阈值,由此得到消噪后的小波系数W^
(10)《m-^(^-W;) (11) 所说的利用更新后的小波包系数的自适应阈值进行小波包重构以恢 复增强后的语音信号是根据小波包分解所使用的小波函数和层数,禾拥消 噪后的小波系数^;,运用重构滤波器重构出增强后的语音信号
S(")-附K衍,奵 (12)
本发明应用小波包分析技术对语音信号进行分解与重构的基础上,对 分解后的小波包系数从尺度和时间两方面进行阈值自适应调节,再对此系 数进行重构以实现语音信号的噪声自适应消除,从而实现算法的有效性和 较强的针对性。采用这种方法的实例表明,这种新型非空气传导语音增强 方法能够有效弥补传统语音增强方法针对性不强的弱点,且执行效率高, 效果明显,因此具有较强的实用价值和应用前景。


图1为整个雷达非空气传导语音增强系统的结构框图 , 图2为对某段指定的语音信号,使用本发明所述方法之前和之后,及
与传统谱减法相比的雷达语音语谱图比较图。其中图2(a)为未增强语音的 语谱图,图2(b)为使用传统谱减法增强后的语音谱图;图2(c)为使用本发
明所述方法增强后语音的语谱图。
具体实施例方式
下面结合附图对本发明作进一步详细说明。
参见图l,本发明首先将接收到的雷达非空气传导语音信号进行数字
化处理后进行小波包变换l;对所获得的小波包系数进行两方面的处理 一是计算全局阈值2; 二是通过计算Teager能量算子3,进而计算二阶低通 滤波器4,从而生成时间自适应掩模5。利用所生成的时间自适应掩模5, 结合全局阈值2得到时间-尺度自适应阈值6。禾拥此时间-尺度自适应阈值对小波包系数进行阈值处理7,并经过小波包重构8得到增强后的语音。
其具体步骤如下-
1) 首先,对雷达非空气传导的语音信号采样并做A/D转换,进行数字 化处理得到带噪语音信号,其采样速率为5KHz 20KHz;
2) 其次,对带噪语音信号进行小波包分解;
设带噪语音信号y(n)由纯净语音信号s(n)与噪声信号d(n)叠加而 成,即
少0) = +(l)
选择小波函数,对带噪语音信号y (n)经j层小波包变换后得到2J个子 带小波系数,j^1,其中第k个子带中第m个小波系数值为w",并将小 波分阶层数设为4层,
< =附^(")4 (2)
3) 然后,分别基于尺度和时间计算小波包系数的自适应阈值; 其具体步骤如下首先,计算全局小波消噪阈值A,其计算公式

(7 = M4D/0.6745
式中o为噪声信号的噪声水平,N为噪声信号的信号长度,MAD为小 波系数绝对值的中值,MAD的取值由第1个尺度小波系数得到,将以上公 式扩展至小波包变换,即得到基于尺度的自适应阈值,其中小波包变换第 k个子带的阈值入k为
= M4iV 0.6745 式中o k为第k个子带的噪声水平,队为第k个子带的信号长度,MADk为第k个子带小波系数M^绝对值的中值;
其次,根据以下公式得到小波包系数的Teager能量4;<formula>formula see original document page 10</formula>
(5)
经过Teager能量计算后采用二阶低通巴特沃思IIR滤波器&(附)对 Teager能量滤波并归一化,得到时间自适应掩禾莫M^ :
<formula>formula see original document page 10</formula>
(6)
由于含有语音成分的帧其Teager能量值波动较大,因此对第k个子 带Teager能量掩模M^分帧并作直方图分析,根据当前帧M^的偏移值《
区分语音帧和噪声帧;
<formula>formula see original document page 10</formula>(7)
上式中H表示M^的直方图分布,abscissa[,]函数表示直方图分布 最大值的横坐标值,即Teager能量最集中的值,若《<0. 35则第k个子 带当前帧为语音帧,利用《对M^进行修正即可得到最终的时间自适应阈<formula>formula see original document page 10</formula>
(8)
若5/< 0.35 若《2 0.35
最后,禾拥式(8)得到的时间自适应阈值对式(4)得到的尺度自适应阈 值进行修正,即可得到第k个子带的时间-尺度自适应阈值& :
根据小波阈值消噪原理,将由上式计算得到的阈值代入软阈值消噪公
式,<formula>formula see original document page 10</formula>
(10)其中7^(义,4)为软阈值,由此得到消噪后的小波系数《 :
《=R(KW) (11)
4)最后,利用更新后的小波包系数的自适应阈值进行小波包重构以 恢复增强后的语音信号是根据小波包分解所使用的小波函数和层数,利用 消噪后的小波系数《 ,运用重构滤波器重构出增强后的语音信号
"")=胖-4《刀1 (12)
以下是发明人给出的实施例,但并不局限于这些实施例 一位男性在距离雷达式非空气传导语音探测仪前5米处以正常语速发
声,语音材料为"第四军医大学",语音时长为4 8秒。依下述步骤对此
语音做增强处理- 1) 对雷达非空气传导语音信号采样做A/D转换,采样速率为10KHz/秒;
2) 对数字化后的雷达语音进行带噪信号的小波包分解;
3) 计算基于尺度和时间的小波包系数自适应消噪阈值;
4) 进行小波包重构以恢复增强语音信号;
处理结果见图2:从图2(a)中可以看出,原始语音中携带有具有较强 能量的噪声,这些噪声在语音字句之间能够明显地观察到。图2(b)显示出 传统的谱减法能够有效地减少2 kHz以下的噪声,同时也能有效去除语音 间隙的噪声,但是不能够去除高频噪声。图2(c)示出本专利申请所述的基 于小波包能量的非空气传导语音增强方法的效果。它不仅能够减小语音及 其间隙中的低频噪声,而且能较完全地去除高频噪声。说明与传统谱减法 相比,基于小波包能量的非空气传导语音增强方法能够在全频率段内实现 较好的语音增强效果。同步开展的听觉感知实验也表明本专利所述方法能 够有效去除雷达语音的噪声,且不丢失语音信息。此外,与传统谱滤波方法相比,本方法能在去噪度、语音畸变度及残 留"音乐噪声"之间做出很好的折衷,这是因为算法能够同时在时间和频 域尺度动态地调整阈值,并进而自适应调整小波包系数。因此,无论是从 噪声谱估计还是语音谱估计上来看,该算法更能实时地自适应地跟踪语音 的变化,从而使得算法中的谱增益以及噪声谱估计更符合假设的语音模型 和人耳听觉特性,并在较大程度上提高了语音信号的可懂度。
本发明主要针对基于雷达的非空气传导语音增强,在一些特殊应用场 合中,也能够应用于其它语音增强领域(如机器人的声音),同时兼顾语 音信号分析及语音识别等学科领域的需要。
尽管本发明所论述的是针对基于雷达的非空气传导语音的增强方法, 但本发明的使用范围并不仅限于雷达式非空气传导语音信号的增强,对于 一些类似情况或相似条件下获取的语音信号(甚至其它声学信号),本发明 所述方法都具有重要的直接或间接的使用和借鉴价值;
本发明所述的语音增强方法主要针对一般的雷达语音噪声环境,对于
特殊的声学环境和过于嘈杂的声学背景则需要做有针对性的修改;
由于基于雷达的非空气传导语音的采集过程较传统语音采集过程复 杂,因此本发明所述方法所适用语音信号的质量还要受到前端采集电路的 影响,但大量的实验表明,本发明具有相当好的抗前端噪声影响的效果, 具有较广泛的适用性。
权利要求
1、一种基于小波包能量的非空气传导语音增强方法,其特征在于1)首先,对雷达非空气传导的语音信号采样并做A/D转换,进行数字化处理得到带噪语音信号,其采样速率为5KHz~20KHz;2)其次,对带噪语音信号进行小波包分解;3)然后,分别基于尺度和时间计算小波包系数的自适应阈值;4)最后,利用自适应阈值进行小波包系数更新,并进行小波包重构以恢复增强后的语音信号。
2、 根据权禾腰求l所述的基于小波包能量的非空气传导语音增强方法,其特征在于所说的对带噪语音信号进行小波包分解的步骤如下-设带噪语音信号y(n)由纯净语音信号s(n)与噪声信号d(n)叠加而 成,即<formula>formula see original document page 2</formula>选择小波函数,对带噪语音信号y (n)经j层小波包变换后得到2j个子 带小波系数,j》1,其中第k个子带中第m个小波系数值为w",并将小波分阶层数设为4层,<formula>formula see original document page 2</formula>
3、 根据权利要求1所述的基于小波包能量的非空气传导语音增强 方法,其特征在于所说的基于尺度和时间计算小波包系数自适应阈 值的方法如下1)首先,计算全局小波消噪阈值X,其计算公式为<formula>formula see original document page 2</formula>式中0为噪声信号的噪声水平,N为噪声信号的信号长度,MAD为小 波系数绝对值的中值,MAD的取值由第1个尺度小波系数得到,将以上公 式扩展至小波包变换,即得到基于尺度的自适应阈值,其中小波包变换第 k个子带的阈值"为 =M4Z^ / 0.6745(4)式中^为第k个子带的噪声水平,Nk为第k个子带的信号长度,MADk 为第k个子带小波系数vt^绝对值的中值;其次,根据以下公式得到小波包系数的Teager能量《 ,:《=1>(附]2-<战—w+1(5)经过Teager能量计算后采用二阶低通巴特沃思IIR滤波器/^m)对 Teager能量滤波并归一化,得到时间自适应掩模M":(6)麵(lo))由于含有语音成分的帧其Teager能量值波动较大,因此对第k个子 带Teager能量掩模M"分帧并作直方图分析,根据当前帧M^的偏移值^区分语音帧和噪声帧;(7)上式中H表示M"的直方图分布,abscissa[']函数表示直方图分布 最大值的横坐标值,即Teager能量最集中的值,若《<0. 35则第k个子 带当前帧为语音帧,利用S对M"进行修正即可得到最终的时间自适应阈值M'i《=《卜匁若S/<0.35 若&^0.35(8)最后,禾!」用式(8)得到的时间自适应阈值对式(4)得到的尺度自适应阈 值进行修正,即可得到第k个子带的时间-尺度自适应阈值^ :根据小波阈值消噪原理,将由上式计算得到的阈值代入软阈值消噪么、式,r麵)4柳")W一义)若W>A (10) L o若卜^义其中7H;i,^)为软阈值,由此得到消噪后的小波系数""
4、根据权利要求l或2或3所述的基于小波包能量的非空气传导语音增强方法,其特征在于所说的利用更新后的小波包系数的自适应阈值 进行小波包重构以恢复增强后的语音信号是根据小波包分解所使用的小 波函数和层数,利用消噪后的小波系数《 ,运用重构滤波器重构出增强后的语音信号(12)。
全文摘要
一种基于小波包能量的非空气传导语音增强方法,在应用小波包分析技术对语音信号进行分解与重构的基础上,对分解后的小波包系数从尺度和时间两方面进行阈值自适应调节,再对此系数进行重构以实现语音信号的噪声自适应消除,从而实现算法的有效性和较强的针对性。采用这种方法的实例表明,这种新型非空气传导语音增强方法能够有效弥补传统语音增强方法针对性不强的弱点,且执行效率高,效果明显,因此具有较强的实用价值和应用前景。
文档编号G10L21/00GK101625869SQ20091002355
公开日2010年1月13日 申请日期2009年8月11日 优先权日2009年8月11日
发明者盛 李, 明 牛, 王健琪, 荆西京 申请人:中国人民解放军第四军医大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1