语音增强方法及装置的制造方法_2

文档序号:8261289阅读:来源:国知局
r>[0043] 所述语音T-F单元和噪声T-F单元具有一一对应关系;
[0044]S300、将各个语音T-F单元的特征值和经掩蔽后的噪声T-F单元的特征值进行比 较,并以比值为依据得到各个语音T-F语音单元相对应的掩蔽值,然后根据得到的掩蔽值 进行相应的掩蔽处理;进行对比的语音T-F单元和噪声T-F单元具有一一对应关系;
[0045]S400、对经过掩蔽处理后的N个语音T-F单元进行合成,以获得最终的增强语音信 号。
[0046] 具体实施时,所述步骤S200中所述的特征值包括IID、ITD中的至少一种,下面对 IID和ITD详细阐述:
[0047]ITD,即双耳延时差(interauraltimedifferences),指的是到达两个采集点的 语音在延时上存在的差异,当采集到的为带噪语音信号时,只要不是相对于麦克在同一个 方位,那么目标声源的语音信号和周围的环境噪声到达两个采集点的延时差异则不相同。 若只有目标声源的语音信号时,从两个采集点采集到的延时差由目标声源的语音信号造 成,同样,若只有噪声时,从两个采集点采集到的延时差由噪声造成。若信号为目标声源的 语音信号和周围环境噪声混杂时,那么从两个采集点采集到的延时差主要体现较强的那一 路信号的延时差。
[0048]ITD的计算公式如下:
【主权项】
1. 语音增强方法,其特征在于,包括: 步骤一、从多个不同的空间位置采集多路带噪语音信号; 步骤二、对所述带噪语音信号进行初步语音增强,W获得初步增强语音信号,然后对 所述初步增强语音信号进行分频和加窗逐峽处理,将其分割为N个语音T-F单元,并提取每 个语音T-F单元中的特征值; 同时,对所述带噪语音信号进行分频和加窗逐峽处理,W得到N个噪声T-F单元,提取 每个噪声T-F单元的特征值并将其和设定值进行对比,根据比值确定各个噪声T-F单元对 应的掩蔽值,然后进行相应的掩蔽处理,W获得噪声参考信号; 所述语音T-F单元和噪声T-F单元具有一一对应关系; 步骤H、将每个语音T-F单元的特征值和其对应的经掩蔽后的噪声T-F单元的特征值 进行比较,并W比值为依据得到每个语音T-F语音单元相对应的掩蔽值,然后根据得到的 掩蔽值进行相应的掩蔽处理; 步骤四、对经过掩蔽处理后的N个语音T-F单元进行合成,W获得最终的增强语音信 号。
2. 根据权利要求1所述的语音增强方法,其特征在于,所述步骤二中所述的特征值包 括IID和/或ITD。
3. 根据权利要求2所述的语音增强方法,其特征在于,处于高频段的噪声/语音T-F单 元提取IID,处于低频段的噪声/语音T-F单元提取口D,所述的高频段和低频段的分界线 为 1. 5KHz。
4. 根据权利要求2或3所述的语音增强方法,其特征在于,所述IID和掩蔽值的关系 为: Mask gram(i, j)=l, if IID > 2 Mask gram(i, j)=0. 5, ifl. 2 < IID < 2 Mask gram(i, j)=0. 3, ifl < IID < 1. 2 Mask gram(i, j) =0. 01, else 其中,Mask gram(i,_1.)表示第i个时峽、第j个频带的噪声/语音T-F单元所对应的 掩蔽值。
5. 根据权利要求1、2或3所述的语音增强方法,其特征在于,在所述步骤一中还包括追 踪定位目标声源的步骤。
6. 语音增强装置,其特征在于,包括: 语音采集模块:用于从多个不同的空间位置采集多路带噪语音信号; 语音增强模块:用于对所述语音采集模块采集到的带噪语音信号进行初步语音增强, 获得初步增强语音信号; 第一人耳滤波模块:用于对所述语音增强模块中输出的初步增强语音信号进行分频和 加窗逐峽处理,形成N个语音T-F单元; 第一特征提取模块:用于提取每个语音T-F单元的特质值; 噪声参考模块:包括第二人耳滤波模块、第二特征提取模块、第二特征比较模块及第二 掩蔽模块;所述第二人耳滤波模块用于对带噪语音信号进行分频和加窗逐峽处理,W形成 N个噪声T-F单元,所述第二特征提取模块用于提取每个噪声T-F单元的特征值,所述第二 特征比较模块用于将每个噪声T-F单元的特征值和设定值进行对比,并根据比值确定每个 噪声T-F单元对应的掩蔽值,所述第二掩蔽模块用于对各噪声T-F单元进行掩蔽处理,W获 得噪声参考信号; 第一特征比较模块;对语音T-F单元的特征值和所述噪声参考信号中的相应的噪声 T-F单元的特征值进行比较,根据比值确定每个语音T-F单元对应的掩蔽值; 第一掩蔽模块:根据所述第一特征比较模块得到的掩蔽值,对相应的语音T-F单元进 行掩蔽处理; 语音信号重建模块:对经过第一掩蔽模块处理后的N个语音T-F单元进行合并,形成增 强后的语音信号用于输出。
7. 根据权利要求6所述的语音增强装置,其特征在于,所述特征值包括IID和/或ITD。
8. 根据权利要求7所述的语音增强方法,其特征在于,处于高频段的噪声/语音T-F单 元提取IID,处于低频段的噪声/语音T-F单元提取口D,所述的高频段和低频段的分界线 为 1. 5KHz。
9. 根据权利要求7或8所述的语音增强方法,其特征在于,所述IID和掩蔽值的关系 为: Mask gram(i, j)=l, if IID > 2 Mask gram(i, j)=0. 5, ifl. 2 < IID < 2 Mask gram(i, j)=0. 3, ifl < IID < 1. 2 Mask gram(i, j) =0. 01, else 其中,Mask gram(i, _1.)表示第i个时峽、第j个频带的噪声/语音T-F单元所对应的 掩蔽值。
10. 根据权利要求6所述的语音增强装置,其特征在于,还包括目标声源追踪模块,用 于确定目标声源的位置。
【专利摘要】本发明公开了一种语音增强方法及装置,该方法包括步骤:从多个不同的空间位置采集多路带噪语音信号,根据采集到的带噪语音信号得到初步增强语音信号和噪声参考信号,再将初步增强语音信号和噪声参考信号进行特征值的对比,以对比的比值为依据,对初步增强语音信号进行掩蔽处理,并得到最终的增强语音信号,用于输出。本发明实现了语音信号的360°的全面覆盖,并且信噪比相比于传统的噪声抑制方法(如广义旁瓣对消)提升了5-10dB,在多噪声环境下,能更加有效的对噪声掩蔽,对目标声源的语音信号进行增强,保证较高的语音质量。
【IPC分类】G10L21-0208
【公开号】CN104575511
【申请号】CN201310499826
【发明人】陈卓, 席金苗
【申请人】陈卓, 席金苗
【公开日】2015年4月29日
【申请日】2013年10月22日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1