语音信号处理方法及装置制造方法

文档序号：2825404阅读：198来源：国知局

语音信号处理方法及装置制造方法
【专利摘要】本发明公开了一种语音信号处理方法及装置，其中，该方法包括：获取语音信号帧的能量分布特性；根据该能量分布特性判断该语音信号帧是否为噪声帧。通过本发明，解决了相关技术中对变化较快的非平稳噪声的判别效果较差的问题，提高了对语音信号中噪声帧的判断准确性。
【专利说明】语音信号处理方法及装置
【技术领域】
[0001]本发明涉及通信领域，具体而言，涉及一种语音信号处理方法及装置。
【背景技术】
[0002]目前在生活中，人们对移动终端的语音通话功能及通话质量的要求越来越高，然而现实生活中的通话过程往往会受到背景噪声的干扰，尤其是一些公共场合如车站、广场、街道等。这些非平稳的强噪声对通话质量和语音清晰度有很大的影响，而传统的语音增强算法通常只针对平稳的或者变化很慢的噪声具有较好的效果，但是对变化较快的非平稳噪声的抑制效果很不理想，而且还会在抑制噪声的同时损失语音的清晰度。为了加强对背景噪声的跟踪和估计，相关技术中存在如下几种方法:
[0003]第一种，Donoho提出了典型阈值法，Donoho通过分析高斯白噪声在小波域的特征，根据经验和统计特性在小波域人为的设定一个阈值来区分噪声和实际信号。但是实际中噪声和语音并没有一个明显的阈值界限。
[0004]第二种，基于语音活动检测的方法，研究人员发现一段语音的最开始阶段是完全由背景噪声组成的，可以用这一段信号作为噪声的估计样本，并且通过语音活动检测，提取出语音间隔处的信号进行噪声样本更新。但是这同样是一种粗略的提取，只能跟踪变化缓慢的噪声信号。
[0005]这些方法都会造成语音帧和噪声帧的误判，从而产生一定的语音失真。
[0006]此外，为了提高带噪语音的清晰度，现有的技术如下:
[0007]第一种，基于清浊音判定的语音增强算法，在去噪前首先进行清浊音判定，清音集中了大部分语音的高频信号，是影响语音清晰度的主要成分，所以设置一个较低的阈值，对浊音设置一个稍大的阈值去除大部分噪声成分。但是在背景噪声较大的时候，清音往往被噪声淹没。
[0008]第二种，基于人耳掩蔽效应的去噪算法，通过计算估计掩蔽模型的阈值，对语音进行阈值去噪。但是在计算掩蔽阈值时就存在偏差，并且计算量会增加很多，增加了手机的运算负担。
[0009]这些算法虽然都起到了一定的效果，但是都很难针对每一帧语音内的噪声进行精确处理。
[0010]针对相关技术中对变化较快的非平稳噪声的判别效果较差的问题，目前尚未提出有效的解决方案。

【发明内容】

[0011]针对相关技术中对变化较快的非平稳噪声的判别效果较差的问题，目前尚未提出有效的解决方案，本发明提供了一种语音信号处理方法及装置，以至少解决上述问题。
[0012]根据本发明的一个方面，提供了一种语音信号处理方法，包括:获取语音信号帧的能量分布特性；根据所述能量分布特性判断所述语音信号帧是否为噪声帧。[0013]优选地，根据所述能量分布特性判断所述语音信号帧是否为噪声帧包括:判断所述语音信号帧的能量分布是否集中；在判断结果为否的情况下，确定所述语音信号帧为噪声帧。
[0014]优选地，判断所述语音信号帧的能量分布是否集中包括:计算所述语音信号帧的频域语音峰的个数；在所述个数大于第一预定阈值的情况下，确定所述语音信号帧的能量分布不集中。
[0015]优选地，判断所述语音信号帧的能量分布是否集中包括:计算所述语音信号帧的VPER ;在所述VPER小于第二预定阈值的情况下，确定所述语音信号帧的能量分布不集中；
V/V,
其中
【权利要求】
1.一种语音信号处理方法,其特征在于,包括: 获取语音信号帧的能量分布特性；根据所述能量分布特性判断所述语音信号帧是否为噪声帧。
2.根据权利要求1所述的方法，其特征在于，根据所述能量分布特性判断所述语音信号中贞是否为噪声帧包括: 判断所述语音信号帧的能量分布是否集中；在判断结果为否的情况下，确定所述语音信号帧为噪声帧。
3.根据权利要求2所述的方法，其特征在于，判断所述语音信号帧的能量分布是否集中包括: 计算所述语音信号帧的频域语音峰的个数；在所述个数大于第一预定阈值的情况下，确定所述语音信号帧的能量分布不集中。
4.根据权利要求2或3所述的方法，其特征在于，判断所述语音信号帧的能量分布是否集中包括: 计算所述语音信号帧的语音峰能量比VPER ；在所述VPER小于第二预定阈值的情况下，确定所述语音信号帧的能量分布不集中；其
SPF中，mR = ，SPEl为第一语音峰能量，spE2为第二语音峰能量。
5.根据权利要求4所述的方法，其特征在于，所述语音峰能量通过以下公式计算:S叹=，其中ENGi为第i子带能量，a和b分别为所述语音峰所占频带两端的子带。
i=a
6.根据权利要求1至5中任一项所述的方法，其特征在于，在根据所述能量分布特性判断所述语音信号帧是否为噪声帧之后，还包括: 根据所述语音信号帧的子带能量获取所述语音信号帧的子带信噪比；根据所述子带信噪比对所述语音信号帧进行自动增益。
7.根据权利要求6所述的方法，其特征在于，根据所述子带信噪比对所述语音信号帧进行自动增益包括: 调整所述语音信号帧的自动增益系数随着所述子带信噪比的减小而减小，以及随着所述子带信噪比的增大而增大。
8.根据权利要求7所述的方法，其特征在于，调整所述语音信号帧的自动增益系数随着所述子带信噪比的减小而减小，以及随着所述子带信噪比的增大而增大包括: RcUio = Omxe且

? ,,.Raiio (jctn1--S.中，
Ration] ,、1， Gain为信号幅度增益；Ratio为信号增益相关系数；ES (m, i)为第m帧信号第i个子带的能量；SNRs(i，j)为第i帧第j个子带的子带信噪比。
9.一种语音信号处理装置，其特征在于，包括: 第一获取模块，用于获取语音信号帧的能量分布特性；判断模块，用于根据所述能量分布特性判断所述语音信号帧是否为噪声帧。
10.根据权利要求9所述的装置，其特征在于，所述判断模块包括: 判断单元，用于判断所述语音信号帧的能量分布是否集中；第一确定单元，用于在所述判断单元的判断结果为否的情况下，确定所述语音信号帧为噪声中贞。
11.根据权利要求10所述的装置，其特征在于，所述判断单元包括: 第一计算单元，用于计算所述语音信号帧的频域语音峰的个数；第二确定单元，用于在所述第一计算单元计算出的所述个数大于第一预定阈值的情况下，确定所述语音信号帧的能量分布不集中。
12.根据权利要求10或11所述的装置，其特征在于，所述判断单元包括: 第二计算单元，用于计算所述语音信号帧的语音峰能量比VPER ；第三确定单元，用于在所述第二计算单元计算出的所述VPER小于第二预定阈值的情况下，确定所述语音信号帧的能量分布不集中。
13.根据权利要求9至12中任一项所述的装置，其特征在于，所述装置还包括: 第二获取模块，用于根据所述语音信号帧的子带能量获取所述语音信号帧的子带信噪比；自动增益模块，用于根据所述第二获取模块获取的所述子带信噪比对所述语音信号帧进行自动增益。
14.一种语音信号处理方法,其特征在于,包括: 根据语音信号帧的子带能量获取所述语音信号帧的子带信噪比；根据所述子带信噪比对所述语音信号帧进行自动增益。
15.根据权利要求14所述的方法，其特征在于，根据所述子带信噪比对所述语音信号帧进行自动增益包括: 调整所述语音信号帧的自动增益系数随着所述子带信噪比的减小而减小，以及随着所述子带信噪比的增大而增大。
16.根据权利要求15所述的方法，其特征在于，调整所述语音信号帧的自动增益系数随着所述子带信噪比的减小而减小，以及随着所述子带信噪比的增大而增大包括: Ratio = 0mxeSNmKi}^}\ 且

9 P.Kaiio Gam =-苴中,
Rado + ] /、丫’ Gain为信号幅度增益；Ratio为信号增益相关系数；ES (m, i)为第m帧信号第i个子带的能量；SNRs(i，j)为第i帧第j个子带的子带信噪比。
17.一种语音信号处理装置，其特征在于，包括: 第三获取模块，用于根据语音信号帧的子带能量获取所述语音信号帧的子带信噪比；第二自动增益模块，用于根据所述子带信噪比对所述语音信号帧进行自动增益。
【文档编号】G10L25/51GK103544961SQ201210236881
【公开日】2014年1月29日申请日期:2012年7月10日优先权日:2012年7月10日
【发明者】王进军, 孙焘, 刘冬梅, 薛涛, 王霞, 姚远申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王进军;孙焘;刘冬梅;薛涛;王霞;姚远
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：一种语音识别及输入方法和装置制造方法
上一篇：一种动物状态信息的投放方法和装置制造方法