一种噪声估计方法及装置的制作方法

文档序号：2824022阅读：250来源：国知局

专利名称：一种噪声估计方法及装置的制作方法
技术领域：
本发明涉及移动通信设备领域，尤其涉及一种噪声估计方法及装置。
背景技术：
环境噪声抑制是终端音频链路上必不可少的处理过程，在上行链路和下行链路均需要仔细设计，其效果直接影响用户的主观音质体验。另外，在音频测试中，许多测试项均与噪声抑制相关，例如CTA(China Type Approval，中国入网测试)测试中的空闲信道噪声，失真等，高级测试项中的背景噪声传输，环境噪声抑制等。噪声抑制需要达到的两个的目的1.对语音做尽可能的保护。2.在满足1的前提下，对噪声做尽可能的抑制，但并非抑制越大越好，需要保证处理后无主观能感受到的怪音。在噪声抑制中，对噪声特性的跟踪效果会直接影响处理结果，若跟踪过多，则意味着会抑制过度，进而对语音信号造成失真，造成可懂度下降；若跟踪不足，则意味着对噪声的抑制度会不够。在噪声估计中，通常的做法是采用硬判决(Hard-Decision)的方式跟踪噪声方差，具体流程如图1所示。采用某种语音激活检测器来判断是否为语音信号，当判为语音信号时，不更新噪声方差，否则，更新噪声方差。噪声方差更新过程通常定义为
2 Jaa^1 [k] + {\-a) \ Yn [k]\\if - VAD = False<yNn[k\ = \
‘ {σΝ n_\k\Otherwiseα为一固定平滑因子，范围是W，l]，通常介于0.9到0.99之间。下标η代表帧号，[]中的k代表频点号。采用硬判决的方式更新噪声方差，在高信噪比时，漏检率和误检率往往较低，但在低信噪比时，漏检率和误检率非常明显，从而严重影响噪声的跟踪性能。

发明内容
有鉴于此，本发明提供一种噪声估计方法及装置，以解决现有技术中硬判决算法在低信噪比时噪声的跟踪性能差的问题。其具体方案如下一种噪声估计方法，包括跟踪预设时间窗口内，带噪语流的幅频值的最大值；依据所述幅频值的最大值计算各个频点的信噪比及对应的语音标识；利用所述各个频点对应的语音标识平滑语音存在概率及跟踪因子；平滑所述预设时间窗口内各帧的带噪语流的幅频值；根据所述带噪语流的幅频值平滑结果及平滑后的跟踪因子更新噪声方差。优选的，所述利用所述各个频点对应的语音标识平滑语音存在概率及跟踪因子的步骤前还包括依据所述幅频值的最大值计算全局信噪比及对应的语音标识；按照预设准则利用所述全局信噪比对应的语音标识修正所述各个频点对应的语音标识。优选的，所利用所述各个频点对应的语音标识平滑语音存在概率的过程包括利用下述一阶递归方程pn[k] = βρη-ιω + (1-β)Ιη θχηΜ对语音存在概率 pn[k]进行平滑，其中，所述β为经验平滑参数，所述语音存在概率&[ 小于1。优选的，所述平滑所述预设时间窗口内各帧的带噪语流的幅频值过程为加权平滑所述预设时间窗口内各帧的带噪语流的幅频值。优选的，按照以下步骤加权平滑所述预设时间窗口内各帧带噪语流的幅频值分别获得加权因子与各帧带噪语流幅频值平方的乘积；将各帧带噪语流幅频值对应的乘积相加，获得加权平滑结果；所述加权因子满足Σ ^=1°
n-N-\<i<n优选的，按照以下步骤根据所述带噪语流的幅频值平滑结果及平滑后的跟踪因子更新噪声方差计算1与跟踪因子的差值，并获得所述差值与所述加权平滑结果的乘积，确定其为第一乘积结果；获得所述跟踪因子与上一帧噪声方差的乘积，确定其为第二乘积结果；确定所述第一乘积结果和第二乘积结果的和为更新后的噪声方差。优选的，所述预设准则为计算所述全局信噪比对应的语音标识与各个频点对应语音标识的乘积；确定所述结果为修正后的各个频点对应的语音标识。一种噪声估计装置，包括跟踪单元，用于跟踪预设时间窗口内，带噪语流的幅频值的最大值；各频点信噪比及语音标识计算单元，用于依据所述幅频值的最大值计算各个频点的信噪比及对应的语音标识；跟踪因子平滑单元，用于利用所述各个频点对应的语音标识平滑语音存在概率及跟踪因子；幅频值平滑单元，用于平滑所述预设时间窗口内各帧的带噪语流的幅频值；更新单元，用于根据所述带噪语流的幅频值平滑结果及平滑后的跟踪因子更新噪
声方差。优选的，还包括全局信噪比及语音标识计算单元，用于依据所述幅频值的最大值计算全局信噪比及对应的语音标识；修正单元，用于按照预设准则利用所述全局信噪比对应的语音标识修正所述各个频点对应的语音标识。优选的，所述修正单元包括相乘单元，用于计算所述全局信噪比对应的语音标识与各个频点对应语音标识的乘积；确定单元，用于确定所述乘积为修正后的各个频点对应的语音标识。从上述的技术方案可以看出，本发明公开的噪声估计方法，采用预设时间内带噪语流的幅频值的最大值作为控制噪声更新力度的参数，持续更新噪声方差，避免了直接使用幅频值而被误跟踪或者误判为噪声信号现象发生，保证了能够准确跟踪真实噪声信号的变化，提高了跟踪性能。相对现有技术的硬判决方法，提高了判决结果的准确性，提高了系统的性能。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为硬判决方式跟踪噪声方差的流程图；图2为本发明实施例公开的噪声判决方法的流程图；图3为本发明实施例公开的又一噪声判决算法的流程图；图4为计算语音标识的示意图；图5为本发明实施例公开的一种噪声判决装置的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。本发明公开的一种噪声估计方法的流程如图2所示，包括步骤S21、跟踪预设时间窗口内，带噪语流的幅频值的最大值；由于一定时间窗口内，带噪信号的包络更能反映当前信号是否包含语音帧。根据语音的特性，在语音的两端(开始和结束部分)往往为清音，这些清音能量比较低，而且与噪声类似，直接使用其幅频值往往会被误跟踪或者误判为噪声信号。对这些辅音抑制过度往往会影响语音的主观感受。为了避免这种情况，采用带噪语流的幅频值的最大值，即包络，能更加准确的界定是否包含语音信号，从而能更加准确的跟踪上真实噪声信号的变化。相比于传统的硬判决跟踪方式，能更好地保护语音，尤其是清音部分。本实施例中的预设时间窗口的长度为4 12帧，具体值可根据实际情况任意设定。其中，第η帧的包络定义为该帧之前的前N帧的幅频最大值。即^[幻，^旧⑷丨公式⑴步骤S22、依据所述幅频值的最大值计算各个频点的信噪比及对应的语音标识；第k个频点的包络信噪比定义为
氏[幻=4^公式O)分别求单个频点的信噪比所对应的语音标识hdex[k]，由于人耳对声音的感知呈对数型，所以在求语音标识时采用对数域的信噪比。步骤S23、利用所述各个频点对应的语音标识平滑语音存在概率及跟踪因子；为了减少语音存在概率的随机浮动变化，往往采用一阶递归方式对该值进行平滑pn[k] = β p^tkj + d-^) Indexn[k]公式(3)β为一经验平滑参数。另外为了防止不更新，需要将该语音存在概率PnDO限定为某一个小于1的值。
权利要求
1.一种噪声估计方法，其特征在于，包括跟踪预设时间窗口内，带噪语流的幅频值的最大值；依据所述幅频值的最大值计算各个频点的信噪比及对应的语音标识；利用所述各个频点对应的语音标识平滑语音存在概率及跟踪因子；平滑所述预设时间窗口内各帧的带噪语流的幅频值；根据所述带噪语流的幅频值平滑结果及平滑后的跟踪因子更新噪声方差。
2.根据权利要求1所述的方法，其特征在于，所述利用所述各个频点对应的语音标识平滑语音存在概率及跟踪因子的步骤前还包括依据所述幅频值的最大值计算全局信噪比及对应的语音标识；按照预设准则利用所述全局信噪比对应的语音标识修正所述各个频点对应的语音标识。
3.根据权利要求2所述的方法，其特征在于，所利用所述各个频点对应的语音标识平滑语音存在概率的过程包括利用下述一阶递归方程Pn[k] = ^^[ + (卜⑴^！^㈦对语音存在概率队㈦进行平滑，其中，所述β为经验平滑参数，所述语音存在概率Pn[k]小于1。
4.根据权利要求3所述的方法，其特征在于，所述平滑所述预设时间窗口内各帧的带噪语流的幅频值过程为加权平滑所述预设时间窗口内各帧的带噪语流的幅频值。
5.根据权利要求4所述的方法，其特征在于，按照以下步骤加权平滑所述预设时间窗口内各帧带噪语流的幅频值分别获得加权因子与各帧带噪语流幅频值平方的乘积；将各帧带噪语流幅频值对应的乘积相加，获得加权平滑结果；所述加权因子满足
6.根据权利要求5所述的方法，其特征在于，按照以下步骤根据所述带噪语流的幅频值平滑结果及平滑后的跟踪因子更新噪声方差计算1与跟踪因子的差值，并获得所述差值与所述加权平滑结果的乘积，确定其为第一乘积结果；获得所述跟踪因子与上一帧噪声方差的乘积，确定其为第二乘积结果；确定所述第一乘积结果和第二乘积结果的和为更新后的噪声方差。
7.根据权利要求2-6中任意一项所述的方法，其特征在于，所述预设准则为计算所述全局信噪比对应的语音标识与各个频点对应语音标识的乘积；确定所述结果为修正后的各个频点对应的语音标识。
8.—种噪声估计装置，其特征在于，包括跟踪单元，用于跟踪预设时间窗口内，带噪语流的幅频值的最大值；各频点信噪比及语音标识计算单元，用于依据所述幅频值的最大值计算各个频点的信噪比及对应的语音标识；跟踪因子平滑单元，用于利用所述各个频点对应的语音标识平滑语音存在概率及跟踪因子；幅频值平滑单元，用于平滑所述预设时间窗口内各帧的带噪语流的幅频值；更新单元，用于根据所述带噪语流的幅频值平滑结果及平滑后的跟踪因子更新噪声方差。
9.根据权利要求8所述的装置，其特征在于，还包括全局信噪比及语音标识计算单元，用于依据所述幅频值的最大值计算全局信噪比及对应的语音标识；修正单元，用于按照预设准则利用所述全局信噪比对应的语音标识修正所述各个频点对应的语音标识。
10.根据权利要求8所述的装置，其特征在于，所述修正单元包括相乘单元，用于计算所述全局信噪比对应的语音标识与各个频点对应语音标识的乘积；确定单元，用于确定所述乘积为修正后的各个频点对应的语音标识。
全文摘要
本发明公开了一种噪声估计方法及装置，包括跟踪预设时间窗口内，带噪语流的幅频值的最大值；依据幅频值的最大值计算各个频点的信噪比及对应的语音标识；利用各个频点对应的语音标识平滑语音存在概率及跟踪因子；平滑预设时间窗口内各帧的带噪语流的幅频值；根据带噪语流的幅频值平滑结果及平滑后的跟踪因子更新噪声方差。本发明公开的噪声估计方法，采用预设时间内带噪语流的幅频值的最大值作为控制噪声更新力度的参数，持续更新噪声方差，避免了直接使用幅频值而被误跟踪或者误判为噪声信号现象发生，保证了能够准确跟踪真实噪声信号的变化，提高了跟踪性能。相对现有技术的硬判决方法，提高了判决结果的准确性，提高了系统的性能。
文档编号G10L21/02GK102543092SQ20101061204
公开日2012年7月4日申请日期2010年12月29日优先权日2010年12月29日
发明者王彦, 许云峰, 谢单辉申请人:联芯科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢单辉;许云峰;王彦
技术所有人：联芯科技有限公司
我是此专利的发明人

上一篇：导航语音生成方法及系统的制作方法
上一篇：联网与非联网的智能同步点歌伴唱装置的制作方法