噪声水平估计的制作方法

文档序号:9472497阅读:593来源:国知局
噪声水平估计的制作方法
【技术领域】
[0001] 本发明的实施例一般性地涉及音频处理,并且更具体地,涉及用于噪声水平估计 的方法和系统。
【背景技术】
[0002] 现实生活的噪声可W包括不同类型的噪声:平稳噪声和非平稳噪声。非平稳噪声 可W包括两个分类:本底噪声的突增W及脉冲噪声,它们对于考虑噪声信号的音频处理非 常具有挑战。如本文中所使用的,本底噪声的突增指的是本底噪声从一个水平突然增长到 另一个水平并且在相对长的一段时间内基本维持平稳,并且脉冲噪声指的是其水平突然增 长并且然后在短时间段内下降的非平稳噪声。通常,在音频处理中,诸如在语音增强、音频 播放或者噪声补偿中,需要追踪噪声水平。例如,在耳机噪声补偿中,噪声信号的估计水平 可W直接影响要被应用至音频信号的增益。噪声信号的实际信号水平通常不能够被应用, 因为它随着时间快速变化,特别是当出现本底噪声的突增或者脉冲噪声时。因此,应当处理 噪声信号输入W获得在音频处理中能够被使用的估计噪声水平,如图1所示。
[0003] 主要在语音处理的架构中,特别是在语音增强中,已经开发了噪声估计技术。送些 技术例如可W被划分为:最小值追踪、时间递归平均、基于直方图的噪声估计、W及基于分 位数的噪声估计等等。考虑到两类非平稳噪声,所期望的是,估计的噪声信号跟随本底噪声 的突增并且在短期脉冲噪声期间抵抗噪声估计的移动。然而,现有的噪声估计方法不是对 本底噪声的突增过于敏感或者就是对脉冲噪声过于敏感,不能够在送两种噪声场景中估计 鲁棒的噪声水平。
[0004] 鉴于W上,在本领域中需要一种解决方案用于针对脉冲噪声和本底噪声的突增两 者适当地估计噪声水平。

【发明内容】

[0005] 为了解决前述W及其他潜在问题中的至少一个问题,本发明的实施例提出了用于 噪声水平估计的方法和系统。
[0006] 在一个方面,本发明的实施例提供了一种用于噪声水平估计的方法。该方法包括: 响应于噪声信号的信号水平的增长,计算所述噪声信号的脉冲噪声概率,其中所述脉冲噪 声概率指示所述噪声信号是脉冲噪声的可能性;基于所述脉冲噪声概率,确定用于噪声水 平估计的可变平滑因数,该可变平滑因数与所述噪声信号的先前估计水平相关联;W及利 用所述可变平滑因数平滑所述噪声信号,W确定所述噪声信号的当前估计水平。在送个方 面的实施例进一步包括对应的计算机程序产品。
[0007] 在另一个方面,本发明的实施例提供了一种用于噪声水平估计的系统。该系统包 括:脉冲噪声概率计算单元,被配置为响应于噪声信号的信号水平的增长,计算所述噪声信 号的脉冲噪声概率,其中所述脉冲噪声概率指示所述噪声信号是脉冲噪声的可能性;平滑 因数确定单元,被配置为基于所述脉冲噪声概率,确定用于噪声水平估计的可变平滑因数, 该可变平滑因数与所述噪声信号的先前估计水平相关联;w及噪声水平估计单元,被配置 为利用所述可变平滑因数,平滑所述噪声信号W确定所述噪声信号的当前估计水平。
[0008] 通过W下描述,将认识到,根据本发明的实施例,所估计的噪声水平能够在脉冲噪 声的场景中基于从脉冲噪声概率确定的可变平滑因数来抵抗移动。本发明的实施例所带来 的其他益处将通过下文描述而清楚。
【附图说明】
[0009] 通过参考附图阅读下文的详细描述,本发明实施例的上述W及其他目的、特征和 优点将变得易于理解。在附图中,W示例而非限制性的方式示出了本发明的若干实施例,其 中:
[0010] 图1图示了噪声水平估计的一般性的图;
[0011] 图2图示了根据本发明的实施例的用于噪声水平估计的方法的流程图;
[0012] 图3图示了根据本发明的一个示例实施例的噪声水平估计的示意图;
[0013] 图4图示了根据本发明的另一个示例实施例的噪声水平估计的示意图;
[0014] 图5(a)图示了根据现有的方法和根据本发明的示例实施例的估计噪声水平的比 较;
[0015] 图5(b)-(d)图示了在图5(a)的示例实施例中使用的参数的图;
[0016] 图6图示了根据本发明的示例实施例的用于噪声水平估计的系统的框图;W及
[0017] 图7图示了适合用于实施本发明的实施例的示例计算机系统的框图。
[001引在各个附图中,相同或对应的标号表示相同或对应的部分。
【具体实施方式】
[0019] 下面将参考附图中示出的若干示例实施例来描述本发明的原理。应当理解,描述 送些实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非W任何 方式限制本发明的范围。
[0020] 如W上所提及的,本底噪声的突增和脉冲噪声对于考虑噪声信号的音频处理特别 具有挑战,并且在噪声估计中,期望所估计的噪声信号跟随本底噪声的突增并且抵抗在短 期脉冲噪声期间噪声估计的移动。就此而言,应当从噪声信号输入中区分出本底噪声的增 长和脉冲噪声,并且然后不同的平滑因数能够被应用于平滑噪声信号输入。然而,在增长开 始时,本底噪声的突增和脉冲噪声没有区分。一种简单的解决方法是向前看并且缓冲足够 长的信号,W构建对于信号类型的足够置信度,并且稍后据此处理信号,然后,送可能造成 大的延迟。
[0021] 本发明的实施例提出了用于鲁棒的噪声水平估计的方法和系统,其能够紧密并且 平滑地追踪噪声水平,快速地跟随本底噪声的增长并且抵抗短期脉冲噪声。本发明的方法 和系统引入了脉冲噪声概率和自适应平滑因数,W便于实现低延迟且正确的信号类型分类 W及鲁棒的噪声水平估计。
[0022] 首先参照图2,其示出了根据本发明的示例实施例的用于噪声水平估计的方法 200的流程图。
[002引在步骤S201,响应于噪声信号的信号水平的增长,计算噪声信号的脉冲噪声概率。 脉冲噪声概率指示该噪声信号是脉冲噪声的可能性
[0024]在本发明的一些实施例中,噪声信号可W例如从麦克风输入或者经处理的麦克风 信号来获得。因为噪声的水平是频率和时间的函数,噪声水平估计可W-个频带接一个频 带地执行,或者在全频带上执行。在不同频带处的噪声水平估计可W同时执行或者按顺序 执行。因此,要被估计的噪声信号可W是噪声输入信号的多个频带中的一个频带中的信号, 或者是噪声输入信号的宽带信号。
[00巧]本发明的一个目的是快速并且准确地区分本底噪声的增长和脉冲噪声,两者在早 期阶段均具有增长的信号水平。增长的信号水平可W用于触发脉冲噪声概率的计算。在本 发明的示例实施例中,起始检测器可W用于追踪噪声信号的起始(onset),并且噪声信号增 长的概率可W被表示为起始概率。因此,在计算脉冲噪声概率之前,可W确定噪声信号的起 始概率,并且该起始概率指示信号水平的增长的可能性。起始概率的确定将在W下参照图 3更详细地讨论。
[0026] 响应于检测到信号水平正在增长,执行操作W计算指示该噪声信号是脉冲噪声的 可能性的脉冲噪声概率。脉冲噪声概率在0和1之间。当计算脉冲噪声概率时,本底噪声 增长的概率还可W通过1减去脉冲噪声概率来确定。
[0027] 如本文中所指代的,本底噪声的突增指的是本底噪声从一个水平突然增长到另一 个水平并且在相对长的一段时间内基本维持平稳,并且脉冲噪声指的是其水平突然增长并 且在短时间段内下降的非平稳噪声。例如,在现实生活的场景中,在街角小店的人处于相对 安静的室内环境。当他打开口的时候,他突然进入到高水平的外界交通噪声的环境,并且可 能随后听到在交通噪声之上的很大的关口声。在送种场景中,交通噪声可W导致本底噪声 的增长,并且关口声的噪声(其水平非常快地下降)可W被分类成脉冲噪声。
[0028] 脉冲噪声概率的计算将在W下参照图3更详细地讨论。
[0029] 方法200然后行进至步骤S202,其中基于步骤S201的脉冲噪声概率,确定用于噪 声水平估计的可变平滑因数。
[0030] 如本文中所使用的,可变平滑因数与所述噪声信号的先前估计水平相关联。可变 平滑因数用于平滑噪声信号,W便于使得噪声信号的估计水平快速跟随本底噪声的增长并 且抵抗短时期的脉冲噪声。由于较小的平滑因数可W导致所估计的噪声水平更快速地跟随 噪声信号的实际水平并且反之亦然,如果所计算的脉冲噪声概率较小,其意味着该噪声信 号可能是本底噪声的增长,则可变平滑因数被确定为较小,并且反之亦然。
[0031] 通常,即使没有本底噪声的增长和脉冲噪声,噪声信号输入也可W利用恒定平滑 因数来平滑W产生具有更平滑的水平的平滑噪声信号W用于后续处理,该恒定平滑因数在 本文中被称为基准平滑因数。因此,在步骤S202所确定的可变平滑因数可W在该恒定平滑 因数和1之间。可变平滑因数的确定将在W下参照图3更详细地讨论。
[0032] 方法200然后行进至步骤S203,其中利用可变平滑因数来平滑噪声信号,W确定 该噪声信号的当前估计水平。该估计水平可W在后续音频处理中被使用,诸如在噪声补偿、 语音增强等处理中。该步骤也将在W下参照图3更纤细地讨论。
[0033] 图3图示了根据本发明的一个示例实施例的噪声水平估计的示意图300。参照图 3,将更详细描述噪声水平估计的过程。应当注意,在实践中,图3中示出的一个或多个框可 W是可选的并且因此能够在一些实施例中被省略,并且一些框可W被组合为一个框或者一 个框可w被划分为多个框。本发明的实施例在送方面不受限制。
[0034] 在W下描述所图示的框的操作。
[00巧]颇时分析柜301
[0036] 因为噪声信号输入随时间和频率而变化,噪声水平估计的处理可W针对多个频 带的每个频带来执行,并且参数在频带与频带之间是被调整的。郝么,要被估计的噪声 信号可W是噪声输入信号的多个频带中的一个频带中的信号,或者是噪声输入信号的宽 带信号。例如,噪声信号输入的频率可W被划分成五个频带,Bl(f《700Hz)、B2 (700化 <f《lOOOHz)、B3(lOOOHz<f《2000Hz)、B4 (2000Hz<f《6000Hz)和B5(f> 6000Hz), 并且要被估计的噪声信号可W在五个频带之一。
[0037] 在送种情况下,在一个示例实施例中,框301的输出可W是X(f,t),其中Xa,t) 可W表示噪声信号在一个频带和时间点的实际信号水平。
[0038] 应当注意到,如果在处理中使用宽带噪声信号,在其他实施例中,框301可W是可 选的。在送种情况下,噪声信号例如可W被表示为X(t)。
[0039] 在一些实施例中,送个框还可W确定噪声信号估计的处理间隔At,也就是说,它 可W每隔一个处理间隔At就输出噪声信号X(f,t)。处理间隔At可W由采样率来确定。 例如,送个框可W每个一个样本或者每个十个样本等输出噪声信号X(f,t)。
[0040]快谏平滑柜302巧缓憬平滑柜303
[0041] 两个平滑器可W用于在噪声信号被输出到起始概率、最大值追踪或者脉冲噪
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1