噪声降低增益的百分位滤波的制作方法

文档序号：8207799阅读：849来源：国知局

噪声降低增益的百分位滤波的制作方法
【技术领域】
[0001] 本公开总体上地涉及信号处理，特别是音频信号的信号处理。
【背景技术】
[0002] 声学噪声降低系统典型地包括噪声估计器和增益计算模块，该增益计算模块确定一组噪声降低增益，该组噪声降低增益在例如一组频带上被确定并在变换到频域和分带至该组频带之后被应用到（有噪声的）输入音频信号以削弱噪声成分。声学噪声降低系统可以包括一个麦克风或多个麦克风输入和下混（例如波束形成）以生成一个输入音频信号。声学噪声降低系统可以进一步包括回声降低并且可以进一步包括位置外 (out-of-location)信号降低。
[0003] 已知音乐噪声存在，并且可能由于在一些带中的增益上发生的随时间的短期错误而发生。这样的出错增益可以被认为统计学异常值，即，跨带组统计地位于预期范围之外的增益的值，所以显得"被孤立"。
[0004] 这样的统计学异常值可能出现在其中输入音频信号被变换并分带的其它种类的处理中。这种其它种类的处理包括考虑了依赖于音频信号的重现水平的音频感知中的变化的基于感知域的校平（leveling)、基于感知域的动态范围控制和基于感知域的动态均衡。参见例如作为W02004111994公开的的国际申请PCT/US2004/016964。用于校平和/或动态均衡的针对每个带确定的增益可能包括例如孤立值的统计学异常值，并且这种异常值可能引起诸如音乐噪声的伪像。
[0005] 对增益（例如噪声降低增益）进行中值滤波或跨频带地校平和/或动态均衡增益可以降低音乐噪声伪像。
[0006] 增益值可能随频率显著变化，并且在这种情形下，沿频带运行相对宽的中值滤波器有中断时域包络的连续性的风险，该时域包络的连续性为很多信号的固有特性并且对感知还很关键。在对异常值提供更大的豁免的同时，更长的中值滤波器可降低处理的谱选择性，并且潜在地在频率和时间上在增益中引入更大的不连续或跳跃。
[0007] 在本部分中描述的方法是可从事的方法，但未必是以前已经构想或从事的方法。因此，除非另外指出，否则，不应仅凭借包含于本部分中而认为在本部分中描述的方法中的任一种为现有技术。类似地，除非另外指出，否则，关于一种或更多种方法识别的问题不应基于本部分而认为在任何现有技术中已被识别。
【附图说明】
[0008] 图1不出了处理一个或多个输入音频信号（例如来自不同位置的麦克风的麦克风信号101)的集合的一个示例，包括本发明的实施例。
[0009] 图2图解地示出了本发明的实施例的百分位滤波器的一个实施例的时-频覆盖和分带增益的集合。
[0010] 图3A示出了包括根据本发明的实施例的百分位滤波器的后处理器的简化框图。
[0011] 图3B示出了包括根据本发明的实施例的百分位滤波的后处理方法的简化流程图。
[0012] 图4示出了被配置为确定用于噪声抑制、一些版本中的同时回声抑制以及一些版本中的同时位置外信号抑制的一组经后处理的增益的装置实施例的一个示例。
[0013] 图5更详细地示出了装置实施例的一个示例。
[0014] 图6示出了包括空间灵敏语音活动检测器和风活动检测器的增益计算元件的示例实施例。
[0015] 图7示出了操作处理装置以抑制噪声和位置外信号以及一些实施例中的回声的方法的实施例的流程图。
[0016] 图8示出了用于处理一个或多个音频输入从而确定一组增益、后处理该增益（包括对所确定的增益进行百分位滤波）以及生成已经通过应用增益而被修改的音频输出的处理装置实施例的简化框图。
[0017] 图9示出了针对干净的演讲和汽车噪声的混合中的有噪声的演讲的示例输入波形和对应的语音活动检测器输出。
[0018] 图10示出了使用包括本发明的实施例的不同中值滤波策略针对图9的信号的处理后波形的被表示为（a)到（e)的五张图。
[0019] 图11示出了一段汽车噪声的示例输入波形和对应的语音活动检测器输出。
[0020] 图12示出了使用包括本发明的实施例的不同中值滤波策略针对图11的信号的处理后波形的被表示为（a)到（e)的五张图。
【具体实施方式】
[0021] 概述
[0022] 本发明的实施例包括方法、装置和在一个或多个计算机可读有形介质中被编码以执行该方法的逻辑。
[0023] 一个实施例包括对用于应用到音频信号的分带增益进行后处理的方法，该分带增益通过对一个或多个输入音频信号进行输入处理而被确定。该方法包括对分带增益进行后处理以生成经后处理的增益、针对特定频带生成特定的经后处理的增益（包括使用来自所述一个或多个音频信号的一个或多个先前帧的增益值和来自用于邻近所述特定频带的频带的增益值的增益值的百分位滤波）。
[0024] 一个实施例包括对用于应用到音频信号的分带增益进行后处理的装置，该分带增益通过对一个或多个输入音频信号进行输入处理而被确定。该装置包括后处理器，该后处理器对分带增益进行后处理以生成经后处理的增益、针对特定频带生成特定的经后处理的增益（包括使用来自所述一个或多个音频信号的一个或多个先前帧的增益值和来自用于邻近所述特定频带的频带的增益值的增益值的百分位滤波）。
[0025] 在一些实施例中，在百分位滤波之后，后处理包括频带到频带平滑化和跨时间平滑化的中的至少一个。
[0026] 在一些实施例中，百分位滤波的宽度和深度之一或二者依赖于所述一个或多个输入音频信号的信号分类。在一些实施例中，该分类包括输入音频信号是否可能是语音。
[0027] 在一些实施例中，百分位滤波的宽度和深度之一或二者依赖于所述一个或多个输入音频信号的谱通量（spectral flux)。
[0028] 在一些实施例中，针对特定频带的百分位滤波的宽度或深度之一或二者依赖于正由百分位滤波确定的特定频带。
[0029] 在一些实施例中，频带在感知尺度或对数尺度上。
[0030] 在一些实施例中，百分位滤波具有百分位值，并且，例如该百分位值为中值。在一些实施例中，该百分位滤波具有百分位值，并且该百分位值依赖于所述一个或多个输入音频信号的一个或多个分类和所述一个或多个输入音频信号的谱通量。
[0031] 在一些实施例中，百分位滤波是加权百分位滤波。
[0032] 在一些实施例中，从一个或多个输入音频信号确定的分带增益被用于降低噪声。在一些实施例中，从多于一个的输入音频信号确定分带增益，并将其用于降低噪声和位置外信号。在一些实施例中，从一个或多个输入音频信号和一个或多个参考信号确定分带增益，并将其用于降低噪声和回声。
[0033] 一个实施例包括有形的计算机可读存储介质，包括当由处理系统的一个或多个处理器执行时使得处理硬件实行如此处描述的对用于应用到音频信号的分带增益进行后处理的方法的指令。
[0034] 一个实施例包括程序逻辑，该程序逻辑在被至少一个处理器执行时使得实行如此处描述的方法。
[0035] 特定实施例可以提供这些方面、特征或优点的全部或一些或不提供这些方面、特征或优点。特定实施例可以提供一个或多个其它方面、特征或优点，从此处的附图、描述和权利要求，其中的一个或多个对于本领域技术人员而言可以是显而易见的。
[0036] -些示例实施例
[0037] 本发明的一个方面包括用于增益平滑化（例如用于噪声降低或用于其它输入处理）的增益的百分位滤波。百分位滤波器将特定的增益值替换为预定义数量的值的预定义百分位，例如特定增益值和预定义的一组相邻增益值的预定义百分位。百分位滤波器的一个示例是中值滤波器，其中预定义百分位为第50个百分位。注意，预定义的百分位可以是参数，并且可以与数据相关。因此，在此处描述的一些示例中，针对一种类型的数据（例如，可能是噪声的数据），可以是第一预定义的百分位，并且针对另一种类型的数据（例如，可能是语音的数据），可以有不同的第二百分位值。有时，百分位滤波器被称为等级次序（rank order)滤波器，在这种情况下，使用预定义的等级次序而不是预定义的百分位。例如，针对 9个值的整数，第三等级次序滤波器将输出9个值中第三大的值，而第五等级次序滤波器将输出第五大的值，其为中值，即第50个百分位。
[0038] 图1示出了包括本发明的实施例的处理一组一个或多个输入音频信号（例如来自不同位置的麦克风的麦克风信号101)的一个示例。该处理是按数个（例如M个）采样的时间帧进行的。在简单的实施例中，只有例如一个麦克风的一个输入，并且在另一

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙学京;G·N·迪金斯;
技术所有人：杜比实验室特许公司;
我是此专利的发明人

上一篇：定子组合件支承的制作方法
上一篇：指示游戏音频内容的基于对象的音频的编码和呈现的制作方法