爆破噪声控制的制作方法

文档序号:16674351发布日期:2019-01-18 23:49阅读:317来源:国知局
爆破噪声控制的制作方法

本公开涉及一种用于爆破(pop)噪声控制的系统和方法(总体上称为“系统”)。



背景技术:

常规的声学回声消除方法和常规的降噪方法无法充分地去除由具有如音乐中明显的、脉冲性低音节拍的脉冲参考信号所引起的回声,这是因为参考信号的这些部分倾向于驱动所使用的扬声器使其超过其线性操作范围,并因此在由扬声器再现的声音中造成通过任何常规的声学回声消除方法或任何常规的降噪方法都无法控制或去除的多余的非线性分量。需要对噪声中也被称为爆破噪声或瞬态噪声的脉冲部分进行有效控制。



技术实现要素:

示例性爆破噪声控制系统包括:检测器块,其被配置成基于输入信号的信噪比频谱来检测输入信号中的脉冲分量;以及掩蔽块,其被配置成如果检测到输入信号中的脉冲分量,则生成频谱爆破噪声去除掩模并将频谱爆破噪声去除掩模应用于输入信号,该爆破噪声去除掩模被配置成在应用时抑制输入信号中的脉冲分量。

示例性爆破噪声控制方法包括:基于输入信号的信噪比频谱来检测输入信号中的脉冲分量,并且如果检测到输入信号中的脉冲分量,则产生频谱爆破噪声去除掩模并且将频谱爆破噪声去除掩模应用于输入信号,该爆破噪声去除掩模被配置成在应用时抑制输入信号中的脉冲分量。

在审查以下附图和详细描述时,其它系统、方法、特征和优点对于本领域技术人员将是明显或将变得明显。意图在于所有这些附加系统、方法、特征和优点都包括在本说明书内、处于本发明的范围内并且由所附权利要求保护。

附图说明

参照以下附图可以更好地理解本公开。附图中的部件不一定按比例绘制,而是着重说明本公开的原理。在附图中,贯穿不同的视图,相同的附图标记表示对应的部分。

图1是示出在声学回声消除系统中出现的信号的幅度-时间图,该信号包括来自麦克风的信号、线性声学回声消除级的输出信号以及残余回声抑制级的输出信号。

图2示出了残余回声抑制级的输出信号(左侧)的声谱图和未应用任何爆破噪声去除加权掩模的降噪级的输出信号(右侧)的声谱图。

图3是示出执行示例性爆破噪声控制方法的示例性爆破噪声控制系统的结构的示意图。

图4是示出对来自自适应后置滤波器级和降噪级的输出信号进行比较的幅度-时间图。

图5示出了残余回声抑制级的输出信号(左侧)的声谱图和应用了爆破噪声去除加权掩模的降噪级的输出信号(右侧)的声谱图。

具体实施方式

包括诸如音乐片段等明显脉冲性部分的参考信号更倾向于在扬声器中产生非线性,该非线性结果既无法例如通过声学回声消除(aec)系统的线性信号处理部分来去除,也无法通过其非线性残余回声抑制(res)部分来去除,并因此导致声学回声消除系统的误差信号(形成输出信号)中的较强的剩余脉冲部分,而不管声学回声消除系统中是否启用可选的残余回声抑制级。

图1示出了两个幅度时间图,其示出在示例性声学回声消除系统(未在图1、图2、图4和图5中示出)中出现的各种时间信号的曲线。在图1的左侧示图中,曲线101描述了麦克风信号,曲线102描述了声学回声消除系统的线性信号处理部分的输出信号,以及曲线103描述了声学回声消除系统的残余回声抑制级的输出信号。曲线基于从安装在封闭盒中的音量约为0.8[1]的微型扬声器所获取的记录。该扬声器利用“老鹰乐队”的著名歌曲“加州旅馆”在较高水平上进行驱动。在经过约30[s]时间后,这首歌曲出现脉冲性。在图1的右侧示图中,详细示出了线性声学回声消除级的输出信号(曲线102)和残余回声抑制级的输出信号(曲线103),其中将其阈值设置成20[db]。

当将记录信号的总水平与误差信号进行比较时,可以看出,歌曲脉冲部分(经过时间>30[s])比表现出不太明显的脉冲特性(经过时间<30[s])的部分受线性声学回声消除级的抑制更小。与线性声学回声消除级相比,残余回声抑制级似乎不能区分信号的不同特性,而是以相似方式抑制所有信号部分。因此,即使在残余回声抑制级的输出信号中,误差信号在准稳态信号部分和脉冲信号部分之间仍然表现出相当大的差异。应注意,在最初的15[s]内可以观察到的剩余信号部分表示应当消除回声的语音信号。

如可从图2所见,(仅)应用常规的单通道降噪可能无法克服上述缺点,因为单通道降噪级可能会限于降低随时间变化较慢的噪声部分,而非如以上示例那样的脉冲信号部分。图2示出了残余回声抑制级的输出信号(左侧)的声谱图和未去除爆破噪声的残余回声抑制级之后的降噪级的输出信号(右侧)的声谱图。

图3是示出示例性爆破噪声控制系统(方法)的结构和信号流的示意图,该系统(方法)确定(计算)并应用爆破噪声去除(pnr)掩模,用于去除由诸如音乐等参考信号的脉冲部分驱动的爆破噪声部分以及在有人敲击麦克风时可能出现的基于麦克风信号的爆破噪声部分。图3所示的爆破噪声控制系统连接到执行声学回声消除过程的声学回声消除级301。在声学回声消除级301中,将电参考信号x(n)提供给扬声器302,在扬声器处电参考信号被转换成声音。声音经由具有传递函数w(n)的未知系统303而传递到麦克风304,在麦克风处声音被转换回电信号,麦克风信号y(n)。具有传递函数的自适应滤波器305与未知系统303并行操作,即被提供有参考信号x(n)并输出估算的麦克风信号例如在减法器306中,从麦克风信号y(n)中减去估算的麦克风信号以提供误差信号e(n)。自适应滤波器305由滤波器控制器307采用例如已知的最小均方(lms)方法控制,滤波器控制器接收参考信号(x)和误差信号e(n)。滤波器系数及由此的自适应滤波器305的传递函数由滤波器控制器307在迭代循环中调整,使得误差信号e(n)最小化,即使估算的麦克风信号接近麦克风信号y(n)。未知系统303的未知传递函数由此通过自适应滤波器305的传递函数来近似。

参考信号x(n)和误差信号e(n)形成输入到爆破噪声控制系统中的输入信号,在本示例中特别地,形成输入到爆破噪声控制系统的频谱变换级308中的输入信号,在其中参考信号x(n)和误差信号e(n)通过例如两个快速傅里叶变换(fft)块309和310的方式从时域变换到频谱域中,即变换成频谱参考信号x(ω)和频谱误差信号e(ω)。将频谱参考信号x(ω)和频谱误差信号e(ω)输入到可选的频谱平滑级311中,用于频谱平滑。频谱平滑级311可以包括两个频谱平滑块312和313,一个用于基于参考信号的信号处理,且另一个用于基于误差信号的信号处理。根据是否存在可选的频谱平滑级311,时间平滑级314连接到可选的频谱平滑级311或频谱变换级308。时间平滑级314可以包括两个时间平滑块315和316,一个用于基于参考信号的信号处理,且另一个用于基于误差信号的信号处理。平滑信号可以包括对信号进行滤波以捕获信号中的重要图案,同时忽略噪声、细节和/或快速变化的图案。

背景噪声估算级317连接在时间平滑级314的下游,并且可以包括两个背景噪声估算块318和319,一个用于基于参考信号的处理,且另一个用于基于误差信号的信号处理。基本上,背景噪声估算级317可以使用可用于确定或估算包括在输入信号例如包括在参考信号x(n)和/或误差信号e(n)中的背景噪声的任何已知的方法。在所示示例中,待评估的信号,频谱参考信号x(ω)和频谱误差信号e(ω),处于频谱域中,因此将背景噪声估算块318和319及由此的背景噪声估算级317设计成在频谱域中进行操作。

在频谱信噪比确定(计算)级320中,处理背景噪声估算级317的输入信号和输出信号以提供频谱信噪比,参考信号x(n)的频谱信噪比snrx(ω)以及误差信号e(n)的频谱信噪比snre(ω)。信噪比计算级320可以包括两个信噪比估算块321和322,一个用于基于参考信号的处理,提供频谱信噪比snrx(ω),且另一个用于基于误差信号的信号处理,提供频谱误差信噪比snre(ω)。例如,信噪比估算块321和322可以将对应背景噪声估算块318、319的输入信号除以各自背景噪声估算块318、319的输出信号以计算频谱信噪比snrx(ω)和snre(ω)。

在第一评估级323中,将频谱域中估算的信噪比,即将被称为频谱信噪比snrx(ω)和snre(ω)的每频率多重信噪比,在完全低于例如参考信号频率上限refωmax和麦克风信号频率上限micωmax的预定(可调整)频率限制的频带内,与例如参考信号信噪比阈值refmaxth和麦克风信号信噪比阈值micmaxth的各个预定信噪比阈值进行比较,以确定例如超过数refexceed和micexceed的整数超过数,其在各个每频率当前信噪比(离散频率下的信噪比snrx(ω)和snre(ω))不超过各个预定信噪比阈值(信噪比阈值refmaxth和micmaxth)时,被设置成零。否则,将例如超过数refexceed和micexceed的超过数设置成超过例如信噪比阈值refmaxth和micmaxth的各个预定信噪比阈值的频谱信噪比的整数,其中整数大于或等于1。第一评估级323可以包括两个第一评估块324和325,一个用于基于参考信号的处理,其接收频谱信噪比snrx(ω)并提供超过数refexceed,且另一个用于基于误差信号的信号处理,其接收频谱信噪比snre(ω)并提供超过数micexceed。

在第二评估级326中,将例如超过数refexceed和micexceed的超过数与例如最小阈值refexceedth和micexceedth的各个最小阈值进行比较。如果各个超过数(超过数refexceed和/或超过数micexceed)超过最小阈值(最小阈值refexceedth和/或最小阈值micexceedth),则将例如值idxx和/或值idxe的各个比较值设置成逻辑状态1(‘1’),否则设置成逻辑状态0(‘0’)。第二评估级326可以包括两个第二评估块327和328,一个用于基于参考信号的处理,提供比较值idxx,且另一个用于基于误差信号的信号处理,提供比较值idxe。

在第三评估级329中,检查比较值idxx和idxe以确定它们中的一个是否为1(“或”)或它们是否都为1(“与”)。当期望对麦克风信号或参考信号中的脉冲噪声的最大抑制时使用或(“or”)。当要避免抑制语音信号时,使用与(“and”)。在图3所示的示例性爆破噪声控制系统(方法)中,采用或,使得如果比较值中的一个为1,则将频谱爆破噪声去除掩模pnrmask(ω)设置成(1-snre(ω))pnorm,其中pnorm是掩模的p范数,且snre(ω)是信噪比估算块322的输出。否则,将爆破噪声去除掩模pnrmask(ω)设置成1。

所产生的爆破噪声去除掩模pnrmask(ω)在频谱域中与来自fft块310的频谱误差信号e(ω)相乘以提供频谱输出信号out(ω)。第三评估级329可以包括比较块330,用于检查比较值idxx和idxe以确定它们中的至少一个是否为1。第三比较级329可以进一步包括用于存储p范数pnorm的寄存器331、计算(1-snre(ω))pnorm的处理块332以及用于将频谱误差信号e(ω)乘以爆破噪声去除掩模pnrmask(ω)的乘法块333。频谱域中的输出信号out(ω)通过可包括逆快速傅里叶变换(ifft)块335的逆频谱变换级334而变换成时域中的输出信号out(n)。

虽然以上结合图3描述了用于例如参考信号x(n)和误差信号e(n)的两个输入信号的爆破噪声控制系统,但是可以通过调适相应示出的结构来处理任何数量的输入信号(例如,1、3、4……)。从图3可以看出,为了成功地去除爆破噪声部分,例如通过分析指示在高达预定(可调整)参考信号频率上限refωmax(其可以等于麦克风信号频率上限micωmax,例如100或150或300[hz])的频率范围中的估算的频谱信噪比的信号以及通过计算在预定频率范围内超过预定(可调整)信噪比阈值refmaxth(或麦克风信号的信噪比阈值micmaxth)的频谱信噪比值来检测参考信号的脉冲部分。每当超过信噪比阈值refmaxth的频谱信噪比值的数超过基于预定(可调整)参考信号的最小数refexceedth(或基于麦克风信号的数micexceedth),则将确定(例如,计算)频谱爆破降噪掩模(pnrmask(ω)),否则将频谱爆破降噪掩模设置成中性,即设置成1(pnrmask(ω)=1)。最后,将爆破降噪掩模应用于可能包括或可能不包括残余误差抑制级的声学回声消除级的误差信号。此外,如上所述确定爆破降噪掩模可以以有效的方式与确定常规降噪掩模相结合,该方式允许去除准稳态以及脉冲部分两者,并且还允许区分基于参考信号的爆破噪声部分和基于麦克风信号的部分。

由于能够去除基于参考信号的爆破噪声部分的声学回声消除系统只有在存在一定的扬声器可能变成非线性的可能性时才有效,并且由于该系统(仅)利用信噪比的较低频谱部分进行分析以及创建爆破噪声去除掩模,因此该系统可被视为非线性声学回声消除系统。换言之,(仅)分析频谱信噪比的较低频谱范围并在那检测超过最小数量的频谱线超过预定最大阈值,给出扬声器的振膜的偏移是否较高的指示。因此,不能被常规声学回声消除级消除的非线性副产物将成为误差信号的一部分的可能性较高。另外,由于在该有限频谱范围内频谱信噪比的最小数量超过给定的最大阈值的事实,因此将出现具有脉冲特性的信号的概率也较高。这指示应当确定并应用爆破噪声去除掩模,以便去除误差信号的那些原本无法去除的非线性信号部分。

爆破噪声去除掩模和降噪掩模之间的差别主要在于通过从1中减去给定降噪掩模以产生爆破噪声去除掩模,后者将或多或少地逆转。换言之,虽然降噪掩模使诸如语音的脉冲信号部分不受影响并旨在抑制准稳态信号部分,但是爆破噪声去除掩模则是针对其相反的部分,即其旨在抑制明显的脉冲信号部分,同时仍然试图使语音信号不受影响。由于后者试图抑制和恢复具有相似属性的信号部分,因此将分析限制在通常不存在语音分量的较低频谱部分例如限制在低于150[hz]的频率处是有帮助的。另外,通过(可选地)分析不受任何有用语音信号影响的参考信号,进一步减少了将发生所不希望的抑制有用语音信号的风险。

基于麦克风信号的爆破噪声去除也可能仅依赖于其中基本上不会出现有用语音部分的信噪比频谱,例如低于150[hz]的频率。该频率范围用于分析,并且仅利用那些也表现出脉冲特性的部分来确定爆破噪声去除掩模。因此,即使在将麦克风信号作为爆破噪声去除系统和方法的输入信号时,错误抑制有用语音信号部分的风险也较低。

图4是从常规声学回声消除/残余回声抑制系统的输出获取的时间信号的幅度-时间图(曲线401)以及从采用爆破噪声去除掩模的声学回声消除系统的输出获取的时间信号的幅度-时间图(曲线402),从该图可以看出,出现在信号的前15[s]的有用语音信号几乎完全不受爆破噪声去除掩模的影响。另外,在由常规声学回声消除级输出的信号(例如,残余回声抑制级的输出信号)的语音质量和由本文公开的爆破噪声控制系统和方法输出的信号的语音质量方面,声学验证显示出几乎不易察觉的声学性能。查看剩余时间信号,可以看出非常成功地抑制了剩余的脉冲性干扰。

如图5所示,这也通过这两个信号的声谱图得到证实。当然,本文公开的爆破噪声去除系统和方法既不需要与常规的降噪算法结合,也不需要将参考信号和麦克风信号两者作为输入信号,因为这些信号中仅有一个可以是用于这种爆破噪声去除系统和方法的充分基础。因此,应清楚,具有或不具有残余回声抑制级的上游声学回声消除级对于功能性爆破噪声去除系统和方法也并非必需的。

然而,本文公开的爆破噪声去除系统和方法可以被实施为声学回声消除级或增强型降噪级的一种非线性扩展,其不仅能够抑制准稳态噪声信号,而且能够抑制脉冲噪声信号部分。爆破噪声去除系统和方法可以非常有效地与常规降噪系统和方法相结合,从而在数字信号处理环境中实施时保持较低数量的mips和存储器。除了其简易性之外,其还提供了一种非常有效的方法来基于参考信号和/或麦克风信号和/或声学回声消除级的残余回声信号来减少噪声的脉冲部分。

块被理解成是一种具有以下中的至少一个的硬件系统或其元件:执行软件的处理单元和用于实施各个期望信号传输或处理功能的专用电路结构。因此,可以将系统的部分或全部实施为由处理器或可编程数字电路执行的软件和固件。应认识到,本文公开的任何系统可以包括任何数量的微处理器、集成电路、存储器装置(例如flash、随机存取存储器(ram)、只读存储器(rom)、电可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)或其其它的适当变体)以及彼此协作执行本文公开的操作的软件。另外,所公开的任何系统可以利用任何一个或多个微处理器来执行计算机程序,该计算机程序被实现在被编程为执行所公开的任意数量的功能的非暂时性计算机可读介质中。此外,本文提供的任何控制器包括壳体和各种数量的微处理器、集成电路和存储器装置(例如,flash、随机存取存储器(ram)、只读存储器(rom)、电可编程只读存储器(eprom)和/或电可擦除可编程只读存储器(eeprom))。

已出于说明和描述的目的提供了对实施方案的描述。根据以上描述可以对实施方案进行适当的修改和变化,或者可以从实践该方法中获得这些修改和变化。例如,除非另有说明,否则所述方法中的一个或多个可以由适当的装置和/或装置的组合来执行。所描述的方法和相关联的动作也可以按照除了本申请中描述的顺序之外的各种顺序、并行地和/或同时地执行。所述系统实质上是示例性的,并且可以包括附加元件和/或省略元件。

除非明确叙述,否则如在本申请中所使用的,以单数形式叙述并前面带有词“一(a)”或“一(an)”的元件或步骤应当被理解为不排除复数个所述元件或步骤。此外,对本公开的“一个实施方案”或“一个示例”的引用不旨在被解释为排除也并入了所述特征的附加实施方案的存在。术语“第一”、“第二”和“第三”等仅用作标记,并不旨在对其对象施加数字要求或特定位置顺序。

尽管已经描述了本发明的各个实施方案,但是对于本领域普通技术人员来说明显的是,在本发明的范围内可以有更多的实施方案和实现方式。特别地,技术人员将认识到来自不同实施方案的各种特征的可互换性。尽管已经在某些实施方案和示例的背景下公开了这些技术和系统,但是应理解,这些技术和系统可以超出具体公开的实施方案,扩展到其它实施方案和/或使用以及其明显的修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1