自适应后滤波的制作方法

文档序号:16848074发布日期:2019-02-12 22:29阅读:270来源:国知局
自适应后滤波的制作方法

本公开涉及自适应后滤波系统和方法(一般称为“系统”)。



背景技术:

用于远场声音捕获的系统(也被称为远场麦克风或远场麦克风系统)适于记录来自定位在距远场麦克风较远的距离(例如,几米)处的期望声源的声音。声源与远场麦克风之间的距离越大,期望声噪比越低。术语“噪声”在本案中包括不携带信息、想法或情绪的声音,例如,没有语音或音乐的声音。如果噪声是不期望的,那么它也会被称为噪声。当语音或音乐被引入到充满噪声的环境(诸如车辆、家庭或办公室内部)时,内部存在的噪声可能对期望语音通信或音乐呈现有不期望的干扰影响。降噪通常是不期望信号的衰减,但是也可包括对期望信号的放大。期望信号可以是语音信号,而不期望信号则可以是环境中干扰期望信号的任何声音。已经结合降噪来使用了三种主要方法:定向波束成形、频谱减法和基于音高的语音增强。设计用于接收空间上传播的信号的系统通常遇到干扰信号的存在。如果期望信号和干扰源占用相同的时间频带,那么就不能使用时间滤波来将期望信号与干扰信号分离。期望改进降噪系统和方法。



技术实现要素:

一种自适应阻挡系统包括阻挡掩码块,所述阻挡掩码块被配置成从输入到所述阻挡掩码块中的期望信号和不期望信号中的至少一个生成输出信号,所述输出信号本身或与所述期望信号或所述不期望信号组合地提供掩码信号,其中所述不期望信号包括在所述期望信号中也出现的分量或所述期望信号包括在所述不期望信号中也出现的分量,并且所述输出信号是具有减少的在所述期望信号中也出现的分量或不具有所述分量的不期望信号,或具有减少的在所述不期望信号中也出现的分量或不具有所述分量的期望信号。

一种自适应阻挡方法包括:从输入到阻挡掩码中的期望信号和不期望信号中的至少一个生成输出信号,所述输出信号本身或与所述期望信号或所述不期望信号组合地提供掩码信号,其中所述不期望信号包括在所述期望信号中也出现的分量或所述期望信号包括在所述不期望信号中也出现的分量,并且所述输出信号是具有减少的在所述期望信号中也出现的分量或不具有所述分量的不期望信号,或具有减少的在所述不期望信号中也出现的分量或不具有所述分量的期望信号。

在查阅以下详细描述和随附附图后,其它系统、方法、特征和优点将对本领域的技术人员显而易见。所有此类附加的系统、方法、特征和优点旨在包括在本说明书内,在本发明的范围内,并且由随附权利要求书保护。

附图说明

参考以下附图和描述可更好地理解所述系统。在附图中,相似参考数字在各个不同视图中指示对应部分。

图1是示出示例性远场麦克风系统的示意图。

图2是示出可适用于图1中所示的远场麦克风系统的示例性声学回声消除器的示意图。

图3是示出示例性滤波和求和波束成形器的示意图。

图4是示出示例性波束操纵块的示意图。

图5是示出没有自适应阻挡滤波器的示例性自适应干扰消除器的结构的示意图。

图6是示出没有自适应阻挡滤波器的另一示例性自适应干扰消除器的结构的示意图。

图7是示出示例性自适应阻挡滤波器(系统)的结构的示意图。

图8是示出另一示例性自适应阻挡滤波器(系统)的结构的示意图。

图9是示出示例性语音阻挡掩码块的结构的示意图。

图10是示出被应用于自适应干扰消除器中的示例性自适应阻挡滤波器的结构的示意图。

图11是示出被应用于自适应干扰消除器中的示例性自适应阻挡滤波器的另一结构的示意图。

图12是示出被应用于自适应干扰消除器中的示例性自适应阻挡滤波器的结构的另一结构的示意图。

附图描述在一个或多个结构部件的上下文中的概念。附图中所示的各种部件可以以任何方式来实现,包括例如在适当硬件上执行的软件或固件程序代码、硬件和其任何组合。在一些实例中,各种部件可以反映在实际实现方式中对应部件的使用。某些部件可以分解为多个子部件,并且某些部件可以以与本文所示的顺序不同的顺序(包括并行方式)实现。

具体实施方式

已经发现,期望信号和干扰信号通常源自不同的空间位置。因此,波束成形技术可以用于改进音频应用中的信噪比。常见波束成形技术包括延迟和求和技术、使用算法(诸如griffiths-jim算法)的自适应有限脉冲响应(fir)滤波技术以及基于人类双耳听觉系统的建模的技术。

波束成形器可以根据对权重的选择方式而分类为数据独立或统计上最佳的。数据独立的波束成形器中的权重不依赖于阵列数据,并且被选择为针对所有信号/干扰情景呈现指定响应。统计上最佳的波束成形器基于对数据的统计来选择权重以优化波束成形器响应。数据统计通常是未知的并且可能随时间而变化,因此使用自适应算法来获得收敛到统计上最优的解的权重。计算考虑要求使用具有由大量传感器组成的阵列的部分地自适应的波束成形器。已提出了许多不同的方法来实现最佳的波束成形器。一般,统计上最佳的波束成形器在干扰源的方向上放置零点,试图将波束成形器输出端处的信噪比最大化。

在许多应用中,期望信号可能具有未知强度并且可能不总是存在的。在此类情况下,就不可能正确估计最大信噪比(snr)中的信号和噪声协方差矩阵。缺乏有关于期望信号的知识可能妨碍利用参考信号方法。可以通过将线性约束应用于加权矢量来克服这些限制。线性约束的使用是非常通用的方法,其允许对波束成形器的自适应响应进行广泛控制。并不存在通用线性约束设计方法,并且在许多应用中,不同类型的约束技术的组合可能是有效的。然而,试图找到单个最佳方式或设计线性约束的不同方式的组合可能限制依赖于波束成形应用的线性约束设计的技术的使用。

广义旁瓣消除器(gsc)技术提出用于解决与波束成形应用的线性约束设计技术相关联的缺点的替代方案。在本质上,gsc是用于将受约束的最小化问题改变成无约束的形式的机制。gsc使来自某个方向的期望信号未失真,同时抑制从其它方向辐射的不期望信号。然而,gsc使用双路径结构;用于实现指向期望信号的方向的固定波束成形器的期望信号路径;以及自适应地生成理想地纯噪声估计的不期望信号路径,理想地纯噪声估计从固定波束成形器的输出信号中减去,从而通过抑制噪声来增大其信噪比(snr)。

不期望信号路径,即,噪声估计,可以以两部分式方式实现。不期望信号路径的第一块被配置成从此块的输入信号移除或阻挡期望信号的剩余分量,此块在单个输入的情况下例如是自适应阻挡滤波器,或在使用多于一个输入信号的情况下是自适应阻挡矩阵。不期望信号路径的第二块还可包括自适应(多信道)干扰消除器(aic),以便生成单信道估计的噪声信号,然后从期望信号路径的输出信号(例如,固定波束成形器的任选地时延的输出信号)减去单信道估计的噪声信号。因此,可以抑制固定波束成形器的任选地时延的输出信号中含有的噪声,从而导致更好的snr,因为期望信号分量理想地不受到此处理的影响。这在且仅在噪声估计内的所有期望信号分量可成功地被阻挡的情况下才成立,在实践中,这种情况很少出现,并且因此表示与当前自适应波束成形算法相关的主要缺点中的一个。

可以例如通过从总声音信号中减去经估计的回声信号来实现声学回声消除。为了提供对实际回声信号的估计,已开发了在时域中操作且可采用处理时间离散信号的自适应数字滤波器的算法。此类自适应数字滤波器以参考预设的质量函数来优化限定滤波器的传输特性的网络参数的方式操作。例如通过参考参考信号来最小化自适应网络的输出信号的均方误差来实现这个质量函数。

现在参考图1,在示例性远场声音捕获系统中,来自期望声源101的对应于源信号x(n)(其中n是(离散)时间指数)的声音经由一个或多个扬声器(未示出)辐射,行进穿过房间(未示出),在那里用由传递函数h1(z)……hm(z)(其中z是频率指数)表示的对应房间脉冲响应(rir)100进行滤波,并且在由提供m个麦克风信号的m个(m是整数,例如,2、3或更大)麦克风拾取所得声音信号之前,可最终由噪声破坏。图1中所示的示例性远场声音捕获系统包括提供m个回声消除信号x1(n)……xm(n)的声学回声消除(aec)块200、提供b个(b是整数,例如,1、2或更大)波束成形信号b1(n)……bb(n)的后续的固定波束成形器(fb)块300、提供期望源波束信号b(n)(在本文中也被称为正波束输出信号b(n))和任选地不期望源波束信号bn(n)(在本文中也被称为负波束输出信号bn(n))的后续的波束操纵块400。块100、200、300和400可操作地彼此耦合以在块100和块400之间形成至少一个信号链(信号路径)。可操作地与波束操纵块400的输出耦合且被供应有不期望源波束信号bn(n)的任选的不期望信号(负波束)包括任选的自适应阻挡滤波器(abf)块500和后续的自适应干扰消除器(aic)块600,aic块可操作地与abf块500耦合。abf块500可以提供误差信号e(n)。或者,原始m个麦克风信号或aec块200的m个输出信号或fb块300的b个输出信号可以用作abf块500的输入信号(任选地覆盖有不期望源波束信号bn(n))以建立任选的多信道自适应阻挡矩阵(abm)块以及任选的多信道aic块。

也可操作地与波束操纵块400耦合且被供应有期望源波束信号b(n)的期望信号(正波束)路径包括串联连接的任选的延迟块102、减法器块103和(自适应)后置滤波器块104。自适应后置滤波器104接收来自减法器块103的输出信号u(n)和来自aic块600的控制信号b'(n)。任选的语音暂停检测器(未示出)可连接到自适应后置滤波器块104并在其下游,并且可连接到降噪(nr)块105和任选的自动化增益控制(agc)块106,块中的每一个(如果存在)可连接在语音暂停检测器上游。要注意,aec块200不是如图所示连接在fb块300上游,而是可连接在其下游,如果b<m,即,相较麦克风来说可用的波束成形器块更少,这就可能是有益的。另外,aec块200可以分成多个子块(未示出),例如,用于每个麦克风信号的短长度子块和在bs块400下游的用于期望源波束信号的长长度子块(未示出)以及任选地用于不期望源波束信号的另一长长度子块(未示出)。另外,系统不仅适用于仅具有如图所示的一个源的情况,而且可适用于与多个源结合地使用。例如,如果采用提供两个不相关信号的立体声源,那么aec块可以由立体声学回声消除器(saec)块(未示出)代替。

如从图1可以看出,通过n×m个rir滤波且可能被噪声干扰的n(=1)源信号x(n)用作aec块200的输入。图2描绘了单个麦克风(206)、单个扬声器(205)、aec块200的示例性实现。如本领域的技术人员将理解和了解,这种配置可扩展成包括多于一个麦克风206和/或多于一个扬声器205。由源信号x(n)表示的远端信号经由扬声器205行进通过具有传递函数(矢量)h(n)=(h1,…,hm)的回声路径201以提供回声信号xe(n)。此信号在求和节点209处被添加到近端信号v(n),近端信号可以含有背景噪声和近端语音,从而生成电麦克风(输出)信号d(n)。由自适应滤波器块202提供的经估计的回声信号在减法节点203处从麦克风信号d(n)中减去以提供误差信号eaec(n)。自适应滤波器202被配置成最小化误差信号eaec(n)。

具有阶数l-1的传递函数的fir滤波器202,其中l是fir滤波器的长度,用于对回声路径进行建模。传递函数被给出为

在块203处用于自适应滤波器的期望麦克风信号d(n)被给出为

d(n)=xt(n)h(n)+v(n),

其中x(n)=[x(n)x(n-1)…x(n-l+1)]t是含有输入信号x(n)的l个(l是整数)最近时间样本的实值矢量,,并且v(n)(即,近端信号)可以包括噪声。

使用先前的符号,反馈/回声误差信号被给出为

其中矢量h(n)和含有表示声学回声路径的滤波器系数和其在时间n上通过自适应滤波器系数进行的估计。消除滤波器使用例如最小均方(lms)算法或任何现有技术的递归算法来估计。使用lms类型算法的步长μ(n)的lms更新可表达为

一种简单而有效的波束成形技术是延迟和求和(ds)技术。再次参考图1,aec块200的输出用作固定波束成形器块300的输入xi(n),其中i=1、……、m。图3中示出了固定滤波器和求和(fs)波束成形器块300的一般结构,包括具有传递函数wi(l)中的至少一个的滤波器块302,i=1、……、m,并且wi(l)=[wi(0),…,wi(l-1)],l是fb内的滤波器的长度。如果滤波器块302实现期望(实际)延迟,那么输出波束成形器信号bj(n)(其中j=1、……、b)被给出为

其中m是麦克风的数量,并且对于每个(固定)波束成形器输出信号bj(n)(其中j=1、……、b)的情况下,每个麦克风具有相对于彼此的延迟τi,j。fs波束成形器可以包括加法器301,加法器经由具有传递函数wi(l)的滤波器块302接收输入信号xi(n)。

再次参考图1,由固定fs波束成形器块300输出的波束成形器信号bj(n)用作波束操纵(bs)块400的输入。来自固定波束成形器块300的每个信号取自不同的房间方向,并且可以具有不同的snr水平。波束操纵块400的输入信号bj(n)可以含有低频分量,在语音信号的情况下诸如低频震荡、直流(dc)偏移和不想要的话音发声。这些伪像可能影响bs块400的输入信号bj(n)并且应被去除。

或者,指向不期望信号(例如,噪声)源的波束(即,不期望信号波束)可以基于指向期望声源的波束(即,期望信号波束)而通过使其指向与指向期望声源的波束相反的方向来近似,这将产生使用较少的资源的系统以及具有完全相同的时间变化的波束。另外,这允许了两个波束绝不指向相同方向。

作为另一替代方案,替代仅使用指向期望源方向的波束(正波束),此波束与其相邻波束的总和可以用作正波束输出信号,因为它们全都含有高电平的期望信号,高电平的期望信号彼此相关并因此将通过求和来放大。另一方面,三个相邻波束中含有的噪声部分彼此无关并因此将通过求和来抑制。因此,三个相邻波束的最终输出信号将改进snr。

可另选地通过使用所有fb块的除表示正波束的输出信号之外的输出信号来生成指向不期望源方向(负波束)的波束。这产生了在期望信号源的方向上具有空间0的有效的方向响应。否则,可以应用全向字符,这就可能是有益的,因为噪声通常也以全向方式进入麦克风阵列,并且很少呈定向的形式。

另外,来自bs块的任选地延迟的期望信号可以形成输出信号的基础,并且因此输入到任选的自适应后置滤波器中。由aic块控制且递送经滤波的输出信号的自适应后置滤波器可以任选地输入到可实现已知的频谱减法的后续的单信道降噪块(例如,图1中的nr块105)和任选的(例如,最终的)自动化增益控制块(例如,图1中的agc块106)中。

参考图4,在波束操纵块400中,其输入信号bj(n)使用高通(hp)滤波器和任选的低通(lp)滤波器块401来进行滤波,以便阻挡受噪声影响或不含有有用信号分量(例如,某些语音信号分量)的信号分量。来自滤波器块401的输出可能因噪声而具有幅度变化,这可能会在信号bj(n)内的各点间引入快速随机幅度变化。在此情况下,降噪可能是有用的(例如,在图4中所示的平滑块402中)。

通过在平滑块402中应用例如低通无限脉冲响应(iir)滤波器或移动平均(ma)有限脉冲响应(fir)滤波器(均未示出)来平滑来自滤波器块401的滤波信号,从而减少高频分量并几乎无变化地传送低频分量。平滑块402输出平滑信号,平滑信号仍可含有某种级别的噪声,并且因此可能导致如上所述的值得注意的明显间断。语音信号的电平典型地明显地不同于背景噪声的电平的变化,特别是由于语音信号的电平变化的动态范围更大并且发生在比背景噪声的电平变化短得多的间隔中的事实。因此,噪声估计块403中的线性平滑滤波器将涂抹掉期望信号(例如,音乐或话音信号)的急剧变化,并且滤除噪声。在许多应用中,对音乐或语音信号的这种涂抹是不可接受的,因此可以将非线性平滑滤波器(未示出)应用于噪声估计块403中的平滑信号以克服上述伪像。平滑块402的输出信号bj(n)中的数据点被修改为使得比紧邻点高(可能是由于噪声)的单独点减少,并且比相邻点低的各个点增加。这导致了更平滑的信号(以及对信号变化的更缓慢的阶跃响应)。

接着,基于来自平滑块402的平滑信号和来自噪声估计块403的经估计的背景噪声信号,计算snr值的变化。使用snr的变化,可以将噪声源与期望语音或音乐信号区分开。例如,低snr值可以表示各种噪声源,诸如空调、风扇、开窗或电气装置(诸如计算机等)。可以在时域中或在时域中或在子带频域中估计snr。

在比较器块405中,将来自块404的输出snr值与预定阈值进行比较。如果当前snr值大于预定阈值,那么指示例如期望语音信号的标志将被设定为例如“1”。或者,如果当前snr值小于预定阈值,那么指示不期望信号(诸如来自空调、风扇、开窗或电气装置(诸如计算机)的噪声)的标记将被设定为‘0’。

来自块404和405的snr值经由路径#1到路径#b而传送到控制器块406。控制器块406将随时间而收集的多个snr(低和高两者)值的指数与比较器块405中的状态标志进行比较。在预定时段内收集最大值和最小值的直方图。直方图中的最小值和最大值表示至少两个不同的输出信号。至少一个信号指向由s(n)表示的期望源,并且至少一个信号指向由i(n)表示的干扰源。

如果控制器块406中的低和高snr值的指数随时间而变化,那么发起淡入淡出过程,其允许了从一个输出信号到另一输出信号的平滑迁跃,而不生成声学伪像。bs块400的输出表示随时间而选择的期望信号和任选地不期望信号波束。在此,期望信号波束表示具有最高snr的固定波束成形器输出b(n)。任选的不期望波束表示具有最低snr的固定波束成形器输出bn(n)。

bs块400的输出含有具有高snr(正波束)的信号(其可以由任选的自适应阻挡滤波器(abf)块500用作参考)和具有低snr的任选的信号,从而形成用于任选的abf块500的第二输入信号。abf滤波器块500可以使用最小均方(lms)算法控制的滤波器来自适应地从信号bn(n)(表示不期望源波束)中减去由参考信号b(n)(表示期望源波束)表示的感兴趣信号,并且提供误差信号ei(n)。从abf块500获得的误差信号ei(n)被传递到自适应干扰消除器(aic)块600,aic块自适应地去除与来自在期望信号路径中的固定波束成形器300的波束成形器输出的误差信号相关的信号分量。如已提到,其它信号可另选地或另外地用作abm块的输入。然而,可以部分地或完全地省略包括任选的abm、aic和apf块的自适应波束成形器块。

首先,aic块600使用自适应滤波器(未示出)计算干扰信号。然后,例如通过减法器103从任选地延迟的(具有延迟102)参考信号b(n)中减去此自适应滤波器的输出来消除参考信号b(n)中的剩余干扰和噪声分量。最后,自适应后置滤波器104可以设置在减法器103的下游以用于减少统计噪声分量(不具有不同的自相关)。如在abf块500中那样,可以使用自适应lms算法来更新aic块600中的滤波器系数。可以约束aic块600、abf块500和aec块中的至少一个中的滤波器系数的范数以防止它们变得过大。

图5示出了用于从期望源波束(正波束)信号b(n)中消除噪声的示例性系统。因此,包括在信号b(n)中的噪声分量(由图5中的信号z(n)表示)由自适应系统提供,自适应系统包括滤波器控制块700,滤波器控制块通过滤波器控制信号b"(n)来控制可控制滤波器800。通过减法器块103从期望信号b(n)中减去信号b(n),这任选地在延迟块102中延迟作为经延迟的期望信号b(n-γ)之后进行,以提供加法器输出信号u(n),加法器输出信号在一定程度上含有减少的不期望噪声。表示不期望信号波束并理想地仅含有噪声而没有有用信号(诸如语音)的信号bn(n)用作滤波器控制块700的参考信号,滤波器控制块还接收加法器输出信号作为输入。已知的归一化最小均方(nlms)算法可以用于从由bs块400提供的期望信号b(n)中滤除噪声。期望信号b(n)中的噪声分量由包括滤波器控制块700和可控制滤波器800的自适应系统估计。可控制滤波器800在滤波器控制块700的控制下滤除不期望信号bn(n)以提供对期望信号b(n)中含有的噪声的估计,在减法器块103中从(任选地)延迟的期望信号b(n-γ)中减去该估计以进一步减少期望信号b(n)中的噪声。这继而将增大期望信号b(n)的信噪比(snr)。来自滤波器控制块700的滤波器控制信号b"(n)还用于控制自适应后置滤波器104。图5中所示的系统不采用任选的abf或abm块,因为如果相较期望信号来说,它对提高纯噪声信号的质量影响很小,那么就可省略由abf或abm块执行的对不期望信号的信号分量的附加阻挡。因此,根据不期望信号bn(n)的质量在不降低自适应波束成形器的性能的情况下省略abf或abm块可以是合理的。

参考图6,用于消除来自期望源波束(正波束)(即,来自表示正波束b(n)的信号)的噪声的示例性另选的aic包括可控制滤波器601和滤波器控制器602,可控制滤波器具有传递函数w(n),滤波器控制器控制可控制滤波器601(即,其传递函数w(n))。可控制滤波器601和滤波器控制器602两者接收表示正波束b(n)的信号并组合地形成自适应滤波器。滤波器控制器602还接收减法器603的输出信号,减法器的输出信号是表示包含在期望源波束中的噪声的经估计的噪声信号e(n)。减法器603接收表示负波束bn(n)(即,不期望源波束)的信号和由可控制滤波器601输出的信号。

在图6中所示的系统中,表示正波束b(n)的信号(其主要地含有有用信号(语音))结合表示负波束bn(n)的信号(其主要地含有不期望信号部分(噪声))用作自适应滤波器的参考信号(示例性地示出在时域版本中),参考信号利用nlms算法进行滤波器更新。采用abf的目的是,通过使平方估计噪声信号e(n)最小化,调整自适应滤波器的传递函数w(n),使得其输出允许模拟仍被含于表示负波束bn(n)的信号中的有用信号部分的信号。这意味着,仍被含于表示负波束bn(n)的信号中的有用信号(例如,语音)的分量通过用传递函数w(n)对参考信号滤波来进行估计。滤波后的参考信号从表示负波束bn(n)的信号中减去以从表示负波束bn(n)的信号中去除有用信号(语音)的残余部分。因此,abf的目的是阻挡表示负波束bn(n)的信号内的剩余语音信号部分以最终地得到没有有用(语音)信号分量的噪声(即,然后可用作连续aic的参考的经估计的噪声信号e(n))的估计。通过将不具有语音信号分量的参考提供到aic提,可减少或避免aic对语音信号部分的不期望抑制。因此,aic仅抑制了不期望(噪声)部分,这导致了其输出信号的snr增大。不幸地,正波束和负波束内的语音信号的相关性有时可能无法令人满意。因此,由于自适应系统依赖足够的相关性,因此从负波束中去除语音部分可能无法成功。在下文中,描述abf,abf不太易于使信号相关。

参考图7,示例性abf包括两个域变换块701和702,其中表示正波束b(n)的信号和表示负波束bn(n)的信号从时域变换到谱域,即,变换为频谱正波束信号b(ω)和频谱负波束信号bn(ω)。频谱正波束信号b(ω)被供应到语音阻挡掩码(abm)块703,abm块确定(计算)频谱语音阻挡掩码mask(ω)。语音阻挡掩码mask(ω)例如通过输出频谱估计的噪声信号e(ω)的乘法器704与频谱负波束信号bn(ω)相乘。任选地,频谱正波束信号b(ω)在时间上被延迟块705延迟以输出延迟的频谱正波束信号bd(ω),其为b(ω)·e-jωγ,其中γ是延迟时间并且与频谱估计的噪声信号e(ω)一起被供应到自适应干扰消除器(aic)块706,诸如图1中所示的aic块600。aic块706可以包括自适应后置滤波器(apf)块(未示出)并且输出频谱输出信号n(ω)。

因此,确定(计算)期望加权(即,分别是阻挡掩码(n)、频谱阻挡掩码mask(ω))的一种示例性方式是使用表示正波束b(n)的信号作为基线信号,因为此信号具有最佳snr,这允许了更稳健地计算阻挡掩码mask(n),然后可将其应用于表示负波束bn(n)的信号,或更一般地说,可将其应用于具有最差snr的信号,以便阻止仍被含于其中的潜在剩余语音信号部分。或者,只有具有最差snr的信号可以用作基线信号,例如,表示负波束bn(n)的信号,其被输入到abm块703中,以便分别生成期望语音阻挡掩码mask(n)、频谱阻挡掩码mask(ω),如图8所示。在此,源自频谱负波束信号bn(ω)的频谱阻挡掩码mask(ω)被供应到aic块706作为频谱估计的噪声信号e(ω)。

参考图9,可适用于作为在上文结合图7和图8所述的自适应阻挡滤波器块中或在任何其它应用中的语音阻挡掩码块703的时变语音阻挡掩码块的示例性实现方式可以包括任选的域变换块901,其中输入信号in(n)从时域变换到谱域,即,变换为频谱输入信号in(ω)(例如,通过快速傅里叶变换(fft)),除非频谱输入信号已经可用,诸如在上文结合图7和图8所述的abf块中的信号b(ω)或bn(ω)。输入信号可以是任何信号,例如,麦克风信号,并且可以包括具有最佳或最差snr的信号。频谱输入信号in(ω)(即,其频谱)被供应到用于(时间)平滑频谱的每个频谱线(仓)的任选的频谱平滑块902。根据是否存在任选的频谱平滑块902,用于时间平滑的后续的时间平滑块903连接到任选的频谱平滑块902(如图所示)或连接到频谱变换块901(未示出)。平滑信号可以包括对信号进行滤波以捕获信号中的重要模式,而省去嘈杂、精细尺度和/或快速变化的模式。

背景噪声估计块904连接到时间平滑块903并在其下游,并且可以利用允许用于确定或估计输入信号in(n)中含有的背景噪声的任何已知方法。在所示实例中,要估计的信号(即,频谱输入信号in(ω))在谱域中,使得背景噪声估计块904被设计为在谱域中操作。

在连接在背景噪声估计块904下游的频谱信噪比确定(计算)块905中,处理输入到背景噪声估计块904中的信号和由背景噪声估计块输出的信号以提供频谱信噪比snr(ω)。例如,频谱信噪比确定块905可以将输入到背景噪声估计块904中的信号除以由背景噪声估计块904输出的信号以确定频谱信噪比snr(ω)。

在连接到频谱信噪比确定块905并在其下游的第一估计块906中,将在谱域中的经估计的信噪比snr(ω)与预定信噪比阈值snrth进行比较(例如,在预定频带内)。如果经估计的信噪比snr(ω)超过信噪比阈值snrth,那么由第一估计块906输出的加权掩码i(ω)被设定为预定最大信噪比值,例如,高估因子maxsnrth。否则,加权掩码i(ω)可以被设定为恒定值,例如,1。第一估计块906还输出信噪比掩码snrmask(ω),信噪比掩码得自经估计的信噪比snr(ω),其方法是将经估计的信噪比snr(ω)除以信噪比阈值snrth。

在噪声阻挡块907中,snr驱动的掩码(即,来自第一估计快906的信噪比掩码snrmask(ω))被修改以生成修改一次的snr掩码snrmask'(ω),例如,通过在加权掩码i(ω)为1的情况下将来自第一估计块906的信噪比掩码snrmask'(ω)设定为1、否则就设定为snrmask(ω)来进行修改。然后,将修改一次的信噪比掩码snrmask'(ω)从1中减去以产生修改两次的信噪比掩码snrmask”(ω)。

在连接到噪声阻挡块907并在其下游的任选的第二估计块908中,将修改两次的snr掩码snrmask”(ω)与最小阈值minth进行比较。如果修改两次的snr掩码snrmask”(ω)超过最小阈值minth,那么将修改三次的snr掩码snrmask”'(ω)设定为最小阈值minth,否则修改三次的snr掩码snrmask”'(ω)呈现修改两次的snr掩码snrmask”(ω)。

在图9中所示的阻挡掩码块的第一块中,估计在频域中的时变snr值(即,频谱snr或噪声频谱的值),然后将其与预定可调谐的snr阈值snrth进行比较。根据此比较的结果,如果当前频谱snr(ω)没有超过给定snr阈值snrth,那么生成加权掩码i(ω),其值可以被设定为等于1的中性权重。否则,加权掩码i(ω)被设定为1。加权掩码i(ω)指示超过给定阈值snrth值1的仓,而所有剩余谱线则由0表示。在侧路径中,当前估计的频谱snr值snr(ω)可按照给定snr阈值snrth来缩放,其产生了期望掩码snrmask(ω)=snr(ω)/snrth。接着,掩码将根据加权掩码i(ω)的权重被修改成修改一次的频谱snr掩码snrmask'(ω),如果i(ω)=1,其呈现为1,否则其呈现为snrmask(ω)。将修改一次的频谱snr掩码snrmask'(ω)从1中减去以形成修改两次的频谱snr掩码snrmask”(ω)。在频谱snr掩码snrmask(ω)的所有谱线处(在此加权掩码i(ω)等于1),修改一次的频谱snr掩码snrmask'(ω)也将被设定为1,之后将其从恒定值1中减去,这有效地导致频谱snr掩码snrmask(ω)反转。所得到的修改两次的掩码snrmask”(ω)将任选地被限制于下限(其由最小阈值minth给出),之后它实际上用作期望语音阻挡掩码,期望语音阻挡掩码是修改三次的掩码snrmask”'(ω)。

换句话说,基于当前估计的频谱snr信号snr(ω)(其被归一化到给定阈值snrth并最终地通过将其从1中减去来反转,生成能够抑制诸如语音的脉冲信号的掩码。因此,snr信号snr(ω)的超过给定阈值snrth的部分指示由信号i(ω)中的一个标记的此类脉冲信号,否则其设定为0。通过在将归一化snr信号从1中减去之前将归一化snr信号限制为最大值为1,指示为脉冲的所有信号部分都将产生等于0的语音阻挡掩码,并且因此将被完全地阻挡。所有剩余频谱部分将会造成权重位于1≤snrmask(ω)≤0的范围内,这具体地根据瞬时归一化snr信号snr(ω)/snrth。任选地,可以使有效范围的下限调整了最小阈值minth,从而造成1≤snrmask(ω)≤minth的新的有效范围。

图10示出了结合图7所述的频谱abm和结合图5所述的aic块的具有附加的频谱apf块1001(例如,其对应于图1中所示的apf块104)和附加的域变换块1002的频域(频谱)版本的组合,其中输出信号n(ω)从频域变换为在时域中的信号n(n)。因此,图5中的信号z(n)对应于图10中的频谱信号z(ω)。此外,为了简单起见,图5中所示的aic块的时域版本的参考数字也会在用于对应部分的图10至图12中所示的频域(频谱)版本中使用。

图11示出了结合图8所述的abm和结合图5所述的具有附加的频谱apf块1001和附加的域变换块1002的aic块的频域版本的组合,其中输出信号n(ω)从频域变换为在时域中的信号n(n)。同样,图5中的信号z(n)对应于图11中的频谱信号z(ω)。在此,所得到的加权掩码(即,阻挡掩码mask(ω))被应用于本身,即,被应用于相应的输入信号,诸如频谱负波束信号bn(ω),以便阻挡仍被含于输入信号中的剩余语音信号以生成参考信号,即,频谱估计的噪声信号e(ω),ω是针对连续的aic块。可以利用上面结合图9所述的系统和方法来生成阻挡掩码mask(ω)。

应注意,在上述两种情况下,用于aic级的参考信号(即基本上无语音的噪声信号)经受频谱减法,这意味着e(ω)可能含有所谓的音乐音调,即,音乐噪声。不过,由于这些音乐音调与aic级的期望信号(其由正波束信号b(ω)e-jωγ的任选地时延的版本表示)之间无相关性,因此这将不会在aic级的输出信号被供应到后续的自适应后置滤波器块之前影响aic级的输出信号。因此,上述的系统和方法提供降噪,而无其它不可避免的声学伪像,诸如音乐音调。

避免在aic块内无意中抑制期望信号部分(诸如语音)的另一种可能性是使用来自abm块的语音阻挡掩码作为频谱相关时变漏泄信号leakage(ω)输入到aic块中,例如,aic块的更新部分(即,滤波器控制块700),其中频谱估计的噪声信号e(ω)是频谱负波束信号bn(ω)。图12示出了基于图10中所示的系统的示例性实现方式,其中具有最佳snr的信号(即,频谱正波束信号b(ω))用作abm级的输入,但是也可使用其它信号。此选项可以通过以下等式进行描述:

其中w(n,k)是时间相关和频率相关的自适应滤波器的传递函数,leakage(n,k)是时间相关和频率相关的漏泄,μ(n,k)是时间相关和频率相关的自适应步长,px(n,k)是输入信号的时间相关和频率相关的能量,δ是小值以避免除以0,e(n,k)是时间相关和频率相关的误差信号,(.)*是复杂的共轭运算,x(n,k)是时间相关和频率相关的输入信号,n是离散时间指数,k是离散频率指数(仓)。

已经出于说明和描述的目的呈现了实施方案的描述。可鉴于以上描述执行或可通过实践方法获得实施方案的合适的修改和变化。例如,除非另外指出,否则所述方法中的一种或多种可由合适的装置和/或装置的组合执行。所述方法和相关联的动作也可按照除本申请中所述的顺序之外的各种顺序、并行地和/或同时地执行。所述系统本质上是示例性的,并且可以包括附加的元件和/或省略元件。

如本申请中所用,以单数形式陈述并用字词“一个”或“一种”引出的元件或步骤应理解为并不排除多个所述元件或步骤,除非明确指出存在这种排除情况。此外,对本公开的“一个实施方案”或“一个实例”的参考并非意图被解释为排除也并入了陈述特征的另外实施方案的存在。术语“第一”、“第二”和“第三”等仅用作为标记,而非意在对其对象强加数值要求或特定位置顺序。

本发明的实施方案大体上提供了多个电路、电气装置和/或至少一个控制器。所有对电路、至少一个控制器和其它电气装置以及由它们各自提供的功能的提及不旨在受限于仅涵盖本文中所示和所述的内容。虽然特定标记可指派给所公开的各种电路、控制器和其它电气装置,但是这些标记并不旨在限制各种电路、控制器和其它电气装置的操作范围。此类电路、控制器和其它电气装置可以基于所期望的特定类型的电气实现方式而彼此组合和/或以任何方式分离。

块被理解为具有以下中的至少一个的硬件系统或其元件:执行软件的处理单元和用于实现相应的期望信号传送或处理功能的专用电路结构。因此,系统的部分或全部可实现为由处理器或可编程数字电路执行的软件和固件。将认识到,如本文公开的任何系统可以包括任何数量的微处理器、集成电路、存储器装置(例如,闪存、随机存取存储器(ram)、只读存储器(rom)、电可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)或其它合适的变型)和软件,它们彼此协作以执行本文公开的操作。另外,所公开的任何系统可以利用任一个或多个微处理器来执行计算机程序,计算机程序体现在非瞬时计算机可读介质中,非瞬时计算机可读介质被编程为执行所公开的任何数量的功能。另外,本文提供的任何控制器包括外壳和各种数量的微处理器、集成电路和存储器装置(例如,闪存、随机存取存储器(ram)、只读存储器(rom)、电可编程只读存储器(eprom)和/或电可擦除可编程只读存储器(eeprom))。

虽然已描述了本发明的各种实施方案,但是将对本领域的普通技术人员来说显而易见的是,在本发明的范围内更多的实施方案和实现方式是可能的。具体地讲,技术人员将认识到来自不同实施方案的各种特征的可互换性。虽然在某些实施方案和实例的上下文中已公开了这些技术和系统,但将理解,这些技术和系统可以超出具体公开的实施方案而扩展到其它实施方案和/或其用途和明显修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1