单信道降噪的制作方法

文档序号:16813583发布日期:2019-02-10 14:01阅读:317来源:国知局
单信道降噪的制作方法

本公开涉及单信道降噪系统和方法(一般称为“系统”)。



背景技术:

用于远场声音捕获的系统(也被称为远场麦克风或远场麦克风系统)适于记录来自定位在距远场麦克风较远的距离(例如,几米)处的期望声源的声音。声源与远场麦克风之间的距离越大,期望声音噪声比越低。术语“噪声”在本案中包括不携带信息、想法或情绪的声音,例如,没有语音或音乐的声音。如果噪声是不期望的,那么它也被称为噪声。当语音或音乐被引入充满噪声的环境(诸如车辆、家庭或办公室内部的)中时,内部存在的噪声可能对期望的语音通信或音乐呈现有不期望的干扰影响。降噪通常是不期望信号的衰减,但是也可包括期望信号的放大。期望信号可以是语音信号,而不期望信号则可以是环境中干扰期望信号的任何声音。已经结合降噪来使用了三种主要方法:定向波束成形、频谱减法和基于音高的语音增强。设计用于接收空间上传播的信号的系统通常遇到干扰信号的存在。如果期望信号和干扰源占用相同的时间频带,那么就不能使用时间滤波来将期望信号与干扰信号分离。期望改进降噪系统和方法。



技术实现要素:

一种降噪系统包括:检测器块,所述检测器块被配置成基于输入信号的信噪比频谱而检测所述输入信号中的噪声分量;以及掩蔽块,所述掩蔽块可操作地与所述检测器块耦合,并且被配置成生成最终频谱噪声去除掩码并在检测到所述输入信号中的噪声分量的情况下将所述最终频谱噪声去除掩码应用到所述输入信号,所述最终频谱噪声去除掩码被配置成在应用时抑制所述输入信号中的所述噪声分量。

一种降噪方法包括:基于输入信号的信噪比频谱而检测所述输入信号中的噪声分量;以及成最终频谱噪声去除掩码并在检测到所述输入信号中的噪声分量的情况下将所述最终频谱噪声去除掩码应用到所述输入信号,所述最终频谱噪声去除掩码被配置成在应用时抑制所述输入信号中的所述噪声分量。

在查阅以下详细描述和随附附图后,其它系统、方法、特征和优点将对本领域的技术人员显而易见。所有这些额外的系统、方法、特征和优点旨在包括在本说明书内,在本发明的范围内,并且由所附权利要求书保护。

附图说明

参考以下附图和描述可更好地理解所述系统。在附图中,相似参考数字在各个不同视图中指示对应部分。

图1是示出示例性远场麦克风系统的示意图。

图2是示出可适用于图1中所示的远场麦克风系统的示例性声学回声消除器的示意图。

图3是示出示例性滤波和求和波束成形器的示意图。

图4是示出示例性波束操纵块的示意图。

图5是示出具有自适应后置滤波器且没有自适应阻挡滤波器的示例性自适应干扰消除器的简化结构的示意图。

图6是示例性单信道降噪系统的示意图。

附图描述在一个或多个结构部件的上下文中的概念。附图中所示的各种部件可以以任何方式实现,包括例如在适当硬件、硬件和其任何组合上执行的软件或固件程序代码。在一些实例中,各种部件可以反映在实际实现方式中对对应部件的使用。某些部件可以分解为多个子部件,并且某些部件可以以与本文所示的顺序不同的顺序(包括并行方式)实现。

具体实施方式

已经发现,期望信号和干扰信号通常源自不同的空间位置。因此,波束成形技术可以用于改进音频应用中的信噪比。常见波束成形技术包括延迟和求和技术、使用算法(诸如griffiths-jim算法)的自适应有限脉冲响应(fir)滤波技术以及基于人类双耳听觉系统的建模的技术。

波束成形器可以根据对权重的选择方式而分类为数据独立或统计上最佳的。数据独立的波束成形器中的权重不依赖于阵列数据,并且被选择为针对所有信号/干扰情景呈现指定响应。统计上最佳的波束成形器基于对数据的统计来选择权重以优化波束成形器响应。数据统计通常是未知的并且可能随时间而变化,因此使用自适应算法来获得收敛到统计上最优的解的权重。计算考虑要求使用具有由大量传感器组成的阵列的部分地自适应的波束成形器。已提出了许多不同的方法来实现最佳的波束成形器。一般,统计上最佳的波束成形器在干扰源的方向上放置零点,试图将波束成形器输出端处的信噪比最大化。

在许多应用中,期望信号可能具有未知强度并且可能不总是存在的。在此类情况下,就不可能正确估计最大信噪比(snr)中的信号和噪声协方差矩阵。缺乏有关于期望信号的知识可能妨碍利用参考信号方法。可以通过将线性约束应用于加权矢量来克服这些限制。线性约束的使用是非常通用的方法,其允许对波束成形器的自适应响应进行广泛控制。并不存在通用线性约束设计方法,并且在许多应用中,不同类型的约束技术的组合可能是有效的。然而,试图找到单个最佳方式或设计线性约束的不同方式的组合可能限制依赖于波束成形应用的线性约束设计的技术的使用。

广义旁瓣消除器(gsc)技术提出用于解决与波束成形应用的线性约束设计技术相关联的缺点的替代方案。在本质上,gsc是用于将受约束的最小化问题改变成无约束的形式的机制。gsc使来自某个方向的期望信号未失真,同时抑制从其它方向辐射的不期望信号。然而,gsc使用双路径结构;用于实现指向期望信号的方向的固定波束成形器的期望信号路径;以及自适应地生成理想地纯噪声估计的不期望信号路径,理想地纯噪声估计从固定波束成形器的输出信号中减去,从而通过抑制噪声来增大其信噪比(snr)。

不期望信号路径,即,噪声估计,可以以两部分式方式实现。不期望信号路径的第一块被配置成从此块的输入信号移除或阻挡期望信号的剩余分量,此块在单个输入的情况下例如是自适应阻挡滤波器,或在使用多于一个输入信号的情况下是自适应阻挡矩阵。不期望信号路径的第二块还可包括自适应(多信道)干扰消除器(aic),以便生成单信道估计的噪声信号,然后从期望信号路径的输出信号(例如,固定波束成形器的任选地时延的输出信号)减去单信道估计的噪声信号。因此,可以抑制固定波束成形器的任选地时延的输出信号中含有的噪声,从而导致更好的snr,因为期望信号分量理想地不受到此处理的影响。这在且仅在噪声估计内的所有期望信号分量可成功地被阻挡的情况下才成立,在实践中,这种情况很少出现,并且因此表示与当前自适应波束成形算法相关的主要缺点中的一个。

可以例如通过从总声音信号中减去经估计的回声信号来实现声学回声消除。为了提供对实际回声信号的估计,已开发了在时域中操作且可采用处理时间离散信号的自适应数字滤波器的算法。此类自适应数字滤波器以参考预设的质量函数来优化限定滤波器的传输特性的网络参数的方式操作。例如通过参考参考信号来最小化自适应网络的输出信号的均方误差来实现这个质量函数。

现在参考图1,在示例性远场声音捕获系统中,来自期望声源101的对应于源信号x(n)(其中n是(离散)时间指数)的声音经由一个或多个扬声器(未示出)辐射,行进穿过房间(未示出),在那里用由传递函数h1(z)……hm(z)(其中z是频率指数)表示的对应房间脉冲响应(rir)100进行滤波,并且在由提供m个麦克风信号的m个(m是整数,例如,2、3或更大)麦克风拾取所得声音信号之前,可最终由噪声破坏。图1中所示的示例性远场声音捕获系统包括提供m个回声消除信号x1(n)……xm(n)的声学回声消除(aec)块200、提供b个(b是整数,例如,1、2或更大)波束成形信号b1(n)……bb(n)的后续的固定波束成形器(fb)块300、提供期望源波束信号b(n)(在本文中也被称为正波束输出信号b(n))和任选地不期望源波束信号bn(n)(在本文中也被称为负波束输出信号bn(n))的后续的波束操纵块400。块100、200、300和400可操作地彼此耦合以在块100和块400之间形成至少一个信号链(信号路径)。可操作地与波束操纵块400的输出耦合且被供应有不期望源波束信号bn(n)的任选的不期望信号(负波束)包括任选的自适应阻挡滤波器(abf)块500和后续的自适应干扰消除器(aic)块600,(aic)块可操作地与abf块500耦合。abf块500可以提供误差信号e(n)。或者,原始m个麦克风信号或aec块200的m个输出信号或fb块300的b个输出信号可以用作abf块500的输入信号(任选地覆盖有不期望源波束信号bn(n))以建立任选的多信道自适应阻挡矩阵(abm)块以及任选的多信道aic块。

也可操作地与波束操纵块400耦合且被供应有期望源波束信号b(n)的期望信号(正波束)路径包括串联连接的任选的延迟块102、减法器块103和(自适应)后置滤波器块104。自适应后置滤波器104接收减法器块103的输出信号和来自aic块600的控制信号。任选的语音暂停检测器(未示出)可连接到自适应后置滤波器块104并在其下游,并且可连接到降噪(nr)块105和任选的自动化增益控制(agc)块106,块中的每一个(如果存在)可连接在语音暂停检测器上游。要注意,aec块200不是如图所示连接在fb块300上游,而是可连接在其下游,如果b<m,即,相较麦克风来说可用的波束成形器块更少,这就可能是有益的。另外,aec块200可以分成多个子块(未示出),例如,用于每个麦克风信号的短长度子块和在bs块400下游的用于期望源波束信号的长长度子块(未示出)以及任选地用于不期望源波束信号的另一长长度子块(未示出)。另外,系统不仅适用于仅具有如图所示的一个源的情况,而且可适用于与多个源结合地使用。例如,如果采用提供两个不相关信号的立体声源,那么aec块可以由立体声学回声消除器(saec)块(未示出)代替。

如从图1可以看出,通过n×m个rir滤波且可能被噪声干扰的n(=1)源信号x(n)用作aec块200的输入。图2描绘了单个麦克风(206)、单个扬声器(205)、aec块200的示例性实现。如本领域的技术人员将理解和了解,这种配置可扩展成包括多于一个麦克风206和/或多于一个扬声器205。由源信号x(n)表示的远端信号经由扬声器205行进通过具有传递函数(矢量)h(n)=(h1,…,hm)的回声路径201以提供回声信号xe(n)。此信号在求和节点209处被添加到近端信号v(n),近端信号可以含有背景噪声和近端语音,从而生成电麦克风(输出)信号d(n)。由自适应滤波器块202提供的经估计的回声信号在减法节点203处从麦克风信号d(n)中减去以提供误差信号eaec(n)。自适应滤波器202被配置成最小化误差信号eaec(n)。

具有阶数l-1的传递函数的fir滤波器202(其中l是fir滤波器的长度)用于对回声路径进行建模。传递函数被给出为

在块203处用于自适应滤波器的期望麦克风信号d(n)被给出为

d(n)=xt(n)h(n)+v(n),

其中x(n)=[x(n)x(n-1)...x(n-l+1)]t是含有输入信号x(n)的l个(l是整数)最近时间样本的实值矢量,并且v(n)(即,近端信号)可以包括噪声。

使用先前的符号,反馈/回声误差信号被给出为

其中矢量h(n)和含有表示声学回声路径的滤波器系数和其在时间n上通过自适应滤波器系数进行的估计。消除滤波器使用例如最小均方(lms)算法或任何现有技术的递归算法来估计。使用lms类型算法的步长μ(n)的lms更新可表达为

一种简单而有效的波束成形技术是延迟和求和(ds)技术。再次参考图1,aec块200的输出用作固定波束成形器块300的输入xi(n),其中i=1、……、m。图3中示出了固定滤波器和求和(fs)波束成形器块300的一般结构,包括具有传递函数wi(l)中的至少一个的滤波器块302,i=1、……、m,并且wi(l)=[wi(0),……,wi(l-1)],l是fb内的滤波器的长度。如果滤波器块302实现期望(实际)延迟,那么输出波束成形器信号bj(n)(j=1、……、b)被给出为

其中m是麦克风的数量,并且对于每个(固定)波束成形器输出信号bj(n),在j=1、……、b的情况下,每个麦克风具有相对于彼此的延迟τi,j。fs波束成形器可以包括加法器301,加法器经由具有传递函数wi(l)的滤波器块302接收输入信号xi(n)。

再次参考图1,由固定fs波束成形器块300输出的波束成形器信号bj(n)用作波束操纵(bs)块400的输入。来自固定波束成形器块300的每个信号取自不同的房间方向,并且可以具有不同的snr水平。波束操纵块400的输入信号bj(n)可以含有低频分量,在语音信号的情况下诸如低频震荡、直流(dc)偏移和不想要的话音发声。这些伪像可能影响bs块400的输入信号bj(n)并且应被去除。

或者,指向不期望信号(例如,噪声)源的波束(即,不期望信号波束)可以基于指向期望声源的波束(即,期望信号波束)而通过使其指向与指向期望声源的波束相反的方向来近似,这将产生使用较少的资源的系统以及具有完全相同的时间变化的波束。另外,这允许了两个波束绝不指向相同方向。

作为另一替代方案,替代仅使用指向期望源方向的波束(正波束),此波束与其相邻波束的总和可以用作正波束输出信号,因为它们全都含有高电平的期望信号,高电平的期望信号彼此相关并因此将通过求和来放大。另一方面,三个相邻波束中含有的噪声部分彼此无关并因此将通过求和来抑制。因此,三个相邻波束的最终输出信号将改进snr。

可另选地通过使用所有fb块的除表示正波束的输出信号之外的输出信号来生成指向不期望源方向(负波束)的波束。这产生了在期望信号源的方向上具有空间0的有效的方向响应。否则,可以应用全向字符,这就可能是有益的,因为噪声通常也以全向方式进入麦克风阵列,并且很少呈定向的形式。

另外,来自bs块的任选地延迟的期望信号可以形成输出信号的基础,并且因此输入到任选的自适应后置滤波器中。由aic块控制且递送经滤波的输出信号的自适应后置滤波器可以任选地输入到可实现已知的频谱减法的后续的单信道降噪块(例如,图1中的nr块105)和任选的(例如,最终的)自动化增益控制块(例如,图1中的agc块106)中。

参考图4,在波束操纵块400中,其输入信号bj(n)使用高通(hp)滤波器和任选的低通(lp)滤波器块401来进行滤波,以便阻挡受噪声影响或不含有有用信号分量(例如,某些语音信号分量)的信号分量。来自滤波器块401的输出可能因噪声而具有幅度变化,这可能会在信号bj(n)内的各点间引入快速随机幅度变化。在此情况下,降噪可能是有用的(例如,在图4中所示的平滑块402中)。

通过在平滑块402中应用例如低通无限脉冲响应(iir)滤波器或移动平均(ma)有限脉冲响应(fir)滤波器(均未示出)来平滑来自滤波器块401的滤波信号,从而减少高频分量并几乎无变化地传送低频分量。平滑块402输出平滑信号,平滑信号仍可含有某种级别的噪声,并且因此可能导致如上所述的值得注意的明显间断。语音信号的电平典型地明显地不同于背景噪声的电平的变化,特别是由于语音信号的电平变化的动态范围更大并且发生在比背景噪声的电平变化短得多的间隔中的事实。因此,噪声估计块403中的线性平滑滤波器将涂抹掉期望信号(例如,音乐或话音信号)的急剧变化,并且滤除噪声。在许多应用中,对音乐或语音信号的这种涂抹是不可接受的,因此可以将非线性平滑滤波器(未示出)应用于噪声估计块403中的平滑信号以克服上述伪像。平滑块402的输出信号bj(n)中的数据点被修改为使得比紧邻点高(可能是由于噪声)的单独点减少,并且比相邻点低的各个点增加。这导致了更平滑的信号(以及对信号变化的更缓慢的阶跃响应)。

接着,基于来自平滑块402的平滑信号和来自噪声估计块403的经估计的背景噪声信号,计算snr值的变化。使用snr的变化,可以将噪声源与期望语音或音乐信号区分开。例如,低snr值可以表示各种噪声源,诸如空调、风扇、开窗或电气装置(诸如计算机等)。可以在时域中或在时域中或在子带频域中估计snr。

在比较器块405中,将来自块404的输出snr值与预定阈值进行比较。如果当前snr值大于预定阈值,那么指示例如期望语音信号的标志将被设定为例如‘1’。或者,如果当前snr值小于预定阈值,那么指示不期望信号(诸如来自空调、风扇、开窗或电气装置(诸如计算机)的噪声)的标记将被设定为‘0’。

来自块404和405的snr值经由路径#1到路径#b而传送到控制器块406。控制器块406将随时间而收集的多个snr(低和高两者)值的指数与比较器块405中的状态标志进行比较。在预定时段内收集最大值和最小值的直方图。直方图中的最小值和最大值表示至少两个不同的输出信号。至少一个信号指向由s(n)表示的期望源,并且至少一个信号指向由i(n)表示的干扰源。

如果控制器块406中的低和高snr值的指数随时间而变化,那么发起淡入淡出过程,其允许了从一个输出信号到另一输出信号的平滑迁跃,而不生成声学伪像。bs块400的输出表示随时间而选择的期望信号和任选地不期望信号波束。在此,期望信号波束表示具有最高snr的固定波束成形器输出b(n)。任选的不期望波束表示具有最低snr的固定波束成形器输出bn(n)。

bs块400的输出含有具有高snr(正波束)的信号(其可以由任选的自适应阻挡滤波器(abf)块500用作参考)和具有低snr的任选的信号,从而形成用于任选的abf块500的第二输入信号。abf滤波器块500可以使用最小均方(lms)算法控制的滤波器来自适应地从信号bn(n)(表示不期望源波束)中减去由参考信号b(n)(表示期望源波束)表示的感兴趣信号,并且提供误差信号.。从abf块500获得的误差信号被传递到自适应干扰消除器(aic)块600,(aic)块自适应地去除与来自在期望信号路径中的固定波束成形器300的波束成形器输出的误差信号相关的信号分量。如已提到,其它信号可另选地或另外地用作abm块的输入。然而,可以部分地或完全地省略包括任选的abm、aic和apf块的自适应波束成形器块。

首先,aic块600使用自适应滤波器(未示出)计算干扰信号。然后,例如通过减法器块103从任选地延迟的(具有延迟102)参考信号b(n)中减去此自适应滤波器的输出来消除参考信号b(n)中的剩余干扰和噪声分量。最后,自适应后置滤波器104可以设置在减法器块103的下游以用于减少统计噪声分量(不具有不同的自相关)。如在abf块500中那样,可以使用自适应lms算法来更新aic块600中的滤波器系数。可以约束aic块600、abf块500和aec块中的至少一个中的滤波器系数的范数以防止它们变得过大。

图5示出了用于从期望源波束(正波束)信号b(n)中消除噪声的示例性系统。因此,包括在信号b(n)中的噪声分量(由图5中的信号z(n)表示)由自适应系统提供,自适应系统包括滤波器控制块700,滤波器控制块通过滤波器控制信号来控制可控制滤波器800。通过减法器块103从期望信号b(n)中减去信号b(n),这任选地在延迟块102中延迟作为经延迟的期望信号b(n-γ)之后进行,以提供加法器输出信号,加法器输出信号在一定程度上含有减少的不期望噪声。表示不期望信号波束并理想地仅含有噪声而没有有用信号(诸如语音)的信号bn(n)用作滤波器控制块700的参考信号,滤波器控制块还接收加法器输出信号作为输入。已知的归一化最小均方(nlms)算法可以用于从由bs块400提供的期望信号b(n)中滤除噪声。期望信号b(n)中的噪声分量由包括滤波器控制块700和可控制滤波器800的自适应系统估计。可控制滤波器800在滤波器控制块700的控制下滤除不期望信号bn(n)以提供对期望信号b(n)中含有的噪声的估计,在减法器块103中从(任选地)延迟的期望信号b(n-γ)中减去该估计以进一步减少期望信号b(n)中的噪声。这继而将增加期望信号b(n)的信噪比(snr)。来自滤波器控制块700的滤波器控制信号还用于控制自适应后置滤波器104。图5中所示的系统不采用任选的abf或abm块,因为如果相较期望信号来说,它对提高纯噪声信号的质量几乎没有影响,那么可以省略由abf或abm块执行的对不期望信号的信号分量的附加的阻挡。因此,根据不期望信号bn(n)的质量在不降低自适应波束成形器的性能的情况下省略abf或abm块可以是合理的。

再次参考图1,来自apf块104的输出信号可以形成nr块105的输入信号n(n)。示例性nr块可应用为nr块105或可应用于任何其它应用或用作以下结合图6描述的自治系统。在图6中所示的nr块中,讲输入信号n(n)供应到频谱变换块601,其中频谱变换块从时域变换到谱域,即,例如通过快速傅里叶变换(fft)来变换成频谱输入信号n(ω)。将频谱输入信号n(ω)供应到任选的频谱平滑块602以进行频谱平滑。根据是否存在任选的频谱平滑块602,后续的时间平滑块603连接到任选的频谱平滑块602(如图所示)或连接到频谱变换块601(未示出)。平滑信号可以包括对信号进行滤波以捕获信号中的重要模式,而省去嘈杂、精细尺度和/或快速变化的模式。

背景噪声估计块604连接到时间平滑块603并在其下游,并且可以利用允许确定或估计输入信号n(n)中含有的背景噪声的任何已知的方法。在所示实例中,要估计的信号(即,频谱输入信号n(ω)在谱域中,使得背景噪声估计块604被设计为在谱域中操作。

在连接到背景噪声估计块604并在其下游的频谱信噪比确定(计算)块605中,处理输入到背景噪声估计块604中的信号和由背景噪声估计块输出的信号,以提供频谱信噪比snr(ω)。例如,频谱信噪比确定块605可以将输入到背景噪声估计块604中的信号除以由背景噪声估计块604输出的信号来确定频谱信噪比snr(ω)。

在连接到频谱信噪比确定块605并在其下游的第一估计块606中,将在谱域中的经估计的信噪比snr(ω)与(例如,在预定频带内)预定信噪比阈值snrth进行比较。如果经估计的信噪比snr(ω)超过信噪比阈值snrth,那么由第一估计块606输出的加权掩码(ω被设定为预定最大信噪比值,例如,高估因子maxsnrth。否则,加权掩码i(ω)可以被设定为恒定值,例如,1。第一估计块606还输出通过将经估计的信噪比snr(ω)除以信噪比阈值snrth从经估计的信噪比snr(ω)得到的信噪比掩码snrmask(ω)。

在连接到第一估计块606并在其下游的噪声阻挡块607中,来自第一估计块606的snr驱动的掩码(在此是信噪比掩码snrmask(ω))例如通过将信噪比掩码snrmask(ω)乘以来自第一估计块606的加权掩码i(ω)来修改以生成修改一次的snr掩码snrmask'(ω)。

在连接到噪声阻挡块607并在其下游的任选的第二估计块608中,将经修改的snr掩码snrmask'(ω)与最小阈值minth进行比较。如果经修改的snr掩码snrmask'(ω)超过最小阈值minth,那么修改两次的snr掩码snrmask”(ω)被设定为最小阈值minth,否则修改一次的snr模板snrmask'(ω)被输出为修改两次的snr掩码snrmask”(ω)。

在连接到第二估计块608并在其下游的第三估计块609中,修改两次的snr掩码snrmask”(ω)的p范数用来生成修改三次的(最终的)snr掩码snrmask”'(ω)。在连接到块601和609并在其下游的掩码应用块610中,修改三次的snr掩码snrmask”'(ω)作为噪声阻挡掩码而应用于频谱输入信号n(ω)。在掩码应用块610中,修改三次的snr掩码snrmask”'(ω)可以与频谱输入信号n(ω)相乘以提供频谱输出信号y(ω)。将频谱输出信号y(ω)供应到后续的频谱变换块611,在那里,它从频域变换回时域,即,例如通过快速傅里叶逆变换(ifft)来变换成时域输入信号y(n)。

在图6中所示的单信道降噪系统的第一个块中,估计频域中的snr,即,频谱snr,然后将其与预定snr阈值snrth进行比较。根据此比较的结果,如果当前频谱snr(ω)没有超过给定snr阈值snrth,那么生成加权掩码i(ω),其值可以被设定为1的中性权重。否则,加权掩码i(ω)可以被设定为(可调节的)高估因子maxsnrth,其可以大于或等于1,即,maxsnrth≥0[db]。在侧路径中,当前估计的频谱snr值snr(ω)可以通过给定snr阈值snrth来缩放,这产生了期望掩码

接着,掩码将乘以加权掩码i(ω)的权重来得到其修改一次的频谱snr掩码snrmask'(ω),即

因此,生成含有频谱部分的高估值的频谱加权掩码。此频谱加权掩码的频谱部分包括由超出给定snr阈值snrth的频谱snr值snr(ω)指示的语音信号,以及例如从频谱减法中得知并能够抑制比给定snr阈值snrth低的频谱部分的snr驱动的频谱权重。权重的大小直接地根据当前频谱snr值snr(ω)以及给定snr阈值snrth。等于给定阈值snrth的频谱snr值snr(ω)造成snrmask'(ω)=1的掩码值。如果那么生成修改一次的频谱snr掩码snrmask'(ω)<1的掩码值,并且如果那么生成修改一次的频谱snr掩码的掩码值。

在任选的后续的块中,基于snr的修改一次的频谱snr掩码snrmask'(ω)也可以被限制为可调谐的最小阈值minth。这意味着如果当前频谱掩码那么基于snr的修改一次的频谱snr掩码snrmask'(ω)将被限制于此给定最小阈值,即,它将被设定为使得可以实现minth的最大降噪。

在后续的块中,计算当前的修改一次的频谱snr掩码snrmask'(ω)的p范数来提供修改三次的(最终的)snr掩码snrmask”'(ω)=(snrmask”(ω))p。例如,可以采用p=1/2的p因子,其等于取修改两次的频谱snr掩码snrmask”(ω)或修改一次的频谱snr掩码snrmask'(ω)的平方根。snr阈值snrth可以根据所选择的p因子来进行调整。例如,如果采用p=1/2的p因子,那么snrth的snr阈值=30[db],或如果应用p=1的p因子,那么可以利用snrth=15[db]的snr阈值。另外,可以将与p=1的p因子结合的snrth=15[db]的snr阈值除以除p=1之外的p因子。因此,如果选择p=1/2的p因子,那么将会得到snrth=15[db]的snr阈值,p=15[db]1/2=30[db]。

在另一个块中,修改三次的频谱snr掩码snrmask”'(ω)将应用于频谱输入信号x(ω),从而产生频谱输出信号y(ω)=snrmask”'(ω)·x(ω),其然后将例如利用重叠安全过程变换到时域中。

为了允许高估但在高估的情况下避免掩码的不稳定行为,可以应用替代方法。如果经修改的掩码的权重低于1,那么p范数可应用于修改(一次或两次)的snr掩码snrmask”(ω),这可以被认为是“正常降噪情况”,使得例如对于频谱信噪比bandsnr<snrth,snrmask”'(ω)=(snrmask”(ω))p。然而,如果经修改的掩码的权重超过1,那么可以将不同的p掩码应用于修改(一次或两次)的snr掩码snrmask”(ω),这可以被认为是“高估情况”,使得例如对于频谱信噪比bandsnr>snrth,snrmask”'(ω)=(snrmask”(ω))poec,其中poec是除p之外的p范数。另外,在“高估情况”中,对于snrmask'(ω)>maxsnrth,根据可以将(经修改的)snr掩码限制为最大阈值maxsnrth。在以上概述的情况中,p范数p可以是1/2或1,并且p范数poec可以是√2或2。

测试表明,如果在abf块的末尾添加apf块,那么单信道降噪能够进一步增强底层远场声音捕获系统的总体性能。这也在想要进一步增加语音清晰度例如以提高语音识别引擎的识别率(尤其是在不利情况下(例如在当背景噪声相较语音信号来说要高时的低snr情况下))的情况下成立。

nr块可以放在信号处理链的末尾,但不需要连接在abf块下游,因为该顺序以及图1中所示的系统中利用的一些或所有信号处理块的存在可自由地进行选择。作为实例,可以完全省略abf块,使得bs块可以仅递送正波束输出信号,正波束输出信号可以输入到nr块中。在另一实例中,代替fb块,可以仅利用(单)模态波束成形器,并还可以省略bs块,使得由fb块输出的信号可以输入到nr块等中。在此,fb块可以含有模态波束成形器,模态波束成形器自动地将其观察方向转向期望语音源(例如,说话者)。本文公开的简单且有效的单信道降噪系统和方法基于频谱减法,其中基于当前估计的snr来计算维纳滤波器。

已经出于说明和描述的目的而呈现了对实施方案的描述。可以鉴于以上描述执行或可以通过实践方法获得实施方案的合适的修改和变化。例如,除非另外指出,否则所述方法中的一种或多种可以由合适的装置和/或装置的组合来执行。所述方法和相关联的动作也可按照除本申请中所述的顺序之外的各种顺序、并行地和/或同时地执行。所述系统本质上是示例性的,并且可以包括附加元件和/或省略元件。

如本申请中所用,以单数形式表述并用单词“一个”或“一种”引出的元件或步骤应理解为并不排除多个所述元件或步骤,除非明确指出这种排除情况。此外,对本公开的“一个实施方案”或“一个实例”的参考并非意图解释为排除也并入了所列举特征的另外实施方案的存在。术语“第一”、“第二”和“第三”等仅用作标记,而不意在对其对象施加数值要求或特定位置顺序。

本发明的实施方案大体上提供了多个电路、电气装置和/或至少一个控制器。所有对电路、至少一个控制器和其它电气装置和由它们每个提供的功能的提及不旨在受限于仅涵盖本文中图示和描述的内容。虽然特定标记可指派给所公开的各种电路、控制器和其它电气装置,但是这些标记不旨在限制各种电路、控制器和其它电气装置的操作范围。这些电路、控制器和其它电气装置可以基于所期望的特定类型的电气实现方式彼此组合和/或以任何方式被分离。

块被理解为具有以下中的至少一个的硬件系统或其元件:执行软件的处理单元和用于实现相应的期望信号传送或处理功能的专用电路结构。因此,系统的部分或全部可实现为由处理器或可编程数字电路执行的软件和固件。应认识到,如本文中公开的任何系统可以包括任何数量的微处理器、集成电路、存储器装置(例如,闪存、随机存取存储器(ram)、只读存储器(rom)、电可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)或其它合适的变型)和软件,它们彼此协作以执行本文公开的操作。另外,所公开的任何系统可以利用任一个或多个微处理器来执行计算机程序,计算机程序体现在非瞬时计算机可读介质中,非瞬时计算机可读介质被编程为执行所公开的任何数量的功能。另外,本文提供的任何控制器包括外壳和各种数量的微处理器、集成电路和存储器装置(例如,闪存、随机存取存储器(ram)、只读存储器(rom)、电可编程只读存储器(eprom)和/或电可擦除可编程只读存储器(eeprom))。

虽然已描述了本发明的实施各种方案,但是对于本领域的普通技术人员来说显而易见的是,在本发明的范围内,更多的实施方案和实现方式是可能的。具体地讲,技术人员将认识到来自不同的实施方案的各种特征的可互换性。虽然在某些实施方案和实例的上下文中已公开了这些技术和系统,但讲理解,这些技术和系统可以超出具体公开的实施方案而扩展到其它实施方案和/或其用途和明显修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1