混响估计器的制作方法

文档序号:12142441阅读:210来源:国知局
混响估计器的制作方法与工艺

当在具有一个或多个麦克风的房间中捕获音频(例如,语音)时,除了环境噪声源之外,所捕获的信号通过房间中的声音反射(通常称为“混响”)被更改。通常,这种更改通过语音增强信号处理技术来处理。



技术实现要素:

本发明内容以简化形式介绍概念的选择,以便提供对本公开的一些方面的基本理解。本发明内容不是本公开的广泛概述,并且不意图标识本公开的关键或重要元素或描述本公开的范围。本发明内容仅提出本公开的一些概念作为以下提供的具体实施方式的前序。

本公开广泛涉及用于信号处理的方法和系统。更具体地,本公开涉及使用零点指向(null-steered)波束形成器来产生直达与混响声能比(DRR(Direct-to-Reverberant Ratio))估计的方面。

本公开的一个实施例涉及一种计算机实现方法,包括:

使用波束形成器将音频信号分离为直达路径信号分量及混响路径信号分量;对于多个频率窗口(frequency bin)中的每个频率窗口,确定直达路径信号分量的功率与混响路径信号分量的功率的比率;以及组合相对于频率窗口的范围所确定的比率。

在另一个实施例中,将音频信号分离成直达路径信号分量及混响路径信号分量包括:通过在直达路径信号分量的方向上放置零点来去除直达路径信号分量。

在另一个实施例中,在直达路径信号分量的方向上放置零点包括:选择用于波束形成器的权重,以将零点指向朝着直达路径信号分量的到达方向。

在另一个实施例中,该方法还包括:补偿波束形成器处接收的估计噪声。

本公开的另一实施例涉及一种计算机实现方法,该方法包括:通过在直达路径信号分量的方向上放置波束形成器零点,从而从音频信号的混响路径信号分量分离直达路径信号分量以去除音频信号的直达路径信号分量;对于多个频率窗口中的每个频率窗口,确定直达路径信号分量的功率与混响路径信号分量的功率的比率;以及组合相对于频率窗口的范围所确定的比率。

本公开的又一实施例涉及一种系统,该系统包括:至少一个处理器;以及非暂时性计算机可读介质,该非暂时性计算机可读介质被耦合到至少一个处理器,非暂时性计算机可读介质具有在其上存储的指令,该指令在由至少一个处理器执行时,使至少一个处理器:

使用波束形成器将音频信号分离为直达路径信号分量及混响路径信号分量;对于多个频率窗口中的每个频率窗口,确定直达路径信号分量的功率与混响路径信号分量的功率的比率;以及组合相对于频率窗口的范围所确定的比率。

在另一个实施例中,进一步使系统的至少一个处理器通过在直达路径信号分量的方向上放置零点来去除直达路径信号分量。

在另外一个实施例中,进一步使系统的至少一个处理器选择用于波束形成器的权重,以将零点指向朝着直达路径信号分量的到达方向。

在另一个实施例中,进一步使系统的至少一个处理器补偿波束形成器处接收的估计噪声。

本公开的又一实施例涉及一种系统,该系统包括:至少一个处理器;以及非暂时性计算机可读介质,该非暂时性计算机可读介质被耦合到至少一个处理器,该非暂时性计算机可读介质具有在其上存储的指令,该指令在由至少一个处理器执行时,使至少一个处理器:通过在直达路径信号分量的方向上放置波束形成器零点,从而从音频信号的混响路径信号分量分离直达路径信号分量以去除音频信号的直达路径信号分量;对于多个频率窗口中的每个频率窗口,确定直达路径信号分量的功率与混响路径信号分量的功率的比率;以及组合相对于频率窗口的范围所确定的比率。

根据以下给出的详细描述,本公开进一步适用范围将变得显而易见。然而,应当理解的是,详细说明和具体实施例虽然指示优选实施例,但是仅以说明方式给出,因为在本公开的精神和范围内的各种改变和更改对于本领域技术人员而言将从具体实施方式变得显而易见。

附图说明

对于本领域技术人员而言,从下面结合所附权利要求和附图的具体实施方式的学习,本公开的这些和其他目的、特征和特性将变得更显而易见,所有这些形成本说明书的一部分。在附图中:

图1是示出根据本文描述的一个或多个实施例的DRR估计算法的示例应用的示意图。

图2是示出根据本文描述的一个或多个实施例的用于生成DRR估计的示例方法的流程图。

图3是示出根据本文描述的一个或多个实施例的示例偶极子束模式的图形表示。

图4是示出根据本文描述的一个或多个实施例的DRR估计算法的示例性能结果、没有噪声补偿的DRR估计算法的公式以及在10dB的信噪比(SNR)的基线算法的图形表示。

图5是示出根据本文描述的一个或多个实施例的DRR估计算法的示例性能结果、没有噪声补偿的DRR估计算法的公式以及在20dB SNR的基线算法的图形表示。

图6是示出根据本文描述的一个或多个实施例的DRR估计算法的示例性能结果、没有噪声补偿的DRR估计算法的公式以及在30dB SNR的基线算法的图形表示。

图7是示出根据本文描述的一个或多个实施例的噪声估计误差对平均DRR估计的示例性影响的图形表示。

图8是示出根据本文描述的一个或多个实施例的被布置为使用零点指向波束形成器生成DRR估计的示例计算设备的框图。

本文提供的标题仅为方便,并且不必影响本公开所要求保护的内容范围或含义。

在附图中,相同的附图标记和任何缩写词识别具有相同或相似结构或功能的元件或动作,以便于理解和方便性。附图将在下面的具体实施方式中详细描述。

具体实施方式

概述

现在将描述各种示例和实施例。以下描述提供用于全面理解和实现这些示例描述的具体细节。然而,相关领域的技术人员将理解,在缺乏许多细节的情况下也可以实践本文描述的一个或多个实施例。相同地,相关领域的技术人员也将理解,本公开的一个或多个实施例可以包括本文未详细描述的许多其他明显特征。另外,一些公知的结构或功能可能未在下面详细示出或描述,以便避免不必要地模糊相关描述。

确定环境的声学特性对于语音增强和识别是重要的。混响和环境噪声对音频信号(例如,包含语音的信号)的更改,通常通过语音增强信号处理技术来处理。如果已知相对于语音的混响水平,则可以改进语音增强算法的性能,本公开提供了用于估计该关系的方法和系统。

混响影响房间中远距离语音记录的质量和可理解性。直达与混响声能比(DRR)为直达声音(例如,语音)和混响的能量(例如,强度)之间的比率,是用于评估声学配置的有用测量,并且可用于通知去混响(de-reverberation)算法。本文将更详细地描述,本公开实施例涉及可应用的DRR估计算法,其中利用两个或更多个麦克风(诸如移动通信设备,膝上型计算机等)记录信号。

根据本文描述的一个或多个实施例,本公开的方法和系统使用零点指向波束形成器在各种房间大小、混响时间及源头与接收器距离产生±4dB内精确的DRR估计。此外,所呈现的方法和系统对于背景噪声比现有方法更稳健。以下面将进一步详细描述的,在至少一个假设场景中,可以在从-5到5dB的区域中获得最准确的DRR估计,这为便携式设备的相关范围。

当声学脉冲响应(AIR)可用时,可以通过检查AIR的开端及衰减特性从脉冲响应估计DRR。然而,当AIR不可用时,必须从记录的语音来估计DRR。诸如膝上型计算机、智能电话等的便携式设备,已逐渐并入能够启用多通道算法的使用的多个麦克风。

非介入式DRR估计(non-intrusive DRR estimation)的一些现有方法使用信道之间的空间相干性以估计混响,其假定所有非相干能量是混响。其他现有方法使用调制频谱特征,其需要在语音上训练的映射。

考虑到与现有方法相关的各种缺陷,本公开的方法和系统提供了一种新颖的DRR估计方法,其使用空间选择来分离直达和混响能量并单独考虑噪声。该公式考虑波束形成器对混响声音的响应和噪声的影响。

本公开的方法和系统具有许多现实世界应用。例如,所述方法和系统可以在计算设备(例如,膝上型计算机、台式计算机等)中实现以改进声音记录,视频会议等。图1示出其应用的示例100,其中音频源120(例如,用户、扬声器等)被定位在具有音频捕获设备110(例如,麦克风阵列)阵列的房间105中,并且从源头120产生的信号可以跟随多个路径140到达麦克风阵列110。还可以在房间105中存在一个或多个背景噪声源130。在另一示例中,本公开方法和系统可以用于移动设备(例如,移动电话,智能电话,个人数字助理(PDA))中以及用于被设计成通过语音识别来控制设备的各种系统中。

以下提供了关于本公开DRR估计算法的细节,并且还描述算法的一些示例性能结果。图2示出用于生成DRR估计的示例性高层级过程200。以下将进一步描述示例性过程200中的框205-215的细节。

声学模型

从房间中给定位置发射的连续语音信号s(t),将跟随多个路径包括直达路径以及来自墙壁、地板、天花板及在墙壁中其他物体表面的反射到达任何观察点。由房间中的M个麦克风阵列中的第m个麦克风捕获的混响信号ym(t)的特征在于由源头与麦克风之间声道的AIRhm(t),使得

ym(t)=hm(t)*s(t)+vm(t),

(1)

其中*代表卷积运算,并且vm(t)是麦克风处的加性噪声。AIR是房间几何形状,房间表面的反射率和麦克风位置的函数。让

hm(t)=hd,m(t)+hr,m(t),

(2)

其中hd,m(t)和hr,m(t)分别是第m个麦克风的直达和混响路径的脉冲响应。第m个麦克风的DRRηm是直接从源头到达麦克风功率与从房间中一个或多个表面反射后到达功率的比率。DRR可以写为

当脉冲响应与语音信号卷积时,在第m个麦克风处的观测为信号与混响比(SRR)γ由下式给出:

在s(t)的光谱为白色的情况下,SRR等于DRR。非介入式或盲DRR估计的目的是要从观察信号来估计ηm。根据本公开的一个或多个实施例,所述方法和系统使用空间选择来分离声场的直达和混响分量。

在频域中的波束形成

空间滤波或波束形成使用两个或多个麦克风信号的加权组合以实现特定的方向性模式。复频域(complex frequency domain)中的波束形成器的输出Z(jω)由下式给出

Z(jω)=(w(jω))Ty(jω), (5)

其中w(jω)=[W0(jω),W1(jω),...,WM-1(jω)]T是每个麦克风的复权重向量,y(jω)=[Y0(jω),Y1(jω),...,YM-1(jω)]T则是麦克风信号的向量。

由于单位平面波入射到麦克风上,所以让第m个麦克风处的信号为xm(jω,Ω),其中Ω=(φ,θ)是到达方向(DoA),并且θ和φ分别为方位角(azimuth)和仰角(elevation)。波束形成器的波束图案是

D(jω,Ω)=(w(jω))Tx(jω,Ω), (6)

其中x(jω,Ω)=[X0(jω,Ω),X1(jω,Ω),...,XM-1(jω,Ω)]T

对于各向同性声场(例如,完全漫射),波束形成器的增益G(jω)可由下式给出:

G(jω)=∫Ω|D(jω,Ω)|dΩ。 (7)

频域中的DRR估计

以下考虑根据本文描述的一个或多个使用波束形成器来估计DRR的实施例。从上述等式(1)和(2),可以将频域中麦克风m处的信号定义为

Ym(jω)=Dm(jω)+Rm(jω)+Vm(jω), (8)

其中Dm(jω)=Hm,d(jω)S(jω),以及Rm(jω)=Hm,r(jω)S(jω)。

从等式(5),

Zy(jω)=Zd(jω)+Zr(jω)+Zv(jω), (9)

其中

Zd(jω)=(w(jω))Td(jω)

Zr(jω)=(w(jω))Tr(jω)

Zv(jω)=(w(jω))Tv(jω)

以及

d(jω)=[D0(jω,D1(jω),...,DM-1(jω)]T

并且r(jω)和v(jω)被类似地定义。

选择w(jω)使得Zd(jω)=0,给出

Zy(jω)≈Zr(jω)+Zv(jω)。 (10)

在混响声场由从所有方向以相同概率和幅度到达的平面波组成的简化下,波束形成器的增益可以由下式给出:

G(jω)=∫Ω|D(jω,Ω)|dΩ。 (11)

因此,波束形成器的输出可以由下式给出

E{|Zr(jω)|2}=G2(jω)E{|R(jω)|2}, (12)

其中E{·}是期望运算符;R(jω)是混响能量,独立于麦克风。将等式(10)代入等式(12)给出

由于可以假定在所有麦克风处的混响功率是相同的,所以根据等式(8)可以写成:

E{|Dm(jω)|2}=E{|Ym(jω)|2}-E{|Vm(jω)|2}-E{|R(jω)|2}。 (14)

频率相关(frequency dependent)DRR从等式(3)得出为

将等式(13)和(14)代入等式(15)给出:

总的DRR由下式给出

其中ω1≤ω≤ω2是感兴趣的频率范围。

实施例

为了进一步说明本公开的稳健DRR估计方法和系统的各种特征,以下描述可通过实验获得的一些示例结果。应当理解的是,尽管以下提供了二元件麦克风阵列的场境中的示例性能结果,但是本公开的范围不限于该特定场境或实施。尽管以下描述示出对于少量(例如两个)麦克风可实现优异的性能,并且还示出性能是稳健的,但是也可以在各种其他背景和/或场景中,使用本公开方法和系统来实现以类似的性能水平,包括涉及多于两个麦克风的场境/场景。

在本示例中,从声学语音学连续语音数据库的测试分区中,随机选择语音信号。对于具有尺寸为{3米(m),4m和5m}×6m×3m的房间,这些信号与使用已知源图像方法所产生的AIR进行卷积,每个房间的混响时间(T60)值为0.2秒至1秒,以0.1秒间隔。在每个房间中,从均匀分布随机选择麦克风阵列的四个位置和轮换,并且源头被设置成以0.05、0.10、0.50、1.0、2.0和3.0m的距离垂直于阵列定位。从任何墙壁,不允许麦克风或源头小于0.5米。

使用具有62毫米(mm)间距的二元件麦克风阵列来模拟典型膝上型计算机中的麦克风。使用延迟和减法方案来选择波束形成器权重,以将零点指向朝着直达路径的DoA。

由于所有源头位置与两个麦克风为等距,因此这简化为简单的减法,得到图3所示熟悉的偶极子束图案。图3示出在62mm麦克风间隔的情况下二信道零点指向波束形成器在200Hz处的增益和方向性图案。注意,最大增益为-9.4dB。在实际应用中,需要使用例如对于本领域技术人员已知的用于估计时间延迟的广义相关方法的到达时间差的估计以设置延迟。

直接从模拟AIR估计每个房间的T60,麦克风和源头位置的地面实况DRR。对于每个麦克风,在10、20和30dB的SNR处,独立添加白高斯噪声,其中使用本领域技术人员已知的活动语音电平的客观测量的实施方式来确定清洁功率(clean power)。

在第一实验装置中,将使用在已知的E{|Vm(jω)|2}和E{|Zv(jω)|2}被使用的情况下本公开的DRR估计方法与其中忽略噪声(SNR假设为8dB)方法的公式进行比较,并且还与基线方法进行比较。在实际应用中,可以假设将使用对混响稳健的噪声估计器。为了评估噪声估计误差对DRR估计器的精确度的影响,进行对等式16中的E{|Vm(jω)|2}和E{|Zv(jω)|2}中的每个加上±1.5dB的第二实验。

在本示例中,用于比较的基线方法返回通过频率估计DRR的向量,并且在比较中使用值>-∞的平均值。

图4-6是示出根据本公开的实施例(405、505和605)描述的DRR估计算法精确度的图形表示、不考虑噪声的算法公式(410、510和610)、以及在10dB、20dB和30dB的SNR处的基线算法(415、515和615)。如图形表示405、505和605所示,本公开的算法是准确的,具有在-5到5dB的(地面实况)DRR范围上小于3dB误差。应当注意地,随着DRR减小,本公开的方法可能倾向于高估DRR。这是假设反射以相等概率从所有角度到达的结果。对于特定房间和T60,具有较大源头麦克风距离的情况下,获得较低的DRR。这又导致较强的早期反射从更接近直达路径DoA的方向到达,并且因此更多地被波束形成器零点衰减。通过考虑等式(12)中的早期反射的情况下,DRR被高估。

在本公开的算法公式中包括噪声的重要性通过具有和不具有噪声补偿(具有噪声补偿算法的图形表示405、505和605以及没有噪声补偿算法的图形表示410、510和610)的算法的示例精确度与基线算法(图形表示415、515和615)进行比较是明显的。在没有噪声补偿的情况下,本公开的方法遵循基线算法倾向随着噪声增加而低估DRR。相反地,在噪声被公式中的情况下,本公开方法的精确度在所示SNR的范围上(在图形表示405、505和605中)是一致的,只有估计的标准偏差略微增加。

图7示出噪声估计误差对平均DRR估计的示例影响。具体地,图形表示700示出在参考麦克风处和在波束形成器的输出处的噪声估计中误差的敏感度。在影响直达的和波束形成的功率的相反极性误差(曲线710和720)存在的情况下,DRR估计保持接近没有误差的情况(曲线715),有效地彼此抵消。在误差具有相同极性(曲线705和725)的情况下,在每个项上存在±1.5dB误差的加性效应(additive effect),导致总体上±3dB误差。这表示本公开方法对噪声估计器中的偏差比其方差更敏感。

应当注意的,除了上述示例配置之外,本公开的方法和系统被设计为以源头相对于麦克风阵列的许多其他配置(例如,定位)来实现相似性能。例如,本文描述的DRR估计算法能够在选择适当波束形成器的情况下应用于具有任意数目麦克风的多信道系统。

从上述描述显而易见,本公开的方法和系统提供一种用于在考虑到噪声的情况下从多信道语音估计DRR的新颖方法。上述示例性能结果证实本发明的方法和系统在实际SNR处比基线对噪声更加稳健。所描述的公式根据频率返回DRR的估计,并且因此根据一个或多个实施例,如果需要,可以提供频率相关DRR。另外,由于方法和系统不依赖于语音统计,所以根据一个或多个其他实施例,DRR估计算法也可以应用于音乐。

图8是根据本文描述的一个或多个实施例的被布置成用于使用零点指向波束形成器生成DRR估计的示例性计算设备(800)高级别框图,其中生成的DRR估计在各种房间大小、混响时间以及源头-接收器距离上是精确的。根据至少一个实施例,计算设备(800)可以被配置为利用空间选择来分离直达和混响能量并且单独地考虑噪声,从而考虑波束形成器对混响声音的响应和受噪声的影响。在非常基本配置(801)中,计算设备(800)典型地包括一个或多个处理器(810)和系统存储器(820)。存储器总线(830)可以用于处理器(810)和系统存储器(820)之间的通信。

取决于预期的配置,处理器(810)能够包括但不限于微处理器(μP)、微控制器(μC)、数字信号处理器(DSP)或其任何组合。处理器(810)能够包括一个或多个级别的缓存,诸如一级缓存(811)和二级缓存(812)、处理器核(813)和寄存器(814)。处理器核(813)可以包括算术逻辑单元(ALU)、浮点单元(FPU)、数字信号处理核(DSP核)或其任何组合。存储器控制器(816)还可以与处理器(810)一起使用,或者在一些实现中,存储器控制器(815)可以是处理器(810)的内部部分。

取决于期望的配置,系统存储器(820)可以是任何类型的,包括但不限于易失性存储器(诸如RAM)、非易失性存储器(诸如ROM,

快闪存储器等)或其任何组合。系统存储器(820)通常包括操作系统(821)、一个或多个应用(822)和程序数据(824)。根据本文描述的一个或多个实施例,应用(822)可以包括用于使用空间选择来分离直达和混响能量并单独地考虑环境噪声来生成DRR估计的DRR估计算法(823)。根据这里描述的一个或多个实施例,程序数据(824)可以包括存储指令,该指令在由一个或多个处理设备执行时,实现通过使用零点指向波束形成器来估计DRR的方法,其中所估计的DRR可以用于评估相应的声学配置,并且还可以通知一个或多个去混响算法。

另外,根据至少一个实施例,程序数据(824)可以包括音频信号数据(825),其可以包括关于房间或区域内麦克风位置的数据,房间或区域的几何形状,以及房间或区域(其一起可以构成AIR)中的各种表面的反射率。在一些实施例中,应用(822)可以被布置为与操作系统(821)上的程序数据(824)一起操作。

计算设备(800)可以具有附加特征或功能、以及附加接口以便于基本配置(801)与任何所需设备和接口之间的通信。

系统存储器(820)是计算机存储介质的示例。计算机存储介质包括但不限于RAM、ROM、EEPROM、快闪存储器或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光学存储器、磁带盒、磁带、磁盘存储器或其他磁存储设备或可以用于存储所需信息并且可以由计算设备800访问的任何其他介质。任何这样的计算机存储介质可以是计算设备(800)的一部分。

计算设备(800)可以被实现为小型便携式(或移动)电子设备的一部分,例如蜂窝电话、智能电话、个人数字助理(PDA)、个人媒体播放器设备、平板计算机(平板)、无线web观看设备、个人头戴式耳机设备(personal headset device)、专用设备或包括任何上述功能的混合设备。计算设备(800)还可以被实现为包括膝上型计算机和非膝上型计算机的个人计算机。

前述详细描述已经通过使用框图、流程图和/或示例阐述了设备和/或过程的各种实施例。在这样的框图、流程图和/或示例包含一个或多个功能和/或操作的范围内,本领域技术人员将理解,可以单独地和/或共同地由大范围的硬件、软件、固件或实质上它们的任何组合来实现这样的框图、流程图或示例中的每个功能和/操作。根据至少一个实施例,描述的几个部分主题可以经由专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)或其他集成格式来实现。然而,根据本公开,本领域技术人员将认识到,本文公开的实施例一些方面可以全部或部分等效地实现在集成电路中,作为在一个或多个计算机上运行的一个或多个计算机程序,作为一个或多个程序在一个或多个处理器上运行,作为固件或作为实际上其任何组合,并且设计电路和/或写入用于软件和/或固件代码将在本领域技术人员之一的技术内。

另外,本领域技术人员将理解,本文描述的主题机制能够作为程序产品以各种形式分布,并且在不考虑实际执行分布的非暂时性信号承载介质的特定类型的情况下,本文描述的主题说明性实施例适用。非暂时性信号承载介质的示例包括但不限于以下:可记录型介质、诸如软盘、硬盘驱动器、压缩盘(CD)、数字视频盘(DVD)、数字带(digital tape)、计算机存储器等;以及诸如数字和/或模拟通信介质(例如,光纤线缆、波导、有线通信链路、无线通信链路等)的传输型介质。

关于本文中大体上任何复数和/或单数术语的使用,本领域技术人员可以根场境和/或应用适当地从复数转换为单数和/或从单数转换为复数。为了明晰,本文中可以明确地阐述各种单数/复数置换。

因此,描述了主题的特定实施例。其他实施例在所附权利要求的范围内。在一些情况下,权利要求中叙述的行动可以以不同的顺序执行并且仍然实现期望的结果。另外,附图中描绘的过程不一定需要所示的特定顺序或按次序的顺序,以实现期望的结果。在一些实现中,多任务处理和并行处理可能是有利的。

权利要求书(按照条约第19条的修改)

1.一种计算机实现方法(200),包括:

在直达路径信号分量的方向上,使用波束形成器零点将音频信号分离(205)为所述直达路径信号分量以及混响路径信号分量;

对于多个频率窗口中的每个频率窗口,确定(210)所述直达路径信号分量的功率与所述混响路径信号分量的功率的比率;以及

组合相对于所述频率窗口的范围所确定的比率(215)。

2.根据权利要求1所述的方法,还包括:

基于所组合的比率,对音频信号执行去混响。

3.根据权利要求1所述的方法,其中,在所述直达路径信号分量的方向上放置零点,包括:

选择用于所述波束形成器的权重,以将零点指向朝着所述直达路径信号分量的到达方向。

4.根据权利要求3所述的方法,其中,使用延迟及减法方案来选择所述波束形成器的权重。

5.根据权利要求1所述的方法,还包括:

补偿所述波束形成器处接收的估计噪声。

6.一种计算机实现方法,包括:

通过在直达路径信号分量的方向上放置波束形成器零点,从而从音频信号的混响路径信号分量分离所述直达路径信号分量以去除所述音频信号的直达路径信号分量;

对于多个频率窗口中的每个频率窗口,确定所述直达路径信号分量的功率与所述混响路径信号分量的功率的比率;以及

组合相对于所述频率窗口的范围所确定的比率。

7.根据权利要求6所述的方法,其中,在所述直达路径信号分量的方向上放置所述波束形成器零点,包括:

选择用于所述波束形成器的权重,以将零点指向朝着所述直达路径信号分量的到达方向。

8.根据权利要求7所述的方法,其中,使用延迟及减法方案来选择所述波束形成器的权重。

9.根据权利要求6所述的方法,还包括:

补偿所述波束形成器处接收的估计噪声。

10.一种系统,包括:

至少一个处理器;以及

非暂时性计算机可读介质,所述非暂时性计算机可读介质被耦合到所述至少一个处理器、具有在其上存储的指令,所述指令在由所述至少一个处理器执行时使所述至少一个处理器:

在直达路径信号分量的方向上,使用波束形成器零点将音频信号分离为所述直达路径信号分量及混响路径信号分量;

对于多个频率窗口中的每个频率窗口,确定所述直达路径信号分量的功率与所述混响路径信号分量的功率的比率;以及

组合相对于所述频率窗口的范围所确定的比率。

11.根据权利要求10所述的系统,其中,进一步使所述至少一个处理器:

基于所组合的比率,对音频信号执行去混响。

12.根据权利要求10所述的系统,其中,进一步使所述至少一个处理器:

选择用于所述波束形成器的权重,以将零点指向朝着所述直达路径信号分量的到达方向。

13.根据权利要求12所述的系统,其中,使用延迟及减法方案来选择所述波束形成器的权重。

14.根据权利要求10所述的系统,其中,进一步使所述至少一个处理器:

补偿所述波束形成器处接收的估计噪声。

15.一种系统,包括:

至少一个处理器;以及

非暂时性计算机可读介质,所述非暂时性计算机可读介质被耦合到所述至少一个处理器、具有在其上存储的指令,所述指令在由所述至少一个处理器执行时使所述至少一个处理器:

通过在直达路径信号分量的方向上放置波束形成器零点,从而从音频信号的混响路径信号分量分离所述直达路径信号分量以去除所述音频信号的直达路径信号分量;

对于多个频率窗口中的每个频率窗口,确定所述直达路径信号分量的功率与所述混响路径信号分量的功率的比率;以及

组合相对于所述频率窗口的范围所确定的比率。

16.根据权利要求15所述的系统,其中,进一步使所述至少一个处理器:

选择用于所述波束形成器的权重,以将零点指向朝着所述直达路径信号分量的到达方向。

17.根据权利要求16所述的系统,其中,使用延迟及减法方案来选择所述波束形成器的权重。

18.根据权利要求15所述的系统,其中,进一步使至少一个处理器:

补偿在所述波束形成器处接收的估计噪声。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1