使用麦克风阵列的混响声的提取的制作方法

文档序号：10618744阅读：341来源：国知局

使用麦克风阵列的混响声的提取的制作方法
【专利摘要】方法包括估计第一麦克风信号中的第一散射声部分和第二麦克风信号中的第二散射声部分之间的空间相干性。第一麦克风信号由第一麦克风捕捉，第二麦克风信号由与第一麦克风以已知的方式间隔开的第二麦克风捕捉。方法进一步包括定义散射声滤波器的滤波系数的线性约束，线性约束基于空间相干性。方法还包括计算第一麦克风信号和第二麦克风信号的信号统计和噪声统计中的至少一个。方法还包括通过在考虑滤波系数的线性约束的条件下对关于信号统计和噪声统计中的至少一个的优化问题求解，确定散射声滤波器的滤波系数。
【专利说明】
使用麦克风阵列的混响声的提取
技术领域
[0001] 本发明属于声学分析、空间声音录音、麦克风阵列信号处理和空间滤波的领域。本发明的一些实施例设及可W被用于确定散射声滤波器即使用麦克风阵列从录音中提取散射声(混响声）的滤波器，的滤波系数的方法。一些实施例设及可W被用于确定散射声滤波器的滤波系数的装置。
【背景技术】
[0002] 典型地，混响环境中的麦克风阵列的声音获取的目的在于捕捉声音源的直达声同时削弱噪声和混响。对于很多应用，如果能够在抑制直达声和噪声的同时也提取混响声，将是有益的。例如，在空间声音重现[Pu化ki2007, IliiergartSOlS ,Kowalc巧k2013]中，录音端出现的混响需要在重现端进行重现，W重塑期望的空间效果。此外，给定了混响声的估计，我们可W计算参数，例如信号-混响比率或混响声功率，其对于各种其他应用代表重要信息。
[0003] 尽管在文献中已经很好地解决直达声分量的估计(例如，使用源分离、去混响、或降噪），但是只存在很少的提取混响声的方法。通常，混响被建模为(时变)散射声场。为了提取散射声，最近使用单声道滤波器(例如，在[Pu化ki2007，化ie巧art2013]中），当多个源是有效的或用于类瞬时信号时，产生不好的表现。使用多声道滤波器可W达到更好的性能(例如，比owalc巧k2013 ,Iliie巧art2013b])。不幸的是，目前存在的多声道滤波器不是最优的，并且不会产生用于捕捉散射声的合适的指向性图案。
[0004] 因此，可期望的是提供在散射声提取和/或直达声抑制方面具有改进的性能的散射声滤波器。还可期望的是散射声滤波器具有高度全向性(除了直达声分量的到达方向之夕F)的方向响应。高度全向性的方向响应是需要的，因为散射声从所有方向到达麦克风阵列。

【发明内容】

[0005] 提出的方法包括定义散射声滤波器的滤波系数的线性约束。线性约束基于第一麦克风信号中的第一散射声部分和第二麦克风信号中的第二散射声部分之间的空间相干性。第一麦克风信号由第一麦克风捕捉，第二麦克风信号由与第一麦克风W已知的方式间隔开的第二麦克风捕捉。方法还包括计算至少一个直达声的到达方向、第一麦克风信号和第二麦克风信号的信号统计、和第一麦克风信号和第二麦克风信号的噪声统计中的至少一个。方法进一步包括通过在考虑滤波系数的线性约束的条件下对关于至少一个直达声的到达方向、信号统计和噪声统计中的至少一个的优化问题求解，确定散射声滤波器的滤波系数。
[0006] 实施例提出了一种计算机程序，当在计算机或信号处理器上执行时用于实施上述的方法。
[0007] 进一步实施例提出一种装置，包括线性约束计算器，该线性约束计算器用于定义散射声滤波器的滤波系数的线性约束。线性约束基于第一麦克风信号中的第一散射声部分和第二麦克风信号中的第二散射声部分之间的空间相干性。第一麦克风信号由或者已经由第一麦克风捕捉，第二麦克风信号由或者已经由与第一麦克风W已知的方式间隔开的第二麦克风捕捉。装置还包括统计计算器，该统计计算器用于计算至少一个直达声的到达方向、第一麦克风信号和第二麦克风信号的信号统计、和第一麦克风信号和第二麦克风信号的噪声统计中的至少一个。装置进一步包括滤波系数计算器，该滤波系数计算器用于通过在考虑滤波系数的线性约束的条件下对关于至少一个直达声的到达方向、信号统计和噪声统计中的至少一个的优化问题求解，确定散射声滤波器的滤波系数。
[0008] 实施例基于W下见解:在考虑与麦克风信号的散射声部分相关的至少一个线性约束时，可W确定散射声滤波器。
【附图说明】
[0009] 下面，参考附图较详细地描述本发明的实施例，其中：
[0010] 图1示出具有单声道滤波器的提取散射声的方法的示意性框图；
[0011] 图2示出具有多声道滤波器的提取散射声的方法的示意性框图；
[0012] 图3示出根据用于实施的第一示例的本发明的示意性框图；
[0013] 图4示出根据用于实施的第二示例的本发明的示意性框图；
[0014] 图5示出根据用于实施的第S示例的本发明的示意性框图；
[0015] 图6示出从根据图2的具有滤波器的用于提取散射声的方法得到的提取图案的示例；
[0016] 图7示出从根据图4的具有滤波器的用于提取散射声的方法得到的提取图案的示例；
[0017] 图8示意性地示出麦克风阵列和由麦克风阵列获得的不同声音信号。
【具体实施方式】
[001引术语"直达芦'和"散射芦'定义如下。
[0019] 直达声：主要从特定主要方向到达麦克风的声音。直达声可W表示例如从声源直接传送到麦克风的声音或明显的房间反射。直达声可W是例如具有特定到达方向的平面波或球面波。当已知直达声的到达方向时，假定已知麦克风的几何形状，可W计算麦克风之间的直达声的相对传递函数。
[0020] 散射声：从所有方向到达麦克风的声音。散射声可W代表例如房间中存在的后续混响。典型地，没有主要到达方向可W与混响声(各向同性声场(isotropic sound field)) 相关联，即，声音W相等的平均功率从所有方向到达。此外，麦克风之间的散射声的相对传递函数必须假定为随机且不可观测的。但是，麦克风之间的散射声的平均相对传递函数对于特定麦克风设置和散射场假定通常是已知的或可W被度量的。
[0021] 下述分段概括现有的从麦克风录音提取散射声(或混响声）的方法。如下，M指示使用的麦克风的数量。我们假定所有麦克风信号都已经被转换到时间-频率域，其中k是频率索引，n是时间索引（注意滤波器也可W典型地被应用于时间域）。麦克风捕捉在散射场中传播的L个平面波(称作直达声）。第1个平面波的DOA被表示为单位标准矢量m化，n)。在时间- 频率域中，第m个(全方位)麦克风的信号可W为
[0022]
[0023] 运里，Xi化，n)是第I个平面波的声压，Xd化，n，cU)是散射声，Xn化，n，cU)是平稳噪声 (例如，自身噪声或背景噪声），dm是在给定的坐标系统中描述(第m个麦克风的)麦克风位置的矢量。
[0024] 本发明的目的是评估位置dm处的Xd化，n，dm)。
[0025] 单声道滤波器从单个麦克风信号(M=I)提取散射声。运种滤波器被例如用在定向音频编码[Pu化ki2007]或虚拟麦克风[Thiergad2013]。
[0026] 散射声的估计由将麦克风信号中的一个，例如第一麦克风的麦克风信号Xi化，n)，与滤波器H化，n)相乘而构建，例如：
[0027]
[0028] 通常，滤妮器H化.n)是维纳(Wi ener)滤波器，由下述公式给出
[0029]
[0030] 其中是散射声的功率，(K是平面波和平稳噪声的功率。在一些应用中，使用平方根维纳滤波器（即，H的平方根)而非维纳滤波器。值得注意的是，为了计算H化，n)，必须估计功率(l)d和(K。为了运个目的，我们可W考虑例如信号-散射比率（SDR)，其可W如 [化iergart2012]中解释的而被估计。可选地，H(k，n)可W由估计所谓的散射而创建，如 [Pu化ki2007,化ie巧a;rt2013]所述。典型地，估计SDR或散射需要多于一个的麦克风。然而，最终通过过滤单个麦克风信号得到散射声。
[0031] 图1示出具有单声道滤波器的用于提取散射声的示例系统。首先，从多个麦克风信号估计SDR(或可选地，散射）。然后，从运个信息计算滤波器H化，n)。最后，将滤波器H化，n) 与单个麦克风信号相乘W得到散射声估计。
[0032] 多声道滤波器考虑M>1个麦克风。运种滤波器已经使用在例如[Thiergad2013b， Kowalczyk2013]中。对于W下推导，用矢量X化,n) = [Xi化,n),拉化,n),. . . ,Xm化,n) ]T表示 M个麦克风信号。通讨M个去巧风信号的线性结合估计第m个麦克风处的散射声，即，
[0033]
[0034] 其中，Wm是长度M的复权重向量。必须计算Wm的权重W得到散射声的精确估计。
[0035] 找到合适滤波器的直接方法是计算权重Wm, W便在最小化包含在麦克风信号中的平稳噪声Xn化,n , dm)的同时抑制L个平面波。滤波器权重可W被数学地表示为
[0036]
[0037] 服U的純化约击责.
[00；3 引
[0039]运里，On是平稳噪声的PSD矩阵（功率谱密度矩阵），即
。其可W 用已知的方式估计，例如，当不存在散射声或直达声时。此外，ai是所谓的传播矢量。其元素是从第m个麦克风到其他麦克风的第1个平面波的相对传递函数。因此，ai是具有长度M的列矢量(记住：只通过M个麦克风信号的Wm加权的线性结合估计第m个麦克风的散射声;其他麦克风处的散射声是基本冗余的，因为通过从第m个麦克风到其他麦克风的相对传递函数，运些信号是相关的并且如果需要的话可W W运种方式计算）。31的元素基于第1个平面波的 DOA。运意味着ai是第1个平面波的DOA的函数，即ai = f(ni)。因为ai基于直达声（即，平面波），其在下文中被称作直达声约束。使用运个空间滤波器，我们本质上创建了波束形成器，其具有对于L个平面波的方向零值的提取图案。结果，抑制所有的平面波。遗憾的是，因为我们只具有空值约束，对上述最小值问题求解导致权重Wm为0,即，不能提取散射声。
[0040] 为了克服上述问题并避免零滤波权重，[化ie巧art2013b，Kowalczyk2013]提出使用相同滤波器但是具有额外约束，给定为：
[0041] w%(k,n) = 1,
[0042] 其中ao是与特定DOAno相对应的传播矢量，没有平面波从其到达。具有运种约束，可 W避免零滤波权重，但是仍然不能捕捉不想要的直达声。结果，使用运种滤波器，仅仅捕捉散射声和一些噪声，但是削弱所有的平面波。在[Thiergad2013b]中，通过选择对于平面波的所有DOAni化，n)具有最大角度距离的方向而构建矢量ao对应的DOA no。例如，如果单个平面波从0度到达，则m化，n)将对应于180°。遗憾的是，DOA no不能保证得到噪声尽可能小的散射声估计。此外，产生的提取图案对捕捉散射声来说不是最优的，因为其在较高的频率具有高方向性。当目标是捕捉所有方向的散射声时，运是缺点。
[0043] 产生的提取图案的例子如图6所示。运里，两个直达声从方位方向51°和97°到达。附图示出当使用具有5厘米麦克风间隔的16个麦克风的均匀线性阵列时，在频率为2.8曲Z 处产生的提取图案。提取图案恰好对于51°和97°具有零值，对于对应于方向no的180°具有高增益。此外，提取图案具有多个其他空间零值或对于几乎所有其他方向具有低增益。运个提取图案对于捕捉来自所有方向的散射声是不合适的。还需要注意直达声约束ai与直达声的DOA直接相关。在图7中示出在运个分段中不能使用空间滤波器实现的期望的提取图案。运个提取图案对于直达声的DOA具有两个空间零值，但除此之外，它几乎是全方位的。运个提取图案通过使用下面结合图7描述的提出的滤波器实现。
[0044] 可W在[VanTrees2002]中发现给定上述约束的计算滤波器权重Wm的闭合解。为了计算空间滤波器，必须知道L个平面波的D0A，即计算直达声约束ai和ao。运个DOA信息可W由已知的窄带DOA估计器确定，例如Root MUSIC或ESPRIT。进一步注意，a日的元素通常是复的，对于每一个k和n，a〇通常都需要被重新计算，因为平面波的DOA必须假定为高度时变的。高度波动a日可W导致听得到的伪象。
[0045] 图2示出具有提出的多声道滤波器的用于提取散射声的示例系统。将麦克风信号变换至时间-频率域之后，估计平稳噪声和L个平面波的D0A。然后，从DOA信息得至ljM+1个线性直达声约束(ai和ao)。基于该信息，可W计算滤波器权重。将运些权重应用到麦克风信号，产生散射声的期望估计。从运个描述可W清楚知道，得到的滤波器仅仅取决于直达声（即， DOA和麦克风之间的平面波的相应相对传递函数），而不取决于散射声。运意味着滤波器不考虑散射声的潜在可用信息，即使它被用来估计散射声。
[0046] 在本发明中，我们提出了克服上述滤波器的限制的用于提取混响声的新型多声道滤波器。提出的空间滤波器的特征在于:趋向于全方位图案的方向性图案，除了对于直达声的到达方向（DOA)呈现空间零值。运代表W低失真捕捉来自各个方向的散射声的高度期望的特性。
[0047]在下文中，我们提出了多声道滤波器W估计使用M>1个麦克风的位置dm处的散射声XcKk,n,dm)。对于上述多声道滤波器，第m个麦克风处的散射声压通过执行麦克风信号的线性组合而被估计，即
[004引
[0049] 下文提出的权矢量Wm,最小化特定的成本函数和被线性限制（与上述多声道滤波器类似）。
[0050] 然而，与上述多声道滤波器相比，我们建议使用不依赖于直达声（即，L个平面波）的线性约束。更确切地说，提出的新的约束分别不是平面波的DOA的函数或麦克风之间的平面波的相应的相对传输函数。
[0051] 与此相反，提出的新的约束基于散射声的统计信息，即，提出的新的约束基于麦克风之间的散射声的相对传送函数。我们将在下面显示提出的新的约束是麦克风之间的散射声相干性或相关性的函数。运个相干性对应于麦克风之间的散射声的平均相对传递函数。
[0052] 通过在满足散射声的失真约束的同时最小化特定的成本函数，获得提出的空间滤波器。思个约巧对脉干宗巧风才间的散射声的相对传递函数。数学地表达，滤波器被计算为
[0化3]
[0054] 服从如下线性约束：
[0化5]
[0056] 。^。。波器最小化的成本函数。成本函数可^是例如滤波器输出处的平稳噪声功率、滤波器输出处的干扰能量、或估计散射声的二次误差。J的例子将在实施例中提出。约束矢里bm由 bm化,11)二[81,111化,11),82,111化,11),...,1^1,111化,11)]给出。束1]1个兀素 8111',111 是麦克风m和m'之间的散射声的相对传递函数。运个相对传递函数被给定为：
[0化7]
[005引注意bm的第m个元素等于1。在此约束下，我们无失真地捕捉散射声。实际上，令Xd 化，n) = [Xd化，n，di)，Xd化，n，d2)，. ..，Xd化，n，dM)]T为包括记录的散射声的矢量。使用上述等式，可W将矢量写为
[0059] Xd 化,n)=bm 化,r〇Xd 化,n,dm)。
[0060] 在滤波器的输出处的散射声被给定为wH化，n)xd化，n)，因为化，n) = l，其与Xd 化，n，cU)相同。因此，运个滤波器无失真地捕捉散射声。实际中通常不能bm中的相对传递函数，因为其基本上是随机的，即，对于每一个k和n都有不同的传递函数的实现。因此，在实践中，Bm' ,m被计算为麦克风m和m'之间的平均相对传递函数，即
[0061] Bm' ,m(k,n) = y m' ,m(k,n)
[0062] 平均相对传递函数丫,m对应于麦克风m和m'之间的散射声的所谓的空间相干性，被定义为
[0063]
[0064] 其中（?巧旨共辆复数。运个空间相干性描述了频域中的麦克风m和m'之间的散射声的相关性。运个相干性基于特定的散射声场。对于给定的房间，可W预先测量相干性。可选地，对于特定散射声场，理论上已知相干性[E化O2001]。例如对于实践中经常可被假定的球面各向同忡敌射声场，我们有
[00 化]
[0066] 其中，sine表示正弦函数，f是为对于给定频带k的声学频率，C是声音的速度。此夕是麦克风m和m'之间的距离。当使用空间相干性作为线性约束Bm',m(代表麦克风之间的散射声的平均相对传递函数)时，得到的滤波器相当于多个线性约束的空间滤波器的总和，其中运些滤波器中的每一个无失真地捕获随机散射声的不同实现。
[0067] 使用上述介绍的散射声约束，我们得到从各个方向同样好地捕获散射声的空间滤波器。运与上述的主要从一个方向（即选择的传播矢量ao相对应的方向）捕获声音的多声道滤波器相反。
[0068] 注意，散射声约束bm与直达声约束ai和ao在概念上非常不同。因此，本节中所提出的新的滤波器在概念上与上述的多声道滤波器相比非常不同。
[0069] 提出的本发明的方框图在图3中示出。首先，使用滤波器组(FB)(IOl)将M个麦克风信号变换至时间-频率域(或用于信号处理的其它合适的域）。其次，在块（102)中计算线性散射声约束矢量bm。如上所述，散射声约束矢量或者是从信号估计的，或者其对应例如特定假定散射场的理论空间相干性。在块(104)中，我们从麦克风信号估计特定统计数据(例如，噪声统计）。运个信息通常表示为PSD矩阵O化，n)，并且用于生成必须被滤波器最小化的成本函数J。在块（103)中计算使受到散射声约束的成本函数最小化的滤波器权重。最后，将权重应用于导致期望散射声估计的麦克风信号。本发明的具体实现在下述实施方案中提出。
[0070] 满足散射声约束的最小化输出功率
[0071] 在本实施例中，我们定义使受到散射声约束的滤波器整个输出最小化的空间滤波器。散射声约束确保散射声被空间滤波器保留，而其余信号部分(不期望的平稳噪声和平面波)被最小化。滤波器权重Wm被计算为
[0072]
[0073] 受到线性约束：
[0074] w%m(k,n) = l〇
[00巧][化nTrees2002]给出运个滤波器的闭合解为
[0076]
[0077] 运里，OX是麦克风信号的PSD矩阵，可W被计算为
[007引 0x(k,n)=E{x(k,n) /化,!!）}，
[0079] 其中，X化，n)是包括麦克风信号的矢量。在实践中，例如通过时间平均来近似期望值。此外，约束向量bm化，n) = [Bi,m化，n) ,B2,m化，n),. . . ,BM,m化，n)]T的元素对应于麦克风m 和m'之间的散射声的空间相干性，即
[0080] Bm',m(k,n)= 丫 m',m(k,n)。
[0081 ] 实际上，空间相干性Bm',m不需要取决于时间（即，Bm',m化，n)=Bm',m化）），因此，空间相干性可W提前被估计或假定为理论值。可W使用下述公式从麦克风信号估计空间相干性 (在其中仅存在散射声的周期中）：
[0082]

[0083] 或者，可W将空间相干性给定为假定特定散射声场的先验信息。在后面运种情况下，我/[p/f击FR佑Il*n城而欠尚同化在片白4击场的空间相干性，良P
[0084]
[0085] 需要注意的是:根据假定的声场，Sinc函数可W由其他函数代替。对于不同的散射声场存在不同的相干函数(已知为先验信息）。示例可W在[E化O2001]中找到。
[0086] 本实施例的方框图在图3中示出。用滤波器组（101)变换麦克风信号后，在信号统计估计块（104)中计算信号的PSD矩阵。此外，在块（102)中或者从信号或使用假定特定散射声场的先验信息计算线性散射声约束矢量bm。随后在块（103)中计算滤波器权重。将权重与麦克风信号相乘产生散射声的期望估计。
[0087] 本实施例计算的滤波器与其他空间滤波器(例如，【背景技术】中描述的滤波器)相比具有W下优点：
[0088] .由于最小化整个输出信号，滤波器提供L个平面波的衰减和平稳噪声之间的最佳折衷；
[0089] .实际中容易计算需要的信号PSD矩阵，因此容易计算滤波器；
[0090] ?不需要L个平面波的DOA信息。
[0091 ]线性约束的最小方差滤波器
[0092] 运个实施例代表新方法和上面结合图2描述的多声道滤波器的现有方法的结合。在本实施例中，定义受到散射约束和附加定向约束的最小化滤波器输出处的平稳噪声的线性约束的巧间滤妮器。滤妮器权軍Wn?被计算为
[0093]
[0094] 受到的线性约束为：
[0095] w%m(k,n) = 1
[0096] 和
[0097]
V/
[0098] 显然，滤波器仅最小化输出处的平稳噪声。使用第二线性约束(如上对于多声道滤波器所解释的，图2)抑制不期望的平面波。运些与根据图3的输出功率最小化滤波器相比的额外的约束确保干扰平面波的更强的抑制。得到的滤波器由于第一线性约束仍保留了散射声。运个滤波器的闭合解，可W在实践中进行计算，且由下式给出：
[0099]
[0100] 运里，矢量C=[bm，ai，a2,…，aL]是包括上述定义的线性约束的约束矩阵，g=[l, 0]T(0为长度L的零矢量)是相应的响应。关于图2所示的多声道滤波器，矢量ai取决于L个平面波的D0A，并能如从文献[Van化ees2002]已知的被计算。与此相反，bm的元素描述麦克风之间的散射声的相关性或相干性。如结合图3所解释的计算bm的元素。此外，On是平稳噪声的PSD矩阵。PSD矩阵可在例如语音停顿的期间被估计。如果不同麦克风中的平稳噪声是相互独立的，可W简单地通过M X M大小的单位矩阵代替O n。
[0101] 本实施例的方框图示于图4。用滤波器组（101)对麦克风信号进行变换后，在噪声统计估计块（104)中计算平稳噪声的PSD矩阵On。此外，在块(102)中，或者从信号或者使用假定特定的散射声场的先验信息计算线性散射声约束bm。在块（105)中，估计L个平面波的 D0A。从运些信息，在块（106)中计算直达声约束ai。计算的信息被反馈到滤波计算块（103)，其使用上面提出的闭合解计算滤波权重Wm。将权重与麦克风信号相乘产生散射声的期望估计。
[0102] 对于运个滤波器得到的提取图案的例子在图7中示出。运里，两个直达声从方位方向51°和97°到达。附图示出当使用具有5厘米麦克风间距的16个麦克风的均匀线性阵列时，在2.8曲Z频率所得到的提取图案。提取图案恰好对于51°和97°具有零值。否则，提取图案几乎是全方位的。运是较产生图6中的空间滤波的图2所示的现有技术的空间滤波器的主要优点。
[0103] 在本实施例中计算的滤波器相比其他空间滤波器(例如，在【背景技术】中所描述的滤波器)具有W下优点：
[0104] .由于直达声约束而具有平面波的强衰减；
[0105] ?被期望用于捕获散射声的几乎全方位的提取图案。
[0106] 组合的方法
[0107] 图3和4所示的空间滤波器一般提供实践中的良好表现。然而，也有特定的缺点。例如图3的滤波器通常不完全抑制直达声。直达声的剩余功率可导致空间声音重现期间的不期望的影响。与此相反，图4的空间滤波器提供针对低频处的平稳噪声的相对差的鲁棒性。下面，结合图3和4的空间滤波器，W在利用两个空间滤波器的优点的同时减少缺点。结果，得到具有良好的干扰抑制(直达声抑制)并对平稳噪声具有高鲁棒性的空间滤波器。
[0108] 下面提出的方法代表所谓的参数多声道维纳滤波器(PMWF)，其可W在所谓的最小均方误差(MMSE)空间滤波器和图3所示的空间滤波器之间调节。另外，图4中的空间滤波器用于估计特定需要的量。
[0109] 提出的PMWF的权向量被计算为
[0110]
[0111]
[0112]
[0113] 其中O2是估计散射声的最大平方绝对误差。对运个优化问题求解得到：
[0114]
[0115]
[0116]
[0117] 运里，QG [0，1]是用户定义的控制参数。对于a = 〇,得到MMSE空间滤波器，其最小化估计散射声的均方误差。对于0 = 1，得到图3提出的空间滤波器。对于其间的值a,存在两个空间滤波器之间的调节。较小的a产生更好的噪声和干扰抑制，而较大的a产生较少失真的散射声估计。注意，如结合图3所解释的计算bm的元素。散射声的功率可W由图4提出的空间滤波器计算，其提供了平面波的很好的抑制。令Wi表示图4的空间滤波器，W估计第一麦克风处的散射声。给定W1，第一麦克风处的散射声功率可W例如如[TMergad2013b]中所描述的得到，即，
[011 引
[0119] 或使用如[Kowalczyk2013]中所解释的判决引导方法得到。在前述公式中，Td是用于散射声的MXM空间相干矩阵。Td的第个元素是麦克风m和m'之间的空间相干性丫 m' ,m。在上文中已经定义了空间相干性丫 m' ,m。
[0120] 本实施例的方框图示于图5。滤波器组（101)对麦克风信号进行变换后，在块(104) 中计算麦克风PSD矩阵Ox和噪声PSD矩阵On。此外，在块(102)中，或者从信号或者使用假定特定的散射声场的先验信息计算线性散射声约束。在块（105)中，估计L个平面波的D0A。从运些信息，我们在块（106)中计算直达声约束。运些约束在（107)中与On-起用于计算权重 Wl。在（108)中从Wl和O n计算散射声的功率4d。然后可W在（103)中使用d)d，〇x，和bm计算空间滤波器的最终权重Wm。用参数a可W在MMSE滤波器和PMWF之间调节空间滤波器。将权重 Wm与麦克风信号相乘产生散射声的期望估计。
[0121] 图8示意性地示出包括M个麦克风的麦克风阵列。麦克风阵列暴露于包括直达声部分和散射声部分的声场。直达声部分在图8中用L个声源Xl=I到Xl=L表示，每一个被假设为在麦克风阵列的位置的生成大体平面波。每个平面波(在麦克风阵列的位置)的传播方向在图帥由矢量m至化示出。直达声部分通常是位置dm的函数。散射声Xd化，n，dm)可W模拟例如室内的混响。假定散射声由具有随机相位、随机幅度和随机DOA的平面波的无穷和产生。运意味着，散射声由围绕声音场景随机分布的无限数量的源产生。运些声源模拟产生后期混响的无限数量的房间反射。
[0122] 单个麦克风信号，例如对于第m个麦克风，Xm化，n)是L个直达声部分Xl=I到Xl=l、散射声部分的Xd和噪声Xn的组合，即
[0123]
[0124] 对于其他麦克风到第m个麦克风之间的散射声的相对传递函数Bi,m，B2,m，...， Bm',m，. . .，BM,m示意性地示于图8。从第m个麦克风到自身的相对传递函数Bm,m(未在图8示出）通常等于1。
[0125] W下列表提供上述的方面的一些的简要概述：
[01%] ?接收至少两个麦克风信号；
[0127] .将麦克风信号变换至时间-频率域或另一合适的域；
[0128] .计算线性散射声约束作为麦克风之间的散射声的相关性或相干性的函数；
[0129] .计算信号和/或噪声的统计；
[0130] .在一些实施例中：估计直达声的D0A，计算表示麦克风之间的直达声的相对传递函数的直达声约束；
[0131] .在一些实施例中：计算辅助滤波器，并估计散射声的功率；
[0132] .计算空间滤波器的权重，W通过考虑散射声约束使用得到的信号/噪声统计和可选的散射声功率信息提取散射声；
[0133] .使用计算的空间滤波器的权重执行麦克风信号的线性组合。
[0134] 尽管已在装置的上下文中描述一些方面，但显然，运些方面也表示对应方法的描述，其中块或器件对应于方法步骤或方法步骤的特征。类似地，方法步骤的上下文中所描述的方面也表示对应块或项目或对应装置的特征的描述。
[0135] 取决于某些实施要求，本发明的实施例可W W硬件或软件实施。可使用其上储存有与可编程计算机系统协作(或能够协作）的电子可读控制信号，W便执行各个方法的数字储存媒体，例如，软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存，来执行实施。
[0136] 根据本发明的一些实施例包括具有电子可读控制信号的永久数据载体，该控制信号能够与可编程计算机系统协作，使得执行本文中所描述的方法中的一个。
[0137] 大体而言，本发明的实施例可实施为具有程序代码的计算机程序产品，当计算机程序产品在计算机上运行时，程序代码操作性地用于执行方法中的一个。程序代码可例如储存于机器可读载体上。
[0138] 其他实施例包括储存于机器可读载体上的用于执行本文中所描述的方法中的一个的计算机程序。
[0139] 换句话说，因此，本发明方法的实施例为具有程序代码的计算机程序，当计算机程序在计算机上运行时，程序代码用于执行本文中所描述的方法中的一个。
[0140] 因此，本发明方法的另一实施例为包括记录于其上的，用于执行本文中所描述的方法中的一个的计算机程序的数据载体(或数字储存介质，或计算机可读介质）。
[0141] 因此，本发明方法的另一实施例为表示用于执行本文中所描述的方法中的一个的计算机程序的数据流或信号序列。数据流或信号序列可例如被配置为通过数据通信连接，例如，通过因特网，传递。
[0142] 另一实施例包括处理构件，例如，被配置为或适于执行本文中所描述的方法中的一个的计算机或可编程逻辑器件。
[0143] 另一实施例包括其上安装有用于执行本文中所描述的方法中的一个的计算机程序的计算机。
[0144] 在一些实施例中，可编程逻辑器件(例如，现场可编程口阵列）可用于执行本文中所描述的方法的功能性中的一些或所有。在一些实施例中，现场可编程口阵列可与微处理器协作，W便执行本文中所描述的方法中的一个。大体而言，较佳地由任何硬件装置执行方法。
[0145]上文所描述的实施例仅仅说明本发明的原理。应理解，本领域技术人员将显而易见对本文中所描述的配置及细节进行修改及变化。因此，仅意欲由所附的权利要求的范畴限制范围，而非由通过本文中实施例的描述及解释所呈现的特定细节限制范围。
[0146] 参考文献
[0147] [Pulkki2007]V.Pulkki/'Spatial sound reproduction with directional audio coding/^J.Audio Eng.Soc,Vol.55,No.6,pp.503-516,June 2007.
[0148] [Thiergart2013]0?Thiergart，G?DelGaldo,M.Taseska,and E.Habets，" Geometry-based spatial sound acquisition using distributed microphone arrays /^Audio, Speech,and Language Processing，IEEE Transactions on,Vol.21, No.12,pp.2583-2594,December 2013.
[0149] [Kowalczyk2013化.Kowalczyk,O.Thiergai't，A.Craciun,and E.A.P.Habets，" Sound acquisition in noisy and reverberant environments using virtual/'in Applications of Signal Processing to Audio and Acoustics(WASPAA)，2013IEEE Workshop on,October 2013.
[0150] [Thiergai^tSOlSWChlliiei^gart and E.A.P.Habets,"An informed LCMV filter based on multipleinstantaneous direction-0f-arrivaI estimates,"in Acoustics Speech and Signal Processing(ICASSP),2013 IEEE International Conference on， 2013,pp.659-663.
[0151] [Thiergai^tSOlSlO^Thiergai^tfG^D^Galdo,and E.A.P.Habets, "On 化e spatial coherence in mixed sound fields and its application to signal-t0-diffuse ratio estimationThe Journal of the Acoustical Society of America,vol.132, no.4,pp.2337-2346,2012.
[0152] [VanTrees2002]H.L.Van Trees,Detection,Estimation,and Modulation Theory:Part IViArray Processing.John Wiley&Sons,April 2002,vol. I.
[01 日3] [Elko2001]G.W.Elko, ('Spatial coherence functions for differential micro-phones in isotropic noise fields，'，in Microphone Arrays: Signal Processing Techniques and Applications，edited by M.Brandstein and D.Ward, chapter 4,61-85(Springer,Berlin)(2001)?
【主权项】
1. 一种方法，包括：定义散射声滤波器的滤波系数的线性约束，所述线性约束基于第一麦克风信号中的第一散射声部分和第二麦克风信号中的第二散射声部分之间的空间相干性，所述第一麦克风信号由第一麦克风捕捉，所述第二麦克风信号由与第一麦克风W已知的方式间隔开的第二麦克风捕捉；计算至少一个直达声的到达方向、所述第一麦克风信号和所述第二麦克风信号的信号统计、和所述第一麦克风信号和所述第二麦克风信号的噪声统计中的至少一个;和通过在考虑所述滤波系数的线性约束的条件下对关于所述至少一个直达声的到达方向、所述信号统计和所述噪声统计中的至少一个的优化问题求解，确定所述散射声滤波器的所述滤波系数。2. 根据权利要求1所述的方法，进一步包括：基于所述第一麦克风和所述第二麦克风之间的所述散射声的相关性或相对传递函数提供所述空间相干性。3. 根据权利要求1所述的方法，其中对于给定的环境，在所述环境中不存在直达声的时间周期内，所述空间相干性基于所述散射声的相关性或相对传递函数的先前度量。4. 根据权利要求1或2所述的方法，其中所述空间相干性基于所述散射声的理论关系，其中相应的假定散射声场具有关于所述第一麦克风和所述第二麦克风之间的所述散射声的相关性的理论特性。5. 根据权利要求1至4中任一项所述的方法，其中所述优化问题表示为服从的所述线性约束为 wHbm 化,η) = 1，其中， W化，η)是所述散射声滤波器的所述滤波系数的矢量； Wm化，η)是基于第m个麦克风处的麦克风信号的评估的所述优化问题的解； J(w)是成本函数； W化，η)是估计空间相干性的矢量，其中所述矢量的第m'个元素是所述第m个麦克风和第m '个麦克风之间的所述散射声的估计空间相干性； k是频域索引；W及 η是时域索引。6. 根据权利要求5所述的方法，其中所述成本函数J(w)基于噪声统计、噪声功率谱密度 (PSD)矩阵、信号统计、或麦克风功率谱密度(PSD)矩阵中的一个。7. 根据权利要求1至6中任一项所述的方法，进一步包括：估计至少一个直达声的到达方向或所述第一麦克风和所述第二麦克风之间的至少一个直达声的相对传递函数中的至少一个；使用所述至少一个直达声的所述到达方向或所述相对传递函数计算至少一个直达声约束，其中所述至少一个直达声约束导致所述至少一个直达声的抑制。8. 根据权利要求1至7中任一项所述的方法，其中所述优化问题的解为其中， Wm化，η)是基于第m个麦克风处的麦克风信号的估计的优化问题的解； b"化，η)是估计空间相干性的矢量，其中所述矢量的所述第m'个元素是所述第m个麦克风和第m '个麦克风之间的散射声的的估计空间相干性； ae[〇，l]是用户定义的控制参数，通过所述用户定义的控制参数，所述散射声滤波器可W在最小均方误差空间滤波器和最小化所述输出功率同时满足所述散射声约束的滤波器之间调节； Φ d是散射声功率;W及 φχ是所述麦克风信号的功率谱矩阵。9. 根据权利要求8所述的方法，进一步包括：基于辅助散射声滤波器估计所述散射声功率Φ d。10. 根据权利要求9所述的方法，其中基于W下公式执行估计所述散射声功率Φ d:其中， 4是提供所述散射声功率Φ<ι的估计的所述估计散射声功率； W1是所述辅助散射声滤波器的滤波系数的矢量； Φχ是所述麦克风信号的功率谱密度矩阵； Φη是所述麦克风信号中的所述噪声的功率谱密度矩阵；W及 Γ d是所述散射声的空间相干性矩阵，所述Γ d的第(m，m'）个元素是麦克风m和麦克风m' 之间的空间相干性丫11. 根据权利要求1至10中任一项所述的方法，进一步包括：使用所述散射声滤波的所述滤波系数执行所述第一麦克风信号和所述第二麦克风信号的线性组合。12. -种计算机程序，当在计算机或信号处理器上执行时，用于实施权利要求1至11中任一项所述的方法。13. -种装置，包括：线性约束计算器，用于定义散射声滤波器的滤波系数的线性约束，所述线性约束基于第一麦克风信号中的第一散射声部分和第二麦克风信号中的第二散射声部分之间的空间相干性，所述第一麦克风信号由第一麦克风捕捉，所述第二麦克风信号由与第一麦克风W 已知的方式间隔开的第二麦克风捕捉；计算器，用于计算至少一个直达声的到达方向、所述第一麦克风信号和所述第二麦克风信号的信号统计、和所述第一麦克风信号和所述第二麦克风信号的噪声统计中的至少一个;和滤波系数计算器，用于通过在考虑所述滤波系数的线性约束的条件下对关于所述至少一个直达声的到达方向、所述信号统计和所述噪声统计中的至少一个的优化问题求解，确定所述散射声滤波器的所述滤波系数。14. 根据权利要求13所述的装置，其中所述空间相干性基于所述第一麦克风和所述第二麦克风之间的所述散射声的相对传递函数。15. 根据权利要求13或14所述的装置，进一步包括：辅助滤波系数计算器，用于通过在考虑与所述滤波系数计算器不同的所述辅助滤波系数的线性约束的条件下对不同的优化问题求解，确定辅助散射声滤波器的辅助滤波系数；所述辅助散射声滤波器用于估计估计散射声功率；W及其中所述滤波系数计算器用于当确定所述散射声滤波器的所述滤波系数时考虑所述估计散射声功率。
【文档编号】G10L21/0208GK105981404SQ201480066907
【公开日】2016年9月28日
【申请日】2014年12月2日
【发明人】奥利弗·蒂尔加特, 伊曼纽尔·哈毕兹
【申请人】弗朗霍夫应用科学研究促进协会

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：奥利弗·蒂尔加特;伊曼纽尔·哈毕兹;
技术所有人：弗朗霍夫应用科学研究促进协会;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。