用于非线性和时变回波消除的参考麦克风的制作方法

文档序号:11637508阅读:299来源:国知局
用于非线性和时变回波消除的参考麦克风的制造方法与工艺

相关申请的交叉引用

根据美国专利法律35u.s.c.§119(e),本申请要求于2014年11月25日提交的、名称为“referencemicrophonefornon-linearandtimevariantechocancellation(用于非线性和时变回波消除的参考麦克风)”的美国临时申请no.62084221的权益,其全部内容通过引入而并入本文。

本申请涉及声回波消除方法(acousticechocancelingapproach),例如用于移动电话的声回波消除方法。



背景技术:

在双向远程通信系统中,声回波源于通过扬声器(loudspeaker)输出的、在通常被称为近端装置的相同装置上由麦克风捕获的信号。该捕获的结果是,在远程通信延迟后,会话另一侧的用户(远端用户)听见作为回波的自身声音。可证明的是,回波不利于进行自然会话,并且针对免提电话会话需要消除回波的方法。

免提电话装置有时使用全双工声回波消除(aec:acousticechocancellation)算法,来消除回波语音并最大程度降低影响会话质量。可以在发送到扬声器的信号和通过麦克风捕获的信号之间建立纯线性相关性时,aec算法最适用。

在目前的移动装置中,朝向便携式和更轻薄工业设计的驱动已使得这些装置内体积变得更小。声学性能在有效体积内受此约束。针对轻薄优雅的设计,需要使用更小、更薄的扬声器。因此,可以移动更少量的空气,导致声压级(spl:soundpressurelevel)降低,尤其是在较低频率情况下。当初始设备制造商(oem)设计出小规格扬声器时,所产生的扬声器无法实现预期spl。音频系统工程师可以过驱动(overdrive)扬声器和功率放大器,以获得预期spl。然而,对扬声器尺寸的约束通常导致非线性输出。

一般来说,扬声器振动在小和高振幅时表现不同。对振幅的依赖性是对系统中固有非线性的指示。过驱动扬声器同样通过扬声器振膜的过度振幅,来引起非线性失真(软限幅的结果)。该次级非线性效应是生成不在激发刺激物中的额外谱分量。它们通常是作为多个基频之间的谐波或互调失真的、所应用的基频的整数倍。同样利用谐波生成来过驱动小型扬声器,因为低频基频的谐波可以在心理声学上填充低频损耗,使得音频频谱下端声音比其更加饱满。

影响小型扬声器中非线性行为的一个因素是磁力因素bl(x)。当磁场不均匀时,磁力因素是位移的函数。这在更小型扬声器中具有更大影响。另一因素是悬挂柔性(compliance)cms(x)或者相反地,悬挂刚度kms(x)。这是悬挂的回复力作为距离的函数而增加。又一因素是机械阻力rms(v)并且此因素取决于线圈的速度。机械阻力随任一方向中速度的递增而增加。

免提电话应用的回波路径中非线性的主要原因通常是扬声器。所有这些因素影响施加到振膜上的力,其进一步影响音圈的位移和速度。这是在这些因素之间互相作用的非线性反馈回路。bl(x)和kms(x)产生dc分量,而rms(v)使得谐振时基频压缩。这些经由反馈人体影响总谐波失真(thd:totalharmonicdistortion)和互调失真(imd:intermodulationdistortio)。扬声器中主导的非线性可能显著影响输出信号。

过驱动超规格扬声器同样能够使扬声器失效,因为过度振幅可以使振膜摆动,并且因为扬声器音圈中的余热同样可以使扬声器失效。电子反馈补偿可以用于扬声器防护。扬声器防护技术测量音圈上的电流和电压,以估计温度和偏移,并且自适应地将这些限定在针对最高可能spl和更佳可听性的最大程度以下。这提高了扬声器的寿命,同时提取最高性能。

扬声器防护技术采用自适应算法,以管理输出信号动力学,为了制约偏移(excursion),限制温度并最大程度降低thd,同时最大程度提高输出功率。相比于aec使用的信号,扬声器输出在时间和频率方面不断变化。因此,扬声器信号输出电平可以与aec算法通常使用作为回波参考信号的远端信号在时间上进行高度的去相关处理,即,即使在准稳态意义上,其也不再是时间恒定的。

小型扬声器用于移动音频,原因如下:通过市场营销和工业设计要求驱动的对尺寸的约束;用于扬声器声学(包括背体积)的小空间;用于携带的移动性和便利性的纤薄装置;制造商的经济性决策;以及在竞争相当激烈的市场中用料清单及成本的控制。

鉴于工程和市场决策,通常过驱动小型扬声器。这些扬声器需要满足使用时的目标spl,并诱发低频基频的谐波失真,以增强低音感受,尤其是当低频在更小型扬声器中被衰减时。

用于aec算法的扬声器非线性和扬声器防护算法的结果是,并未维持回波参考信号和实际扬声器输出之间的线性非时变关系。这可以导致较差的aec性能。

存在若干与这种非线性系统标识有关的问题,并且先前算法不足以在线性条件下匹配aec的性能。非线性aec(nlaec)算法的计算复杂性同样显著超过线性aec算法。此外,过驱动用于导出这种使用情况的足够输出的小型扬声器的必要性,同样导致开发随时间变化的扬声器防护算法,其根据源自于扬声器的实时性能参数,动态地调节扬声器的驱动功率。这可以导致非线性的减少,但引起随时间变化的扬声器输出系统。这同样引发在aec算法的收敛问题,这通常发生在扬声器防护算法之前导出的参考信号。

所有这些问题已经导致一些用户对先前方法的不满。

附图说明

为了更完整地理解本公开,应参照下述详细说明及附图,其中:

图1包括根据本发明的各种实施方式的、麦克风系统的框图;

图2包括根据本发明的各种实施方式的、声压级与距源的距离的曲线图;

图3包括根据本发明的各种实施方式的、声压级与全向对差动式麦克风的对数距离的关系的曲线图;

图4包括根据本发明的各种实施方式的、差动式麦克风的一示例的框图;

图5包括根据本发明的各种实施方式的、差动式麦克风的另一示例的框图;

图6包括根据本发明的各种实施方式的、差动式麦克风的另一示例的框图;

图7包括根据本发明的各种实施方式的、差动式麦克风的另一示例的框图。

本领域技术人员应当理解,附图中的元素是为了简单和明了而示出。还应当理解,可以以出现的特定顺序来对某些操作和/或步骤进行描述或者描写,但是本领域技术人员应能够理解对顺序的这种特殊性实际上是不需要的。还应该理解,本文中使用的术语和措辞具有与其各自相应的探究和研究领域相对应的这种术语和措辞的普通含义,除非本文中规定了其具有特定的含义。

具体实施方式

本方法提供了在诸如电话和移动无线装置(例如,移动电话或智能电话)这样的电子装置中的声回波消除。在一特定示例中,移动电话可以作为免提电话使用,并且来自扬声器的信号由装置上的麦克风捕获,并被回波反射回发出原声的人员。在诸如移动智能电话这样的特定消费者装置中,扬声器和功率放大器通常可以在其线性操作范围外驱动。

在这种情况下,对线性声回波消除(aec)算法进行修改,以试图识别并消除回波的非线性分量。本方法解决了在非线性和时变条件下声回波消除的问题,并为线性非时变系统上运行的分量提供改进的性能和降低的aec算法复杂性。

本文所呈现的方法涉及语音电话,并且更具体地涉及用于移动电话的声回波消除方法。然而,应当理解,本文所呈现的理念可以有效地用于声回波消除设置,其中,从扬声器输出的信号不再与通过回放应用播放的信号呈线性和时间恒定相关。

在若干此类实施方式中,接收到来自远端用户的远端信号并在扬声器处广播远端信号。确定用于估计回波传递函数的信号,在如下信号之间选出该信号:远端信号或从紧邻扬声器设置的近场麦克风接收到的回波参考信号。近场麦克风感测从扬声器广播的远端信号。至少部分地基于所选信号来确定回波传递函数,并且回波传递函数代表扬声器和远场麦克风之间的声路径的特性,该远场麦克风与近场麦克风相比设置在距扬声器更远的距离处。至少部分地基于回波传递函数来确定估计回波。从由远场麦克风接收到的信号中减去所估计的回波,并且减去步骤有效于消除在从远端麦克风接收到的信号中存在的回波。

在某些方面,近场麦克风是差动式麦克风。在其他方面,远端信号由功率放大器放大。

在某些示例中,将扬声器和近场麦克风设置成彼此相距在约5mm以内。在其他示例中,将近场麦克风、远场麦克风以及扬声器设置在单个平台处。在其他示例中,在相同声学环境中,将近场麦克风和扬声器设置在单个平台处,并且,将远场麦克风设置在另一平台中。

在某些方面,尽管差动式麦克风邻近扬声器,但是由于扬声器输出远端信号而导致的差压电平并没有使差动式麦克风超载。在其他方面,在差动式麦克风处拾取的信号是包括所有扬声器非线性效应的扬声器输出信号,并且由于近端话音信号和环境噪音而具有可忽略的(insignificant)能量,允许回波传递函数估计处理呈线性处理。

在某些示例中,由于近端和噪音源距差动式麦克风的距离,由于近端话音信号和环境噪音而导致的差压电平在差动式麦克风处可忽略。在其他方面,在差动式麦克风处拾取的信号是包括所有扬声器非线性效应的扬声器输出信号,并且由于近端话音信号和环境噪音而具有可忽略的能量,从而允许回波传递函数估计处理呈线性处理。

在某些示例中,来自线性回波传递函数估计的回波传递估计用于估计非线性回波路径,并从通过远场语音麦克风所捕获的麦克风信号中成功地减去非线性回波。在某些示例中,单个平台位于移动电话、膝上型计算机或平板计算机、家庭自动化设备或其他近端语音通信设备、或能够音频回放并响应于语音输入的设备。其他示例也是可能的。

在其他这些示例中,涉及一种装置,其包括:近场麦克风,该近场麦克风用于接收来自扬声器的声音,并产生回波参考信号;以及远场麦克风,该远场麦克风用于接收来自扬声器的声音。近场麦克风与扬声器紧邻布置。该装置包括:回波参考控制模块,该回波参考控制模块被配置为自适应地并动态地确定回波估计信号,以估计回波传递函数,从如下信号之间选出该信号:从近场麦克风接收到的回波参考信号和来自远端用户的远端信号,或这两个信号的组合。该装置还包括:自适应模块,该自适应模块被配置为至少部分地基于所选回波估计信号来确定回波传递函数,并且自适应模块还被配置为至少部分地基于回波传递函数来确定所估计的回波。该装置还包括:汇总器,该汇总器从通过远场麦克风产生的信号中减去所估计的回波,以产生回波消除信号。

现参照图1,描述了回波消除系统100的示例。系统100包括:扬声器-封闭-麦克风-系统(lems:loudspeaker-enclosure-microphone-system)102。lems102包括:功率放大器104(放大输入信号)、扬声器106(向用户提供信号)、近场麦克风108(紧邻用作紧邻噪音消除麦克风装置的扬声器106)、以及远场麦克风110。扬声器106可以是任意类型的、将电信号转换成声能的扬声器或接收机。在一示例中,扬声器106是扬声器。在一示例中的麦克风108是下述差动式麦克风。

系统100还包括:回波参考控制模块120、控制逻辑122、自适应算法124、以及滤波器路径126。回波参考控制模块120的功能是:自适应地确定用于确定回波传递函数(回波参考来自麦克风108)的信号n{x(n)}或远端信号x(n)。这可以通过将回波参考信号与通过麦克风108拾取的回波信号进行比较,确定扬声器中非线性的数量来实现。控制逻辑122的功能是与回波参考控制模块120协同作业,以管理自适应算法124,从而在该过程中使用适当输入。自适应算法124的功能是估计回波传递函数。它可以是若干标准中的一个,并被证实是线性声回波消除算法。滤波器路径126的功能用于建模声回波路径,从而复制可以在声回波消除器中消除的真实回波。

如图1所示,将紧邻噪音消除麦克风装置108放置为邻近紧凑型移动设备中的扬声器106。"紧邻"是指小于约5mm的距离。其他距离也是可能的。紧邻扬声器106允许麦克风108拾取基准回波信号,同时对来自其他声源的信号具有免疫性。

麦克风108用作远端回波参考麦克风。因为扬声器106中的所有非线性均已考虑到,所以这允许回波参考相对于来自麦克风110的主麦克风回波信号呈线性关系。结合初始远端参考信号(通过例如回波消除器的当前可用实施方式中的软件,在内部提供的),这种信号源导致甚至在高度非线性驱动的扬声器系统中的优异aec性能,算法复杂性的要点或许在移动系统中失效。远端参考将提供用于通过双端口麦克风拾取回波参考的远端语音活动检测触发器。这依次提供如通过如下等式给出的、提供给适当的线性声回波消除器算法的参考信号。当线性条件成立时,相反可以使用诸如nlms、fd-nlms、mdf或类似算法这样的最优算法。

在图1的双向远程通信系统中,声回波源于通过扬声器106输出的、在通常被称为近端的相同装置上由麦克风110所捕获的信号。该捕获的结果是,在远程通信延迟后,会话另一侧(远端)的用户听见作为回波的自身声音。可证明地是,回波不利于进行自然会话,并且免提电话会话需要消除回波的方法。一方面,系统100使用全双工声回波消除(aec)算法(经由自适应算法124实施),来消除回波语音,以最大程度降低影响会话质量。可以在发送到扬声器106的信号和通过麦克风110捕获的信号之间建立纯线性相关性时,aec算法最适用。

如图1所示,将来自远端的信号132在声学上通过扬声器106广播到用户聆听免提电话装置的房间中。此外,麦克风110捕获连同广播扬声器信号的回波和任何背景噪音的用户语音(近端语音)。扬声器106、房间(封闭)以及麦克风108和110都包括lems102。假设lems102呈线性,可以建模回波,作为远端信号x(n)和lems声响应h(n)的乘积,即

d(n)=h(n)*x(n)(1)

使用扬声器106和麦克风110的线性模型,将扬声器106和麦克风110之间的声路径及相关线性增益集中到房间的声响应或回波路径传递函数。因而,可以建模lems声响应h(n),作为有限脉冲响应(fir)滤波器h(n)。然后,该回波是远端信号x(n)(表示为向量)的函数。

d(n)=h(n)tx(n)(2)

aec算法124的目标是从麦克风信号中去除回波信号d(n),从而远端用户无法对其进行察觉。这必须在近端话音信号s(n)不失真的情况下完成。aec算法124的通用方法是自适应地估计从扬声器至麦克风的回波路径。然后将此估计应用于远端信号,以再生回波,从而可以从麦克风信号s(n)和汇总器129中减去。在环境噪音v(n)的情况下,这是复杂的。麦克风信号是回波、近端信号和噪音的总和。

y(n)=d(n)+s(n)+v(n)=h(n)tx(n)+s(n)+v(n)(3)

驱动回波消除器,以通过自适应算法收敛于回波路径的有限脉冲响应横向滤波器估计所估计的回波可以写作所建模的回波路径与扬声器信号的函数。

将回波消除后的信号e(n)限定为误差信号,麦克风信号和估计回波之间的差值:

该问题可以通过使误差的适当函数最小化来解决。通常选择均方误差e{e2(n)},此标准具有单一全局极小值,只要系统维持其线性。这允许可以收敛于全局极小值的若干自适应方法。很多此类方法采用lms(最小均方值)自适应算法的时间或频域变量。该算法也是公知的并且在此用作线性声回波消除的代表方法。lms算法采用"最陡下降(steepestdecent)",来接近全局极小值。可以通过最小化均方误差并进行误差e(n)和输入x(n)之间的瞬时梯度估计,来导出滤波器路径估计的lms更新等式。

这里,μ是学习速率因子。它可以示出为受限于输入自相关的最大本征值,并且算法的总收敛性受本征值扩展的制约。lms算法对输入的功率敏感。这种依赖性通常通过使用输入功率x(n)tx(n)来正常化更新分量来移除。

上述等式假设lems系统中的时间变化足够慢,使得自适应算法可以收敛于比声路径转换更迅捷的正确解决方案。这通常成立,只要没有超出针对自适应算法进行抽头(tapped)的点,来修改参考回波信号。

当前方法通过考虑扬声器响应的非线性,来线性化声回波问题。因此,可以采用通用的低复杂度线性aec算法,来代替具有其相关问题的复杂非线性aec算法。

更具体地,麦克风108用于拾取回波参考信号。扬声器106和回波参考麦克风108被配置为在邻近(极近场)处具有声端口。可以将这种回波参考麦克风设计成,对紧邻的音频信号敏感并且极大幅度地削弱远场信号。将这两个端口分开的示例距离可能小于约5mm。近端源通常是该距离的至少5至25倍以上,即25mm到125mm以上。有利地的是,一方面,当前方法线性地捕获扬声器106端口附近的音频,同时对近端目标信号和周围音频具有可忽略的灵敏度。这可以在一示例中通过使用麦克风108的差动式麦克风来实现。

可以理解的是,一般来说,可以使用由下述声学机构限定的、具有近场响应的麦克风作为回波参考信号的源。这种麦克风带有具有极高衰减敏感度的近场响应,作为从麦克风的渐增距离的函数。随距离急剧下降的响应允许使用麦克风,以准确地捕获扬声器的输出,同时将近端语音削弱到可忽略的电平。

如图2所示,声压级随距离反向下降。这由关系p×r=k表示,其中,r是距源的距离,p是源处的声压级而k是常数。如果将声压级转换成db,则:

20log10|p(r)|=20log10k-20log10r

(7)

如图2所示,在一定距离ri;i=1,2,3,4处的压力pri由k/ri给出。间隔恒定距离δ处的压力差可以表示为

如果δ<r1,则r1r2≈r12且r3r4≈r32,因此

实际声压级可以显著高于源附近的压力差,并且潜在地使全向麦克风负载过重,然而,压力差更小并且麦克风振膜和电路很容易设计为避免超载。此外,作为r2的函数的压力差的该反比关系的效应意味着在距声源较远距离处,压力差显著小于实际压力级。这示于图2。如果将压力差转换成db,则:

20log10|pd|=20log10kδ-40log10r

=20log10k+20log10δ-40log10r(8)

图3示出当以对数标度相对于距离进行绘制时,该差异是全向麦克风和差动式麦克风之间的声压级(以分贝计)(例如,可用于麦克风108的声压级)。该绘图示出相比于全向麦克风,差动式麦克风的敏感度下降。

采用具有差动式麦克风拾取(即,使麦克风108成为差动式麦克风)的方法,获得了与扬声器端口紧邻的扬声器信号的清楚和线性的拾取。然而,在免提电话配置中用户的语音在相当远的位置处,并且将以图3所示的更快速率(20log10δ-20log10r)降低。这里,第一项是常数且第二项表明,随着距源的距离,相比于全向麦克风的敏感度,差动式麦克风敏感度以更快速率显著降低。

这种配置相对于诸如用户的语音和近端环境噪音这样的近端信号并不敏感,并提供声回波消除的线性回波参考信号。因此,差动式麦克风一方面用于回波参考麦克风108。

存在可用于麦克风108的差动式麦克风的各种配置。现将描述一些此类示例。

现参照图4,描述了麦克风400的一示例。麦克风400是作为近场差动式麦克风的双端口麦克风。盖403设置在基底或基座401上,并具有穿过其延伸的第一端口402和第二端口404。mems装置406从端口接收声能,并将声能转换成电信号。在一示例中,垫片410包围麦克风400。垫片可以具有引导至端口402和404的通道412和414。此外,可以提供通过基底到端口404的通道416。垫片410包括与通道412和414连通的端口450和452。

可以理解的是,本文所述的mems装置包括通电的振膜和背板。声压使振膜移动,并且该移动产生针对背板的差动电压或差动电流。差动电压或差动电流代表所接收到的声能。

现参照图5,描述了麦克风500的另一示例。盖503设置在基底或基座501上并具有穿过其延伸的端口502。基座503中的通道507允许mems装置506下方的体积与盖503和mems装置506之间的体积之间的连通。mems装置506从端口502接收声能,并将该声能转换成电信号。在图5的示例中,单一端口使mems装置506内的振膜的两侧曝光。此配置可重复使用,用于精确地捕获回波参考信号。

现参照图6,描述了麦克风600的另一示例。盖603设置在基底或基座601上,并具有穿过其延伸的端口602。mems装置606从端口602接收声能并将该声能转换成电信号。在一示例中,垫片610包围麦克风600并具有双端口620和622,该双端口620和622通过通道624与盖603上的端口602连通。在另一示例中,当将端口602置于mems系统装置606(无基底或基座)下方时,垫片610具有引导至端口602的通道652和654。在图6所示的两个示例中,将具有两个声端口的垫片连接到全向麦克风的一个端口。针对这种垫片的、在麦克风端口处的压力是在垫片的两个端口处的压力差。

现参照图7,描述了麦克风700的另一示例。麦克风700包括:第一mems装置705和第二mems装置706,同时盖703设置在基底或基座701上。第一端口702延伸通过盖703,并且第二端口704延伸通过基座701。该配置操作单一端口mems并可用于正常语音捕获,而另一mems充当主要用于提供回波消除参考信号的双端口噪音消除结构。该配置还可以通过结合单端口mems和双端口mems的信号,来允许用于传输信号的更好环境噪音消除。

在此描述了本发明的优选实施方式,包括发明人已知的实施本发明的最佳方式。应当理解,所例示的实施方式仅仅是示例性的,而不应当理解为限制本发明的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1