串扰处理B链的制作方法

文档序号:21487060发布日期:2020-07-14 17:13阅读:289来源:国知局
串扰处理B链的制作方法

本文描述的主题涉及音频信号处理,并且更具体地涉及在对扬声器应用音频串扰消除时解决(几何上和物理上的)不对称性。



背景技术:

音频信号可能被输出至次优配置的呈现系统和/或室内声学。图1a示出了理想的跨耳配置(transauralconfiguration)的示例,即,单个收听者在空的隔音室内中的针对双声道立体声扬声器系统的理想的扩音器和收听者配置。如图1a所示,收听者140处于理想位置(即,“最佳听音位置(sweetspot)”)以体验来自左扬声器110l和右扬声器110r呈现的音频,具有相对于内容创建者的原始意图最准确的空间和音质再现。

然而,存在理想的“最佳听音位置”条件不满足或者利用音频发射装置不可实现的各种情况。这些包括收听者140的头部位置从立体声扩音器110l与110r之间的理想的“最佳听音位置”横向偏移的情况,如图1b所示。或者,如图1c所示,收听者140处于理想位置,但是每个扩音器110l和110r与收听者140的头部位置之间的距离不相等。此外,收听者140可能处于理想的位置,但是扩音器110l和110r的频率和振幅特性是不相等的(即,呈现系统是“不匹配的”),如图1d所示。在另一个示例中,收听者140和扩音器110l和110r的物理位置可能是理想的,但是扩音器110l和110r中的一个或更多个可能从理想角度旋转地偏移,如图1e所示的右扩音器110r。



技术实现要素:

示例实施方式涉及针对各种扬声器或环境不对称性进行调整的空间增强音频信号的b链处理。不对称性的一些示例可以包括一个扬声器与收听者之间的时间延迟与另一个扬声器与收听者之间的时间延迟不同、一个扬声器与收听者之间的信号水平(感知和客观的)与另一个扬声器与收听者之间的信号水平不同、或者一个扬声器与收听者之间的频率响应与另一个扬声器与收听者之间的频率响应不同。

在一些示例实施方式中,用于增强左扬声器和右扬声器的输入音频信号的系统包括空间增强处理器和b链处理器。空间增强处理器通过对输入音频信号的空间分量和非空间分量进行增益调整来生成空间增强信号。b链处理器确定左扬声器与右扬声器之间在收听位置的频率响应、时间对准和信号水平上的不对称性。b链处理器通过以下来生成针对左扬声器的左输出声道和针对右扬声器的右输出声道:向空间增强信号应用n频带均衡以针对频率响应上的不对称性进行调整;向空间增强信号应用延迟以针对时间对准上的不对称性进行调整;以及向空间增强信号应用增益以针对信号水平上的不对称性进行调整。

在一些实施方式中,b链处理器通过向左空间增强声道和右空间增强声道中的至少之一应用一个或更多个滤波器来应用n频带均衡。一个或更多个滤波器平衡左扬声器和右扬声器的频率响应,并且可以包括以下中至少之一:低架滤波器(low-shelffilter)和高架滤波器(high-shelffilter);带通滤波器;带阻滤波器;峰值陷波滤波器;以及低通滤波器和高通滤波器。

在一些实施方式中,b链处理器根据收听位置的改变来调整延迟和增益中的至少之一。

一些实施方式可以包括非暂态计算机可读介质,其存储有在由处理器执行时将处理器配置成进行以下操作的指令:通过对输入音频信号的空间分量和非空间分量进行增益调整来生成空间增强信号,所述输入音频信号包括针对左扬声器的左输入声道和针对右扬声器的右输入声道;确定左扬声器与右扬声器之间的不对称性;以及通过以下来生成针对左扬声器的左输出声道和针对右扬声器的右输出声道:向空间增强信号应用n频带均衡以针对频率响应上的不对称性进行调整;向空间增强信号应用延迟以针对时间对准上的不对称性进行调整;以及向空间增强信号应用增益以针对信号水平上的不对称性进行调整。

一些实施方式可以包括一种用于处理左扬声器和右扬声器的输入音频信号的方法。该方法可以包括:通过对输入音频信号的空间分量和非空间分量进行增益调整来生成空间增强信号,所述输入音频信号包括针对左扬声器的左输入声道和针对右扬声器的右输入声道;确定左扬声器与右扬声器之间在收听位置的频率响应、时间对准和信号水平上的不对称性;以及通过以下来生成针对左扬声器的左输出声道和针对右扬声器的右输出声道:向空间增强信号应用n频带均衡以针对频率响应上的不对称性进行调整;向空间增强信号应用延迟以针对时间对准上的不对称性进行调整;以及向空间增强信号应用增益以针对信号水平上的不对称性进行调整。

附图说明

图1a、图1b、图1c、图1d和图1e示出了根据一些实施方式的相对于收听者的扩音器位置。

图2是根据一些实施方式的音频处理系统的示意性框图。

图3是根据一些实施方式的空间增强处理器的示意性框图。

图4是根据一些实施方式的子带空间处理器的示意性框图。

图5是根据一些实施方式的串扰补偿处理器的示意性框图。

图6是根据一些实施方式的串扰消除处理器的示意性框图。

图7是根据一些实施方式的b链处理器的示意性框图。

图8是根据一些实施方式的用于输入音频信号的b链处理的方法的流程图。

图9示出了根据一些实施方式的非理想头部位置和不匹配的扩音器。

图10a和图10b示出了根据一些实施方式的图9中所示的非理想头部位置和不匹配的扩音器的频率响应。

图11是根据一些实施方式的计算机系统的示意性框图。

附图描绘了并且具体实施方式描述了仅出于说明的目的各种非限制性实施方式。

具体实施方式

现在将详细参照实施方式,其示例在附图中示出。在以下详细描述中,为了提供对所描述的各种实施方式的透彻理解,阐述了许多具体细节。然而,可以在没有这些具体细节的情况下实践所描述的实施方式。在其他实例中,没有详细描述公知的方法、过程、部件、电路和网络,以便不会不必要地模糊实施方式的各方面。

本公开内容的实施方式涉及提供空间增强和b链处理的音频处理系统。空间增强可以包括将子带空间处理和串扰消除应用于输入音频信号。b链处理在非理想配置的立体声扩音器呈现系统上还原跨耳呈现的音频的感知空间音场(soundstage)。

诸如可以在电影院中或者通过个人耳机所使用的数字音频系统可以被认为是两部分——a链和b链。例如,在电影环境中,a链包括胶片印刷上的声音记录,其通常可以杜比模拟获得,并且还包括在数字格式例如杜比数字、dts和sdds中的选择。而且,从胶片印刷检索音频并对其进行处理使得准备好进行放大的设备是a链的一部分。

为了校正并且/或者最小化次优配置的呈现系统安装、室内声学或收听者位置的影响,b链包括硬件和软件系统以将多声道音量控制、均衡、时间对准和放大应用于扩音器。b链处理可以被分析地或参数地配置成优化收听体验的感知质量,其通常意图是使收听者更接近“理想”体验。

示例音频系统

图2是根据一些实施方式的音频处理系统200的示意性框图。音频处理系统200对包括左输入声道xl和右输入声道xr的输入音频信号x应用子带空间处理、串扰消除处理和b链处理以生成包括左输出声道ol和右输出声道or的输出音频信号o。输出音频信号o在非理想配置的立体声扩音器呈现系统上还原跨耳呈现的输入音频信号x的感知空间音场。

音频处理系统200包括耦接至b链处理器240的空间增强处理器205。空间增强处理器205包括子带空间处理器210、串扰补偿处理器220以及耦接至子带空间处理器210和串扰补偿处理器220的串扰消除处理器230。

子带空间处理器210通过对左输入声道xl和右输入声道xr的中间子带分量和侧子带分量进行增益调整来生成空间增强音频信号。串扰补偿处理器220执行串扰补偿以补偿由串扰消除处理器230应用的串扰消除中的频谱缺陷或伪象。串扰消除处理器230对子带空间处理器210和串扰补偿处理器220的组合输出执行串扰消除以生成左增强声道al和右增强声道ar。下面结合图3到图6讨论关于空间增强处理器210的另外的细节。

b链处理器240包括耦接至延迟和增益处理器260的扬声器匹配处理器250。除了其他事项外,b链处理器240可以针对扩音器110l和110r与收听者头部之间的总时间延迟差异、扩音器110l和110r与收听者头部之间的信号水平(感知和客观的)差异以及扩音器110l和110r与收听者头部之间的频率响应差异进行调整。

扬声器匹配处理器250接收左增强声道al和右增强声道ar,并且针对不提供匹配扬声器对的装置例如移动装置扬声器对或其他类型的左右扬声器对来执行扩音器平衡。在一些实施方式中,扬声器匹配处理器250将均衡和增益或衰减应用于左增强声道al和右增强声道ar中的每一个,以从理想收听最佳听音位置的有利点提供频谱上和感知上平衡的立体声像。给定在呈现/收听系统中的实际物理不对称性(例如,偏移中心的头部位置和/或非等效的扩音器至头部的距离),延迟和增益处理器260接收扬声器匹配处理器250的输出,并且将延迟和增益或衰减应用于声道al和ar中的每一个以进行时间对准并且进一步在感知上平衡来自特定收听者头部位置的空间图像。可以以不同的顺序执行由扬声器匹配处理器250和延迟和增益处理器260应用的处理。关于b链处理器240的另外的细节将在下面结合图7讨论。

示例空间增强处理器

图3是根据一些实施方式的空间增强处理器205的示意性框图。空间增强处理器205对输入音频信号进行空间增强,并对空间增强的音频信号执行串扰消除。为此,空间增强处理器205接收包括左输入声道xl和右输入声道xr的输入音频信号x。在一些实施方式中,输入音频信号x是从数字比特流(例如,pcm数据)中的源部件提供的。源部件可以是计算机、数字音频播放器、光盘播放器(例如,dvd、cd、蓝光)、数字音频流转化器或数字音频信号的其他源。空间增强处理器205通过处理输入声道xl和xr生成包括两个输出声道al和ar的输出音频信号a。输出音频信号a是具有串扰补偿和串扰消除的输入音频信号x的空间增强音频信号。尽管图3中未示出,空间增强处理器205还可以包括放大器,该放大器放大来自串扰消除处理器230的输出音频信号a,并且将信号a提供至输出装置,例如扩音器110l和110r,其将输出声道al和ar转换为声音。

空间增强处理器205包括子带空间处理器210、串扰补偿处理器220、组合器222以及串扰消除处理器230。空间增强处理器205执行输入音频输入声道xl、xr的串扰补偿和子带空间处理,将子带空间处理的结果与串扰补偿的结果组合,并且然后对组合的信号执行串扰消除。

子带空间处理器210包括空间频带划分器310、空间频带处理器320和空间频带组合器330。空间频带划分器310耦接至输入声道xl和xr以及空间频带处理器320。空间频带划分器310接收左输入声道xl和右输入声道xr,并且将输入声道处理成空间(或“侧”)分量ys和非空间(或“中间”)分量ym。例如,可以基于左输入声道xl与右输入声道xr之差来生成空间分量ys。可以基于左输入声道xl和右输入声道xr之和来生成非空间分量ym。空间频带划分器310将空间分量ys和非空间分量ym提供至空间频带处理器320。

空间频带处理器320耦接至空间频带划分器310和空间频带组合器330。空间频带处理器320从空间频带划分器310接收空间分量ys和非空间分量ym,并且对所接收到的信号进行增强。具体地,空间频带处理器320根据空间分量ys生成增强的空间分量es,并且根据非空间分量ym生成增强的非空间分量em。

例如,空间频带处理器320向空间分量ys应用子带增益以生成增强的空间分量es,并且向非空间分量ym应用子带增益以生成增强的非空间分量em。在一些实施方式中,空间频带处理器320附加地或可替选地向空间分量ys提供子带延迟以生成增强的空间分量es,并且向非空间分量ym提供子带延迟以生成增强的非空间分量em。子带增益和/或子带延迟可能可以针对空间分量ys和非空间分量ym的不同(例如,n)的子带而不同,或者可以相同(例如,针对两个或更多个子带)。空间频带处理器320针对空间分量ys和非空间分量ym的不同的子带相对于彼此来调整增益和/或延迟,以生成增强的空间分量es和增强的非空间分量em。空间频带处理器320然后将增强的空间分量es和增强的非空间分量em提供至空间频带组合器330。

空间频带组合器330耦接至空间频带处理器320,并且还耦接至组合器222。空间频带组合器330从空间频带处理器320接收增强的空间分量es和增强的非空间分量em,并且将增强的空间分量es和增强的非空间分量em组合成左空间增强声道el和右空间增强声道er。例如,可以基于增强空间分量es和增强非空间分量em之和来生成左空间增强声道el,并且可以基于增强非空间分量em与增强空间分量es之差来生成右空间增强声道er。空间频带组合器330将左空间增强声道el和右空间增强声道er提供给组合器222。

串扰补偿处理器220执行串扰补偿以补偿串扰消除中的频谱缺陷或伪象。串扰补偿处理器220接收输入声道xl和xr,并执行处理以补偿由串扰消除处理器230执行的增强的非空间分量em和增强的空间分量es的后续串扰消除中的任何伪象。在一些实施方式中,串扰补偿处理器220可以通过应用滤波器来对非空间分量xm和空间分量xs执行增强以生成串扰补偿信号z,该串扰补偿信号z包括左串扰补偿声道zl和右串扰补偿声道zr。在其他实施方式中,串扰补偿处理器220可以仅对非空间分量xm执行增强。

组合器222将左空间增强声道el与左串扰补偿声道zl组合以生成左增强补偿声道tl,并且将右空间增强声道er和右串扰补偿声道zr组合以生成右补偿声道tr。组合器222耦接至串扰消除处理器230,并向串扰消除处理器230提供左增强补偿声道tl和右增强补偿声道tr。

串扰消除处理器230接收左增强补偿声道tl和右增强补偿声道tr,并对声道tl、tr执行串扰消除以生成包括左输出声道al和右输出声道ar的输出音频信号a。

关于子带空间处理器210的另外的细节将在下面结合图4进行讨论,关于串扰补偿处理器220的另外的细节将在下面结合图5进行讨论,关于串扰消除处理器230的另外的细节将在下面结合图6进行讨论。

图4是根据一些实施方式的子带空间处理器210的示意性框图。子带空间处理器210包括空间频带划分器310、空间频带处理器320和空间频带组合器330。空间频带划分器310耦接至空间频带处理器320,并且空间频带处理器320耦接至空间频带组合器330。

空间频带划分器310包括l/r至m/s转换器402,l/r至m/s转换器402接收左输入声道xl和右输入声道xr,并将这些输入转换为空间分量xm和非空间分量xs。可以通过将左输入声道xl和右输入声道xr相减来生成空间分量xs。可以通过将左输入声道xl和右输入声道xr相加来生成非空间分量xm。

空间频带处理器320接收非空间分量xm,并应用一组子带滤波器以生成增强的非空间子带分量em。空间频带处理器320还接收空间子带分量xs,并且应用一组子带滤波器以生成增强的非空间子带分量em。子带滤波器可以包括峰值滤波器、陷波滤波器、低通滤波器、高通滤波器、低架滤波器、高架滤波器、带通滤波器、带阻滤波器和/或全通滤波器的各种组合。

在一些实施方式中,空间频带处理器320包括用于非空间分量xm的n个频率子带中的每一个的子带滤波器以及用于空间分量xs的n个频率子带中的每一个的子带滤波器。例如,针对n=4个子带,空间频带处理器320包括用于非空间分量xm的一系列子带滤波器,所述一系列子带滤波器包括用于子带(1)的中间均衡(eq)滤波器404(1)、用于子带(2)的中间eq滤波器404(2)、用于子带(3)的中间eq滤波器404(3)以及用于子带(4)的中间eq滤波器404(4)。每个中间eq滤波器404将滤波器应用于非空间分量xm的频率子带部分以生成增强的非空间分量em。

空间频带处理器320还包括用于空间分量xs的频率子带的一系列子带滤波器,所述一系列子带滤波器包括用于子带(1)的侧均衡(eq)滤波器406(1)、用于子带(2)的侧eq滤波器406(2)、用于子带(3)的侧eq滤波器406(3)以及用于子带(4)的侧eq滤波器406(4)。每个侧eq滤波器406将滤波器应用于空间分量xs的频率子带部分以生成增强的空间分量es。

非空间分量xm和空间分量xs的n个频率子带中的每一个可以对应于频率范围。例如,频率子带(1)可以对应于0hz至300hz,频率子带(2)可以对应于300hz至510hz,频率子带(3)可以对应于510hz至2700hz,以及频率子带(4)可以对应于2700hz至奈奎斯特频率。在一些实施方式中,n个频率子带是临界频带的合并集合。可以使用来自各种音乐类型的音频样本的语料库来确定临界频带。根据样本确定24个bark(巴克)尺度临界频带上的中间分量与侧分量的长期平均能量比率。然后将具有类似的长期平均比率的连续频带分组在一起以形成临界频带集合。频率子带的范围以及频率子带的数量可以是可调整的。在一些实施方式中,n个频带中的每一个可以包括临界频带集合。

在一些实施方式中,中间eq滤波器404或侧eq滤波器406可以包括双二阶滤波器,双二阶滤波器具有由等式1定义的传递函数:

其中,z是复变量,而a0、a1、a2、b0、b1和b2是数字滤波器系数。该滤波器可以使用如等式2所定义的直接i型拓扑来实现:

其中,x是输入向量,y是输出。对某些处理器而言,其他拓扑可能有益,这取决于它们的最大字长和饱和行为。

然后,双二阶滤波器可以用于实现具有实值输入和输出的任何二阶滤波器。为了设计离散时间滤波器,设计连续时间滤波器并且经由双线性变换将其变换为离散时间滤波器。此外,可以使用频率规整(warping)来实现对中心频率和带宽中的任何引起的偏移的补偿。

例如,峰化(peaking)滤波器可以包括由等式3定义的s平面传递函数:

其中s是复变量,a是峰的幅度,q是滤波器的“质量”(被典型推导为:)。数字滤波器系数是:

b0=1+αa

b1=-2*cos(ω0)

b2=1-αa

a1=-2cos(ω0)

其中ω0是以弧度为单位的滤波器的中心频率,以及

空间频带组合器330接收中间分量和侧分量,将增益应用于分量中的每一个,并将中间分量和侧分量转换成左声道和右声道。例如,空间频带组合器330接收增强的非空间分量em和增强的空间分量es,并且在将增强的非空间分量em和增强的空间分量es转换成左空间增强声道el和右空间增强声道er之前执行全局中间增益和侧增益。

更具体地,空间频带组合器330包括全局中间增益408、全局侧增益410以及耦接至全局中间增益408和全局侧增益410的m/s至l/r转换器412。全局中间增益408接收增强的非空间分量em并且应用增益,全局侧增益410接收增强的非空间分量es并且应用增益。m/s至l/r转换器412从全局中间增益408接收增强的非空间分量em,并且从全局侧增益410接收增强的空间分量es,并且将这些输入转换成左空间增强声道el和右空间增强声道er。

图5是根据一些实施方式的串扰补偿处理器220的示意框图。串扰补偿处理器220接收左输入声道和右输入声道,并通过对输入声道应用串扰补偿来生成左输出声道和右输出声道。串扰补偿处理器220包括l/r至m/s转换器502、中间分量处理器520、侧分量处理器530和m/s至l/r转换器514。

当串扰补偿处理器220是音频系统202、400、500或504的一部分时,串扰补偿处理器220接收输入声道xl和xr,并且执行预处理以生成左串扰补偿声道zl和右串扰补偿声道zr。声道zl、zr可以用于补偿串扰处理中的任何伪象(artifact),例如串扰消除或模拟。l/r至m/s转换器502接收左输入音频声道xl和右输入音频声道xr,并且生成输入声道xl、xr的非空间分量xm和空间分量xs。通常,左声道和右声道可以被相加以生成左声道和右声道的非空间分量,并且被相减以生成左声道和右声道的空间分量。

中间分量处理器520包括多个滤波器540,例如m个中间滤波器540(a)、540(b)至540(m)。这里,m个中间滤波器540中的每一个处理非空间分量xm和空间分量xs的m个频带中的一个。中间分量处理器520通过处理非空间分量xm来生成中间串扰补偿声道zm。在一些实施方式中,使用通过模拟的关于串扰处理的非空间xm的频率响应图来配置中间滤波器540。另外,通过分析频率响应图,可以估计任何频谱缺陷,例如在频率响应图中超过预定阈值(例如,10db)的作为串扰处理的伪象出现的峰或谷。这些伪象主要由串扰处理中的延迟且反转的对侧信号与它们对应的同侧信号的求和产生,从而有效地将梳状滤波器类似的频率响应引入最终呈现结果。中间串扰补偿声道zm可以由中间分量处理器520生成以补偿估计的峰或谷,其中m个频带中的每一个与峰或谷相对应。具体地,基于串扰处理中应用的特定延迟、滤波频率和增益,峰和谷在频率响应中上下偏移,从而引起频谱的特定区域中的能量的可变放大和/或衰减。每个中间滤波器540可以被配置成针对一个或更多个峰和谷进行调整。

侧分量处理器530包括多个滤波器550,例如m个侧滤波器550(a)、550(b)至550(m)。侧分量处理器530通过处理空间分量xs来生成侧串扰补偿声道zs。在一些实施方式中,关于串扰处理的空间xs的频率响应图可以通过模拟获得。通过分析频率响应图,可以估计任何频谱缺陷,例如在频率响应图中超过预定阈值(例如,10db)的作为串扰处理的伪象出现的峰或谷。侧串扰补偿声道zs可以由侧分量处理器530生成以补偿估计的峰或谷。具体地,基于串扰处理中应用的特定延迟、滤波频率和增益,峰和谷在频率响应中上下偏移,从而引起频谱的特定区域中的能量的可变放大和/或衰减。每个侧滤波器550可以被配置成针对峰和谷中的一个或更多个进行调整。在一些实施方式中,中间分量处理器520和侧分量处理器530可以包括不同数量的滤波器。

在一些实施方式中,中间滤波器540或侧滤波器550可以包括具有由等式1定义的传递函数的双二阶滤波器:

其中z是复变量,以及a0、a1、a2、b0、b1和b2是数字滤波器系数。实现这种滤波器的一种方式是通过等式5定义的直接i型拓扑:

其中x是输入向量,y是输出。取决于它们的最大字长和饱和行为,可以使用其他拓扑。

然后,双二阶滤波器可以用于实现具有实值输入和输出的二阶滤波器。为了设计离散时间滤波器,设计连续时间滤波器,然后经由双线性变换将其变换为离散时间滤波器。此外,可以使用频率规整来补偿中心频率和带宽中的引起的偏移。

例如,峰化滤波器可以具有由等式6定义的s平面传递函数:

其中s是复变量,a是峰的幅度,q是滤波器“质量”,并且数字滤波器系数由下式定义:

b0=1+αa

b1=-2*cos(ω0)

b2=1-αa

a1=-2cos(ω0)

其中ω0是以弧度为单位的滤波器的中心频率,以及

此外,滤波器的质量q可以由等式7定义:

其中δf是带宽以及fc是中心频率。

m/s至l/r转换器514接收中间串扰补偿声道zm和侧串扰补偿声道zs,并且生成左串扰补偿声道zl和右串扰补偿声道zr。通常,可以将中间声道和侧声道相加以生成中间分量和侧分量的左声道,并且可以将中间声道和侧声道相减以生成中间分量和侧分量的右声道。

图6是根据一些实施方式的串扰消除处理器230的示意性框图。串扰消除处理器230从组合器222接收左增强补偿声道tl和右增强补偿声道tr,并对声道tl、tr执行串扰消除以生成左输出声道al和右输出声道ar。

串扰消除处理器260包括带内-带外划分器610、反转器620和622、对侧估计器630和640、组合器650和652以及带内-带外组合器660。这些部件一起操作以将输入声道tl、tr划分成带内分量和带外分量,并且对带内分量执行串扰消除以生成输出声道al、ar。

通过将输入音频信号t划分成不同的频带分量并且通过对选择性分量(例如,带内分量)执行串扰消除,可以针对特定频带执行串扰消除,同时避免其他频带中的劣化。如果在不将输入音频信号t划分成不同频带的情况下执行串扰消除,则在这样的串扰消除之后的音频信号可能在低频(例如,低于350hz)、较高频率(例如,高于12000hz)或者在低频和较高频率中在非空间分量和空间分量上表现出明显的衰减或放大。通过选择性地对绝大多数有效的空间线索(cue)所在的带内(例如,在250hz与14000hz之间)执行串扰消除,可以保持在混音的整个频谱上平衡的总能量,特别是非空间分量中平衡的总能量。

带内-带外划分器610将输入声道tl、tr分别分成带内声道tl,in、tr,in和带外声道tl,out、tr,out。特别地,带内-带外划分器610将左增强补偿声道tl划分为左带内声道tl,in和左带外声道tl,out。类似地,带内-带外划分器610将右增强补偿声道tr分成右带内声道tr,in和右带外声道tr,out。每个带内声道可以包含与包括例如250hz到14khz的频率范围对应的相应输入声道的一部分。频带范围可以例如根据扬声器参数来调整。

反转器620和对侧估计器630一起操作以生成左对侧消除分量sl,以补偿由于左带内声道tl,in而引起的对侧声音分量。类似地,反转器622和对侧估计器640一起操作以生成右对侧消除分量sr,以补偿由于右带内声道tr,in而引起的对侧声音分量。

在一种方法中,反转器620接收带内声道tl,in,并将所接收的带内声道tl,in的极性反转以生成反转的带内声道tl,in’。对侧估计器630接收反转的带内声道tl,in’,并通过滤波提取反转的带内声道tl,in’的对应于对侧声音分量的一部分。因为对反转的带内声道tl,in’执行滤波,所以由对侧估计器630提取的部分变为带内声道tl,in的归于对侧声音分量的一部分的反转。因此,由对侧估计器630提取的部分变为左对侧消除分量sl,其可以被添加至对应的带内声道tr,in以减少由于带内声道tl,in而引起的对侧声音分量。在一些实施方式中,反转器620和对侧估计器630以不同的顺序实现。

反转器622和对侧估计器640针对带内声道tr,in执行类似的操作以生成右对侧消除分量sr。因此,为了简洁起见,本文省略对其的详细描述。

在一个示例实现方式中,对侧估计器630包括滤波器632、放大器634和延迟单元636。滤波器632接收反转的输入声道tl,in’,并通过滤波函数提取反转的带内声道tl,in’的对应于对侧声音分量的一部分。示例滤波器实现是具有选自5000hz与10000hz之间的中心频率和选自0.5与1.0之间的q的陷波滤波器或高架滤波器。以分贝为单位的增益(gdb)可以根据等式8得出:

gdb=-3.0-log1.333(d)等式(8)

其中,d是延迟单元636在(例如采样速率为48khz的)样本中的延迟量。

替选实现是具有选自5000hz与10000hz之间的转角频率和选自0.5与1.0之间的q的低通滤波器。此外,放大器634通过相应的增益系数gl,in放大提取的部分,并且延迟单元636根据延迟函数d对来自放大器634的放大的输出进行延迟以生成左对侧消除分量sl。对侧估计器640包括滤波器642、放大器644和延迟单元646,其对反转的带内声道tr,in’执行类似的操作以生成右对侧消除分量sr。在一个示例中,对侧估计器630、640根据以下等式生成左对侧消除分量sl、sr:

sl=d[gl,in*f[tl,in’]]等式(9)

sr=d[gr,in*f[tr,in’]]等式(10)

其中f[]是滤波函数,d[]是延迟函数。

串扰消除的配置可以由扬声器参数确定。在一个示例中,可以根据两个扬声器280之间相对于收听者形成的角度来确定滤波器中心频率、延迟量、放大器增益和滤波器增益。在一些实施方式中,扬声器角度之间的值用于插入其他值。

组合器650将右对侧消除分量sr与左带内声道tl,in组合以生成左带内补偿声道ul,并且组合器652将左对侧消除分量sl与右带内声道tr,in组合以生成右带内补偿声道ur。带内-带外组合器660将左带内补偿声道ul与带外声道tl,out组合以生成左输出声道al,并且将右带内补偿声道ur与带外声道tr,out组合以生成右输出声道ar。

因此,左输出声道al包括与带内声道tr,in的归于对侧声音的一部分的反转对应的右对侧消除分量sr,并且右输出声道ar包括与带内声道tl,in的归于对侧声音的一部分的反转对应的左对侧消除分量sl。在该配置中,由扩音器280r根据到达右耳的右输出声道ar输出的同侧声音分量的波前可以消除由扩音器280l根据左输出声道al输出的对侧声音分量的波前。类似地,由扬声器280l根据到达左耳的左输出声道al输出的同侧声音分量的波前可以消除由扩音器280r根据右输出声道ar输出的对侧声音分量的波前。因此,可以减少对侧声音分量以增强空间可检测性。

示例b链处理器

图7是根据一些实施方式的b链处理器240的示意性框图。b链处理器240包括扬声器匹配处理器250与延迟和增益处理器260。扬声器匹配处理器250包括耦接至左放大器704和右放大器706的n频带均衡器(eq)702。延迟和增益处理器260包括耦接至左放大器712的左延迟708和耦接至右放大器714的右延迟710。

假设如图1a至图1e所示收听者140的方位朝向理想空间图像的中心(例如,在给定对称、匹配和等距扩音器的情况下音场的虚拟横向中心)保持固定,则理想和真实呈现的空间图像之间的变换关系可以基于以下来描述:(a)一个扬声器与收听者140之间的总时间延迟不同于另一个扬声器与收听者140之间的总时间延迟,(b)一个扬声器与收听者140之间的(感知和客观的)信号水平不同于另一个扬声器与收听者140之间的信号水平,以及(c)一个扬声器与收听者140之间的频率响应不同于另一个扬声器与收听者140之间的频率响应。

b链处理器240校正延迟、信号水平和频率响应中的上述相对差异,从而产生恢复的接近理想的空间图像,就像收听者140(例如,头部位置)和/或呈现系统被理想地配置一样。

b链处理器240从空间增强处理器205接收包括左增强声道al和右增强声道ar的音频信号a作为输入。b链处理器240的输入可以包括针对处于理想状态的给定收听者/扬声器配置(如图1a所示)的任何跨耳处理的立体声音频流。如果音频信号a没有空间不对称性,并且如果系统中不存在其他不规则性,则空间增强处理器205为收听者140提供显著增强的音场。然而,如果在系统中确实存在不对称(如上所述并且在图1b至图1e中示出的),b链处理器240可以被应用以在非理想状况下保持增强的音场。

尽管理想的收听者/扬声器配置包括具有匹配的左和右扩音器至头部距离的成对扩音器,但是许多现实世界的设置不满足这些标准,从而导致折衷的立体声收听体验。移动装置可以例如包括具有有限带宽(例如,1000hz至8000hz频率响应)的面向前方的耳机扩音器,以及正交(向下或侧向)面向的微型扩音器(例如,200hz至20000hz频率响应)。这里,扬声器系统以双重方式不匹配,其中音频驱动器性能特征(例如,信号水平、频率响应等)不同,并且由于扬声器的非平行方位导致的相对于“理想的”收听者位置的时间对准不匹配。另一个示例是使用立体声桌面扩音器系统的收听者没有将扩音器或他们自己布置在理想的配置中(例如,如图1b、图1c或图1e所示)。b链处理器240因此提供了每个声道的特性的调谐,解决了相关联的系统特定的不对称性,从而导致在感知上更具吸引力的跨耳音场。

在空间增强处理或一些其他处理已经被应用于在理想配置的系统(即,处于最佳听音位置(sweetspot)的收听者,匹配、对称放置的扩音器等)的假设下进行调谐的立体声输入信号x之后,扬声器匹配处理器250为(如绝大多数移动装置中的情况那样)未提供匹配扬声器对的装置提供实际的扩音器平衡。扬声器匹配处理器250的n频带eq702接收左增强声道al和右增强声道ar,并对声道al和ar中的每一个应用均衡。

在一些实施方式中,n频带eq702提供各种eq滤波器类型,例如低架和高架滤波器、带通滤波器、带阻滤波器和峰值陷波滤波器,或者低通和高通滤波器。例如,如果立体声对中的一个扩音器成角度地离开理想收听者最佳听音位置,则该扩音器将表现出相对于收听者最佳听音位置的明显高频衰减。n频带eq702的一个或更多个频带可以应用于该扩音器声道,以便(例如,经由高架滤波器)恢复从最佳听音位置观察时的高频能量,从而实现与另一前向扩音器的特性的近似匹配。在另一场景中,如果两个扩音器都是面向前的,但是它们中的一个具有非常不同的频率响应,则eq调谐可以被应用于左声道和右声道两者以达到两者之间的频谱平衡。应用这样的调谐可以等效于“旋转”感兴趣的扩音器以与另一面向前的扩音器的方位匹配。在一些实施方式中,n频带eq702包括用于独立处理的n个频带中的每一个的滤波器。频带的数量可以变化。在一些实施方式中,频带的数量与子带空间处理的子带相对应。

在一些实施方式中,可以针对特定扬声器集合来预定义扬声器不对称性,其中已知不对称性被用作用于选择n频带eq702的参数的基础。在另一示例中,可以基于测试扬声器——例如通过使用测试音频信号、记录由扬声器根据所述信号生成的声音、以及分析所记录的声音——来确定扬声器不对称性。

左放大器704耦接至n频带eq702以接收左声道,并且右放大器706耦接至n频带eq702以接收右声道。放大器704和706通过调整一个或两个声道上的输出增益解决扩音器响度和动态范围能力的不对称性。这对于平衡扩音器距收听位置的距离中的任何响度偏移以及对于平衡具有极大不同的声压级(spl)输出特性的不匹配的扩音器对尤其有用。

延迟和增益处理器260接收扬声器匹配处理器250的左输出声道和右输出声道,并且将时间延迟和增益或衰减应用于声道中的一个或更多个声道。为此,延迟和增益处理器260包括接收从扬声器匹配处理器250输出的左声道并应用时间延迟的左延迟708,以及向左声道应用增益或衰减以生成左输出声道ol的左放大器712。延迟和增益处理器260还包括:右延迟710,右延迟710接收从扬声器匹配处理器250输出的右声道并应用时间延迟;以及右放大器714,该右放大器714向右声道应用增益或衰减以生成右输出声道or。如上所述,扬声器匹配处理器250从理想收听者“最佳听音位置”的视角在感知上平衡左/右空间图像,着重于从该位置为每个驱动器提供平衡的spl和频率响应,并且忽略实际配置中存在的基于时间的不对称性。在实现了该扬声器匹配之后,给定在呈现/收听系统中的实际物理不对称性(例如,偏离中心的头部位置和/或不等效的扬声器到头部的距离),延迟和增益处理器260根据特定收听者头部位置对空间图像进行时间对准,以及进一步在感知上平衡。

可以设置由延迟和增益处理器260应用的延迟和增益值,以解决静态系统配置,例如使用正交定向的扩音器的移动电话,或者横向偏移扬声器例如家庭影院音箱前面的理想的收听最佳听音位置的收听者。

也可以基于改变收听者的头部和扩音器之间的空间关系而动态调整由延迟和增益处理器260应用的延迟和增益值,如在采用物理移动作为游戏玩法的组成部分的游戏场景中可能发生的(例如,诸如针对游戏或人工现实系统使用深度相机的位置跟踪)。在一些实施方式中,音频处理系统包括摄像机、光传感器、接近传感器或用于确定收听者的头部相对于扬声器的位置的一些其他合适的装置。所确定的用户头部的位置可以被使用以确定延迟和增益处理器260的延迟和增益值。

音频分析例程可以提供用于配置b链处理器240的适当的扬声器间延迟和增益,从而产生时间对准的并且在感知上平衡的左/右立体图像。在一些实施方式中,在缺乏来自这样的分析方法的可测量数据的情况下,可以使用如由下面的等式11和等式12定义的映射来实现直观的手动用户控制或者经由计算机视觉或其他传感器输入的自动控制:

其中,延迟增量(delaydelta)和延迟以毫秒为单位,增益以分贝为单位。延迟(delay)和增益(gain)列向量假定它们的第一个分量属于左声道,而第二个分量属于右声道。因此,delaydelta≥0指示左扬声器延迟大于或等于右扬声器延迟,并且delaydelta<0指示左扬声器小于右扬声器延迟。

在一些实施方式中,代替对声道应用衰减,可以对相对的声道应用等量的增益,或者组合地对一个声道应用增益而对另一声道应用衰减。例如,可以将增益应用于左声道而不是对左声道应用衰减。对于如在移动、台式pc和控制台游戏以及家庭影院场景中发生的近场收听,收听者位置与每个扩音器之间的距离增量足够小,并且因此收听者位置与每个扩音器之间的spl增量足够小,使得与理想的收听者/扬声器配置相比,以上映射中的任何一个将用于成功地恢复跨耳空间图像,同时保持整体可接受的大音场。

示例音频系统处理

图8是根据一些实施方式的用于处理输入音频信号的方法800的流程图。方法800可以具有更少或附加的步骤,并且可以以不同的顺序执行步骤。

音频处理系统200(例如空间增强处理器205)增强802输入音频信号以生成增强的信号。增强可以包括空间增强。例如,空间增强处理器205将子带空间处理、串扰补偿处理和串扰消除处理应用于包括左输入声道xl和右输入声道xr的输入音频信号x以生成包括左增强声道al和右增强声道ar的增强信号a。这里,音频处理系统200通过对输入音频信号x的中间(非空间)子带分量和侧(空间)子带分量进行增益调整来应用空间增强,并且增强信号a被称为“空间增强信号”。音频处理系统200可以执行其他类型的增强以生成增强信号a。

音频处理系统200(例如,b链处理器240的扬声器匹配处理器250的n频带eq702)将n频带均衡应用于804增强信号a以针对左扬声器与右扬声器之间在频率响应上的不对称性进行调整。n频带eq702可以将一个或更多个滤波器应用于左增强声道al、右增强声道ar、或者左声道al和右声道ar两者。应用于左增强声道al和/或右增强声道ar的一个或更多个滤波器平衡左扬声器和右扬声器的频率响应。在一些实施方式中,平衡频率响应可以被使用以针对左扬声器或右扬声器调整相对于理想角度的旋转偏移。在一些实施方式中,n频带eq702左扬声器与右扬声器之间的不对称性,并且基于所确定的不对称性来确定用于应用n频带eq的滤波器的参数。

音频处理系统200(例如,左放大器704和/或右放大器706)将增益应用于806左增强声道al和右增强声道ar中的至少一个以针对左扬声器和右扬声器之间在信号水平上的不对称性进行调整。所应用的增益可以是正增益或负增益(也称为衰减)以解决扬声器响度和动态范围能力的不对称性,或者解决具有不同的声压级(spl)输出特性的不匹配的扩音器对中的不对称性。

音频处理系统200(例如,b链处理器240的延迟和增益处理器260)将延迟和增益应用于808增强信号a以针对收听位置进行调整。收听位置可以包括用户相对于左扬声器和右扬声器的位置。用户是指扬声器的收听者。给定呈现/收听系统中的实际物理不对称性(例如,偏离中心的头部位置和/或不等效的扩音器至头部的距离),延迟和增益针对收听者的位置对从扬声器匹配处理器250输出的空间图像进行时间对准以及进一步在感知上平衡。例如,左延迟708可以应用延迟并且左放大器712可以将增益应用于左增强声道al。右延迟710可以应用延迟并且右放大器714可以将增益应用于右增强声道ar。在一些实施方式中,延迟可以被应用于左增强声道al或右增强声道ar之一,并且增益可以被应用于左增强声道al或右增强声道ar之一。

音频处理系统200(例如,b链处理器240的延迟和增益处理器260)根据收听位置的变化来调整810延迟和增益中的至少一个。例如,用户相对于左扬声器和右扬声器的空间位置可以改变。音频处理系统200随时间监视收听者的位置,基于收听者的位置确定应用于增强信号o的增益和延迟,并且根据收听者的位置随时间的改变来调整应用于增强信号o的延迟和增益以生成左输出声道ol和右输出声道or。

可以以不同的顺序执行对各种不对称性的调整。例如,可以在针对收听位置相对于扬声器位置或方位的非对称性的调整之前、之后或与其结合地执行针对扬声器特性(例如,频率响应)的非对称性的调整。音频处理系统可以针对收听位置确定频率响应、时间对准以及信号水平中的左扬声器与右扬声器之间的不对称性;并且通过以下操作来生成针对左扬声器的左输出声道和针对右扬声器的右输出声道:将n频带均衡应用于空间增强信号以针对左扬声器与右扬声器之间在频率响应上的不对称性进行调整,将延迟应用于空间增强信号以针对时间对准中的不对称性进行调整,以及将增益应用于空间增强信号以针对信号水平中的不对称性进行调整。

在一些实施方式中,不是应用多个增益或延迟来针对不对称性的不同来源(例如,扬声器特性或收听位置)进行调整,而是使用单个增益和单个延迟来针对引起扬声器之间的增益或时间延迟差异的多种类型的不对称性进行调整并且从收听位置的有利点进行调整。然而,将扬声器不对称性和收听位置不对称性的处理分开以减少处理需要可能是有利的。例如,一旦扬声器频率响应已知,相同的滤波器值可以被用于扬声器调整,同时针对收听位置的改变(例如,当用户移动时)进行不同的时间延迟和信号水平调整。

图9示出了根据一些实施方式的非理想头部位置和不匹配的扩音器。收听者140与左扬声器910l和右扬声器910r相距不同的距离。此外,扬声器910l和910r的频率特性和/或振幅特性不相等。图10a示出了左扬声器910l的频率响应,图10b示出了右扬声器910r的频率响应。

为了校正如图9、图10a和图10b所示的扬声器910l和910r的扬声器不对称性以及收听者140相对于扬声器910l和910r中的每一个的位置,b链处理器240的部件可以使用以下配置。n频带eq702可以针对左增强声道al应用具有截止频率4500hz、q值0.7以及斜率-6db的高架滤波器,并且可以针对右增强声道ar应用具有截止频率6000hz、q值0.5以及斜率+3db的高架滤波器。左延迟708可以应用0ms延迟,右延迟710可以应用0.27ms延迟,左放大器712可以应用0db增益,并且右放大器714可以应用-0.40625db增益。

示例计算系统

注意,这里描述的系统和过程可以在嵌入式电子电路或电子系统中实施。所述系统和过程还可以在计算系统中实施,该计算系统包括一个或更多个处理系统(例如,数字信号处理器)以及存储器(例如,可编程只读存储器或可编程固态存储器),或一些其他电路,诸如专用集成电路(asic)或现场可编程门阵列(fpga)电路。

图11示出了根据一个实施方式的计算机系统1100的示例。音频系统200可以在系统1100上实现。示出了耦接至芯片组1104的至少一个处理器1102。芯片组1104包括存储器控制器集线器1120和输入/输出(i/o)控制器集线器1122。存储器1106和图形适配器1112耦接至存储器控制器集线器1120,并且显示装置1118耦接至图形适配器1112。存储装置1108、键盘1110、指向装置1114和网络适配器1116耦接至i/o控制器集线器1122。计算机1100的其他实施方式具有不同的架构。例如,在一些实施方式中,存储器1106直接耦接至处理器1102。

存储装置1108包括一个或更多个非暂态计算机可读存储介质,诸如硬盘驱动器、光盘只读存储器(cd-rom)、dvd或固态存储器装置。存储器1106保持由处理器1102使用的指令和数据。例如,存储器1106可以存储指令,这些指令在由处理器1102执行时使得处理器1102执行或者将处理器1102配置成执行本文所讨论的功能,例如方法800。指向装置1114与键盘1110结合使用,以将数据输入到计算机系统1100中。图形适配器1112在显示装置1118上显示图像和其他信息。在一些实施方式中,显示装置1118包括用于接收用户输入和选择的触摸屏能力。网络适配器1116将计算机系统1100耦接至网络。计算机1100的一些实施方式具有与图11所示的部件不同的部件和/或其他部件。例如,计算机系统1100可以是缺乏显示装置、键盘和其他部件的服务器,或者可以使用其他类型的输入装置。

附加考虑

所公开的配置可以包括许多益处和/或优点。例如,输入信号可以被输出至不匹配的扩音器,同时保留或增强音场的空间感。即使当扬声器不匹配时或者当收听者不在相对于扬声器的理想的收听位置时,也可以实现高质量的收听体验。

在阅读本公开内容后,本领域技术人员将理解本文所公开的原理、另外的替选实施方式。因此,尽管已示出并且描述了特定实施方式和应用,然而要理解的是,所公开的实施方式不限于本文所公开的特定结构和部件。在不脱离本文所描述的范围的情况下,可以对本文所公开的方法和装置的布置、操作和细节进行对本领域技术人员而言将明显的各种修改、改变和变型。

可以单独地或与其他装置结合地利用一个或更多个硬件或软件模块来执行或实现本文描述的任何步骤、操作或过程。在一个实施方式中,使用包括含计算机程序代码的计算机可读介质(例如,非暂态计算机可读介质)的计算机程序产品实现软件模块,所述计算机程序代码可以由计算机处理器执行以用于执行所描述的步骤、操作或处理中的任一个或全部。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1