个人多声道音频预补偿控制器设计的制作方法

文档序号:11532998阅读:235来源:国知局
个人多声道音频预补偿控制器设计的制造方法与工艺

提出的技术一般涉及用于为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的方法和系统,对应的计算机程序和用于计算机程序的载体,和用于确定音频预补偿控制器的滤波器系数的装置,对应的音频预补偿控制器,和包括音响系统与在到音响系统的输入路径中的改善的音频预补偿控制器的音频系统,以及数字音频信号。



背景技术:

包括放大器、电缆、扬声器和房间声学的多声道声音再现系统将总是影响再现的声音的频谱、瞬态和空间属性(典型地以不想要的方式)。尽管诸如放大器和扬声器之类的组件的技术质量一般可以被假设为现在是高的,然而由于多个原因,声音再现经受声音质量劣化。将在下面讨论它们中的一些。

首先,放置装备所在的房间的声学混响对系统的感知音频质量具有相当大且经常有害的影响。混响的影响经常被不同地描述,这取决于考虑哪个频率区域。在低频处,经常在共振、驻波或所谓的房间模式方面描述混响,共振、驻波或所谓的房间模式通过在频谱的低端中在不同频率处引入强峰和深零陷(deepnull)来影响再现的声音。在较高频率处,混响一般被认为是在来自扬声器本身的直接声音之后的某个时间到达收听者的耳朵的反射。在高频处的混响一般不可以被假设成对声音质量有有害的影响。然而,混响确实对时间和空间声音再现有影响。

其次,诸如立体声或5.1环绕(例如,家庭影院系统)之类的建立的基于扬声器的多声道声音再现标准一般假设音响系统的对称设置。假设在记录中以某种方式编码的多声道信号经由以定义的角度和与收听者成距离放置的扬声器再现。例如通常在专业录音室中找到这样的对称设置。然而在现实中,在考虑诸如消费者家庭的典型收听环境时,这样的对称设置是不现实的。在这些环境中,诸如家具之类的其它因素确定扬声器和收听者的位置,而不是关于标准中的建议放置它们。这导致损害的声音再现和因此有害的声音质量。

再次,这些多声道标准一般假设一个收听者,其位于某个位置,该位置经常被称为甜点(sweetspot)。这个甜点典型地相当小,并且对应于空间中的有限区域。然而,仅仅在甜点中提供高保真声音再现,该高保真声音再现是具有关于记录的高度精确性和真实性的声音再现。在该有限的区域外部,声音再现严重恶化。这还产生了针对位于给定的甜点外部的一个或多个收听者的受损的声音质量。

最后,通过多个扬声器的声音再现总是具有身份的概念性问题。通过在非真实记录环境中的多个扬声器的记录的声音的精确再现一定被视为不可能的任务。这对于多声道声音再现的空间方面是特别有效的,多声道声音再现将总是对应于记录的声场的近似而不是它的真实(高保真)再现。因此,声音质量还取决于关于呈现的多声道方法的人类期望和经验。尽管在许多情况下声音再现可能不准确,但是其对于收听者仍然可能是似乎真实的,并且因而被感知为正确的空间声音再现。因此,相对于给定的收听情况,一般可以改善声音再现的保真度。



技术实现要素:

一个目的是提供一种为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的改善的方法。

另一个目的是提供一种被配置成为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的系统。

还有一个目的是提供一种计算机程序,用于当由处理器执行时确定音频预补偿控制器的滤波器系数。

又一个目的是提供一种包括计算机程序的载体。

再一个目的是提供一种用于确定音频预补偿控制器的滤波器系数的装置。

还有一个目的是提供一种改善的音频预补偿控制器。

又再一个目的是提供一种音频系统,包括音响系统和在到音响系统的输入路径中的改善的音频预补偿控制器。

进一步的目的是使得能够由改善的音频预补偿控制器生成数字音频信号。

这些和其它目的由提出的技术的实施例来满足。

根据第一方面,提供一种用于为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的方法,相关联的音响系统包括n≥2个扬声器。该方法包括以下步骤:

·在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处为至少一对扬声器中的每一个估计模型传递函数;

·至少基于控制点的区附属,为m个控制点中的每一个确定依赖区的目标传递函数;以及

·至少基于m个控制点的模型传递函数和目标传递函数,确定音频预补偿控制器的滤波器系数。

以这种方式,可以获得用于相关联的音响系统的音频预补偿控制器,该音频预补偿控制器使得能够同时在两个或更多个收听区中改善和/或定制声音再现。

作为示例,通过使用依赖区的目标传递函数,可以取决于收听环境在不同区中进行相似的声音再现,或者至少部分地个性化或定制声音再现。

根据第二方面,提供一种被配置成为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的系统。该音响系统包括n≥2个扬声器。该系统被配置成:基于收听环境的声学属性的模型,在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处为至少一对扬声器中的每一个估计模型传递函数。该系统还被配置成:至少基于控制点的区附属和声学属性的模型,为m个控制点中的每一个确定依赖区的目标传递函数。该系统被进一步配置成:至少基于m个控制点的模型传递函数和目标传递函数,确定音频预补偿控制器的滤波器系数。

根据第三方面,提供一种用于当由处理器执行时为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的计算机程序,相关联的音响系统包括n≥2个扬声器。该计算机程序包括指令,该指令在由处理器执行时使得处理器:

-在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处为至少一对扬声器中的每一个估计模型传递函数;

-至少基于控制点的区附属,为m个控制点中的每一个确定依赖区的目标传递函数;以及

-至少基于m个控制点的模型传递函数和目标传递函数,确定音频预补偿控制器的滤波器系数。

根据第四方面,提供一种包括第三方面的计算机程序的载体。

根据第五方面,提供一种用于为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的装置,相关联的音响系统包括n≥2个扬声器。该装置包括估计模块,用于在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处为至少一对扬声器中的每一个估计模型传递函数。该装置还包括定义模块,用于至少基于控制点的区附属而为m个控制点中的每一个定义依赖区的目标传递函数。该装置进一步包括确定模块,用于至少基于m个控制点的模型传递函数和目标传递函数而确定音频预补偿控制器的滤波器系数。

根据第六方面,提供一种通过使用第一方面的方法确定的音频预补偿控制器。

根据第七方面,提供一种音频系统,包括音响系统和在到音响系统的输入路径中的音频预补偿控制器。

根据第八方面,提供一种由音频预补偿控制器生成的数字音频信号,该音频预补偿控制器通过使用第一方面的方法来确定。

当阅读具体实施方式时,将认识到其它优点。

附图说明

通过参考结合附图理解的以下描述,可最佳地理解实施例连同其进一步的目的和优点,在附图中:

图1是图示包括音响系统和在到音响系统的输入路径中的音频预补偿控制器的音频系统的示例的示意图。

图2是包括两个扬声器和三个收听区的音响系统的示意说明,其中灰色座表示传统的甜点,而黑色座表示必须为其均衡声音再现的不对称收听区。

图3描绘没有任何反射的模拟和对称音响系统(灰色线)的量值响应(顶部图)和扬声器间差分相位(idp)(底部图),连同用于如在先前工作(黑色线)中建议的这样的系统的最优idp。

图4描绘在一个控制点(黑色线)中的测量的房间传递函数与基于传播延迟(灰色线)的对应的梳状滤波器中的idp和量值总和响应。

图5图示用于如由先前工作提出的互补全通滤波器(黑色实线和虚线)连同对应的未补偿idp(灰色实线和虚线)的示例。

图6是图示根据示范性实施例的用于确定音频预补偿控制器的方法的示意流程图。

图7是具有两个扬声器和两个控制点的对称汽车音响系统设置的示意说明,每个收听区中一个。

图8比较期望对于如图7中所示的对称设置是对称的测量的脉冲响应。

图9图示用于在收听区之间不同的目标传递函数的相位响应的两个区示例。

图10通过示例示意性地图示:每个目标传递函数附属于收听区(控制点周围的灰色框),并且目标传递函数的相位响应在区域之间的它们的相位特性不同。

图11描述根据示范性实施例的以框图形式的个人音频控制器设计。

图12描绘在说明性示例中应用的频率加权。

图13图示设计示例。示出用于不同的预补偿方法和未补偿的系统的在两个前座中的每一个中的48个控制点中估计的四声道汽车音响系统的左右两个扬声器之间的平均互相关。

图14是图示根据示范性实施例的用于确定音频预补偿控制器的系统的示例的示意框图。

图15是图示用于为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的装置的示例的示意框图。

图16是适合于该发明的实现方式的基于计算机的系统的示例的示意框图。

图17示意性地图示根据本发明的合并预补偿控制器或滤波器系统的声音生成或再现系统。

具体实施方式

在整个附图中,相同的参考标记用于相似或对应的元件。

为了更好地理解提出的技术,始于参照图1的体现的音响系统和预补偿控制器的示例的简要概述可能是有用的。

图1是图示包括音响系统和在到音响系统的输入路径中的音频预补偿控制器的音频系统的示例的示意图。音频预补偿控制器具有l≥1个输入信号。音响系统包括n≥2个扬声器和z≥2个收听区,该扬声器和收听区由总共m≥2个控制点覆盖。

由图1中所示的音响系统表示的诸如立体声或5.1环绕声(surround)之类的标准化的多声道音频系统被默认地设计用于单独一个收听者和一个区域。仅仅在被称为甜点的单个收听区域或区中有由收听者感知的声音,如由记录生产者所意图的,例如参见[34,ch.8]。在下面我们将可互换地使用术语收听区域、收听位置、收听区和甜点,以描述人类收听者将针对其获得优化的声音体验的区域。

对于单个收听者,甜点可以被放置在不同的位置处(例如通过对扬声器声道使用适当的延迟和增益调节)。传统上,甜点位于与在某个距离和高度处的扬声器等距的位置,例如参见图2中的灰色座,其中甜点位于扬声器之间的距离b的一半处,并且其中从甜点的中心到两个扬声器的距离b1相等。我们将在这里超越单个甜点情况,并且为多声道音频系统调查多个收听位置或区的设计。这些收听区位于传统甜点外部,并且不由标准多声道声音再现考虑,参见图2中的说明性示例(黑色座)。我们将这样的设计称为个人多声道声音再现。词语个人应当被理解用于每个收听者的单独声音体验,即每个收听者获得他/她自己的甜点。

在多声道音频系统中,虚拟声源由多个扬声器同时辐射声音而创建。在传统的立体声设置中,两个扬声器被等距地放置在收听者的前面,与收听者的左右典型地成30°的角度,参见用于示意说明的图2。一般地,虚拟声源的位置由两个声道的强度和到达时间的差确定。当两个扬声器同时在收听者耳朵处再现具有相等强度和相位的信号时,得到的声源位于收听者的前面。当坐在甜点中时,该位置对应于两个扬声器之间的中间的点,并且被称为幻像中心。通过两个声道的强度和相位的变化,虚拟声源的位置可以在两个扬声器之间移动[5][13,ch.3][14,ch.15.4]。相同的推理可以应用于其它多声道声音再现标准,诸如5.1或7.1环绕声。

在甜点外部,在收听者耳朵处的强度和到达时间差与甜点中的那些不同,导致不同地感知的虚拟源。在甜点外部的收听位置,优先效应导致声音图像朝着最近的扬声器移位[5]。然而,生产多声道音频制作,记住一个收听者正坐在甜点中。因此,多声道声音的空间再现在除了甜点外的其它收听位置中严重恶化,并且在几个收听位置中的空间保真度一般不可通过使用标准多声道音频系统来获得。

多个甜点的创建

在下面我们将讨论使用标准多声道音频系统作为用于创建多个甜点的手段的挑战,多个甜点在空间上分离并且受制于空间保真度。文献中已经报道了解决该挑战的许多尝试,并且接下来我们将讨论它们中的许多个。

在汽车音频系统中,仪表板中心扬声器频繁地用于创建空间保真度,尤其是在两个前座中,例如参见[11][17][23]。然而,将扬声器放置在仪表板的中心是相当昂贵的,并且由于空间约束,它有时也是不可行的。如今,所有标准汽车音响系统中的大多数是没有中心扬声器的四声道系统。

诸如扬声器放置或控制反射和扬声器辐射之类的被动解决方案在文献中被提出,例如参见[11][16][33]。然而,这些解决方案被限制在语音和许多仪器的基音所在的重要频率范围之上的较高频率,但是它们可以用作改善多个区中的空间保真度的互补手段。

双耳系统构成另一个提出的解决方案。在[4]中,听觉传输立体声作为在收听者的耳朵处生成希望的声场的手段被讨论。听觉传输立体声是基于串扰消除精确地控制收听者耳朵处的声场的信号处理技术。讨论具有扬声器、输入和收听者(耳朵)的不同组合的几个场景。据争论:一般地,具有听觉传输立体声的虚拟源的再现可能优于标准立体声。为大多数场景导出示例性解决方案。然而,没有讨论具有两个扬声器、两个输入和两个收听者(四个耳朵)的情况。根据[4],系统在这种情况下是超定的,并且不存在精确的解决方案。此外,包括设计中的房间校正受制于巨大的复杂化,并且除了其它之外由于非因果滤波器和不稳定的头相关的传递函数,信号处理技术中的一些带来潜在的问题。

此外,声场合成技术是创建多个甜点的选项。在[25]中,呈现对多个偏离中心的收听者的高保真度立体声响复制系统方法。在[15][28]中描述波场合成(wfs)、基于向量的幅度平移和高保真度立体声响复制的使用。然而,一般地,高保真度立体声响复制解决方案需要围绕收听者以圆形或球形布局定位的几个扬声器。wfs方法还需要涉及的扬声器之间的小间隔,并且因而需要大量的扬声器。因此,到目前为止,这些方法已经有限的用于许多应用。

在[7]中提出了一种相关的方法,其中为多个收听区域提出声场控制。基本想法是使得在例如汽车车厢的不同位置中的收听者感知与如果收听者已经坐在普通收听房间中的情况相似的声场。在[7]中呈现的方法因而是创建虚拟声源的主题。例如,如果将在汽车车厢中呈现立体声或环绕声源材料,则在[7]中呈现的提出的方法是变换声场,使得汽车车厢中的所有收听者将感知相同的声音体验,好像他们正坐在具有立体声或环绕声设置的普通客厅中。虽然该声场变换对于提出的问题是极好的,但是它不考虑其中所有收听者将同时经历所有收听区中的个人立体声或环绕声的情况。当例如在普通汽车车厢中收听未补偿的立体声或环绕声时是这种情况,声场变换仍然受制于优先效应。换句话说,即使在[7]中提出的声场变换给出客厅体验,它也不解决创建几个甜点的问题。本发明中提出的新颖方法解决这个问题。在[20]中建议相关的解决方案。

另一个方法是控制由在两个收听位置中的两个扬声器通过控制作为频率的函数的延迟、瞄准两个分离的区中的理论上最佳的扬声器间差分相位(idp)来生成的声场,例如参见[12][24][27][29][30]或与调节相位响应相关的其它方法[10][19]。基于由两个扬声器到每个区的中心之间的距离给出的相对传播延迟差,可以确定在每个区中得到的idp。两个区中的未补偿的idp在0hz处为零,并且对于增加的频率在±180°之间变化。因此,第一区中的idp与第二区中的idp相反。对于示例,参见图3的底部图中的灰色线。在量值总和响应中,在其中idp为±180°的频率处遇到宽的下降,参见图3的顶部图中的灰色线。这样的量值响应被称为梳状滤波器效应,并且对于针对高达约5khz的频率的感知的声音质量是有害的,例如参见[13,ch.17][34,ch.9]。

全通滤波器可以用于补偿每个区中的idp,使得补偿的idp对于所有频率主要是同相的,即,补偿的系统在两个区中具有±90°的最大相对相位差,参见图3中的黑色线。补偿的量值响应中得到的下降因此是窄的,并且不可听的[12][24][27][29][30]。使用这样的全通滤波器方法在没有反射的收听环境中工作良好。然而,这样的收听环境仅仅存在于理论中或在具有对称设置的自由空间传播中。可以期望在一些良好设计的收听环境中给出合理的结果。此外,这样的全通滤波器方法限于两个对称的偏离中心的收听位置,不包括量值响应的校正,并且不处理由收听环境和非对称收听区的声学属性引起的相位差。换句话说,仅仅考虑由于扬声器与每个区的中心之间的对称距离的相位差。然而,例如在汽车中,遇到强的早期反射,并且因此这些方法的性能一般显著地降低。相对传播延迟差不足够好地描述典型收听环境的声学属性。这将在以下部分中更详细地讨论。

个人多声道声音再现

根据第一方面,提供一种用于为包括n≥2个扬声器的相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的方法。参照图6,该方法包括以下步骤:

s1:在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处,为至少一对扬声器中的每一个评估模型传递函数。

例如,模型传递函数在这里可以是表示从扬声器到测量点或所谓的控制点的声音传播的、以传递函数形式表示的任何模型。收听区包括m个控制点的子集,并且可以位于收听环境中的任何地方。

s2:至少基于控制点的区附属,为m个控制点中的每一个确定依赖区的目标传递函数。

作为示例,目标传递函数是在m个控制点的每一个中的接收的声音的希望的行为的描述。可以为属于或附属于不同区的不同控制点不同地设置目标。

s3:至少基于m个控制点的模型传递函数和目标传递函数,确定音频预补偿控制器的滤波器系数。

例如,确定预补偿控制器的特性的预补偿控制器的滤波器系数可以是例如有限脉冲响应(fir)或无限脉冲响应(iir)滤波器的任何滤波器结构的可调节参数。

以这种方式,可以获得用于相关联的音响系统的音频预补偿控制器,该音频预补偿控制器使得能够同时在两个或更多个收听区中改善和/或定制声音再现。

作为示例,通过使用依赖区的目标传递函数,可以取决于收听环境使得声音再现在不同区中相似,或者被至少部分地个性化或定制。

通常,收听区对应于不同的人类收听位置。

作为示例,目标可以是在几个空间上分离的收听区中创建相似的声场,其中区中的至少一个位于传统的所谓的甜点外部。例如,可能希望在所有区中同时获得空间和时间保真度,而不管其位置如何。这既不可以通过诸如例如立体声或5.1环绕声之类的标准多声道音响系统来实现,也不可以通过文献中提出的任何方法来获得以用于真实的收听环境和合理量的扬声器。在标准多声道系统中,仅仅在单个良好定义的收听位置中提供具有高保真度的正确声音再现;甜点。

设置在区之间不同的依赖区的目标的概念例如可用于提供以下特征中的一个或多个:

•同时在几个区中改善的空间多声道声音再现。

•同时在每个区中改善的音调平衡,在每个区中具有相似或可能不同的音调。

•在声学上对于不同收听环境和区域足够的滤波器系数。

•考虑声学环境的由模型传递函数描述的滤波器系数。

作为非限制性示例,滤波器系数可基于优化准则函数来确定,其中准则函数至少包括与模型传递函数和目标传递函数相关的目标误差,并且可选地还包括至少一对扬声器的补偿的模型传递函数的表示之间的差。

例如,模型传递函数和目标传递函数可表示在考虑的控制点处的脉冲响应。

应当理解:提出的技术可应用于多于两个收听区,即z≥3。

相似地,提出的技术可应用于多于两个扬声器,即n≥3。在该场景中,提出的技术例如可以成对的方式应用于扬声器,或者通过简单地考虑一对扬声器并使用一个或多个剩余的扬声器作为一个或多个可选的支持扬声器。

如果可选的支撑扬声器将与当前方法一起使用,则该方法包括以下可选步骤:

•对于l个输入信号中的每一个,将n个扬声器中选择的一个指定为主扬声器,并将包括n个扬声器中的至少一个的选择的子集s指定为一个或多个支持扬声器,其中主扬声器不是子集的部分;

•基于选择的主扬声器和一个或多个选择的支持扬声器,为l个输入信号中的每一个确定音频预补偿控制器的滤波器参数,使得在音频预补偿控制器的动力学的稳定性的约束下优化准则函数,其中准则函数包括在m个控制点之上的补偿的估计的脉冲响应与目标脉冲响应之间的差的乘方(power)的加权求和。

此外,应当理解:l≥1个输入信号可通过上混频或下混频源信号以匹配希望的声音记录标准来创建。作为示例,单个单声源信号可被上混频到例如立体声(l=2)或环绕声5.1(l=6)。相似地,7.1环绕声声源信号可以下混频到立体声(l=2)或5.1(l=6)环绕声。此外,对于本领域技术人员显而易见的是:单个单声源信号可以用作输入信号(l=1),随后被补偿并馈送到至少一对扬声器。

在特定示例中,对于关于扬声器和收听区的位置的对称和非对称设置两者,模型传递函数是声学不对称的。作为示例,图7中示出具有两个扬声器和两个控制点(每个收听区中一个)的对称汽车音响系统设置。尽管扬声器到控制点之间的传播延迟是完美对称的,但是这样的对称设置将不导致对称的声学测量。例如,在图8中描绘如图7中所示的设置的测量的脉冲响应。图8的顶部图示出来自相邻区中的左(黑色)和右(灰色)扬声器的脉冲响应,底部图示出远程区中的扬声器的脉冲响应。如果设置是完全对称的,则对应的脉冲响应将是相等的。通过检查,本领域技术人员可以看到,仅仅传播延迟(由对应的脉冲响应中的第一脉冲表示)在扬声器之间是对称的,而脉冲响应以其它方式不是相同的(对称的),如在完美对称的声学环境中将是这种情况。对于不对称设置,脉冲响应也不可避免地不对称。因此,尽管设置的对称性(扬声器和收听区),但是现实(测量的)脉冲响应一般是不对称的。

可选地,基于控制点中的至少一对所述扬声器之间的相位差来确定每个控制点中的目标传递函数。相位差例如由控制点中的模型传递函数定义,并且依赖区的目标传递函数的相位特性在附属于不同收听区的控制点之间典型地不同。

在一个示例中,在多个,即m个控制点中的每一个处估计模型传递函数的步骤可基于在控制点中的每一个处估计脉冲响应、基于音响系统的声音测量。

在另一个示例中,在多个,即m个控制点中的每一个处估计模型传递函数的步骤可基于在控制点中的每一个处的脉冲响应的模拟,其中该模拟包括一阶反射和/或更高阶反射。

在特定示例中,在音频预补偿控制器的动力学的稳定性的约束下,可基于优化准则函数来确定滤波器系数。例如,准则函数可至少包括在所述m个控制点之上的补偿的模型脉冲响应与目标脉冲响应之间的差的乘方的加权求和,以及可选地在至少一对扬声器的补偿的模型传递函数的表示之间的差的乘方的加权求和。

如果这样的可选的相似性要求将与当前方法一起使用,则该方法包括以下可选步骤:

•为l个输入信号中的每一个,指定n个扬声器中选择的一个作为主扬声器;

•如果可行的话,为l个输入信号中的每一个指定扬声器对,其中扬声器对需要对应于用于虚拟声源的创建的输入信号。

•基于选择的主扬声器和选择的扬声器对,为l个输入信号中的每一个确定音频预补偿控制器的滤波器参数,使得在所述音频预补偿控制器的动力学的稳定性的约束下优化准则函数,其中准则函数包括在m个控制点或m个控制点的子集之上的补偿的估计的脉冲响应与目标脉冲响应之间的差的乘方的加权求和,以及在至少一对扬声器的补偿的模型传递函数的表示之间的差的乘方的加权求和。

可选地,该方法可进一步包括将为z个收听区确定的滤波器系数归并到用于音频预补偿控制器的归并的一组滤波器参数中的步骤。

在下面,将基于模型框架的同等非限制性示例、参照滤波器设计的非限制性示例描述提出的技术。

以下非限制性示例中的目的是在多个收听区中同时创建真实的个人多声道音频体验。不同的区在空间上分离,并且它们中的至少一个位于默认甜点外部。在该示例中,我们基于具有三个基本特征的mimo前馈控制来建议使用一般滤波器设计框架:(1)成对声道相似性均衡;(2)可能使用支持扬声器;(3)基于为每个控制点单独选择的目标传递函数,模型传递函数到各个区的均衡。这些目标传递函数的相位响应的特性在区之间不同。目标传递函数的量值响应不受约束。

先前的工作

如果人们仅仅考虑由于从两个扬声器到两个区的中心的距离的相位差,则人们已经知道当前问题描述的答案。如上所讨论的,某些全通滤波器提供均衡系统的装置,使得补偿的idp在用于定义的频率范围的两个区中主要是同相的。这样的全通滤波器的设计是相当简单的。基于系统完全由扬声器到每个区的中心之间的距离描述的假设,系统的行为可以由梳状滤波器描述。这样的梳状滤波器在等间隔的频率处具有下降(其中idp最大,即±180°),以及在等间隔的频率处的峰值(其中idp完全同相,即0°),参见图3。这些频率容易计算[34]。令以秒为单位测量的d是两个扬声器之间的相对传播延迟差。则第一下降的频率fd1或其中idp是±180°的第一频率由fd1=1/2d给出。剩余的下降将发生在第一下降的奇数倍处,使得fdn=n/2d,其中n=2n+1,n∈n+。峰值的频率fpn或者其中idp同相的频率由fpn=n/d计算,n∈n+

基于该假设,希望的全通滤波器可以容易地设计[12][24][27][29][30]。基本想法是在频率处应用180°相移,其中区中的扬声器间差分相位(idp)主要异相,即|idp|>90°。图7中图示具有两个扬声器s1和s2以及两个控制点r1和r2的音响系统,在两个区中的每一个中一个扬声器和控制点。基于传播延迟差,图3的底部图描绘分别由灰色实线和虚线图示的控制点r1和r2中的idp。180°相移或者可以由一个全通滤波器应用,或者优选地分布在两个互补的全通滤波器之间[30]。这样的互补全通滤波器的示例由图5中的黑色实线和虚线图示。理论上,这样的全通滤波器产生希望的补偿的idp,其对于两个控制点中的所有频率主要是同相的。理论上,在图3中示出(分别为黑色实线和虚线)在控制点r1和r2中的该最佳补偿的idp。

全通滤波器方法的限制

当在典型收听环境中考虑测量的rtf时,控制点中的两个扬声器之间的idp不遵循这样的系统模式,这是容易确定的。我们将通过示例来澄清这一点。图4描绘在一个控制点(黑色线)中测量的rtf和基于传播延迟(灰色线)的对应的梳状滤波器的idp和量值总和响应。在汽车的左前座中进行测量,控制点中的两个扬声器的相对传播延迟差为1.7ms。比较图4中的图表,显然的是:idp和量值总和响应两者实际上未由梳状滤波器良好地描述,梳状滤波器基于控制点中的扬声器之间的相对传播延迟差。尽管基于梳状滤波器设计全通滤波器是相当简单的,但是图4的检查强烈地建议:在考虑现实声学环境下,其可以被假设不可能用该设计策略来确定相位响应。测量的idp不可以由对应于梳状滤波器描述的琐碎公式来描述。当考虑真实声学环境时,这图示对新颖的滤波器设计方法的需求。

全通滤波器方法的另一个限制在于它们的设计。如由图5的底部图中的黑色线所描绘的瞬时相移实际不可以实现。全通滤波器的阶确定可以多好地达到理想补偿的idp。实际上有用的滤波器不可以完美地达到希望的idp,因为如果它可以达到,脉冲响应中的振铃将是清晰可听的[2][30]。必须平滑全通滤波器(例如通过选择低阶iir全通滤波器[30])。然而,这样的平滑的全通滤波器将不产生具有适当精度的希望的idp。

在以下非限制性示例中,我们将介绍提出的新颖的方法,并且突出其优于先前工作的优点。

声学建模

从扬声器输入到麦克风的声学信号路径将作为示例被建模为由其房间传递函数(rtf)完全描述的线性时不变系统(lti)。从在m个控制点处的测量来估计n个扬声器中的每一个的房间声学脉冲响应,m个控制点分布在意图的z个收听区的空间区域之上,使得每个收听区由mz个控制点覆盖。为了简单起见,我们假设在这个示例中:每个区中的控制点mz的数量相等,使得控制点的总数m由所有mz个控制点的总和给出。推荐控制点的数量m等于或大于扬声器的数量n。然后可以通过从扬声器一次一个扬声器地发出测试信号并记录在所有m个测量位置处的得到的声学响应信号来估计动态声学响应。诸如白色或有色噪声或扫频正弦波之类的测试信号可以用于该目的。从一个扬声器到m个输出的线性动态响应的模型然后可以以例如具有一个输入和m个输出的fir或iir滤波器的形式来估计。诸如最小二乘法或基于傅里叶变换的技术之类的各种系统识别技术可以用于该目的。为所有的扬声器重复测量过程,最终导致由动态模型的m×n矩阵表示的模型传递函数。多输入多输出(mimo)模型可以替代地由状态空间描述来表示。用于表示声音再现系统的虽然非常一般但是数学上方便的mimo模型的示例是通过具有对角分母的右矩阵分数描述(mfd)[18],

等式(1):

这是将在下面利用的mfd的类型。如果允许矩阵a-1n(q-1)是全多项式矩阵,可以获得甚至更一般的模型,并且在原则上没有禁止使用这样的结构。然而,我们将坚持下面的结构(1),因为它允许最佳控制器的更透明的数学推导。注意:如在(1)中定义的模型传递函数hn可包括描述模型误差和不确定性的参数化,如由以下示例给出。

考虑导致从空间稀疏测量数据获得的模型的可行量的m个控制点,我们将采用在[6][26][32]中呈现的随机不确定性模型。因此,线性系统模型被分解为两部分的总和,一个确定性标称部分和一个随机不确定性部分,其中不确定性部分由随机变量部分参数化。标称部分在这里将表示已知关于空间仅仅缓慢变化(并且其因此由空间稀疏的rtf测量良好地捕获)的模型传递函数的那些分量,而不确定部分表示未由这样的测量完全捕获的分量。典型地,这些空间复杂的分量由以高频的晚房间反射和混响组成。相应地,(1)中的hn(q-1)被分解为等式(2.1):

其中h0n(q-1)是标称模型,并且δhn(q-1)构成不确定性模型。为h0n(q-1)和δhn(q-1)写出矩阵分数,等式(2.1)的分解可以被表达为等式(2.2):

音频预补偿控制器设计

考虑多声道音频音响系统,包括围绕房间中的z个有界三维收听区ωz∈r3的n个扬声器,n≥2并且1≤nn≤n。这里,nn,n∈{1,2},表示用于创建虚拟源的考虑的扬声器对中的扬声器中的每一个的扬声器的总数。作为示例,考虑位于两个前座中的具有两个收听区的4声道汽车扬声器系统。因此,扬声器的总数(被称为1、2、3和4)因此为n=4。收听区的总数则为z=2。假设前左(fl)和右前(fr)扬声器再现立体声录音。进一步假设使用所有的n=4个扬声器,以便改善fl和fr扬声器的声音再现,这产生:与fl和fr相关联的扬声器的总数为nn=n1=n2=4,因为扬声器的总数对应于n1和n2的并集:n=n1∪n2。在m个控制点或测量位置中测量系统的声学输出,其中mz个控制点均匀分布在每个收听区ωz内。令以上音响系统的nn个输入信号由尺寸nn*1的信号向量u1n(k)=[]t表示,并且令m个输出信号由尺寸m*1的信号向量yn(k)=[]t表示。然后之间的关系由等式(3)给出:

其中由等式(1)和等式(2.1)给出的hn(q-1)是尺寸m×nn的有理矩阵,具有是标量稳定有理函数hijn(q-1)的元素;i=1,...,m;j=1,...,nn。

目标传递函数的示例性定义

尺寸m×1的目标传递函数dn例如可被参数化为等式(4):

在以上中,假设多项式元素中的至少一个具有非零前导系数;包括等式(4)中的二次相等(secondequality)以强调dn包含d0个样本的初始建模延迟。在这个示例中,我们将为目标使用fir模型,并且因此我们具有e=1。此外,每个控制点具有包含全通滤波器的单独的目标传递函数。全通滤波器的相位特性在附属于不同区的控制点之间显著不同。目标d然后可以被表达为等式(5):

其中的大小为mz×1,并且包含用于收听区ωz中mz个控制点的目标。图9中图示用于在用于z=2个收听区和m=2个控制点的相位响应中的差的示例,mz=m1=m2=1,图9描绘控制点r1(黑色虚线)和r2(黑色实线)中的目标传递函数的相对相位响应,连同控制点r1(灰色线)中的未补偿idp。图10通过示例示意性地图示每个目标传递函数附属于收听区(围绕控制点的灰色框),并且目标传递函数的相位响应在区之间的其相位特性上不同。

可选相似性矩阵的示例性定义

提出的方法可以可选地包括相似性要求。如果希望可选地最小化选择的扬声器对的扬声器之间的差,则可以包括作为设计的一部分的相似性矩阵p。当p被设置为仅仅包含零的矩阵时,则将不考虑相似性。我们将示出如何通过示例包括相似性要求。相似性矩阵p被定义如下:

等式(6):

p=[diag(d)|-diag(d)],

其中d由等式(5)给出,并且其中用于列向量d的diag(d)表示具有沿着对角线的元素d的适当维度的对角矩阵,即diag(d1,...,dm)表示对角上具有d1,...,dm的对角矩阵。多项式矩阵p还包含标量相似性加权因子ρ,其允许基于给定的音响系统和收听环境来调节希望的相似性的程度。提出的相似性矩阵的设计一般与[3]中建议的设计显著不同,在[3]中建议单位矩阵和置换(相似性矩阵在[3]中被称为置换矩阵)。根据等式(6)的设计考虑在[3]中不可预见的不同区之间的目标传递函数的差异。通过调用等式(5)和(6),我们然后针对等式(11)的右手边上最后项获得以下公式(将被最小化的准则函数)

这意味着:当每个控制点中最小化由y1和y2表示的一对扬声器的补偿的模型传递函数的表示之间的差时,每个补偿的模型传递函数与每个控制点中的目标传递函数相乘。因而在考虑每个控制点中的期望目标传递函数之下最小化所述差。

扬声器对和支持扬声器的选择的示例

对于建议的方法,必须在n个扬声器之中选择至少一个扬声器对。选择的对应当对应于l个输入信号中的两个,其中两个选择的输入用于虚拟声源的创建,或者可选地,该对中的每个扬声器应当对应于相同的单(单个信号)输入。例如,如果将再现立体声录音,则左前和右前扬声器定义扬声器对。在另一个示例中,如果将再现5.1环绕声录音(家庭影院),则左前和右前扬声器应当被主要选择为扬声器对。然后可以根据提出的方法,通过选择进一步的扬声器对或者通过与任何希望的其它均衡器组合来均衡剩余的扬声器。

必须仔细选择可选的支持扬声器。例如,如果立体声系统的左前主扬声器完全由右前扬声器支持,则两个扬声器将再现左和右声道两者。这不可避免地导致单效果,因为两个扬声器将再现对应于左和右声道的总和的非常相似的信号。该单效果可以通过应用以下两个可选设计策略之一来避免:(a)仅仅允许与主扬声器的输入声道相关联的支持扬声器。(b)声源的位置典型地不可由人类听觉在小房间中以低频来定位,尤其是用于偏离中心的收听位置[35]。因此,可以应用具有约180hz的截止频率的低通滤波器来支持不与主输入声道相关联的扬声器(被称为约束的支持扬声器)。然后可使用在任意位置处的支持扬声器而不引起单效果,因为左和右声道的总和然后仅仅由用于低频的扬声器再现,这将不影响定位。

优化准则的定义的示例

考虑等式(1)-(6)中引入的由至少一个扬声器对组成的mimo系统。令n∈{1,2}描述该对的两个扬声器,并且回想扬声器的总数n由n=n1∪n2给出,其中n1和n2是用于需要相似的该对扬声器中每一个的扬声器的数量。注意:该对中的每个扬声器具有nn-1个可选支持扬声器,并且让我们引入信号,参见图11,

等式(7):

这里,w(k)是具有零均值和协方差e{w2(k)}=ψ的固定白噪声。尺寸分别m×m和nn×nn的滤波器vn(q-1)和wn(q-1)分别构成用于误差和控制信号的加权矩阵。此外,尺寸都是m×nn的hn(q-1)和h0n(q-1)由等式(1)-(3)给出。尺寸nn×1的控制信号u1n(k)和u2n(k)由等式(8)给出:

这里,rtot(q-1,q)是(可选地非因果的)前馈补偿器,而fn*(q-1)和rn(q-1)由等式(9)给出:

这里,d0与等式(4)中相同,并且表示补偿的系统的主要批延迟(或平滑滞后),而djn,j=1,...,nn,是可以用于补偿不同扬声器之中的距离的个体偏差的延迟。根据[8][9],等式(9)中的fn*(q-1)在这里由过剩相位零构建,过剩相位零是用于每个ωz中的所有测量位置的nn个扬声器中的每一个的rtf之中常见的。即,参见等式(1),bn的第j列的元素b1jn,…,bmjn被假设共享公共的过量的相位因子fj(q-1)。

由于fn*(q-1)是固定的并且是已知的,所以它可以被认为是增强系统的因子

等式(10):

其中hn(q-1)由等式(1)-(3)给出。

目标现在是设计控制器rn(q-1),以便获得各自的声道的目标,同时进行尽可能相似的标称补偿的声道响应,参见图11。换句话说,目的是最小化准则

等式(11):

这里分别表示关于δbn中的不确定参数(参见(3))的期望以及驱动噪声w(k)。尺寸m×m的矩阵pn构成相似性矩阵,其可以用于定义如何最小化关于涉及的扬声器对的等式(11)的右手边上的第三项。此外,pn构成加权矩阵以调整在频率和空间两者中考虑相似性的控制点。

最佳控制器设计的示例

例如基于其它范数构成平方2-范数或其它形式的准则的准则等式(11)可以几种方式、关于预补偿器r的可调节参数来优化。还可能在对预补偿器施加结构约束,诸如例如需要其元素是某些固定阶的fir滤波器,并且然后在这些约束下执行可调节参数的优化。这样的优化可以用自适应技术或者通过使用fir维纳滤波器设计方法来执行。然而,由于所有结构约束导致受约束的解空间,与没有这样的约束的问题公式相比,可获得的性能将较差。因此,除了预补偿器的因果性和补偿的系统的稳定性之外,应当优选地执行优化而没有对预补偿器的结构约束。用如上所述的优化问题,问题变成用于多变量前馈补偿器r的线性二次高斯(lqg)设计问题。

线性二次理论为线性系统和二次准则提供最佳线性控制器或预补偿器,例如参见[1][21][22][31]。如果涉及的信号被假设为高斯型,则通过优化准则等式(11)获得的lqg预补偿器不仅在所有线性控制器之中而且在所有非线性控制器之中可以被示为最优,例如参见[1]。因此,在r的因果性和补偿的系统hr的稳定性的约束下,优化关于r的可调节参数的准则等式(11)是非常一般的。假设hd稳定,因而补偿的系统或误差传递运算符d-hr的稳定性等于控制器r的稳定性。

我们现在将为由等式(1)-(10)和准则等式(11)定义的问题呈现lqg最优预补偿器。解决方案使用多项式矩阵来在传递运算符或传递函数形式中给出。用于推导这样的解决方案的技术例如已经在[31]中呈现。替代地,可以通过状态空间技术和riccati等式的解来导出该解决方案,例如参见[1][22]。

用于优化预补偿器的多项式矩阵设计等式

给定以上系统,用固定且已知的延迟多项式矩阵,全通有理矩阵fn*(q),并且假设信号w(k)是零均值单位方差白噪声序列,没有预失真伪影的在因果性和稳定性的约束下最小化的准则等式(11)的最佳线性二次高斯(lqg)预补偿器r(q-1)如等式(12)那样被获得:

其中尺寸(n1+n2)×(n1+n2)的β是由等式(13)给出的唯一的(达到单位常数矩阵)稳定光谱因子:

其中,尺寸2m×(n1+n2)的如在等式(10)中那样。等式(13)中的通过调用等式(10)和(2.2)来给出:

注意:标量加权因子ρ被包括在p中,使得ρ2缩放等式(13)中关于目标要求的相似性项。尺寸(n1+n2)×1的多项式矩阵q连同多项式矩阵l□二者构成diophantine等式的唯一解。

等式(14):

具有通用度

等式(15):

用于光谱平滑的后处理的示例

当音响系统正在再现音乐时,最优选的是:系统的传递函数的量值谱是平滑的和良好平衡的,至少在收听区之上是平均的。如果补偿的系统在所有位置完美地达到希望的目标d和相似性,则补偿的系统的平均量值响应将如所希望的。然而,由于不可以期望设计的控制器r在所有频率处完全达到目标响应d和相似性(例如由于不可以完全补偿的非常复杂的房间混响),在补偿的系统中将总是有一些剩余的近似误差。这些近似误差在不同频率处可具有不同的量值,并且它们可影响再现的声音的质量。量值响应缺陷一般是不希望的,并且控制器矩阵应当优选地被调节,使得在所有收听区中平均地达到总目标量值响应。

因此,在准则最小化之后优选地添加最终设计步骤,目的是调节控制器响应,使得平均起来,目标量值响应在测量位置之上平均地被良好地近似。为此,可以基于设计模型或基于新的测量而在各种收听位置中评估整个系统(即,包括控制器r的系统)的量值响应。然后可以设计最小相位滤波器,使得平均(在均方根(rms)的意义上)在所有收听区中达到目标量值响应。作为示例,可采用基于空间响应变化的可变分数倍频程平滑,以便不在任何特定频率区中过度补偿。结果是调节r的所有元素达相等的量的一个标量均衡器滤波器。

说明性示例

我们现在将基于在四声道汽车音响系统的两个前座中获得的实际测量呈现评估的结果,该四声道汽车音响系统由位于门中的四个宽带扬声器组成。使用的汽车是福特mondeo轿车,其中所有的扬声器是交付的标准音响系统的一部分。安装了汽车售后市场放大器,以便有权访问声道并绕过头部单元。该音响系统对应于典型的标准汽车音响系统。

在该滤波器设计中,矩阵v包含适当维度的单位矩阵。因此,我们将不使用目标误差的任何频率加权。矩阵w包含频率加权,该频率加权惩罚控制动作,使得不在其操作范围外部驱动涉及的扬声器。此外,该加权矩阵还控制支持扬声器的工作频率范围(例如通过将它们的影响限制到较低频率)。我们在这里利用所有可用的扬声器作为支持扬声器,具有以下限制:仅仅使用与除了选择的对的考虑的扬声器外的其它输入信号相关联的支持扬声器高至180hz,参见图12中的细虚线。

相似性矩阵p还包含频率加权,优选地用于将相似性努力集中到较低频率。该加权由具有4khz的截止频率的搁置滤波器组成,参见图12。这由假设相移高达大约5khz可听到的事实来激发。标量相似性加权因子被设置为ρ2=0.3。

为了在混响条件下估定比较的方法的空间性能,我们将使用互相关测量,互相关测量在窄频带中评估在创建虚拟源的扬声器对中的扬声器之间的互相关。可以考虑两个基本规则来解释描绘区中全部控制点之上的平均互相关的图13:(1)在给定中心频率处的互相关越高,即越接近1,rtf将在对应的频带中平均更相等,从而导致在该频带中的虚拟源的更好的空间再现;(2)具有高互相关的频率范围越宽,全部空间再现越好。

图13直接比较(a)、(b)和(c)的两个区中的平均互相关性,(a)用提出的方法补偿、由图13中的黑色粗实线和虚线描绘的系统,(b)用在先前工作中建议的全通滤波器设计补偿、由图13中的灰色粗实线和虚线描绘的系统,(c)图13中的黑色细实线和虚线描绘的未补偿的系统。全通设计产生未补偿的系统的显著改善。然而,如前所论证,这样的全通设计基于粗略的简化,并且不太适合于补偿真实的音频系统,尤其是在诸如汽车之类的挑战性声学环境中。相反,瞄准几个区中的空间保真度的滤波器设计应当考虑给定的声学环境。这里提出基于目标传递函数而不是滤波器的相位响应的直接设计的这样的方法,并且我们通过图13的检查推断:建议的个人音频框架显著地改善空间声音再现,因为它在宽频率范围上获得高互相关。此外,个人音频滤波器设计在高达250hz的两个区中获得高互相关和相等性能两者。在250-3000hz之间,全通滤波器设计比个人音频滤波器在两个区中获得更均衡的性能。然而,对于全通滤波器设计,互相关在这些频率处非常低(参见灰色粗实线和虚线),并且性能因而在两个区中同样差。相比之下,个人音频滤波器设计在高达3000hz的两个区中获得高互相关,参见图13中的黑色粗实线和虚线。这些结果强烈地表明提出的方法在性能上优于先前报道的方法。

实现方式方面

将理解:本文所述的方法和设备可以以各种方式组合和重新布置。

例如,实施例可以硬件、或者用于由合适的处理线路执行的软件、或其组合来实现。

本文所述的步骤、功能、过程、模块和/或块可用使用任何常规技术的硬件来实现,任何常规技术(诸如分立电路或集成电路技术)包括通用电子线路和专用线路。

特定的示例包括一个或多个适当配置的数字信号处理器和其它已知的电子电路,例如,经互连以执行专用功能的离散逻辑门,或者专用集成电路(asic)。

替代地,本文所述的步骤、功能、过程、模块和/或块中的至少一些可以软件来实现,该软件诸如用于由诸如一个或多个处理器或处理单元之类的合适的处理线路执行的计算机程序。

处理线路的示例包括但不限于一个或多个微处理器、一个或多个数字信号处理器(dsp)、一个或多个中央处理单元(cpu)、视频加速硬件和/或任何合适的可编程逻辑线路,诸如一个或多个现场可编程门阵列(fpga)或一个或多个可编程逻辑控制器(plc)。

还应当理解:重新使用在其中实现提出的技术的任何常规设备或单元的一般处理能力或许是可能的。重新使用现有软件也或许是可能的(例如通过现有软件的重新编程或通过添加新的软件组件)。

根据第二方面,提供一种被配置成为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的系统。该音响系统包括n≥2个扬声器。该系统被配置成:基于收听环境的声学属性的模型,在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处为至少一对扬声器中的每一个估计模型传递函数。该系统还被配置成:至少基于控制点的区附属和声学属性的模型,为m个控制点中的每一个确定依赖区的目标传递函数。该系统被进一步配置成:至少基于m个控制点的模型传递函数和目标传递函数,确定音频预补偿控制器的滤波器系数。

作为示例,该系统可被配置成:基于优化准则函数来确定滤波器系数,其中准则函数至少包括与模型传递函数和目标传递函数相关的目标误差,并且可选地还包括在至少一对扬声器的补偿的模型传递函数的表示之间的差。

例如,该系统可被配置成:基于表示在控制点处的脉冲响应的模型传递函数和目标传递函数来操作。

在特定示例中,该系统被配置成:确定对于与扬声器和收听区的位置相关的对称和非对称设置两者声学上不对称的模型传递函数。

作为示例,该系统可被配置成:基于在控制点中的至少一对扬声器之间的相位差来确定每个控制点中的目标传递函数。相位差例如可由控制点中的一个或多个模型传递函数定义,并且所述依赖区的目标传递函数的相位特性通常在附属于不同收听区的控制点之间不同。

在一个示例中,该系统可被配置成:基于音响系统的声音测量、基于在控制点中的每一个处估计脉冲响应来在控制点中的每一个处估计模型传递函数。

在另一个示例中,该系统被配置成:基于在控制点中的每一个处的脉冲响应的模拟来在控制点中的每一个处估计模型传递函数,其中模拟包括一阶反射和/或更高阶反射。

可选地,该系统可被配置成:在音频预补偿控制器的动力学的稳定性的约束下、基于优化准则函数来确定滤波器系数。例如,准则函数可至少包括在m个控制点之上的补偿的模型脉冲响应和目标脉冲响应之间的差的乘方的加权求和,以及可选地在至少一对扬声器的补偿的模型传递函数的表示之间的差的乘方的加权求和。

作为示例,如图1的概述中所如示,音频预补偿控制器可具有用于l个控制器输入信号的l个输入和用于n个控制器输出信号的n个输出,音响系统的每个扬声器一个,其中扬声器对中的至少一个被指定用于输入信号。

在特定示例中,该系统包括处理器和存储器。存储器包括可由处理器执行的指令,由此处理器可操作以确定音频预补偿控制器的滤波器系数。

图14是图示包括处理器10和相关联的存储器20的这样的系统100的示例的示意框图。

在该特定示例中,在计算机程序25;45中实现本文所述的步骤、功能、过程、模块和/或块中的至少一些,所述计算机程序被加载到存储器20中,用于由包括一个或多个处理器的处理线路执行。一个或多个处理器10以及存储器20彼此互连以使能正常的软件执行。可选的输入/输出设备也可互连到一个或多个处理器10和/或存储器20,以使能相关数据(诸如一个或多个输入参数和/或一个或多个得到的输出参数)的输入和/或输出。

术语“处理器”应当在一般意义上被解释为能够执行程序代码或计算机程序指令以执行特定处理、确定或计算任务的任何系统或设备。

包括一个或多个处理器的处理线路因而被配置成在执行计算机程序时执行诸如本文所述的那些之类的良好定义的处理任务。

处理线路不必专用于仅仅执行上述步骤、功能、过程和/或块,而是还可执行其它任务。

在特定实施例中,计算机程序包括指令,该指令在由至少一个处理器执行时使得一个或多个处理器:

-在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处为至少一对扬声器中的每一个估计模型传递函数;

-至少基于控制点的区附属,为所述m个控制点中的每一个确定依赖区的目标传递函数;以及

-至少基于m个控制点的模型传递函数和目标传递函数,确定音频预补偿控制器的滤波器系数。

提出的技术还提供包括计算机程序25;45的载体20;40,其中载体是电子信号、光信号、电磁信号、磁信号、电信号、无线电信号、微波信号或计算机可读存储介质中的一个。

作为示例,软件或计算机程序25;45可被实现为计算机程序产品,计算机程序产品通常被携带或存储在计算机可读介质20;40(特别是非易失性介质)上。计算机可读介质可包括一个或多个可移动或不可移动存储器设备,包括但不限于只读存储器(rom)、随机存取存储器(ram)、光盘(cd)、数字多功能盘(dvd)、蓝光盘、通用串行总线(usb)存储器、硬盘驱动器(hdd)存储设备、闪存、磁带或任何其它常规存储器设备。计算机程序因而可被加载到计算机或等效处理设备的操作存储器中,用于由其处理线路执行。

因此,当由一个或多个处理器执行时,本文中呈现的一个或多个流程图可被认为是一个或多个计算机流程图。对应的装置可被定义为功能模块的分组,其中由处理器执行的每个步骤对应于功能模块。在这种情况下,功能模块被实现为在处理器上运行的计算机程序。因此,用于滤波器设计的系统或装置可替代地被定义为功能模块的分组,其中功能模块被实现为在至少一个处理器上运行的计算机程序。

驻留在存储器中的计算机程序因而可被组织为适当的功能模块,该功能模块被配置为在由处理器执行时执行本文所述的步骤和/或任务的至少一部分。

图15是图示用于为相关联的音响系统的补偿确定音频预补偿控制器的滤波器系数的装置的示例的示意框图。相关联的音响系统包括n≥2个扬声器。装置300包括估计模块310,用于在音响系统的收听环境中的z≥2个空间上分离的收听区中分布的多个,即m个控制点中的每一个处为至少一对扬声器中的每一个估计模型传递函数。装置300还包括定义模块320,用于至少基于控制点的区附属来为m个控制点中的每一个定义依赖区的目标传递函数。装置300进一步包括确定模块330,用于至少基于m个控制点的模型传递函数和目标传递函数来确定音频预补偿控制器的滤波器系数。

替代地,可能主要由硬件模块或者可替代地由硬件实现图15中的模块。软件与硬件的程度是纯粹的实现方式选择。

典型地,在分离的计算机系统上求解设计等式以产生预补偿滤波器的滤波器参数。然后计算的滤波器参数通常被下载到数字滤波器中,数字滤波器例如由执行实际滤波的数字信号处理系统或相似的计算机系统(诸如例如智能手机、平板电脑、膝上型计算机)来实现。

虽然该发明可以以软件、硬件、固件或其任何组合来实现,但是由该发明提出的滤波器设计方案被优选地实现为以程序模块、功能或等效物形式的软件。软件可以任何类型的计算机语言(诸如c、c++或甚至用于数字信号处理器(dsp)的专用语言)编写。在实践中,该发明的相关步骤、功能和动作被映射到计算机程序中,该计算机程序在由计算机系统执行时实现与预补偿滤波器的设计相关联的计算。在基于pc的系统的情况下,通常在诸如dvd、cd、usb闪存驱动器之类的计算机可读介质或用于分发给用户/滤波器设计者的相似结构上编码用于音频预补偿滤波器的设计的计算机程序,然后用户/滤波器设计者可将程序加载到他/她的计算机系统中,用于随后的执行。甚至可经由因特网从远程服务器下载软件。

图16是图示根据该发明的适合于滤波器设计算法的实现方式的计算机系统的示例的示意框图。系统100可以任何常规计算机系统的形式来实现,该计算机系统包括个人计算机(pc)、大型计算机、多处理器系统、网络pc、数字信号处理器(dsp)等等。无论如何,系统100基本上包括中央处理单元(cpu)或者一个或多个数字信号处理器(dsp)核10、系统存储器20和互连各种系统组件的系统总线30。系统存储器20典型地包括只读存储器(rom)22和随机存取存储器(ram)24。此外,系统100通常包括提供数据和程序信息的非易失性存储的一个或多个驱动器控制的外围存储器设备40,诸如例如硬盘、磁盘、光盘、软盘、数字视频盘或存储卡。每个外围存储器设备40通常与用于控制存储器设备的存储器驱动器以及用于将存储器设备40连接到系统总线30的驱动器接口(未图示)相关联。根据该发明实现设计算法的滤波器设计程序、可能连同其它相关程序模块可被存储在外围存储器40中,并且被加载到系统存储器20的ram22中,用于由cpu10执行。给定相关的输入数据(诸如模型表示和其它可选配置),滤波器设计程序计算预补偿滤波器的滤波器参数。

然后通常经由系统100的i/o接口70而将确定的滤波器参数从系统存储器20中的ram24传送到预补偿控制器,也被称为预补偿滤波器系统200。优选地,预补偿控制器或滤波器系统200基于数字信号处理器(dsp)或相似的中央处理单元(cpu)202或等效处理器以及用于保持滤波器参数和所需的延迟信号样本的一个或多个存储器模块204。存储器204通常还包括滤波程序,该滤波程序在由处理器202执行时基于滤波器参数执行实际滤波。

代替经由i/o系统70直接向预补偿控制器或滤波器系统200传送计算的滤波器参数,可将滤波器参数存储在外围存储卡或存储盘40上,用于以后分发到可以或可以不位于远离滤波器设计系统100预补偿控制器或滤波器系统。也可例如经由因特网而从远程位置下载计算的滤波器参数,并且然后优选地以加密的形式。

为了使得能够在考虑时由音频装备产生的声音的测量,任何常规的麦克风单元或相似的记录设备80可以通常通过模数(a/d)转换器80连接到计算机系统100。基于由麦克风80单元进行的(常规的)音频测试信号的测量,系统100可以使用加载到系统存储器20中的应用程序来开发音频系统的模型。测量还可用于评估预补偿滤波器和音频设备的组合系统的性能。如果设计者对得到的设计不满意,他可基于修改的一组设计参数来启动预补偿滤波器的新的优化。

此外,系统100典型地具有用于允许与滤波器设计者的用户交互的用户界面50。几个不同的用户交互场景是可能的。

例如,滤波器设计者可决定他/她想在控制器或滤波器系统200的滤波器参数的计算中使用具体的定制的一组设计参数。滤波器设计者然后经由用户界面50定义相关的设计参数。

对于滤波器设计者还可能在一组不同的预配置参数之间选择,该组不同的预配置参数可能已经被设计用于不同的音频系统、收听环境和/或用于将特殊特性引入到得到的声音中的目的。在这样的情况下,预配置选项通常被存储在外围存储器40中,并在滤波器设计程序的执行期间被加载到系统存储器中。

滤波器设计者还可通过使用用户界面50来定义模型传递函数。代替基于麦克风测量确定系统模型,对于滤波器设计者还可能从一组不同的预配置系统模型中选择音频系统的模型。优选地,这样的选择基于特定音频装备,该特定音频装备将与得到的预补偿滤波器一起被使用。

优选地,音频滤波器连同声音生成系统被体现,以便使得能够生成受滤波器影响的声音。

在替代实现方式中,没有或仅有边缘用户参与地或多或少地自主执行滤波器设计。现在将描述这样的结构的示例。示范性系统包括监控程序、系统识别软件和滤波器设计软件。优选地,监控程序首先生成测试信号并测量音频系统的得到的声学响应。基于测试信号和获得的测量,系统识别软件确定音频系统的模型。监控程序然后收集和/或生成所需的设计参数,并将这些设计参数转发到滤波器设计程序,滤波器设计程序计算预补偿滤波器参数。作为选择,监控程序然后可评估关于测量的信号的得到的设计的性能,并且如果有必要,命令滤波器设计程序以基于修改的一组设计参数来确定新的一组滤波器参数。可重复该过程,直到获得令人满意的结果。然后,最终的一组滤波器参数被下载/实现到预补偿控制器或滤波器系统中。

还可能自适应地(代替使用固定的一组滤波器参数)调节预补偿滤波器的滤波器参数。在音频系统中使用滤波器期间,音频条件可能改变。扬声器和/或诸如收听环境中的家具之类的物体的位置可能改变,这反过来可能影响房间声学,和/或音频系统中的某种装备可由导致整体音频系统的不同特性的某种其它装备交换。在这样的情况下,来自收听环境中的一个或多个位置中的音频系统的声音的连续或间歇测量可由一个或几个麦克风单元或相似的声音记录设备来执行。记录的声音数据然后可被馈送到滤波器设计系统中,诸如图16的系统100,该滤波器设计系统计算新的音频系统模型并调节滤波器参数,使得它们更好地适应新的音频条件。

自然地,该发明不限于图16的布置。作为替代方案,预补偿滤波器的设计和滤波器的实际实现方式两者可在一个并且相同的计算机系统100或200中来执行。这一般意味着在相同的dsp或微处理器系统上实现和执行滤波器设计程序和滤波程序。

在图17中示意性地图示根据本发明合并预补偿控制器或滤波器系统200的声音生成或再现系统400。来自声源的音频信号的向量w(t)被转发到预补偿控制器或滤波器系统200中(可能经由常规的i/o接口210)。如果音频信号w(t)是模拟的(诸如对于lp、模拟音频盒式磁带和其它模拟声源),在进入滤波器200之前信号首先在a/d转换器210中被数字化。例如来自cd、dat磁带、dvd、迷你盘等等的数字音频信号可被直接转发到滤波器200而无需任何转换。

数字或数字化的输入信号w(k)然后由预补偿滤波器200预补偿,基本上考虑随后的音频系统装备的效果。

得到的补偿的信号u(k)然后可能通过进一步的i/o单元230、例如经由无线链路而被转发到d/a转换器240,在d/a转换器240中数字补偿信号u(k)被转换为对应的模拟信号。该模拟信号然后进入放大器250和扬声器260。从该组n个扬声器260发出的声音信号ym(t)然后具有希望的音频特性,给出接近理​​想的声音体验。这意味着已经通过预补偿滤波器的反转动作消除了音频系统装备的任何不想要的效果。

预补偿控制器或滤波器系统可被实现为具有到随后的放大器的模拟或数字接口的数字信号处理器或计算机中的独立装备,如上所提及。替代地,它可被集成到数字前置放大器、d/a转换器、、计算机声卡、紧凑立体声系统、家庭影院系统、计算机游戏控制台、tv、mp3播放器对接站、智能电话、平板电脑、膝上型计算机或目的是产生声音的任何其它设备或系统的结构中。还可能以更加面向硬件的方式、用诸如fpga或asic之类的定制的计算硬件结构来实现预补偿滤波器。

应当理解:可与将声音信号分布到实际再现地点分离地执行预补偿。由预补偿滤波器产生的预补偿信号不一定必须被立即分布到声音生成系统并与声音生成系统直接连接,但可被记录在分离的介质上,用于以后分发到声音生成系统。图17中的补偿信号u(k)然后例如可能表示已经被调节到特定音频设备和收听环境的cd或dvd盘上的记录的音乐。它还可以是存储在因特网服务器上的预补偿的音频文件,用于允许随后将文件通过因特网下载或流传输到远程位置。

上述实施例仅仅作为示例给出,并且应当理解:提出的技术不限于此。将由本领域技术人员理解:可对实施例进行各种修改、组合和改变而不脱离由所附权利要求限定的本范围。特别地,在技术上可能的情况下,可以在其它配置中组合在不同实施例中的不同部分解决方案。

参考文献

[1]b.d.o.andersonandj.b.moore.optimalcontrol,linearquadraticmethods.prentice-hall,englewoodcliffs,nj,1990.

[2]m.arlbrant.soundqualityenhancementofautomotiveaudiosystems.master'sthesis,chalmersuniversityoftechnology,sweden,2009.

[3]a.bahne,l.-j.brännmarkanda.ahlén.audioprecompensationcontrollerdesignwithpairwiseloudspeakerchannelsimilarity,jan.2014,wopatentapp.pct/se2013/050,748

[4]j.bauckandd.h.cooper.generalizedtransauralstereoandapplications.j.audioeng.soc,44(9):683-705,sep.1996.

[5]j.blauert.spatialhearing-revisededition:thepsychophysicsofhumansoundlocalization.themitpress,1996.

[6]l.-j.brännmark.robustaudioprecompensationwithprobabilisticmodelingoftransferfunctionvariability.inieeeworkshoponapplicationsofsignalprocessingtoaudioandacoustics,waspaa'09,proceedings,pages193-196,newpaltz,ny,october2009.

[7]l.j.brännmark,m.sternadandm.johansson.soundfieldcontrolinmultiplelisteningregions,jul.2013,uspatent8,213,637

[8]l.-j.brännmark,a.bahne,anda.ahlén.compensationofloudspeaker-roomresponsesusingmimofeedforwardcontrol.ieeetransactionsonaudio,speech,andlanguageprocessing,21(6):1201-1216,2013.

[9]l.-j.brännmarkanda.ahlén.spatiallyrobustaudiocompensationbasedonsimofeed-forwardcontrol.ieeetransactionsonsignalprocessing,57(5),may2009.

[10]m.christophandl.scholz.audiosystemphaseequalization,may2011,uspatentapp.12/917,604

[11]d.clark.stereoinautomobiles.inaes8thint.conf.:thesoundofaudio,washingtond.c.,usa,may1990.

[12]b.a.cookandm.j.smithers.stereophonicsoundimaging,sep.2007,wopatentapp.pct/us2007/006,520

[13]f.altoneverest.masterhandbookofacoustics.mcgraw-hill,4thedition,2001.

[14]h.fastlande.zwicker.psychoacoustics.springer,3rdedition,2007.

[15]m.frank,f.zotter,h.wierstorf,ands.spors.spatialaudiorendering.ins.mölleranda.raake,editors,qualityofexperience,t-labsseriesintelecommunicationservices,pages247-260.springerinternationalpublishing,2014.

[16]h.i.gefvert.multi-purposeinterchangeablemodularautoloudspeakersystem,february1985.uspatent4,502,149.

[17]a.grimani.astereophonicimagingsystemforcaraudio.presentedataes91stconv.,newyork,ny,usa.preprint3190,oct.1991.

[18]t.kailath.linearsystems.prentice-hall,englewoodcliffs,nj,1980.

[19]h.kihara,h.binauralcorrelationcoefficientcorrectingapparatus,mar.1989,uspatent4,817,162

[20]d.kim,andy.seo.three-dimensionalsoundreproducingapparatusformultiplelistenersandmethodthereof,jun.2003,uspatent6,574,339

[21]v.kučera.analysisanddesignofdiscretelinearcontrolsystems.academia,prague,1991.

[22]h.kwakernaakandr.sivan.linearoptimalcontrolsystems.wiley,newyork,1972.

[23]h.lahti.dolbysurroundsystemsincars.inaes15thint.conf.:audio,acoustics&smallspaces,copenhagen,denmark,oct.1998.

[24]matsuo,o.stereoprocessingsystem,mar.1990,uspatent4,908,858

[25]d.mooreandj.wakefield.optimizationofthelocalizationperformanceofirregularambisonicdecodersformultipleoff-centerlisteners.presentedataes128thconv.,london,uk.conv.paper8061,may2010.

[26]k.öhrn,a.ahlén,andm.sternad.aprobabilisticapproachtomultivariablerobustfilteringandopen-loopcontrol.ieeetransactionsonautomaticcontrol,40(3):405-418,march1995.

[27]m.l.petroff.digitalsignalprocessingforsymmetricalstereophonicimaginginautomobiles,april2005.uspatent6,876,748.

[28]r.rabensteinands.spors.soundfieldreproduction.inj.benesty,m.m.sondhi,andy.(a.)huang,editors,springerhandbookofspeechprocessing,pages1095-1114.springerberlinheidelberg,2008.

[29]k.sadaie.stereophonicreproductionsystem,july1991.uspatent5,033,092.

[30]m.j.smithers.improvedstereoimaginginautomobiles.presentedataes123thconv.,newyork,ny,usa.conv.paper7223,oct.2007.

[31]m.sternadanda.ahlén.lqcontrollerdesignandself-tuningcontrol.ink.hunt,editor,polynomialmethodsinoptimalcontrolandfiltering,pages56-92.peterperegrinus,london,uk,1993.

[32]m.sternadanda.ahlén.robustfilteringandfeedforwardcontrolbasedonprobabilisticdescriptionsofmodelerrors.automatica,29(3):661-679,1993.

[33]f.b.thigpen.vehicleaudiosystemwithdirectionalsoundandreflectedaudioimagingforcreatingapersonalsoundstage,mar.2008.uspatent7,343,020.

[34]f.e.toole.soundreproduction.focalpress,2008.

[35]d.griesinger.spatialimpressionandenvelopmentinsmallrooms.presentedataes103rdconv.,newyork,ny,usa.preprint4638,sep.1997。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1