用于驱动扬声器阵列的波场合成装置和方法

文档序号:7606700阅读:181来源:国知局
专利名称:用于驱动扬声器阵列的波场合成装置和方法
技术领域
本发明涉及一种波场合成系统,特别是用于避免由于扬声器阵列中扬声器数量有限而导致的人为后果。
在娱乐电子产品领域中,人们对新科技和创新产品的需求不断增长。对于新的多媒体系统的成功而言,提供最佳的功能或性能是一个重要的先决条件。这可以通过数字技术,特别是计算机技术的应用来实现,例如提供增强型逼真视听效果的应用。在先前的音频系统中,一个重要缺点在于立体音频再现的质量,不管是在自然环境下还是在虚拟环境下。
音频信号的多通道扬声器再现方法早已为人们熟知,并且已标准化多年,但所有常用的技术都具有使传输格式受扬声器的位置和收听者的方位制约的缺陷。当扬声器相对于收听者错误排列时,音频质量将受到严重的影响。最佳的声音只能出现在再现空间的很小的一个区域内,也就是所谓的“最佳听音位置(sweet spot)”。
借助于新科技,在音频再现过程中可以得到更佳的自然立体效果和更棒的环绕或包络。这一新技术,即所谓的波场合成(WFS)的原理在Delft理工大学已经进行了研究,并在上世纪八十年代第一次发表(Berkout,A.J.;de Vries,D.;Vogel,P.Acoustic control by Wavefield Synthesis(利用波场合成的音响控制),JASA 93,933)。
由于这一方法对计算机性能和传输速率有很高的要求,到目前为止波场合成技术很少应用于实践中。只有微处理技术和音频编码技术的发展使得在具体的应用中采用这项技术成为可能。该专业领域的第一代产品将于明年问世,在以后的几年里,消费者领域的第一代波场合成应用也将出现在市场上。
WFS的基本原理在于惠更斯波理论原理的应用波面上所有的点都是以球面的或者圆形的方式传播的初级波面的开始点。
应用于声学领域中,通过彼此并排放置的大量扬声器(即所谓的扬声器阵列),每个任意形状的来波阵面可以被复制。在最简单的情况下,需要再现的单点源和线性排列的扬声器,必须向每个扬声器的音频信号提供一个时延和振幅缩放比例,使得每个扬声器的发射声场准确地重叠。通过多个声源,对于每个声源,单独计算每个扬声器的贡献,并加上结果信号。如果要被复制的声源位于有反射墙的房间内,那么通过扬声器阵列,反射也将被复制为额外的声源。因此,计算量的开销主要决定于声源的数目、录音室的反射特性和扬声器的数量。
特别地,这一技术的优势在于使得自然立体声效果能够覆盖再现空间的较大区域。与已知的技术相比,声源的方向和距离能够以很精确的方式被复制。在有限的程度内,一个虚拟的声源可以出现在真实的扬声器和收听者之间。
虽然对于属性已知的环境而言,波场合成技术工作得很好,但是如果属性改变或者波场合成是在与真实环境属性不匹配的环境属性下工作的话,例外将会发生。
然而,波场合成技术也可以有意地应用于通过相应的立体听觉的感知来补充视觉的感知。先前,在虚拟演播室进行制作时,虚拟场景的可信视觉效果的传输工具位于前台。与图像匹配的声音效果往往通过在随后所谓的后期制作中的人工步骤对音频信号产生影响,或者在实现时被归类为过于昂贵和耗时,因此被忽略。因此,总会在各人的感觉之间产生矛盾,从而导致感觉设计空间、也就是设计场景的真实性较差。
在技术出版物“Subjective experiments on the effects ofcombining spatialized audio and 2D video projection in audio-visualsystems(音频-视频系统中关于空间化音频与二维视频投影组合效果的主观试验)”,W.de Bruijn和M.Boone,AES会议文件5582,2002年5月10日至13日,慕尼黑,阐述了视听系统中关于空间化音频与二维视频投影组合效果的主观试验。特别地,其中强调了两个站在与摄像机保持不同距离处、并且几乎站在各自身后的说话者能被一个观察者更好地理解,如果这两个站在各自身后说话的人能够被看到,并利用波场合成技术将他们重建为不同的虚拟声源的话。在这种情况下,通过主观测试表明,收听者能够更好地理解和区分两个说话者,尽管他们在同时进行交谈。
2001年9月24日到27日,在Ilmenau召开的第46届国际科学讨论会上,名为“Automatisierte Anpassung der Akustik an virtuelleRume(对虚拟空间中音响的自动匹配)”,U.Reiter,F.Melchior和C.Seidel的论文中提出了一种自动语音后期制作处理的方案。为此,对可视化所需的电影拍摄参数,例如房间的大小、表面的纹理或者摄像机位置和演员的方位,进行检测,以确定其声学相关度,因此产生相应的控制数据。随后,这以自动的方式对效果和后期制作方法产生影响如根据与摄像机的距离来改变说话者的音量,或者根据房间的大小和墙面的纹理来改变回响时间,这是为了达到提高虚拟场景的视觉效果以加强真实感的目的。
可以实现“用摄像机的耳朵来聆听”,以使场景更为逼真。这里,在画面中的声音事件方位和环绕场中的接听事件方位之间力求得到尽可能高的相关性。这意味着,希望声源位置总是能够与画面相适应。摄像机参数,如缩放,也被考虑进声效的设计中,就像左右两个扬声器的位置被考虑一样。为此,虚拟演播室的跟踪数据与所伴随的时间代码一起由系统写入到一个文件中。同时,画面、声音和时间代码被记录在一个MAZ中。这个camdump文件被传送到一台计算机,在那里为音频工作站生成控制数据,并同步地通过MIDI界面将它输出到源于MAZ的画面。真实的音频处理,如环绕场中声源的定位和插入早期反射与回响,在音频工作站中进行。该信号被发送给5.1环绕扬声器系统。
摄像机跟踪参数,就像抓取设置中的声源位置一样,可以被记录在真实的电影拍摄中。这些数据也可以在虚拟演播室中产生。
在一个虚拟演播室中,一个演员或节目主持人独自站在录音室。特别地,他或她站在一堵蓝色的墙前面,也可称为蓝盒子或者蓝板。在这个蓝墙上涂有蓝色和淡蓝色的带状图案。这个图案值得一提的地方在于这些带状图案具有不同的宽度,因此能得到许多带状组合的结果。由于蓝墙上唯一的带状组合,在后期制作过程中,当蓝墙被一个虚拟背景代替的时候,可以准确地确定摄像机正朝向哪个方向。借助这一信息,计算机可以确定当前摄像机观察角度的背景。此外,检测并输出额外摄像机参数的摄像机的传感器被分析。通过传感器所检测的典型摄像机参数包括三度转换x、y、z,三度旋转,也称为滚动、倾斜、摇镜头、以及焦距或缩放,这与摄像机的光圈角信息是一个意思。
为了可以不用图像识别和昂贵的传感器技术来确定摄像机准确的位置,也可以采用跟踪系统,它包含多个红外线摄像机来确定安装在摄像机上的红外线传感器的方位,因此也能确定摄像机的方位。利用传感器技术提供的摄像机参数和由图像识别技术所分析的带状信息,实时计算机可以为当前画面计算出其背景。于是,蓝色背景的蓝色调从画面中去除,因此显示出虚拟背景而不是蓝色背景。
在大多数情况下,往往伴随着这样一个概念,其中全部都涉及如何得到虚拟成像场景的整体声效,这可以用来自图像设计中的“全景”一词加以描述。在一个场景的所有镜头中“全景”声效几乎保持不变,即使观察事物的视角不断地改变。因此,视觉细节通过相应的镜头被突出出来,或者被放置到背景中。电影对话设计中的计数器镜头也不再重新配音。
因此,需要在听觉上将观察者置于视听场景中。这里,屏幕或者图像域形成观察方向和观察者的观察角度,这意味着声音以其总是与场景图像相匹配的方式追踪图像。特别地,对于虚拟演播室这将变得更为重要,因为例如在说话的声音和主持人当前所处环境之间没有典型的相关性。为了得到场景的整体视听效果,需要模拟与所提供的图像相配的立体效果。例如当一个电影观众意识到声源的方位时,声源的方位将成为此声音概念中的实质主观属性。
在音频领域,通过波场合成技术(WFS)的应用,能得到优质的大范围听众区域的立体声。如前所述,波场合成是基于惠更斯原理,根据该原理,波阵面可以由基本波(elementary waves)的重迭来形成和构建。根据数学上精确的理论描述,需要用无限小的距离内的无限数目的源来生成基本波。但实际上采用的是相互间隔有限的、狭小的距离的有限数量的扬声器。每个扬声器用一个来自虚拟源的、根据WFS原理具有一定迟延和一定水平的音频信号加以控制。对于所有的扬声器来说,水平和迟延通常是不同的。
如前所述,波场合成系统基于惠更斯原理工作,并重建一个给定的波形,例如通过各个波的多样性,重建与演播区域或者与位于演播区域中的听众保持一定距离的虚拟源的波形。这样,波场合成算法得到扬声器阵列中各个扬声器真实的位置的信息,然后为每个扬声器计算该扬声器最后发出的分量信号,使得该扬声器信号与其他正在工作的扬声器的扬声器信号之间的重迭实现重建,其中听众感到他或她不是被许多独立的扬声器“用声音照耀着”,而是感到在虚拟源位置只有一个扬声器。
对于波场合成设置中的多个虚拟源,每个扬声器虚拟源的贡献,即第一扬声器的第一虚拟源的分量信号、第一扬声器的第二虚拟源的分量信号等等,都被计算,并将这些分量信号相加,最后得到真实的扬声器信号。例如在三个虚拟源的情况下,在听众位置处的所有工作的扬声器的扬声器信号的重迭会导致该听众没有觉得他或她被一个大型的扬声器阵列用声音照耀着,而是他或她所听到的声音仅仅来自位于特定位置的三个声音源,这些位置与虚拟源一致。
实际上,为了得到虚拟源的延迟和/或缩放的音频信号,分量信号的计算通常由音频信号来启动,该音频信号与在某一时刻出现迟延和缩放因数的虚拟源相关联,此因素由虚拟源的位置和扬声器的位置来决定。其中,当只有一个虚拟源的时候,虚拟源的音频信号就代表扬声器信号,或者在为扬声器添加来自其他虚拟源的其他分量信号之后,该音频信号对所考虑的扬声器的扬声器信号做出贡献。
典型的波场合成算法的运算与扬声器阵列中有多少个扬声器无关,波场合成的理论在于每个任意声场可以通过无限数量的独立扬声器准确地重建,这些独立的扬声器彼此无限接近地放置。但实际上无限的数量和无限接近地放置都是难以实现的。相反,只有有限数目的扬声器,它们以相互之间保持一定距离的方式放置。这样,在真实的系统中,如果存在虚拟源,即它是一个真实的源,则只能得到一个近似于实际波形的波形。
此外,例如当考虑到电影院时,在不同的场景中,扬声器阵列只被放置在电影屏幕的边上。在这种情况下,波场合成模块为这些扬声器产生扬声器信号,其中这些扬声器的扬声器信号通常与扬声器阵列中相应扬声器的信号相同。扬声器阵列不仅仅在电影院的边上延伸,例如扬声器阵列排列在屏幕上方,而且它也被安排在视听室的左侧、右侧和后方。这种“360度”的扬声器阵列与例如位于观众前面的、只有一边的扬声器阵列相比,肯定会提供一个更接近精确的波场。然而,位于观众前面的扬声器的信号在上述两种情况下都一样。这意味着波场合成模块通常不能得到关于有多少扬声器阵列、扬声器阵列是单边的、多边的还是360度的反馈。换句话说,波场合成装置根据扬声器的位置、以及与其他扬声器是否无关地来计算扬声器信号。
随后,在图9的基础上,它涉及一个人为结果问题,即虚拟源900何时出现在由环绕放置在室内的扬声器阵列904所限定的收听室902中,在如图9所示的实施例中,扬声器阵列包括阵列组904a,904b,904c和904d。
通过图9中未示出的计算装置,为扬声器子阵列904a,904b,904c,904d(其中之一示例性地被标注为906)中的扬声器产生驱动信号。为了重建虚拟源900,如图9所示,该虚拟源被假想为画面中以点状方式发射的源,为各个扬声器904提供驱动信号,使得由该扬声器发出的声音信号或波阵面汇聚在虚拟源900的虚拟位置。当然,每个扬声器904首先在其主发射方向上发出声音信号,即典型地垂直于扬声器膜片。但是,由于每个扬声器的声音信号相互重迭(这种重迭是基于波场合成原理由驱动信号所导致的),波阵面汇聚在虚拟源900的虚拟位置,用从每个扬声器发出的虚线(例如910)来表示。和所有其他扬声器一样,发出虚线910的扬声器产生一个扬声器信号,该信号以下述方式移动到虚拟源与虚线910相关的实线,它在图9中带有箭头、并被标注为912,代表虚拟源的有用信号。
然后,朝着虚拟源900移动的波阵面由另外一个虚线914来表示,这个虚线914产生虚拟源900的有用信号916,它用带有箭头的实线916来表示。这意味着原则上在视听室里两个波场相互重叠。如图9所示的实施例中,一个波场是用于描述扬声器信号汇聚在虚拟源900的位置上的所有虚线。另一方面,“有用”波场用图9中带有箭头的实线(例如912,916)来表示。由于这两个波场(即“生成波场”和“有用波场”)相重迭,人为后果在整个视听室902内发展。这些人为后果是由系统所导致的,因为虚拟源900位于阵列中,而且并没有带有点射特征的扬声器设置在虚拟源的位置上。
换句话说,为了生成有用信号,扬声器子阵列904a的信号以及来自扬声器阵列904b和904d的至少下部的扬声器信号在虚拟源900的一边上生成,在图9中这个边上标有实线916。而另一方面,为了在标有实线912的虚拟源的边上产生虚拟源900的信号作为有用信号,应当生成来自通常位于虚拟源上方的扬声器子阵列904c以及来自扬声器阵列904d,904b的至少一部分的波阵面。通过这样的方式,如前所述,人为后果在整个视听室902内发展,因为收听者不仅能听到图9中用虚线所示的生成波场,同时也能收听到图9中用实线所示的有用波场。
但实际上收听者只是希望听到有用波场,即由带有箭头的实线表示的波场,而对图9中用虚线表示的生成波场没有兴趣。但是如前所述,由于收听者听到了两个波场,产生了不想要的人为后果。
本发明的目的在于提供波场合成概念,至少是减少了人为后果。
这个目标通过权利要求1的波场合成装置、权利要求15的驱动扬声器阵列的方法、或者权利要求16的计算机程序来实现。
本发明基于以下发现即由于“生成波场”而导致的人为后果(如参考图9所述)的缩少或消除是通过只进行虚拟源的波场部分重建而实现的,不是通过扬声器阵列中所有提供了驱动信号分量的扬声器,而是首先在虚拟源位置的基础上确定扬声器阵列中的相关扬声器,然后被确定为相关的扬声器的驱动信号分量基于虚拟源的音频信号被计算出来,其中只是对相关扬声器提供计算出的驱动信号分量,而不相关的扬声器不提供驱动信号分量,因为该音频信号与虚拟源有关。
通过这种方式,只有虚拟源有用波场的一部分被重建,其中需要被重建的部分波场可以被任意确定。特别地,根据本发明,根据特定收听者的位置,扬声器的发声受到了抑制,这些扬声器相对于收听者和虚拟源的位置来排列,使收听者的位置在虚拟源和扬声器之间。
这些扬声器(就它们的情况而言)是不相关的扬声器,因此也没有被控制以抑制在收听者所在的部分房间内生成波场,因此收听者在他所处的位置只是感受到虚拟源的有用波场,并获得消除了人为后果的听觉享受。
但是,这导致在虚拟源的相对一边,也就是在虚拟源的一边,在相关扬声器所处的地方只存在生成波场,而有用波场在那里不出现。因此收听者将在这一边获得明显减弱的听觉享受,因为这里只存在生成波场,而不存在相对于虚拟源的有用波场。
但是,由于通常多个虚拟源会出现在多个不同的位置,事实上虚拟源并不位于视听室的中央,而是在四周,所以视听室的“不良”一边,即视听室中用来确定相对于虚拟源的相关性的所限定的收听者位置的相对一边的区域,此区域的收听效果的降低并不很严重,因此对于整个视听室或多数收听者的整体收益来说,这种质量上的损失是可以接受的。
换句话说,用于基于虚拟源位置和所限定的扬声器位置来确定扬声器阵列中相关扬声器的装置可操作用来减弱由于“生成波场”的扬声器信号所引起的人为后果,该扬声器信号的移动方向与从虚拟源移动到所限定的收听者位置的方位相反。
在本发明的一个优选实施例中,对于位于视听室外面的源,所有扬声器都被确定为与虚拟源不相关,其中它们的主发射方向和从虚拟源通过该扬声器的方向之间的夹角大于90度。这意味着,从虚拟源到该扬声器的矢量不包含与扬声器得主发射方向平行的方向分量。如果是这种情况,则该扬声器被确定为不相关,因为该扬声器不能对从虚拟源扩展到收听者位置扩展的波场重建做出贡献,反之亦然。
在这一点上,应当指出的是,由于以上原因,考虑到扬声器的出于某种原因呈半圆形的发射场,扬声器的主发射方向位于该半圆形场中,即该场位于扬声器的前面。潜在的向后的附带发射并没有加以考虑,如果这个“向后”的附带发射含有方向分量,这将被忽视,因此在确定扬声器时并不重要。
在本发明的一个优选实施例中,其中一个直线阵列被用作扬声器阵列,通过它在视听室中产生所谓的接收线,理论上视听室可以采用任意的形式,如Edwin N.G.Verherjen于1998年发表的标题为“Sound Preproduction by Wave Field Synthesis(利用波场合成进行声音再现)”的博士论文所述,视听室基于接收线被分为两个房间,这样的波场重建是最优的。与所述接收线平行、并经过虚拟位置的线将视听室划分成第一和第二两个半个房间。在收听者所处的半个房间内,由于虚拟源位于这半个房间内,为了使生成波场不活动,所有扬声器都被确定为不相关,这样可以获得一个较好的音频效果。然而在另外半个房间内,所有扬声器都被确定为相关,从而产生在收听者所在的半个房间内获得良好音频效果所需的虚拟源的有用波场。
上述考虑涉及虚拟位置位于视听室内的虚拟源,但是假如虚拟源位于视听室以外的虚拟位置,最好将所有超过接收线的扬声器确定为不相关的扬声器。同时,在本发明的一个优选实施例中,如果扬声器坐标轴(即主发射方向)和一方面通过虚拟源、另一方面通过所考虑的扬声器的线之间的夹角不大于90度,则这样的扬声器被确定为非相关,从而再次消除位于房间外的虚拟源分量的生成波场,使其远离视听室,使得只有虚拟源的有用波场出现在视听室内。换句话说,在与从虚拟源到收听者位置的方向相反的方向上发出扬声器信号的扬声器再次不工作。
下面将参考附图描述本发明的优选实施例,其中

图1是本发明所述波场合成装置的电路框图;图2是波场合成环境的基本电路图;图3是图2所示波场合成环境的更详细的示意图;图4是对虚拟源位于视听室外的情况的示意图,以此来对虚拟源的相关扬声器和非相关扬声器进行特征描述;图5是虚拟源与扬声器坐标轴之间夹角关系的示意图;图6是虚拟源位于视听室内的情况的示意图;图7是虚拟源位于视听室内的情况的更详细的示意图;图8是带有波场合成模块以及位于演播区域内的扬声器阵列的波场合成系统的原理电路框图;以及图9是解释以点状方式发射的虚拟源的波场重建的原理图。
图1示出了本发明所述的波场合成装置的电路框图,该波场合成装置利用驱动信号来驱动扬声器阵列。如将要基于图8所解释的,这些扬声器被放置在视听室的不同位置处,正如波场合成领域所公知的。扬声器的驱动信号一方面基于与具有相对于扬声器阵列的虚拟位置的虚拟源相联系的音频信号,另一方面基于由该驱动信号所要驱动的扬声器的限定位置。
在这一点上,应当指出的是,在一个波场合成设置中通常会有放置在多个不同的虚拟位置的多个虚拟源。这种情况下,波场合成装置用来为每个虚拟源计算扬声器的驱动信号分量,其中将所考虑的扬声器的基于多个不同的虚拟源所计算出的驱动信号分量相加,以最后得到该扬声器的驱动信号,因此多个不同的虚拟源或者与多个虚拟源相关联的音频信号进入这个扬声器。
如图1所示的本发明所述波场合成装置包括用于确定扬声器阵列中相关扬声器的装置10,装置10基于通过第一输入端12馈入的虚拟源的虚拟位置进行确定。此外,用于确定的装置10基于通过如图1中的原理电路框图所示的另一输入端14馈入的当前所考虑的扬声器的位置来工作。需要指出的是,扬声器阵列中的扬声器位置通常是固定地给定的,并例如以表格的形式存储在装置10中,即并不需要通过它们自身的输入端14来馈入。最后,用于确定相关扬声器的装置10基于收听者的位置来工作,该位置通过另一输入端16馈入。在此还应当指出的是,在一个优选实施例中,收听者的位置,或者以不产生人为后果的方式服务的收听者所处的半个房间,每次都不变,而且也可以通过固定的方式被调整。根据这个实施例,收听者的位置或者多个收听者的位置,即生成波场不活动的地方,可以不断地改变或者固定地给出。
如随后解释的,最好基于接收线(其中接收线也最好穿过视听室的中央),一方面确定每个虚拟源的所限定的收听者位置,另一方面确定每个虚拟源的每个位置,这样收听者位置输入端16可以用来确定扬声器阵列中的相关扬声器。
由于扬声器输出的扬声器信号的运动方向与从虚拟源到收听者位置的方向相反,装置10用来减少或者消除人为后果。对于这一点,需要指出的是,在本发明的一个实施例中,不仅在与从虚拟源到收听者位置的方向相反的方向上发出扬声器信号的扬声器是不工作的,而且发射方向具有与从虚拟源到收听者位置的方向相反的方向分量的扬声器,或者只含有一个垂直于从虚拟源到收听者位置的方向的分量的扬声器都被确定为不相关。
装置10用来识别相关扬声器,并通过为相关扬声器计算驱动信号分量的装置20的输出端18来传递该信息。装置20是通用的波场合成模块,它基于波场合成技术来计算扬声器的驱动信号分量,其中扬声器驱动信号分量在迟延和缩放方面(即衰减/放大)相互不同。但是其中除了延迟和缩放外,在一个驱动信号分量中采样的结果与虚拟源中的结果相同,即与和虚拟源相联系的音频信号相等。
用于计算的装置20用来在输出端22输出相关扬声器的驱动信号分量,并将它们传输到装置24。装置24将一个虚拟源的驱动信号分量提供给相关扬声器,而没有将该虚拟源的驱动信号分量传递给不相关的扬声器,从而在所限定的收听者所处的视听室的区域内抑制“生成波场”,如基于图9所述。
随后参照图2和图3,总体上涉及了波场合成模块的通用功能性或者扬声器的驱动信号的计算,即基于驱动信号分量或者分量信号来计算扬声器信号。然而,首先基于图8来阐述通用的整体环境的波场合成。
在更具体地描述本发明之前,将基于图8来阐述波场合成系统的原理结构。波场合成系统包括一个扬声器阵列800,它相对于演播区域802被放置。特别地,如图8所示的360度的扬声器阵列包括四个阵列边800a,800b,800c和800d。如果演播区域802例如是个电影院,考虑前/后或者左/右,我们假设电影屏幕位于演播区域802的同一边,部分阵列800c放置其上。在这种情况下,坐在演播区域802中的所谓最优点P处的观众将向前看,也就是面对屏幕。在观众后面,是部分阵列800a,部分阵列800d在观众左边,而部分阵列800b在右边。每个扬声器阵列由许多不同的扬声器组成,每个扬声器阵列由多个不同的单个扬声器808,这些扬声器中的每一个通过只在图8中示出的数据总线812从波场合成模块810提供的其自身的扬声器信号来控制。波场合成模块利用例如关于各个扬声器的型号和各个扬声器相对于演播区域802的位置等信息(即扬声器信息(LS info))来进行计算,并且如果需要的话,还通过其他输入来计算各个扬声器的808的扬声器信号,这些扬声器信号根据已知波场合成算法从与位置信息相关联的虚拟源的音轨中导出。波场合成模块也可以得到其他的输入,如演播区域的室内音响效果等信息。
随后对本发明的阐述在原理上可以在演播区域中的每个点P来进行。最优点可位于演播区域802中的任意位置,也可以有多个最优点,例如位于最优线上。然而,为了在演播区域802内得到尽可能多的点的最理想状态,最好假设最优点或者最优线位于由扬声器部分阵列800a,800b,800c,800d所限定的波场合成系统重心的中央或者中心。
下面基于图2和图3,参考图2中的波场合成模块200或者图3中详细描述的排列方式详细阐述波场合成模块800。
图2示出了本发明实现的波场合成环境,波场合成环境中央是一个波场合成模块200,其包括输入端202、204、206和208,以及输出端210、212、214、216。通过输入端202至204,不同虚拟源的输出信号被馈送给波场合成模块。通过这种方式,输入端202例如接收虚拟源1的音频信号、以及与之相关联的虚拟源的位置信息。在一个电影院系统中,例如,音频信号1是一个演员从屏幕左侧移动到屏幕右侧的声音,这个声音可能远离观众或者向着观众而来。音频信号1是这个演员的真实的声音,而位置信息表示捕获设置中,在当前的特定时刻第一个演员的位置,其作为时间的函数。另一方面,音频信号n例如是另一个演员以和第一个演员相同或者不同的方式移动的声音。通过与音频信号n同步的位置信息,与音频信号n相关联的所述另一个演员的当前位置被报告给波场合成模块200。实际上,多个不同的虚拟源的存在取决于捕获设置,其中每个虚拟源的音频信号作为它自身的音轨馈送给波场合成模块200。
如上面所述,波场合成模块通过经由输出端210至216向各个扬声器输出扬声器信号,为多个扬声器LS1,LS2,LS3,LSm提供信号。在再现情景中,如电影院,各个扬声器的位置通过输入206报告给波场合成模块200。在电影院,有多个单独的扬声器排列在阵列中,环绕着观众成组设置,使得这些扬声器不但位于观众的前面(即例如在屏幕的后面),而且还位于观众后面,以及观众的左边和右边。此外,其他输入也可报告给波场合成模块200,如房间音响效果等信息,这样在电影院捕获场景时可以模仿真实的房间音响效果。
大体上,例如通过输出210馈送给扬声器LS1的扬声器信号会与虚拟源的分量信号重迭,从而使扬声器LS1的扬声器信号包含返回虚拟源1的第一分量,返回虚拟源2的第二分量,以及返回虚拟源n的第n分量。各个分量信号线性重迭,即在其计算之后被相加,从而在收听者耳边复制线性重迭,这样收听者将在真实场景中听到可被他或她所感知的声源线性重迭。
然后,参考图3阐述波场合成模块200的一个更为详细的实施例。波场合成模块200具有很强的并行结构,从每个虚拟源的音频信号和相应虚拟源位置信息开始,首先计算延迟信息Vi和缩放因数SFi,它们取决于位置信息和所考虑的扬声器的位置,例如序列数为j的扬声器,即扬声器LSj。由于虚拟源的位置信息和所考虑的扬声器j的位置,延迟信息Vi和缩放因数SFi的计算通过在装置300、302、304、306中所执行的已知算法来完成。基于延迟信息Vi(t)和SFi(t)、以及与各个虚拟源相关联的音频信号ASi(t),为当前时刻tA计算最后得到的扬声器信号中分量信号Kij的具体值AWi(tA)。这由装置310、312、314、316来完成,如图3中简要示出的。图3还示出了在时刻tA各个分量信号的“闪光拍摄(flash shot)”。然后通过累加器320对各个分量信号进行累加,以确定当前时刻tA扬声器j的扬声器信号的具体值,然后将其馈送给扬声器以进行输出(例如,如果扬声器j是扬声器LS3,则输出214)。
从图3可以看到,对于每个虚拟源,首先由于迟延和带有当前时刻缩放系数的缩放,分别计算有效值,此后由于多个不同的虚拟源而对所有扬声器分量信号进行累加。例如,如果只有一个虚拟源,则累加器将被忽略,如果虚拟源1是唯一的虚拟源,则图3中累加器输出端处的信号例如对应于装置310输出的信号。
在此应当指出的是,在图3的输出端322处得到扬声器信号的输出,由于设置了多个不同的虚拟源1,2,3,...,n,该输出是扬声器分量信号的叠加。如图3所示,原则上可以在波场合成模块810中为每个扬声器808提供一种排列方式,除非总是有2个、4个或8个相邻的扬声器由同一个扬声器信号来控制,这对于实践来说是优选的。
在本发明的一个优选实施例中,区分了虚拟源是位于视听室里面还是外面,虚拟源位于视听室里面的情况基于图4来描述,而虚拟源位于视听室里面的情况基于图6来说明。
在图4中描述了视听室902,其中虚拟源900位于视听室外面。此外,在图4中示出了接收线400,它被设计为使得最优波合成在该接收线上发生。在本发明的一个优选实施例中,为每个虚拟源单独计算接收线400,接收线400被如此限定使得它通过视听室的中央402并垂直于从虚拟源900延伸到视听室中央402的直线404。接收线400形成了位于接收线400朝向虚拟源900一侧上的相关扬声器与位于接收线另一侧上的非相关扬声器之间的分界。将位于接收线400上方的扬声器确定为相关扬声器(最好考虑室外虚拟源的90度标准,这将在后面谈及)保证了至少扬声器子阵列904a中的所有扬声器都没有施加驱动信号分量,所述扬声器子阵列904a发出的扬声器信号具有平行于直线404但与从虚拟源900到视听室中央的方向相反的分量。由于虚拟源位于图4所示的位置,因此实现了人为后果减少甚至消除的再现,例如当收听者位于接收线上,特别是位于作为所限定的收听者位置的视听室中央时,收听者会感觉声音来自虚拟源900的方向,而不是“来自后面”,就像位于所限定的收听者位置402处的收听者朝虚拟源900的方向看去那样。因此,尽管收听者看到虚拟源位于他或她的前面,但却感到波阵面从他或她的背后传播到他或她的前面,这就是人为后果。
此外,应当指出的是,对于所有位于接收线上方的扬声器,也就是位于接收线400背对虚拟源900一侧上的扬声器,普通波场合成形式的应用对于计算缩放来存在着问题。
此外,对于位于室外的源,最好只是将扬声器坐标轴500与从虚拟源900到该扬声器的直线之间的夹角不超过90度的扬声器确定为相关扬声器,因为这个扬声器不会为虚拟源900提供消除人为后果的贡献,如基于图5所示。如图5所示,最好只是将夹角α小于或等于90度的扬声器确定为相关扬声器。
随后,基于图6来描述虚拟源900位于视听室内部的情况。在此,图6所示的情况与图9所述的常见问题很相似。由于与图9相似,在图6中“生成波场”也是用虚线来表示,而“有用波场”用带有箭头的实线来说明。此外,在图6中,视听室的中央402也被绘制成所限定的收听者位置的一个示例。另外,较低的扬声器子阵列904a中的扬声器被描述成产生人为后果的扬声器。特别地,在图6所示的例子中,视听室例如通过分割线600划分成不产生人为后果的区域600a(其中根据本发明所述的对相关扬声器的确定只有有用波场)和具有人为后果的区域600b(其中只有生成波场,其中由于虚拟源的产生人为后果的扬声器的不工作,因此没有虚拟源900的有用波场,而只有与有用波场的方向相反的生成波场)。
在图6所示的虚拟源900位于视听室902内部的情况下,如图5所述的90度分界线并不存在,因为原则上所有扬声器都能提供贡献。
根据本发明,由于以相应方向传播波场的人为后果,收听者不会位于扬声器和虚拟源之间,因此不会听到“生成”波场,这随着相关扬声器的确定而继续进行,如后面基于图7所描述的。另外,接收线400用来将相关扬声器和非相关扬声器区分开来。特别地,如基于图4已经描述的,它最好被如此放置,使得它穿过视听室的中央402或波场合成扬声器阵列的中央。此外,从虚拟源900到中央402的直线404,它例如是所限定的收听者位置,构建形成一个平行于接收线400、但穿过虚拟源900的虚拟位置的分割线600,如图7所示。这样,视听室再一次被分割为不产生人为后果的区域600a和具有人为后果的区域600b,其中不产生人为后果的区域600a是相对于分割线600的、所限定的收听者位置402所处的视听室区域,而具有人为后果的区域600b是收听者不在的视听室区域。
在图7所示的实施例中,限定分割线600、进而限定相关扬声器和非相关扬声器的基础在于确定波场合成接收线,这可以相对自由地发生。如已经描述的,没有幅度误差的线是接收线,由于扬声器阵列不是完整的三维形式,因此在接收线的前面和后面会出现因系统原因而导致的细微误差。
此外,在图7所示的实施例中,阵列中央被选为收听者位置,特别是接收线从这里穿过,至少在视听室中央不存在幅度误差。而且接收线最好是直线,虽然如前面所述任意形状的接收线都是允许的。
此外,分割线600最好垂直于从虚拟源到中央402的直线404,这样由于简化了几何条件,使得波场合成计算的可能性能够执行得更为有效。
此外,最好选择与接收线平行、且穿过虚拟源的线,而不是穿过阵列中央的线,作为对相关扬声器的限制。
如已经阐述的,最好判断虚拟源的每个新位置处扬声器的情况,即对相关扬声器和非相关扬声器进行区分,从而在视听室的最大范围内获得最佳的减少了人为后果的状态。但是这将导致在虚拟源移动时,由于相关和非相关扬声器之间边界的改变,使得扬声器打开或关闭。由于减少了潜在的轻微噼啪噪音的发生,特别是在从视听室中的虚拟源发生移动并且在正弦音频信号的情况下,如果在前一时刻一个扬声器还没有成为相关扬声器,但由于移动的虚拟源将变为相关扬声器,最好“轻柔地(softly)”打开这个“新的”相关扬声器。
换句话说,新认定为相关的扬声器的水平缓慢地提升至它的标称水平。标称水平这里是指根据常规波场合成理论计算驱动信号分量所确定的水平或者缩放比例。这样,确保了不会发生水平跳变,例如特别是当源位于视听室的内部时,位置发生明显改变,因此从一个时刻到下一个时刻,由于在前一时刻还没有出现虚拟源,扬声器将突然具有强烈的信号分量。
与应用相关地,在一段时间内,例如10个时刻,也即10个音频信号时间采样,发生“软”接通,它是从扬声器接通时刻的零水平(即将扬声器确定为相关扬声器的时刻)到波场合成计算所导致的标称水平。
“接通时间段”的具体选择,即如上所述的是10个时刻或者只有两个时刻,甚至20个时刻,特别取决于具体的应用,因为其他波场合成的需要也要考虑,即尽管虚拟源的整体水平应当正确。虚拟源的定位也不能不加以考虑,因为由于虚拟源的因素,它对于驱动信号分量水平的影响表现得很强烈。
在这一点上,需要指出的是,本发明所述处理将导致非相关扬声器的驱动信号分量,如上所述,所述驱动信号分量没有提供给扬声器,但可以由波场合成单元进行计算,将导致来自虚拟源的音频信号的整体上感知到的减少水平进一步显露出来。这个问题通过提升相关扬声器的驱动信号分量得以抵消,从而再次在收听者的“耳边”以某种方式完全地获得虚拟源的一定目标水平。在这一点上,最好从这一水平提高中,排除接通过程中的(即例如在10个连续的时刻期间内还没有相关的)扬声器的驱动信号分量,一方面使得对于这个虚拟源水平没有感知到水平变化,另一方面“软”接通不会造成危险。
对于软接通,需要指出的是,当前处于接通过程中的扬声器的驱动信号分量的振幅可在预定数目的时刻内以台阶状、线性、正弦曲线或者其他方式单调地增加,这取决于现有的计算资源和所希望的应用。
根据整体的条件,用驱动信号来驱动扬声器阵列的本发明所述方法可以通过硬件或软件来实现。这种实现可以发生在数字存储介质中,尤其是带有与可编程计算机系统协同工作的电可读控制信号的软盘或CD,以实现本发明的方法。总的来说,本发明还涉及带有存储在机读载体上的程序代码的计算机程序产品,当该计算机程序产品在计算机中执行时,用于实现本发明所述的方法。换句话说,本法明也可以通过带有程序代码的计算机程序来实现,当该计算机程序在计算机上运行时,用于执行所述的驱动扬声器阵列的方法。
权利要求
1.通过驱动信号来驱动扬声器(904)组成的阵列(904a,904b,904c,904d)的波场合成装置,这些扬声器被放置在不同的限定位置,用于一个扬声器的驱动信号是基于一个音频信号,这个音频信号与具有相对于所述扬声器阵列的虚拟位置的虚拟源(900)相关联,并且还基于所限定的该扬声器的位置,包括用于根据虚拟源的位置、预先确定的收听者位置、以及所限定的扬声器位置来确定扬声器阵列中的相关扬声器的装置(10),从而减少了由于与从虚拟源到预先确定的收听者位置的方向相反的方向上移动的扬声器信号所造成的人为后果;用于计算相关扬声器和虚拟源的驱动信号分量的装置(20);以及用于将对应于虚拟源的相关扬声器的驱动信号提供给所述相关扬声器的装置(24),其中虚拟源的驱动信号没有提供给扬声器阵列中不属于相关扬声器的那些扬声器。
2.根据权利要求1所述的装置,其中用于提供的装置(20)用来限定虚拟源的接收线(400),并且对于设置在接收线(400)上的收听者位置,用于确定的装置将响应于为其所提供的虚拟源的驱动信号分量、发射出其运动方向包含至少一个平行于从虚拟源到接收线的方向的方向分量的扬声器信号的扬声器确定为相关扬声器。
3.根据权利要求1或2所述的波场合成装置,其中对于相对于扬声器阵列的收听者位置,用于确定的装置(10)将响应于为其所提供的虚拟源的驱动信号分量、发射出其至少一部分运动方向平行于从虚拟源的虚拟位置到相应扬声器的矢量的扬声器信号的扬声器确定为相关扬声器。
4.根据前面权利要求之一的波场合成装置,其中用于确定的装置(10)用来检测虚拟位置是否位于由扬声器阵列所限定的视听室(902)的外面,其中,在上述检测结果为肯定的情况下,位于虚拟源(900)的虚拟位置和接收线(400)之间的扬声器被确定为相关扬声器。
5.根据前面权利要求之一的波场合成装置,其中用于确定的装置(10)在扬声器的主发射方向(500)与位于虚拟源(900)和该扬声器之间的直线之间确定一个夹角(a),并且只有将那些夹角小于在预定范围内的大约为90度的分界角的扬声器确定为相关扬声器。
6.根据权利要求5所述的波场合成装置,其中所述预定范围为+/-20度。
7.根据权利要求1至3之一的波场合成装置,其中用于确定的装置(10)用来检验虚拟源(900)的虚拟位置是否位于由扬声器阵列所限定的视听室(902)内部,其中,在上述检测结果为肯定的情况下,位于背对着一条参考线(600)一侧的区域内的扬声器被确定为相关扬声器,所述参考线平行于接收线(400)、并且穿过相对于接收线(400)的虚拟源(900)的虚拟位置。
8.根据前面权利要求之一的波场合成装置,其中所述扬声器阵列是线性阵列,并且其中用于计算虚拟源的驱动信号分量的装置(20)用来计算扬声器和虚拟源的驱动信号分量,从而产生一条接收线(400),其中无误差的波场合成可以由接收线上的收听者位置来生成。
9.根据前面权利要求之一的波场合成装置,其中接收线(400)穿过视听室(902)的中央(402)延伸。
10.根据权利要求8或9所述的波场合成装置,其中用于计算的装置(20)用来计算虚拟源和扬声器阵列中扬声器的驱动信号分量,从而产生一条直线作为接收线(400)。
11.根据前面权利要求之一的波场合成装置,其中虚拟源(900)的虚拟位置是可随时间变化的,并且其中用于计算的装置(20)用来计算虚拟源(900)和扬声器的驱动信号分量,从而使得在前一个时刻不相关、而在当前时刻相关的扬声器的驱动信号分量通过相对于标称水平预先确定的衰减程度来进行衰减。
12.根据权利要求11所述的波场合成装置,其中用于计算的装置(20)在预定数目的时刻内逐步减少衰减程度,从最大衰减值减小到等于0的衰减值。
13.根据权利要求12所述的波场合成装置,其中预定的时刻数目大于2并且小于40。
14.根据利要求11至13之一的波场合成装置,其中一个目标水平与虚拟源相关联,并且其中在前一时刻和当前时刻均为相关扬声器的扬声器的虚拟源驱动信号分量水平被放大,以补偿由于考虑到虚拟源的水平而预先确定的衰减程度而产生的衰减。
15.通过驱动信号来驱动扬声器(904)组成的阵列(904a,904b,904c,904d)的方法,这些扬声器被放置在不同的所限定的位置,用于一个扬声器的驱动信号是基于一个音频信号,该音频信号与具有相对于扬声器阵列的虚拟位置的虚拟源(900)相关联,并且还基于所限定的扬声器位置,包括以下步骤根据虚拟源的位置、预先确定的收听者位置、以及所限定的扬声器位置来确定(10)扬声器阵列中的相关扬声器,从而减少了由于与从虚拟源到预先确定的收听者位置的方向相反的方向上移动的扬声器信号所造成的人为结果;为相关扬声器和虚拟源计算(20)驱动信号分量;并且将对应于该虚拟源的相关扬声器的驱动信号分量提供(24)给所述相关扬声器,其中虚拟源的驱动信号没有提供给扬声器阵列中不属于相关扬声器的那些扬声器。
16.具有程序代码的计算机程序,当该程序在计算机上运行时用于实现权利要求15所述的方法。
全文摘要
本发明涉及一种通过驱动信号来驱动扬声器阵列的波场合成装置,其中这些扬声器被放置在不同的所限定的位置。用于一个扬声器的驱动信号是基于一个音频信号,该音频信号与具有相对于扬声器阵列的虚拟位置的虚拟源相关联,并且还基于所限定的扬声器位置。首先根据虚拟源的位置、预先确定的收听者位置、以及所限定的扬声器位置来确定扬声器阵列中的相关扬声器,从而减少了由于与从虚拟源到预先确定的收听者位置的方向相反的方向上移动的扬声器信号所造成的人为后果。一个用于将对应于该虚拟源的相关扬声器的驱动信号分量提供给所述相关扬声器的装置(24)连接在一个用于计算相关扬声器和虚拟源的驱动信号分量的装置(20)的下行方向上,其中虚拟源的驱动信号没有提供给扬声器阵列中不属于相关扬声器的那些扬声器。这样,位于视听室区域内的人为后果由于生成波场而受到了抑制,从而在这个区域内只听到有用波场,而不会受到人为后果影响。
文档编号H04S7/00GK1826838SQ200480017481
公开日2006年8月30日 申请日期2004年5月28日 优先权日2003年6月24日
发明者托玛斯·罗德尔, 托玛斯·斯伯尔, 森达·布里克斯 申请人:弗兰霍菲尔运输应用研究公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1