基于声输入信号提供空间参数的空间音频处理器和方法

文档序号:2832783阅读:301来源:国知局
专利名称:基于声输入信号提供空间参数的空间音频处理器和方法
技术领域
本发明的实施方式创建了一种用于基于声输入信号来提供空间參数的空间音频处理器。本发明的其他实施方式创建了一种用于基于声输入信号来提供空间參数的方法。 本发明的实施方式可涉及例如基于麦克风录音的空间声音的声学分析、參数化描述和再现的领域。
背景技术
空间声音记录目的在于利用多个麦克风捕获声场,使得在再现ー侧,当声像存在于记录位置处时,听众能感知声像。用于空间声音记录的标准方法使用简单立体声麦克风或更复杂的定向麦克风组合,例如,诸如用在立体混响中的B格式麦克风。通常,这些方法被称为同步麦克风技术。可替代地,可应用基于声场的參数再现的方法,该方法被称为參数空间音频处理器。近来,已提出针对空间音频的分析、參数化描述和再现的几种技木。各系统关于參数化描述的类型、所需输入信号的类型、与具体扬声器设置的相关性和无关性等具有独特优势和缺陷。用于空间声音的有效參数化描述的ー个实例由定向音频编码(DirAC)给出(V.Pulkki: Spatial Sound Reproduction with Directional AudioCoding, Journal ofthe AES, Vol. 55,No. 6,2007)。DirAC表示用于空间声音的声学分析和參数化描述(DirAC分析)以及用于其再现(DirAC合成)的方法。DirAC分析采用多个麦克风信号作为输入。以ー个或几个下混音频信号和包括声音方向和扩散度的參数侧信息的形式为多个频率子带提供空间声音的描述。扩散度參数描述了所记录的声场如何扩散。此外,扩散度可被用作对方向估计的可靠性测量。另ー应用由空间音频信号的方向相关处理构成(M. Kallingeret al. :A Spatial Filtering Approach forDirectional Audio Coding, 126th AESConvention, Munich, May 2009)。基于參数化表示,可利用任意扬声器设置来再现空间音频。此外,DirAC分析可被视为參数化编码系统的声学前端,该參数化编码系统的声学前端能够编码、传输和再现多信道空间音频,例如MPEG环绕。空间声场分析的另一方法由所谓的空间音频麦克风(SAM)来表不(C. Faller:Microphone Front-Ends for Spatial Audio Coaers, in Proceedingsof theAES 125th International Convention, San Francisco, Oct. 2008)。SAM 米用同步定向麦克风的信号作为输入。与DirAC类似,SAM连同扩散声音分量的估计一起来确定用于声场的參数化描述的声音DOA (D0A-波达方向)。用于空间音频的记录和分析的參数化技术(诸如DirAC和SAM)依赖于对具体声场參数的估计。因此,这些方法的性能強烈取决于空间隐含參数(诸如声音的波达方向或声场扩散度)的估计性能。一般地,当估计空间隐含參数时,可对声输入信号(例如,对稳定性或者对音调)作出特定假设,以采用用于音频处理的最佳(即,最有效或最准确)算法。传统上,为此可定义单个时间不变信号模型。然而,通常出现的问题是不同音频信号可能表现出极为瞬时的变化,使得描述音频输入的通用的时间不变模型经常不充分。尤其是当考虑用于处理音频的单个时间不变信号模型时,可能发生模型失配,这降低了所应用的算法的性能。本发明的实施方式的目的在于提供用于具有由声输入信号的瞬时变化或瞬时非稳定引起的较低模型失配的声输入信号的空间參数。

发明内容
该目的由根据权利要求I所述的空间音频处理器、根据权利要求14所述的用于基于声输入信号来提供空间參数的方法以及根据权利要求15所述的计算机程序来解決。本发明的实施方式创建了一种用于基于声输入信号来提供空间參数的空间音频处理器。空间音频处理器包括信号特性确定器和可控參数估计器。信号特性确定器被配置为确定声输入信号的信号特性。可控參数估计器被配置为根据可变空间參数计算规则来计算针对声输入信号的空间參数。參数估计器还被配置为根据所确定的信号特性来修改可变空间參数计算规则。本发明的实施方式的思想在于当基于声输入信号的信号特性来修改用于计算空间參数的计算规则时,可创建用于基于声输入信号来提供空间參数的空间音频处理器,该空间音频处理器减小了由声输入信号的瞬时变化引起的模型失配。已发现当确定声输入信号的信号特性时,可减小模型失配,并基于所确定的信号特性来计算用于声输入信号的空间參数。換言之,通过例如在预处理步骤中(在信号特性确定器中)确定声输入信号的特性(信号特性)井随后识别最适合当前情况(当前信号特性)的信号模型(例如,空间參数计算规则或空间參数计算规则的參数),本发明的实施方式可处理由声输入信号的瞬时变化引起的模型失配问题。该信息可被馈送至參数估计器,该參数估计器随后可选择最佳參数估计策略(针对声输入信号的瞬时变化)来计算空间參数。因此,本发明的实施方式的优势在于可实现具有显著减小的模型失配的參数化场描述(空间參数)。声输入信号例如可以是利用ー个或多个麦克风(例如,利用麦克风阵列或者利用B格式麦克风)测量的信号。不同麦克风可具有不同方向性。声输入信号例如可以是例如在时域或频域中(例如,在STFT域中,STFT=短时傅里叶变换)或者换言之,以时间表示或频率表不的声压“P”或特定速度“U”。声输入信号例如可包括在三个不同(例如,正交)方向上的分量(例如,X分量、y分量和z分量)以及全方位分量(例如,w分量)。此外,声输入信号可仅包括三个方向的分量且不包括全方位分量。此外,声输入信号可仅包括全方位分量。此外,声输入信号可包括两个定向分量(例如,X分量和I分量、X分量和z分量、或者y分量和z分量)和全方位分量,或者不包括全方位分量。此外,声输入信号可仅包括一个定向分量(例如,X分量、y分量或z分量)和全方位分量,或者不包括全方位分量。由信号特性确定器根据声输入信号(例如,根据麦克风信号)确定的信号特性例如可以是与时间、频率、空间有关的稳定间隔;双向通话或多个声源的存在性;首调或瞬变的存在性;声输入信号的信噪比;或者类似掌声信号的存在性。类似掌声信号在本文中被定义为包括例如具有不同方向的快速瞬变时间序列的信号。CN 102918588 A



3/24 页由信号特性确定器采集的信息可被用于例如在定向音频编码(DirAC)或空间音频麦克风(SAM)中控制可控參数估计器,例如用于选择最适合当前情况(声输入信号的当前信号特性)的估计器策略或估计器设置(或者換言之,用于修改可变空间參数计算规则)。本发明的实施方式可以类似方式应用于两个系统(空间音频麦克风(SAM)和定向音频编码(DirAC))或者任何其他參数化系统。在下文中,重点将集中于定向音频编码分析。 根据本发明的一些实施方式,可控參数估计器可被配置为计算空间參数,作为包括关于时隙和频率子带的扩散度參数和/或关于时隙和频率子带的波达方向參数的定向音频编码參数,或者作为空间音频麦克风參数。在下文中,定向音频编码和空间音频麦克风被视为对诸如例如波达方向和声音扩散度的空间參数操作的系统声学前端。应当注意,也可将本发明的概念直接应用于其他声学前端。定向音频编码和空间音频麦克风均提供从声输入信号获取的具体(空间)參数来描述空间声音。传统上,当利用声学前端(诸如定向音频编码和空间音频麦克风)来处理空间音频时,针对声输入信号的単一通用模型被定义为使得可获得最佳(或接近最佳)的參数估计器。只要满足通过模型考虑的基本假设,估计器就按需求执行。如前文提及,如果不是该情況,则出现模型失配,这通常导致严重估计误差。该模型失配代表经常性问题,因为声输入信号通常高度随时间变化。


将參照附图来描述根据本发明的实施方式,其中图I示出了根据本发明实施方式的空间音频处理器的示意性框图;图2示出了作为參考实例的定向音频编码器的示意性框图;图3示出了根据本发明又ー实施方式的空间音频处理器的示意性框图;图4示出了根据本发明又ー实施方式的空间音频处理器的示意性框图;图5示出了根据本发明又ー实施方式的空间音频处理器的示意性框图;图6示出了根据本发明又ー实施方式的空间音频处理器的示意性框图;图7a示出了可用于根据本发明实施方式的空间音频处理器的參数估计器的示意性框图;图7b示出了可用于根据本发明实施方式的空间音频处理器的參数估计器的示意性框图;图8示出了根据本发明又ー实施方式的空间音频处理器的示意性框图;图9示出了根据本发明又ー实施方式的空间音频处理器的示意性框图;图10示出了根据本发明又ー实施方式的方法的流程图。
具体实施例方式在利用附图更详细地说明本发明的实施方式之前,应当指出,相同或功能等同的元件提供有相同附图标记,且将省略对这些元件的重复描述。因此,对提供有相同附图标记的元件的描述可相互交換。根据图I的空间音频处理器在下文中,将參照图I来描述空间音频处理器100,图I示出了该空间音频处理器
7的不意性框图。用于基于声输入信号104 (或者基于多个声输入信号104)来提供空间參数102或空间參数估计102的空间音频处理器100包括可控參数估计器106和信号特性确定器108。信号特性确定器108被配置为确定声输入信号104的信号特性110。可控參数估计器106被配置为根据可变空间參数计算规则来计算针对声输入信号104的空间參数102。可控參数估计器106还被配置为根据所确定的信号特性110来修改可变空间參数计算规 则。换言之,根据声输入信号或声输入信号104的特性来控制可控參数估计器106。如上所述,声输入信号104可包括定向分量和/或全方位分量。如已经提及,合适的信号特性HO例如可以是与声输入信号104的时间、频率、空间有关的稳定间隔、声输入信号104中的双向通话或多个声源的存在性、声输入信号104内的音调或瞬变的存在性、声输入信号104的掌声存在性或信噪比。合适信号特性的列举仅是信号特性确定器108可确定的信号特性的ー个实例。根据本发明的其他实施方式,信号特性确定器108也可确定声输入信号104的其他(未提及的)信号特性,且可控參数估计器106可基于声输入信号104的这些其他信号特性来修改可变空间參数计算规则。可控參数估计器106可被配置为计算空间參数102,作为包括关于时隙η和频率子带k的扩散度參数Ψ (k, η)和/或关于时隙η和频率子带k的波达方向參数(p(k,η)的定向音频编码參数,或者作为例如关于时隙η和频率子带k的空间音频麦克风參数。可控參数估计器106还可被配置为使用除DirAC或SAM之外的另ー概念来计算空间參数102。DirAC參数和SAM參数的计算应仅被理解为实例。例如,可控參数估计器可被配置为计算空间參数102,使得该空间參数包括声音方向、声音扩散度或声音方向的统计测量。声输入信号104例如可被设置在时域或(短时)频域中,例如在STFT域中。例如,设置在时域中的声输入信号104可包括多个声学音频流X1 (t)至xN (t),其各自包括时间上的多个声输入样本。各声输入流例如可由不同麦克风提供,且可与不同看方向相对应。例如,第一声输入流X1 (t)可与第一方向(例如,与X方向)相对应;第二声输入流X2(t)可与第二方向相对应,该第二方向可与第一方向正交(例如,y方向);第三声输入流X3(t)可与第三方向相对应,该第三方向可与第一方向和第二方向正交(例如,z方向);以及第四声输入流X4(t)可以是全方位分量。这些不同声输入流可由例如在正交方向上的不同麦克风记录,且可使用模数转换器来数字化。根据本发明的其他实施方式,声输入信号104可包括例如在时频域(诸如STFT域)中以频率表示的声输入流。例如,可以B格式提供声输入信号104,该B格式包括特定速度矢量(particle velocity vector)U(k, η)和声压矢量P(k, η),其中,k表示频率子带,以及η表不时隙。特定速度矢量U(k,n)是声输入信号104的定向分量,其中,声压P (k, η)表不声输入信号104的全方位分量。如前述所提及,可控參数估计器106可被配置为提供空间參数102,作为定向音频编码參数或者作为空间音频麦克风參数。在下文中,将作为參考实例来给出常规定向音频编码器。该常规定向音频编码器的示意性框图在图2中示出。根据图2的常规定向音频编码器图2示出了定向音频编码器200的示意性框图。该定向音频编码器200包括B格式估计器202。B格式估计器202包括滤波器组。定向音频编码器200还包括定向音频编码參数估计器204。定向音频编码參数估计器204包括能量分析器206,其用于执行能量分析。此外,定向音频编码參数估计器204包括方向估计器208和扩散度估计器210。定向音频编码(DirAC)(V. Pulkki: Spatial Sound ReproductionwithDirectional Audio Coding, Journal of the AES, Vol. 55,No. 6,2007)表不用于空间声音的分析和再现的有效的感知驱动方法。DirAC分析以下混音频信号和附加侧信息(例如,声音的波达方向(DOA)和声场扩散度)的形式来提供声场的參数化描述。DirAC考虑与人听觉有关的特征。例如,假设双耳时间差(ITD)和双耳声强差(ILD)可由声音DOA描述。相应地,假设双耳相干性(IC)可由声场的扩散度表不。根据DirAC分析的输出,声首再现系统可利用任意一组扬声器来生成用于再现具有原始空间感的声音的特征。应当注意,扩散度也可被视为对所估计的DOA的可靠性测量。扩散度越高,DOA的可靠性越低,且反之亦然。该信息可被许多基于DirAC的工具(诸如源定位(0. Thiergart et al. !Localizationof boundbources in Reverberant Environments Based on Directional AudioCodingParameters, 127th AES Convention, NY,October 2009))使用。本发明的实施方式聚焦于DirAC的分析部分而非声音再现。在DirAC分析中,基于由B格式估计器202提供的B格式信号,经由由声场的能量分析器206执行的能量分析来估计參数。B格式信号由与声压P(k,η)相对应的全方位信号以及与笛卡尔坐标系的X方向、y方向和ζ方向对齐的ー个、两个或三个偶极信号来构成。偶极信号对应于特定速度矢量U (k,η)的元素(element)。DirAC分析在图2中示出。时域中的麦克风信号(即,xjt)、x2(t)、…、xN(t))被提供给B格式估计器202。这些时域麦克风信号在下文中可被称为“时域声输入信号”。B格式估计器202包括短时傅里叶变换(STFT)或另ー滤波器组(FB),其计算在短时频域中的B格式信号,即声压P(k,η)和特定速度矢量U(k,n),其中,k和η分别表示频率索引(频率子帯)和时间块索引(时隙)。信号P(k,η)和U(k, η)在下文中可被称为“短时频域声输入信号”。B格式信号可从利用麦克风阵列的測量中犾得(如在 R· Schultz-Amling et al. :Planar MicrophoneArray Processing for theAnalysis and Reproduction of Spatial Audio usingDirectional Audio Coding, 124tnAES Convention, Amsterdam, TheNetherlands, May 2008 中所述),或者直接通过使用例如 B格式麦克风来获得。在能量分析中,可使用方程(I)针对不同频带来単独估计有效声音强度矢量Ia (k,η),Ia (k, n) =Re {P (k, η) U* (k, η)},(I)式中,Re(·)产生实部,以及U*(k,n)表示特定速度矢量U(k,η)的复共轭。在下文中,有效声音强度矢量也将被称为强度參数。使用方程I中的STFT域表示,声音φ(1《,11)的DOA可在方向估计器208中针对每个k和η被确定为有效声音強度矢量Ia(k,η)的相反方向。在扩散度估计器210中,根据方程
(2),可基于有效強度的波动来计算声场f(k,n)的扩散度,
_1」E(|ls(k,n)|),(2)式中,|(.)|表示矢量范数,以及E(·)给出期望。在实际应用中,期望Ε(·)可通过沿ー个或多个具体维度(例如,沿时间、频率或空间)的有限平均化来近似。
已发现方程2中的期望E ( ·)可通过沿具体维度平均化来近似。为此,可沿时间(时间平均化)、频率(频谱平均化)或空间(空间平均化)来执行平均化。空间平均化是指例如利用放置在不同点处的多个麦克风阵列来估计方程2中的有效声音強度矢量Ia(k,η)。例如,我们可在房间内四个不同点处放置四个不同(麦克风)阵列。因此,我们随后针对每个时频点(k,n)均具有四个强度矢量Ia(k,n),这四个強度矢量Ia(k,n)可被平均化(以与例如频谱平均化相同的方式)以获得对期望算子E( ·)的近似。例如,当使用在几个η上的时间平均化时,我们获得由方程(3)给出的对扩散度參数的估计W(k,η),
权利要求
1.一种用于基于声输入信号(104)来提供空间參数(102、φ(1<,η)、Ψ (k,η))的空间音频处理器,所述空间音频处理器包括 信号特性确定器(108、308、408、508、608、808、908),其被配置为确定所述声输入信号(104)的信号特性(110、710、810);以及 可控參数估计器(106、306、406、506、606、606a、606b、806、906),其用于根据可变空间參数计算规则来计算针对所述声输入信号(104)的所述空间參数(102、(p(k, η) > Ψ (k, η));其中,所述可控參数估计器(106、306、406、506、606、606a、606b、806、906)被配置为根据所确定的信号特性(110、710、810)来修改所述可变空间參数计算规则。
2.根据权利要求I所述的空间音频处理器, 其中,所述空间參数(102)包括声音方向和/或声音扩散度和/或声音方向的统计测量。
3.根据权利要求I或2所述的空间音频处理器, 其中,所述可控參数估计器(106、306、406、506、606、606a、606b、806、906)被配置为计算所述空间參数(102、cp(k, 11)、Ψ (k, η)),作为包括针对时隙(η)和针对频率子带(k)的扩散度參数(Ψ (k, η))和/或针对时隙(η)和针对频率子带(k)的波达方向參数(<p(k,η))的定向音频编码參数,或者作为空间音频麦克风參数。
4.根据权利要求I至3中任一项所述的空间音频处理器, 其中,所述信号特性确定器(308)被配置为确定所述声输入信号(104)的稳定间隔;以及 其中,所述可控參数估计器(306)被配置为根据所确定的稳定间隔来修改所述可变空间參数计算规则,使得用于计算所述空间參数(102、Ψ (k, n)、(p(k, η))的平均时段针对相对较长的稳定间隔相对较长,且针对相对较短的稳定间隔相对较短。
5.根据权利要求4所述的空间音频处理器, 其中,所述可控參数估计器(306)被配置为基于所述声输入信号(104)的信号參数(Ia(k, η))的至少ー个时间平均化,针对时隙(η)和频率子带(k)从所述声输入信号(104)计算所述空间參数(102、Ψ (k,η));以及 其中,所述可控參数估计器(306)被配置为根据所确定的稳定间隔来改变所述声输入信号(104)的所述信号參数(Ia(k,η))的时间平均化的平均化时段。
6.根据权利要求5所述的空间音频处理器, 其中,所述可控參数估计器(306)被配置为使用低通滤波器来实施所述声输入信号(104)的所述信号參数(Ia(k,η))的时间平均化; 其中,所述可控參数估计器(306)被配置为基于加权參数(α )来调整所述声输入信号(104)的当前信号參数与所述声输入信号(104)的之前信号參数之间的加权,使得所述平均化时段基于所述加权參数(α ),使得所述当前信号參数的权重相比所述之前信号參数的权重针对相对较短的稳定间隔相对较高,以及使得所述当前信号參数的权重相比所述之前信号參数的权重针对相对较长的稳定间隔相对较低。
7.根据权利要求I至6中任一项所述的空间音频处理器, 其中,所述可控參数估计器(406、506、906)被配置为根据所确定的信号特性(110)从用于计算所述空间參数(102、Ψ (k, n)、cp(k,η))的多个空间參数计算规则(410、412)中选择ー个空间參数计算规则(410、412)。
8.根据权利要求7所述的空间音频处理器, 其中,所述可控參数估计器(406、506)被配置为使得所述多个空间參数计算规则(410,412)中的第一空间參数计算规则(410)不同于所述多个空间參数计算规则(410、412)中的第二空间參数计算规则(412),以及其中,所述第一空间參数计算规则(410)和所述第二空间參数规则(412)选自由以下组成的组频率子带中多个时隙上的时间平均化、时隙中多个频率子带上的频率平均化、时间平均化和频率平均化以及未平均化。
9.根据权利要求I至8中任一项所述的空间音频处理器, 其中,所述信号特性确定器(408)被配置为确定所述声输入信号(104)是否同时包括来自不同声源的分量,或者其中,所述信号特性确定器(508)被配置为确定所述声输入信号(104)的音调; 其中,所述可控參数估计器(406、506)被配置为根据信号特性确定的结果从用于计算所述空间參数(102、Ψ (k, n) MK H))的多个空间參数计算规则(410、412)中选择ー个空间參数计算规则(410、412),使得当所述声输入信号(104)包括最多一个声源的分量时,或者当所述声输入信号(104)的音调低于给定音调阈值水平时,选择所述多个空间參数计算规则(410、412)中的第一空间參数计算规则(410),以及使得当所述声输入信号(104)同时包括多于ー个声源的分量时,或者当所述声输入信号(104)的音调高于给定音调阈值水平时,选择所述多个空间參数计算规则(410、412)中的第二空间參数计算规则(412); 其中,所述第一空间參数计算规则(410)包括第一数目的频率子带(k)上的频率平均化,以及所述第二空间參数计算规则(412)包括第二数目的频率子带(k)上的频率平均化或者不包括频率平均化;以及 其中,所述第一数目大于所述第二数目。
10.根据权利要求I至9中任一项所述的空间音频处理器, 其中,所述信号特性确定器(608)被配置为确定所述声输入信号(104)的信噪比(110、710); 其中,所述可控參数估计器(606、606a、606b)被配置为实施频率子带(k)中多个时隙上的时间平均化、时隙(η)中多个频率子带(k)上的频率平均化、空间平均化或者它们的组合;以及 其中,所述可控參数估计器(606、606a、606b)被配置为根据所确定的信噪比(110、710)来改变所述时间平均化、所述频率平均化、所述空间平均化或者它们的组合的平均化时段,使得所述平均化时段针对所述声输入信号的相对较低的信噪比(110、710)相对较长,以及使得所述平均化时段针对所述声输入信号(104)的相对较高的信噪比(110、710)相对较短。
11.根据权利要求10所述的空间音频处理器, 其中,所述可控參数估计器(606a、606b)被配置为对多个时隙和频率子带(k)上的强度參数(Ia(k,η))的子集或者对多个时隙和频率子带(k)上的波达方向參数((p(k,η))的子集实施所述时间平均化;以及 其中,强度參数(Ia(k,η))子集中的强度參数(Ia(k,η))的数目或波达方向參数((p(k, η))子集中的波达方向參数(cp(k, η))的数目对应于所述时间平均化的平均化时段,使得强度參数(Ia(k,η))子集中的强度參数(Ia(k,η))的数目或波达方向參fK(p(k, η))子集中的波达方向參数((p(k, η))的数目针对所述声输入信号(104)的相对较高的信噪比(110、710)相对较低,以及使得强度參数(la(k,η))子集中的强度參数(la(k,η))的数目或波达方向參数(φ(Κ η))子集中的波达方向參数(φ(Κ η))的数目针对所述声输入信号(104)的相对较低的信噪比(110、710)相对较高。
12.根据权利要求10至11中任一项所述的空间音频处理器, 其中,所述信号特性确定器(608)被配置为提供所述声输入信号(104)的信噪比(110、710)作为所述声输入信号(104)的多个信噪比參数,所述声输入信号(104)的每个信噪比參数与频率子带和时隙相关联,其中,所述可控參数估计器(606a、606b)被配置为接收目标信噪比(712)作为多个目标信噪比參数,每个目标信噪比參数与频率子带和时隙相关联;以及 其中,所述可控參数估计器(606a、606b)被配置为根据所述声输入信号的当前信噪比參数来改变所述时间平均化的平均化时段,使得当前信噪比參数(102)试图匹配当前目标信噪比參数。
13.根据权利要求I至12中任一项所述的空间音频处理器, 其中,所述信号特性确定器(908)被配置为确定所述声输入信号(104)是否包括与类似掌声信号相对应的瞬变分量; 其中,所述可控參数估计器(906)包括滤波器组(912),所述滤波器组(912)被配置为基于转换计算规则将所述声输入信号(104)从时域转换为频率表示;以及 其中,所述可控參数估计器(906)被配置为根据信号特性确定的结果从多个转换计算规则中选择用于将所述声输入信号(104)从时域转换为频率表示的转换计算规则,使得当所述声输入信号包括与类似掌声信号相对应的分量时,选择所述多个转换计算规则中的第ー转换计算规则,以将所述声输入信号(104)从时域转换为频率表示,以及使得当所述声输入信号不包括与类似掌声信号相对应的分量时,选择所述多个转换计算规则中的第二转换计算规则,以将所述声输入信号(104)从时域转换为频率表示。
14.一种用于基于声输入信号来提供空间參数的方法,所述方法包括 确定(1010)所述声输入信号的信号特性; 根据所确定的信号特性来修改(1020)可变空间參数计算规则;以及 根据所述可变空间參数计算规则来计算(1030)所述声输入信号的空间參数。
15.ー种具有程序代码的计算机程序,所述程序代码在计算机上运行时,用于执行根据权利要求14所述的方法。
全文摘要
本发明公开了一种用于基于声输入信号来提供空间参数的空间音频处理器,包括信号特性确定器和可控参数估计器。信号特性确定器被配置为确定声输入信号的信号特性。用于根据可变空间参数计算规则来计算针对声输入信号的空间参数的可控参数估计器被配置为根据所确定的信号特性来修改可变空间参数计算规则。
文档编号G10L19/00GK102918588SQ201180026742
公开日2013年2月6日 申请日期2011年3月16日 优先权日2010年3月29日
发明者奥利弗·蒂尔加特, 法比安·库奇, 理查德·舒尔茨-阿姆林, 马库斯·卡琳格尔, 乔瓦尼·德尔加尔多, 阿希姆·昆茨, 迪尔克·玛赫内, 维莱·普尔基, 米科-维莱·雷蒂嫩 申请人:弗兰霍菲尔运输应用研究公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1