双声道音频信号的解码的制作方法

文档序号:2830407阅读:261来源:国知局

专利名称::双声道音频信号的解码的制作方法
技术领域
:本发明涉及空间音频编码,并更具体地涉及双声道音频信号的解码。
背景技术
:在空间音频编码中,处理双/多声道音频信号使得音频信号在彼此相异的不同音频声道上得到重现,从而为收听者提供音源周围的空间效果感受。该空间效果可通过将音频直接记录为适合于多声道或双声道重现的格式来创建,或该空间效果可以以任何双/多声道音频信号人工创建,其中空间效果即为公知的空间化。通常已知的是,对于耳机重现,人工空间化可以由HRTF(头部相关传送函数)滤波执行,其产生针对收听者左耳和右耳的双声道信号。利用从对应于声源信号发起方向的HRTF导出的滤波器对声源信号进行滤波。HRTF是从自由场中的声源到人的耳朵或人工假头部的耳朵所测量的传送函数,其由到替代头部并置于头部中央的麦克风的传送函数所划分。可以向空间化的信号添加人工空间效果(例如早期反射和/或后期回响)用于改进源的外化以及逼真度。由于各种音频收听以及交互设备的增多,兼容性变得更重要。在空间音频格式中,通过上混技术到缩混技术都追求兼容性。通常已知存在算法用于将多声道音频信号转换为诸如DolbyDigital⑧以及DolbySurround⑧的立体声格式,并用于进一步将立体声信号转换为双声道信号。然而,原始多声道音频信号的空间图像无法在这种处理中得到完全重现。将多声道音频信号转换为用于耳机收听的更好方式在于用使用了HRTF滤波的虚拟扬声器替代原始扬声器,并且通过这些虚拟扬声器(例如DolbyHeadphone)来播放扬声器声道信号。然而,这种处理存在不利,即为了生成双声道信号,总是首先需要多声道混合。即,首先对多声道(例如5+1个声道)信号解码并合成,而HRTF随即才应用于每个信号以形成双声道信号。相比于从压缩的多声道格式直接解码为双声道格式,这在计算上是一种繁重的方法。.双声道标记编码(BCC)是一种高度发展的参数化空间音频编码方法。BCC将空间多声道信号呈现为单个(或多个)缩混的音频声道和作为原始信号的频率和时间的函数估计的感知上相关的声道间差异组。该方法允许混合的空间音频信号用于将被转换为任意其他扬声器布局的任意扬声器布局,其可包括相同或包括不同数量的扬声器。因此,BCC被设计用于多声道扬声器系统。然而,从BCC处理的单声道信号和其边信息生成双声道信号需要首先以单声道信号和边信息为基础合成多声道呈现,并且仅在之后才可能从多声道呈现生成用于空间耳机重现的双声道信号。很明显,该方法从生成双声道信号的角度而言并非最优。
发明内容现在,发明了一种改进的方法以及实现该方法的技术设备,通过该方法和设备,支持直接从参数化编码的音频信号中生成双声道信号。本发明的各个方面包括解码方法、解码器、设备、编码方法、编码器和计算机程序,以上诸项的特征在独立权利要求中加以陈述。本发明的各种实施方式在从属权利要求中公开。根据第一方面,根据本发明的一种方法基于合成双声道音频信号的思想,从而首先输入参数化编码的音频信号,所述参数化编码的音频信号包括多个音频声道的至少一个组合信号和描述了多声道声像的一个或多个相应的边信息组。然后按由相应的边信息组确定的比例,将头部相关传送函数滤波器的预定组应用于至少一个组合信号,从而合成双声道音频信号。根据一个实施方式,根据所述头部相关传送函数滤波器的预定组中,选择将要应用的、对应于原始多声道扬声器布局的每个扬声器方向的头部相关传送函数滤波器的左右对。根据一个实施方式,所述边信息组包括用于描述原始声像的多声道音频的声道信号的增益估计组。根据一个实施方式,确定作为时间和频率的函数的原始多声道音频的增益估计;以及调节用于每个扬声器声道的增益,使得每个增益值的平方和等于1。根据一个实施方式,将至少一个组合信号划分为所利用的帧长度的时间帧,继而,对所述帧加窗;以及在应用头部相关传送函数滤波器之前,将至少一个组合信号变换到频域。根据一个实施方式,在应用头部相关传送函数滤波器之前,将至少一个组合信号在频域中划分为多个心理声学激发频带,诸如遵照等效矩形(ERB)带宽比例的频带。根据一个实施方式,为左侧信号和右侧信号的每个分别地加和所述频带的头部相关传送函数滤波器的输出;以及将经加和的左侧信号和经加和的右侧信号变换到时域以创建双声道音频信号的左侧分量和右侧分量。第二方面提供了一种用于生成参数化编码的音频信号的方法,所述方法包括输入包括多个音频声道的多声道音频信号;生成多个音频声道的至少一个组合信号;以及生成包括用于多个音频声道的增益估计的边信息的一个或多个对应组。根据一个实施方式,通过比较每个独立声道的增益级与组合信号的累积的增益级,计算增益估计。根据本发明的配置提供了显著的优势。一个主要的优势在于编码过程的简单和低计算复杂度。从解码器完全地基于由编码器给出的空间和编码参数来执行双声道合成的意义上说解码器也是灵活的。而且,在转换中维持了有关原始信号的等同空间性。对于边信息,原始混合的增益估计组是足够的。更显著地,本发明支持对由参数化音频编码提供的压缩中间状态的增强的利用,提高了传输方面以及存储音频方面的岁文率。本发明的其他方面包括配置为执行上述方法的发明性步骤的各种设备。在下文中,将参考附图更详细地描述本发明的各种实施方式,附图中图1示出了根据现有技术的通用双声道标记编码(BCC)机制;图2示出了根据现有技术的BCC合成机制的一般结构;图3示出了根据本发明实施方式的双声道解码器的框图;以及图4示出了根据本发明实施方式的电子设备的简化框图。具体实施例方式在下文中,将通过参考根据实施方式的、用于作为实现解码机制示例性平台的双声道标记编码(BCC)来描述本发明。然而,应该理解本发明不仅仅限于BCC类型的空间音频编码方法,而是可以以任何这样的音频编码机制来实现,该音频编码机制提供从一个或多个音频声道的原始组以及适合的空间边信息组合而成的至少一个音频信号。双声道标记编码(BCC)是用于空间音频的参数化表示的一般概念,其用来自于单个音频声道和某些边信息的任意数量声道递送多声道输出。图l示出了这种原理。多个(M)输入音频声道通过缩混处理组合成为单输出(S;"加和,,)信号。并行地,从输入声道提取对多声道声像进行描述的最显著声道间标记,并且将其紧凑地编码为BCC边信息。然后,可能使用用于对该和信号进行编码的适当的低比特率音频编码机制将和信号和边信息两者传输至'J接收机侧。最终,BCC解码器通过重新合成声道输出信号而从传输的和信号以及空间标记信息中生成用于扬声器的多声道(N)输出信号,其中这些多声道输出信号承载相关的声道间标记,诸如声道间时差(ICTD)、声道间级差(ICLD)以及声道间相干性(ICC)。相应地,为了优化尤其针对扬声器回放的多声道音频信号的重建来选择BCC边信息(即声道间标记)。存在两种BCC机制,即用于可变渲染的BCC(类型IBCC),其意味着出于在接收机处进行渲染的目的而传输多个单独源信号,以及用于自然渲染的BCC(类型IIBCC),这意味着传输多个立体声或环绕信号的音频声道。用于可变渲染的BCC将单独的音频源信号(例如,语音信号、独立记录的乐器、多轨录音)作为输入。而用于自然渲染的BCC将"最终混合"立体声或多声道信号作为输入(例如,CD音频、DVD环绕)。如果通过常规编码技术来执行这些处理,则比特率按比例伸缩或至少按比例地近似为音频声道的数量,例如传输5.1多声道系统的六个音频声道要求大约六倍于一个音频声道的比特率。然而,由于BCC边信息仅要求相当低的比特率(例如2kb/s),所以两种BCC机制导致比特率仅稍稍高于一个音频声道传输所要求的比特率。图2示出了BCC合成机制的一般结构。加以传输的单声道信号("和,,)首先在时域加窗为帧并继而由FFT处理(快速傅立叶变换)和滤波器组FB映射到对适合子带的谱呈现。为了替代FFT以及FB中的处理,可以使用QMF(正交镜像滤波器)滤波器组过程执行对信号的分解。在回放声道的一般情况下,在一对声道之间的每个子带中,即,针对相对于参考声道的每个声道,考虑ICLD和ICTD。选择子带以便达到足够高的频率解析度,例如子带带宽等于ERB(等效矩形带宽)比例的两倍通常被认为是合适的。对于每个将要生成的输出声道,将单独的延时ICTD以及级差ICLD施加于谱系数,随后为相干性合成处理,该处理在合成的音频声道之间重新引入相干性和/或相关性(ICC)的最相关方面。最终,所有合成的输出声道通过IFFT处理(逆FFT)转换回到时域表示,这产生了多声道输出。为了更详细地描述BCC方法,参考F.Baumgarte和C.Faller的"倫a画/CWIEEETransactionsonSpeechandAudioProcessing,巻.11,6号,2003年11月,并参考C.Faller和F.Baumgarte的"BinauralCueCoding-PartII:SchemesandApplications",IEEETransactionsonSpeechandAudioProcessing,巻.11,6号,2003年11月。BCC是编码机制的一个示例,其提供了适合的平台用于实现根据实施方式的解码机制。根据一个实施方式的双声道解码器接收单声道化信号和边信息作为输入。其思想是以对应于涉及收听位置的扬声器方向的HRTF替代在原始混合中的每个扬声器。按照增益值组所规定的比例将单声道化信号的每个频率声道馈送给实现HRFT的每对滤波器,其中该比例可以在边信息的基础上计算。因而,在双声道音频场景中,可以认为该处理实现了对应于原始扬声器的一组虚拟扬声器。由此,本发明通过除了允许用于各种扬声器布局的多声道音频信号外,还允许将双声道信号直接从参数化编码的空间信号导出而无需任何中间BCC合成处理,从而增加了BCC的Y介值。下面参考图3描述本发明的某些实施方式,图3示出了根据本发明一个方面的双声道解码器的框图。解码器300包括用于单声道化信号的第一输入302以及用于边信息的第二输入304。出于说明实施方式的原因,将输入302、304示出为不同的输入,但本领域技术人员应该理解在实际的实施中,可以经由相同的输入提供单声道化的信号和边信息。根据一个实施方式,边信息不必包括与BCC机制中相同的声道间标记,即声道间时差(ICTD)、声道间级差(ICLD)以及声道间相干性(ICC),而是作为替代地,仅包括在每个频带处定义原始混合的声道间声压分布的一组增益估计。除了增益估计,边信息优选地包括涉及收听位置的原始混合扬声器的数量和位置,以及使用的帧长度。根据一种实施方式,为了取代从编码器将增益估计作为边信息的一部分发送,在解码器中从BCC机制的声道间标记(例如从ICLD)来计算增益估计。解码器300进一步包括加窗单元306,其中首先将单声道化信号划分为所^^用帧长度的时间帧,并继而对帧适当地加窗,例如正弦窗。适合的帧长度可以调整使得该帧对于离散傅里叶变换(DFT)足够长,同时短得足以管理信号中的迅速变化。实验已表明适合的帧长度大约是50ms。因此,如果使用了采样频率为44.1kHZ(通常用于各种音频编码机制),则帧可以包括,例如,产生46.4ms帧长度的2048个采样。优选地进行加窗使得相邻窗重叠50%,从而平滑由谱修改(电平或延迟)引起的跃迁。随后,加窗的单声道化信号在FFT单元308中变换到频域。以有效率的计算为目的在频域内完成该处理。技术人员应该理解信号处理的先前步骤可以在实际的解码器300之外实现,即,加窗单元306以及FFT单元308可以在包括解码器的设备中实施,并且待处理的单声道化信号当被提供给该解码器时已被加窗并转换到频域。出于有效地计算频域信号的目的,将信号馈送到滤波器组310,其将信号划分为心理声学激发频带。根据一个实施方式,设计滤波器组310使得其配置为将信号遵照公知的等效矩形带宽(ERB)比例划分为32个频带,这带来了所述32个频带上的信号分量Xo,…,x^作为在方框306、308以及310的备选方案,可以在执行信号分解的QMF滤波器组中执行单声道化信号的时-频域处理。技术人员应该理解除了FFT处理或QMF滤波器组处理,还可4吏用任何其他适合执行期望的时-频域处理的方法。解码器300包括一组HRTF312、314作为预存信息,根据该信息选择对应于每个扬声器方向的左右HRTF对。为了说明的原因,在图3中示出了两组HRTF312、314,—个用于左侧信号并且一个用于右侧信号,但是很明显在实践的实施方式中一组HRFT将足够。为了将选择的HRTF左-右对调整为对应于每个扬声器声道声级,优选地估计增益值G。如上所述,增益估计可以包括在从编码器接收的边信息中,或者可以以BCC边信息为基础在解码器中计算它们。因此,根据时间和频率的函数针对每个扬声器声道估计增益,并且为了保留原始混合的增益级,优选地调整针对每个扬声器声道的增益使得每个增益值的平方和等于1。这提供了如下优势,如果N是实际生成声道的数量,则仅仅N-1的增益估计需要从编码器发送,并且丟失的增益值可以以N-l增益值为基础计算。然而,技术人员应该理解本发明的操作并不必要调整每个增益值的平方的和等于1,而是解码器可以将增益值的平方按比例缩放使得该和为1。继而将每个HRTF左-右对滤波器312、314按照由一组增益G规定的比例加以调整,得到经调整的HRTF滤波器312,,314,。再次应该注意到在实际中,原始HRTF滤波器幅度312、314仅仅根据增益值来缩放,但是出于描述实施方式的目的,在图3中示出"附加的,,HRTF组312,,314,。针对每个频带,将单信号分量x。,…,xm馈送到每个调整了的HRTF滤波器左-右对312',314,。针对左侧信号以及针对右侧信号的滤波器输出继而在加和单元316、318中为两个双声道声道加和。加和的双声道信号再次加正弦窗,并且通过在IFFT单元320、322中执行的逆FFT处理变换回时域。如果分析滤波器加和不为1,或者其相位响应并非线性,则优选使用适当的合成滤波器组以避免在最终的双声道信号Br和Bl中的失真。再次,如果如上所述,在信号的分解中使用QMF滤波器组单元,则IFFT单元320、322优选地由IQMF(逆QMF)滤波器组单元所替代。根据实施方式,为了增强对于双声道信号的外化,即头部外的定位,将适度的空间响应添加到双声道信号。出于此目的,解码器可以包括回响单元,优选地位于加和单元316、318以及IFFT单元320、322之间。添加的空间响应模仿扬声器收听情形下的空间效果。然而,所需要的回响时间短得足以使得计算复杂度并不显著提高。图3中示出的双声道解码器300还支持立体声缩混解码的特殊情况,其中的空间图像变窄了。修改解码器300的操作使得每个可调整的HRTF滤波器312、314由预定义的增益值所替代,其中上述实施方式仅根据增益值按比例缩放。因此,单声道化的信号通过常数HRTF滤波器处理,该滤波器包括在边信息的基础上计算的一组增益值乘以单增益。结果,空间音频缩混为立体声信号。这种特别情况提供了这样的优势,即立体声信号可以使用空间边信息从组合的信号创建,而不需要解码空间音频,从而立体声解码过程比传统的BCC合成要简单。双声道解码器300的结构在其他方面保持与图3—样,仅仅可调整的HRTF滤波器312、314由具有用于立体声缩混的预定增益的缩混滤波器替代。如果双声道解码器包括HRTF滤波器,例如,用于5.1环绕音频配置,则针对立体声缩混解码的特殊情况,HRTF滤波器常数增益例如可以如表1中所定义的。<table>tableseeoriginaldocumentpage16</column></row><table>表l用于立体声缩混的HRTF滤波器根据本发明的配置提供了显著的优势。一个主要的优势在于编码过程的简单和低计算复杂度。从解码器完全地基于由编码器给出的空间和编码参数来执行双声道上混的意义上说解码器也是灵活的。而且,在转换中维持了有关原始信号的等同空间性。对于边信息,原始混合的增益估计组是足够的。更显著地,从传输或存储音频的观点看,当利用由参数化音频编码提供的压缩中间状态时,通过改进的效率获得了最显著的优势。技术人员应该理解,由于HRTF高度独立并且不可能平均,所以理想的重新空间化只能通过测量收听者自有的唯一HRTF组实现。因此,对HRTF的使用不可避免地有色化信号使得处理音频的质量无法等同于原始。然而,由于测量每个收听者的HRTF是不现实的选择,所以当使用的是建模的组或者从仿真头部或具有平均大小并相当对称的头部测量的组时,则获得可能的最佳结果。正如先前所述,根据实施方式,增益估计可以包括在从编码器接收的边信息中。因此,本发明的一方面涉及用于多声道空间音频信号的编码器,其根据频率和时间的函数针对每个扬声器声道估计增益,并在将沿着一个(或多个)组合的声道进行传输的边信息中包括增益估计。编码器例如可以是已知这样的BCC编码器,其进一步被配置为除了或者替代描述了多声道声像的声道间标记ICTD、ICLD以及ICC,还计算增益估计。继而至少包括增益估计的边信息与和信号两者被传输到接收机侧,优选地使用合适的低比特率音频编码机制用于对和信号进行编码。根据实施方式,如果在编码器中计算增益估计,则通过将每个独立声道的增益级与组合声道的积累的增益级进行比较来执行计算;即,如果我们将增益级表示为X,原始扬声器布局的独立声道表示为"m"并且采样表示为"k",则针对每个声道,增益估计计算为|Xm(k)|/|XSUM(k)|。据此,增益估计确定了每个独立声道对比于所有声道的总增益幅度的成比例的增益幅度。根据实施方式,如果在解码器中基于BCC边信息计算增益估计,则可以例如在声道间级差ICLD的基础上执行计算。因此,如果N是实际生成的"扬声器"数目,则包括N-1个未知变量的N-l个方程首先在ICLD值的基础上组成。继而,每个扬声器方程平方和设置为等于1,从而可以解决一个独立声道的增益估计,并在解出的增益估计的基础上,可以从N-1个方程解出其余的增益估计。例如,如果实际生成的声道数量为五(N=5),则N-l个方程组成如下L2=L1+ICLD1,L3=L1+ICLD2,L4=L1+ICLD3以及L5二L1+ICLD4。继而将它们的平方和设置为等于1:L12+(L1+ICLD1)2+(Ll+ICLD2)2+(Ll+ICLD3)2+(Ll+ICLD4)2=1。然后可以解出LI的值,并在L1的基础上,可以解出其余的增益级L2-L5的值。出于简化的目的,描述了先前示例使得在编码器中缩混输入声道(M)以形成单一组合的(例如单声道)声道。然而,实施方式在可替换实现中也同样地可以应用,其中,依赖于特定音频处理应用,将多个输入声道(M)缩混,以形成两个或三个单独的组合声道(S)。如果缩混生成多个组合声道,可以使用传统的音频传送技术传递组合声道的数据。例如,如果生成两个组合声道,可以利用传统的立体声传送技术。在这种情况下,BCC解码器能够提取并使用BCC码来从两个组合的声道中组合出双声道信号。根据实施方式,依赖于特定应用,在所合成的双声道信号中实际生成的"扬声器,,的数量(N)可以不同于(大于或小于)输入声道(M)的数量。例如,输入音频能够对应于7.1环绕声,而可以将双声道输出音频合成为对应于5.1环绕声,反之亦然。频声道转换为S个组合的音频声道,以及一个或多个对应的边信息组,其中M〉S,以及,允许从S个组合的音频声道和对应的边信息组中生成N个输出音频声道,其中N〉S,而且N可以等于M,或者不同于M。由于传送一个组合声道和必需的边信息所需要的比特率非常低,所以本发明在诸如无线通信系统的可用带宽是稀缺资源的系统中尤其能够良好地应用。因此,在通常缺乏高质量的扬声器的移动终端或其他便携设备中,尤其可应用这些实施方式,其中,通过收听根据这些实施方式的双声道音频信号能够引入多声道环绕声的特征。进一步的可行的应用的领域包括电话会议服务,其中通过向收听者给出会议呼叫的参与者位于会议室的不同地点的印象,而容易地区分电话会议的参与者。图4示出了数据处理设备(TE)的简化的结构,其中能够实现才艮据本发明的双声道解码系统。数据处理设备(TE)能够是例如移动终端、PDA设备或个人计算机(PC)。数据处理单元(TE)包括I/O装置(I/O),中央处理单元(CPU)和存储器(MEM)。存储器(MEM)包括只读存储器ROM部分和可重写部分,诸如随机访问存储器RAM和FLASH存储器。通过I/0装置(I/O)传送去往/来自中央处理单元(CPU)的用于与不同的外部方通信的信息,外部方例如CD-ROM、其他设备和用户。如果将数据处理设备实现为移动台,其通常包括收发机Tx/Rx,其通常利用收发机基站(BTS)通过天线与无线网络通信。用户接口(UI)设备通常包括显示器、小键盘、麦克风和用于耳机的连接装置。数据处理设备可以进一步包括连接装置MMC,诸如标准形式的槽,用于各种的硬件模块或者像集成电路IC,其可以提供将在数据处理设备中运行的各种应用。因而,根据本发明的双声道解码系统可以在数据处理设备的中央处理单元CPU中或者在专用数字信号处理器DSP(参数化代码处理器)中执行,由此,数据处理设备接收包括多个音频声道的至少一个组合信号以及一个或多个对应的包括用于多声道音频的声道信号的增益估计的边信息组的参数化编码的音频信号。可以从例如CD-ROM的存储器装置中,或者经由天线和收发机Tx/Rx从无线网络中接收参数化编码的音频信号。数据处理设备进一步包括合适的滤波器组,和头部相关传送函数滤波器的预定义组,由此,数据处理设备将组合信号变换到频域,并按由对应的边信息组确定的比例,将头部相关传送函数滤波器应用于组合信号以合成双声道音频信号,然后经由耳机进行重现。同样地,根据本发明的编码系统也可以在数据处理设备的中央处理单元CPU中或者在专用数字信号处理器DSP中执行,由此,数据处理设备生成包括多个音频声道的至少一个組合信号以及一个或多个对应的包括用于多声道音频的声道信号的增益估计的边信息组的参数化编码的音频信号。也可以在诸如移动台的终端设备中将本发明的功能实现为计算机程序,当该计算机程序在中央处理单元CPU或专用数字信号处理器DSP中执行时,使得计算机程序实现本发明的过程。可将计算机程序SW的功能分布于相互通信的若干单独的程序组件。可将计算机软件存储于任何存储器装置,诸如PC的硬盘或CD-ROM盘,可将其从中加载到移动终端的存储器内。也可通过网络,例如,使用TCP/IP协议栈加载计算机软件。也可以使用硬件方案或硬件和软件方案的组合来实现本发明的装置。因而,可将上述计算机程序产品至少部分地在硬件模块中实现为硬件方案,例如,ASIC或FPGA电路,硬件模块包括用于将模块连接到电子设备的连接装置,或实现为一个或多个集成电路IC,硬件模块或IC进一步包括用于执行所述程序代码任务的各种装置,将所述装置实现为硬件和/或软件。很明显本发明不仅仅限于上文示出的实施方式,而是可以在所附权利要求书的范围内加以修改。权利要求1.一种用于合成双声道音频信号的方法,所述方法包括输入参数化编码的音频信号,所述参数化编码的音频信号包括多个音频声道的至少一个组合信号和描述了多声道声像的一个或多个相应的边信息组;以及按由所述相应的边信息组所确定的比例,将头部相关传送函数滤波器的预定组应用于所述至少一个组合信号,从而合成双声道音频信号。2.根据权利要求1所述的方法,进一步包括根据头部相关传送函数滤波器的所述预定组,应用对应于原始多3.根据权利要求1或2所述的方法,其中所述边信息组包括用于描述了原始声像的、所述多声道音频的所述声道信号的增益估计组。4.根据权利要求3所述的方法,其中所述边信息组进一步包括涉及收听位置的所述原始多声道声像的扬声器的数量和位置,以及利用的帧长度。5.根据权利要求l或2所述的方法,其中所述边信息组包括在双声道标记编码(BCC)机制中使用的声道间标记,诸如声道间时间差(ICTD)、声道间级差(ICLD)以及声道间相干性(ICC),所述方法进一步包括基于所述BCC机制的至少一个所述声道间标记,计算所述原始多声道音频的增益估计组。6.根据权利要求3-5的任何一个所述的方法,进一步包括确定作为时间和频率的函数的所述原始多声道音频的所述增益估计的所述组,以及为每个扬声器声道调节所述增益,使得每个增益值的平方和等于7.根据前述任何一个权利要求所述的方法,进一步包括将所述至少一个组合信号划分为所利用的帧长度的时间帧,继而对所述帧加窗;以及在应用所述头部相关传送函数滤波器之前,将所述至少一个组合信号变换到频域。8.根据权利要求7所述的方法,进一步包括在应用所述头部相关传送函数滤波器之前,将在所述频域中的所述至少一个组合信号划分为多个心理声学激发频带。9.根据权利要求8所述的方法,进一步包括遵照等效矩形(ERB)带宽比例将在所述频域中的至少一个组合信号划分为32个频带。10.根据权利要求7-9的任何一个中所述的方法,其中使用QMF滤波器分解所述至少一个组合信号来执行将所述至少一个组合信号变换到所述频域的步骤。11.根据权利要求8-10的任何一个所述的方法,进一步包括分别地为左侧信号和右侧信号的每个加和所述频带的所述头部相关传送函数滤波器的输出;以及将经加和的左侧信号和经加和的右侧信号变换到时域来创建双声道音频信号的左侧分量和右侧分量。12.—种用于合成立体声音频信号的方法,所述方法包括输入参数化编码的音频信号,所述参数化编码的音频信号包括多个音频声道的至少一个组合信号和描述了多声道声像的一个或多个相应的边信息组;以及按由所述相应的边信息组确定的比例,将具有预定增益值的缩混滤波器组应用于所述至少一个组合信号,从而合成立体声音频信号。13.—种参数化音频解码器,包括参数化代码处理器,用于处理参数化编码的音频信号,所述参数化编码的音频信号包括多个音频声道的至少一个组合信号和描述了多声道声像的一个或多个相应的边信息组;以及合成器,用于按照由所述相应的边信息组确定的比例,将头部相关传送函数滤波器的预定组应用于所述至少一个组合信号,从而合成双声道音频信号。14.根据权利要求13所述的解码器,其中所述合成器配置为根据头部相关传送函数滤波器的所述预定组,应用对应于所述原始多声道音频的每个扬声器方向的头部相关传送函数滤波器的左右对。。15.根据权利要求13或14所述的解码器,其中所述边信息的所述组包括用于描述所述原始声像的、所述多声道音频的所述声道信号的增益估计组。16.根据权利要求13或14所述的解码器,其中所述边信息的所述组包括在双声道标记编码(BCC)机制中4吏用的声道间标记,诸如声道间时间差(ICTD)、声道间级差(ICLD)以及声道间相干性(ICC),所述解码器配置为基于所述BCC机制的至少一个所述声道间标记,计算所述原始多声道音频的增益估计组。17.根据权利要求13-16的任何一个所述的解码器,进一步包括用于将所述至少一个组合信号划分为所利用的帧长度的时间帧的装置,用于为所述帧加窗的装置;以及用于在应用所述头部相关传送函数滤波器之前,将所述至少一个组合信号变换到频域的装置。18.根据权利要求17所述的解码器,进一步包括用于在应用所述头部相关传送函数滤波器之前,将在所述频域中的所述至少一个组合信号划分为多个心理声学激发频带的装置。19.根据权利要求18所述的解码器,其中用于划分所述频域中的所述至少一个组合信号的所述装置包括滤波器组,所述滤波器组配置为遵照等效矩形带宽(ERB)比例,将所述至少一个组合信号划分为32个频带。20.根据权利要求17-19的任何一个所述的解码器,其中用于将所述至少一个组合信号变换到所述频域的装置,所述装置包括配置为分解所述至少一个组合信号的QMF滤波器。21.根据权利要求17-20的任何一个所述的解码器,进一步包括加和单元,用于为左侧信号和右侧信号的每个分别地加和所述频带的所述头部相关传送函数滤波器的输出;以及变换单元,用于将所述经加和的左侧信号和所述经加和的右侧信号变换到时域来创建双声道音频信号的左侧分量和右侧分量。22.—种参数化音频解码器,包括参数化代码处理器,用于处理参数化编码的音频信号,所述参数化编码的音频信号包括多个音频声道的至少一个组合信号和描述了多声道声像的一个或多个相应的边信息组;以及合成器,用于按由所述相应的边信息组确定的比例,将具有预定增益值的缩混滤波器组应用于所述至少一个组合信号,从而合成立体声音频信号。23.—种计算机程序产品,存储于计算机可读介质之上并且可在数据处理设备中执行,用于处理参数化编码的音频信号,所述参数化编码的音频信号包括多个音频声道的至少一个组合信号和描述了多声道声像的一个或多个相应的边信息组,所述计算机程序产品包括用于控制所述至少一个组合信号到所述频域的变换的计算机程序^码部分;以及用于按由所述相应的边信息组确定的比例,将头部相关传送函凄史滤波器的预定组应用于所述至少一个组合信号以合成双声道音频信号的计算机程序代码部分。24.—种用于合成双声道音频信号的设备,所述装置包括用于输入参数化编码的音频信号的装置,所述参数化编码的音频信号包括多个音频声道的至少一个组合信号和描述了多声道声像的一个或多个相应的边信息组;用于按由所述相应的边信息组确定的比例,将头部相关传送函凄丈滤波器的预定组应用于所述至少一个组合信号以合成双声道音频信号的装置;以及用于在音频重现装置中提供所述双声道音频信号的装置。25.根据权利要求24中所述的设备,所述设备是移动终端、PDA设备或个人计算机。26.—种用于生成参数化编码的音频信号的方法,所述方法包括输入包括多个音频声道的多声道音频信号;生成所述多个音频声道的至少一个组合信号;以及生成包括用于所述多个音频声道的增益估计的边信息的一个或多个对应组。27.根据权利要求26所述的方法,进一步包括通过将每个独立声道的增益级与所述组合信号的累积的增益级进行比较,计算所述增益估计。28.根据权利要求26或27所述的方法,其中所述边信息组进一步包括涉及收听位置的原始多声道声像的扬声器的所述数量和位置,以及所利用的帧长度。29.根据权利要求26-28的任何一个所述的方法,其中所述边信息组进一步包括在双声道标记编码(BCC)机制中使用的声道间标记,诸如声道间时间差(ICTD)、声道间级差(ICLD)以及声道间相干性(ICC)。30.根据权利要求26-29的任何一个所述的方法,进一步包括确定作为时间和频率的函数的所述原始多声道音频的所述增益估计的所述组,以及为每个扬声器声道调节所述增益,使得每个增益值的所述平方和等于1。31.—种用于生成参数化编码的音频信号的参数化音频编码器,所述编码器包括用于输入包括多个音频声道的多声道音频信号的装置;用于生成所述多个音频声道的至少一个组合信号的装置;以及用于生成包括用于所述多个音频声道的增益估计的边信息的一个或多个对应组的装置。32.根据权利要求31所述的解码器,进一步包括通过将每个独立的声道的增益级与所述组合信号的所述累积的增益级进行比较来计算所述增益估计的装置。33.—种计算机程序产品,存储于计算机可读介质上并且可在数据处理设备中执行,用于生成参数化编码的音频信号,所述计算机程序产品包括用于输入包括多个音频声道的多声道音频信号的计算机程序代码部分;用于生成所述多个音频声道的至少一个组合信号的计算机程序^码部分;以及用于生成包括用于所述多个音频声道的增益估计的边信息的一个或多个对应组的计算机程序代码部分。全文摘要一种方法用于合成双声道音频信号的方法,该方法包括输入参数化编码的音频信号,该音频信号包括至少一个多音频声道的组合信号和描述了多声道声像的一个或多个对应边信息组;以及按由边信息的对应组确定的比例,将预定的头部相关传送函数滤波器组应用于至少一个组合信号,用于合成双声道音频信号。还公开了对应的参数音频解码器、参数音频编码器、计算机程序产品以及用于合成双声道音频信号的设备。文档编号G10L19/02GK101366321SQ200780002089公开日2009年2月11日申请日期2007年1月4日优先权日2006年1月9日发明者J·蒂尔屈,M·瓦阿纳南,P·奥雅拉申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1