音频编码和解码中相位信息的有效利用的制作方法

文档序号:2823156阅读:290来源:国知局
专利名称:音频编码和解码中相位信息的有效利用的制作方法
技术领域
本发明涉及音频编码和音频解码,更具体地说,涉及一种当相位信息的重建是感 知相关时选择性地提取和/或传输相位信息的编码和解码方案。
背景技术
例如双耳线索编码(BCC)、参数立体声(PS)或MPEG环绕(MPS)的最近的参数多信 道编码方案使用人类听觉系统的针对空间感知的线索的紧凑参数表示。这允许了具有两个 或多个音频信道的音频信号的速率有效表示。为此,编码器进行从M个输入信道至N个输 出信道的降混,且将所提取的线索连同该降混信号一起传输。此外,根据人类感知的原理对 这些线索进行量化,即,人类听觉系统无法听到或无法区别的信息可被删除或粗略量化。当降混信号为“一般性”音频信号时,这种原始音频信号的编码表示所消耗的带宽 可以通过使用单信道音频压缩器对降混信号或降混信号的信道进行压缩而进一步减少。在 下文中,将各种类型的这些单信道音频压缩器概括为核心编码器。用于描述两个或多个音频信道间的空间相互关系的典型线索是将输入信道间的 电平关系进行参数化的信道间电平差(ILD)、将输入信道间的统计相依性进行参数化的信 道间互相关性/相干性(ICC),以及将输入信道的类似信号段间的时间或相位差进行参数 化的信道间时间/相位差(ITD或IPD)。为了维持由降混与先前描述的线索所表示的信号的高感知质量,通常是针对不同 频带计算个别线索。也就是,针对该信号的给定时段,传输将相同属性进行参数化的多个线 索,每个线索-参数表示信号的预定频带。可以在时间和频率上依赖于接近于人类的频率分辨率的标尺来计算这些线索。无 论何时当表示多信道音频信号时,相应的解码器基于传输的空间线索和降混传输的信号 (因此所传输的降混常被称为载波信号)进行从M信道至N信道的升混。通常,得到的升混信道可描述为传输的降混的电平和相位加权版本。如传输的相 关性参数(ICC)所指示的,通过对传输的降混信号(“干”信号)和从该降混信号导出的去 相关信号(“湿”信号)进行混合与加权,可以合成在编码信号的同时导出的去相关性。这 样,升混信道与原始信道相比具有彼此类似的相关性。通过将该降混馈送至滤波器链例如 全通滤波器和延迟线,可产生去相关信号(即,当与传输的信号互相关时具有接近于零的 互相关性系数的信号)。然而,可以使用其它导出去相关信号的方式。显然,在前述编码/解码方案的特定实现中,必须进行编码信号的传输比特率(理 想的是尽可能地低)与可实现的质量(理想的是尽可能地高)间的折衷。因此,可以决定不传输空间线索的完整集合,而忽略一个特定参数的传输。附加 地,此决定可能受到选择适当的升混的影响。例如,适当的升混可平均地再现未传输的空间 线索。也就是,至少针对完整带宽信号的长期分段,保留平均空间属性。特别地,并非所有参数多信道方案都使用信道间时间差或信道间相位差,从而避 免相应的计算或合成。例如MPEG环绕等方案仅依赖于ILD和ICC的合成。通过去相关性合成隐性地对信道间相位差进行近似,该去相关性合成将两种去相关信号的表示与所传输 的降混信号进行混合,其中两种表示具有180度的相对相移。忽略IPD的传输,从而减少参 数信息的需要量,同时接受再现质量的恶化。因此,需要提供更佳的信号重建质量而不明显增加所需的比特率。

发明内容
本发明的一个实施例通过使用相位估计器来实现上述目的,当输入音频信号之间 的相移超过预定阈值时,该相位估计器导出指示第一和第二输入音频信号间的相位关系的 相位信息。当从感知观点来看,需要传输相位信息时,用于将空间参数和降混信号包括到输 入音频信号的编码表示中的关联输出接口将仅包括导出的相位信息。为此,可连续进行相位信息的确定,且可以基于阈值仅进行是否要包括该相位信 息的判定。例如,该阈值可描述针对其不需要附加相位信息处理来实现重建后的信号的可 接受质量的最大容许相移。可选地,输入音频信号间的相移可以与相位信息的实际产生无关地导出,这样,仅 当超过相位阈值时才进行导出相位信息的正式相位分析。可选地,可以实现空间输出模式判决器,其接收连续产生的相位信息,并且仅当满 足相位信息条件时,即,例如,当输入信号间的相位差超过预定阈值时,该判决器才操控输 出接口以包括相位信息。也就是说,输出接口主要将ICC参数和ILD参数以及降混信号仅包括到输入音频 信号的编码表示中。当出现具有特定信号特征的信号时,附加地包括所确定的相位信息,从 而可以较高质量地重建使用编码表示重建的信号。但是,这可以仅以最小量附加传输信息 来实现,因为确实仅针对关键的那些信号部分传输相位信息。这一方面允许高质量重建,而另一方面允许低比特率实现。本发明的另一实施例对该信号进行分析来导出信号特征信息,该信号特征信息用 于在具有不同信号类型或特征的输入音频信号之间进行区分。例如,这可以是不同特征的 语音信号和音乐信号。当输入音频信号具有第一特征时,仅需要相位估计器;而当输入音频 信号具有第二特征时,相位估计可以作废。因此,当编码其中需要相位合成的信号以提供重 建后信号的可接受质量时,输出接口仅包括该相位信息。其它空间线索例如相关性信息(例如ICC参数)被持久地包括在编码表示中,因 为其存在对信号类型或信号特征这两者可能均较为重要。对于信道间电平差也一样如此, 该信道间电平差主要是描述两个重建的信道间的能量关系。在另一实施例中,可基于其它空间线索,诸如基于第一和第二输入音频信号间的 相关性ICC,来进行相位估计。当存在包括信号特征上的一些附加限制的特征信息时,这是 可行的。于是,除了统计信息之外,也可使用ICC参数来提取相位信息。根据另一个实施例,可极其比特有效地包括相位信息,因为仅实现一个相位切换, 对具有预定大小的相移的应用信号通知。虽然如此,如下文中所详细描述的,在再现中粗略 重建相位关系可能对某些信号类型就足够了。在另外的实施例中,能够以高得多的分辨率 (例如10个或20个的不同相移)来对相位信息进行信号通知,或者甚至作为用于给定-180 度至+180度的可能的相对相位角的连续参数来进行信号通知。
当信号特征已知时,可仅对少数频带传输相位信息,该频带数目可能远小于用于 导出ICC参数和/或ILD参数的频带数目。例如,当已知音频输入信号具有语音特征时,对 于整个带宽仅需要一个单个相位信息。在另一附加实施例中,可以针对例如IOOHz至5kHz 间的频率范围导出单个相位信息,因为假设扬声器的信号能量主要分布于此频率范围内。 例如,当相移超过90度或超过60度时,针对全部带宽的公共相位信息参数是可行的。此外,当信号特征已知时,通过将阈值标准应用到所述参数,可以从已存在的ICC 参数或相关性参数直接导出相位信息。例如当ICC参数小于-0. 1时,可以断定此相关性参 数与固定的相移相对应,因为输入音频信号的语音特征限制了其它参数,在下文中将详细 描述的。在本发明的另一实施例中,当将该相位信息包括到比特流中时,还对从信号导出 的ICC参数(相关性参数)进行修改或后处理。这利用了下述事实ICC(相关性)参数实 际上可以包括与两个特征有关的信息,即,与输入音频信号间的统计相依性有关的信息、以 及与这些信号间的相移有关的信息。因此,当传输附加相位信息时,对相关性参数进行修 改,使得在重建信号时,尽可能最佳地分离地考虑相位和相关性。在完全后向兼容的情境下,也可以通过本发明解码器的实施例来进行这样的相关 性修改。当解码器接收附加相位信息时可激活相关性修改。为了实现这种感知上优异的重建,本发明的音频编码器的实施例可包括附加信号 处理器,该附加信号处理器对由音频解码器的内部升混器所产生的中间信号进行操作。例 如,升混器会接收降混信号和除了相位信息(ICC和ILD)以外的全部空间线索。升混器导 出具有如空间线索所描述的信号属性的第一和第二中间音频信号。为此,可以预见附加混 响(去相关)信号的产生,以便对去相关信号部分(湿信号)和传输的降混信道(干信号) 进行混合。然而,当音频解码器接收到相位信息时,中间信号后处理器会将附加相移应用到 中间信号的至少一个。即,仅当传输附加相位信息时,该中间信号后处理器才可操作。也就 是,本发明的音频解码器的实施例与传统的音频解码器完全兼容。在解码器的一些实施例中的处理以及在编码器侧的处理可以按照时间和频率选 择性方式来进行。也就是,可以处理具有多个频带的一连串相邻时间片。因此音频编码器 的一些实施例包括了信号组合器,以对所产生的中间音频信号和后处理的中间音频信号进 行组合,使得该编码器输出时间连续的音频信号。换句话说,针对第一帧(时段),信号组合器可以使用由升混器所导出的中间音频 信号;而针对第二帧,信号组合器可以使用后处理的中间信号,因为该信号由中间信号后处 理器导出。除了引入相移之外,当然也可以在该中间信号后处理器中实现更先进的信号处理。可选地或附加地,音频解码器的实施例可以包括相关性信息处理器,诸如当附加 地接收到相位信息时对所接收的相关性信息ICC进行后处理。然后,由传统升混器使用后 处理的相关性信息来产生中间音频信号,使得结合由信号后处理器所引入的相移,可以实 现音频信号的自然声音再现。


在下文中将参考附图描述本发明的多个实施例,其中,图1示出了用于从降混信号产生两个输出信号的升混器;图2示出了由图1的升混器使用ICC参数的实例;图3示出了要被编码的音频输入信号的信号特征的实例;图4示出了音频编码器的实施例;图5示出了音频编码器的另一实施例;图6示出了由图4和图5的编码器中的一个所产生的音频信号的编码表示的实例;图7示出了编码器的另一实施例;图8示出了用于语音/音乐编码的编码器的另一实施例;图9示出了解码器的实施例;图10示出了解码器的另一实施例;图11示出了解码器的另一实施例;图12示出了语音/音乐解码器的实施例;图13示出了一种编码方法的实施例;以及图14示出了一种解码方法的实施例。
具体实施例方式图1示出了一种可以用于解码器的实施例中的升混器,使用降混信号6来产生第 一中间音频信号2和第二中间音频信号4。此外,使用附加信道间相关性信息和信道间电平 差信息作为控制升混的放大器的操控参数。升混器包括去相关器10、三个具有相关性的关联的放大器1 至12c、第一混合节 点14a、第二混合节点14b、以及第一和第二电平关联的放大器16a和16b。降混音频信号6 是分配到去相关器10和分配到去相关的关联的放大器1 和12b的输入的单声信号(mono signal)。去相关器10使用该降混音频信号6,根据去相关性算法创建该信号的去相关版 本。将去相关音频信道(去相关信号)输入到第三相关性关联的放大器12c中。可以注意 到,仅包括降混音频信号的样本的升混器的信号分量经常也称作为“干”信号;而仅包括去 相关信号的样本的信号分量常称作“湿”信号。ICC关联放大器12a至12c根据取决于传输的ICC参数的缩放规则来缩放湿信号 分量和干信号分量。基本上,在通过求和节点Ha和14b对干和湿信号分量求和之前,调整 这些信号的能量。为此,将相关性关联的放大器12a的输出提供至第一求和节点14a的第 一输2 ;而将相关性关联的放大器12b的输出信号提供至求和节点14b的第一输入。将与 湿信号关联的相关性关联的放大器12c的输出提供至第一求和节点1 的第二输入以及第 二求和节点14b的第二输入。然而,如图1所示,求和节点处的湿信号的符号的不同在于 以负号的方式将其输入到第一求和节点14a,而将具有原始符号的湿信号输入到第二求和 节点14b中。即,将去相关信号与具有其原始相位的第一干信号分量混合,而将其与具有反 向相位(即,有180度相移)的第二干信号分量混合。如已经解释的,依据相关性参数对能量比进行在先调整,使得从求和节点1 和 14b输出的信号具有与原始编码信号的相关性(其由传输的ICC参数进行参数化)类似的相关性。最后,使用能量关联放大器16a和16b对第一信道2与第二信道4间的能量关系 进行调整。能量关系由ILD参数进行参数化,使得两个放大器均由取决于ILD参数的函数 来操控。也就是,所产生的左信道2和右信道4具有与原始编码信号的统计相依性类似的 统计相依性。然而,对直接源自于传输的降混音频信号6的所产生的第一(左)和第二(右) 输出信号2和4的贡献在于具有相同相位。虽然图1假定了升混的宽带实现,但另一实现可对多个并行频带分别进行升混, 使得图4的升混器可以对原始信号的带宽受限表示进行操作。于是,可通过在最终合成混 合中添加所有带宽受限输出信号,来获得具有全频带的已重建信号。图2示出了用于操控具有相关性的关联的放大器1 至12c的ICC参数相依函数 的实例。使用该函数并从要被编码的原始信道适当导出ICC参数,可粗略(平均地)再现 原始编码信号间的相移。针对此讨论,了解所传输的ICC参数的产生是必要的。本讨论的 基础可以是从要被编码的两个输入音频信号的两个相应信号段之间所导出的复数信道间 相干性参数,定义如下
ICC复数=Λ ΣΣ\^, )\2ΣΣ\^
V k Ik I上式中,指标1是所处理的信号段内部的样本数目,而可选指标k表示多个子带中 的一个,根据一些特定实施例,可以由一个单一 ICC参数表示。换句话说,X1和\是两个信 道的复数值子带样本,k是子带指标,而1是时间指标。通过将原始取样的输入信号馈送到QMF滤波器组,可以导出复数值子带样本,例 如导出64个子带,其中每个子带内部的样本以复数值的数来表示。通过使用前面的公式来 计算复数互相关性,以一个复数值参数(即,参数ICCss)使两个相应信号段特征化,该参 数ICCsii具有下列性质其长度I ICC I表示两个信号的相干性。矢量越长,则两个信号间的统计相依性越高。也就是说,无论何时当ICCsii的长度或绝对值等于1时,除了一个全局缩放因子之 外,两个信号完全相同。但是可以具有相对相位差,相对相位差则由ICCsii的相位角产生。 在此情况下,ICCss相对于实轴的角度表示两个信号间的相位角。但是,当使用多于一个子 带(即,k彡2)进行ICCsii的导出时,相位角因而是所有已处理的参数频带的平均角度。换句话说,当两个信号是统计上强相依的(I ICC复数I ^ 1)时,实数部分Re UCCs 近似为相位角的余弦,并因而为信号间相位差的余弦。当ICCsii的绝对值显著低于1时,不再将矢量ICCsii与实轴间的角度θ解译为相 同信号间的相位角。相反,其是统计上相当独立的信号间的最佳匹配相位。图3给出了可能的矢量ICCs数的三个实例20a、20b和20c。矢量20a的绝对值 (长度)接近于单位1,意味着矢量20a所表示的两个信号几乎相同,但彼此相移。换句话 说,两个信号是高度相干的。在此情况下,相位角30 (Θ)直接与几乎相同的信号之间的相移相对应。然而,如果ICC复数的评估得到矢量20b,则相位角θ的含义不再是明确确定的。 因为复数矢量20b具有显著低于1的绝对值,两个已分析信号部分或信号在统计上是相当 独立的。即,所观察的时段内的信号不具有共同形状。另外,相位角30有一些表示与两个 信号的最佳匹配相对应的相移。但是,当这些信号是非相干的时,两个信号间的共同相移几 乎不重要。此外,矢量20c也有接近于单位1的绝对值,因而可以将其相位角32 (Φ)再次无 疑义地识别为两个类似信号间的相位差。此外,显而易见的是,大于90度的相移与矢量ICC ^勺实数部分相对应,该实数部分小于0。在关注两个或更多已编码信号的统计相依性的正确构建的音频编码方案中,图1 示出了从传输的降混信道创建第一和第二输出信道的可能升混进程。作为控制具有相关性的关联的放大器20a-20c的ICC相依函数,经常使用图2所 示的函数,以允许从完全相关信号到完全去相关信号的平滑过渡,而不会引入任何不连续。 图2示出了如何在干信号分量(通过操控放大器1 和12b)与湿信号分量(通过操控放 大器12c)之间分配信号能量。为了实现此目的,传输ICCs数的实数部分,作为针对ICCfiii 的长度的度量,并因而作为针对信号之间的相似性的度量。在图2中,χ轴给出了传输的ICC参数的值,y轴给出了由升混器的求和节点1 和14b混合在一起的干信号(实线30a)和湿信号(虚线30b)的能量的量。即,当信号极 好地相关(相同的信号形状,相同的相位)时,传输的ICC参数将为单位1。因此,升混器将 所接收的降混音频信号6分配至输出,而不添加任何湿信号部分。由于降混音频信号基本 上是编码的原始信道的求和,因此,就相位和相关性而言该再现是正确的。然而,如果信号反相关(相位=180度,相同的信号形状),则传输的ICC参数 为-1。因此,重建后的信号将不包括干信号的信号部分,而仅包括湿信号的信号分量。由于 将湿信号部分添加到第一音频信道,并从产生的第二音频信道扣除,信号之间的相移被正 确重建为180度。但是,该信号根本不包括任何干信号部分。这是不利的,因为干信号实际 上包括传输至解码器的整个直接信息。因此,可以降低已重建信号的信号质量。然而,该降低取决于所编码的信号类型, 即,取决于底层信号的信号特征。一般来说,由去相关器10所提供的相关信号具有类似混 响的声音特征。也就是说,例如,与语音信号相比,仅使用去相关信号所导致的听觉失真对 于音乐信号而言是相当低的,其中根据混响的音频信号的重建会导致不自然的声音。概括地说,前述解码方案仅粗略对相位特性进行近似,因为至多对其进行平均地 恢复。这是极为粗糙的近似,由于其仅通过改变添加的信号来实现,其中,所添加的信号部 分具有180度的相对相位差。对于明确去相关的信号或者甚至是反相关的信号(ICC <0), 需要相当的量的去相关信号来恢复此去相关,即信号间的统计独立性。通常,由于作为全通 滤波器输出的去相关信号具有”混响状”声音,极大降低了可达到的总体质量。如已经提到的,针对一些信号类型,相位关系的恢复较不重要,但对其它信号类 型,正确恢复可能是感知上相关的。尤其是,当从这些信号导出的相位信息满足某种感知上 激励的相位重建标准时,可能需要原始相位关系的重建。因此,当满足某种相位特性时,本发明的一些实施例确实将相位信息包括到音频信号的编码表示中。即当优势(在速率失真估计中)明显时,仅有时传输相位信息。此外, 可以对传输的相位信息进行粗略量化,从而仅需要少量的附加比特率。给定传输的相位信息,可以利用干信号分量之间、即从原始信号直接导出的信号 分量(因而感知上高度相关)之间的正确相位关系来重建该信号。例如,如果以ICCsii矢量20c来对信号进行编码,则传输的ICC参数(ICCsii的实 数部分)近似为-0.4。也就是,在升混中,大于50%能量将从去相关信号导出。但是,因为 可听见的能量的量仍源自于降混音频信道,因此由于可听见,源自于降混音频信道的信号 分量间的相位关系仍然较为重要。即,更接近地对重建信号的干信号部分间的相位关系进 行近似是可期望的。因此,一旦确定原始音频信道间的相移大于预定阈值,则传输附加相位信息。根据 特定实现,这样的阈值实例可以是60度、90度或120度。根据该阈值,可以以高分辨率来传 输该相位关系,即,信号通知多个预定相移中的一个,或传输连续改变的相位角。在本发明的一些实施例中,仅传输单一相移指示器或相位信息,用于指示重建信 号的相位将以预定相位角偏移。根据一个实施例,仅当ICC参数在预定负值范围内时才应 用此相移。根据相位阈值标准,此范围例如可为-1至-0.3或-0.8至-0.3。也就是说,可 能需要一个单个比特的相位信息。当ICCe的实数部分为正时,由于干信号分量的相位相同处理,由图1的升混器正 确地对已重建信号间的相位关系进行平均地近似。然而,如果所传输的ICC参数低于0,则原始信号的相移平均大于90度。同时,由 升混器使用干信号的仍然可听的信号部分。因此,在始于ICC = 0至例如ICC近似为-0. 6 的区域中,固定相移(例如,对应于与前面引入的区间的中间相对应的相移)能够仅以一个 单个传输比特的代价,来提供具有显著增加的感知质量的重建信号。例如,当ICC参数行进 至更小数值例如低于-0. 6时,仅第一和第二输出信道2和4中的少量信号能源自于干信号 分量。因此可以再次跳过对这些感知上较不相关的信号部分间的正确相位特性的恢复,因 为干信号部分几乎根本不可听。图4示出了用于产生第一输入音频信号40a和第二输入音频信号40b的编码表示 的本发明的编码器的一个实施例。音频编码器42包括空间参数估计器44、相位估计器46、 输出操作模式判决器48和输出接口 50。将第一和第二输入音频信号40a和40b分配至空间参数估计器44和相位估计器 46。空间参数估计器适于导出空间参数,指示两个信号相对于彼此的信号特征,诸如ICC参 数和ILD参数。将估计的参数提供给输出接口 50。相位估计器46适于导出两个输入音频信号40a和40b的相位信息。这样的相位 信息例如可以是两个信号间的相移。例如,可以通过直接进行两个输入音频信号40a和40b 的相位分析来直接估计该相移。在另一可选实施例中,可以通过可选信号线52将由空间参 数估计器44导出的ICC参数提供给相位估计器。相位估计器46然后可以使用任何方式导 出的ICC参数进行相位差的确定。与利用两个音频输入信号的完整相位分析的实施例相比 较,这可以得到较低复杂度的实现。将导出的相位信息提供给输出操作模式判决器48,该判决器能够在第一输出模式 与第二输出模式之间对输出接口 50进行切换。将导出的相位信息提供给输出接口 50,该输出接口 50通过将产生的ICC、ILD或PI (相位信息)参数的特定子集包括在编码表示中, 创建第一和第二输入音频信号40a和40b的编码表示。在第一操作模式中,输出接口 50将 ICC、ILD和相位信息PI包括在编码表示M中。在第二操作模式中,输出接口 50仅将ICC 和ILD参数包括在编码表示M中。当相位信息指示大于预定阈值的第一和第二音频信号40a和40b间的相位差时, 输出操作模式判决器48判定为第一输出模式。相位差例如可通过执行信号的完整相位分 析来确定。例如,这可以通过相对于彼此偏移输入音频信号并通过计算针对各个信号偏移 的互相关性来执行。具有最高值的互相关性与该相移相对应。在可选实施例中,从ICC参数来估计相位信息。当ICC参数(ICCsii的实数部分) 低于预定阈值时,认为有明显相位差。针对检测的可能相移可以例如为大于60度、90度或 120度的相移。相反地,ICC参数的标准可以为0. 3、0或-0. 3的阈值。引入到该表示中的相位信息可以是例如指示预定相移的单个比特。可选地,通过 以更精细的量化来传输相移,直到相移的连续表示,传输的相位信息可以更为精准。此外,音频编码器可对输入音频信号的带宽受限拷贝进行操作,使得图4的多个 音频编码器43并联实现,各个音频编码器对原始宽带信号的带宽滤波版本进行操作。图5示出了本发明的音频编码器的另一实施例,包括相关性估计器62、相位估计 器46、信号特征估计器66和输出接口 68。相位估计器46与图4中引入的相位估计器相对 应。因此,省略对相位估计器的特性的进一步讨论以免不必要的重复。通常,具有相同或类 似的功能的组件被赋予了相同的参考符号。将第一输入音频信号40a和第二输入音频信号 40b分配至信号特征估计器66、相关性估计器62和相位估计器46。信号特征估计器适于导出信号特征信息,其指示输入音频信号的第一或第二不同 特征。例如,语音信号可被检测为第一特征,而音乐信号可被检测作为第二信号特征。附加 信号特征信息可用来确定相位信息传输的需要,或者附加地,用来根据相位关系来解译相 关性参数。在一个实施例中,信号特征估计器66为信号分类器,用来导出信息,指示该音频 信号即第一和第二输入音频信道40a和40b的当前提取为语音类的还是非语音的。依据导 出的信号特征,可通过可选控制链路70来接通和断开相位估计器46的相位估计。可选地, 可一直进行相位估计,同时通过可选第二控制链路72来操控输出接口,例如,当检测到输 入音频信号的第一特征例如语音特征时,仅包括相位信息74。相反,一直进行ICC确定,从而提供编码信号的升混所需的相关性参数。可选地,音频编码器的另一实施例可以包括降混器76,其适于来导出降混音频信 号78,可选地,可将该降混音频信号78包括到由音频编码器60所提供的编码表示M中。在 可选实施例中,如对图4的实施例已经讨论的,相位信息可以基于相关性信息ICC的分析。 为此,相关性估计器62的输出可以通过可选信号线52提供给相位估计器46。当在语音信号和音乐信号间对信号进行区分时,根据以下考虑,这样的确定可以 诸如基于ICCsir当从信号特征信息66得知该信号为语音信号时,可根据以下考虑评估ICCfiii
当确定为语音信号时,可以作出以下结论人类听觉信号所接收的信号是强相关 的,这是由于语音信号的源为点状的。因此,ICCsii的绝对值接近于1。因此,根据下述公 式,可以仅使用ICCssW实数部分的信息来估计出图3的相位角Θ (IPD),而甚至无需评估 复数矢量ICC复数Re{ICC 复数}= cos(IPD)可以基于ICCsii的实数部分来获得相位信息,可以无需计算ICCsii的虚数部分就 可以进行确定该ICCsii的实数部分。简而言之,可以作出以下结论IICC复数 I l_>Re{ICC复数} = cos (IPD)在上式中,要注意的是,cos(IPD)与图3的cos (θ)相对应。更为一般地,在解码器端进行相位合成的必要性也可以根据下述考虑得出相干性(abS(ICCfii;))显著大于0,相关性(Real(ICCfiii))显著小于1,或相位角 (arg(ICC复数))显著不同于0。要注意的是,这些是一般标准,其中在存在语音的情况下,隐性地假定了 abs(ICC
复数)明显大于0。图6给出了图5的编码器60导出的编码表示的实例。与时段80a和第一时段80b 相对应,该编码表示仅包括相关性信息,其中对于第二时段80c,由输出接口 68所产生的该 编码表示包括相关性信息和相位信息PI。简而言之,由音频编码器所产生的编码表示的特 征在于其包括降混信号(为求简明并未示出),该降混信号是使用第一和第二原始输出信 道产生的。该编码表示还包括第一相关性信息82a,用于指示第一时段80b内的第一和第二 原始音频信道间的相关性。另外,所述表示还包括第二相关性信息82b,用于指示第二时段 80c内的第一和第二音频信道间的去相关性;以及第一相位信息84,用于指示针对第二时 段的第一和第二原始音频信道间的相位关系,其中对第一时段80b并未包括相位信息。要 注意的是,为易于说明,图6仅示出了辅助信息而未示出也被传输的降混信道。图7示意性地示出了本发明的另一实施例,其中音频编码器90还包括相关性信息 修改器92。图7的图示假定已经进行了例如参数ICC和ILD的空间参数提取,从而将空间 参数94连同音频信号96 —起提供。音频编码器90还包括信号特征估计器66和相位估计 器46,其操作如上所示。根据信号分类和/或相位分析的结果,根据由上部信号路径指示的 第一操作模式来提取和递交相位参数。可选地,由信号分类和/或相位分析操控的开关98 可以激活第二操作模式,其中对提供的空间参数94无需修改即进行传输。然而,当选择需要传输相位信息的第一操作模式时,相关性信息修改器92从接收 的ICC参数导出相关性度量,传输该度量来替代ICC参数。选择相关性度量,使得当确定第 一和第二输入音频信号间的相对相移时,以及当音频信号被归类为语音信号时,相关性度 量大于相关性信息。另外,由相位参数提取器100来提取并传输相位参数。可选ICC调整或替代最初导出的ICC参数而被递交的相关性度量的确定可以具有更佳的感知质量的效果,原因在于其考虑下述事实对于小于0的ICC,重建信号将仅包括 少于50 %的干信号,其实际上仅为从原始音频信号直接导出的信号。也就是说,虽然已经知 道音频信号仅由于相移而有明显差异,但是重建提供了由去相关的信号(湿信号)支配的 信号。当由相关性信息修改器增加ICC参数(ICCss的实数部分)时,该升混将自动使用来 自于干信号的更多信号能量,即,使用更多”真正”音频信息,从而使得当得出相位再现的必 要性时,再现的信号更接近于原始信号。换句话说,以解码器升混添加较少的去相关性信号的方式,对传输的ICC参数进 行修改。ICC参数的一个可能修改在于使用信道间相干性(ICCssW绝对值),来替代通常 用作ICC参数的信道间互相关性。信道间互相关性定义为ICC = Re{ICC复数},并且,该信道间互相关性取决于这些信道的相位关系。然而,信道间相干性系与相 位关系独立,定义如下ICC= IICC 复数 I。计算信道间相位差,并将其连同其余空间辅助信息一起传输至解码器。从图8的 实施例中将显而易见的是,该表示在实际相位值的量化上是非常粗糙的,并且还可以具有 粗糙的频率分辨率,其中甚至宽带相位信息可以是有用的。从复数信道间关系可以导出相位差,如下IPD = arg(ICC复数)。如果相位信息被包括在比特流中,即被包括到编码表示M中,解码器的去相关性 合成可以使用已修改的ICC参数(相关性度量)来产生具有降低的混响的升混信号。例如,如果信号分类器在语音信号与音乐信号间进行区分,一旦确定该信号的主 要语音特征,则可根据下述规则来进行是否需要相位合成的判定。首先,针对多个用来产生ICC和ILD参数的参数频带,可以导出宽带指示值或相移 指示器。也就是说,例如,可以对语音信号主要存在的频率范围(例如IOOHz至2KHz)进行 评估。一个可能的评估将是基于已经导出的频带的ICC参数来计算此频率范围内的平均相 关性。如果结果是此平均相关性小于预定阈值,则可认为该信号是异相的并触发相移。此 外,依据相位重建的期望粒度,可以使用多个阈值来信号通知不同的相移。可能的阈值可以 例如为0、-0.3或-0.5。图8示出了本发明的另一个实施例,其中编码器150可操作用于编码语音信号和 音乐信号。将第一和第二输入音频信号40a和40b提供给编码器150,该编码器150包括信 号特征估计器66、相位估计器46、降混器152、音乐核心编码器154、语音核心编码器156和 相关性信息修改器158。信号特征估计器66适于在作为第一信号特征的语音特征与作为第 二信号特征的音乐特征之间进行区分。通过控制链路160,信号特征估计器66可操作用于 依据导出的信号特征来操控输出接口 68。相位估计器或者直接根据输入音频信道40a和40b、或者根据由降混器152导出 的ICC参数来估计相位信息。该降混器创建降混音频信道M(16》和相关性信息ICC(164)。 根据前述实施例,可选地,相位估计器46可直接从提供的ICC参数164导出相位信息。可 以将降混音频信道162提供给音乐核心编码器154、以及语音核心编码器156,这两者均连 接到输出接口 68以提供音频降混信道的编码表示。一方面,将相关性信息164直接提供给输出接口 68。另一方面,将其提供给相关性信息修改器158的输入,该修改器158适于修改 提供的相关性信息且将这样导出的相关性度量提供给输出接口 68。根据信号特征估计器66估计的信号特征,该输出接口将不同参数子集包括到该 解码表示中。在第一(语音)操作模式中,输出接口 68包括由语音核心编码器156编码的 降混音频信道162的编码表示、以及从相位估计器46导出的相位信息PI和相关性度量。该 相关性度量可以是由降混器152所导出的相关性参数ICC,或者可选地,是相关性信息修改 器158修改的相关性度量。为此,相关性信息修改器158可由相位估计器46操控和/或激 活。在音乐操作模式中,输出接口包括如由音乐核心编码器IM编码的降混音频信道 162和由降混器152导出的相关性信息ICC。不言而喻,如同上述的特定实施例,包括不同参数子集能够以不同方式来实现。例 如,可以使音乐编码器和/或语音编码器去激活,直到激活信号根据由信号特征估计器66 导出的信号特征将其切换到信号路径。图9示出了根据本发明的解码器的实施例。音频解码器200适于从编码表示204 中导出第一音频信道20 和第二音频信道202b,编码表示204包括降混音频信号206a、针 对降混信号的第一时段的第一相关性信息208、以及针对降混信号的第二时段的第二相关 性信息210,其中仅针对第一时段或第二时段包括相位信息212。解复用器(未显示)对该编码表示204的各个分量进行解复用,并将第一和第二 相关性信息连同降混音频信号206a —起提供给升混器220。升混器220可以是例如图1所 述的升混器。然而,也可以使用有不同的内部升混算法的不同升混器。通常,升混器适于使 用第一相关性信息208和降混音频信号206a导出针对第一时段的第一中间音频信号22 ; 以及使用第二相关性信息210和降混音频信号206a导出与第二时段相对应的第二中间音 频信号222b。换句话说,使用去相关性信息ICC1重建第一时段,而使用ICC2重建第二时段。将 第一和第二中间信号22 和222b提供给中间信号后处理器224,该中间信号后处理器2M 适于使用相应的相位信息212来导出针对第一时段的后处理中间信号226。为此,中间信号 后处理器2M接收相位信息212、以及由升混器220产生的中间信号。当存在与特定音频信 号相对应的相位信息时,该中间信号后处理器2M适于将相移添加到中间音频信号的音频 信道中的至少一个。也就是说,中间信号后处理器2M将相移添加到第一中间音频信号222a,其中中 间信号后处理器224并未将任何相移添加到第二中间音频信号222b。中间信号后处理器 224输出后处理中间信号2 来替代第一中间音频信号,以及未变更的第二中间音频信号 222b。音频解码器200还包括信号组合器230,用于组合从中间信号后处理器2M输出的 信号,并因而导出由音频解码器200所产生的第一和第二音频信道20 和202b。在一个特定实施例中,该信号组合器对从该中间信号后处理器输出的这些信号进 行级联,以最终导出针对第一和第二时段的音频信号。在另一实施例中,信号组合器可以实 现某种交叉衰落,例如,通过在从中间信号后处理器提供的信号间进行衰落来导出第一和 第二音频信号20 和202b。当然,信号组合器230的其它实现也是可行的。
利用如图9所示的本发明解码器的实施例提供了添加附加相移的灵活性,因为附 加相移可以由编码器信号进行信号通知或以反向兼容方式解码该信号。图10示出了本发明的另一实施例,其中音频解码器包括去相关电路M3,取决于 传输的相位信息,该去相关电路243能够依据第一去相关规则和第二去相关规则进行操 作。根据图10的实施例,可以对根据其从传输的降混音频信道240导出去相关信号242的 去相关规则进行切换,其中该切换取决于现有相位信息。在其中传输相位信息的第一模式中,使用第一去相关规则来导出去相关信号M2。 在其中未接收到相位信息的第二模式中,使用第二去相关规则,创建去相关信号,该信号比 使用第一去相关规则创建的信号更为去相关。换句话说,当需要相位合成时,可以导出去相关信号,该信号不如当不需要相位合 成时所使用的信号那样高度去相关。即,解码器然后可以使用更类似于干信号的去相关信 号,从而在升混中自动创建具有更多干信号分量的信号。这通过使去相关信号更类似于干 信号来实现。在另一实施例中,可以将可选相移器246应用到针对具有相位合成的重建而产生 的去相关信号。通过提供已经具有相对于干信号的正确相位关系的去相关信号,这提供了 重建信号的相位特性的更接近重建。图11示出了本发明的音频解码器的另一实施例,包括分析滤波器组260和合成滤 波器组沈2。解码器接收降混音频信号206、以及相关的ICC参数(ICCtl. .. ICCn)。然而,在 图11中,不同ICC参数不仅与不同时段相关联,同时也与音频信号的不同频带相关联。艮口, 每个时段处理具有完整的关联ICC参数集合(ICCtl. . . ICCn)。由于该处理以频率选择方式执行,分析滤波器组沈0导出传输的降混音频信号 206的64个子带表示。即,导出64个带宽受限信号(在滤波器组表示中),每个信号与一 个ICC参数相关联。可选地,多个带宽受限信号可以共享公共ICC参数。各个子带表示由 升混器^^、264b、...处理。各个升混器可以是例如根据图1的实施例的升混器。因此,针对每个带宽受限表示,创建第一和第二音频信道(两者均带宽受限)。 将每个子带这样创建的音频信道中的至少一个输入到中间音频信号后处理器266a、 ^56b、...,例如,如图9所述的中间音频信号后处理器。根据图11的实施例,中间音频信号 后处理器沈63、26613、...由相同的公共相位信息212操控。即,在子带信号由合成滤波器 组沈2合成以成为由解码器所输出的第一和第二音频信道20 和202b之前,将相同相移 应用到每个子带信号。可以这样进行相位合成,仅需要传输一个附加公共相位信息。在图11的实施例 中,可以进行原始信号的相位特性的正确恢复,而无需比特率的适当增加。根据另一实施例,针对其使用公共相位信息212的子带数目是信号相关的。因此, 当应用相应的相移时,可以仅针对能够对其实现感观质量提高的子带来评估相位信息。这 可进一步提高已解码信号的感知质量。图12示出了音频解码器的另一实施例,该音频解码器适于解码原始音频信号的 编码表示,所述信号可以是语音信号或音乐信号。即,或者在编码表示内传输信号特征信 息,指示传输了哪种信号特征;或者可以根据比特流中的相位信息的存在,隐性地导出信号 特征。为此,相位信息的存在可以指示音频信号的语音特征。根据信号特征,传输的降混音频信号206或者由语音解码器266解码或者由音乐解码器268解码。如图11所示出和阐 明的,执行进一步处理。因此,对于进一步的实现细节,参考图11的解释。图13示出了用于产生第一和第二输入音频信号的编码表示的本发明方法的实施 例。在空间参数提取步骤300,从第一和第二输入音频信号导出ICC参数和ILD参数。在相 位估计步骤302中,导出指示第一和第二输入音频信号间的相位关系的相位信息。在模式 判定304中,当相位关系指示大于预定阈值的第一和第二输入音频信号间的相位差时,选 择第一输出模式;而当该相位差小于该阈值时,选择第二输出模式。在表示产生步骤306, 在第一输出模式中将ICC参数、ILD参数和相位信息包括在编码表示中;而在第二输出模式 中仅将ICC参数和ILD参数包括在编码表示中而不包括相位关系。图14示出了使用音频信号的编码表示产生第一和第二音频信道的方法的实施 例,所述编码表示包括降混音频信号;用于指示用来产生降混信号的第一和第二原始音频 信道间的相关性的第一和第二相关性信息,所述第一相关性信息具有针对降混信号的第一 时段的信息,而所述第二相关性信息具有针对第二不同时段的信息;以及相位信息,所述相 位信息用于指示针对第一时段的第一和第二原始音频信道间的相位关系。在升混步骤400,使用降混信号和第一相关性信息导出第一中间音频信号,该第一 中间音频信号与第一时段相对应且包括第一和第二音频信道。在升混步骤400,还使用降混 音频信号和第二相关性信息导出第二中间音频信号,该第二中间音频信号与第二时段相对 应且包括第一和第二音频信道。在后处理步骤402,使用第一中间音频信号,针对第一时段导出后处理中间信号, 其中将由相位关系指示的附加相移添加到第一中间音频信号的第一或第二音频信道中的 至少一个。在信号组合步骤404,使用后处理中间信号和第二中间音频信号,产生第一和第二 音频信道。根据本发明方法的特定实现要求,本发明方法能够以硬件或软件的方式来实现。 可利用数字存储介质来进行实现(尤其是其上存储了电子可读控制信号的盘、DVD或CD), 该数字存储介质与可编程计算机系统协作从而执行本发明方法。总的来说,本发明因而是 具有存储在机器可读载体上的程序代码的计算机程序产品,所述程序代码可操作用于当计 算机程序产品在计算机上运行时执行本发明方法。因此,换句话说,本发明方法是具有当计 算机程序在计算机上运行时执行本发明方法中的至少一个的程序代码的计算机程序。尽管在前面已经参考特定实施例具体示出并描述了本发明,但是本领域的技术人 员将会理解,在不脱离本发明的精神和范围的情况下,可以在形式和细节上作出各种其它 改变。要理解的是,在不脱离这里所述以及由所附权利要求包括的更广泛概念的情况下,可 以在适配到不同实施例时作出各种改变。
权利要求
1.一种用于产生第一和第二输入音频信号的编码表示的音频编码器,包括相关性估计器,所述相关性估计器适于导出指示第一和第二输入音频信号之间的相关 性的相关性信息;信号特征估计器,所述信号特征估计器适于导出信号特征信息,所述信号特征信息指 示所述输入音频信号的不同的第一或第二特征;相位估计器,所述相位估计器适于当所述输入音频信号具有第一特征时导出相位信 息,所述相位信息指示所述第一和第二输入音频信号之间的相位关系;以及输出接口,所述输出接口适于当所述输入音频信号具有第一特征时将所述相位信息和相关性度量包括到所述编码 表示中;或者当所述输入音频信号具有第二特征时将所述相关性信息包括到所述编码表示中,其中 当所述输入音频信号具有第二特征时不包括所述相位信息。
2.根据权利要求1所述的音频编码器,其中由所述信号估计器指示的所述第一信号特 征是语音特征;以及由所述信号估计器指示的所述第二信号特征是音乐特征。
3.根据权利要求1所述的音频编码器,其中所述相位估计器适于使用所述相关性信息 来导出所述相位信息。
4.根据权利要求1所述的音频编码器,其中所述相位信息指示所述第一和第二输入音 频信号之间的相移。
5.根据权利要求3所述的音频编码器,其中所述相关性估计器适于产生ICC参数作为 去相关性信息,所述ICC参数由所述第一和第二输入音频信号的取样信号段的复数互相关 性ICC复数的实数部分表示,每个信号段由1个样本值X(I)表示,其中ICC参数可以由下 式描述
6.根据权利要求5所述的音频编码器,其中所述预定阈值等于或小于0.3。
7.根据权利要求5所述的音频编码器,其中针对相关性信息的所述预定阈值与大于90 度的相移相对应。
8.根据权利要求1所述的音频编码器,其中所述相关性估计器适于导出多个相关性参 数,作为相关性信息,每个相关性参数与所述第一和第二输入音频信号的相应子带有关;以 及其中所述相位估计器适于导出用于指示针对与所述相关性参数相对应的子带中的至少 两个子带的所述第一和第二输入音频信号之间的相位关系的相位信息。
9.根据权利要求1所述的音频编码器,还包括相关性信息修改器,所述相关性信息修 改器适于导出所述相关性度量,以便所述相关性度量指示比所述相关性信息更高的相关性;以及其中所述输出接口适于包括所述相关性度量而非所述相关性信息。
10.根据权利要求9所述的音频编码器,其中所述相关性信息修改器适于使用所述第 一和第二输入音频信号的两个取样的信号段的复数互相关性ICC复数的绝对值,作为所述 相关性度量ICC,每个信号段由1个复数值样本值X(I)表示,所述相关性度量ICC由下式描 述
11.一种用于产生第一和第二输入音频信号的编码表示的音频编码器,包括空间参数估计器,所述空间参数估计器适于导出ICC参数或ILD参数,所述ICC参数指示所述第一和第二输入音频信号之间的相关性,所述ILD参数指示所述第一和第二输入音 频信号之间的电平关系;相位估计器,所述相位估计器适于导出相位信息,所述相位信息指示所述第一和第二 输入音频信号之间的相位关系;输出操作模式判决器,所述输出操作模式判决器适于当所述相位关系指示大于预定阈值的所述第一和第二输入音频信号之间的相位差时,指示第一输出模式,或者当所述相位差小于所述预定阈值时,指示第二输出模式;以及输出接口,所述输出接口适于在第一输出模式中,将所述ICC参数或ILD参数以及所述相位信息包括到所述编码表 示中;以及在第二输出模式中,将所述ICC参数和ILD参数包括到所述编码表示中而不将所述相 位信息包括到所述编码表示中。
12.根据权利要求11所述的音频编码器,其中所述预定阈值与60度的相移相对应。
13.根据权利要求11所述的音频编码器,其中所述空间参数估计器适于导出多个ICC 参数或ILD参数,每个ICC参数或ILD参数与所述第一和第二输入音频信号的子带表示的 相应子带有关;以及其中所述相位估计器适于导出用于指示针对子带表示的子带中的至少 两个子带的所述第一和第二输入音频信号之间的所述相位关系的相位信息。
14.根据权利要求13所述的音频编码器,其中所述输出接口适于将单个相位信息参数 包括到所述表示中,作为所述相位信息,所述单个相位信息参数指示针对子带表示的子带 中的预定子组的所述相位关系。
15.根据权利要求11所述的音频编码器,其中所述相位关系由指示预定相移的单个比 特表示。
16.一种使用音频信号的编码表示来产生第一和第二音频信道的音频解码器,所述编 码表示包括降混音频信号、以及指示用来产生降混音频信号的第一和第二原始音频信道之 间的相关性的第一和第二相关性信息,所述第一相关性信息具有针对所述降混信号的第一 时段的信息,以及第二相关性信息具有针对不同的第二时段的信息;所述编码表示还包括针对第一时段和第二时段的相位信息,所述相位信息指示所述第一和第二原始音频信道之 间的相位关系,所述音频解码器包括升混器,所述升混器适于使用所述降混音频信号和所述第一相关性信息导出第一中间音频信号,所述第一中间 音频信号与所述第一时段相对应且包括第一和第二音频信道;和使用所述降混音频信号和所述第二相关性信息导出第二中间音频信号,所述第二中间 音频信号与所述第二时段相对应且包括第一和第二音频信道;中间信号后处理器,所述中间信号后处理器适于使用所述第一中间音频信号和所述相 位信息来导出针对所述第一时段的后处理中间音频信号,其中所述中间信号后处理器适于 将由所述相位关系指示的附加相移添加到所述第一中间音频信号的第一或第二音频信道 中的至少一个上;以及音频组合器,所述音频组合器适于通过对所述后处理中间音频信号与所述第二中间音 频信号进行组合来产生所述第一和第二音频信道。
17.根据权利要求16所述的音频解码器,其中所述升混器适于使用多个相关性参数, 作为所述相关性信息,每个相关性参数与所述第一和第二原始音频信号的多个子带中的一 个子带相对应;以及其中所述中间信号后处理器适于将由所述相位关系指示的附加相移添加到所述第一 中间音频信号的相应子带中的至少两个子带上。
18.根据权利要求16所述的音频解码器,还包括相关性信息处理器,所述相关性信息 处理器适于导出相关性度量,所述相关性度量指示比第一相关性更高的相关性;以及其中,当相位信息指示高于预定阈值的所述第一和第二原始音频信道之间的相移时, 所述升混器使用所述相关性度量而非所述相关性信息。
19.根据权利要求16所述的音频解码器,还包括去相关器,所述去相关器适于根据针 对所述第一时段的第一去相关规则和根据针对所述第二时段的第二去相关规则,从所述降 混音频信号导出去相关音频信道,其中所述第一去相关规则与所述第二去相关规则相比创 建了更少的去相关的音频信道。
20.根据权利要求19所述的音频解码器,其中所述去相关器还包括相移器,所述相移 器适于将附加相移施加到使用所述第一去相关规则所产生的去相关音频信道,所述附加相 移取决于所述相位信息。
21.一种用于产生第一和第二输入音频信号的编码表示的方法,包括导出指示所述第一和第二输入音频信号之间的相关性的相关性信息;导出信号特征信息,所述信号特征信息指示所述输入音频信号的不同的第一或第二特征;当所述输入音频信号具有第一特征时导出相位信息,所述相位信息指示所述第一和第 二输入音频信号之间的相位关系;以及当所述输入音频信号具有所述第一特征时将所述相位信息和相关性度量包括到所述 编码表示中;或者当所述输入音频信号具有所述第二特征时将所述相关性信息包括到所述编码表示中, 其中当所述输入音频信号具有所述第二特征时不包括所述相位信息。
22.一种用于产生第一和第二输入音频信号的编码表示的方法,包括导出ICC参数或ILD参数,所述ICC参数指示所述第一和第二输入音频信号之间的相 关性,所述ILD参数指示所述第一和第二输入音频信号间的电平关系;导出相位信息,所述相位信息指示所述第一和第二输入音频信号之间的相位关系; 当所述相位关系指示大于预定阈值的所述第一和第二输入音频信号之间的相位差时, 指示第一输出模式,或者当所述相位差小于预定阈值时,指示第二输出模式;以及在第一输出模式中,将所述ICC参数或ILD参数以及所述相位关系包括到所述编码表 示中;或者在第二输出模式中,将所述ICC参数或ILD参数包括到所述编码表示中而不将所述相 位关系包括到所述编码表示中。
23.一种使用音频信号的编码表示来导出第一和第二音频信道的方法,所述编码表示 包括降混音频信号、以及指示用来产生所述降混音频信号的第一和第二原始音频信道之间 的相关性的第一和第二相关性信息,所述第一相关性信息具有针对所述降混信号的第一时 段的信息,以及所述第二相关性信息具有针对不同的第二时段的信息;所述编码表示还包 括针对所述第一时段和第二时段的相位信息,所述相位信息指示所述第一和第二原始音频 信道之间的相位关系,所述方法包括使用所述降混音频信号和所述第一相关性信息导出第一中间音频信号,所述第一中间 音频信号与所述第一时段相对应且包括第一和第二音频信道;使用所述降混音频信号和所述第二相关性信息导出第二中间音频信号,所述第二中间 音频信号与所述第二时段相对应且包括第一和第二音频信道;使用所述第一中间音频信号和所述相位信息,导出针对所述第一时段的后处理中间信 号,其中,通过将由所述相位关系指示的附加相移添加到所述第一中间信号的第一或第二 音频信道中的至少一个上来导出后处理中间信号;以及对所述后处理中间信号和所述第二中间音频信号进行组合以导出所述第一和第二音 频信道。
24.一种音频信号的编码表示,包括降混信号,所述降混信号是利用第一和第二原始音频信道产生的; 第一相关性信息,所述第一相关性信息用于指示在第一时段内的所述第一和第二原始 音频信道间的相关性;第二相关性信息,所述第二相关性信息用于指示在第二时段内的所述第一和第二原始 音频信道间的相关性;以及相位信息,所述相位信息用于指示针对所述第一时段的所述第一和第二原始音频信道 之间的相位关系,其中所述相位信息是针对所述第一时段和第二时段的包括在所述表示中 的仅有的相位信息。
25.一种具有程序代码的计算机程序,所述程序代码用于当在计算机上运行时执行根 据权利要求21至23中任一项所述的方法。
全文摘要
当附加地考虑指示输入音频信号的至少第一或第二不同特征的信号特征信息时,可以使用指示第一和第二输入音频信号间的相关性的相关性信息,来导出第一和第二输入音频信号的有效编码表示。当输入音频信号具有第一特征时,导出指示第一和第二输入音频信号间的相位关系的相位信息。当输入音频信号具有第一特征时,将相位信息和相关性度量包括到该编码表示中;而当输入音频信号具有第二特征时,仅将相关性信息包括在该编码表示中。
文档编号G10L19/00GK102089807SQ200980127092
公开日2011年6月8日 申请日期2009年6月30日 优先权日2008年7月11日
发明者伯恩哈特·格里尔, 朱利恩·罗比利亚德, 玛利亚·路易斯-瓦莱罗, 约翰内斯·希勒佩特, 马蒂亚斯·诺伊辛格 申请人:弗朗霍夫应用科学研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1