用于音频编码和解码的方法、对应的计算机可读介质以及对应的音频编码器和解码器的制造方法_3

文档序号:9635221阅读:来源:国知局
件102和第二接收组件112被组合在一个单个接收组件中。在一些实施例中,输入 信号130、126被组合为一个单个输入信号,所述一个单个输入信号可以是具有使得接收组 件102、112可以从一个单个输入信号提取不同信息的格式的比特流。
[0055] 系统100还可以包括音频对象逼近组件108,其被布置在第一接收组件102和第 二接收组件112的下游,并且被配置为将重构矩阵104应用于Μ个下混信号106以便产生 Ν个逼近音频对象110。更具体地说,音频对象逼近组件108可以执行矩阵运算,在该矩阵 运算中,将重构矩阵乘以包括Μ个下混信号的矢量。重构矩阵104可以是随时间和频率变 化的,即,重构矩阵104中的元素的值针对每个时间/频率瓦片可以是不同的。因此,重构 矩阵104的元素依赖于哪个时间/频率当前正被处理。
[0056] 频率k和时隙1处(S卩,时间/频率瓦片)的逼近4汰4的音频对象η例如在 音频对象逼近组件108处被计算,例如,对于频带b,b= 1,…,Β中的所有频率采样k,用 二来计算,其中,cm,b,n是频带b中的与下混声道Ym相关联的对象η 的重构系数。可以指出,重构系数Cnl, b,n被假定为在时间/频率瓦片上是固定的,但是在进 一步的实施例中,该系数在时间/频率瓦片期间可以变化。
[0057] 系统100还包括被布置在音频对象逼近组件108下游的去相关组件118。去相关 组件118被配置为对N个逼近音频对象110的至少一个子集140进行去相关处理,以便产 生至少一个去相关音频对象136。换句话说,可以对N个逼近音频对象110中的全部或仅 仅一些进行去相关处理。所述至少一个去相关音频对象136中的每一个对应于N个逼近音 频对象110中的一个。更确切地说,去相关音频对象136的集合对应于被输入到去相关过 程118的逼近音频对象的集合140。所述至少一个去相关音频对象136的目的是减小N个 逼近音频对象110之间的不想要的相关性。该不想要的相关性特别是在包括音频解码系统 100的音频系统具有低目标比特率时出现。在低目标比特率下,重构矩阵可能是稀疏的。这 意味着重构矩阵中的许多元素可能是零。在这种情况下,特定的逼近音频对象110可以基 于来自Μ个下混信号106的单个下混信号或几个下混信号,从而增加了在逼近音频对象110 之间引入不想要的相关性的风险。根据一些实施例,去相关组件118对Ν个逼近音频对象 110中的每一个进行去相关处理,由此Ν个逼近音频对象110中的每一个对应于一个去相关 音频对象136。
[0058] 可以对去相关组件118进行去相关处理的Ν个逼近音频对象110中的每一个进行 不同的去相关处理,例如,通过将白噪声滤波器应用于被去相关的逼近音频对象,或者通过 应用任何其他的合适的去相关处理,诸如全通滤波。
[0059] 进一步的去相关处理的示例可以在以下中找到:MPEG参数化立体声编码工具(其 被用在HE-AACv2中,如IS0/IEC14496-3以及2004年5月德国柏林AES第116届大会的 论文:J.E.Hgdeg:&rd,H.Pu;rnhagen,J· Liljeryd,"Syntheticambiencein parametricstereocoding" 中所描述的那样)、MPEG环绕(IS0/IEC23003-1)以及MPEG SA0C(IS0/IEC23003-2)〇
[0060] 为了不引入不想要的相关性,不同的去相关处理是互相去相关的。根据其他实施 例,对逼近音频对象110中的若干或全部对象进行相同的去相关处理。
[0061] 系统100还包括音频对象重构组件128。对象重构组件128被布置在音频对象逼 近组件108、去相关组件118和第二接收组件112的下游。对象重构组件128被配置为,针 对N个逼近音频对象138中的不具有对应的去相关音频对象136的每个逼近音频对象,通 过逼近音频对象138来重构音频对象142的时间/频率瓦片。换句话说,如果某一逼近音 频对象138尚未进行去相关处理,则它被简单地重构为由音频对象逼近组件108提供的逼 近音频对象110。对象重构组件128被进一步配置为,针对N个逼近音频对象110中的具有 对应的去相关音频对象136的每个逼近音频对象,使用去相关音频对象136和对应的逼近 首频对象110两者来重构首频对象的时间/频率瓦片。
[0062] 为了促进该进程,第二接收组件112被进一步配置为针对N个逼近音频对象110 中的具有对应的去相关音频对象136的每个逼近音频对象,接收至少一个加权参数132。所 述至少一个加权参数132表不第一加权因子116和第二加权因子114。也被称为干因子的 第一加权因子116以及也被称为湿因子的第二加权因子116,由湿/干提取器134从所述至 少一个加权参数132推导出。第一加权因子116和/或第二加权因子114可以是随时间和 频率变化的,g卩,加权因子116、114的值针对被处理的每个时间/频率瓦片可以是不同的。
[0063] 在一些实施例中,所述至少一个加权参数132包括第一加权因子116和第二加权 因子114。在一些实施例中,所述至少一个加权参数132包括单个加权参数。如果如此,则 湿/干提取器134可以从所述单个加权参数132推导出第一加权因子116和第二加权因子 114。例如,第一加权因子116和第二加权因子114可以满足某些关系,这些关系允许一旦 加权因子中的一个加权因子是已知的,贝U另一个加权因子就可以被推导。这样的关系的不 例可以是,第一加权因子116和第二加权因子114的平方和等于一。因此,如果单个加权参 数132包括第一加权因子116,则可以按照一减去平方的第一加权因子116的平方根来推导 第二加权因子114,反之亦然。
[0064] 第一加权因子116用于加权122,即,用于与逼近音频对象110相乘。第二加权因 子114用于加权120,即,用于与对应的去相关音频对象136相乘。音频对象重构组件128 被进一步配置为例如通过执行求和来组合124加权的逼近音频对象150与对应的加权的去 相关音频对象152,以重构对应的音频对象142的时间/频率瓦片。
[0065] 换句话说,针对每个对象和每个时间/频率瓦片,去相关的量可以由一个加权参 数132控制。在湿/干提取器134中,该加权参数132被转换为被应用于逼近对象110的 权重因子116 (wd")以及被应用于去相关对象136的权重因子114 (Wiret)。这些权重因子的 平方和为一,即,
[0066]
[0067] 这意味着作为求和124的输出的最终对象142具有与对应的去相关对象110相同 的能量。
[0068] 为了使得输入信号126、130可以被不能处理去相关的音频解码器系统解码,即, 为了保持与这样的音频解码器的向后兼容性,输入信号126可如图2中所描绘的那样被布 置在帧202中。根据该实施例,使用第一格式将重构矩阵104布置在帧202的第一字段中, 并且使用第二格式将所述至少一个加权参数132布置在帧202的第二字段中。以这种方式, 能够读取第一格式、但不能读取第二格式的解码器仍然可以对重构矩阵104进行解码并且 以任何常规的方式使用重构矩阵104来对下混信号106进行上混。帧202的第二字段在这 种情况下可以被丢弃。
[0069] 根据一些实施例,图1中的音频解码系统100可以例如在第一接收组件102处附 加地接收L个辅助信号144。可以存在一个或多个这样的辅助信号,S卩,L多1。这些辅助 信号144可以被包括在输入信号130中。辅助信号144可以以这样的根据以上的向后兼容 性得到保持的方式被包括在输入信号130中,S卩,以使得不能处理辅助信号的解码器系统 仍然可以从输入信号130中推导处下混信号106。重构矩阵104可以进一步实现从Μ个下 混信号106和L个辅助信号144重构Ν个音频对象110的逼近。音频对象逼近组件108因 此可以被配置为将重构矩阵104应用于Μ个下混信号106和L个辅助信号144以便产生Ν 个逼近音频对象110。
[0070] 辅助信号144的作用是改进在音频对象逼近组件108中对Ν个音频对象的逼近。 根据一个示例,辅助信号144中的至少一个辅助信号等于Ν个音频对象中的将被重构的一 个。在这种情况下,用于重构特定音频对象的重构矩阵104中的矢量将仅包含单个非零参 数,例如,具有值一(1)的参数。根据其他示例,L个辅助信号144中的至少一个辅助信号 是Ν个音频对象中的将被重构的至少两个的组合。
[0071] 在一些实施例中,L个辅助信号可以表示N个音频对象的信号维度,这些信号维度 是在从N个音频对象产生Μ个下混信号106的过程中丢失的信息。这可以通过说明Μ个下 混信号106跨越信号空间中的超平面并且L个辅助信号144不位于该超平面中来进行解 释。例如,L个辅助信号144可以与Μ个下混信号106跨越的超平面正交。仅基于Μ个下 混信号106,只有位于超平面中的信号可以被重构,S卩,不位于超平面中的音频对象将被超 平面中的音频信号逼近。通过在重构中进一步使用L个辅助信号144,不位于超平面中的信 号也可以被重构。结果是,可以通过还使用L个辅助信号来改进音频对象的逼近。
[0072] 图3以举例的方式示出了用于产生至少一个加权参数320的音频编码器
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1