用于混迭误差信号来处理音频信号的装置及方法_3

文档序号:9794130阅读:来源:国知局
迭减少必须考虑到可以将不同 分量复制到影响常见交叠区的两个帧的相同频率索引。在产生混迭减少分量时必须考虑这 种情况。为此,上文将第一帧中的修补视作在帧j-Ι中具有为gn(k)的增益,且在帧j中具有 为0的增益,假定帧j中的修补在帧j-Ι中具有为0的增益且在帧j中具有为gj(k)的增益。用 于产生混迭减少信号的所得频谱系数如下所示:
[0081] Uj(k)=-gj-i(k) · Xj-i(Pj-i(k))+gj(k) · Xj-i(Pj(k))
[0082] Uj-i(k)=-gj-i(k) · Xj(Pj-i(k))+gj(k) · Xj(Pj(k))
[0083]图313不出了这种配置的框图。
[0084]在以下部分中,考虑到类似性,更详细地论述图3a以及图5a和5b中的两个方面。 [0085]通过下式,来定义MDCT,其中所述MDCT的频率分辨率为包括自样本位置jN开始的 2N个样本的帧Xj(n)的N个频谱系数:
[0087] 其中w(n)是长度2N的窗口函数,k是频率索引,η是时域中的样本索引。时间信号X (η)的帧xj (η)被定义为:
[0088] xj(n) = x( jN+n) ,0 < n<2N
[0089] 通过对频谱分量Yj(k)进行反向变换,来获得中间输出帧夕/(〃),〇_ < 2Λ;
[0091 ]通过将交叠片段相加来计算MDCT逆处理(BTOCT)的最终输出:
[0094] w(N-1-n) =w(N+n)
[0095] 且
[0096] w2(n) = l-w2(N+n)
[0097] 交叠区中的BTOCT在应用增益因子之后的输出为:
[0099] 其中
[0101 ]交叠相加、开窗口及时间反转之后,结合图lb、3a所描述的第二方面的混迭校正项 为:
[0105]余弦项具有以下对称性:
[0108] 代入这种对称性得到:
[0111]从yk(n)减去rk(n)给出构成混迭减少的输出的项:
[0113]这与根据参考图la、5a及5b所示和所述的第一方面用增益幻―丨仏丨和幻仏)重建构 出的信号之间的平滑转换相对应。
[0114]随后,参考图lc及ld,以便示出时间部分与块(无论在编码器或分析侧上还是在解 码器或合成侧上)的关系。
[0115]图Id示出了第0时间部分至第3时间部分的示意性表示,且这种后续时间部分的每 个时间部分具有特定交叠范围170。基于这种时间部分,通过参考图2a详细所述的处理(示 出了引入混迭的变换操作的分析侧),来产生表示交叠时间部分的一系列块的块。
[0116] 具体地,当图Id应用于分析侧时,通过应用分析窗口的开窗口器201来对图Id所示 的时域信号开窗口。因此,为了获得例如第〇时间部分,开窗口器将分析窗口应用于例如 2048个样本(具体地,应用于样本1至样本2048)。因此,N等于1024,窗口的长度为2N个样本 (在该示例中,为2048)。然后,开窗口器应用另一分析操作,但并非将样本2049作为该块的 第一样本,而是将样本1025作为该块中的第一样本,以便获得第一时间部分。因此,获得第 一交叠范围170,所述第一交叠范围是50 %交叠的1024个样本长。附加地,针对第二和第三 时间部分应用这种过程,但该过程始终具有交叠以便获得特定交叠范围170。
[0117] 应强调,交叠未必必须为50%交叠,交叠还可以是更高和更低程度,且甚至可以存 在多交叠(即,多余两个窗口的交叠),使得时域音频信号的样本并非仅有助于两个窗口和 相应的频谱值块,且样本还有助于超过两个的窗口 /频谱值块。另一方面,本领域技术人员 还应理解,存在可以由图2a的开窗口器201应用的其他窗口形状,所述其他窗口形状具有0 个部分及/或具有单一值的部分。对于这种具有单一值的部分,似乎这种部分通常与在先窗 口或后续窗口的〇个部分相交叠,因此位于具有单一值的窗口的恒定部分中的特定音频样 本仅有助于单个频谱值块。
[0118] 然后,将由图Id获得的窗口型时间部分传送至用于执行迭入操作的折迭器202。这 种迭入操作可以例如执行迭入,使得在折迭器202的输出处,仅存在每块具有N个样本的采 样值的块。然后,在折迭器202执行的折迭操作之后,应用时间-频率转换器,所述时间-频率 转换器例如是将输入处的每块N个样本转换为在时间-频率转换器203的输出处的N个频谱 值的DCT-IV转换器。
[0119] 因此,图lc示出了在块203的输出处获得的一系列频谱值块,具体示出了与在图la 和lb的102处所不的第一修改值相关联的第一块191和与例如在图la和lb的106所不的第二 修改值相关联的第二块192。自然地,如图所示,该序列在第二块之前或甚至在第一块之前 具有更多块193或194。第一和第二块191、192是例如通过变换图Id的窗口型第一时间部分 以获得第一块而获得的,且第二块是通过经由图2a的时间-频率转换器203变换图Id的窗口 型第二时间部分而获得的。因此,一系列频谱值块中彼此相邻的两个频谱值块代表被第一 时间部分和第二时间部分覆盖的交叠范围。
[0120]随后,讨论图2b以便示出对图2a的编码器或分析侧处理的结果进行的合成侧或解 码器侧处理。将由图2a的频率转换器203输出的一系列频谱值块输入到修改器211。如已概 述,对于图lc至2b所示的示例,每个频谱值块具有N个频谱值。每个块与其修改值相关联,诸 如,图la和lb所示的102、104。然后,在典型IMDCT操作或典型冗余减少合成变换中,执行由 频率-时间转换器212、用于迭出的折迭器213、用于应用合成窗口的开窗口器214所示的操 作以及由块215所示的交叠/加法器操作,以便获得在交叠范围中的时域信号。在该示例中, 上述信号每块具有2N个值,使得在每个交叠和加法运算之后,如果修改值102、104不可随时 间或频率变化,则获得N个新的不含混迭的时域样本。然而,如果这些值可随时间及频率变 化,则块215的输出信号并非是不含混迭的,但是可以通过在图lb和la的背景下讨论的及在 本说明中其它附图的背景下讨论的本发明的第一与第二方面来解决该问题。
[0121 ]随后,给出由图2a和2b的块执行的过程的另一说明。
[0122]尽管参考MDCT来例示所述说明,但是可以以类似及相似方式来处理其他引入混迭 的变换。作为交迭变换,MDCT相比于其他傅里叶相关变换的不同之处在于:它的输出是输入 的一半(而非相同数目)。具体地,MDCT为线性函数F:R 2N-RN(其中R表示实数集)。根据下式 将2N个实数x0、……、x2N-l变换成N个实数X0、……、XN_1:
[0124](这种变换前面的归一化系数(文中,具备统一性)是任意约定的并且在处理之间 是不同的。下文仅约束MDCT和IMDCT的归一化的乘积。)
[0125]逆MDCT被称为IMDCT。因为存在不同数目的输入和输出,所以乍看之下可能认为 MDCT不应是可逆的。然而,通过将时间相邻的交叠块的交叠頂DCT相加,来实现完美可逆性, 从而消除误差且获取原始数据;这种技术被称为时域混迭消除(TDAC)。
[0126] BTOCT根据下式将N个实数X0、……、XN-1变换成2N个实数y0、……、y2N_l:
[0128] (与DCT-IV、正交变换相似,逆变换与前向变换具有相同形式。)
[0129] 在具有一般窗口归一化的窗口型MDCT的状况下(参见下文),应将IMDCT前面的归 一化系数乘以2(即,变成2/N)。
[0130]在典型信号压缩应用中,通过使用与上述MDCT和頂DCT公式中的xn和yn相乘的窗 口函数wn(n = 0,. . .,2N-1)来进一步改善变换特性,以便通过使该函数在n = 0及2N的点处 平滑地归零,来避免在这些点的边界处的不连续性。(也就是说,可以在MDCT之前和頂DCT之 后对数据进行开窗口。)原则上,X和y可以具有不同窗口函数,且所述窗口函数还可以从一 个块改变至下一块(尤其是在组合不同大小的数据块的情况下),但是为了简单起见,考虑 针对大小相等的块使用相同窗口函数的常见状况。
[0131 ] 对于对称窗口 wn=w2N_l_n,只要w满足以下Princen-Bradley条件,则所述变换保 持可逆的(也就是说,TDAC起作用):
[0132] K +
[0133] 使用各种窗口函数。下式给出产生被称作调制型交迭变换的形式的窗口:
[0135] 该窗口被用于MP3及MPEG-2AAC,且
[0137] 针对VorbisjC-3使用凯赛-贝塞尔导出(KBD)窗口,且MPEG-4AAC也可以使用KBD 窗口。
[0138] 应注意,应用于MDCT的窗口与针对一些其他类型的信号分析使用的窗口不同,这 是由于所述窗口必须满足Princen-Bradley条件。这种区别的原因之一是将MDCT窗口应用 了两次,用于MDCT(分析)及頂DCT(合成)两者。
[0139]通过检查定义可以看出,对于偶数N,MDCT基本上等效于DCT-IV,其中将输入移位 N/2并且一次变换两个N个数据块。通过更仔细地检查这种等效,可以容易地导出诸如TDAC 的重要特性。
[0140]为了定义与DCT-IV的精确关系,必须认识到DCT-IV与交替的偶数/奇数边界条件 相对应:偶数在其左边界处(约n = -l/2),奇数在其右边界处(约n = N-l/2)等等(而不是针 对DFT的周期性边界)。这种情况遵循标识。因此,如果其输入是:
[0143] 因此,如果其输入是长度为N的阵列X,则可以想到将该阵列扩展为(x、-XR、-x、 xR......)等,其中xR表示逆序下的χ。
[0144] 考虑具有2N个输入和N个输出的MDCT,其中将所述输入划分为四个块(a,b,c,d), 每个块具有N/2的大小。如果将这些数据向右移位N/2(在MDCT定义下,从+N/2项起),则(b, c,d)扩展经过N个DCT-IV输入的端部,因此必须根据上文所述的边界条件来将所述输入"折 叠"回去。
[0145] 因此,2N个输入(a,b,c,d)的MDCT恰好等效于N个输入的DCT-IV: (-cR-d,a-bR),其 中R表示如上所述的反转(reversal)。
[0146] 针对图2a的窗口函数202例示出这种情况,a是部分204b、b是部分205a、c是部分 205b且d是部分206a。
[0147] (这样,可以将计算DCT-IV的任何算法一般地(trivially)应用于MDCT。)
[0148] 类似地,上述頂DCT公式恰好是DCT-IV的1/2(该公式是其自身的逆公式),其中输 出被扩展至(经由边界条件)长度为2N且往回向左移位N/2。根据上述过程,逆D
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1