用于多声道音频编码的噪声填充的制作方法

文档序号:9925379阅读:414来源:国知局
用于多声道音频编码的噪声填充的制作方法
【技术领域】
[0001] 本发明关于一种用于多声道音频编码的噪声填充。
【背景技术】
[0002] 现代频域语音/音频编码系统,例如IETF[1]的化us/Celt编解码器及MPEG-4皿-AAC[2],或者,特别是MPEG-D X皿-AA(XUSAC) [3],用于编码音频帖,运些音频帖要么使用长 变换-长区块,要么使用八个相继短变换-短区块,其取决于信号的瞬时稳定性。除此之外, 对于低比特率编码,运些方案使用相同声道的伪随机噪声或低频系数并且提供工具W重建 声道的频率系数。在址E-AAC,运些工具分别作为噪声填充及频谱带复制。
[0003] 然而,对于非常音调的或瞬时立体声效的输入,单独的噪声填充及/或频谱带复制 在非常低的比特率情况下限制可实现的编码质量,主要因为两个声道的过多的频谱系数需 要被明确地传递。

【发明内容】

[0004] 因此,本发明的目的是提供用于执行多声道音频编码中的噪声填充的概念,该多 声道音频编码提供更高效率的编码,特别是在非常低的比特率情况下。
[0005] 本发明的目的由所附独立权利要求的主题实现。
[0006] 本发明是基于如下发现:在多声道音频编码中,如果使用噪声填充源而不是人工 产生的噪声或相同声道的频谱复制来执行声道的零量化比例因子频带的噪声填充,可实现 编码效率的提升。尤其是,基于使用来自多声道音频信号的先前帖或当前帖的不同声道的 频谱线产生的噪声,通过执行噪声填充,多声道音频编码的效率可W呈现更高的效率。
[0007] 通过使用多声道音频信号的先前帖的频谱共置的频谱线,或使用多声道音频信号 的其它声道的频谱时序共置的频谱线,运能够实现重建的多声道音频信号的更舒适的质 量,特别在非常低的比特率时,编码器需要接近零量化的频谱线的情况,W作为整体的零量 化比例因子带。由于噪声填充的提升,编码器的质量损失更少,则可W选择零量化更多的比 例因子带,从而提高编码效率。
[000引根据本发明实施例,用于执行噪声填充的源与用于执行复值立体声预测的源部分 地重迭。尤其是,先前帖的降混可W被使用作为噪声填充的源W及共享为执行或至少增强 虚拟部分估计W应用于执行复声道间预测的源。
[0009] 根据实施例,现有的多声道音频编解码器W反向兼容的方式被延伸,W便W逐帖 方式发出信号,应用于声道间噪声填充。依照下面所述的具体实施例,例如信号作用于反向 兼容的方式延伸址E-AAC,并且利用有条件地编码的噪声填充参数的未使用状态,使信号开 启及关闭声道间噪声填充。
【附图说明】
[0010] 本发明的有利的实施是从属权利要求的主题。W下参考附图描述本发明的优选实 施例,其中:
[0011] 图1示出根据本发明实施例的参数化频域解码器的框图;
[0012] 图2示出描述频谱序列的示意图,该频谱序列形成多声道音频信号的声道的频谱 图,W容易理解图1的解码器的描述;
[0013] 图3示出描述图2所示的频谱图之外的当前频谱的示意图,W容易理解图1的解码 器的描述;
[0014] 图4示出另一实施例的参数化频域音频解码器的框图,该参数化频域音频解码器 的先前帖的降混被用作声道间噪声填充的基底;W及
[0015] 图5示出实施例的参数化频域音频编码器的框图。
【具体实施方式】
[0016] 图1示出根据本发明实施例的频域音频解码器。该解码器通常使用标号10标示,并 且该解码器包含比例因子频带识别器12、去量化器14、噪声填充器16及逆变换器18及频谱 线提取器20, W及比例因子提取器22。解码器10可能包括的可选的进一步的元件包含复立 体声预测器24、MS(mid-side,中间-两侧)解码器26及逆TNS(Temporal Noise化aping,瞬 时噪声整形)滤波工具,图1示出逆TNS滤波工具的两个实例28a及28b。除此之外,使用标号 30表示的降混供应器示出及详细介绍如下。
[0017] 图1的频域音频解码器10是支持噪声填充的参数化解码器,根据该参数化解码器, 使用比例因子带的比例因子对某个零量化比例因子带填充噪声,该参数化解码器作为工具 W控制填充于该比例因子带的噪声的水平。除此之外,图1的解码器10代表多声道音频解码 器,用于重建来自入站(inbound)数据流30的多声道音频信号。然而,图1聚焦于解码器10中 设及重建多声道音频信号之一的元件,多声道音频信号被编码于数据流30并输出位于输出 端32的(输出)声道。标号34表示解码器10可包含进一步的元件或可W包含一些管线的操作 控制,用于负责重建多声道音频信号的其它声道,其中W下描述指示位于输出端32的感兴 趣声道的解码器10的重建如何与其它声道的解码交互作用。
[0018] 数据流30表示的多声道音频信号可包含两个或多个声道。如下所述,本发明的实 施例的描述专注于立体声案例,立体声案例是仅包含两个声道的多声道音频信号,但是原 则上,下述提出的实施例可W容易的被变换成可选的实施例,即关于多声道音频信号及其 包含两个W上声道的编码。
[0019] 如下图1的描述中将更清楚的示出,图1的解码器10是变换解码器,亦即根据解码 器10的编码方法,声道被编码于变换域,例如使用声道的重迭变换。此外,依据音频信号的 创建器,存在时间相位,在运些时间相位期间,音频信号的声道大部分代表相同的音频内 容,彼此之间仅存在它们之间的微量或确定性改变的不同之处,例如不同的振福及/或相位 W代表音频场,其中声道之间的不同使音频场的音频源的虚拟位置能够相关于虚拟扬声器 的位置,该虚拟扬声器位置与多声道音频信号的输出声道相关联。然而,在一些其它瞬时相 位,音频信号的不同声道可W几乎彼此非相关,且甚至可代表完全不同的音频源。
[0020] 为了说明音频信号的声道之间会随时间改变的可能的关系,图1的解码器10下方 的编解码器允许随时间改变的不同测量的用法,W利用声道间冗余。例如,MS编码允许代表 立体声音频信号的左声道及右声道之间的切换,或作为一对M(中间)声道及S(侧边)声道代 表左声道及右声道的降混,并且分别减半它们之间的差异。即,在频谱时序的程度上,两个 声道的频谱连续地被数据流30变换,但运些(传输的)声道的含义可W分别随时间及相对于 输出声道而改变。
[0021] 复立体声预测(另一个声道间冗余开发工具)在频谱域里通过使用另一声道的频 谱共置线能够预测一个声道的频谱域系数或频谱线。关于运点的更多细节描述如下。
[0022] 为了方便理解下面关于图1及其中示出的元件的描述,图2示出数据流30表示的立 体声音频信号的示例性例子,对于两声道的频谱线如何取样数值,有一可能的方法是将两 声道的频谱线编码于数据流30, W通过图1的编码器10来处理。尤其是,图2的上半部分显示 立体声音频信号的第一信道的频谱图40,图2的下半部分显示立体声音频信号的其它声道 的频谱图42。再者,值得注意的是,频谱图40及42的"含义"可能会随着时间而改变,例如由 于在MS编码域及非MS编码域之间的随时间改变的切换。在第一实施例中,频谱图40及42分 别地设及M声道及S声道,其中在后面的例子中,频谱图40和42设及左声道和右声道。MS编码 域及非MS编码域之间的切换可W被信号化于数据流30。
[0023] 图2示出在随时间改变的频谱时序分辨率上,频谱图40及42可W被编码于数据流 30。举例来说,两个(传输)声道可W W时间同步的方式细分成帖序列,并且用大括号44标 示,大括号44可W是相同长度并且彼此相连但没有重迭。如刚才所提到的,被表示于数据流 30的频谱图40及42的频谱分辨率可W随时间而改变。起初,对频谱图40及42而言,假设频谱 时序分辨率随时间的改变是相同的,但在下面的描述中将可明显的看到该简化的延伸也是 可行的。频谱时序分辨率的改变,例如W帖44为单位被信号化于数据流30,亦即频谱时序分 辨率W帖44为单位而改变。在频谱图40及42的频谱时序分辨率中的改变可通过切换变换长 度及变换数量来实现,运被用于描述每个帖44内的频谱图40及42。在图2的示例中,W帖44a 及帖44b为例,为了取样帖内音频信号的声道,通过使用长变换产生最高频谱分辨率,且对 于每个声道的每个运种帖,每个频谱线具有一个频谱线取样值。在图2中,频谱线的取样值 在格子内使用小叉来标示,反过来,格子被排列成行及列,并将代表频谱时序网格,每列频 谱时序网格对应于一个频谱线及每行频谱时序网格对应于帖44的次时间间隔,帖44对应于 参与形成频谱40及42的最短变换。尤其是,图2示出,例如对于帖44d,帖可能可选地使用较 短长度的连续变换,从而导致如帖44d此类的帖产生降低的频谱分辨率的数个时序连续频 谱。W八个短变换被用于帖44d为示例,所述之八个短变换在帖42d内产生之频谱图40及42 之一频谱时序取样,并且在频谱线彼此间隔开,使得仅有第八个频谱线被填充,但是对于八 个变换窗口或用于变换帖44d的较短长度的变换中的每一个均有取样值。为了说明目的,图 2示出帖的其它数量的变换也是可行的,例如变换长度的两个变换的使用,举例来说,对于 帖44a及44b,长变换的半个变换长度产生时序频谱的网格或频谱图40及42的取样,其中每 第二个频谱线获得两个频谱线取样值,上述两个频谱线取样值的其中一个为主变换,另一 个为尾随变换。
[0024] 帖被细分为变换的变换窗口示出在图2下方,其中每个频谱图使用交迭窗口状线。 时序重迭用于例如时域混叠消除(Time-Domain Aliasing Cancellation,TDAC)的目的。
[0025] 尽管如此,但在下面进一步描述的实施例也可W W另一种方式来实现,图2示出在 不同频谱时序分辨率之间切换的情况,执行单个帖44,使得对于每个帖44,相同数量的频谱 线值(频谱线值由图2中的小叉标示)产生频谱图40及42,差异仅在线的频谱时序的取样方 式,对应于各个帖44,线对各个频谱时序片频谱时序地取样,在时间上跨越各个帖44的时 间,并且在频谱上从零频率跨越到最大频率fmax。
[0026] 图2示出关于帖44d,通过合适地分配频谱线取样值,所有的帖44可获得相似的频 谱,频谱线取样值属于相同的频谱线但不属于在一个声道的一个帖内的短变换窗口,在图2 中使用箭头,箭头从在帖内未被占用的(空的)频谱线指向相同帖的下一个被占用的频谱 线。运样得到的频谱在W下称为"交错频谱"。在交错中,一个声道的一个帖的n个变换,例 如,在频谱上随后的频谱线的n个短变换的n个频谱共置频谱线值的集合跟随之前,该n个短 变换的频谱共置频谱线值相互跟随。交错的中间形式也是可行的,W及:代替交错一个帖的 所有频谱线系数,仅交错帖44d的短变换的适当的子集合的频谱线系数是可行的。在任何情 况中,无论何时讨论对应于频谱图40及42的两个声道的帖的频谱,运些频谱可W参考交错 的或非交错的频谱。
[0027] 为了有效率地编码频谱线系数,对编码频谱线系数进行量化,此频谱线系数表示 通过数据流30传输到解码器1的频谱图40及42。为了频谱时序地控制量化噪声,量化步骤的 大小通过比例因子控制,比例因子被设定于一定的频谱时序网格。尤其是,在每个频谱图的 每个频谱顺序中,频谱线被分组成频谱连续不重迭的比例因子组。图3在其上半部分示出频 谱图40的频谱46W及在频谱图42之外的共时序频谱48。如图所示,频谱46及4的往着频谱轴f 被细分为比例因子带,用于将频谱线分组成不重迭的组。比例因子带在图3中使用大括号50 示出。为了简化起见,假设频谱46及48的比例因子带之间的边界互相重合,但此情况并不是 必须的。
[00%]也就是说,通过在数据流30中编码的方式,频谱图40及42中的每个分别被细分为 时序的频谱,并且运些频谱中的每个皆被频谱化细分成比例因子带,并且对于每个比例因 子带,数据流30对对应于各个比例
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1