基于qmf的处理数据的时间对齐的制作方法_4

文档序号:9872511阅读:来源:国知局
应的波形数据对齐的元数据延迟单元256。在示出的示例 中,音频编码器250的元数据延迟单元256不引入任何附加延迟(因为元数据处理链所引入 的延迟比波形处理链所引入的延迟更大)。
[0073]另外,音频编码器250包括被配置为根据音频编码器250的输入处的原始音频信号 来确定波形数据的波形处理链251、252、253、254、255。波形处理链包括波形延迟单元252, 波形延迟单元252被配置为将附加延迟引入到波形处理链中,以使波形数据与对应的元数 据对齐。由波形延迟单元252引入的延迟可以使得元数据处理链的(包括波形延迟单元252 所插入的波形延迟的)总体延迟对应于波形处理链的总体延迟。在帧长度N = 2048的情况 下,波形延迟单元252的延迟可以是2048-320 = 1728个样本。
[0074]图3a示出了包括扩展单元301的音频解码器300的选段。图3a中的音频解码器300 可以对应于图1和/或图2a中的音频解码器100并且还包括被配置为利用从存取单元110中 的解码后的元数据128得到的一个或多个扩展参数310根据多个低波段信号123来确定多个 扩展后的低波段信号。通常,一个或多个扩展参数310与存取单元110内包括的SBR(例如A-SPX)元数据相耦合。换言之,一个或多个扩展参数310通常可施加于音频信号中与SBR元数 据相同的选段或部分。
[0075] 如在上面概述,存取单元110中的元数据112通常与音频信号的帧的波形数据111 相关联,其中该帧包括预定数目N个样本。SBR元数据通常基于多个低波段信号(也称作多个 波形子带信号)来确定,其中多个低波段信号可以利用QMF分析来确定。QMF分析产生音频信 号的帧的时间-频率表示。具体而言,音频信号的帧的N个样本可以由Q(例如Q = 64)个低波 段信号表示,这Q个低波段信号各自包括N/Q个时隙。对于具有N= 2048个样本的帧并且对于 Q = 64,每一个低波段信号包括N/Q = 32个时隙。
[0076] 在特定帧内的瞬变的情况下,基于直接在后帧的样本来确定SBR元数据可能是有 益的。该特征被称作SBR超前。具体而言,SBR元数据可以基于来自后一帧的预定数目的时隙 来确定。例如,后一帧的多达6个时隙可被考虑在内(即,Q*6 = 384个样本)。
[0077] SBR超前的使用在图4中被示出,图4示出了将不同的组帧400、430用于SBR或HFR方 案的音频信号的一系列帧401、402、403。在组帧400的情况下,381?/册1?方案不利用381?超前 所提供的灵活性。然而,固定的偏移一即固定的SBR超前延迟一480被用来实现使用SBR超 前。在示出的示例中,固定偏移对应于6个时隙。作为该固定偏移480的结果,特定帧402的特 定存取单元110的元数据112可部分地施加于位于特定存取单元110之前(并且与直接在前 帧401相关联)的存取单元110内包括的波形数据111的时隙。这由SBR元数据411、412、413与 帧401、402、403之间的偏移示出。因此,存取单元110内包括的381?元数据411、412、413可能 可施加于被偏移了SBR超前延迟480的波形数据111 JBR元数据411、412、413被施加于波形 数据111以提供重构帧421、422、423。
[0078]组帧430利用SBR超前。可见SBR元数据431例如由于帧401内的瞬变的发生而可施 加于波形数据111的多于32个时隙。另一方面,在后SBR元数据432可施加于波形数据111的 少于32个时隙。SBR元数据433再一次可施加于32个时隙。因此,SBR超前允许关于SBR元数据 的时间分辨率的灵活性。应当注意到,无论SBR超前的使用并且无论SBR元数据431、432、433 的适用性,针对帧401、402、402使用固定偏移480来生成重构帧421、422、423。
[0079]音频编码器可被配置为利用音频信号的同一选段或同一部分来确定SBR元数据和 一个或多个扩展参数。因此,如果SBR元数据是利用SBR超前来确定的,则一个或多个扩展参 数可被确定并且可能可施加于同一 SBR超前。具体而言,一个或多个扩展参数可以可施加于 与对应的SBR元数据431、432、433相同数目的时隙。
[0080] 扩展单元301可被配置为将一个或多个扩展增益施加于多个低波段信号123,其中 这一个或多个扩展增益通常取决于一个或多个扩展参数310。具体而言,一个或多个扩展参 数310可以对用来确定一个或多个扩展增益的一个或多个压缩/扩展规则有影响。换言之, 一个或多个扩展参数310可以指示已被对应音频编码器的压缩单元使用的压缩函数。一个 或多个扩展参数310可以使得音频解码器能够确定该压缩函数的逆。
[0081] -个或多个扩展参数310可以包括指示对应的音频编码器是否已经压缩多个低波 段信号的第一扩展参数。如果尚未施加压缩,则音频解码器将不施加扩展。因此,第一扩展 参数可以用来打开或者关闭压缩扩展特征。
[0082] 可替代地或者除此之外,一个或多个扩展参数310可以包括指示相同的一个或多 个扩展增益是否将被施加于多声道音频信号的所有声道的第二扩展参数。因此,第二扩展 参数可以在压缩扩展特征的每声道施加或者每多声道施加之间进行切换。
[0083]可替代地或者除此之外,一个或多个扩展参数310可以包括指示是否要针对帧的 所有时隙施加相同的一个或多个扩展增益的第三扩展参数。因此,第三扩展参数可以用来 控制压缩扩展特征的时间分辨率。
[0084]利用一个或多个扩展参数310,扩展单元301可以通过施加在对应音频编码器处施 加的压缩函数的逆来确定多个扩展后的低波段信号。利用一个或多个扩展参数310将已经 在对应音频编码器处施加的压缩函数通过信号通知给音频解码器300。
[0085] 扩展单元301可以位于超前延迟单元104的下游。这保证了 一个或多个扩展参数 310被施加于多个低波段信号123的正确部分。具体而言,这保证了一个或多个扩展参数310 被施加于多个低波段信号123中与(SBR施加单元106内的)SBR参数相同的部分。因此,保证 了扩展对与SBR方案相同的时间组帧400、430进行操作。由于SBR超前,组帧400、430可以包 括可变数目的时隙,结果,扩展可以对可变数目的时隙进行操作(如在图4的情况下概述)。 通过将扩展单元301置于超前延迟单元104的下游,保证了正确的组帧400、430被施加于一 个或多个扩展参数。结果,即使在拼接点之后也可以保证高质量的音频信号。
[0086]图3b示出了包括压缩单元351的音频编码器350的选段。音频编码器350可以包括 图2b中的音频编码器250的组件。压缩单元351可被配置为利用压缩函数来压缩多个低波段 信号(例如降低其动态范围)。另外,压缩单元351可被配置为确定指示已被压缩单元351使 用的压缩函数的一个或多个扩展参数310,以使得音频解码器300的对应扩展单元301能够 施加压缩函数的逆。
[0087]可以在SBR超前258的下游执行对多个低波段信号的压缩。另外,音频编码器350可 以包括SBR组帧单元353, SBR组帧单元353被配置为保证SBR元数据是针对音频信号中与一 个或多个扩展参数310相同的部分来确定的。换言之,SBR组帧单元353可以保证SBR方案对 与压缩扩展方案相同的组帧400、430进行操作。鉴于SBR方案(例如在瞬变的情况下)可以对 扩展后的帧进行操作的事实,压缩扩展方案也可以对扩展后的帧(包括附加时隙的)进行操 作。
[0088] 在本文档中,已经分别描述了音频编码器和对应的音频解码器,其允许将音频信 号编码为一系列时间对齐的AU,这些时间对齐的AU包括与音频信号的一系列段相关联的波 形数据和元数据。时间对齐的AU的使用实现了拼接数据流,同时在拼接点处减少了假象。另 外,音频编码器和音频解码器被设计为使得可拼接的数据流被以计算高效的方式处理并且 使得总体编码延迟保持低。
[0089] 在本文档中描述的方法和系统可被实现为软件、固件和/或硬件。某些组件例如可 被实现为在数字信号处理器或者微处理器上运行的软件。其他组件例如可被实现为硬件 和/或实现为专用集成电路。在所描述的方法和系统中遇到的信号可被存储在诸如随机存 取存储器或者光学存储介质之类的介质上。它们可以经由诸如无线电网络、卫星网络、无线 网络或有线网络一例如因特网一之类的网络而被传送。利用在本文档中描述的方法和系统 的典型设备是便携式电子设备或者用来存储和/或渲染音频信号的其他消费者设备。
【主权项】
1. 一种音频解码器(1〇〇,300),其被配置为根据接收到的数据流的存取单元(110)来确 定音频信号(127)的重构帧;其中存取单元(110)包括波形数据(111)和元数据(112);其中 波形数据(111)和元数据(112)与音频信号(127)的同一重构帧相关联;其中音频解码器 (100,300)包括 一波形处理路径(101,102,103,104,105),其被配置为根据波形数据(111)生成多个波 形子带信号(123); 一元数据处理路径(108,109),其被配置为根据元数据(111)生成解码后的元数据 (128);以及 一元数据施加和合成单元(106,107),其被配置为根据所述多个波形子带信号(123)并 根据解码后的元数据(128)来生成音频信号(127)的重构帧;其中波形处理路径(101,102, 103.104.105) 和/或元数据处理路径(108,109)包括被配置为使所述多个波形子带信号 (123)和解码后的元数据(128)时间对齐的至少一个延迟单元(105,109)。2. 如权利要求1所述的音频解码器(100,300),其中,所述至少一个延迟单元(105,109) 被配置为使所述多个波形子带信号(123)和解码后的元数据(128)时间对齐以使得波形处 理路径(101,102,103,104,105)的总体延迟对应于元数据处理路径(108,109)的总体延迟。3. 如任何先前权利要求所述的音频解码器(100,300),其中,所述至少一个延迟单元 (105,109)被配置为使所述多个波形子带信号(123)和解码后的元数据(128)时间对齐以使 得所述多个波形子带信号(123)和解码后的元数据(128)被及时地提供给元数据施加和合 成单元(106,107)以供元数据施加和合成单元(106,107)执行处理。4. 如任何先前权利要求所述的音频解码器(100,300),其中,元数据处理路径(108, 109)包括元数据延迟单元(109),该元数据延迟单元(109)被配置为使解码后的元数据 (128)延迟音频信号(127)的重构帧的帧长度N的大于零的整数倍。5. 如权利要求4所述的音频解码器(100,300 ),其中,所述整数倍使得元数据延迟单元 (109)所引入的延迟大于波形处理路径(101,102,103,104,105)的处理所引入的延迟。6. 如权利要求4至5中任一个所述的音频解码器(100,300),其中,所述整数倍对于大于 960的帧长度N而言是一,并且其中所述整数倍对于小于或等于960的帧长度N而言是二。7. 如任何先前权利要求所述的音频解码器(100,300),其中,波形处理路径(101,102, 103.104.105) 包括波形延迟单元(105),该波形延迟单元(105)被配置为使所述多个波形子 带信号(123)延迟以使得波形处理路径的总体延迟对应于音频信号(127)的重构帧的帧长 度N的大于零的整数倍。8. 如任何先前权利要求所述的音频解码器(100,300),其中,波形处理路径(101,102, 103,104,105)包括 一解码和解量化单元(101),其被配置为对波形数据(111)进行解码和解量化以提供指 示波形信号的多个频率系数(
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1