技术简介:
本专利针对传统音频编码中分层结构效率低、频谱块划分不精准的问题,提出基于DRA多声道编码的分层方法。通过将编码数据按谱线序号值排序后分割为频谱块,并结合固定比特率划分、边界替代及双模式排列策略,实现频谱信息的高效组织与传输。该方法优化了数据分层结构,提升了编码适应性与传输效率。
关键词:分层音频编码,DRA算法,频谱块排列
专利名称:一种分层音频编码方法和系统的制作方法
技术领域:
本发明涉及一种音频编码方法及其系统,更具体地,涉及一种分层音频编码方法及其系统。
背景技术:
如图1A-1B所示,作为中国音频编码电子行业标准的DRA音频编、解码技术近年来 已为业内所熟知。有关DRA(Digital Rise Audio)音频编解码技术更详细的内容可参见信 息产业部2007年1月4日发布的、标准序号SJ/T11368-2006的行业标准,该标准的全部内 容在此以引用的方式并入本文。另外,为了叙述方便,下文中将该标准简称为“DRA标准”, 并将与DRA标准相应的DRA多声道数字音频编解码技术简称为“DRA技术”。DRA技术是一种高质量的多声道音频编码算法,其可支持固定码率和可变码率音 频编码,为DRA技术在不同领域的实施和推广打下了良好的基础。但DRA技术目前还不 能支持分层编码(即,可伸缩编码),这就使其无法具有下文所述的可伸缩编码算法所具 备的额外的优势(1)将最重要(内层)的数据包以更好的错误保护机制传输a)当使用 UEP(Unequal Error Protection 不等错保护)时,可以从内层到外层划分不同保护级别 的数据块;b)当进行自适应信道调度(如利用OFDM多载波中不同载波具有不同的信噪比 时)来实现UEP等作用,需要要求音频编码具有分级分层的数据结构。(2)对于网络(打包 方式)传输a)能够标记每个音频帧中各个数据包的重要性;b)如果当前所获得的带宽下 降,可以丢掉不重要的包(即外层码流数据),可以保证实时播放(不需要缓冲)。(3)对于 音频数据库a)高质量内容被编码和存储;b)不用重新编码,可以预听其低质量版本。(4) 对于仅仅一次编码,即可用于多传输通道的同播节目源如可以用于多种网络传输路径或 无线传输通道,不需要另外编码(相对应VBR模式情况,VBR可以满足一种特定可变带宽应 用)。随着DRA技术在产业中越来越广泛地应用,有必要定义一种基于DRA核心算法的 分层编码算法,通过该算法编码的音频可至少获得上文(1)_(4)所述的优点。
发明内容本发明的目的在于基于现有的DRA音频编码关键技术,设计可分层的DRA音频编 码方法及其系统,使DRA技术能被应用在一些需要分层编码的技术领域中。本发明首先提供了一种分层音频编码方法,其包括:A)通过多声道音频编码算法 编码输入多声道音频数据;B)被编码的数据被分为多个辅助数据块和多个频谱块;并且按 照多个频谱块中所含数据对应的谱线序号值大小来排列各个频谱块。优选地,多声道音频 编码算法是DRA多声道音频编码算法。进一步地,所述方法还包括C)将多个频谱块的数据中与频谱有关的部分分别排 列到多个频谱块中的每一个的谱系数部分中;以及D)将多个频谱块的数据中与频谱无关 的部分分别排列到多个频谱块中的每一个的剩余部分,也就是边信息部分中。
进一步地,在多个频谱块的每一个中,E)每一个谱系数部分都首先按照所对应谱 线序号值的大小排列编号较小的声道,然后再按照所对应谱线序号值的大小排列编号较大 的声道。
进一步地,在多个频谱块的每一个中,E)每个谱系数部分都首先按照声道编号的 大小排列具有较小谱线序号值的编码数据,然后再按照声道编号的大小排列具有较大谱线 序号值的编码数据。进一步地,根据编码特性,分别选择上述E)和F)两种方式之一对每个谱系数部分 进行排列。优选地,编码特性包括仅使用E)或仅使用F)进行所有谱系数部分排列所获得的 总编码效率。更进一步地,每一个频谱块的长度可精确对应固定比特率地划分、近似对应固定 比特率地划分、以及基于相应DRA码书段的长度来划分频谱块的长度。更进一步地,可通过在前和在后的各一个频谱块恢复当前的频谱块。优选地,频谱 块恢复包括使用在前和在后的各一个频谱块的系数进行线性内插。更进一步地,频谱块的分层个数的计算方法为频谱块的分层个数=(码率所对 应的帧长_帧头_边信息)/分层带宽。更进一步地,频谱块的边界都代替DRA码书段的边界。更进一步地,当频谱块的边界与DRA码书段的边界的距离小于某个预定阈值时, 采用DRA码书段的边界来代替频谱块的边界;当频谱块的边界与DRA码书段的边界的距离 大于某个预定阈值时,采用频谱块的边界代替DRA码书段的边界。本发明还提供了一种分层音频编码系统,包括G)音频编码器,编码器使用多声道 音频编码算法;H)分割器,包括分割模块,将被编码的数据分割为多个辅助数据块和多个 频谱块;该系统按照多个频谱块中所含数据对应的谱线序号值大小来排列各个频谱块。优选地,多声道音频编码算法是DRA多声道音频编码算法。进一步地,分割器还包括排列模块,其用于I)将多个频谱块的数据中与频谱有关 的部分排列到多个频谱块中的每一个的谱系数部分中;以及J)将多个频谱块的数据中与 频谱无关的部分排列到多个频谱块中的每一个的边信息部分。进一步地,在多个频谱块的每一个中,E)每个谱系数部分都首先按照所对应谱线 序号值的大小排列编号较小的声道,然后再按照所对应谱线序号值的大小排列编号较大的声道。进一步地,在多个频谱块的每一个中,F)每个谱系数部分都首先按照声道编号的 大小排列具有较小谱线序号值的编码数据,然后再按照声道编号的大小排列具有较大谱线 序号值的编码数据。进一步地,根据编码特性,分别选择上述E)和F)两种方式之一对每个谱系数部分 进行排列。优选地,编码特性包括仅使用E)或仅使用F)进行所有谱系数部分排列所获得的 总编码效率。更进一步地,每一个频谱块的长度可精确对应固定比特率地划分、近似对应固定 比特率地划分、以及基于相应DRA码书段的长度来划分频谱块的长度。
更进一步地,可通过在前和在后的各一个频谱块恢复当前的频谱块。优选地,频谱 块恢复包括使用在前和在后的各一个频谱块的系数进行线性内插。更进一步地,频谱块的分层个数的计算方法为频谱块的分层个数=(码率所对 应的帧长_帧头_边信息)/分层带宽。更进一步地,频谱块的边界都代替DRA码书段的边界。更进一步地,当频谱块的边界与DRA码书段的边界的距离小于某个预定阈值时, 采用DRA码书段的边界来代替频谱块的边界;当频谱块的边界与DRA码书段的边界的距离 大于某个预定阈值时,采样频谱块的边界代替DRA码书段的边界。本发明还提供了一种分层编码的多声道数字音频帧结构,包括多个辅助数据块 和多个频谱块;并且按照多个频谱块中所含数据对应的谱线序号值大小来排列各个频谱 块。优选地,帧结构保存的是经过DRA多声道音频编码算法编码后的数据。进一步地,多个频谱块的每一个分别包括排列了多个频谱块的数据中与频谱有 关部分的谱系数部分;以及边排列了多个频谱块的数据中与频谱无关部分的信息部分。进一步地,在多个频谱块的每一个中,E)每个谱系数部分都首先按照所对应谱线 序号值的大小排列编号较小的声道,然后再按照所对应频谱的大小排列编号较大的声道。进一步地,在多个频谱块的每一个中,E)每个谱系数部分都首先按照声道编号的 大小排列具有较小谱线序号值的编码数据,然后再按照声道编号的大小排列具有较大谱线 序号值的编码数据。进一步地,根据编码特性,分别选择上述E)和F)两种方式之一对每个谱系数部分 进行排列。优选地,编码特性包括仅使用E)或仅使用F)进行所有谱系数部分排列所获得的 总编码效率。更进一步地,每一个频谱块的长度可精确对应固定比特率地划分、近似对应固定 比特率地划分、以及基于相应DRA码书段的长度来划分频谱块的长度。更进一步地,通过在前和在后的各一个频谱块可恢复当前的频谱块。优选地,频谱 块恢复包括使用在前和在后的各一个频谱块的系数进行线性内插。更进一步地,频谱块的分层个数的计算方法为频谱块的分层个数=(码率所对 应的帧长_帧头_边信息)/分层带宽。更进一步地,频谱块的边界都代替DRA码书段的边界。更进一步地,当频谱块的边界与DRA码书段的边界的距离小于某个预定阈值时, 采用DRA码书段的边界来代替频谱块的边界;当频谱块的边界与DRA码书段的边界的距离 大于某个预定阈值时,采用频谱块的边界都代替DRA码书段的边界。基于上述技术方案,在现有DRA编码技术的基础上,通过对被编码的数据进行分层结构处理,设计出可分层的DRA音频编码方法及其系统。
图IA和IB是方框图,其分别示出了 DRA音频编码器和解码器;图IC示意性表示了经过DRA音频编码器处理后的DRA音频帧结构;
图2k是流程图,其示出了根据本发明一个实施例的分层音频编码方法;图2B是流程图,其示出了根据本发明又一实施例的分层音频编码方法;图2C是流程图,其示出了根据本发明再一实施例的分层音频编码方法;在图3是流程图,其示出了根据本发明实施例的精确划分频谱块0方法;在图4是流程图,其示出了根据本发明实施例的近似划分频谱块0方法;在图5A是示意图,其示出了确定频谱块边界与DRA码书段边界的方法;在图5B是示意图,其示出了确定频谱块边界与DRA码书段边界的又一方法; 在图5C是示意图,其示出了确定频谱块边界与DRA码书段边界的再一方法;图6是方框图,其示出了根据本发明实施例的一种分层音频编码系统;图7A是方框图,其示出了根据本发明实施例的音频帧结构;图7B是方框图,其示出了根据另一本发明实施例的音频帧结构;以及图7C是方框图,其示出了根据本发明再一实施例的音频帧结构。
具体实施例方式通过借助附图在下文中将描述本发明的优选实施例。在以下描述中,将不详细描 述已成为现有技术的功能或结构,因为不必要的细节将导致本发明的介绍含混不清。在图IA中示出了典型的DRA音频编码器100,其可通过硬件、软件、和/或韧件来 实现。简言之,DRA标准所涉及的技术就是以多个技术模块对源音(例如,输入PCM样本) 进行信号处理,以达到几乎无损压缩源音的目的。上述多个技术模块包括但不限于暂态分 析模块120、多分辨率滤波器组模块122、线性标量量化模块130、量化指数编码模块132、码 表选择模块134、人耳听觉模型模块140、全局比特分配模块142及多路复用模块150。按照 DRA标准的相关规定,上述技术模块为必选模块,即符合标准的DRA输出码流(即,DRA标准 码流)一定是经过上述模块处理后的码流。与之相对应地,图IB中示出了典型的DRA音频 解码器,它用于接收被DRA编码器处理后的码流,并通过执行编码的逆过程而将编码码流 还原为PCM样本输出。图IC示意性示出了经过DRA音频编码器处理后的DRA音频帧结构,包括同步字、 帧头信息、每声道的信息、填充比特、附加信息等5大部分。DRA技术是一种高质量的多声道音频编码算法,其可支持固定码率和可变码率音 频编码,为DRA技术在不同领域的实施和推广打下了良好的基础。但DRA技术目前还不能 支持分层编码(即,可伸缩编码),这就使其无法具有分层编码所具备的优势。为了解决上述问题,本发明提供了基于DRA编码技术的音频分层编码方法与系 统。在随后的附图及说明中,帧头信息(见图1C,用于存储和传输解码所用的部分辅 助信息;为了更清楚地表示该部分的作用,下文也称之为“帧头边信息”)包括原DRA帧中的 窗序列信息、帧头类型信息、和差立体声及强度立体声总开关等信息;而在每个频谱块的编 码边信息(下文称之为频谱块边信息,见图7A和7B)中,则包括了 Huffman码书下标和码 书应用范围、谱系数量化下标、谱系数量化步长、和差立体声开关以及进行强度立体声时的 谱系数量化步长等信息。但本领域技术人员通过阅读本说明书后能够理解的是帧头边信 息以及频谱块边信息中所包含的具体内容并不受本发明限定。例如,频谱块边信息中同样可包含和差立体声及强度立体声总开关等信息。 图2A示出了根据本发明一个优选实施例的分层音频编码方法10A。如图所示,方 法IOA开始于步骤11 ;随后,在步骤12中,接收来自外部装置的多声道音频码流。接下来, 在步骤13中,对接收的码流行进行分割,将它们分成多个辅助数据块和多个频谱块。然后, 在步骤14A中,将多个频谱块中的每一个频谱块分割成边信息部分和谱系数部分(例如图 7A中所示,频谱块0到频谱块N-I的每一个都被分为两部分频谱块X的编码边信息和频 谱块X的熵编码数据,X从0到N-I之间取值),在谱系数部分中存储与谱系数有关的部分。 接下来,在步骤15A中,每个谱系数部分中的数据都首先按照所对应谱线序号值的大小排 列编号较小的声道。然后,在步骤16A中,再按照所对应谱线序号值的大小排列编号较大的 声道。最后,如步骤17所示,将步骤16A产生的排列后的数据、步骤14A产生的边信息部分、 以及步骤13产生的多个辅助数据块一起打包,形成分层编码的DRA帧(如图7A所示,下文 还将详细说明)。随后,在步骤18结束编码过程。优选地,在步骤12所接收的多声道音频 码流是经过DRA编码算法处理的音频码流。图2B示出了根据本发明的另一个优选实施例的分层音频编码方法10B。如图所 示(结合图2A),方法IOB中的步骤11-13与方法IOA中的步骤11-13完全相同,在此不再 赘述。方法IOB和IOA的主要不同点在于当存在多声道音频信号时,通过首先对各个声道 的频域谱系数进行交织来达到分层编码的目的。具体来说,首先在步骤14B中,将多个频谱 块中的每一个频谱块分割成边信息部分和谱系数部分(详见图7B,下文中还将详细描述); 然后,在步骤15B中,每个谱系数部分都首先按照声道编号的大小排列具有较小谱线序号 值的编码数据;接下来,在步骤16B中,再按照声道编号的大小排列具有较大谱线序号值的 编码数据;最后,如步骤17所示,将步骤16B产生的排列后的数据、步骤14B产生的边信息 部分以及步骤13产生的多个辅助数据块一起打包,形成分层编码的DRA帧(如图7B所示, 下文还将详细说明)。随后,在步骤18结束编码过程。优选地,在步骤12所接收的多声道 音频码流是经过DRA编码算法处理的音频码流。图2C示出了根据本发明的再一个优选实施例的分层音频编码方法10C。如图所 示(结合图2A、2B),方法IOC中步骤11-13与方法IOA中的步骤完全相同。接下来,在步 骤19中,判断多个频谱块中的谱系数部分所采用的排列方法,具体判断方法将在下文中详 细描述。如果在步骤19中判断标志位为0,则执行方法IOA中的步骤14A-16A ;否则,执行 方法IOB中的步骤14B-16B。最后,如步骤17所示,将步骤16A或步骤16B排列后的数据、 步骤14A或步骤14B产生的边信息部分、以及步骤13产生的多个辅助数据块一起打包,形 成分层编码的DRA帧(如图7C所示,下文还将详细说明)。随后,在步骤18结束编码过程。 优选地,在步骤12所接收的多声道音频码流是经过DRA编码算法处理的音频码流。具体来说,在步骤19中,标志位是根据编码特性决定的。编码特性例如包括仅使 用方法IOA或仅使用方法IOB进行所有谱系数部分排列所获得的总编码效率。步骤19所 进行的判断实际就是从方法IOA所对应的效率和方法IOB所对应的效率中选出两者中较大 的一个,然后输出判断结果选择效率较高者对应的那种编码方法。在随后的附图及说明中,标号η表示谱线序号值,BL表示预定的固定比特率(可 由用户分配),Bn表示0-η个谱线的总码率,L0表示频谱块0的长度。在图3中示出了根据本发明实施例中的精确划分频谱块0的长度Ltl的方法30。本领域技术人员通过阅读本说明书,可类推获得其它频谱块的划分方法。方法30开始于步骤 31,谱线序号值初始值设置为0。接下来,参考方法IOA在步骤32中对频谱块0中的谱系数 部分进行排列。接下来在步骤33中,比较Bn与固定比特率BL的大小。如果Bn小于BL,则 使η加1,继续进行步骤32-33 ;否则,进入判断步骤34 当Bn等于BL时,转到步骤35,令Ltl 取值η并输出L0 ;否则,转到步骤36,令L0取值η-1并输出Lqo根据本发明的另一个实施例,在步骤32还可能根据方法IOB或IOC对频谱块中的谱系数部分进行排列,然后再根据随后的步骤判断和输出Ltl,上述对步骤32的变形对于本 领域技术人员来说是显而易见地,在此不再赘述。根据方法30,当选择的Ltl使得每一频谱块的总比特率BJS于固定比特率BL时, 在第Ltl个谱线所对应的数据之后填充比特‘0’,直到总比特率达到固定比特率BL为止,以 保证精确匹配预定比特率。图4示出了根据本发明实施例的近似划分频谱块0的长度Ltl的方法40。下文将 详细介绍频谱块0的近似划分方法,本领域技术人员通过阅读本说明书,可类推获得其它 频谱块的划分方法。本方法开始于步骤41,谱线序号值初始值设置为0。接下来在步骤42, 按照方法IOA对谱系数部分进行排列。接下来,在步骤43中,比较Bn与固定比特率BL的大 小。如果Bn大于BL,则进入步骤44 (随后描述);否则,使η加1,继续进行步骤42-43。在 步骤44中,判断Blri-BL的绝对值与Bn-BL的绝对值之间大小关系,并根据该判断如下执行 方法40 如果Blri-BL的绝对值大于或等于Bn-BL的绝对值,则进入步骤46,使Ltl = η并输 出L0 ;否则,进入步骤45,使Ltl = η-1并输出Lqo根据本发明的另一个实施例,在步骤42还可能根据方法IOB或IOC对频谱块中的 谱系数部分进行排列,然后再根据随后的步骤判断和输出Ltl,上述对步骤42的变形对于本 领域技术人员来说是显而易见地,在此不再赘述。根据方法40,选取的Ltl保证频谱块0的总比特率B。与固定比特率BL最为接近 (但可能大于或小于BL)。当Ltl所对应的比特率Btl超出固定比特率BL时,不舍弃最后一个 谱线;当L0所对应的比特率Btl低于固定比特率BL时,在其后也不填充比特‘0’。以上述方 法选取Ltl的结果只能是近似匹配预定比特率。根据本发明再一实施例,本发明还公开了通过在前和在后的各一个频谱块来恢复 丢失的当前频谱块的方法。具体来说,用在前和在后的各一个频谱块的系数进行线性内插 恢复当前频谱块。根据本发明的另一个实施例,本发明还公开了划分频谱块个数的计算公式频谱 块的分层个数=(码率所对应的帧长_帧头-边信息)/分层带宽。具体地,假定该帧的码 率是128kbps,帧头与边信息所占的码率是16kbps,分层带宽为4kbps,根据计算公式,可以 得出频谱块的分层个数=(128kbps-16kbps)/4kbps = 28。在图5A-5C中,示出了根据本发明再一实施例的、确认频谱块边界与DRA码书段边 界的方法。频谱块η的长度用Ln表示。在本发明的一个示例中,选取频谱块个数为3,当然 也可取为其它数值。如图5所示,频谱块分别为ΙΛ、ΙΑ、ΙΛ,边界分别为a,b,c,d。DRA码 书段分别为R0,R1, R2,边界分别为a,,b,,C,,d,。在图5A中,示出了用频谱块的边界来代替DRA码书段边界的方法。即当确定频谱 块ΙΛ、IA、LB2的边界a,b,c,d时,码书段被重新划分为Rtl, R1, R2,边界a’,b’,C’,d’与频谱块LB。LB1, LB2的边界a,b,c, d完全对应。即,频谱块的边界一一对应地代替了 DRA码 书段的边界。在图5B中,示出了确定频谱块边界与DRA码书段边界的又一方法。具体地,以边界b为例首先是确定一阈值Tl,判断频谱块边界b与DRA码书段边界b’之间的距离。在 图5B中,频谱块边界b与DRA码书段边界b’的距离小于预定阈值TI,判定采用DRA码书段 边界b’来代替频谱块边界b。即,频谱块的边界被重新划分为b’。在图5C中,示出了确定频谱块边界与DRA码书段边界的再一方法。如图5C所示, 虚线是原来DRA码书段Rtl,边界为b’。在图5C的情况下,频谱块边界b与DRA码书段边界 b’的距离大于某个预定阈值TI时,此时与图5B中方法相反,采用频谱块的边界b代替DRA 码书段的边界b’。S卩,重新确认DRA码书段边界b’,采用频谱块的边界b来代替DRA码书 段的边界b’。在图6中,示出了根据本发明实施例的分层音频编码系统60。如图所示,系统60 包括音频编码器62和分割器63。其中音频编码器62接收音频数据61,并例如采用DRA多 声道音频编码算法对音频数据61加以音频编码处理。分割器63接收音频编码器62处理 后的数据,并将输出的数据打包64。分割器63包括分割模块(未示出),用于将被编码的 数据分割成多个辅助数据块和多个频谱块,并以多个频谱块中所含数据对应的谱线序号值 大小来排列各个频谱块。此外,分割器63中还可进一步包括排列模块(未示出),用于将多个频谱块的数据 中与频谱有关的部分排列到多个频谱块中的每一个的谱系数部分中;以及将多个频谱块的 数据中与频谱无关的部分排列到多个频谱块中的每一个的边信息部分。分割器63中的排列模块可以采用第一种方式来对每个谱系数部分进行排列对 每一个频谱块中的每一个谱系数部分,首先按照所对应谱线序号值的大小排列编号较小的 声道,然后再按照所对应谱线序号值的大小排列编号较大的声道。分割器63中的排列模块还可以采用第二种方式来对每个谱系数部分进行排列 对每一个频谱块中的每一个谱系数部分,首先按照声道编号的大小排列具有较小谱线序号 值的编码数据,然后再按照声道编号的大小排列具有较大谱线序号值的编码数据。分割器63中的排列模块中还可以进一步包括判断模块,根据编码特性分别判断 并选择上述两种方式之一来对每个谱系数部分进行排列。其中,编码特性包括仅使用第一 种方式或仅使用第二种方式来对每个谱系数部分进行排列所获得的总编码效率;判断模块 用来选择上述两种方式中总编码效率较高的那种谱系数部分排列的方式。分割器63中的分割模块划分频谱块的长度,可以精确对应固定比特率划分和近 似对应固定比特率划分以及基于相应DRA码书段的长度来划分频谱块的长度。其中,精确 对应固定比特率划分和近似对应固定比特率划分的方法在前面分别结合图3的方法30和 图4的方法40中已经详细介绍,在此不再赘述。而基于相应DRA码书段的长度来划分频谱 块的长度和方法,对于本领域技术人员来说是显而易见地。分割器63中的分割模块划分后的频谱块,可以通过在前和在后的各一个频谱块 恢复丢失的当前频谱块。具体来说,用在前和在后的各一个频谱块的系数进行线性内插恢 复当前频谱块。根据本发明的另一个实施例,本发明还公开了划分频谱块个数的计算公式频谱块的分层个数=(码率所对应的帧长-帧头-边信息)/分层带宽。具体地,假定该帧的码 率是128kbps,帧头与边信息所占的码率是16kbps,分层带宽为4kbps,根据计算公式,可以 得出频谱块的分层个数=(128kbps-16kbps)/4kbps = 28。分割器62中的分割模块划分频谱块时,根据本发明的一个优选实施例,对频谱块 边界的确定,有两种方式。一种是以频谱块边界都取代DRA码书段的边界。S卩,其中DRA码 书段边界与频谱块边界一一对应。另一种设定方式DRA码书段边界和频谱块边界是通过设置某个预定阈值来实现 的。当频谱块边界与DRA码书段边界的距离小于某个预定阈值时,采用DRA码书段边界来 代替频谱块边界;当频谱块边界与DRA码书段边界的距离大于某个预定阈值时,采用频谱 块边界来代替DRA码书段边界。详细的描述在前面结合图5A、图5B以及图5C中已将介绍, 在此不在累赘。
在图7A、7B及图7C中详细描述了根据本发明实施例的分层编码方法所获得的音 频帧结构;其中,S[block] [ch] [bin]中的三维坐标依次表示块号、声道号和谱系数。如图7A、图7B及图7C所示,多声道数字音频帧结构包括多个辅助数据块和多个频 谱块。具体地,多个辅助数据块包括同步字、帧头信息及一般边信息、填充比特、以及附加数 据等数据。进一步地,按照多个频谱块中所含数据对应的谱线序号值大小来排列各个频谱 块。具体地,频谱块分为N块,分别标记为频谱块O、频谱块1...频谱块N-1。进一步地,多 个频谱块中的每一个频谱块分为谱系数部分和边信息部分,其中,谱系数部分排列了编码 后的数据中与频谱有关的部分,边信息部分排列了编码后的数据中与频谱无关的部分。如图7A所示,对每一个频谱块中的每一个谱系数部分按照所对应谱线序号值的 大小排列编号较小的声道,然后再按照所对应谱线序号值的大小排列编号较大的声道。具体地,频谱块0的谱系数排列为S
S[O][O][Lq-I]、S[O][I][O]S
[1] [L0-I]. . · · S
[nch-1]
S
[nch-1] [L0-I]。 如图7B中所示,对每一个频谱块中的每一个谱系数部分都首先按照声道 编号的大小排列具有较小谱线序号值的编码数据,然后再按照声道编号的大小排列 具有较大谱线序号值的编码数据。具体地,频谱块0的谱系数排列为S
S
[nch-1]
、S
[1] S
[nch-1][1]____S
[L0-I] S
[nch-1]。频谱块 1 的谱系数为 S[1]
[LJS[l][nCh-l][LQ]、S[l]
[L。+l] S[l] [nch-1] [L0+l]· · · · S[l]
[L0+L「l] S[l] [nch-1] [L0+L「l]。频谱块 N-I 的谱系数如图7C中所示,在帧头信息中增加一个比特作为结构标志位。具体地,根据编码 特性,结构标志位可设为“0”或“1”。当结构标志位为“0”时,本帧中频谱块的谱系数部分 用图7A中的排列方法,即,使用图7A中的音频帧结构;当结构位为“1”时,本帧中频谱块的 谱系数部分用图7B中的排列方法,即,使用图7B中的音频帧结构。优选地,编码特性包括仅使用图7A中音频帧结构或仅使用图7B中音频帧结构进 行所有谱系数部分排列所获得的总编码效率。虽然结合目前被认为是最实际和最优的实施例描述了本发明,但本领域技术人员 应当理解本发明不限于所公开的实施例,相反,本发明旨在覆盖所附权利要求的精神和范 畴之内包括的各种各样的修改和等价结构。本领域技术人员能够理解的是可如示于特定 实施例地将多种变形和/或改进使用到本发明,而这并不脱离以宽广方式描述的本发明精 神或范围。因此,本文的实施例被认为在各个方面是描述性的而非限定性的。
权利要求一种分层音频编码方法,包括以下步骤A)通过多声道音频编码算法编码输入的多声道音频数据;以及B)将被编码的数据分为多个辅助数据块和多个频谱块;其特征在于,按照所述多个频谱块中所含数据对应的谱线序号值的大小来排列各个频谱块。
2.根据权利要求1所述的方法,其特征在于,所述多声道音频编码算法是DRA多声道音 频编码算法。
3.根据权利要求2所述的方法,其特征在于还包括C)将所述多个频谱块的数据中与频谱有关的部分分别排列到所述多个频谱块中的每 一个的谱系数部分中;以及D)将所述多个频谱块的数据中与频谱无关的部分分别排列到所述多个频谱块中的每 一个的剩余部分,也就是边信息部分中。
4.根据权利要求3所述的方法,其特征在于,在所述多个频谱块的每一个中,E)每个所 述谱系数部分都首先按照所对应谱线序号值的大小排列编号较小的声道,然后再按照所对 应谱线序号值的大小排列编号较大的声道。
5.根据权利要求3所述的方法,其特征在于,在所述多个频谱块的每一个中,F)每个所 述谱系数部分都首先按照声道编号的大小排列具有较小谱线序号的编码数据,然后再按照 声道编号的大小排列具有较大谱线序号的编码数据。
6.根据权利要求3所述的方法,其特征在于,根据编码特性,分别选择以下两种方式之 一对每个所述谱系数部分进行排列E)每个所述谱系数部分都首先按照所对应谱线序号值的大小排列编号较小的声道,然 后再按照所对应谱线序号值的大小排列编号较大的声道;或F)每个所述谱系数部分都首先按照声道编号的大小排列具有较小谱线序号值的编码 数据,然后再按照声道编号的大小排列具有较大谱线序号值的编码数据。
7.根据权利要求6所述的方法,其特征在于,所述编码特性包括仅使用E)或仅使用F) 进行所有所述谱系数部分排列所获得的总编码效率。
8.根据权利要求4-6之一所述的方法,其特征在于,精确对应固定比特率地划分每个 所述频谱块的长度。
9.根据权利要求4-6之一所述的方法,其特征在于,近似对应固定比特率地划分所述 频谱块的长度。
10.根据权利要求4-6之一所述的方法,其特征在于,基于相应DRA码书段的长度来划 分所述频谱块的长度。
11.根据权利要求4-6之一所述的方法,其特征在于,通过在前和在后的各一个频谱块 恢复当前的频谱块。
12.根据权利要求11所述的方法,其特征在于,所述恢复包括使用所述在前和在后的 各一个频谱块的系数进行线性内插。
13.根据权利要求4-6之一所述的方法,其特征在于,所述频谱块的分层个数=(码率 所对应的帧长_帧头_边信息)/分层带宽。
14.根据权利要求4-6之一所述的方法,其特征在于,采用频谱块的边界来直接代替DRA码书段的边界。
15.根据权利要求4-6之一所述的方法,其特征在于,当所述频谱块的边界与所述DRA 码书段的边界的距离小于某个预定阈值时,采用所述DRA码书段的边界来代替所述频谱块 的边界;当所述频谱块的边界与所述DRA码书段的边界的距离大于某个预定阈值时,采用 所述频谱块的边界都代替所述DRA码书段的边界。
16.一种分层音频编码系统,包括G)音频编码器,所述编码器使用多声道音频编码算法来编码输入的多声道音频数据;以及H)分割器,所述分割器包括分割模块,将被编码的数据分割为多个辅助数据块和多个 频谱块,其特征在于,按照所述多个频谱块中所含数据对应的谱线序号值大小来排列各个 频谱块。
17.根据权利要求16所述的系统,其特征在于,所述多声道音频编码算法是DRA多声道音频编码算法。
18.根据权利要求17所述的系统,其特征在于,所述分割器还包括排列模块,其用于I)将所述多个频谱块的数据中与频谱有关的部分排列到多个频谱块中的每一个的谱 系数部分中;以及J)将所述多个频谱块的数据中与频谱无关的部分排列到多个频谱块中的每一个的边 信息部分。
19.根据权利要求18所述的系统,其特征在于,在所述多个频谱块的每一个中,E)每个 所述谱系数部分都首先按照所对应谱线序号值的大小排列编号较小的声道,然后再按照所 对应谱线序号值的大小排列编号较大的声道。
20.根据权利要求18所述的系统,其特征在于,在所述多个频谱块的每一个中,F)每个 所述谱系数部分都首先按照声道编号的大小排列具有较小谱线序号值的编码数据,然后再 按照声道编号的大小排列具有较大谱线序号值的编码数据。
21.根据权利要求18所述的系统,其特征在于,根据编码特性,分别选择以下两种方式 之一对每个所述谱系数部分进行排列E)每个所述谱系数部分都首先按照所对应谱线序号值的大小排列编号较小的声道,然 后再按照所对应谱线序号值的大小排列编号较大的声道;或F)每个所述谱系数部分都首先按照声道编号的大小排列具有较小谱线序号值的编码 数据,然后再按照声道编号的大小排列具有较大谱线序号值的编码数据。
22.根据权利要求21所述的系统,其特征在于,所述编码特性包括仅使用E)或仅使用 F)进行所有所述谱系数部分排列所获得的总编码效率。
23.根据权利要求19-21之一所述的系统,其特征在于,精确对应固定比特率地划分每 个所述频谱块的长度。
24.根据权利要求19-21之一所述的系统,其特征在于,近似对应固定比特率地划分所 述频谱块的长度。
25.根据权利要求19-21之一所述的系统,其特征在于,基于相应DRA码书段的长度来 划分所述频谱块的长度。
26.根据权利要求19-21之一所述的系统,其特征在于,通过在前和在后的各一个频谱块恢复当前的频谱块。
27.根据权利要求26所述的系统,其特征在于,所述恢复包括使用所述在前和在后的 各一个频谱块的系数进行线性内插。
28.根据权利要求19-21之一所述的系统,其特征在于,所述频谱块的分层个数=(码 率所对应的帧长_帧头_边信息)/分层带宽。
29.根据权利要求19-21之一所述的系统,其特征在于,采用频谱块的边界来直接代替 DRA码书段的边界。
30.根据权利要求19-21之一所述的系统,其特征在于,当所述频谱块的边界与所述 DRA码书段的边界的距离小于某个预定阈值时,采用所述DRA码书段的边界来代替所述频 谱块的边界;当所述频谱块的边界与所述DRA码书段的边界的距离大于某个预定阈值时, 采用所述频谱块的边界都代替所述DRA码书段的边界。
全文摘要本发明涉及一种分层音频编码方法,包括以下步骤A)通过多声道音频编码算法编码输入的多声道音频数据;以及B)将被编码的数据分为多个辅助数据块和多个频谱块;按照所述多个频谱块中所含数据对应的谱线序号值的大小来排列各个频谱块。通过使用根据本发明的分层音频编码方法,使DRA技术能被应用在一些需要分层编码的技术领域中。
文档编号G10L19/02GK101840702SQ200910080309
公开日2010年9月22日 申请日期2009年3月18日 优先权日2009年3月18日
发明者徐茂, 王磊, 闫建新 申请人:数维科技(北京)有限公司