数字音频编码的附加数据的扩展结构及相应的扩展装置的制作方法

文档序号:2833423阅读:251来源:国知局
专利名称:数字音频编码的附加数据的扩展结构及相应的扩展装置的制作方法
技术领域
本发明涉及数字音频编解码领域,更具体地说,涉及一种DRA数字音频编码的附加数据的扩展结构及相应的扩展装置。
背景技术
现有的数字音频编码技术会在音频帧中添加附加数据,并通过该附加数据对数字音频编码效果进行处理,同时使得每个音频帧都具有固定的比特长度,以便于对数字音频编解码的控制。在数字音频编码标准IS0/IEC MPEG-I的音频编码标准中,附加数据一般设置在每个音频帧的最后,可由用户填充附加数据以保持固定的比特率。这里的附加数据没有具体 定义内容,可由用户自己定义。在DAB (Digital Audio Broadcasting,数字信号广播)音频编码标准中,附加数据也设置在音频帧的最后,该附加数据由后至前依次包括固定的2个字节,用于设置节目相关数据;2或4个字节的CRC校验字,用于保护编码中的比例因子信息;可变字节数,用于扩展节目相关数据;填充比特,用于保证整个DAB音频帧具有固定的长度。其中用于扩展节目相关数据的附加数据的具体内容也由用户自己定义在IS0/IEC 13818-7MPEG-2AAC 和 IS0/IEC 14996-3MPEG-4AAC 等(下面简称ACC)音频编码标准中,用于填充的附加数据可包括多个设置在音频帧的各个部分的填充单元。同时每个填充单元填充的附加数据可以是扩展元数据动态范围内容、SBR (SpectralBand Replication,频段复制)内容、SBR-CRC (Spectral Band Replication-CyclicalRedundancy Check,频段复制-循环冗余码校验)内容、固定内容填充数据或任意其他填充数据等。但这里每个填充单元只能使用一种类型的附加数据。在Dolby AC-3的音频编码标准中,附加数据设置在音频帧的接近最后的位置,附加数据中的最后I比特指明是否存在有效的附加数据,如果存在,则将之前的14比特用来说明有效的附加数据,否则不存在这14比特,最后附加数据的最前面设置有保证音频帧具有固定的长度的填充比特。该音频编码标准中的附加数据的14比特的具体内容也由用户自己定义。在GB/T 22726-2008《多声道数字音频编解码技术规范》,即DRA (Digital RiseAudio)的音频编码标准中,附加数据设置在一个音频帧的帧尾,并且在音频帧的帧头指明了在音频帧的帧尾是否存在附加数据。但位于帧头的指示只指明了本帧的附加数据前的字节数,附加数据的具体内容也是由用户自己定义。综上所述,上面提到的五种音频编码标准中,仅ACC音频编码标准的附加数据定义了每个填充单元的附加数据的类型。但是ACC音频编码标准中的填充单元较为分散,无法明确的给出附加数据的整体长度;同时各个填充单元都有其各自的长度,在应用多个填充单元时,解码器分析每帧码流会非常麻烦,必须对每个填充单元进行长度解析后才能直接跳到下一帧的开始位置。此外ACC音频编码标准中的每个填充单元只能使用一种类型的附加数据,使得附加数据的使用效率较低。故,有必要提供一种数字音频编码的附加数据的扩展结构及相应的扩展装置,以解决现有技术所存在的问题。

发明内容
本发明要解决的技术问题在于,针对现有技术中的数字音频编码的附加数据的扩展结构及相应的扩展装置中的附加数据的类型不兼容或使得数据音频编码的效率低下的技术问题,提供一种可同时应用多种类型的附加数据,且编码效率高的DRA数字音频编码的附加数据的扩展结构及相应的扩展装置。本发明涉及一种数字音频编码的附加数据的扩展结构,所述附加数据设置在相应的音频帧的帧尾,其包括
附加数据总长度字节,用于描述所述附加数据的总字节长度;以及附加数据字节,包括至少一个附加数据单元;所述附加数据单元包括数据长度字节,用于描述所述附加数据单元的字节长度;数据类型字节,用于描述所述附加数据单元的数据类型;以及数据内容字节,用于描述所述附加数据单元的附加数据内容,所述附加数据总长度字节设置在所述附加数据字节之前。在本发明所述的数字音频编码的附加数据的扩展结构中,所述附加数据单元中的字节依次为所述数据类型字节、所述数据长度字节以及所述数据内容字节。在本发明所述的数字音频编码的附加数据的扩展结构中,所述附加数据单元中的字节依次为所述数据长度字节、所述数据类型字节以及所述数据内容字节。在本发明所述的数字音频编码的附加数据的扩展结构中,所述数据长度字节用于描述整个所述附加数据单元的字节长度。在本发明所述的数字音频编码的附加数据的扩展结构中,所述数据长度字节用于描述所述数据内容字节的字节长度。在本发明所述的数字音频编码的附加数据的扩展结构中,所述音频帧还包括音频编码数据,所述音频编码数据采用DRA的音频编码标准进行编码。在本发明所述的数字音频编码的附加数据的扩展结构中,所述音频编码数据包括同步字节、帧头字节以及各音频声道的压缩字节。在本发明所述的数字音频编码的附加数据的扩展结构中,所述音频帧还包括填充数据,所述填充数据设置在所述附加数据与所述音频编码数据之间,用于保证所述音频帧的固定长度。在本发明所述的数字音频编码的附加数据的扩展结构中,所述附加数据总长度字节的长度为255或65792,所述数据长度字节的长度为4096,所述数据类型字节的长度为16。本发明还涉及一种数字音频编码的附加数据的扩展装置,其包括上述的数字音频编码的附加数据的扩展结构。实施本发明的数字音频编码的附加数据的扩展结构及相应的扩展装置,具有以下有益效果可同时应用多种类型的附加数据,且编码效率高,解决了现有的数字音频编码的附加数据的扩展结构及相应的扩展装置中的附加数据的类型不兼容或使得数据音频编码的效率低下的技术问题。


下面将结合附图及实施例对本发明作进一步说明,附图中图I为本发明的数字音频编码的附加数据的扩展结构的第一优选实施例所在音频帧的结构示意图;图2为本发明的数字音频编码的附加数据的扩展结构的第二优选实施例所在音频帧的结构示意图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。请参照图1,图I为本发明的数字音频编码的附加数据的扩展结构的第一优选实施例所在音频帧的结构示意图。该音频帧包括音频编码数据、填充数据以及附加数据。该音频编码数据采用DRA的音频编码标准进行编码,该音频编码数据包括同步字节、帧头字节以及各音频声道的压缩字节,该同步字节提供该音频帧的同步信息;该帧头字节提供该音频帧的帧属性,例如帧长信息、采样率索引信息、声道数信息等信息,该帧头字节还提供用于指明该音频帧的帧尾是否存在附加数据的附加数据提示信息;音频声道的压缩字节用于提供该音频帧的各音频声道的压缩信息。填充数据设置在附加数据和音频编码数据之间,用于保证音频帧的固定长度。该填充数据根据音频帧的预设长度、音频编码数据的长度以及附加数据总长度进行设定,使得该音频帧可保持固定的比特率。附加数据设置在相应的音频帧的帧尾,包括附加数据总长度字节以及附加数据字节。该附加数据总长度字节用于描述该附加数据的总字节长度,且附加数据总长度字节设置在整个附加数据的最前面(即附加数据总长度字节设置在附加数据字节之前),这样的设置便于解码时快速跳过附加数据的区域,直接解码下一帧音频,同时为音频帧长度的计算提供了便利的结构。附加数据字节包括至少一个附加数据单元,该附加数据单元包括数据长度字节、数据类型字节以及数据内容字节,数据长度字节用于描述附加数据单元的字节长度;数据类型字节用于描述附加数据单元的数据类型;数据内容字节用于描述附加数据单元的附加数据内容;。在本实施例中,附加数据单元中的字节依次为数据长度字节、数据类型字节以及数据内容字节,这里的数据长度字节可描述整个附加数据单元的字节长度,这样数据长度字节、数据类型字节以及数据内容字节的长度可以随意调整。当然在数据长度字节和数据类型字节采用预设的字节长度描述时,数据长度字节可只描述数据内容字节的字节长度,这样的设置可以提高编码效率。数据类型字节可根据附加数据类型的总数或常用的附加数据类型的数目使用合适的字节长度来表示,以尽可能的减少附加数据的编码量,例如当附加数据类型的总数为9种时,可使用4比特来表示数据类型字节。数据内容字节用于描述附加数据单元的附加数据内容,具体如元数据、低码率环绕声扩展和分层扩展等。其设置在附加数据单元的最后,用于对附加数据进行最细化的说明。下面通过一具体实施例说明具有本发明的数字音频编码的附加数据的扩展结构的音频帧,具体为具有DRA数字音频编码的附加数据的扩展结构的音频帧的具体组成结构。如下所示为该音频帧的音频编码数 据、填充数据以及附加数据的扩展语法格式
DRA_vStream()
{
FrameHeader O ;
{
bAuxData = Unpack(I);
}
UnpackBitPad O;
AuxiliaryData O ;
}其中FrameHeader ()为音频编码数据(其中具体内容部分省略),UnpackBitPadO为填充数据,AuxiliaryDataO为附加数据。其中音频编码数据包括同步字节、帧头字节以及各音频声道的压缩字节。填充数据用于填充值为“I”的比特数据,对于非固定码率格式的编码,只需填充最多31比特,确保本音频帧的附加数据前的数据长度为32比特(4字节)的倍数。这里指出音频编码数据的中贞头字节会设置一信息bAuxData说明该音频巾贞是否存在附加数据区域,如bAuxData=l则表示附加数据区域存在。其中附加数据的扩展语法格式如下AuxiliaryData ( bAuxData )
{
if (bAuxData)
{
count = 0;
aux—data—Ien—total = Unpack(8) + I;count += I;
if (aux_data_len_total == 256)
{
esc_leng th_total = Unpack(16) aux_data_Ien_totaI 十=csc_length_total; count += 2;
}
do {
aux_data_1en = Unpack (12) + I filling—type = Unpack(4);
count += aux_data_J_Ln switch filling—type
{
case ’ 0000,
DRA_ext_data( aux_data_1 en ); //一般透明数据 Break; case ‘0001’
DRA_ext_metadata ( aux_data_len ); //元数据 Break; case: ‘ ooiiy
DRA_exl_BWE( aux—datajtn ); //低码率带宽扩展数


Break; case tfOOI I’
DRA_cxt_surround ( aux_d it i_lcn ) ; //低码率环绕声 数据
Break; case: ‘0100,
DRA_ext_scaleble ( aux_data_len ); //分层编码数据Break;case: ‘0101, DRA_eχt_richmeclia ( aux_data_len ); //富媒体数据Break;case: iIlll*DRA—ext—type ( aux—data—Ien ) ;//附加数据类型扩展
Break; default:
break;
}
if (aux_data_len_tottl 〈= count) break;
} while(I)
I
}其中aux—data—I en—total和esc—length—total用来表示附加数据总长度字节,其中aux—data—I en—total为8比特,最多可表不255的长度;esc—length—total为16比^特,如果附加数据总长度字节的字节长度大于等于256,则用eSC_length_t0tal进行扩展。所以一音频帧中附加数据总长度字节的字节长度最大为256+65536=65792。aux_data_len表示数据长度字节,其中aux_data_len为12比特,可以表示4096的长度。filling_type表示数据类型字节,其中filling_type为4比特,可以表示16的长度,即可提供16种不同的扩展类型,具体对应关系可如下表I所示,表I为数据类型字节中扩展类型的具体内容;表I
权利要求
1.一种数字音频编码的附加数据的扩展结构,所述附加数据设置在相应的音频帧的帧 尾,其特征在于,包括附加数据总长度字节,用于描述所述附加数据的总字节长度;以及附加数据字节,包括至少一个附加数据单元;所述附加数据单元包括数据长度字节,用于描述所述附加数据单元的字节长度;数据类型字节,用于描述所述附加数据单元的数据类型;以及数据内容字节,用于描述所述附加数据单元的附加数据内容,所述附加数据总长度字节设置在所述附加数据字节之前。
2.根据权利要求1所述的数字音频编码的附加数据的扩展结构,其特征在于,所述附 加数据单元中的字节依次为所述数据类型字节、所述数据长度字节以及所述数据内容字 节。
3.根据权利要求1所述的数字音频编码的附加数据的扩展结构,其特征在于,所述附 加数据单元中的字节依次为所述数据长度字节、所述数据类型字节以及所述数据内容字 节。
4.根据权利要求3所述的数字音频编码的附加数据的扩展结构,其特征在于,所述数 据长度字节用于描述整个所述附加数据单元的字节长度。
5.根据权利要求3所述的数字音频编码的附加数据的扩展结构,其特征在于,所述数 据长度字节用于描述所述数据内容字节的字节长度。
6.根据权利要求1所述的数字音频编码的附加数据的扩展结构,其特征在于,所述音 频帧还包括音频编码数据,所述音频编码数据采用DRA的音频编码标准进行编码。
7.根据权利要求6所述的数字音频编码的附加数据的扩展结构,其特征在于,所述音 频编码数据包括同步字节、帧头字节以及各音频声道的压缩字节。
8.根据权利要求6所述的数字音频编码的附加数据的扩展结构,其特征在于,所述音 频帧还包括填充数据,所述填充数据设置在所述附加数据与所述音频编码数据之间,用于 保证所述音频帧的固定长度。
9.根据权利要求1所述的数字音频编码的附加数据的扩展结构,其特征在于,所述附 加数据总长度字节的长度为255或65792,所述数据长度字节的长度为4096,所述数据类型 字节的长度为16。
10.一种数字音频编码的附加数据的扩展装置,其特征在于,包括权利要求1至权利要 求9其中任一所述的数字音频编码的附加数据的扩展结构。
全文摘要
本发明涉及一种数字音频编码的附加数据的扩展结构及相应的扩展装置,该附加数据设置在相应的音频帧的帧尾,其包括附加数据总长度字节,用于描述附加数据的总字节长度;以及附加数据字节,包括至少一个附加数据单元;附加数据单元包括数据长度字节,用于描述附加数据单元的字节长度;数据类型字节,用于描述附加数据单元的数据类型;以及数据内容字节,用于描述附加数据单元的附加数据内容,附加数据总长度字节设置在附加数据字节之前。本发明还涉及一种数字音频编码的附加数据的扩展装置,本发明的数字音频编码的附加数据的扩展结构及相应的扩展装置可同时应用多种类型的附加数据,且编码效率高。
文档编号G10L19/00GK102956233SQ201210381358
公开日2013年3月6日 申请日期2012年10月10日 优先权日2012年10月10日
发明者闫建新, 王磊 申请人:深圳广晟信源技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1