音频编、解码方法和音频编、解码装置的制作方法

文档序号:6471163阅读:340来源:国知局
专利名称:音频编、解码方法和音频编、解码装置的制作方法
技术领域
本发明涉及音频编解码技术,尤其涉及一种音频编码方法、音频解码方法和音频
编码装置、音频解码装置。
背景技术
在监控应用中,一般都需要在监控数据中加入时间信息(如绝对时间信息年月日时分秒等),以备日后检索查证。但现有技术中对于监控语音等音频数据尚没有在音频数据中加入时间信息的解决方案,导致无法方便的标记原始监控音频数据采集的时间,给后续的检索查证等环节带来困难。

发明内容
有鉴于此,本发明中一方面提供一种音频编码方法和音频解码方法,另一方面提供一种音频编码装置和音频解码装置,以便在音频数据中加入时间信息,使音频数据能够进行时间定位检索。
本发明所提供的音频编码方法,包括 采集音频数据,并对所述音频数据进行编码,根据设定的嵌入规则,将对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入了时间信息的音频编码数据。 较佳地,所述设定的嵌入规则包括在每个音频数据帧的帧头中嵌入对应的时间信息;或在设定间隔的音频数据帧的帧头中嵌入对应的时间信息。 较佳地,所述对应时间信息的语法包括设置参考日期信息和/或参考时刻信息。
较佳地,所述对应时间信息的语法进一步包括设置参考日期标志和参考时刻标志,在所述参考日期标志设置为有效时,设置所述参考日期信息;在所述参考时刻标志设置为有效时,设置所述参考时刻信息。 较佳地,所述参考日期信息包括年份信息、月份信息和日信息;所述参考时刻信息包括小时信息、分钟信息和秒信息,或者所述参考时刻信息包括小时信息、分钟信息、
秒信息和毫秒信息。 较佳地,所述年份信息用12比特数据表示,表示范围为0 4095,或者所述年份信息用预设基数+7比特数据表示,表示范围为预设基数+(0 127);所述月份信息用4比特数据表示,表示范围为1 12,或者所述月份信息用4比特数据+1表示,表示范围为1+ (0 11);所述日信息用5比特数据表示,表示范围为1 31,或者所述日信息用5比特数据+1表示,表示范围为1+(0 30);所述小时信息用5比特数据表示,表示范围为0 23 ;所述分钟信息用6比特数据表示,表示范围为0 59 ;所述秒信息用6比特数据表示,表示范围
为0 59 ; 或者,所述年份信息用16比特表示;所述月份信息用8比特表示;所述日信息用8比特表示;所述小时信息用8比特表示;所述分钟信息用8比特表示;所述秒信息用8比特表示;其中,每4比特表示一位数字,高位在前。
本发明所提供的音频解码方法,包括 对音频编码数据进行解码,根据解码的音频数据帧的帧头语法中对应时间信息的语法,得到对应所述音频数据帧的时间信息。
较佳地,所述对应时间信息的语法包括设置参考日期标志和参考时刻标志;
在所述参考日期标志设置为有效时,设置有参考日期信息;在所述参考时刻标志设置为有效时,设置有参考时刻信息。 较佳地,所述根据解码的音频数据帧的帧头语法中对应时间信息的语法,得到对应所述音频数据帧的时间信息包括 判断当前解码的音频数据帧的帧头语法中的参考日期标志和参考时刻标志,在所述参考日期标志有效时,获取对应的参考日期信息,在所述参考时刻标志为有效时,获取对应的参考时刻信息;在所述参考日期标志无效时,根据音频帧长或帧率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考日期信息插值得到当前解码的音频数据帧的参考日期信息,在所述参考时刻标志无效时,根据音频帧长或帧率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考时刻信息插值得到当前解码的音频数据帧的参考时刻信息。
本发明所提供的音频编码装置,包括
音频采集单元,用于采集音频数据;
时间获取单元,用于获取当前时间; 时间提供控制单元,用于根据设定的嵌入规则,将所述时间获取单元获取的当前时间提供给音频编码单元; 音频编码单元,用于对所述音频采集单元采集的音频数据进行编码,并根据设定
的嵌入规则,将对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到
嵌入了时间信息的音频编码数据。 较佳地,所述音频编码单元包括 语法生成子单元,用于根据设定的嵌入规则以及时间提供单元提供的当前时间,生成对应时间信息的语法; 编码子单元,用于对所述音频采集单元采集的音频数据进行编码,将来自所述语
法生成子单元的对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到
嵌入了时间信息的音频编码数据。 本发明所提供的音频解码装置,包括 音频解码单元,用于对音频编码数据进行解码; 时间信息提取单元,用于根据解码的音频数据帧的帧头语法中对应时间信息的语
法,得到对应所述音频数据帧的时间信息。 较佳地,该装置进一步包括 播放单元,用于将所述音频解码单元解码出的音频数据进行播放。 从上述方案可以看出,本发明中通过在音频压縮编码数据中以固定的格式嵌入时
间信息(如绝对时间信息),即将对应时间信息的语法嵌入当前进行编码的音频数据帧的
帧头语法中,得到嵌入了时间信息的音频编码数据,该时间信息与压縮编码的音频数据一
5起传输或存储,与音频数据同步,并且也不会改变原始音频数据的内容。 此外,解码时通过解析音频数据帧帧头中对应时间信息(如绝对时间信息)的相
关语法,即可获得每帧音频数据对应的时间信息。当需要对时间信息进行定位检索时,通过
解析并查询音频数据帧帧头中对应时间信息的相关语法,可以快速按时间定位音频,而且
该检索过程可以用机器或软件程序实现,替代人工检索,提高效率,节约成本。 最后,利用解码时得到的时间信息,可以很容易的实现多个编码器压縮编码的音
频数据同步播放,即同步播放某一时刻的多方位音频数据。


图1为本发明中嵌入时间信息的音频编解码的系统流程示意 图2为本发明实施例中音频编码方法的示例性流程 图3为本发明实施例中音频编码装置的示例性结构 图4为本发明实施例中音频解码装置的示例性结构图。
具体实施例方式
本发明实施例中,考虑到在音频数据压縮编码时,常划分为帧。而在音频压縮编码
标准中,每一帧音频数据都定义了相应的头语法结构,用于在编解码器之间传递相关信息,
如编码模式、采样频率、通道数、码率等等。因此,本发明实施例中,为了将同步的时间信息
携带在音频数据中,并且可以不破坏音频数据内容且便于对特定时间音频数据的检索,考
虑在帧头语法中嵌入对应时间信息的语法,使得压縮编码的音频数据中包含时间信息。
图1为本发明中嵌入时间信息的音频编解码的系统的流程示意图。首先,通过音
频采集得到音频数据,并同时进行当前时间的获取,根据预先设定的嵌入规则,将获取的当
前时间提供给音频编码,音频编码根据设定的嵌入规则,将对应时间信息的语法嵌入当前
进行编码的音频数据帧的帧头语法中,得到嵌入了时间信息的音频编码数据用于传输或存
储,从而完成音频数据的编码过程。然后音频编码数据经过传输或存储后提供给解码端进
行音频解码,根据解码的音频数据帧帧头语法中对应时间信息的语法,得到对应所述音频
数据帧的时间信息,同时,可将对应的音频数据进行播放,从而完成音频的解码过程。
下面结合实施例和附图,对本发明进一步详细说明。 图2为本发明实施例中音频编码方法的示例性流程图。如图2所示,该流程包括如下步骤 步骤201 ,采集音频数据。 步骤202,对所述音频数据进行编码,根据设定的嵌入规则,将对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入了时间信息的音频编码数据。
相应地,音频编码数据经过存储或传输后到达解码端,解码端可对音频编码数据进行解码,并根据解码的音频数据帧帧头语法中对应时间信息的语法,得到对应所述音频数据帧的时间信息。进一步地,可将对应的音频数据进行播放。 其中,设定的嵌入规则可以是在每个音频数据帧的帧头中嵌入对应的时间信息。其中,时间信息可包括参考日期信息和/或参考时刻信息。例如,可在初始采集到的音频数据帧中嵌入参考日期信息和参考时刻信息,而后续的音频数据帧中可只嵌入参考时刻信息;或者,在初始采集到的音频数据帧中嵌入参考日期信息和参考时刻信息,而后续的音频数据帧中间隔嵌入参考日期信息和参考时刻信息、参考日期信息、以及参考时刻信息。
其中,参考日期信息又可包括年份信息、月份信息和日信息(当然实际应用中,也可根据需要只包括月份信息和日信息,或者只包括日信息等);参考时刻信息可包括小时信息、分钟信息和秒信息(当然实际应用中,还可进一步包括毫秒信息,或者只包括小时信息和分钟信息等)。 相应地,具体的语法格式可如下所示
{ 相应地,在解码端解码时,若当前解码的音频数据帧的帧头语法中存在参考日期信息,则获取对应的参考日期信息,若存在参考时刻信息,则获取对应的参考时刻信息;若不存在参考日期信息,则可根据音频帧长或帧率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考日期信息插值得到当前解码的音频数据帧的参考日期信息,若不存在参考时刻信息,则可根据音频帧长或帧率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考时刻信息插值得到当前解码的音频数据帧的参考时刻信息。
此外,具体的语法格式也可如下所示
{
年份信息;月份信息;日信息;
小时信息;分钟信息;秒信息;毫秒信息;
参考日期标志;参考时刻标志;
如果参考日期标志为有效,则存在
年份信息;月份信息;日信息;
如果参考时刻标志为有效,则存在
小时信息;分钟信息;
7
秒信息; 毫秒信息; }
} 此时,通过设置参考日期标志和参考时刻标志,可用于表示当前音频数据帧中是
否携带有参考日期信息和参考时刻信息。例如,假设参考日期标志和参考时刻标志都用1
比特(bit)数据表示,则可用"1"表示有效,用"0"表示无效;反之亦可。 相应地,在解码端解码时,可判断当前解码的音频数据帧帧头语法中的参考日期
标志和参考时刻标志,在所述参考日期标志有效时,获取对应的参考日期信息,在所述参考
时刻标志为有效时,获取对应的参考时刻信息;在所述参考日期标志无效时,根据音频帧长
或帧率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考日期信息插值得到
当前解码的音频数据帧的参考日期信息,在所述参考时刻标志无效时,根据音频帧长或帧
率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考时刻信息插值得到当前
解码的音频数据帧的参考时刻信息。 进一步地,为减少嵌入时间信息(如绝对时间信息)导致音频编码数据量的增加,可以只在某些设定的音频数据帧的帧头语法中嵌入时间信息(例如,只在设定间隔的音频数据帧的帧头语法中嵌入时间信息),而其他音频数据帧的帧头语法中则不嵌入时间信息。此时,对于不嵌入时间信息的帧头语法中,也可包括参考日期标志和参考时刻标志,只是这两个标志均设置为无效。解码时,对于不存在参考日期信息和参考时刻信息的音频数据帧,仍然可根据音频帧长或帧率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考日期信息和参考时刻信息分别插值得到当前解码的音频数据帧的参考日期信息和参考时刻信息。 具体实现时,年份信息、月份信息和日信息,以及小时信息、分钟信息秒信息甚至毫秒信息可有多种不同的具体表示形式。下面列举其中三种
第一种 年份信息可以用12-bit(比特)表示,表示范围为0 4095。例如,2008年可以表示为"0111, 1101, 1000"。 月份信息可以用4-bit表示,表示范围为l 12。例如,10月可以表示为"1010"。
日信息可以用5-bit表示,表示范围为1 31。例如,25日可以表示为"l, 1001"。
小时信息可以用5-bit表示,表示范围为0 23。例如,14点可以表示为"O,1110"。 分钟信息可以用6-bit表示,表示范围为0 59。例如,48分可以表示为"11,0000"。 秒信息可以用6-bit表示,表示范围为0 59。例如,35秒可以表示为"10, 0011 "。
毫秒信息可以用10-bit表示,表示范围为0 999。例如,525毫秒可以表示为"IO,OOOO,1101"。
第二种 年份信息用7-bit表示,表示范围为0 127。年份信息+基数等于当前年份。例如,基数取2000,则2008年可以表示为"000, 1000"。
8
月份信息用4-bit表示,表示范围为0 11。月份信息+1等于当前月份。例如,10月可以表示为"1001"。 日信息用5-bit表示,表示范围为0 30。日信息+l等于当前日期。例如,25日可以表示为"1,1000"。 毫秒信息表示以1/N秒为单位的份数。例如,N取128,毫秒信息用7_bit表示,表示范围为0 127,则"010, 1101"表示45/128秒。
其它信息可同第一种方法中的表示。
第三种 年份信息用16-bit表示,每4-bit表示一位数字,高位在前。例如,2008年可以表示为"0010, 0000, 0000, 1000"。 月份信息用8-bit表示,每4-bit表示一位数字,高位在前。例如,10月可以表示为"0001,0000"。日信息、小时信息、分钟信息、秒信息等信息均可采用上述类似表示。
此外,还可以有其它很多种表示方法,此处不再一一列举。 进一步地,为保证帧头语法元素的总长度为整数个字节,上述嵌入的时间信息的
组合,包括参考日期信息和参考时刻信息,参考日期信息,以及参考时刻信息,其各子信息元素组合的长度保持为整数个字节。 以上对本发明实施例中的音频编解码方法进行了详细描述,下面再对本发明实施例中的音频编解码装置进行详细描述。 图3为本发明实施例中音频编码装置的示例性结构图。如图3所示,该装置包括音频采集单元、时间获取单元、时间提供控制单元和音频编码单元。
其中,音频采集单元用于采集音频数据。
时间获取单元用于获取当前时间。 时间提供控制单元用于根据设定的嵌入规则,将所述时间获取单元获取的当前时间提供给音频编码单元。 音频编码单元用于对所述音频采集单元采集的音频数据进行编码,并根据设定的嵌入规则,将对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入了时间信息的音频编码数据。
具体实现时,音频编码单元可包括语法生成子单元和编码子单元。 其中,语法生成子单元用于根据设定的嵌入规则以及时间提供单元提供的当前时
间,生成对应时间信息的语法。 编码子单元用于对所述音频采集单元采集的音频数据进行编码,将来自所述语法生成子单元的对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入了时间信息的音频编码数据。
图4为本发明实施例中音频解码装置的示例性结构图。如图4所示,该装置包括音频解码单元和时间信息提取单元。进一步地,还可以包括播放单元。
其中,音频解码单元用于对音频编码数据进行解码。 时间信息提取单元用于根据解码的音频数据帧帧头语法中对应时间信息的语法,得到对应所述音频数据帧的时间信息。
播放单元用于将所述音频解码单元解码出的音频数据进行播放。 本发明实施例中音频编码装置和音频解码装置中各单元的具体实现过程可与本
发明实施例中的音频编码方法和音频解码方法中的相应实现过程一致,此处不再一一赘述。 进一步地,本发明中的技术方案也可以应用于监控以外的其他音频应用(如广播电视)中。并且,为保证在音频编码装置所在系统或网络中各个音频编码器所嵌入的时间信息同步,便于日后检索或同步播放,可以采用整个网络统一授时并较准时刻的方式,如利用GPS全网统一授时和校准等。 以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
一种音频编码方法,其特征在于,该方法包括采集音频数据,并对所述音频数据进行编码,根据设定的嵌入规则,将对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入了时间信息的音频编码数据。
2. 如权利要求l所述的方法,其特征在于,所述设定的嵌入规则包括在每个音频数据 帧的帧头中嵌入对应的时间信息;或在设定间隔的音频数据帧的帧头中嵌入对应的时间信息。
3. 如权利要求1或2所述的方法,其特征在于,所述对应时间信息的语法包括设置参 考日期信息和/或参考时刻信息。
4. 如权利要求3所述的方法,其特征在于,所述对应时间信息的语法进一步包括设置 参考日期标志和参考时刻标志,在所述参考日期标志设置为有效时,设置所述参考日期信 息;在所述参考时刻标志设置为有效时,设置所述参考时刻信息。
5. 如权利要求4所述的方法,其特征在于,所述参考日期信息包括年份信息、月份信 息和日信息;所述参考时刻信息包括小时信息、分钟信息和秒信息,或者所述参考时刻信 息包括小时信息、分钟信息、秒信息和毫秒信息。
6. 如权利要求5所述的方法,其特征在于,所述年份信息用12比特数据表示,表示范围 为0 4095,或者所述年份信息用预设基数+7比特数据表示,表示范围为预设基数+(0 127);所述月份信息用4比特数据表示,表示范围为1 12,或者所述月份信息用4比特数 据+1表示,表示范围为1+(0 11);所述日信息用5比特数据表示,表示范围为1 31,或 者所述日信息用5比特数据+1表示,表示范围为1+(0 30);所述小时信息用5比特数据 表示,表示范围为0 23 ;所述分钟信息用6比特数据表示,表示范围为0 59 ;所述秒信 息用6比特数据表示,表示范围为0 59 ;或者,所述年份信息用16比特表示;所述月份信息用8比特表示;所述日信息用8比 特表示;所述小时信息用8比特表示;所述分钟信息用8比特表示;所述秒信息用8比特表 示;其中,每4比特表示一位数字,高位在前。
7. —种音频解码方法,其特征在于,该方法包括对音频编码数据进行解码,根据解码的音频数据帧的帧头语法中对应时间信息的语 法,得到对应所述音频数据帧的时间信息。
8. 如权利要求7所述的方法,其特征在于,所述对应时间信息的语法包括设置参考日 期标志和参考时刻标志;在所述参考日期标志设置为有效时,设置有参考日期信息;在所述参考时刻标志设置 为有效时,设置有参考时刻信息。
9. 如权利要求8所述的方法,其特征在于,所述根据解码的音频数据帧的帧头语法中 对应时间信息的语法,得到对应所述音频数据帧的时间信息包括判断当前解码的音频数据帧的帧头语法中的参考日期标志和参考时刻标志,在所述参 考日期标志有效时,获取对应的参考日期信息,在所述参考时刻标志为有效时,获取对应的 参考时刻信息;在所述参考日期标志无效时,根据音频帧长或帧率,利用前后相邻的两个嵌 入了时间信息的音频数据帧对应的参考日期信息插值得到当前解码的音频数据帧的参考 日期信息,在所述参考时刻标志无效时,根据音频帧长或帧率,利用前后相邻的两个嵌入了时间信息的音频数据帧对应的参考时刻信息插值得到当前解码的音频数据帧的参考时刻 信息。
10. —种音频编码装置,其特征在于,该装置包括 音频采集单元,用于采集音频数据; 时间获取单元,用于获取当前时间;时间提供控制单元,用于根据设定的嵌入规则,将所述时间获取单元获取的当前时间 提供给音频编码单元;音频编码单元,用于对所述音频采集单元采集的音频数据进行编码,并根据设定的嵌 入规则,将对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入 了时间信息的音频编码数据。
11. 如权利要求IO所述的装置,其特征在于,所述音频编码单元包括 语法生成子单元,用于根据设定的嵌入规则以及时间提供单元提供的当前时间,生成对应时间信息的语法;编码子单元,用于对所述音频采集单元采集的音频数据进行编码,将来自所述语法生 成子单元的对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入 了时间信息的音频编码数据。
12. —种音频解码装置,其特征在于,该装置包括 音频解码单元,用于对音频编码数据进行解码;时间信息提取单元,用于根据解码的音频数据帧的帧头语法中对应时间信息的语法, 得到对应所述音频数据帧的时间信息。
13. 如权利要求12所述的装置,其特征在于,该装置进一步包括 播放单元,用于将所述音频解码单元解码出的音频数据进行播放。
全文摘要
本发明公开了一种音频编码方法、解码方法和音频编码装置、解码装置。其中,音频编码方法包括采集音频数据,并对所述音频数据进行编码,根据设定的嵌入规则,将对应时间信息的语法嵌入当前进行编码的音频数据帧的帧头语法中,得到嵌入了时间信息的音频编码数据。音频解码方法包括对音频编码数据进行解码,根据解码的音频数据帧帧头语法中对应时间信息的语法,得到对应所述音频数据帧的时间信息。本发明所公开的技术方案,能够在音频数据中加入时间信息,使音频数据能够进行时间定位检索。
文档编号G06F17/30GK101740032SQ200810226659
公开日2010年6月16日 申请日期2008年11月19日 优先权日2008年11月19日
发明者冯宇红, 李晓峰, 邱嵩, 陈朝武 申请人:北京中星微电子有限公司;北京中盾安全技术开发公司;中星电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1