高级音频编码系统的制作方法

文档序号:8300072阅读:330来源:国知局
高级音频编码系统的制作方法
【技术领域】
[0001] 本发明设及一种编码系统,具体地,设及一种高级音频编码系统。
【背景技术】
[000引 AAC(Advanced Audio Coding)的中文称为"局级音频编码",是目自U最先进的感知 音频编码技术。它出现于1997年,由化aunhofer IIS、AT&T、杜比实验室、Sony等公司共同 开发而生,它是基于MPEG-2编码技术,目的是取代MP3格式。2000年,MPEG-4标准出现后, AAC重新集成了其特性,加入了 SBR技术和PS技术,形成了目前的MPEG-4 AACdMPEG-4 AAC 具有信号压缩比高、量化编解码过程模块化、重建音质完美的特点。MPEG-4 AAC作为一种目 前最先进感知编码技术标准,广泛应用于各个领域,具有很大的市场价值。但是,AAC标准 算法无法满足当今感知音频编码技术的实时性要求,是其算法复杂度很高,需要消耗大量 运算时间和系统资源,存在编码延时导致的。因此,为了实现高实时性能、低复杂度的音频 编码,那么对AAC标准的相关算法和编码结构进行优化设计是十分必要的。同时,AAC音频 感知编码具有共同的核屯、灵魂,即量化编解码、屯、理声学模型及滤波器组(又称频域变换) =大关键技术,量化编解码模块占了主要部分。
[0003] 量化编码模块在实现高压缩比中起着主要作用。目前的技术环境中,AAC标准大 多采用的是双循环迭代量化算法,但是在具体实现过程中普遍存在收敛速度慢,迭代次数 多,运算量大等缺点,无法满足实时编码的需要。目前AAC标准算法提供的量化过程是通过 采用双循环迭代结构来实现的:内迭代循环调整全局缩放因子,使之达到规定比特编码要 求;外迭代循环调整子带缩放因子,计算子带量化噪声。当子带量化噪声超过掩蔽阔值时, 增加子带的缩放因子将其量化噪声在掩蔽阔值之下,从该种实现方式可W看出双循环迭代 结构存在W下=个主要缺点;迭代次数多,运算量大,收敛速度慢。

【发明内容】

[0004] 针对现有技术中的缺陷,本发明的目的是提供一种高级音频编码系统,其减少迭 代次数,提高有效性,加快收敛速度。
[0005] 根据本发明的一个方面,提供一种高级音频编码系统,其特征在于,由屯、理声学模 型模块、滤波器组、联合立体声编码模块、量化编码模块组成,屯、理声学模型模块、滤波器 组、联合立体声编码模块、量化编码模块依次连接。
[0006] 优选地,所述屯、理声学模型模块主要是利用屯、理声学原理对信号频谱进行分析计 算出信掩比、掩蔽阔值供其它模块使用。
[0007] 优选地,所述滤波器组主要是使用改进的离散余弦变换,把时间域上的输入音频 数据变换成频域信号。
[000引优选地,所述联合立体声编码模块是针对多声道开发的一种复杂的空间编码技 术,去掉空间的冗余f目息。
[0009] 优选地,所述量化编码模块主要包括量化和编码两个部分,是AAC音频编码系统 非常重要的功能模块。
[0010] 优选地,所述量化编码模块包括:
[0011] 比特计算单元,用于计算可分配的比特数;
[0012] SDI初始化单元,采用SDI算法对量化因子进行初始化,SDI算法主要是通过构建 信号的初始值与信号某些特性关系的数学模型来实现量化因子的初始化;
[0013] 感知滴预检测单元,用于提高码表查询、比特数耗费计算、编码的效率,是在进行 码表查询、比特数耗费计算、编码之前所进行的预处理工作;
[0014] 编码单元,通过码表查询,并采用哈夫曼编码的方法进行编码,同时计算出实际的 比特耗费,判断实际比特耗费是否小于可分配的比特数,否则调整最小量化阶的单步步长, 重新进行哈夫曼编码,直到满足能使实际比特耗费小于可分配的比特数。
[0015] 与现有技术相比,本发明具有如下的有益效果;本发明能够较好的提高量化模块 初始化过程的有效性,减少步长调整次数。引入感知摘预检测在一定程度上减少不必要的 运算开销。本发明省略了原双循环结构中的噪声控制循环部分,因此,不需要再进行复杂的 反量化处理从而大大增加了 AAC编码的实时性。
【附图说明】
[0016] 通过阅读参照W下附图对非限制性实施例所作的详细描述,本发明的其它特征、 目的和优点将会变得更明显:
[0017] 图1为本发明高级音频编码系统结构框图。
[0018] 图2为本发明中量化编码模块的结构框图。
[0019] 图3为本发明高级音频编码系统的量化编码模块的工作流程图。
【具体实施方式】
[0020] 下面结合具体实施例对本发明进行详细说明。W下实施例将有助于本领域的技术 人员进一步理解本发明,但不W任何形式限制本发明。应当指出的是,对本领域的普通技术 人员来说,在不脱离本发明构思的前提下,还可W做出若干变形和改进。该些都属于本发明 的保护范围。
[0021] 如图1所示,本发明高级音频编码系统主要由屯、理声学模型模块201、滤波器组 202、联合立体声编码模块203、量化编码模块204组成,屯、理声学模型模块201、滤波器组 202、联合立体声编码模块203、量化编码模块204依次连接。
[0022] 屯、理声学模型模块201主要是利用屯、理声学原理对信号频谱进行分析计算出信 掩比、掩蔽阔值等一系列屯、理声学参数供其它模块使用,是编码器的核屯、模块。屯、理声学模 型应用到的主要屯、理声学原理有;临界子带频率分析、绝对掩蔽阔值、频域掩蔽、时域掩蔽 和感知滴等。屯、理声学模型模块把整个信号频带按人耳的听觉感知特性划分成临界频带, 然后计算出各临界子带的信掩比、掩蔽阔值等屯、理声学参数,信掩比用于对每个比例因子 带进行比特分配,掩蔽阔值用于对量化噪声进行控制。
[0023] 滤波器组202主要是使用改进的离散余弦变换(MDCT),把时间域上的输入音频数 据变换成频域信号。
[0024] 联合立体声编码模块203是针对多声道开发的一种复杂的空间编码技术,其目的 是为了去掉空间的冗余信息。
[0025] 量化编码模块204主要包括量化和编码两个部分,是AAC音频编码系统非常重要 的功能模块。量化处理的根本目的就是为了在允许的比特范围内尽可能的压缩数据并保 证量化误差的能量低于掩蔽阔值。量化模块的目标是将频谱数据量化,使量化噪声满足屯、 理声学模型的要求。量化模块首先对得到的音频信号频谱划分量化比例因子带,然后针对 每个比例因子带根据计算得到的掩蔽阔值进行非均匀量化。在具体的量化过程中不断地对 全局量化因子和各比例因子带的局部量化因子进行调整W实现在给定的编码比特率下尽 可能的将量化噪声控制在掩蔽阔值之下;最后对量化后的信号和比例因子再进行哈夫曼编 码,实现高压缩比和高音质的音频编码。
[0026] 下面对所述系统的工作过程及其工作原理进行详细的描述:
[0027] 屯、理声学模型模块201根据屯、理声学模型计算输入音频信号容许的失真,把整个 信号频带按人耳的听觉特性划分出临界频带,然后计算出各临界子带的信掩比,并计算出 各临界子带的最小掩蔽阔值。信掩比用于比特分配;绝对掩蔽阔值用于控制量化噪声。滤 波器组202结合由屯、理声学模型计算出来的感知滴,将输入的音频采样数据通过使用改进 的离散余弦变换MDCT实现音频从时域到频域的转换。将时域的信号状态转化为频域的信 号数据。接着,联合立体声编码模块203通过采用强度立体声和M/S立体声编码方式来实 现立体声编码同时去除信号数据的冗余信息。然后,在量化编码模块204中按屯、理声学模 块输出的掩蔽阔值把比特数分配给输入频谱,通过一种将SDI算法和感知滴预检测结合起 来的单循环量化结构使量化所产生的量化噪声低于掩蔽域值,降低比特率,并使码率满足 设定的要求,实现输入信号的压缩。最后使用哈弗曼编码打包码流得到需要的AAC数据; [002引本发明主要从算法和结构两个方面对量化编码模块204进行改进,提出一种将 SDI算法和感知滴预检测结合起来的单循环量化结构,使高级音频编码系统的量化编码模 块中量化过程的更简单、更实用,从而提高了系统的实时性。
[0029] 参照图2,示出了本发明高级音频编码系统的量化编码模块的结构框图,量化编码 模块包括:
[0030] 比特计算单元301,用于计算可分配的比特数;
[0031] SDI初始化单元302,采用SDI算法对量化因子进行初始化,SDI算法主要是通过构 建信号的初始值与信号某些特性关系的数学模型来实现量化因子的初始化,如下式(1):
[0032]
【主权项】
1. 一种高级音频编码系统,其特征在于,由屯、理声学模型模块、滤波器组、联合立体声 编码模块、量化编码模块组成,屯、理声学模型模块、滤波器组、联合立体声编码模块、量化编 码模块依次连接。
2. 根据权利要求1所述的高级音频编码系统,其特征在于,所述屯、理声学模型模块主 要是利用屯、理声学原理对信号频谱进行分析计算出信掩比、掩蔽阔值供其它模块使用。
3. 根据权利要求1所述的高级音频编码系统,其特征在于,所述滤波器组主要是使用 改进的离散余弦变换,把时间域上的输入音频数据变换成频域信号。
4. 根据权利要求1所述的高级音频编码系统,其特征在于,所述联合立体声编码模块 是针对多声道开发的一种复杂的空间编码技术,去掉空间的冗余信息。
5. 根据权利要求1所述的高级音频编码系统,其特征在于,所述量化编码模块主要包 括量化和编码两个部分,是AAC音频编码系统非常重要的功能模块。
6. 根据权利要求1所述的高级音频编码系统,其特征在于,所述量化编码模块包括: 比特计算单元,用于计算可分配的比特数; SDI初始化单元,采用SDI算法对量化因子进行初始化,SDI算法主要是通过构建信号 的初始值与信号某些特性关系的数学模型来实现量化因子的初始化; 感知滴预检测单元,用于提高码表查询、比特数耗费计算、编码的效率,是在进行码表 查询、比特数耗费计算、编码之前所进行的预处理工作; 编码单元,通过码表查询,并采用哈夫曼编码的方法进行编码,同时计算出实际的比特 耗费,判断实际比特耗费是否小于可分配的比特数,否则调整最小量化阶的单步步长,重新 进行哈夫曼编码,直到满足能使实际比特耗费小于可分配的比特数。
【专利摘要】本发明提供了一种高级音频编码系统,由心理声学模型模块、滤波器组、联合立体声编码模块、量化编码模块组成,心理声学模型模块、滤波器组、联合立体声编码模块、量化编码模块依次连接。本发明减少迭代次数,提高有效性,加快收敛速度。
【IPC分类】G10L19-038, G10L19-008
【公开号】CN104616657
【申请号】CN201510016797
【发明人】孙莹, 何云龙, 杜美霞
【申请人】中国电子科技集团公司第三十二研究所
【公开日】2015年5月13日
【申请日】2015年1月13日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1