无线音频压缩、解压缩方法及音频编码器和音频解码器的制作方法

文档序号:2835959阅读:477来源:国知局
专利名称:无线音频压缩、解压缩方法及音频编码器和音频解码器的制作方法
技术领域
本发明涉及一种面向无线应用的音频压缩、解压缩方法及音频编码器和音频解码
O
背景技术
无线数字音频系统不同于一般的有线音频系统,而基于嵌入式技术的无线数字音频系统更是有效地将嵌入式技术、音频编解码技术、无线传输技术结合在一起,可以很好地解决基于PC的数字音频系统在实际应用中存在的不便。和基于PC的数字音频系统相比, 基于嵌入式技术的无线数字音频设备具有体积小,携带方便,功能专业化高,成本较低,稳定性高,实时性好等特点。虽然无线音频传输与有线音频传输相比,具有使用灵活方便的特点,但是会受到带宽、延迟和功耗等方面的限制。而目前蓝牙SBC无线音频系统的成本相对较高,且音质较低。因此,针对无线传输设计一款在低码率、低延迟和低计算复杂度的情况下实现较高音质的音频编解码算并将之应用在基于嵌入式技术的无线音频系统中是十分有意义的。目前公知的高音质音频编码器按照编码方式可以分为两类。第一类是,有损音频编码器,该类型编码器通过分析音频数据频域上的相关性对音频数据进行压缩,第二类是, 无损音频编码器,该类型编码器通过分析音频数据时域上的相关性对音频数据进行压缩。第一类编码器采用变换域结合心理声学模型的压缩方法或者时域预测结合自适应量化器的压缩方法对音频数据进行压缩,变换域方法是将时域信号转换成频域,而后通过心理声学模型分析该音频信号的频域分量特性,最终通过量化器控制各频域分量的量化精度。由于有心理声学模型的分析,变换域方法可以在保证人耳主观感受的情况下最大限度地压缩音频数据流,所以变换域方法的特点就是高延迟、高复杂度、高音质和低码流。以主流的变换域方法有余弦调制滤波器组实现的子带编码,如MPl、MP2和MP3,改进型离散余弦变换(MDCT)实现的时域混叠消除编码(TDAC) Jndolby AC3,而AAC用的则是上述两种变换域方法的结合。时域预测方法是通过消除音频信号的时域相关性来进行压缩,通过计算音频数据和预测值的差值,并设定自适应量化器的量化级、更新下一数据的预测值。并传输当前数据和预测值的差值。由于采用残差的传输方式和自适应的量化器,时域预测方法在保证一定压缩比的情况下很难将提高主观音质水平,所以时域预测方法的特点是低延迟、低运算量、低音质和中等的压缩比。常见的时域预测方法有ADPCM等。第二类编码器采用时域预测结合熵编码的方法对音频数据进行压缩,主要特点是高延迟、无损音质、低运算量和低压缩比。无损编码通过时域测试等方式分析时域信号的相关性和数据的冗余性,通过熵编码来压缩时域数据的冗余。这种方式最大的特点就是音频数据的无损压缩,能完美的重现压缩前的音频数据,但是由于时域数据的冗余度分析需要大段时域数据且冗余度会根据数据的变化而改变,因而无损压缩方法的帧长较长,且压缩后的数据量会随音频数据的变化而变化。常见的无损压缩方法有WAVPACK、FLAC等。由于基于无线音频传输的音频码流需要的高音质、低延迟、高压缩比且码流在可控的情况下是固定的,所以第一类编码器中的变换域编码因为其高延迟和高运算量无法达到无线传输的要求,而时域预测编码又因其压缩比和低音质而同样无法满足要求。无损算法虽然音质堪称完美,但因其低压缩比和码流不定限制了其在无线音频方面的应用。

发明内容
为了克服已有音频传输技术的无法同时有效满足无线音频传输的高音质、低延迟、高压缩比且码流在可控的不足,本发明提供一种,在保证音频数据高音质的情况下实现了高压缩比、低延迟和中等的运算复杂度,更适应无线音频应用的无线音频压缩、解压缩方法及音频编码器和音频解码器。本发明解决其技术问题所采用的技术方案是一种无线音频压缩方法,所述音频压缩方法包括以下步骤(1),通过正交镜像滤波器组将输入PCM音频数据滤波转换成表示频域的子带数据;O),将获得的频域子带数据经过心理声学模型的计算频域感知分量,所述心理声学模型包括听觉绝对阈值表和掩蔽阈值表;(3),通过自适应比特分配方法计算量化后子频带数据的量化后比特分配数;,根据所分配的比特数量,量化上述处理后在频域上的子频带数据。进一步,所述步骤(3)中,所述自适应比特分配方法根据输入的频域感知分量和量化因子计算子频带比特分配数;其中比特分配数的确定流程包括如果量化因子高且子频带所处频率范围低时,优先分配比特;如果量化因子低且子带所处频域范围较高时,分析所处频域范围的频域感知分量,频域感知分量高的优先分配比特;如果量化因子高但所处频域范围高时,分析所处频域范围的频域感知分量,感知分量高的优先分配比特。优选的,所述步骤(3)中,采用对称编解码方法删减了量化后比特分配数的传输, 编码压缩后码流中不包含比特分配数,而是在解码端重新根据量化因子和频域感知分量计算比特分配数。
一种音频编码器,所述音频编码器包括正交镜像滤波单元,用于通过对原型低通滤波器余弦调制构建的16通道滤波器组,将时域信号转换成16子带的频域信号;心理声学模型分析单元,用于通过掩蔽阈值分析子频带数据,生成频域感知分量;量化因子计算单元,用于计算子频带数据的量化因子;自适应比特分配单元,用于根据频域感知分量和量化因子计算子频带的比特分配数;APCM量化单元,用以根据比特分配数和量化因子对子频带数据量化处理;码流生成单元,用于将帧头、量化因子和量化后频带数据打包生成码流。进一步,所述滤波器组为16子带滤波器,原型低通滤波器符合16子带滤波器组的条件是完美重构条件。
5
—种无线音频解压缩方法,所述音频解压缩方法包括以下步骤首先,从输入的编码后码流中寻找同步字,而后解析出声道数据、量化方式和比特池信息;接着,从码流中解析量化因子;接着,根据量化因子和比特池信息计算比特分配数;接着,从码流中解析出量化后数据,然后根据量化因子和比特分配数计算频域子带数据;接着,通过反相正弦正交滤波器对子频带数据进行反相滤波,得到PCM数据;最后,根据声道数据的配置,将滤波得到的PCM数据转换成PCM码流。一种音频解码器,所述音频解码器包括码流解析单元,用于读取同步字判断帧头,分析帧长,分析码流边信息;量化因子解析单元,用于从码流中解析量化因子,用于比特分配和反量化;比特分配单元,用于根据量化因子计算比特分配数据;频域数据解析单元,用于从码流中解析量化后数据;反量化单元,用于根据量化因子、比特分配数和量化后数据计算子频带数据;反相滤波单元,用于根据子频带数据通过反相镜像正交滤波器计算PCM数据;PCM码流生成单元,用于根据单/双声道的不同将PCM数据按要求排列成PCM流。本发明的技术构思为通过镜像正交滤波器组分析音频采样信号的频域特性,并将时域信号转换成频域信号,通过心理声学模型分析频域信号,并控制自适应比特分配器和量化器对频域信号进行量化打包。根据本发明的另一个方面,提供一种音频压缩和解压缩装置,压缩装置包括可配置原型滤波器和余弦调制滤波器组,通余弦调制变换原型滤波器正交搬移到各个子频带, 形成镜像正交滤波器组,将时域采样转换为频域子频带信号;量化因子分析器,计算子频带数据的量化比特位数,用于比特分配;基于心理声学模型的自适应比特分配器,根据心理声学模型的听觉阈值和掩蔽阈值和设定的比特池(bitpool),分析子频带信号,分配比特;量化器,按比特分配数对子频带数据量化打包。解压缩装置包括码流解析装置,解析码流中通用部分,如采样率,声道模式和比特池(bitpool)等信息;量化因子解析器,读取码流中量化因子部分,解析量化因子;比特分配器,根据量化因子和比特池计算比特分配数;频域数据解析器,解析码流中压缩后频域数据;反量化器,根据解析的频域数据、量化因子和比特分配数计算子频带数据。反相滤波器,对子频带数据反相滤波,得到还原的PCM数据;PCM 生成器,将还原的PCM码流根据需求排列格式输出。本发明的有益效果主要表现在在保证音频数据高音质的情况下实现了高压缩比、低延迟和中等的运算复杂度,更适应无线音频应用。


图1是本发明音频压缩方法的流程图。图2是本发明音频压缩系统的结构图。图3是本发明音频压缩系统的原型低通滤波器系数图。图4是本发明音频解压缩方法的流程图。
图5是本发明音频解压缩系统的结构。图6是本发明滤波系统的流程图。图7是本发明滤波器组的构成图。
具体实施例方式下面结合附图对本发明作进一步描述。参照图1,图1所示是一种音频压缩方法的流程图,具体过程如下首先,在步骤310通过配置选择所需的正交镜像滤波器组对每组输入的音频数据进行滤波,根据延迟、音质和运算量的不同要求将每个音频数据分成16或32个子频带。接着,在步骤320用心理声学模型分子带音频数据分析频域的子带数据。通过听觉绝对阈值和掩蔽阈值获得子频带数据的频域感知分量。接着,在步骤330直接计算子频带数据的量化比特数,并确定各子带最大量化比特数为量化因子。接着,在步骤340根据子带数据频域感知分量和量化因子计算子带数据量化后比特分配数。接着,在步骤350APCM量化器根据分配好的比特数对频域的音频数据量化处理, 生成量化子频带数据。在步骤360中,利用熵编码把帧头同步字、量化因子和量化后的子频带数据形成比特流。图2是根据本发明的音频编码器包括镜像正交滤波单元110,心理声学模型单元 120,量化因子分析单元130,自适应比特分配单元140,APCM量化打包单元150,以及比特流产生单元160。首先本发明使用的镜像正交变换是一种子带滤波,其利用正交变换滤波器组将输入时域信号转换成频域信号,滤波器组中滤波器数目和滤波器系数的精度增加那么滤波后子带数据的频域分辨率和精度就增加。滤波器组的构成是由一个原型低通滤波器(图3) 经离散余弦调制构成(式1),参见图1,可配置的正交镜像滤波器组能够将输入的音频转换成16子频带或者32子频带的频域信号,16子频带和32子频带分别对应不同音质、延迟和运算量的需求,在一般情况下选用16字频带滤波器组,特点是延迟小,运算量中等,音质好,而当无线传输带宽冗余大且环境干扰小时可以选择延迟稍长,运算量大但音质更好的 32子频带滤波器组。hk {η) = 2h(n) cos[(A: + 0.5)(n - -^-]0 ^ η ^ N-1,0 ^ k ^ M-I(1)心理声学模型分析子带频域信号的频域分量,根据听觉绝对阈值和声音掩蔽阈值对子带频域数据分析,获得感知频域分量。量化因子分析单元130,分析子频带数据的量化等级,计算量化因子,用于计算比特分配数。自适应比特分配单元140,根据量化因子和心理声学模型的频域感知分量对各子带数据分配比特数。
APCM量化单元150,根据各子带上的分配的比特数对子频带数据进行量化。比特流产生单元160,产生同步字,打包量化因子和量化后子带数据形成比特流。图4所示是本发明无线音频解压缩的流程图。首先,在步骤510从输入的编码后码流中寻找同步字,而后解析出声道数据、量化方式和比特池等信息。接着在步骤520中从码流中解析量化因子。接着在步骤530中根据量化因子和比特池信息计算比特分配数。接着在步骤MO中从码流中解析出量化后数据,然后根据量化因子和比特分配数计算频域子带数据。接着在步骤550中通过反相正弦正交滤波器对子频带数据进行反相滤波,得到 PCM数据。最后,在步骤560中根据声道数据的配置,将滤波得到的PCM数据转换成PCM码流。图5根据本发明的音频解码器包括码流解析单元410,量化因子解析单元420,比特分配单元430,频域数据解析单元440,反量化单元450,反相滤波单元460,PCM生成单元 470。码流解析单元410,读取同步字判断帧头,分析帧长,分析码流边信息。量化因子解析单元420,从码流中解析量化因子,用于比特分配和反量化。比特分配单元4330,根据量化因子计算比特分配数据。频域数据解析单元440,从码流中解析量化后数据。反量化单元450,根据量化因子、比特分配数和量化后数据计算子频带数据。反相滤波单元460,根据子频带数据通过反相镜像正交滤波器计算PCM数据。PCM码流生成单元,根据单/双声道的不同将PCM数据按要求排列成PCM流。首先,在编码端构建一个256系数的原型低通滤波器,该滤波器的通带截止宽度是由频域响应带宽和所需构建的滤波器组中滤波器的数目决定的,原型滤波器的精度决定了整个滤波器组的精度和性能。时域的PCM数据通过整个余弦调制滤波器组产生子频带数据,经过下采样的子频带数据传输至解码端,解码端同样的滤波器组将上采样后的自带数据进行综合滤波,重构成为PCM数据流。接着采用余弦调制方式将原型低通滤波器调制成多个带通滤波器,与原低通滤波器一共形成正交镜像滤波器组,参见图6,实际中滤波器频响(620)的非理想性会通过各个滤波器之间的混和叠加方式进行弥补,因而得到的滤波器组的频域响应仍然是线性且满足完美重构条件的,达到与理想频响(610)同样的效果。如图7,可以看到采用本发明滤波器的滤波延迟对比相同技术的MP3的要小一半。 采样率481ΛΖ的情况下约2毫秒。而由于滤波器组中滤波器数目少于MP3,因而运算消耗是 MP3编解码的一半。本实施例的心理声学模型、比特分配和量化方式经过优化后简化了心理声学模型的计算复杂度,直接应用经过验证的频域听觉阈值和掩蔽阈值对子频带数据进行分析;而在比特分配单元由于采用了对称量化方案,比特分配的结果并不直接通过码流传输至解码端,而是通过量化因子在解码端通过同样的比特分配机制计算比特分配数,这样减小了大量的码流可用于传输量化后音频数据,并且设定了码流长度调节参数,可随时根据无线传输环境调节比特分配数。 如上所述,本实施例专门正对无线音频传输应用的特点采用了优化的高精度正交镜像滤波器组在保证音频完美重构的情况下降低了编解码的延迟和计算复杂度,并通过对称量化和参数调节码流的方法降低码流并适应无线传输环境的变化而可自适应的对码流做出调整。另外,本实施例通过心理声学模型的方法在降低码流的情况下的保证了人耳主观对音质的需求。
权利要求
1.一种无线音频压缩方法,其特征在于所述音频压缩方法包括以下步骤(1),通过正交镜像滤波器组将输入PCM音频数据滤波转换成表示频域的子带数据; O),将获得的频域子带数据经过心理声学模型的计算频域感知分量,所述心理声学模型包括听觉绝对阈值表和掩蔽阈值表;(3),通过自适应比特分配方法计算量化后子频带数据的量化后比特分配数; ,根据所分配的比特数量,量化上述处理后在频域上的子频带数据。
2.如权利要求1所述的无线音频压缩方法,其特征在于所述步骤(3)中,所述自适应比特分配方法根据输入的频域感知分量和量化因子计算子频带比特分配数;其中比特分配数的确定流程包括如果量化因子高且子频带所处频率范围低时,优先分配比特; 如果量化因子低且子带所处频域范围较高时,分析所处频域范围的频域感知分量,频域感知分量高的优先分配比特;如果量化因子高但所处频域范围高时,分析所处频域范围的频域感知分量,感知分量高的优先分配比特。
3.如权利要求1所述的无线音频压缩方法,其特征在于所述步骤(3)中,采用对称编解码方法删减了量化后比特分配数的传输,编码压缩后码流中不包含比特分配数,而是在解码端重新根据量化因子和频域感知分量计算比特分配数。
4.一种用如权利要求1所述的无线音频压缩方法形成的音频编码器,其特征在于所述音频编码器包括正交镜像滤波单元,用于通过对原型低通滤波器余弦调制构建的16通道滤波器组,将时域信号转换成16子带的频域信号;心理声学模型分析单元,用于通过掩蔽阈值分析子频带数据,生成频域感知分量; 量化因子计算单元,用于计算子频带数据的量化因子;自适应比特分配单元,用于根据频域感知分量和量化因子计算子频带的比特分配数; APCM量化单元,用以根据比特分配数和量化因子对子频带数据量化处理; 码流生成单元,用于将帧头、量化因子和量化后频带数据打包生成码流。
5.如权利要求4所述的音频编码器,其特征在于所述滤波器组为16子带滤波器,原型低通滤波器符合16子带滤波器组的条件是完美重构条件。
6.一种无线音频解压缩方法,其特征在于所述音频解压缩方法包括以下步骤首先,从输入的编码后码流中寻找同步字,而后解析出声道数据、量化方式和比特池信息;接着,从码流中解析量化因子;接着,根据量化因子和比特池信息计算比特分配数;接着,从码流中解析出量化后数据,然后根据量化因子和比特分配数计算频域子带数据;接着,通过反相正弦正交滤波器对子频带数据进行反相滤波,得到PCM数据; 最后,根据声道数据的配置,将滤波得到的PCM数据转换成PCM码流。
7.一种用如权利要求6所述的无线音频解压缩方法实现的音频解码器,其特征在于 所述音频解码器包括码流解析单元,用于读取同步字判断帧头,分析帧长,分析码流边信息; 量化因子解析单元,用于从码流中解析量化因子,用于比特分配和反量化; 比特分配单元,用于根据量化因子计算比特分配数据; 频域数据解析单元,用于从码流中解析量化后数据;反量化单元,用于根据量化因子、比特分配数和量化后数据计算子频带数据; 反相滤波单元,用于根据子频带数据通过反相镜像正交滤波器计算PCM数据; PCM码流生成单元,用于根据单/双声道的不同将PCM数据按要求排列成PCM流。
全文摘要
一种无线音频压缩方法,包括以下步骤(1),通过正交镜像滤波器组将输入PCM音频数据滤波转换成表示频域的子带数据;(2),将获得的频域子带数据经过心理声学模型的计算频域感知分量,所述心理声学模型包括听觉绝对阈值表和掩蔽阈值表;(3),通过自适应比特分配方法计算量化后子频带数据的量化后比特分配数;(4),根据所分配的比特数量,量化上述处理后在频域上的子频带数据。以及提供利用该音频压缩方法实现的音频编码器、无线音频解压缩方法及音频解码器。本发明在保证音频数据高音质的情况下实现了高压缩比、低延迟和中等的运算复杂度,更适应无线音频应用。
文档编号G10L19/00GK102436819SQ201110327749
公开日2012年5月2日 申请日期2011年10月25日 优先权日2011年10月25日
发明者冯炯, 姚嘉, 杨洋, 黄凯 申请人:杭州微纳科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1