多声道无损音频混合编解码方法及装置制造方法

文档序号：2828078阅读：160来源：国知局

多声道无损音频混合编解码方法及装置制造方法
【专利摘要】本发明是一种多声道无损音频混合编解码方法和装置，所述方法和装置根据采样频率，声道数，量化位数，预处理模块及预测模块的运算复杂度选择算术与Golomb-rice熵编解码，利用算术与Golomb-rice熵编解码各自的优点，实现对多声道音频信号的算术与Golomb-rice的混合编解码。1、因本发明在考虑熵编码复杂度与编解码效率之间的平衡，提供了一种适用于多声道无损音频数据的混合熵编码方法，利用本方法可以实现在编解码复杂度和编解码速度之间的切换，可以根据编码设备或解码端设备的处理器运算能力差别，可以满足更广泛的应用需求。实现高质量多声道的无损音频编码，有效降低硬件成本。
【专利说明】多声道无损音频混合编解码方法及装置

【技术领域】
[0001] 本发明涉及数字信号处理技术，尤其是涉及数字音频信源编解码方法及装置。

【背景技术】
[0002] 随着半导体技术，宽带网络技术和大容量存储技术的发展，人们对多声道，高采样频率的无损音频信号的需求越来越强烈。但因为声道数量的增加，采用频率的提高，也带来了无损音频编解码计算复杂度的倍增。影响编解码计算复杂度的主要因素有：声道数量，采用频率，量化位数，编解码算法复杂度等；其中声道数量，采用频率，量化位数等因素是客观输入条件，编解码算法复杂度是可调节因素。编解码算法大体可分为：预处理算法，预测算法，熵编码。
[0003] 多声道数字音频编码领域，为了去除数据冗余，需要使用熵编码算法实现数据压缩，主要的熵编码方法有算术编码，哈夫曼编码，Golomb-Rice编码，行程编码等。这些熵编码算法适用于不同统计特性的数据源的压缩，而且时间与空间复杂度也有较大的差别。哈夫曼编码较难把概率模型建模与编码分开，在压缩率方面，扩展的哈夫曼编码能接近信源的熵，但其空间复杂度和时间复杂度都比较大；与哈夫曼编码比，算术编码较容易把概率模型建模与编码分开，它是对整个信源的编码，其压缩率也能接近信源的熵，但概率表的刷新比较耗时，时间复杂度比较大；Golomb-rice依据的是几何分布的概率模型对数据进行压缩，压缩率稍差，但其时间与空间复杂度较低；而行程编码只适用于连续重复的数据压缩，缺乏通用性。

【发明内容】

[0004] 本发明的目的是从计算复杂度和压缩率两个角度考虑，提出适用范围更广的混合熵编码方法。
[0005] 本发明提出的基于计算复杂度分析的混合熵编解码方法，根据采样频率，声道数，量化位数，预处理模块，预测模块的运算复杂度选择算术与Golomb-rice熵编解码，利用了算术与Golomb-rice熵编解码各自的优点，实现对多声道音频信号的编解码。
[0006] 为了实现本发明的目的，提出一种多声道无损音频混合编解码方法，所述方法根据采样频率，声道数，量化位数，预处理模块及预测模块的运算复杂度选择算术与 Golomb-rice熵编解码，利用算术与Golomb-rice熵编解码各自的优点，实现对多声道音频信号的算术与Golomb-rice的混合编解码。
[0007] 所述算术与Golomb-rice的混合熵编码方法包括具体步骤：
[0008] 对原始音频输入信号进行预处理，减少信号之间的冗余度，提高压缩率；
[0009] 对音频输入信号进行预测，去除原始信号前后数据的相关性；
[0010] 根据音频数据采样频率，声道数，预测模块复杂度参数，预处理模块复杂度参数，音频数据特征参数组合信息，设置选择算术熵编码和Golomb-Rice熵编码的阈值；
[0011] 所述算术与Golomb-rice的混合熵解码方法包括具体步骤：
[0012] 进行预测逆处理；
[0013] 进行预处理逆处理；
[0014] 从码流中读取熵编码算法标识，以决定调用算术还是Golomb-rice熵解码器，解码当前声道或者帧数据。
[0015] 所述方法允许算术编码和Golomb-Rice熵编码在数据帧中独立存在或混合存在，艮P，码流内全部数据采用算术编码方法、码流内全部数据采用Golomb-Rice编码方法或码流内数据采用算术编码和Golomb-Rice编码并存的方法。
[0016] 所述根据运算复杂度选择算术与Golomb-rice熵编解码，是通过对编解码技术中的各个处理模块进行归一化处理，为各编解码模块设定复杂度权重，根据计算复杂度决策要求，选定适当的处理模块及等级、实现压缩率与编解码速度之间的动态调节。
[0017] 所述预处理有以下这些形式：
[0018] 对原始输入信号的滤波整型处理、对原始输入信号的变换处理、对原始输入信号的去相关处理、对原始输入信号的联合处理和对原始输入信号的重组处理。
[0019] 所述对音频输入信号进行预测有以下形式：
[0020] Levinson-DurbinLPC线性预测、LMS最小均方误差自适应预测、RLS递推最小二乘算法和LTPLong-term预测。
[0021] 所述设置选择算术熵编码和Golomb-Rice熵编码的阈值包括；
[0022] 1)设置调用算术编码和Golomb-rice摘编码的米样频率阈值；
[0023] 2)设置调用算术编码和Golomb-rice熵编码的声道数阈值；
[0024] 3)设置调用算术编码和Golomb-rice熵编码的预测滤波器的最大阶数阈值；
[0025] 4)设置调用算术编码和Golomb-rice熵编码的预测模块的复杂度阈值。
[0026] 所述预测模块的复杂度阈值选择LPC预测阶数作为决策因子：
[0027] LPC>16,摘编码选择Golomb-Rice;
[0028] LPC〈 = 16,熵编码选择算术编码。
[0029] 为实现本发明的方法，还提出一种多声道无损音频混合编解码装置，包括混合编码装置和混合解码装置，
[0030] 所述混合编码装置包括：
[0031] 预处理模块，对原始音频输入信号进行预处理，减少信号之间的冗余度，提高压缩率；
[0032] 预测模块，去除原始信号前后数据的相关性；
[0033] 复杂度决策模块，根据信号的采样频率，声道个数，预测滤波器的阶数以及预测处理模块的计算复杂度选择调用算术或者Golomb-rice熵编码模块：
[0034] 熵编码模块，包括算术编码和Golomb-Rice熵编码的混合熵编码器；
[0035] 所述混合解码装置包括：
[0036] 预测逆处理模块，对应预测处理的逆过程；
[0037] 预处理逆处理模块，对应预处理的逆过程；
[0038] 熵解码模块，包括算术解码和Golomb-Rice熵解码的混合熵解码器。
[0039] 所述线性预测模块为基于LPC线性预测的128阶预测模块。
[0040] 本发明的有益效果：
[0041] 1、因本发明在考虑熵编码复杂度与编解码效率之间的平衡，提供了一种适用于多声道无损音频数据的混合熵编码方法，利用本方法可以实现在编解码复杂度和编解码速度之间的切换，可以根据编码设备或解码端设备的处理器运算能力差别（例如：需要实现高压缩率可以选择使用算术编码方法，需要实现高解码速度可以选择Golomb-Rice编码方法），选择适用的编解码模式，可以满足更广泛的应用需求。
[0042] 2、本发明可以在受限的处理资源下实现高质量多声道的无损音频编码，有效降低硬件成本。
[0043] 3、因改进技术具有简单，高效的特点，很容易被应用到数字音频领域，提供无损音频编解码方案。
[0044] 4、作为无损音频技术的改善点，可以在中国自主的无损音频标准中获得应用。

【专利附图】

【附图说明】
[0045] 图1是本发明的混合编码核心模块结构框图；
[0046] 图2是本发明的无损音频编码模块结构框图；
[0047] 图3根据采样频率选择熵编码器示意图
[0048] 图4是根据声道数选择熵编码器示意图
[0049] 图5是根据数据的量化位数选择熵编码器示意图
[0050] 图6是根据预测滤波器的阶数选择熵编码器示意图
[0051] 图7是根据预测处理模块的复杂度选择熵编码器示意图
[0052] 图8是根据组合信息选择熵编码器示意图
[0053] 图9是本发明的混合解码核心模块结构框图；
[0054] 图10是本发明的无损音频解码模块结构框图；
[0055] 图11是本发明的混合熵编码模式示例1 ;
[0056] 图12是本发明的混合熵编码模式示例2
[0057] 图13是本发明的混合熵编码模式示例3
[0058] 图14是本发明的混合熵编码模式示例4。

【具体实施方式】
[0059] 为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，对本发明进一步详细说明。
[0060] 本发明关键技术包括：
[0061] (1)通过使用算术编码和Golomb-Rice编码的混合熵编码方法来提高编解码速度并适当提高压缩率，本发明允许算术编码和Golomb-Rice编码在数据帧中独立存在或混合存在，即，码流内全部数据采用算术编码方法、码流内全部数据采用Golomb-Rice编码方法或码流内数据米用算术编码和Golomb-Rice编码并存的方法；
[0062] (2)利用计算复杂度决策扩展无损音频编码适用范围，实现对更多声道数量和更高采样频率的支持；通过对编解码技术中的各个处理模块进行归一化处理，为各编解码模块设定复杂度权重，根据计算复杂度决策要求，选定适当的处理模块及等级。
[0063] (3)利用简单的计算复杂度决策实现压缩率与编解码速度之间的动态调节；
[0064] 1、算术与Golomb-rice的混合编码方法
[0065] 1. 1混合编码核心框图
[0066] 图1是本发明的混合编码核心模块结构框图；如图所示，本发明允许算术编码和 Golomb-Rice编码在数据帧中独立存在或混合存在。
[0067] 1. 2无损音频编码框图
[0068] 图2是本发明的无损音频编码模块结构框图；显示无损音频编码模块的一个实施例，下面具体说明各个模块的结构特点。
[0069] 1. 3预处理模块
[0070] 对原始音频输入信号进行一些特殊的处理，减少信号之间的冗余度，提高压缩率。可能有以下这些形式：
[0071] 1)对原始输入信号的滤波处理（如滤波整型）。
[0072] 2)对原始输入信号的变换处理（如小波变换）。
[0073] 3)对原始输入信号的去相关处理（如声道去相关）。
[0074] 4)对原始输入信号的联合处理（如联合声道编码）
[0075] 5)对原始输入信号的重组处理（如声道数据的交叉重组）
[0076] 1. 4预测模块
[0077] 预测模块是用FIR(Finiteimpulseresponsefilters)，IIR(Infiniteimpulse responsefilters)滤波器技术去除原始信号前后数据的相关性，可能有以下这些形式：
[0078] 1)LPC(LinearPrediction)线性预测；
[0079] 2)LMS(LeastMeanSquare)最小均方误差自适应预测；
[0080] 3)RLS(RecursiveLeastSquare)递推最小二乘算法；
[0081] 4)LTP(long-termPrediction)Long-term预测；
[0082] 上面列举的四种预测方法用的都是FIR滤波器技术，实现的算法都是：

【权利要求】
1. 一种多声道无损音频混合编解码方法，其特征在于，所述方法根据采样频率，声道数，量化位数，预处理模块及预测模块的运算复杂度选择算术与Golomb-rice熵编解码，利用算术与Golomb-rice熵编解码各自的优点，实现对多声道音频信号的算术与 Golomb-rice的混合编解码。
2. 根据权利要求1的混合编解码方法，其特征在于：所述算术与Golomb-rice的混合熵编码方法包括具体步骤：对原始音频输入信号进行预处理，减少信号之间的冗余度，提高压缩率；对音频输入信号进行预测，去除原始信号前后数据的相关性；根据音频数据采样频率，声道数，预测模块复杂度参数，预处理模块复杂度参数，音频数据特征参数组合信息，设置选择算术熵编码和Golomb-Rice熵编码的阈值；所述算术与Golomb-rice的混合熵解码方法包括具体步骤：进行预测逆处理；进行预处理逆处理；从码流中读取熵编码算法标识，以决定调用算术还是Golomb-rice熵解码器，解码当前声道或者帧数据。
3. 根据权利要求1的方法，其特征在于，所述方法允许算术编码和Golomb-Rice熵编码在数据帧中独立存在或混合存在，即，码流内全部数据采用算术编码方法、码流内全部数据米用Golomb-Rice编码方法或码流内数据米用算术编码和Golomb-Rice编码并存的方法。
4. 根据权利要求1的方法，其特征在于，所述根据运算复杂度选择算术与Golomb-rice 熵编解码，是通过对编解码技术中的各个处理模块进行归一化处理，为各编解码模块设定复杂度权重，根据计算复杂度决策要求，选定处理模块及等级、实现压缩率与编解码速度之间的动态调节。
5. 根据权利要求1的方法，其特征在于，所述预处理有以下这些形式：对原始输入信号的滤波整型处理、对原始输入信号的变换处理、对原始输入信号的去相关处理、对原始输入信号的联合处理和对原始输入信号的重组处理。
6. 根据权利要求1的方法，其特征在于，所述对音频输入信号进行预测有以下形式： Levinson-Durbin LPC线性预测、LMS最小均方误差自适应预测、RLS递推最小二乘算法和 LTP Long-term 预测。
7. 根据权利要求1的方法，其特征在于，所述设置选择算术熵编码和Golomb-Rice熵编码的阈值包括； 1) 设置调用算术编码和Golomb-rice熵编码的米样频率阈值； 2) 设置调用算术编码和Golomb-rice熵编码的声道数阈值； 3) 设置调用算术编码和Golomb-rice熵编码的预测滤波器的最大阶数阈值； 4) 设置调用算术编码和Golomb-rice熵编码的预测模块的复杂度阈值。
8. 根据权利要求6的方法，其特征在于，所述预测模块的复杂度阈值选择LPC预测阶数作为决策因子： LPC > 16，摘编码选择 Golomb-Rice ; LPC〈= 16,熵编码选择算术编码。
9. 一种多声道无损音频混合编解码装置，包括混合编码装置和混合解码装置，其特征在于，所述混合编码装置包括：预处理模块，对原始音频输入信号进行预处理，减少信号之间的冗余度，提高压缩率；预测模块，去除原始信号前后数据的相关性；复杂度决策模块，根据信号的采样频率，声道个数，预测滤波器的阶数以及预测处理模块的计算复杂度选择调用算术或者Golomb-rice熵编码模块：熵编码模块，包括算术编码和Golomb-Rice熵编码的混合熵编码器；所述混合解码装置包括：预测逆处理模块，对应预测处理的逆过程；预处理逆处理模块，对应预处理的逆过程；熵解码模块，包括算术解码和Golomb-Rice熵解码的混合熵解码器。
10.根据权利要求8混合编解码装置，其特征在于，所述线性预测模块为基于LPC线性预测的128阶预测模块。
【文档编号】G10L19/008GK104392725SQ201410721299
【公开日】2015年3月4日申请日期:2014年12月2日优先权日:2014年12月2日
【发明者】杨新辉, 刘任化申请人:中科开元信息技术(北京)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨新辉;刘任化;
技术所有人：中科开元信息技术（北京）有限公司;
我是此专利的发明人

上一篇：语音评测方法和装置制造方法
上一篇：用于棋牌类游戏的语音操控系统及语音操控方法