一种无损音频压缩编码方法及其解码方法

文档序号:2827764阅读:629来源:国知局
一种无损音频压缩编码方法及其解码方法
【专利摘要】本发明提供一种无损音频压缩编码方法及其解码方法,编码方法包括以下步骤:S1:采用自适应分巾贞技术对原始PCM音频信号进行分巾贞得到分中贞信息和分巾贞信号,把分巾贞信息纳入边信息;S2:对每一帧信号进行改进的离散余弦变换得到残余频谱和变换信号;S3:对每一帧变换信号进行声道去相关;S4:利用线性预测参数对进行声道去相关后的每一帧进行线性预测得到残差信号;55:将残差信号和残余频谱一起进行熵编码得到熵编码的码本,并将其转换成压缩的比特流输出;56:将S4中线性预测用到的线性预测参数和S5中得到的熵编码的码本纳入S1中的边信息中。
【专利说明】一种无损音频压缩编码方法及其解码方法

【技术领域】
[0001] 本发明涉及数字音频压缩领域,具体涉及一种无损音频压缩编码方法及其解码方 法。

【背景技术】
[0002] 音频编码的核心目标就是用最少的比特数来表示信号,同时又实现透明的信号再 生,就是说即使敏感的听音者("金耳朵")也不能觉察原始输入与再生输出音频之间的差 另IJ。既要保证音频文件保持无损,又要保证其存储空间小、传输快,降低无损音频的压缩比、 提高压缩效率是有效的途径。无损音频压缩编码主要分为两步:第一去相关,第二熵编码。 去相关的方法分为两类:基于预测的编码和基于变换的编码。预测又可以分为线性预测和 非线性预测。由于非线性预测实现起来复杂度较高,所以在实际应用中使用线性预测的算 法居多。基于变换的无损编码是在整数变换出现之后发展起来的。
[0003] 现有的无损音频压缩算法虽然在维持音频文件完整性方面已到达非常精准的效 果,但是在压缩效率方面却总是难以有所突破,仅仅能压缩至原文件的一半。


【发明内容】

[0004] 本发明的目的在于提出一种压缩比低、压缩速度快、算法复杂程度低的无损音频 压缩方法。
[0005] 本发明的又一目的在于提出一种与该无损音频压缩编码方法对应的解码方法。
[0006] -种无损音频压缩编码方法,该方法基于改进的离散余弦变换和整系数线性预 测,包括以下步骤:
[0007] S1 :采用自适应分帧技术对原始PCM音频信号进行分帧得到分帧信息和分帧信 号,把分巾贞信息纳入边信息;
[0008] S2 :对每一帧信号进行改进的离散余弦变换得到残余频谱和变换信号;
[0009] S3 :对每一巾贞变换信号进行声道去相关;
[0010] S4:利用线性预测参数对进行声道去相关后的每一帧进行线性预测得到残差信 号;
[0011] S5 :将残差信号和残余频谱一起进行熵编码得到熵编码的码本,并将其转换成压 缩的比特流输出;
[0012] S6 :将S4中线性预测用到的线性预测参数和S5中得到的熵编码的码本纳入S1中 的边信息中。
[0013] 本发明方法同时采用离散余弦变换编码和线性预测进行去相关,使得信号间的冗 余更小。
[0014] 所述步骤S1中的自适应分帧方法如下:
[0015] 首先以最小帧长为单位,计算当前帧与前一帧的相关系数,如果此系数小于阈值, 则标记该帧与前一帧为不相关帧,单独成一帧,如果此系数大于阈值,则认为当前帧与前一 帧相关,将相邻的相关帧依次合并,但最大帧长不超过设定的最大帧长允许值,当合并帧的 长度超过设定的最大巾贞长时重起一中贞。
[0016] 分帧提供了音频信号的可编辑能力,可以使特性一致的信号能够在一帧内进行 处理。
[0017] 所述步骤S2中改进的离散余弦变换是基于模变换的整数型改进的离散余弦变 换。对于整数型改进的离散余弦变换采用模变换算法来代替提升算法,避免提升算法中由 级联产生的延时和递增的取整误差等缺陷,提高了算法的实时性和压缩效率,采用整系数 线性预测,并对其预测器选取进行优化,旨在通过选择效率更高的预测器,提高压缩效率。
[0018] 所述的模变换是利用勾股数三元组代替三角函数,对吉文斯旋转变换进行整数型 近似。
[0019] 整数型改进离散余弦变换是用于无损编码滤波器组离散余弦变换中的整数实现, 基于模变换的整数型改进的离散余弦变换(IntMDCT算法)的运行速度最快。模变换算较 提升算法具有更高的精度。吉文斯(Givens)旋转变换在二维平面内的2范数不变性有利 于扩展输出信号的动态范围。
[0020] 所述步骤S4中的线性预测是利用整系数预测方式,其优化方式是通过取最后2种 预测结果的加权平均来取代初始预测值。
[0021] 整系数预测技术提供了一组简洁的预测系数矩阵,较精确地表征了音频信号的幅 度,而分析他们的运算量并不大,应用这组模型参数可以降低存储音频信号的容量,实现 有效的无损还原,取最后2种预测结果的加权平均取代初始预测器,通过选择效率更高的 预测器,能提高压缩效率。
[0022] 所述步骤S5中的熵编码是哥伦布-莱斯编码,其过程如下:
[0023] S21 :将残差信号负数映射到正数,映射公式如下:
[0024]

【权利要求】
1. 一种无损音频压缩编码方法,该方法是基于改进的离散余弦变换和整系数线性预测 实现的,其特征在于,包括以下步骤: 51 :采用自适应分帧技术对原始PCM音频信号进行分帧得到分帧信息和分帧信号,把 分帧信息纳入边信息; 52 :对每一帧信号进行改进的离散余弦变换得到残余频谱和变换信号; 53 :对每一帧变换信号进行声道去相关; 54 :利用线性预测参数对进行声道去相关后的每一帧进行线性预测得到残差信号; 55 :将残差信号和残余频谱一起进行熵编码得到熵编码的码本,并将其转换成压缩的 比特流输出; 56 :将S4中线性预测用到的线性预测参数和S5中得到的熵编码的码本纳入S1中的边 信息中。
2. 根据权利要求1所述的无损音频压缩编码方法,其特征在于,所述步骤S1中的自适 应分帧方法如下: 首先以最小帧长为单位,计算当前帧与前一帧的相关系数,如果此系数小于预设的阈 值,则标记该帧与前一帧为不相关帧,单独成一帧,如果此系数大于预设的阈值,则认为当 前帧与前一帧相关,将相邻的相关帧依次合并,但最大帧长不超过设定的最大帧长允许值, 当合并帧的长度超过设定的最大帧长时重起一帧。
3. 根据权利要求1所述的无损音频压缩频编码方法,其特征在于,所述步骤S2中改进 的离散余弦变换是基于模变换的整数型改进的离散余弦变换。
4. 根据权利要求3所述的无损音频压缩频编码方法,其特征在于,所述的模变换是利 用勾股数三元组代替三角函数,对吉文斯旋转变换进行整数型近似。
5. 根据权利要求1所述的无损音频压缩频编码方法,其特征在于,所述步骤S4中的线 性预测是利用整系数预测方式,其优化方式是通过取最后2种预测结果的加权平均来取代 初始预测值。
6. 根据权利要求1所述的无损音频压缩频编码方法,其特征在于,所述步骤S5中的熵 编码是哥伦布-莱斯编码,其过程如下: 521 :将残差信号负数映射到正数,映射公式如下:
r [η]是输入的残差信号,η = 0, 1,2,......; 522 :确定哥伦布-莱斯参数s进行编码:
μ是r[n]的绝对值平均值。
7. 根据权利要求6所述的无损音频压缩频编码方法,其特征在于,所述的哥伦布-莱斯 参数s作为边信息与残差信号一起传输。
8. -种对权利要求7所述的无损音频压缩频编码方法进行编码的信号解码的方法,其 特征在于,该方法包括如下流程: 对边信息进行解码,从中分离出熵编码的码本、线性预测参数、分帧信息;对码本信息 进行熵解码得到熵编码前的残余频谱和残差信号,利用线性预测参数对熵解码得到熵编码 前的残差信号进行线性预测重构,利用熵解码得到熵编码前的残余频谱进行整数型改进的 离散余弦变换的逆变换,将进行线性预测重构后的信号和进行整数型改进的离散余弦变换 的逆变换后的信号整合得到原始的每帧信号,最后根据分帧信息将各帧顺次连接起来得到 原始音频文件。
【文档编号】G10L19/12GK104217726SQ201410441330
【公开日】2014年12月17日 申请日期:2014年9月1日 优先权日:2014年9月1日
【发明者】陆许明, 徐永键, 李佳男, 谭洪舟 申请人:东莞中山大学研究院, 中山大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1