一种用于感知音频编码的量化器自适应调整方法

文档序号:2837171阅读:581来源:国知局

专利名称::一种用于感知音频编码的量化器自适应调整方法
技术领域
:本发明涉及感知音频编码中的量化器,具体地说涉及一种用于感知音频编码的量化器自适应调整方法。编码器的量化失真和量化器的区间划分和量化值大小有关。标量量化器将落在量化区间[x(i),x(i+1))的信号工映射为量化电平y(i);x(i)是量化边界点,量化电平的间隔称为量化阶距。量化阶距相等且量化区间相等的量化器为均匀量化器,否则为非均匀量化器。利用质心条件和最佳划分条件,可以用迭代的方式求得最佳量化电平和量化区间,它能获得最小的量化均方误差。感知音频编码器中,MPEG-1Layerl和Layer2中使用均匀标量量化器。均匀量化器结构简单,但是其量化信噪比会随着量化电平数的减小而下降,在小信号时信噪比较差,因此,均匀量化器只有在信号均匀分布时才是最优量化器,非均匀分布信号的最优量化器是非均匀量化器。非线性扩压是非均匀量化中最常用的技术。MPEG-1Layer3和MPEG-4AAC都使用了非线性扩压和可变量化阶距来实现非均匀量化,其非均匀量化器遵循了音频中小信号多的特性,减少了量化均方误差。感知音频编码器的原始量化谱由下式获得其中a:是变换域谱,A是扩压系数,—A是动态量化步长,它对特定子带是不变的,由于后文的论述都是在子带中进行的,故可将A视为常数。在MPEG-4AAC中,工是MDCT(改进的离散余弦变换)谱,A=3/4。原始量化谱规范到量化电平i=0,1,2,…得到整数量化谱其中,level表示电平规范操作。有损音频编码中,电平规范操作是减少信息量的主要手段和编码噪声的主要来源。MPEG-4AAC标准推荐采用量化边界点x④二i—0.4054,用一个特殊的取整完成电平规范操作int表示提取实数的整数部分。对于原始量化谱x而言,这相当于量化电平为,电平区间为[O,l],[1,2],[2,3],,量化区间为<formula>formulaseeoriginaldocumentpage6</formula>(4)量化均方误差为"薦=={V/A—leVelW1/A}2A2/AMPEG-4AAC编码以帧为单位,在子带中进行,需要考虑子带信号的整体失真。不失一般性,认为子带原始量化谱是iV+l维向量,其中最大值为<formula>formulaseeoriginaldocumentpage6</formula>(6)考虑x,在[o,ij之间均匀和非均匀两种分布,前者分布密度函数为P")=^/Xmax,"(7)后者模仿音频信号小信号居多,分布密度函数为P0r)=1.9/Xmax-l.崎腿2,工e[O,X腿](8)从而得到子带重建后的能量与原始信号能量比值的期望值,如图l-a与图l-b所示,其中iV分别取值3和31,它代表了Mpeg-4AAC中较典型的编码子带长度。可以看到,这两种分布都出现了当Xn^较小时,能量比期望值大于l的情况比重大,能量波动幅度高的情况。这说明Mpeg-4AAC的量化器容易出现重建信号能量偏离原始信号的整体能量失真的问题。
发明内容本发明就是为了解决上述技术问题,提出了一种用于感知音频编码的量化器自适应调整方法,在不改变感知音频编码器的结构的前提下可以减小感知音频编码中的量化器在对音频进行编码时产生的总体能量失真,提高量化编码后的重建信号质量。为了实现上述目的,本发明采用了如下的技术方案一种用于感知音频编码的量化器自适应调整方法,包括如下处理步骤A、根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;B、以更新的量化边界点作为量化器新的量化边界点进行量化处理;C、重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。所述量化处理是通过如下取整操作实现的x《=int[;}r+/—x厄『(/)],/二int[l+义],其中,、为量化处理后的整数.量化谱,z为原始量化谱,x皿^(/)为更新的量化边界点。进一步的,所述步骤A包含如下处理过程Al、划分量化区间,获得初始量化边界点;A2、统计原始量化谱分布频数;A3、判断步骤A2中统计出的原始量化谱分布频数是否有效,如是向通过块能量失真最小原则计算得到的量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点;如否向初始量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点。所述通过块能量失真最小原则计算得到的量化边界点是通过求解积分ix(i)^/X2/Y(X)dy=(i—1)2/AjfP(X)dX+WA/P(X)dX实现的,:失真最小原方程卜11-1x(i)其中X是原始量化谱,A是扩压系数,x(i)是待计算的块能]则下的量化边界点,P0O是原始量化谱的分布密度函数。优选的,所述积分方程的求解采用如下累加比较流程A31:令&"M/丄,S*=Pd(fc);A32:比较6和C(0,若6〈C(z),执行步骤A33,若^〉C(i),执行步骤A34;A33:&=&—1,6=5+Pd(A;),回到步骤A32;A34:计算块能量失真最小原则下的量化边界点i(0:XI2上,6C(i)砂)歩)争ErwMA〖2+A!、2/A+l"S7+1)2/Arw=^"——,其中,i(i为块能量失真最小原则下的量化边界点,PJA0是步骤A2中统计出的原始量化谱分布频数,A是扩压系数,A是动态量化步长,丄是统计电平数,M是统计区间数。优选的,步骤A3中对原量化边界点进行调整的所述设定原则为低通滤波。当步骤A2中统计出的原始量化谱分布频数有效时,所述低通滤波是通过公式Xw滞(i)=(1—/3)x腳(。+/3.i(i)实现的,其中Xw服(i)是更新的量化边界点,x^D^)是原量化边界点,/是遗忘因子。所述步骤Al中的划分量化区间是通过量化均方误差最小原则来进行的,初始量化边界点由下式计算得到XM^(i)<formula>formulaseeoriginaldocumentpage8</formula>,其中,x^"i)是初始量化边界点。当所述步骤A3中判断统计出的原始量化谱分布频数无效时,所述低通滤波是通过公式x備w(O=(1—a)Xo^(i)+o;XM犯(50实现的,其中,x鼎^(i)是更新的量化边界点,x。^(i)是原量化边界点,a是遗忘因子。步骤A2包含如下处理过程设定统计样本总量阈值用于控制统计周期;当原始量化谱统计总数大于设定的统计样本总量阈值,统计周期结束,继续步骤A3;否则重复步骤A2继续统计原始量化谱分布频数。步骤A2中原始量化谱分布频数根据下式统计得到<formula>formulaseeoriginaldocumentpage8</formula>,其中,x为原始量化谱,丄为统计电平数,A:=min7M为统计区间数,Pd0)代表累加后的原始量化谱x在区间的<formula>formulaseeoriginaldocumentpage8</formula>的出现频出现频数,pd'a)代表累加前的原始量化谱x在区间数。所述统计区间数满足条件M=nl,其中n为大于等于10的整数。步骤A3中所述判断步骤A2中统计出的原始量化谱分布频数是否有效是根据如下原则确定设定统计样本量阈值iV,;计算量化电平[z-1,i]的出现频数总和乂比较乂与乂,当iV,^乂时,原始量化谱分布频数有效;当乂<^时,原始量化谱分布频数无效。本发明通过在初始量化边界点与通过块能量失真最小原则计算得到的量化边界点之间动态调整量化边界点使得量化器在音频编码时可以根据信号特性进行自适应调整,从而减小了总体能量失真,提高了量化编码后的重建信号质量。本发明在不改变感知音频编码器的结构的前提下能够提高编码器的编码性能,性能提高的幅度随着编码码率上升而增加。图1一a是现有技术的音频编码器在子带长度为4时随原始量化谱最大值变化的能量波动示意图;图l一b是现有技术的音频编码器在子带长度为32时随原始量化谱最大值变化的能量波动示意图;图2是本发明实施例的自适应调整方法的流程图;图3是应用了本发明的自适应调整方法的MegalAAC编码器的结构框架示意图;图4一a是80kbps平均码率下三种量化边界点确定方法的NMR比较示意图;图4一b是128kbps平均码率下三种量化边界点确定方法的NMR比较示意图;图4一c是256kbps平均码率下三种量化边界点确定方法的NMR比较示意图。具体实施方式下面结合附图对本发明进行进一步具体的说明。本发明的用于感知音频编码的量化器自适应调整方法,主要包括如下处理步骤A、根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;B、以更新的量化边界点作为量化器新的量化边界点进行量化处理;C、重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。下面以一具体实施例对上述步骤进行说明,参看图2,具体步骤如下1、划分量化区间,获得初始量化边界点量化处理开始,首先要划分量化区间,本实施例采用量化均方误差最小原则来划分量化区间。量化均方误差最小原则可用式<formula>formulaseeoriginaldocumentpage10</formula>"表示,以此原则划分量化区间得到初始量化边界点xm^(i),x^"i)称为均方误差连续量化边界点,在量化均方误差最小原则下可得到xm^(勺由下式获得<formula>formulaseeoriginaldocumentpage10</formula>,显然它只与电平区间和扩压系数有关,因此只需要在初始化的时候计算一次。2、统计原始量化谱分布频数感知音频编码器的原始量化谱由下式获得其中a;是变换域谱,A是扩压系数,A是动态量化步长。令统计电平数为L,统计区间数为Af,M满足M二nL,ti是整数,通常大于等于IO,区间<formula>formulaseeoriginaldocumentpage10</formula>间距为Z/M;令Pd(A;)为原始量化谱x在区间的出现频数,它是一个M元素的向量。若有落在区间中的X,则Pd(&)增加1,即:<formula>formulaseeoriginaldocumentpage10</formula>(10)式中,P"AO代表累加后的原始量化谱x在区间—i&、的出现频数,P/O0代表累加前的原始量化谱x在区间-1)丛、的出现频数。显然,PJW反映了原始量化谱x在各个区间的分布情况,称PJAO为原始量化谱分布频数。3、判断原始量化谱分布频数是否有效并据此对量化边界点进行调整判断原始量化谱分布频数是否有效采用下列步骤31、判断统计周期是否结束在一个统计周期中,设定统计样本总量阈值i^用来控制统计周期的长度,当原始量化谱的统计总数没有达到统计样本总量阈值i^,继续步骤2对原始量化谱分布频数进行统计。当原始量化谱的统计总数达到JV,时,统计周期结束,进行下一步。32、判断统计出的分布频数是否有效利用量化电平之间的统计样本量阈值M来控制样本统计的精度。对于每个电平区间[z-l,z],计算量化电平的出现频数总和<formula>formulaseeoriginaldocumentpage11</formula>分布频数有效,此时进行步骤33;若小于设定的统计样本量阈值M,说明统计出的分布频数无效,此时进行步骤34。33、向通过块能量失真最小原则计算得到的量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点本发明定义块能量失真(BlockEnergyDistortion)为能量误差的期望,它是量化器对于信号整体能量失真的度量。量化器的块能量失真为"<formula>formulaseeoriginaldocumentpage11</formula>如果A^为零,可以认为量化器对于输入信号和重建信号能量守恒。因此,本发明采用块能方程来表示其中X是原始量化谱,A是扩压系数,x(i)是块能量失真最小原则下待计算的量化边界点,P(x)是原始量化谱的分布密度函数。原始量化谱的分布密度函数P(X)是通过统计的方法来得到的,即其可量失真最小原则对量化器进行调整,该原则可用下列积分(10)以用前述步骤2中统计的原始量化谱分布频数P"AO来等价替代,这样得到的量化边界点称为短时近似最优量化边界点。所谓短时近似最优量化边界点,短时是针对更新周期而言,如果信号变化不剧烈,可以认为两个相邻周期的最优量化边界点变化也很小,这就是短时效应,上一个更新周期计算的最优量化边界点可以在当前周期使用,可以认为短时的时间间隔是2个更新周期的时间,更新周期越短,短时效应越可靠;近似则是指原始信号的实际分布,即原始量化谱的分布密度函数几乎不可获得,通常采用统计的方式来替代真正的信号分布。因此该最优量化边界点是近似的,这个近似的程度和统计周期有关,周期越长,近似的程度越高,但短时效应相应地会降低。通过累加比较流程求解前述积分方程得到块能量失真最小原则下的短时近似最优量化边界点,累加比较流程步骤如下331:令&二iiW"/i,^PJA;);332:比较6和C(i),若6〈C(i),执行步骤333,若6〉C(i),执行步骤334;333:fc=fc—l,6二^+Pd(&),回到步骤332;334:计算短时近似最优量化边界点i(i)<formula>formulaseeoriginaldocumentpage12</formula>得到短时近似最优量化边界点后,通过设定原则对原量化边界点进行调整以得到新的量化边界点。本实施例设定的调整原则是低通滤波,即平滑更新,由于此处的平滑对滤波器要求不高,可以釆用比较简单的方式。本实施例采用一阶滑动平均过程,它只用2次乘法,不需要额外存储空间,更新后的量化边界点x,^(i)由下式获得<formula>formulaseeoriginaldocumentpage12</formula>X^"勺为原量化边界点,即调整时的当前量化边界点,调整后跳转至步骤4。34、利用初始量化边界点对当前量化边界点进行更新当统计出的分布频数无效时,需要对当前的量化边界点执行还原过程,即向初始量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点。设定的调整原则同样是低通滤波,低通滤波同样采用一阶滑动平均过程,更新后的量化边界点X皿w(勺由下式获得X層W=(1_")Xo"0+"Xm促W(16)式15中的/3与式16中的a是遗忘因子,0$%/3^1。4、以更新的量化边界点作为量化器新的量化边界点进行量化处理使用更新后的量化边界点x^『(/),进行取整操作获得整数量化谱x《如下/=(i7)5、重复前述步骤,动态更新量化边界点,并以更新的量化边界点进行量化处理。上述处理是在一帧数据中进行,由于量化处理针对的是连续多帧数据,对待量化的码流的每一帧数据重复上述过程,从而在量化过程中动态地更新量化边界点,并以更新后的量化边界点进行量化处理,这样即可实现量化器根据信号特性的自适应调整。在本发明的量化处理过程中,量化边界点不断在初始量化边界点与短时近似最优量化边界点之间动态更新,量化区间相应不断变化,从而实现了量化器在量化过程中可以根据信号特性进行自适应调整,提高了量化编码后重建信号的质量。本发明的自适应调整量化边界点的方法不影响量化器以及编码器的结构,可以使用在各种感知音频编码器上。这里使用MegalAAC编码器作为测试平台,MegalMC编码器的框架结构如图3所示。MPEG-4MC的扩压系数A^3/4,本方法需要确定六个参数,统计最大电平丄,统计区间总数M,统计样本总量阈值i^,量化电平之间的统计样本量阈值乂和更新遗忘因子a,/3。不同码率下原始量化谱x的分布差异极大,低码率和中码率(每通道64kbps以下)x集中在0-4之间;高码率(每通道80kbps以上)x分布相对均匀。对于80kbps,128kbps,256kbps三种码率立体声编码的测试,参数i^的设置高码率与低码率略有不同。本实施例中,统计最大电平i=16,统计区间总数M设为160;遗忘因子a固定为0.5,统计样本总量阈值A^,量化电平之间的统计样本量阈值和更新遗忘因子/3的取值见表1,为方便起见,M用比值iVji^代替。每种码率不同参数组合共175组,对8段44100Hz采样,16比特量化的立体声剪辑进行,每段剪辑持续11.63秒,剪辑曲目见表2,每次测试结果取8段剪辑的平均值<表1测试参数的设置<table>tableseeoriginaldocumentpage14</column></row><table>测试选用使用MPEG-4MC标准中提供的固定量化边界点的配置和使用误差连续划分量化边界点的配置作为参考,编码器的其他参数不变,最终输出的测试码流码率偏差在0.03%以内,码率变化的影响可以忽略。重建音频的评价指标采用噪声掩模比丽R(NoisetoMaskRatio),丽R越小越好。测试结果见图4。图4-a,图4-b和图4-c为在80kps,128kbps,256kbps平均码率下,使用标准量化边界点,均方误差连续量化边界点的测试结果和使用本发明的自适应调整量化边界点的平均,最好以及最坏三种情况下的测试结果。从图4可以看到,在80kbps平均码率下,使用自适应调整量化边界点的平均丽R反而有小幅上升0.0137dB;在128kbps码率下,平均臓降低了0,1347dB,最高降低了0.1455dB,最少也降低了0.1034dB;在256kbps平均码率下,丽R平均降低幅度达到了0.24dB,最高达到了0.2535dB,最低也达到了0.2275dB。通过上述各参数的不同组合测试,可以得到,在低码率时,本方法对于重建音频信号丽R的改进不明显,而随着码率的提高,丽R降幅增大。其主要参数在中码率时,A^可以取2500到5000,iVJiVT和/3可以分别取0.03,0.1,在高码率时仏/JVT可以取0.08。从测试结果看,本方法在不改变感知音频编码器的结构的前提下能够提高编码器的编码性能,性能提高的幅度随着编码码率上升而增加。该方法适用于各种感知音频编码器,减小了感知音频编码中的量化器在对音频进行编码时产生的总体能量失真,提高了量化编码后的重建信号质量。以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属
技术领域
的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,例如积分方程的求解并不限定采用累加比较流程,而设定的调整原则也不限于使用低通滤波,例如可以采用一次向初始量化边界点或短时近似最优量化边界点方向调整一个固定步长的调整方式,低通滤波也可采用更高阶的处理,统计原始量化谱分布频数是否有效时,亦可利用时间阈值来作为统计周期的结束,这些变化都应当视为属于本发明的保护范围。权利要求1、一种用于感知音频编码的量化器自适应调整方法,其特征在于,包括如下处理步骤A、根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;B、以更新的量化边界点作为量化器新的量化边界点进行量化处理;C、重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。2、如权利要求1所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述量化处理是通过如下取整操作实现的<formula>formulaseeoriginaldocumentpage2</formula>其中,为量化处理后的整数量化谱,义为原始量化谱,x^『(/)为更新的量化边界点。3、如权利要求1或2所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述步骤A包含如下处理过程Al、划分量化区间,获得初始量化边界点;A2、统计原始量化谱分布频数;A3、判断步骤A2中统计出的原始量化谱分布频数是否有效,如是向通过块能量失真最小原则计算得到的量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点;如否向初始量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点。4、如权利要求3所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述通过块能量失真最小原则计算得到的量化边界点是通过求解积分方程<formula>formulaseeoriginaldocumentpage2</formula>实现的,其中y是原始量化谱,A是扩压系数,x^)是待计算的块能量失真最小原则下的量化边界点,P(x)是原始量化谱的分布密度函数。5、如权利要求4所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述积分方程的求解采用如下累加比较流程A31:令&"M/丄,6=Pd(A;);A32:比较6和C(z),若6〈C(z),执行步骤A33,若6>(:(0,执行步骤A34;A33:&=&—1,6回到步骤A32;A34:计算块能量失真最小原则下的量化边界点^勺<formula>formulaseeoriginaldocumentpage3</formula>l)M/£+l丄、6,为块能量失真最小原则下的量化边界点,P^A:)是步骤A2中统计出的原始量化谱分布频数,A是扩压系数,A是动态量化步长,丄是统计电平数,_M是统计区间数。6、如权利要求5所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A3中对原量化边界点进行调整的所述设定原则为低通滤波。7、如权利要求6所述的用于感知音频编码的量化器自适应调整方法,其特征在于,当步骤A2中统计出的原始量化谱分布频数有效时,所述低通滤波是通过公式x,w(i)=(1—/)Xo^0')+〃.i(O实现的,其中x丽^(i)是更新的量化边界点,x。^(勺是原量化边界点,/3是遗忘因子。8、如权利要求6所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述步骤Al中的划分量化区间是通过量化均方误差最小原则来进行的,初始量化边界点由下式计算得到<formula>formulaseeoriginaldocumentpage3</formula>其中,XM^^)是初始量化边界点,9、如权利要求8所述的用于感知音频编码的量化器自适应调整方法,其特征在于,当所述步骤A3中判断统计出的原始量化谱分布频数无效时,所述低通滤波是通过公式x顺w(i)=(1—a)x0i^(X)+axw观(i)实现的,其中,x,^(i)是更新的量化边界点,x。^(i)是原量化边界点,a是遗忘因子。10、如权利要求3所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A2包含如下处理过程设定统计样本总量阈值用于控制统计周期;当原始量化谱统计总数大于设定的统计样本总量阈值,统计周期结束,继续步骤A3;否则重复步骤A2继续统计原始量化谱分布频数。11、如权利要求3所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A2中原始量化谱分布频数根据下式统计得到fc二min其中,x为原始量化谱,L为统计电平数,M为统计区间数,Pd(A;)代表累加后的原始量化谱x在区间出现频数,P/(A;)代表累加前的原始量化谱x在区间一'L的^^,^)的出现频12、如权利要求11所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述统计区间数满足条件M二n丄,其中n为大于等于10的13、如权利要求11所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A3中所述判断步骤A2中统计出的原始量化谱分布频数是否有效是根据如下原则确定设定统计样本量阈值;计算量化电平[i-l,i]的出现频数总和iV,"(卜1)M/丄+l比较iV,与iVt,当iV,2乂时,原始量化谱分布频数有效;当iV,<乂时,原始量化谱分布频数无效。全文摘要本发明公开了一种用于感知音频编码的量化器自适应调整方法,包括如下处理步骤A.根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;B.以更新的量化边界点作为量化器新的量化边界点进行量化处理;C.重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。本发明通过量化边界点的动态更新,可以使得量化器在音频编码时根据信号特性自适应调整,从而减小了总体能量失真,提高了量化编码后的重建信号质量,在不改变感知音频编码器的结构的前提下提高编码器的编码性能。文档编号G10L19/00GK101312042SQ20071007455公开日2008年11月26日申请日期2007年5月23日优先权日2007年5月23日发明者晟吴,邱小军,强陈,黎家力申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1