一种滤波参数矢量量化和结合量化模型预测的音频编码方法

文档序号:2822028阅读:698来源:国知局
专利名称:一种滤波参数矢量量化和结合量化模型预测的音频编码方法
技术领域
本发明涉及一种对音频信号进行编码的方法,具体地说是指一种滤波参数矢量量化和结合量化模型预测的音频编码方法。主要是滤波参数矢量量化和结合量化模型预测的音频信号编码方法,它用来解决音频信号编码中预回声问题,同时又能有效的降低码率和控制噪声。
在编解码音频信号中,为解决预回声现象,当前已有的一些技术大致包括以下几种预回声控制与比位池技术对滤波器组覆盖快变段窗内的谱系数,增加编码精度。这会极大的增加快变帧编码所需要的比特数,这种方法不能用于固定码率编码器。在MPEG-1标准中,采用比特池方法,在比特需要峰值时使用前面的帧留下的比特,从而维持平均的恒定码率。然而实际上,如果遇到变化非常快的信号,编码时所需的比特池的大小会大的不合理。
自适应窗切换技术许多感知编码器中使用的是自适应窗切换技术。这种方法能根据输入信号的特性,自适应的调整滤波器组窗的大小;稳态部分或缓变部分采用长时窗,快变信号部分采用短时窗进行编码。这样可以极大的降低峰值比特需求,因为需要高编码精度的信号部分在时间上得到了限制。这种方法的主要缺点是它增加了编码器计算量,并且使得编码器结构复杂化。由于不同的窗长需要心理声学模型不同的解释和归一化,以及不同的频带及无噪编码结构,窗切换显著的增加了编码器结构的复杂度。此外,在采用交叠相加结构滤波器组时,窗切换判断需要编码器额外的缓冲和延迟,会导致更大的端对端的延迟。最后,虽然长窗和短窗具有较好的时频局部特性,但是开始窗和结束窗却会引入较大的低效编码。
增益修正技术第三种抑制量化噪声扩散的技术,是在计算信号的谱分解前,对信号应用动态增益修正方法进行增益控制。输入信号的动态范围通过一个乘积性预处理器得到降低,然后进入编码器,这样,信号的“峰值”在编码前得到了消弱。增益修正参数也编码到比特流中,在解码端,用此信息进行一个相反的过程。对信号谱分解前作动态乘积修正,等价于动态修正滤波器组的分析窗,依赖于增益修正函数的形状不同,分析滤波器的频率响应根据合成窗函数而变化。为了能对大多数信号都能有效处理,非常重要的是要让增益修正过程能独立的应用于音频信号谱的不同部分,这是因为,快变信号时间一般只在部分谱上占主导,而且,通常并不希望扩宽滤波器组的低通滤波通道的频率响应,因为这样会增大临界带宽的不匹配。
在MPEG音频编码技术中,MPEG-1和MPEG-2所定义的编码器系列,层1和层2使用低频率分辨率的滤波器组,没有进行谱度量来处理预回声现象。层3运用了高的频率分辨率滤波器组,结合预回声控制、比特池和自适应窗切换技术来进行预回声处理。在MPEG-4的编码工具中,增加了一种“时域噪声成形”技术,在基于感知音频编码器的结构中,信号经过滤波器组变换成频域系数后,根据对信号类型的判断,如果是快变类信号,不直接对频域系数进行量化,而是在通过增加一个TNS滤波器,再转换到时域中,在时域中进行量化和编码。这种技术的优点是利用了快变信号在频域的特点,能够通过预测的方法对变换系数进行编码,使得量化噪声在时域的形状和原始信号包络类似,有效的控制了量化噪声的扩散问题,不足之处增加的边带信息较多,影响了整体编码效率。
本发明的一种滤波参数矢量量化和结合量化模型预测的音频编码方法,对音频信号编码的方法包括以下步骤(1)输入音频信号用分析滤波器分析、转换到频域的系数;(2)对频域系数进行线性预测分析;(3)对预测系数进行矢量量化;(4)谱系数进行预测滤波得到残差系数序列;(5)谱系数残差和预测系数矢量量化结果一同量化;(6)量化结果和边带信息进行编码,得到输出比特流。
所述的对音频信号编码的方法中对频域系数的量化由以下步骤组成(1)对分析滤波器的输出,确定预测的频率范围以及窗的大小;(2)对选定的系数执行线性预测分析过程;(3)根据预测增益确定是否使用预测参数矢量量化和谱系数滤波;(4)对谱系数用量化重构的滤波器系数做误差滤波;(5)残差序列用传统的量化和编码方法处理。
所述的对音频信号编码的方法中对预测器参数矢量量化由以下步骤组成(1)用线性预测分析模型对谱系数进行预测;(2)预测分析器的参数由预测器系数组成,用LSF参数的形式表示;(3)LSF参数采用矢量量化方法发送;(4)矢量量化器的结构采用分级形式,最少两级,第一级量化LSF系数,第二级量化第一级的误差矢量,以此类推;(5)矢量量化LSF参数的失真度量采用最佳的失真度量准则确定;(6)矢量量化的结果得到的是码本中码字的序号,作为量化的参数发送到解码端。
本发明的一种滤波参数矢量量化和结合量化模型预测的音频编码方法,对音频信号解码的方法包括以下步骤(1)从比特流中解码出标记信息,得到相应的预测器参数编码和量化的谱数据;(2)预测器参数的反量化过程,得到预测器系数;(3)对预测谱系数进行逆滤波过程;(4)用合成滤波器得到重构的音频信号。
所述的对音频信号解码的方法中对预测参数的反量化由以下步骤组成(1)从比特流中得到矢量量化的码字序号;(2)根据码字序号,分级重构、插值,求出量化重构后的LSF参数;(3)转换LSF参数到预测器参数形式;(4)用重构的预测器参数,对谱预测残差进行逆滤波处理。
本发明的滤波参数矢量量化和结合量化模型预测的音频编码方法,解决音频信号编码中预回声问题,同时有效的降低码率和控制噪声。
图2是本发明音频编码方法解码器端的结构框图。
图3是本发明编码器实施例中的一个算法流程框图。
对快变类信号,其最优的编码方法可以从以下的事实得到假设有实信号x(t),它的平方Hilbert包络可以表示为其频谱的自相关函数的逆Fourier变换;同时我们知道,信号的功率谱密度函数可以表示为其时域波形的自相关函数的Fourier变换。因此,可以说信号在时域的平方Hilbert包络与信号在频域的功率谱密度函数是互为对偶关系的。
从上面的对偶关系可以得到,每个一定频率范围内的部分带通信号,如果它的Hilbert包络保持恒定的话,那么相邻谱值的自相关也将保持恒定。这就意味着谱系数序列相对于频率而言是稳态序列,从而可以用预测编码技术来对谱值进行处理,用公用的一组预测系数来有效的表示信号。对于快变信号如响板信号,这种谱系数的可预测编码性质还可以更直观的来理解。对一个纯粹的正弦信号,其时域包络是平坦的,对应的频域表示是一个极度不平坦的单脉冲形状的谱。显然,对它的最优编码方式,如果在频域,就是对谱直接编码的变换编码技术,如果在时域,则是用预测编码如LPC线性预测技术;假设时域的输入信号是一个脉冲信号,那么它在频域的就具有一个平坦的功率谱,这个信号对传统的音频编码技术而言,不论是用变换编码处理频域系数,还是用预测技术处理时域波形,都是最坏的一种情况。然而,此时如果采用相反的技术,即时域波形用变换编码技术或频域系数用预测方法,则可以更有效的对信号编码。
建立了时域和频域的对偶关系后,对频域滤波系数应用预测编码的方法,那么所有关于时域的预测性质现在对频域而言也是成立的。由于功率谱密度与平方Hilbert包络之间互为对偶,谱系数预测的增益即编码的残差能量依赖于平方包络的平坦度度量,因此对具有快变特性的信号,其平方包络不平坦度决定了具有较高的编码增益的性质。对快变信号段,预测策略可以选择开环预测和闭环预测两种方案,都可以获得编码增益,但在系统的整体性能上,二者各具有不同的优点。闭环预测的误差能量在解码信号中随着预测增益增加而减小,因为谱系数数据中引入的误差具有平坦的功率密度谱,在解码端量化噪声时域的形状依然保持着平坦,即误差信号能量在时域也是均匀分布的,这意味着它并不能消除编码窗寂静段内量化噪声的时域的非掩蔽现象。如果采用的是开环预测方法,那么在解码端总的误差能量并不减少,就整体误差能量而言并无增益。然而此时误差能量在时域的形状与信号时域形状一致,能把量化噪声控制在实际的信号之下,对快变信号来说,就解决了时域掩蔽的问题。谱系数的这种预测编码方法就是时域噪声成形算法。
在传统的基于感知原理的音频编码器中,结合改进的消除预回声技术的过程可以如下处理输入信号通过一个高分辨率的滤波器组或者变换,被分解为一组谱系数。基于计算得到的谱系数,对在目标频率范围内相应的谱系数执行标准的LPC分析过程,如计算自相关矩阵、递推执行Levinson-Durbin算法求预测器的系数。线性预测分析依照最高允许的噪声成形滤波器的阶数执行,当计算的预测增益超过预先设定的阈值时,就可以激活噪声成形预测编码模块。
对目标频率范围的谱系数,用计算得到的量化预测器系数进行误差滤波,计算出预测谱的残差序列。预测滤波器的输出代替了原来的谱系数,被送到标准的量化器中进行量化和编码。由线性预测分析编码原理可知,谱系数的残差序列的动态范围小于输入谱系数的动态范围,因此在量化单元中可以分配较少的比特数,或者在相同比特数的条件下,可以获得改进的编码增益。
发送到解码器的边带信息由一个标记位来扩展,只是是否使用了改进的滤波参数矢量量化和滤波系数预测编码方法。如果标记为真,那么比特流中有目标频率范围及其余的必要信息。预测器系数的参数是经过矢量量化的LPC系数变换形式。
预测器参数LPC预测滤波器的矢量量化转化为线谱对频率系数LSF进行,矢量量化采用分级量化方式进行。当前预测器系数被量化为各级码本中的相应的码字,对线谱对频率系数LSF矢量参数,选择最佳的失真度量准则(如最近邻准则),搜索计算出各级码本的码字索引,作为预测器矢量量化参数发送。
编码器的量化和编码模块以及心理声学模型的计算,可以采用传统的基于感知的音频编码器中的技术来处理。
在对应的解码器中,对每个声道需要做以下的处理对边带信息进行解码,根据标记位的设置,对预测器系数的矢量量化码字索引,进行相反的逆量化过程,求出多级量化的线谱对频率系数LSF,然后根据LSF系数,解码求出量化的线性预测误差滤波器的滤波参数。
对量化的谱系数的残差序列进行逆量化过程,求出残差序列。然后让残差序列通过线性预测逆滤波器,得到频域的谱系数序列。
后续的处理过程采用传统处理方法进行解码,最终得到重构的音频信号。
下面将通过上述方法的一个实施例的相关框图来说明本发明,但是本发明并不只是局限于这些框图所示的实现过程,它们仅仅是示例性的。根据本发明所提出的权利要求中的原则对上述过程的任何形式上而非本质的改动也是属于本发明范围之内的。


图1给出了本发明的编码方案的一个实施例框图。原始音频信号被送到分析滤波器组101模块进行分析滤波,得到了频域的滤波系数,同时信号也经过快变信号检测102和心理声学分析106。在快变信号检测102中对信号做是否快变信号的检测,作为选择窗长或者运用本发明算法的判断。心理声学分析106同时对信号做心理声学模型分析。然后在谱预测及矢量量化103模块中对滤波系数在频域应用线性预测分析的方法,对谱系数进行预测,同时对预测器的参数进行矢量量化。预测器参数矢量量化的结果直接送到合成比特流105,作为边带信息放入最终的比特流中发送到解码端。模块量化及编码104和合成比特流105的功能和结构与传统方法中的作用相同。
图2给出了本发明的解码方案的一个实施例框图。步骤比特流解码201实施比特流解码过程,得到编码时的各种比特流信息。预测参数反量化202根据解码得到的标记位的值,首先对经过矢量量化的预测器系数进行反量化,并依此构造频域系数的逆预测误差滤波器。谱系数反量化203根据重构的逆预测器参数进行滤波,进行谱系数的反量化过程,最后通过合成滤波器204步骤得到重构的音频信号。
图3给出了编码器实施例中本发明方法的一个算法流程框图。经过分析滤波器组101滤波后得到谱系数。在确定频率范围302和确定块类型及窗长303步骤中确定要进行预测分析的谱范围以及选择所使用的窗的大小。线性预测分析304步骤执行线性预测分析过程,求出频率范围内的谱系数自相关矩阵,然后用Levison-Durbin算法得到预测器参数,同时可以求出预测增益。增益大于阀值305根据预测增益是否满足大于给定的阈值作为选择预测滤波的条件,如果增益不大于阈值,则跳过该模块311步骤结束预测过程,用传统的方法继续处理。如果满足条件,预测器参数LP转化为线谱对频率系数LSF,因为线谱对频率系数LSF既具有较好的量化特性,又提供了一种直接的度量矢量量化失真的度量,对预测器参数LP的矢量量化是基于线谱对频率系数LSF码本的。LSF参数矢量量化307步骤进行LSF参数的多级矢量量化,得到矢量量化码本的码字序号。在谱系数预测滤波308中用量化后的重构线性预测分析参数,对谱系数进行误差滤波处理。边信息量化309和转系数量化模块310对上述步骤后得到的结果进行量化,最终完成算法的一次处理过程。
文中英文缩写如下表所示

权利要求
1.一种滤波参数矢量量化和结合量化模型预测的音频编码方法,其特征在于对音频信号编码的方法包括以下步骤(1)输入音频信号用分析滤波器(101)分析、转换到频域的系数;(2)对频域系数进行线性预测分析(304);(3)对预测系数进行矢量量化(307);(4)谱系数进行预测滤波得到残差系数序列;(5)谱系数残差和预测系数矢量量化结果一同量化;(6)量化结果和边带信息进行编码,得到输出比特流。
2.根据权利要求1所述的对音频信号编码的方法,其特征在于所述的频域系数的量化由以下步骤组成(1)对分析滤波器(101)的输出,确定预测的频率范围(302)以及窗的大小;(2)对选定的系数执行线性预测分析(304)过程;(3)根据预测增益(305)确定是否使用预测参数矢量量化和谱系数滤波;(4)对谱系数用量化重构的滤波器系数做误差滤波;(5)残差序列用传统的量化和编码方法处理。
3.根据权利要求1所述的对音频信号编码的方法,其特征在于所述的预测器参数矢量量化由以下步骤组成(1)用线性预测分析(304)模型对谱系数进行预测;(2)预测分析器的参数由预测器系数组成,用LSF参数的形式表示;(3)LSF参数采用矢量量化方法发送;(4)矢量量化器的结构采用分级形式,最少两级,第一级量化LSF系数,第二级量化第一级的误差矢量,以此类推;(5)矢量量化LSF参数的失真度量采用最佳的失真度量准则确定;(6)矢量量化的结果得到的是码本中码字的序号,作为量化的参数发送到解码端。
4.一种滤波参数矢量量化和结合量化模型预测的音频编码方法,其特征在于对音频信号解码的方法包括以下步骤(1)从比特流(201)中解码出标记信息,得到相应的预测器参数编码和量化的谱数据;(2)预测器参数(202)的反量化过程,得到预测器系数;(3)对预测谱系数进行逆滤波过程;(4)用合成滤波器得到重构的音频信号。
5.根据权利要求4所述的对音频信号解码的方法,其特征在于所述的预测参数(202)的反量化由以下步骤组成(1)从比特流中得到矢量量化的码字序号;(2)根据码字序号,分级重构、插值,求出量化重构后的LSF参数;(3)转换LSF参数到预测器参数形式;(4)用重构的预测器参数,对谱预测残差进行逆滤波处理。
全文摘要
本发明公开了一种对音频信号进行编码的方法,主要是滤波参数矢量量化和结合量化模型预测的音频信号编码方法。它用来解决音频信号编码中预回声问题,同时又能做到有效的降低码率和控制噪声的目的。在本发明中,音频信号经滤波器后得到滤波参数,对滤波参数进行预测分析,求出预测模型的参数,对它们用矢量量化方法进行参数化处理,这相当于在传统的感知编码器滤波器模块和量化模块之间增加了一个新的模块。
文档编号G10L21/02GK1458646SQ03122000
公开日2003年11月26日 申请日期2003年4月21日 优先权日2003年4月21日
发明者潘兴德 申请人:北京阜国数字技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1