在数字音频信号编码器中控制噪声整形反馈环路的制作方法

文档序号:7884743阅读:310来源:国知局
专利名称:在数字音频信号编码器中控制噪声整形反馈环路的制作方法
技术领域
本发明涉及数字信号的编码领域。根据本发明的编码特别适于诸如音频信号(语音、音乐或其他)之类的数字信号的传送和/或存储。本发明更具体地有关于在ADPCM (代表了 “自适应差分脉冲编码调制”)编码类型的波形编码中反馈环路的控制,且特别有关于使得可能传递可伸缩二进制串(train)量化索引的、嵌入码ADPCM类型的编码。
背景技术
参考

图1和2来描述建议ITU-T G.722、ITU_T G.726或ITU-T G.727所规定的嵌入码ADPCM编码/解码的一般原理。因而,图1表示了在每采样B个与B+K个比特之间操作的ADPCM类型(例如:G.722低频带、G.727)的嵌入码编码器;注意到非可伸缩ADPCM编码(例如:G.726、G.722高频带)的情况对应于K=O。它包括:-预测模块110,使得 可能基于量化误差信号名(O= (7/)v(//) n' = n-l,...,n-Nz(其中v(n')是量化比例因子(scale factor))的先前采样并且基于重构信号rB(n')n' =n-l,...,n-Np (其中η是当前时刻)来给出信号的预测<( )。-减法模块120,用于从输入信号X(η)中减去该输入信号的预测4( ),以获得表现为e(n)的预测误差信号。-用于误差信号的量化模块130QB+K,用于接收误差信号e(n)作为输入,以给出由B+K个比特组成的量化索引IB+K(n)。量化模块QB+K是嵌入码类型的,即,它包括具有B个比特的核心量化器、和嵌入在该核心量化器中的具有B+kk=l,K个比特的量化器。在ITU-T G.722标准(低频带的编码)的情况下,通过X.Maitre.编著的用于描述 G.722 标准的概述文章〃7kHz audio coding within 64kbit/s〃.1EEE Journal onSelected Areas in Communication, Vol.6-2,February 1988 中的表格 IV和 VI 来给出量化器Qb、Qb+1、Qb+2 (令B=4)的判决等级和重构等级。量化模块QB+K的输出端的B+K个比特的量化索引IB+K(n)经由传送信道140而传送到如参考图2所描述的解码器。该解码器同样包括:-模块150,用于删除索引IB+K(n)的K个低阶比特,以给出低比特率索引Ib(η);-逆量化模块121(Qb)用于给出B个比特上的量化误差信号e|( ) = yBlS( )ν(η)作为输出;-模块170QAdapt,用于对量化器和逆量化器进行适配,以针对接下来的时刻给出也称为比例因子的等级控制参数V (η);
-加法模块180,用于将预测与量化误差信号相加,以给出低比特率重构信号rB(n);-模块190PAdapt,用于基于B个比特上的量化误差信号<( ),并且基于通过1+PZ(Z)所滤波的信号<00,来对预测模块进行适配。可以注意到,在图1中,附图标记为155的阴影线部分表示了包含预测器165和175以及逆量化器121的低比特率本地解码器。因而,此本地解码器使得可能基于低比特率索引Ib(H)来在170处对逆量化器进行适配,并且基于所重构的低比特率数据来对预测器165和175进行适配。此部分还一致地存在于如参考图2所描述的嵌入码ADPCM解码器中。在不存在帧丢失的情况下,图2的嵌入码ADPCM解码器接收源自于传送信道140的索引Γ B+k (IB+k的可能被二进制误差干扰的版本)作为输入,其中O SkS K。该解码器利用比特率为每采样B个比特的逆量化模块210(QBr来进行逆量化,以获得信号.( ) = #符号“'”指示基于所接收到的比特所解码的、并且由于传送误差而
O
导致可能与编码器所使用的值不同的值。B个比特的输出信号r, B(n)将等于该信号的预测x/⑷与B个比特的逆量化器的输出<( )之和。解码器的此部分255与图1的低比特率本地解码器155 —致。 通过采用比特率指示符“模式(mode ) ”和选择器220,解码器可以改进所重构的信号。确实,如果“模式”指示出已经传送了 B+1个比特,则该输出将等于预测4(H)和具有B+1个比特的逆量化器230的输出>’#(_'( )之和。如果“模式”指示出已经传送了 B+2个比特,则该输出将等于预测七"(》)和具有B+2个比特的逆量化器240的输出之和。ITU-T标准G.722 (在下文中,命名为G.722)的嵌入码ADPCM编码进行宽带中的信号编码,其被定义有[50-7000HZ]的最小带宽,并且以16kHz来进行采样。G.722编码是通过利用正交镜像滤波器来对信号进行分解、所获得的两个信号子带
和[4000-8000Hz]中每一个的ADPCM编码。通过6个、5个和4个比特上的嵌入码ADPCM编码来对低频带进行编码,而通过每采样2个比特的ADPCM编码器来对高频带进行编码。取决于用于对低频带进行解码所使用的比特的数目,总比特率将为64、56或48比特/秒(bit/S)。开发了此编码,以首先使用在ISDN (综合服务数字网)中。近来,将它部署在IP网络上的改进质量的电话应用中。对于具有许多等级的量化器,量化噪声的谱将是相对平坦的。然而,在其中信号具有低能量的频区中,噪声可以具有比信号更大的等级,并因此不再必须被屏蔽(mask)。于是,在这些区域中,它可能变为可听得见的。因此,编码噪声的整形是必须的。在如同G.722的编码器中,适于嵌入码编码的编码噪声的整形将也是期望的。
一般地,编码噪声整形的目的在于获得量化噪声,该量化噪声的谱包络遵循短期屏蔽阈值;经常对该原理进行简化,使得噪声的谱近似地遵循该信号的谱,这确保了均匀的(homogeneous)信噪比,使得即使在信号的较低能量区中,噪声也保持是听不见的。在ITU-T 建议 G.711.l"Wideband embedded extension for G.711pulse codemodulation"或 〃G.711.1:A wideband extension to ITU-T G.711〃.Y.Hiwasaki, S.Sasaki, H.0hmuro, T.Mori, J.Seong, M.S.Lee, B.Kovesi, S.Ragot, J.-L.Garcia, C.Marro, L.M., J.Xu, V.Malenovsky, J.Lapierre, R.Lefebvre.EUSIPC0, Lausanne, 2008 中描述了用于利用嵌入码的PCM (代表“脉冲编码调制”)类型编码的噪声整形技术。此建议描述了具有通过噪声反馈而进行的编码噪声整形的编码,诸如图3所图示的。基于源自于逆核心量化器(块301)的、核心比特率为64kbit/s的解码信号s' L0(n)(LO代表了层0),来计算(块303)用于对编码噪声进行整形的感知滤波器F(Z)(块305)。因此,核心比特率本地解码器(块301)使得可能计算噪声整形滤波器F(Z)。因而,在解码器处,还可能基于核心比特率解码信号来计算此相同的噪声整形滤波器。在G.711.1编码器处使用用于传递核心比特的量化器(块308)和用于传递改进比特的量化器(块309)。用于接收核心二进制流(LO)和改进比特(LI)的G.711.1解码器基于核心比特率(64kbit/s)解码信号、按照与编码器处相同的方式、来计算用于对编码噪声进行整形的滤波器F(Z),并且将此滤波器应用于改进比特的逆量化器的输出信号,所整形的高比特率信号是通过将所滤波的信号与所解码的核心信号进行相加而获得的。因而,噪声整形改进了核心比特率信号的感知质量。它在改进比特的质量上供应了有限改进。确实,对于改进比特的编码,不执行编码噪声整形,量化器的输入对于核心量化与对于改进量化是相同的。然后,当除了核心比特之外、还对改进比特进行解码时,解码器必须通过适配的滤波来删除所得到的乱真分量(spurious component)。如在建议G.711.1中实现的通过噪声反馈进行的噪声整形可一般化到除了 G.711之外的PCM编码器,并且一般化到ADPCM类型的编码。在图4中表示了 PCM/ADPCM编码中的示范已知噪声反馈结构。在下文中,将使用以下标记:s (n):要编码的输入信号s' (n):编码器的输入信号(修改后的要编码信号)s(n):本地解码器所提供的解码信号q(n)=s'(n)-s(n)编码器的量化噪声 图4图示了 PCM/ADPCM编码噪声的整形的示范实现。此编码器包括PCM/ADPCM编码块502和本地解码器503。对该编码噪声qG(n)=s(n)-s(n)进行滤波(块504),并且将它重新注射(块505)到信号s (η)上。基于信号s(n)来估计(块500)预测系数,而在G.711.1(图3)中,基于核心比特率处的过去解码信号来估计它们。按照已知的方式,通过对线性预测滤波器A(Z)的系数进行衰减,基于对信号s (η)的短期相关进行建模的线性预测滤波器A(Z)来典型地获得(块500)滤波器A (z/Y)。将利用γ =0.92作为典型值,通过滤波器
权利要求
1.一种用于在数字音频输入信号的ADPCM类型编码期间、控制编码噪声的整形的方法,通过实现包括噪声滤波的反馈来执行该噪声整形,其特征在于,该方法包括以下步骤: -获得(702)用于指示出该信号的大谱动态范围的参数,该参数指示出该反馈的不稳定的风险; -通过比较该指示参数与至少一个预定阈值,来检测(705)不稳定的风险; -在检测到不稳定的风险的情况下限制(706)该反馈; -在已经限制了该反馈的当前帧之后预定数目的帧上,逐步重新激活(708、709、710)该反馈。
2.根据权利要求1的方法,其特征在于,用于指示出大谱动态范围的参数是由输入信号(s(n))的线性预测分析所产生的第二反射系数(k2)。
3.根据权利要求1的方法,其特征在于,用于指示出大谱动态范围的参数是由解码信号< ^( ))的线性预测分析所产生的第二反射系数(k2)。
4.根据权利要求1的方法,其特征在于,所述大谱动态范围的参数是输入信号与噪声之间的信噪比。
5.根据权利要求1的方法,其特征在于,通过将要应用于噪声滤波参数(604)的加权系数设置为零,来执行该反馈的限制。
6.根据权利要求1的方法,其特征在于,通过在噪声滤波的输出处应用零值的增益,来执行该反馈的限制。
7.根据权利要求5的方法,其特征在于,通过将加权系数应用于滤波参数来执行该反馈的逐步重新激活,该加权系数通过预定数目的帧上的递增来定义。
8.根据权利要求6的方法,其特征在于,通过在预定数目的帧上在噪声滤波的输出处应用增大的增益值,来执行该反馈的逐步重新激活。
9.根据权利要求1的方法,其特征在于,在分级编码的核心编码期间和改进编码期间,同时地实现该方法。
10.一种数字音频信号ADPCM类型的编码器,包括用于对编码噪声进行整形的反馈,该编码器包含噪声滤波模块,其特征在于,该编码器包括噪声整形控制模块(600、800),该噪声整形控制模块包括: -用于获得用于指示出该信号的大谱动态范围的参数的部件,该参数指示出该反馈的不稳定的风险; -用于通过比较该指示参数与至少一个预定阈值来检测不稳定的风险的部件; -用于在检测到不稳定的风险的情况下限制该反馈的部件; -用于在已经限制了该反馈的当前帧之后预定数目的帧上、逐步重新激活该反馈的部件。
11.一种计算机程序,包括代码指令,用于当由处理器来执行这些指令时、实现根据权利要求I到9之一的控制方法的步骤。
全文摘要
本发明涉及一种用于在数字音频输入信号的ADPCM编码期间、控制编码噪声的整形的方法。通过使用包括滤波噪声的反馈来执行该噪声整形。所述方法包括以下步骤获得(702)用于指示出该信号的高谱动态范围的参数,所述参数指示出该反馈的不稳定的风险;通过比较该指示参数与至少一个预定阈值来检测(705)不稳定的风险;在检测到不稳定风险的情况下限制(706)该反馈;以及在限制了该反馈的当前帧之后预定数目的帧上逐渐重新激活(708、709、710)该反馈。本发明还涉及一种具有反馈的编码器,包括用于实现如所描述的控制方法的控制模块。
文档编号H04B1/62GK103081366SQ201180040670
公开日2013年5月1日 申请日期2011年6月17日 优先权日2010年6月24日
发明者S.拉格特, B.科维希, A.勒古亚德尔 申请人:法国电信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1