量化装置及量化方法

文档序号:2832837阅读:687来源:国知局
专利名称:量化装置及量化方法
技术领域
本发明涉及使用树搜索(tree search)进行量化的量化装置及量化方法。
背景技术
在移动通信中,为了有效利用传输频带,必须进行语音及图像的数字信息的压缩编码。其中,对移动电话广泛利用的语音编解码(编码/解码)技术的期待很高,相对于压缩率高的以往的高效率编码,要求更好的音质。另外,为了便于公众利用而必须实施标准化,在世界性地积极进行研究开发。近年来,ITU-T (International Telecommunication Union TelecommunicationStandardization Sector,国际电信联盟远程通信标准化组织)及MPEG(Moving PictureExpert Group,动态图像专家组)正在研究不管对于语音还是音乐都能够进行编码的编解码器的标准化,正寻求更高效率且高质量的语音编解码。通过20年前建立的对语音的发声机构进行建模并巧妙地应用矢量量化的基本方式即CELP (Code Excited Linear Prediction,码激励线性预测),语音编码技术大幅提高了性能。国际规格中,在ITU-T标准G. 729、G. 722. 2、ETSI标准AMR、AMR_WB、3GPP2标准VMR-WB等多个标准方式中采用了 CELP。上述CELP的主要技术是能够以低比特率对声谱的轮廓进行编码的LPC(LinearPrediction Coding,线性预测编码)分析、以及通过LPC分析获得的参数的量化。尤其,近年的大部分标准方式中使用的是基于线谱的量化。其代表是LSP (Line Spectral Pair,线谱对)和对其改良后的ISP(Immittance Spectral Pair,导抗谱对),两者因插值性好,因此与矢量量化(以下称作“VQ(Vector Quantization)”)的兼容性都较高。通过将它们用于编码,能够以低比特率传输频谱信息。由此,以CELP为基本的编解码的性能显著提高。最近,为了应对高效率且高质量的语音编解码的需求,在ITU-T、MPEG、3GPP等中正逐渐标准化对宽带信号(16kbps)、超宽带信号(32kbps)进行编码的编解码。在为了对宽带、超宽带的数字信号进行编码而使用LPC系数时,必须以较多的比特数对16阶以上的多阶数的LSP或ISP进行编码。因此,一般使用将编码对象(目标矢量)分割成多个并将其分别矢量量化的“分割VQ”,但无法进行矢量的元素间的统计性的相关,因此编码性能降低。因此,作为进一步获得编码性能的方法,使用多级量化(Multiple stagequantization) 0多级量化是指不分割目标矢量,而是使用多个小的矢量量化连续地进行量化以逐渐减小误差。即,多级量化是将前级的量化的误差矢量在下一级进行量化的方法。如果只使用在前级误差最小的量化结果,则能够使计算量非常小。但是,如果只将误差最小的量化结果作为候选来进行多级量化,则综合性的编码失真不是充分小,量化性能差。因此,考虑使用从误差最小的候选起,保留前几个误差小的量化结果的候选的树搜索。由此,能够在一定程度上以较少的计算量获得高编码性能。尤其,在分配比特数多的情况下,为了将计算量抑制得较少,须增加级数,而在多级数的多级量化中,若不使用树搜索,将无法获得充分的量化性能。
专利文献I中公开了以多级量化CELP的激励矢量的方法。另外,已广泛知晓的是,在级数多时,通过使用树搜索,能够实现高效率的搜索。在各级中将保留的候选(误差小的量化结果)的数量设为N来进行搜索的方法被称作“N-best搜索(N best search)”,作为高效率的多级的搜索方法已为人所知。另外,专利文献2中公开了不使用矢量量化而利用N-best搜索来进行搜索的例子。现有技术文献专利文献[专利文献I]日本特开2003-8446号公报[专利文献2]日本特开2000-261321号公报

发明内容
发明要解决的问题但是,使用上述N > I的N-best搜索的多级矢量量化虽然能够使最终的编码失真小于将各级的候选锁定为一个(N= I)的做法,但计算量增加至N倍。相反,若将N的数量抑制得较少,则又会导致编码失真变大。这样,在以往的使用N-best搜索的多级矢量量化中,并未致力于以更少的计算量来减小编码失真,无法获得充分的编码性能。本发明的目的在于,提供以少的计算量减小编码失真,获得充分的编码性能的量化装置及量化方法。解决问题的方案本发明的量化装置使用树搜索进行多级量化,该量化装置采用的结构包括搜索单元,进行作为编码对象的一个以上的每个目标与存储在码本中的码矢量之间的匹配,并从量化失真最小的候选起,求一个以上的、在前级中确定的或者预先设定的候选数的候选;计算单元,对于所述候选,从所述目标减去所述码矢量,计算量化误差矢量;以及候选数确定单元,基于在所述前级确定的候选数,确定在下一级使用的候选数。本发明的量化方法使用树搜索进行多级量化,该方法包括以下步骤进行作为编码对象的一个以上的每个目标与存储在码本中的码矢量之间的匹配,并在第I级,从量化失真最小的候选起,求一个以上的、预先指定的候选数的候选,在第2级以后,从量化失真最小的候选起,求一个以上的、在前级确定的候选数的候选;对于所述候选,从所述目标减去所述码矢量,计算量化误差矢量;以及基于在所述前级确定的候选数,确定在下一级使用的候选数。发明的效果根据本发明,能够以少的计算量减小编码失真,获得充分的编码性能。


图1是表示本发明实施方式I的CELP编码装置的结构的方块图。图2是表示图1所示的多级矢量量化单元的内部结构的方块图。图3是表示图2所示的矢量量化单元的内部结构的方块图。
图4是表示图3所示的候选数确定单元中的候选数确定程序的流程图。图5是表示本发明实施方式2的候选数确定单元中的候选数确定程序的流程图。标号说明101LPC分析单元102多级矢量量化单元103自适应码本104固定码本105增益码本IO6、IO7 乘法器108、110 加法器109LPC合成滤波器111听觉加权单元112失真最小化单元201-1 201-J矢量量化单元202码确定单元301失真计算及码本搜索单元302 码本303候选数确定单元304暂定目标计算单元
具体实施例方式以下,参照附图详细地说明本发明的实施方式。(实施方式I)图1是表示本发明实施方式I的CELP编码装置100的结构的方块图。该CELP编码装置100在包含声道信息及激励源信息的语音信号Sll中,对于声道信息,通过求LPC参数(线性预测系数)来进行编码。另外,CELP编码装置100对于激励源信息,通过求指定使用预先存储的哪个语音模型的码数据、即指定以自适应码本103及固定码本104生成何种激励矢量(码矢量)的码数据,从而对激励源信息进行编码。具体而言,CELP编码装置100的各单元进行以下的动作。LPC分析单元101对语音信号Sll实施线性预测分析,求作为频谱包络信息的LPC参数,并输出至多级矢量量化单元102及听觉加权单元111。多级矢量量化单元102对由LPC分析单元101获得的LPC参数进行多级矢量量化,将获得的量化LPC参数输出至LPC合成滤波器109,将量化LPC参数的码数据输出至CELP编码装置100的外部。另一方面,自适应码本103存储有由LPC合成滤波器109使用的先前的激励源,按照与由失真最小化单元112指示的码数据对应的自适应码本延迟(lag),由存储的激励源生成I子帧量的激励矢量。该激励矢量作为自适应码本矢量被输出至乘法器106。固定码本104预先存储有多个规定形状的激励矢量,将与由失真最小化单元112指示的码数据对应的激励矢量作为固定码本矢量输出至乘法器107。这里,固定码本104为代数码本,对于使用了由两种个数的脉冲构成的代数码本时的结构,说明通过加法进行加权的情况。代数激励源是指多数标准编解码中采用的激励源,是设立了仅以位置与极性(+/-)为信息的、大小为I的少量脉冲的激励源。例如在ARIB规格书“RCR STD-27K”的5. 3节“CS-ACELP”中的5. 3.1. 9章、5. 4节的“ACELP”中的5. 4. 3. 7章等中已有公开。此外,上述自适应码本103是为了表现如浊音般周期性强的分量而使用。另一方面,固定码本104是为了表现如白噪声般周期性弱的分量而使用。增益码本105根据来自失真最小化单元112的指示,生成用于从自适应码本103输出的自适应码本矢量的增益(自适应码本增益)及用于从固定码本104输出的固定码本矢量的增益(固定码本增益),并分别输出至乘法器106、107。乘法器106将从增益码本105输出的自适应码本增益乘以从自适应码本103输出的自适应码本矢量,并输出至加法器108。乘法器107将从增益码本105输出的固定码本增益乘以从固定码本104输出的固定码本矢量,并输出至加法器108。加法器108将从乘法器106输出的自适应码本矢量与从乘法器107输出的固定码本矢量相加,并将相加后的激励矢量作为激励源输出至LPC合成滤波器109。LPC合成滤波器109将从多级矢量量化单元102输出的量化LPC参数设为滤波器系数,并使用将由自适应码本103及固定码本104生成的激励矢量设为激励源的滤波器函数即LPC合成滤波器,生成合成信号。该合成信号被输出至加法器110。加法器110通过从语音信号Sll中减去由LPC合成滤波器109生成的合成信号而计算误差信号,并将该误差信号输出至听觉加权单元111。此外,该误差信号相当于编码失真。听觉加权单元111对从加法器110输出的编码失真实施听觉加权,并输出至失真最小化单元112。失真最小化单元112对每个子帧求使从听觉加权单元111输出的编码失真为最小的自适应码本103、固定码本104及增益码本105的各索引,并将这些索引作为码数据输出至CELP编码装置100的外部。更详细而言,基于上述自适应码本103及固定码本104生成合成信号并求该信号的编码失真的一连串处理为闭环控制(反馈控制),失真最小化单元112通过在I子帧内使对各码本指示的码数据进行各种变化来搜索各码本,并输出最终获得的、使编码失真为最小的各码本的码数据。此外,编码失真成为最小时的激励源在每个子帧被反馈给自适应码本103。自适应码本103根据该反馈更新所存储的激励源。这里,说明固定码本104的搜索方法。首先,通过搜索使以下的式(I)的编码失真最小的激励矢量,进行激励矢量的搜索与码数据的导出。E = X- (pHa+qHs) 2 ......(I)E :编码失真,X :编码目标,P 自适应码本矢量的增益,H :听觉加权合成滤波器,a 自适应码本矢量,q :固定码本矢量的增益,s :固定码本矢量一般而言,以开环(以各自的环)搜索自适应码本矢量与固定码本矢量,因此通过搜索使以下的式(2)的编码失真为最小的固定码本矢量,进行固定码本104的码的导出。
权利要求
1.量化装置,使用树搜索进行多级量化,该量化装置包括: 搜索单元,进行作为编码对象的一个以上的每个目标与存储在码本中的码矢量之间的匹配,并从量化失真最小的候选起,求一个以上的、在前级中确定的或者预先设定的候选数的候选; 计算单元,对于所述候选,从所述目标减去所述码矢量,计算量化误差矢量;以及 候选数确定单元,基于在所述前级确定的候选数,确定在下一级使用的候选数。
2.如权利要求1所述的量化装置, 所述候选数确定单元确定在下一级使用从在所述前级确定的候选数中减I所得的候选数。
3.如权利要求1所述的量化装置, 所述候选数确定单元在所述前级确定的候选数为预先指定的值P以下的情况下,在所述量化失真大于规定的阈值时,确定在下一级使用候选数P,而在所述量化失真为所述规定的阈值以下时,确定在下一级使用比预先指定的P小的值Q作为候选数。
4.如权利要求1所述的量化装置, 所述搜索单元在其为第I级的情况下,从量化失真最小的候选起求预先指定的候选数的候选。
5.如权利要求1所述的量化装置, 所述候选数确定单元在当前的级数为规定的级数以上或者候选数为规定的候选数P以下的情况下, 在所述量化失真大于规定的阈值且候选数小于规定的候选数R时,确定在下一级使用候选数R, 在所述量化失真为所述规定的阈值以下且候选数小于比所述候选数R小的规定的候选数Q时,确定在下一级使用候选数Q。
6.量化方法,使用树搜索进行多级量化,该方法包括以下步骤: 进行作为编码对象的一个以上的每个目标与存储在码本中的码矢量之间的匹配,并在第I级,从量化失真最小的候选起,求一个以上的、预先指定的候选数的候选,在第2级以后,从量化失真最小的候选起,求一个以上的、在前级确定的候选数的候选; 对于所述候选,从所述目标减去所述码矢量,计算量化误差矢量;以及 基于在所述前级确定的候选数,确定在下一级使用的候选数。
全文摘要
提供以较少的计算量减小编码失真,并获得充分的编码性能的量化装置及量化方法。多级矢量量化单元(102)在第1级矢量量化单元(201-1)中设为预先指定的候选数N,在第2级以后的矢量量化单元(201-2~201-J)中,每前进一级,将候选数逐次减1,当候选数减到3以下时,每次都评估量化失真,若量化失真大于规定的阈值,则将下一级的候选数设为预定的数值P,若量化失真为规定的阈值以下,则将下一级的候选数设为比预定的P小的数值Q。
文档编号G10L19/107GK103081007SQ201180042309
公开日2013年5月1日 申请日期2011年9月16日 优先权日2010年9月17日
发明者森井利幸 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1