变换编码装置和变换编码方法

文档序号:2833014阅读:165来源:国知局
专利名称:变换编码装置和变换编码方法
技术领域
本发明涉及在频域中对输入信号进行编码的变换编码装置和变换编码方法。
背景技术
为了有效地利用移动通信系统中的电波资源等,要求以低比特率对语音信号进行压缩。另一方面,用户期望提高通话语音的质量以及实现富有现场感的通话业务。为了实现上述要求,不仅期望语音信号质量的提高,而且期望对频带更宽的音频信号等语音之外的信号也能够进行高质量的编码。为此,分层地综合多个编码技术的研究备受关注。例如,有分层地组合下述的第一层和第二层的技术,所述第一层,以适合于语音信号的模式,对输入信号以低比特率进行编码,所述第二层,以也适合于语音信号以外的信号的模式,对输入信号与第一层解码信号之间的差分信号进行编码(例如,参照非专利文献 I)。其中,提出了使用在 MPEG-4 (Moving Picture Experts Group phase-4 :动态图像专家组阶段4)标准化了的技术进行可扩展编码的例子。具体来说,将适合于语音信号的CELP(Code Excited Linear Prediction :码激励线性预测)用于第一层,并对从原信号减去第一层解码 目号后的残差/[目号,使用AAC (Advanced Audio Coder :闻级首频编码)和TwinVQ (Transform Domain Weighted Interleave Vector Quantization :变换域加权交织矢量量化)那样的变换编码作为第二层。另外,所谓TwinVQ的变换编码是,对输入信号进行MDCT(Modified DiscreteCosine Transform :改进离散余弦变换),并对获得的MDCT系数用谱包络和每个Bark尺度的平均振幅进行归一化的技术(例如,参照非专利文献2)。其中,将表示谱包络的LPC (Linear Predictive Coding :线性预测编码)系数,以及每个 Bark 尺度(Bark scale)的平均振幅值分别单独编码,对归一化后的MDCT系数进行交织,将其分割为子矢量,并进行矢量量化。特别是,在将谱包络和每个Bark尺度的平均振幅称为标度因子(scalefactor),并将归一化后的MDCT系数称为频谱的微细结构(以下称为“微细频谱”)时,TwinVQ可以理解为,将MDCT系数分离为标度因子和微细频谱而进行编码的技术。在以TwinVQ为代表的变换编码中,标度因子用于控制微细频谱的功率。因此,标度因子对主观质量(人的听觉质量)造成的影响较大,在标度因子的编码失真较大时,使主观质量极大地劣化。所以,标度因子的高性能编码是很重要的。(非专利文献I)三木弼一编著,“MPEG-4乃全^(初版)”(株)工业调查会,1998年 9 月 30 日,p. 126-127(非专利文献2)岩上直樹、守谷健弘、三樹聡、池田和永、神明夫著、「周波数領域重 付、y " —H卜 >量子化(TwinVQ) (二 J 3楽音符号化」信学論(A),1997年5 月,vol. J80-A, no. 5, p. 830-83
发明内容
本发明需要解决的问题在TwinVQ中,用谱包络及每个Bark尺度的平均振幅来表示相当于标度因子的信息。例如,着眼于每个Bark尺度的平均振幅时,在非专利文献2所公开的技术中,决定了使由下述的算式所表示的加权平方误差d为最小的、每个Bark尺度的平均振幅矢量。d = YjWi-(Ei-C^m))1
I …式(I)其中,i表示Bark尺度的序号,Ei表示第iBark的平均振幅,Ci (m)表示平均振幅码本中所记录的第m平均振幅矢量。在上述式⑴中所示的加权函数Wi是Bark尺度,即频率的函数,在Bark尺度i相同时,与输入标度因子和量化候补之间的差(Ei-CiOn))相乘的加权(Weight)Wi总是相同。另外,Wi表示与Bark尺度对应的加权,基于谱包络的大小被计算。例如,使对谱包络较小的频带的平均振幅的加权成为较小的值,使对谱包络较大的频带的平均振幅的加权成为较大的值。所以,将对谱包络较大的频带的平均振幅的加权设定得较大,其结果,重视该频带而进行编码。相反地,将对谱包络较小的频带的平均振幅的加权设定得较小,因此该频带的重要度变低。一般而言,谱包络较大的频带对语音质量造成的影响较大,所以为了改善语音质量,正确地表示属于该频带地频谱是很重要。然而,在非专利文献2所公开的技术中,在为了实现低比特率而减少对平均振幅的量化分配的比特数时,存在以下的问题因为比特数不够,平均振幅矢量C(m)的候选数被限定,比如即使决定了可满足上述式(I)的平均振幅矢量,但其量化失真较大,导致语音质量的劣化。本发明的目的是提供变换编码装置和变换编码方法,即使在不能被分配足够的比特数时,也能够减轻听觉上的语音质量的劣化。解决问题的方案本发明的变换编码装置所采用的结构包括输入标度因子计算单元,计算与输入频谱对应的多个输入标度因子;码本,存储多个标度因子,并输出一个标度因子;失真计算单元,计算所述多个输入标度因子中的一个输入标度因子与从所述码本输出的标度因子之间的失真;加权失真计算单元,计算加权失真,该加权失真为,与在所述一个输入标度因子大于从所述码本输出的标度因子时的所述失真相比,对在所述一个输入标度因子小于从所述码本输出的标度因子时的所述失真附加了更重的加权的加权失真;以及搜寻单元,在所述码本中,搜寻使所述加权失真为最小的标度因子。本发明的变换编码装置所采用的结构包括输入标度因子计算单元,将输入的频谱的信号频带分割为NB个子带,并计算作为各个子带的频谱的平均振幅的、NB个输入标度因子;码本,存储多个包含与各个子带对应的NB个标度因子的候补的矢量,并输出一个矢量;失真计算单元,从所述NB个输入标度因子的值,减去从所述码本输出的所述一个矢量所包含的NB个标度因子的候补的值,以计算每个子带的失真;加权失真计算单元,计算加权失真,该加权失真为,所述失真的值为正时,将所述失真的平方值与第一加权相乘,所述失真的值为负时,将所述失真的平方值与具有比所述第一加权的值大的值的第二加权相乘,并将NB个的、与所述第一加权或所述第二加权相乘后的所述失真的平方值相加;以及搜寻单元,在所述码本中,搜寻使所述加权失真为最小的矢量。
本发明的变换编码装置所采用的结构包括第一标度因子计算单元,将输入的第一频谱的信号频带分割为NB个子带,并对于每个子带计算第一频谱的平均振幅,以得到NB个第一标度因子,所述第一频谱为信号的估计频谱;第二标度因子计算单元,将第二频谱的信号频带分割为NB个子带,并对于每个子带计算第二频谱的平均振幅,以得到NB个第二标度因子,所述第二频谱为所述信号的频谱;码本,存储多个包含与各个子带对应的NB个校正系数的矢量,并输出一个矢量;乘法单元,将与所述NB个子带中的一个子带对应的第一标度因子的值、与从所述一个矢量所包含并与所述一个子带对应的校正系数的值相乘并输出;失真计算单元,从与所述一个子带对应的第二标度因子的值,减去与从所述乘法单元输出的所述校正系数相乘的第一标度因子的值,计算与所述一个子带对应的失真;加权失真计算单元,计算加权失真,该加权失真为,所述失真的值为正时,将所述失真的平方值与第一加权相乘,所述失真的值为负时,将所述失真的平方值与具有大于所述第一加权的值的第二加权相乘,并将NB个的、与所述第一加权或所述第二加权相乘后的所述失真的平方值相加;以及搜寻单元,在所述码本中,搜寻使所述加权失真为最小的矢量。本发明的变换编码方法包括以下步骤将输入的频谱的信号频带分割为NB个子带,并计算作为各个子带的频谱的平均振幅的、NB个输入标度因子;从存储有多个包含与各个子带对应的NB个标度因子的候补的矢量的码本中,选择一个矢量;从所述NB个输入标度因子的值,减去选择出的所述一个矢量所包含的NB个标度因子的候补的值,以计算每个子带的失真;计算加权失真,该加权失真为,所述失真的值为正时,将所述失真的平方值与第一加权相乘,所述失真的值为负时,将所述失真的平方值与具有比所述第一加权的值大的值的第二加权相乘,并将NB个的、与所述第一加权或所述第二加权相乘后的所述失真的平方值相加;以及在所述码本中,搜寻使所述加权失真为最小的矢量。本发明的有益效果根据本发明,在低比特率环境下,也能够减轻听觉上的语音质量的劣化。


图I是表示实施方式I的可扩展编码装置的主要结构的方框图。图2是表示实施方式I的第二层编码单元内部的主要结构的方框图。图3是表示实施方式I的校正标度因子编码单元内部的主要结构的方框图。图4是表示实施方式I的可扩展解码装置的主要结构的方框图。图5是表示实施方式I的第二层解码单元内部的主要结构的方框图。图6是表示实施方式2的第二层编码单元内部的主要结构的方框图。图7是表示实施方式2的第二层解码单元内部的主要结构的方框图。图8是表示实施方式3的第二层编码单元内部的主要结构的方框图。图9是表示实施方式4的变换编码装置的主要结构的方框图。图10是表示实施方式4的标度因子编码单元内部的主要结构的方框图。图11是表示实施方式4的变换解码装置的主要结构的方框图。
图12是表示实施方式5的可扩展编码装置的主要结构的方框图。图13是表示实施方式5的第二层编码单元内部的主要结构的方框图。图14是表示实施方式5的校正标度因子编码单元内部的主要结构的方框图。图15是表示实施方式5的第二层解码单元内部的主要结构的方框图。图16是表示实施方式6的第二层编码单元内部的主要结构的方框图。图17是表示实施方式6的校正标度因子编码单元内部 的主要结构的方框图。图18是表示实施方式7的可扩展解码装置的主要结构的方框图。图19是表示实施方式7的修正LPC计算单元内部的主要结构的方框图。图20是表示实施方式7的各个层的信号频带和语音质量的示意图。图21是表示实施方式7的根据第一实现方法的功率谱的修正状态的频谱特性图。图22是表示实施方式7的利用第二实现方法的功率谱的修正状态的频谱特性图。图23是表示实施方式7的使用修正LPC系数而构成的后置滤波器的频谱特性图。图24是表示实施方式8的可扩展解码装置的主要结构的方框图。图25是表示实施方式8的抑制信息计算单元内部的主要结构的方框图。
具体实施例方式本发明可以大致分为适用于可扩展编码的情况和适用于由单一层构成的编码的情况。其中,可扩展编码是,具有由多个层构成的分层结构的编码方式,其特征为在各个层生成的编码参数具有可扩展性。也就是说,具有如下的特征从多个层的编码参数中的一部分层(低层)的编码参数也能够获得某一程度的质量的解码信号,通过使用更多的层的编码参数来进行解码,能够获得更高质量的解码信号。因此,在实施方式I 3和5 8中说明将本发明适用于可扩展编码的情况,而在实施方式4中说明将本发明适用于由单一层构成的编码的情况。另外,在实施方式I 3和5 8中,以下述情况为例进行说明。(I)进行由第一层和高于该层的第二层构成的,S卩,由低层和高层构成的两层结构的可扩展编码。(2)进行编码参数在频率轴方向上具有可扩展性的频带可扩展编码。(3)在第二层进行在频域中的编码即变换编码,并使用MDCT (Modified DiscreteCosine Transform :改进离散余弦变换)作为变换方式。另外,在所有的实施方式中,以将本发明适用于语音信号的编码的情况为例进行说明。下面,参照附图详细地说明本发明的实施方式。(实施方式I)图I是表示本发明实施方式I的具备变换编码装置的可扩展编码装置的主要结构的方框图。本实施方式的可扩展编码装置包括下采样单元101、第一层编码单元102、复用单元103、第一层解码单元104、延迟单元105以及第二层编码单元106,各个单元进行以下的动作。下采样单元101从采样率F2的输入信号生成采样率Fl (Fl ( F2)的信号,将其提供给第一层编码单元102。第一层编码单元102对从下采样单元101输出的采样率Fl的信号进行编码。由第一层编码单元102获得的编码参数被提供给复用单元103,同时被提供给第一层解码单元104。第一层解码单元104根据第一层编码单元102输出的编码参数生成第一层的解码信号。另一方面,延迟单元105使输入信号延迟规定的长度。该延迟为用于校正在下采样单元101、第一层编码单元102以及第一层解码单元104产生的时间延迟。第二层编码单元106使用由第一层解码单元104生成的第一层解码信号,对从延迟单元105输出的延迟了规定时间的输入信号进行变换编码,将生成的编码参数输出到复用单元103。复用单元103将由第一层编码单元102求得的编码参数与由第二层编码单元106求得的编码参数进行复用,并将其作为最终的编码参数输出。图2是表示第二层编码单元106内部的主要结构的方框图。第二层编码单元106包括MDCT分析单元111和112、高频频谱估计单元113以及校正标度因子编码单元114,各个单元进行以下的动作。MDCT分析单元111对第一层解码信号进行MDCT分析,计算信号频带(频带)0 FL的低频频谱(窄带频谱),并输出到高频频谱估计单元113。MDCT分析单元112对原信号即语音信号进行MDCT分析,计算信号频带O 的宽带频谱,其中,将与窄带频谱相同的带宽且信号频带为高频段FL ra的高频频谱,输出到高频频谱估计单元113和校正标度因子编码单元114。这里,窄带频谱的信号频带与宽带频谱的信号频带之间有FL < FH的关系。高频频谱估计单元113利用信号频带O FL的低频频谱来估计信号频带FL 的高频频谱,从而获得估计频谱。估计频谱的导出方法为,基于低频频谱,通过使该低频频谱变形,求与高频频谱之间的相似性为最大的估计频谱。高频频谱估计单元113对与该估计频谱有关的信息(估计信息)进行编码,输出获得的编码参数,同时将估计频谱本身提供给校正标度因子编码单元114。在以下的说明中,将从高频频谱估计单元113输出的估计频谱称为第一频谱,将从MDCT分析单元112输出的高频频谱称为第二频谱。这里,将在上述说明中出现的各种频谱汇总起来,与信号频带一起如下表示。窄带频谱(低频频谱)· · · O FL宽带频谱…O FH 第一频谱(估计频谱)…FL FH
第二频谱(高频频谱)…FL FH校正标度因子编码单元114对第一频谱的标度因子进行校正,以使第一频谱的标度因子接近于第二频谱的标度因子,并对与该校正标度因子有关的信息进行编码而输出。图3是表示校正标度因子编码单元114内部的主要结构的方框图。校正标度因子编码单元114包括标度因子计算单元121和122、校正标度因子码本123、乘法器124、减法器125、判定单元126、加权误差计算单元127以及搜寻单元128,各个单元进行以下的动作。标度因子计算单元121将输入的第二频谱的信号频带FL 分割为多个子带,并求各个子带所包含的频谱的大小,将其输出到减法器125。具体而言,分割为子带时,与临界频带相对应地进行分割,并以Bark尺度被分割为等间隔。另外,标度因子计算单元121求各个子带所包含的频谱的平均振幅,并将其作为第二标度因子SF2 (k) {O < k < NB}。其中,NB表示子带数。另外,也可以使用最大振幅值等代替平均振幅。
标度因子计算单元122将输入的第一频谱的信号频带FL 分割为多个子带,并计算各个子带的第一标度因子SFl (k) {O < k < NB},将其输出到乘法器124。另外,在标度因子计算单元122中,与标度因子计算单元121相同地,也可以使用最大振幅值等代替平均振幅。在以后的处理中,将多个子带中的各个参数汇总成一个矢量值。例如,将NB个标度因子作为一个矢量来表示。并且,以对各个矢量进行各种处理的情况,也就是进行矢量量化的情况为例进行说明。校正标度因子码本123中存储多个校正标度因子的候选,根据来自搜寻单元128的指示,将所存储的校正标度因子的候选中的一个候选依次输出到乘法器124。在校正标度因子码本123中所存储的校正标度因子的多个候选被表示为矢量。乘法器124将从标度因子计算单元122输出的第一标度因子与从校正标度因子码本123输出的校正标度因子的候选相乘,将乘法结果提供给减法器125。减法器125从标度因子计算单元121所输出的第二标度因子中,减去乘法器124的输出、即第一标度因子与校正标度因子候选的乘积,并将由此获得的误差信号提供给加权误差计算单元127和判定单元126。判定单元126基于从减法器125提供的误差信号的符号,决定对加权误差计算单元127提供的加权矢量。具体而言,由下述式(2),表示从减法器125提供的误差信号d(k)。d(k) = SF2 (k) -Vi (k) · SFl (k) (O ^ k < NB)…式(2)其中,ViGO表示校正标度因子的第i个候选。判定单元126判定d(k)的符号,在判定为正时选择Wptjs,而在判定为负时选择Wmg作为加权(weight),将由它们构成的加权矢量w(k)输出到加权误差计算单元127。这些加权中有下述式(3)的大小关系。O < Wpos < Wneg…式(3)例如,在子带数NB = 4且d(k)的符号为{+,_,_,+}时,输出到加权误差计算单元127的加权矢量w (k)可以表示为w(k) = {wpos, wneg, wneg, WpoJ。加权误差计算单元127首先计算从减法器125提供的误差信号的平方值,接着,将从判定单元126提供的加权矢量w(k)乘以误差信号的平方值,从而计算加权平方误差EJf计算结果提供给搜寻单元128。其中,加权平方误差E如下述的式(4)所示。
权利要求
1.一种变换编码装置,包括 输入标度因子计算单元,将输入的频谱的信号频带分割为NB个子带,并计算作为各个子带的频谱的平均振幅的、NB个输入标度因子; 码本,存储多个包含与各个子带对应的NB个标度因子的候补的矢量,并输出一个矢量; 失真计算单元,从所述NB个输入标度因子的值,减去从所述码本输出的所述一个矢量所包含的NB个标度因子的候补的值,以计算每个子带的失真; 加权失真计算单兀,计算加权失真,该加权失真为,所述失真的值为正时,将所述失真的平方值与第一加权相乘,所述失真的值为负时,将所述失真的平方值与具有比所述第一加权的值大的值的第二加权相乘,并将NB个的、与所述第一加权或所述第二加权相乘后的所述失真的平方值相加;以及 搜寻单元,在所述码本中,搜寻使所述加权失真最小的矢量。
2.一种通信终端装置,包括权利要求I所述的变换编码装置。
3.一种基站装置,包括权利要求I所述的变换编码装置。
4.一种变换编码装置,包括 第一标度因子计算单元,将输入的第一频谱的信号频带分割为NB个子带,并对于每个子带计算第一频谱的平均振幅,以得到NB个第一标度因子,所述第一频谱为信号的估计频谱; 第二标度因子计算单元,将第二频谱的信号频带分割为NB个子带,并对于每个子带计算第二频谱的平均振幅,以得到NB个第二标度因子,所述第二频谱为所述信号的频谱;码本,存储多个包含与各个子带对应的NB个校正系数的矢量,并输出一个矢量; 乘法单元,将与所述NB个子带中的一个子带对应的第一标度因子的值、与从所述一个矢量所包含并与所述一个子带对应的校正系数的值相乘并输出; 失真计算单元,从与所述一个子带对应的第二标度因子的值,减去与从所述乘法单元输出的所述校正系数相乘的第一标度因子的值,计算与所述一个子带对应的失真; 加权失真计算单兀,计算加权失真,该加权失真为,所述失真的值为正时,将所述失真的平方值与第一加权相乘,所述失真的值为负时,将所述失真的平方值与具有大于所述第一加权的值的第二加权相乘,并将NB个的、与所述第一加权或所述第二加权相乘后的所述失真的平方值相加;以及 搜寻单元,在所述码本中,搜寻使所述加权失真最小的矢量。
5.一种变换编码方法,该方法包括以下步骤 将输入的频谱的信号频带分割为NB个子带,并计算作为各个子带的频谱的平均振幅的、NB个输入标度因子; 从存储有多个包含与各个子带对应的NB个标度因子的候补的矢量的码本中,选择一个矢量; 从所述NB个输入标度因子的值,减去选择出的所述一个矢量所包含的NB个标度因子的候补的值,以计算每个子带的失真; 计算加权失真,该加权失真为,所述失真的值为正时,将所述失真的平方值与第一加权相乘,所述失真的值为负时,将所述失真的平方值与具有比所述第一加权的值大的值的第二加权相乘,并将NB个的、与所述第一加权或所述第二加权相乘后的所述失真的平方值相加;以及 在所述码本中,搜寻使所述加权失真最小的矢量。
全文摘要
本发明的变换编码装置变换编码装置包括输入标度因子计算单元,将输入的频谱的信号频带分割为NB个子带,并计算作为各个子带的频谱的平均振幅的、NB个输入标度因子;码本,存储多个包含与各个子带对应的NB个标度因子的候补的矢量,并输出一个矢量;失真计算单元,从NB个输入标度因子的值,减去从码本输出的一个矢量所包含的NB个标度因子的候补的值,以计算每个子带的失真;加权失真计算单元,在失真的值为正时,将失真的平方值与第一加权相乘,失真的值为负时,将失真的平方值与具有比第一加权的值大的值的第二加权相乘,并将NB个的、与第一加权或第二加权相乘后的失真的平方值相加;以及搜寻单元,在码本中,搜寻使加权失真最小的矢量。
文档编号G10L19/02GK102623014SQ20121006166
公开日2012年8月1日 申请日期2006年10月13日 优先权日2005年10月14日
发明者山梨智史, 押切正浩 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1