解码装置和解码方法

文档序号:2832923阅读:155来源:国知局
专利名称:解码装置和解码方法
技术领域
本发明涉及对语音信号等的输入信号进行编码并传输的通信系统所使用的解码装置和解码方法。
背景技术
在移动通信系统中,为了有效利用电波资源等,要求将语音信号压缩到低比特率后传输。另一方面,还期望提高通话语音的质量及实现较高的现场感的通话服务,为了实现该需求,既期望提高语音信号的质量,又期望高质量地对频带更宽的音频信号等语音信号以外的信号进行编码。对于这样相反的两种要求,分层地合并多个编码技术的技术备受关注。该技术分层组合基本层和扩展层,所述基本层通过适合于语音信号的模型(model)以低比特率对输入信号进行编码,所述扩展层通过也适合于语音以外的信号的模型对输入信号与基本层的解码信号之间的差分信号进行编码。这样分层地进行编码的技术,由于从编码装置得到的比特流具有扩展性(scalability),即具有即使通过比特流的一部分信息也能够得到解码信号的性质,因此一般被称为可扩展编码(分层编码)。根据该性质,可扩展编码方式能够灵活地应对比特率不同的网络间的通信,因此可以说该方式适合于以IPdnternet Protocol,因特网协议)合并各种各样的网络的、今后的网络环境。作为禾Ij 用以 MPEG-4 (Moving Picture Experts Group phase (运动图像专家组)_4)进行标准化的技术来实现可扩展编码的例子,例如有非专利文献1所公开的技术。 该技术在基本层中,利用适合于语音信号的CELP (Code Excited Linear Prediction,码激励线性预测)编码,在扩展层中,对残差信号利用诸如AAC(Advanced Audio Coder,高级音步页编石马器)或者TwinVQ (Transform Domain Weighted Interleave Vector Quantization, 传输域加权交织向量量化)等的变换编码,所述残差信号是从原信号减去第一层解码信号而得到的信号。另外,为了灵活地应对通信速度因异构网络(heterogeneous network)间切换 (handover)或拥塞的发生等动态地变动的网络环境,需要实现比特率间隔较小的可扩展编码,因此需要对降低了比特率的层进行多层化处理而构成可扩展编码。另一方面,在专利文献1和专利文献2中公开了以下技术将作为编码对象的信号变换到频域,在由此得到的频域信号中进行编码的变换编码。在这样的变换编码中,首先对每个子带计算并量化频域信号的能量分量即增益(缩放因子,scale factor),接着计算并量化上述频域信号的微细分量即形状向量。非专利文献1 三木弼一编著,《MPEG-4 O t ^ 》第一版、株式会社工业调查会、1998 年 9 月 30 日、ρ· 126-127专利文献1 日本专利申请特表第2006-513457号公报专利文献2 日本专利申请特开平7-261800号公报

发明内容
发明需要解决的问题然而,在对两个参数依前后的顺序进行量化时,因为在后量化的参数受到在前量化的参数的量化失真的影响,所以存在量化失真变大的倾向。因此,在专利文献1和专利文献2所记载的依增益、形状向量的顺序进行量化的变换编码中,存在形状向量的量化失真变大,从而无法正确地表示频谱的形状的倾向。该问题对如元音(vowel sound)那样的调性(tonality)较强的信号即可观察到多个波峰(peak)形状的频谱特性的信号,产生较大的质量劣化。该问题在实现低比特率时变得显著。本发明的目的在于,提供能够正确地对如元音那样的调性较强的信号即可观察到多个波峰形状的频谱特性的信号的频谱的形状进行编码,从而能够提高解码语音的音质等解码信号的质量的编码装置和编码方法。解决问题的方案本发明的编码装置所采用的结构包括基本层编码单元,对输入信号进行编码而获得基本层编码数据;基本层解码单元,对所述基本层编码数据进行解码而获得基本层解码信号;以及扩展层编码单元,对作为所述输入信号与所述基本层解码信号之间的差的残差信号进行编码而获得扩展层编码数据,所述扩展层编码单元包括分割单元,将所述残差信号分割为多个子带;第一形状向量编码单元,对所述多个子带的各个子带进行编码而获得第一形状编码信息,并且计算所述多个子带的各个子带的目标增益;增益向量构成单元, 利用所述多个目标增益构成一个增益向量;以及增益向量编码单元,对所述增益向量进行编码而获得第一增益编码信息。本发明的编码方法包括以下的步骤将变换系数分割为多个子带,所述变换系数是将输入信号变换到频域而获得的变换系数;对所述多个子带的变换系数的各个变换系数进行编码而获得第一形状编码信息,并且计算所述多个子带的各个变换系数的目标增益; 利用所述多个目标增益构成一个增益向量;以及对所述增益向量进行编码而获得第一增益编码信息。本发明的解码装置所采用的结构包括接收单元,接收第一层编码数据和第二层编码数据,所述第一层编码数据是在编码装置中对输入信号进行编码而获得的,所述第二层编码数据是在所述编码装置中对将第一层残差信号变换到频域而计算出的第一层误差变换系数进行编码而获得的,所述第一层残差信号是在所述编码装置中对所述第一层编码数据进行解码所得到的信号与所述输入信号之间的差的信号;第一层解码单元,对所述第一层编码数据进行解码而生成第一层解码信号;第二层解码单元,对所述第二层编码数据进行解码而生成第一层解码误差变换系数;时域变换单元,将所述第一层解码误差变换系数变换到时域而生成第一解码误差信号;以及加法单元,将所述第一层解码信号和第一层解码误差信号相加而生成解码信号,所述第二层编码数据包含第一形状编码信息和第一增益编码信息,所述第一形状编码信息根据第一形状向量的多个脉冲的位置求出,所述第一形状向量是对所述第一层误差变换系数的一部分的频带,将脉冲配置在振幅值大的多个变换系数的位置而生成的,所述第一增益编码信息是对由多个目标增益构成的一个增益向量进行编码而获得的,所述多个目标增益是将所述第一形状向量分割为多个子带、将所述第一层误差变换系数的所述一部分的频带分割为多个子带、并对于所述多个子带的每个子带利用所述第一形状向量和所述第一层误差变换系数计算出来的。本发明的解码方法包括接收步骤,接收第一层编码数据和第二层编码数据,所述第一层编码数据是在编码装置中对输入信号进行编码而获得的,所述第二层编码数据是在所述编码装置中对将第一层残差信号变换到频域而计算出的第一层误差变换系数进行编码而获得的,所述第一层残差信号是在所述编码装置中对所述第一层编码数据进行解码所得到的信号与所述输入信号之间的差的信号;第一层解码步骤,对所述第一层编码数据进行解码而生成第一层解码信号;第二层解码步骤,对所述第二层编码数据进行解码而生成第一层解码误差变换系数;时域变换步骤,将所述第一层解码误差变换系数变换到时域而生成第一解码误差信号;以及加法步骤,将所述第一层解码信号和第一层解码误差信号相加而生成解码信号,所述第二层编码数据包含第一形状编码信息和第一增益编码信息,所述第一形状编码信息根据第一形状向量的多个脉冲的位置求出,所述第一形状向量是对所述第一层误差变换系数的一部分的频带,将脉冲配置在振幅值大的多个变换系数的位置而生成的,所述第一增益编码信息是对由多个目标增益构成的一个增益向量进行编码而获得的,所述多个目标增益是将所述第一形状向量分割为多个子带、将所述第一层误差变换系数的所述一部分的频带分割为多个子带、并对于所述多个子带的每个子带利用所述第一形状向量和所述第一层误差变换系数计算出来的。发明的效果根据本发明,能够进一步正确地对如元音那样的调性较强的信号即可观察到多个波峰形状的频谱特性的信号的频谱的形状进行编码,从而能够提高解码语音的音质等解码信号的质量。


图1是表示本发明实施方式1的语音编码装置的主要结构的方框图。图2是表示本发明实施方式1的第二层编码单元内部的结构的方框图。图3是表示本发明实施方式1的第二层编码单元中的第二层编码处理的步骤的流程图。图4是表示本发明实施方式1的形状向量编码单元内部的结构的方框图。图5是表示本发明实施方式1的增益向量构成单元内部的结构的方框图。图6是用于详细地说明本发明实施方式1的目标增益配置单元的动作的图。图7是表示本发明实施方式1的增益向量编码单元内部的结构的方框图。图8是表示本发明实施方式1的语音解码装置的主要结构的方框图。图9是表示本发明实施方式1的第二层解码单元内部的结构的方框图。图10是用于说明本发明实施方式2的形状向量码本的图。图11是举例说明本发明实施方式2的形状向量码本所包含的多个形状向量候补的图。
5
图12是表示本发明实施方式3的第二层编码单元内部的结构的方框图。图13是用于说明本发明实施方式3的范围选择单元中的范围选择处理的图。图14是表示本发明实施方式3的第二层解码单元内部的结构的方框图。图15是表示本发明实施方式3的范围选择单元的变化(variation)的图。图16是表示本发明实施方式3的范围选择单元中的范围选择方法的变化的图。图17是表示本发明实施方式3的范围选择单元的结构的变化的方框图。图18是举例说明本发明实施方式3的、在范围信息构成单元中构成范围信息的情形的图。图19是用于说明本发明实施方式3的第一层误差变换系数生成单元的变化的动作的图。图20是表示本发明实施方式3的范围选择单元中的范围选择方法的变化的图。图21是表示本发明实施方式3的范围选择单元中的范围选择方法的变化的图。图22是表示本发明实施方式4的第二层编码单元内部的结构的方框图。图23是表示本发明实施方式5的语音编码装置的主要结构的方框图。图24是表示本发明实施方式5的第一层编码单元内部的主要结构的方框图。图25是表示本发明实施方式5的第一层解码单元内部的主要结构的方框图。图26是表示本发明实施方式5的语音解码装置的主要结构的方框图。图27是表示本发明实施方式6的语音编码装置的主要结构的方框图。图28是表示本发明实施方式6的语音解码装置的主要结构的方框图。图29是表示本发明实施方式7的语音编码装置的主要结构的方框图。图30A 图30C是用于说明在本发明实施方式7的语音编码装置的编码处理中、 作为编码对象的范围的选择处理的图。图31是表示本发明实施方式7的语音解码装置的主要结构的方框图。图32A、图32B是用于说明在本发明实施方式7的语音编码装置的编码处理中、从等间隔地配置的范围的候补中选择编码对象的情况的图。图33是用于说明在本发明实施方式7的语音编码装置的编码处理中、从等间隔地配置的范围的候补中选择编码对象的情况的图。
具体实施例方式下面,参照附图详细地说明本发明的实施方式。下面,使用语音编码装置/语音解码装置作为本发明的编码装置/解码装置的例子进行说明。(实施方式1)图1是表示本发明实施方式1的语音编码装置100的主要结构的方框图。作为本实施方式的语音编码装置和语音解码装置的结构,以采用两层的可扩展结构为例进行说明。另外,第一层构成基本层,第二层构成扩展层。在图1中,语音编码装置100包括频域变换单元101、第一层编码单元102、第一层解码单元103、减法器104、第二层编码单元105、以及复用单元106。频域变换单元101将时域的输入信号变换到频域的信号,并将所获得的输入变换系数输出到第一层编码单元102和减法器104。
第一层编码单元102对由频域变换单元101输入的输入变换系数进行编码处理, 并将所获得的第一层编码数据输出到第一层解码单元103和复用单元106。第一层解码单元103利用由第一层编码单元102输入的第一层编码数据进行解码处理,并将所获得的第一层解码变换系数输出到减法器104。减法器104从由频域变换单元101输入的输入变换系数减去由第一层解码单元 103输入的第一层解码变换系数,并将所获得的第一层误差变换系数输出到第二层编码单元 105。第二层编码单元105对由减法器104输入的第一层误差变换系数进行编码处理, 并将所获得的第二层编码数据输出到复用单元106。另外,将在后面叙述第二层编码单元 105的细节。复用单元106将由第一层编码单元102输入的第一层编码数据与由第二层编码单元105输入的第二层编码数据复用,并将所获得的比特流输出到通信路径。图2是表示第二层编码单元105内部的结构的方框图。在图2中,第二层编码单元105包括子带构成单元151、形状向量编码单元152、 增益向量构成单元153、增益向量编码单元154、以及复用单元155。子带构成单元151将由减法器104输入的第一层误差变换系数分割为M个子带, 并将所获得的M个子带变换系数输出到形状向量编码单元152。这里,在将第一层误差变换系数表示为ei(k)时,第m(0彡m彡M-1)子带变换系数e (m,k)由下式⑴表示。e (m, k) = G1 (k+F (m))... (1)(0 ^ k < F(m+1)-F (m))在式(1)中,F(m)表示各个子带边界的频率,满足0彡F(O) < F⑴ <...<F(M) ^FH的关系。这里,ΠΙ表示第一层误差变换系数的最大频率,m取0彡m彡M-I 的整数。形状向量编码单元152对由子带构成单元151依序输入的M个子带变换系数的各个系数进行形状向量量化,以生成M个子带的各个形状编码信息,并且计算M个子带变换系数各自的目标增益。形状向量编码单元152将所生成的形状编码信息输出到复用单元155, 并将目标增益输出到增益向量构成单元153。另外,将在后面叙述形状向量编码单元152的细节。增益向量构成单元153以由形状向量编码单元152输入的M个目标增益构成一个增益向量,并将其输出到增益向量编码单元154。另外,将在后面叙述增益向量构成单元 153的细节。增益向量编码单元154将由增益向量构成单元153输入的增益向量作为目标值而进行向量量化,并将所获得的增益编码信息输出到复用单元155。另外,将在后面叙述增益向量编码单元154的细节。复用单元155将由形状向量编码单元152输入的形状编码信息与由增益向量编码单元154输入的增益编码信息复用,并将所获得的比特流作为第二层编码数据输出到复用单元106。图3是表示第二层编码单元105中的第二层编码处理的步骤的流程图。首先,在步骤(以下,略称为“ST”)1010中,子带构成单元151将第一层误差变换
7系数分割为M个子带,构成M个子带变换系数。接着,在ST1020中,第二层编码单元105将作为用于计数子带的数目的值的、子带计数值m初始化为“0”。接着,在ST1030中,形状向量编码单元152对第m子带变换系数进行形状向量编码,生成第m子带的形状编码信息,并且生成第m子带变换系数的目标增益。接着,在ST1040中,第二层编码单元105将子带计数值m增值1。接着,在ST1050中,第二层编码单元105判定是否为m<M。在ST1050中,在判定为m<M时(ST1050 “是”),第二层编码单元105使处理步骤返回到ST1030。另一方面,在ST1050中,在判定不为m< M时(ST1050 “否”),在ST1060中,增益向量构成单元153利用M个目标增益构成一个增益向量。接着,在ST1070中,增益向量编码单元154将由增益向量构成单元153构成的增益向量作为目标值进行量化,生成增益编码信息。接着,在ST1080中,复用单元155将由形状向量编码单元152生成的形状编码信息与由增益向量编码单元154生成的增益编码信息复用。图4是表示形状向量编码单元152内部的结构的方框图。在图4中,形状向量编码单元152包括形状向量码本521、互相关计算单元522、 自相关计算单元523、搜索单元524、以及目标增益计算单元525。形状向量码本521存储了多个表示第一层误差变换系数的形状的形状向量候补, 基于由搜索单元524输入的控制信号,将形状向量候补依序输出到互相关计算单元522和自相关计算单元523。另外,一般而言,形状向量码本既有采用实际地确保存储区域来存储形状向量候补的形态的情况,也有根据预先规定的处理步骤构成形状向量候补的情况。在后者的情况下,无需实际地确保存储区域。在本实施方式中采用哪种形状向量码本都可以, 但下面以具有如图4所示的、存储有形状向量候补的形状向量码本521为前提进行说明。以下,将形状向量码本521所存储的多个形状向量候补中的第i候补表示为c(i,k)。这里,k 表示用于构成形状向量候补的多个元素中的第k个。互相关计算单元522根据下式(2)计算由子带构成单元151输入的第m子带变换系数与由形状向量码本521输入的第i形状向量候补之间的互相关ccor (i),并将其输出到搜索单元524和目标增益计算单元525。
F(m+\)-F(m)-\ccor(i) = ^ e(m,k). c(i,k) ...(2)
k=Q自相关计算单元523根据下式(3),计算由形状向量码本521输入的形状向量候补 c(i,k)之间的自相关acor (i),并将其输出到搜索单元524和目标增益计算单元525。
F(m+l)-F(m)-lacorii) = ^ c(i,k)2 ._·(3)
k=0搜索单元524利用由互相关计算单元522输入的互相关ccor (i)以及由自相关计算单元523输入的自相关acoHi),计算由下式(4)表示的贡献度A,并直至搜索到贡献度 A的最大值为止,都将控制信号输出到形状向量码本521。搜索单元524将贡献度A是最大时的形状向量候补的索引i。pt作为最优索引输出到目标增益计算单元525,并且将其作为形状编码信息输出到复用单元155。
权利要求
1.解码装置,包括接收单元,接收第一层编码数据和第二层编码数据,所述第一层编码数据是在编码装置中对输入信号进行编码而获得的,所述第二层编码数据是在所述编码装置中对将第一层残差信号变换到频域而计算出的第一层误差变换系数进行编码而获得的,所述第一层残差信号是在所述编码装置中对所述第一层编码数据进行解码所得到的信号与所述输入信号之间的差的信号;第一层解码单元,对所述第一层编码数据进行解码而生成第一层解码信号; 第二层解码单元,对所述第二层编码数据进行解码而生成第一层解码误差变换系数; 时域变换单元,将所述第一层解码误差变换系数变换到时域而生成第一解码误差信号;以及加法单元,将所述第一层解码信号和第一层解码误差信号相加而生成解码信号, 所述第二层编码数据包含第一形状编码信息和第一增益编码信息, 所述第一形状编码信息根据第一形状向量的多个脉冲的位置求出,所述第一形状向量是对所述第一层误差变换系数的一部分的频带,将脉冲配置在振幅值大的多个变换系数的位置而生成的,所述第一增益编码信息是对由多个目标增益构成的一个增益向量进行编码而获得的, 所述多个目标增益是将所述第一形状向量分割为多个子带、将所述第一层误差变换系数的所述一部分的频带分割为多个子带、并对于所述多个子带的每个子带利用所述第一形状向量和所述第一层误差变换系数计算出来的。
2.解码方法,包括接收步骤,接收第一层编码数据和第二层编码数据,所述第一层编码数据是在编码装置中对输入信号进行编码而获得的,所述第二层编码数据是在所述编码装置中对将第一层残差信号变换到频域而计算出的第一层误差变换系数进行编码而获得的,所述第一层残差信号是在所述编码装置中对所述第一层编码数据进行解码所得到的信号与所述输入信号之间的差的信号;第一层解码步骤,对所述第一层编码数据进行解码而生成第一层解码信号; 第二层解码步骤,对所述第二层编码数据进行解码而生成第一层解码误差变换系数; 时域变换步骤,将所述第一层解码误差变换系数变换到时域而生成第一解码误差信号;以及加法步骤,将所述第一层解码信号和第一层解码误差信号相加而生成解码信号, 所述第二层编码数据包含第一形状编码信息和第一增益编码信息, 所述第一形状编码信息根据第一形状向量的多个脉冲的位置求出,所述第一形状向量是对所述第一层误差变换系数的一部分的频带,将脉冲配置在振幅值大的多个变换系数的位置而生成的,所述第一增益编码信息是对由多个目标增益构成的一个增益向量进行编码而获得的, 所述多个目标增益是将所述第一形状向量分割为多个子带、将所述第一层误差变换系数的所述一部分的频带分割为多个子带、并对于所述多个子带的每个子带利用所述第一形状向量和所述第一层误差变换系数计算出来的。
全文摘要
公开了能够对如元音那样的调性较强的信号的频谱的形状进一步正确地进行解码的解码装置和解码方法。在该装置中,包括接收单元,接收第一层编码数据和第二层编码数据;第一层解码单元,对所述第一层编码数据进行解码而生成第一层解码信号;第二层解码单元,对所述第二层编码数据进行解码而生成第一层解码误差变换系数;时域变换单元,将所述第一层解码误差变换系数变换到时域而生成第一解码误差信号;以及加法单元,将所述第一层解码信号和第一层解码误差信号相加而生成解码信号,所述第二层编码数据包含第一形状编码信息和第一增益编码信息。
文档编号G10L19/02GK102411933SQ20121000422
公开日2012年4月11日 申请日期2008年2月29日 优先权日2007年3月2日
发明者山梨智史, 押切正浩, 森井利幸 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1