解码装置、解码方法以及通信终端和基站装置的制作方法

文档序号:2832344阅读:201来源:国知局
专利名称:解码装置、解码方法以及通信终端和基站装置的制作方法
技术领域
本发明涉及对语音信号、音频信号等进行编码/解码的编码装置、解码装 置以及编码/解码方法。
背景技术
将语音信号通过低比特率进行压缩的语音编码技术,对于移动台通信进 行电波等的有效利用十分重要。特别是作为近年来的趋势来讲,对提高通话 语音的质量寄予的期待日益增加,希望能够实现具有高度的真实感的通话服 务。在此所指的真实感为说话者置身的环境(譬如BGM),因此希望对音频 等的语音之外的信号也能够高质量地进行编码。
在将语音信号编码的语音编码技术中,存在G726、 G729等的由ITU-T (International Telecommunication Union Telecommunication Standardization Sector)标准化的方式。这些方式是以窄带信号(300Hz 3.4kHz)为对象,能 够通过8kbit/s - 32kbit/s进行编码。虽然这些方式可以通过低比特率进行编码, 但是作为编码对象的窄带信号的频域最大只到3.4KHz,仍然太窄,因此其质 量不能提高而导致缺乏真实感。
另夕卜,在ITU-T和3GPP ( The 3rd Generation Partnership Project)中存在 对信号频带为50Hz 7kHz的语音进行编码的标准方式(G722、 G.722.1、 AMR-WB等)。虽然这些方式能够通过6.6kbit/s 64kbit/s的比特率进行宽带 语音信号的编码,但是对宽带语音信号高质量地进行编码需要相对提高比特 率。而且从音质的角度来讲,宽带语音与窄带语音相比虽然具有高音质,但 是对要求高度的真实感的服务来讲很难说已经足够。一般来讲,当信号的最大频率达到10 ~ 15kHz左右时,能够得到相当于
FM广播的真实感,而达到20kHz左右时,能够得到相当于CD的质量。对 于具有如此频带的信号,由MPEG (Moving Picture Expert Group )标准化了 的以层3方式和AAC方式等为代表的音频编码方式比较适合。但是,如果将 这些音频编码方式作为语音通信的编码方式来采用的话,需要设定高比特率 以对语音高质量地进行编码。另外还会发生编码迟延变大等的问题。
作为将宽频域的信号通过低比特率高质量地进行编码的方法,具有下述 技术将输入信号的频谱分割为低频部分和高频部分的两个频谱,然后将低 频频谱进行复制并置换高频频镨(将高频频谱通过低频频谱代用),由此降低 整体的比特率(譬如参照专利文献1 )。该技术将较多的比特分配用于低频频 谱的编码而进行高质量的编码,相反,对于高频频谱则进行将编码后的低频 频语进行复制的基本处理,由此可以通过较少的比特分配来进行编码。
另外,作为与该技术类似的技术,还有下述技术对不能充分分配编码 比特的频带,利用其它预定的部分频频频谱信息进行近似处理而提高质量(譬 如参照专利文献2 )。在没有附加信息的情况下对窄带信号进行频带扩展使其 成为宽带信号,因此将窄带信号的低频频谱复制于高频频谱来作为基本处理 (譬如参照专利文献3)。
再者,不论在哪种技术中,都将其它频带的频谱进行复制,并在用于使 频谱包络线变得平滑而进行的增益调整后,将该复制频谱插入需要进行频谱 补充的频带。日本专利申请特表2001-521648号公报 [专利文献2 ]日本专利申请特开平9-153811号公报 [专利文献3 ]日本专利申请特开平9-90992号公报

发明内容
发明需要解决的问题
但是,在语音信号或音频信号的频谱中,低频频谱的动态范围(频谱振 幅的绝对值(绝对振幅)的最大值与最小值的比)比高频频谱的动态范围大 的现象很常见。图1为用来说明该现象的图,其示出了音频信号的频谱的一 例。该频谱为将采样频率32kHz的音频信号通过30ms的长度来进行频率分 析时的对数频谱。如该图所示,频率为0 ~ 8000Hz的低频频语峰值性很强(存在多个锐利 的谱峰),在该频带的频谱的动态范围很大。与此相反,频率为8~ 15000Hz 的高频频谱的动态范围则很小。对具有这样的频谱特性的信号,如果利用传 统的将低频频谱复制于高频频谱的方法的话,即使进行高频频谱的增益调整, 也会出现下述的现象,即在高频频谱中出现不必要的谱峰形状。
图2为表示将如图1所示频谱的低频频谱(1000 ~ 7000Hz)复制,并通 过功率调整而得到高频频i普(10000- 16000Hz)时的全频带频:潜的图。
如该图所示,当进行上述处理时,在高于10000Hz的频带Rl出现了不 必要的谱峰形状。该谱峰为原来的高频频谱中所没有的。而且,在将该频谱 变换到时域而得到的解码信号中,会发生铃响似的噪声,而导致主观质量降 低的问题。如上所述,在将某频带的频谱通过其它频带的频谱代用的技术中, 需要恰当地调整插入频谱的动态范围。
因此,本发明旨在提供一种编码装置、解码装置以及编码/解码方法,在 将某频带的频谱通过其它频带的频谱代用(置换)的技术中,能够恰当地调 整插入频谱的动态范围来提高解码信号的主观质量。
解决该问题的方案
本发明的解码装置采用这种结构,包括变换单元,将对包含于编码装 置所生成的编码中的低频频谱部分的编码进行解码所得的信号变换成频域信 号而生成第一低频频语;变形信息估计单元,使用所述第一低频频谱的频谱 轮廓信息估计变形信息,所述变形信息用于对所述第一低频频谱的振幅进行 一致性限制;限制单元,使用估计出的所述变形信息,对所述第一低频频谱 的振幅进行一致性限制而生成第二低频频镨;以及解码单元,对包含于所述 编码装置所生成的编码中的高频频谱部分的编码基于所述第二低频频谙进行 解码而生成高频频谱,并且对所述编码进行解码,来调整所述高频频谱的振 幅。
本发明还提供一种包括上述解码装置的通信终端装置。 本发明还提供一种包括上述解码装置的基站装置。
本发明还提供一种解码方法,包括变换步骤,将对包含于编码装置所 生成的编码中的低频频谱部分的编码进行解码所得的信号变换成频域信号而 生成第一低频频谱;变形信息估计步骤,使用所述第一低频频语的频语轮廓 信息估计变形信息,所述变形信息用于对所述第一低频频谱的振幅进行一致形信息,对所述第一低频频谱的振 幅进行一致性限制而生成第二低频频谱;以及解码步骤,对包含于所述编码
装置所生成的编码中的高频频谱部分的编码基于所述第二低频频谱进行解码 而生成高频频谱,并且对所述编码进行解码,来调整所述高频频谱的振幅。 发明的有益效果
根据本发明,在将某频带的频谱通过其它频带的频谱代用的技术中,能 够恰当地调整插入频谱的动态范围而提高解码信号的主观质量。


图l是表示音频信号的频谱的示例的图。
图2为表示复制低频频谱并进行功率调整而得到高频频谱时的全频带的 频谱的图。
图3是表示实施方式1的编码装置的主要结构的方框图。
图4是表示实施方式1的频谱编码单元内部的主要结构的方框图。
图5是表示实施方式1的频谱变形单元内部的主要结构的方框图。
图6是表示实施方式1的变形单元内部的主要结构的方框图。
图7是表示实施方式1的通过变形单元而得到的变形频谱的例子的图。
图8是表示实施方式1的变形单元的其它变化形式的结构的方框图。
图9是表示实施方式1的分层解码装置的主要结构的方框图。
图IO是表示实施方式1的频谱解码单元内部的主要结构的方框图。
图11是表示用于说明实施方式2的频谱编码单元的方框图。
图12是表示实施方式2的频谱编码单元的其它变化形式的结构的方框图。
图13是表示实施方式2的频谱解码单元的主要结构的方框图。 图14是表示实施方式3的频谱编码单元的主要结构的方框图。 图15是表示用于说明实施方式3的变形信息估计单元的方框图。 图16是表示实施方式3的变形单元的主要结构的方框图。 图17是表示实施方式3的频谱解码单元的主要结构的方框图。 图18是表示实施方式4的分层编码装置的主要结构的方框图。 图19是表示实施方式4的频镨编码单元的主要结构的方框图。 图20是表示实施方式4的分层解码装置的主要结构的方框图。图21是表示实施方式4的频谱解码单元的主要结构的方框图。
图22是表示实施方式5的频谱编码单元的主要结构的图。
图23是表示实施方式5的变换信息估计单元的主要结构的方框图。
图24是表示实施方式5的频谱解码单元的主要结构的图。
图25是用于说明实施方式6的频谱变形方法的图。
图26是表示实施方式6的频谱变形单元内部的主要结构的方框图。
图27是用于说明变形频镨的生成方法的图。
图28是用于说明变形频谱的生成方法的图。
图29是表示实施方式6的频谱变形单元内部的主要结构的方框图。
具体实施例方式
以下,参照附图详细说明本发明的实施方式。 (实施方式1 )
图3是表示本发明实施方式1的分层编码装置100的主要结构的方框图。 在此,以编码信息具有由多层构成的分层结构的情形,也就是进行分层编码 (可扩展性编码)的情形为例来说明。
分层编码装置100的各个部分,随着信号的输入执行以下动作。
下采样单元101根据输入信号生成低采样率的信号,并提供给第一层编 码单元102。第一层编码单元102对从下采样单元101输出的信号进行编码。 将通过第一层编码单元102得到的编码符号提供给复用单元103和第一层解 码单元104。然后,第一层解码单元104根据第一层编码单元102输出的编 码符号生成第一层解码信号Sl。
另一方面,延迟单元105将预定长度的延迟赋予输入信号。该延迟用于 校正在下采样单元101、第一层编码单元102以及第一层解码单元104中产 生的时间延迟。频谱编码单元106利用由第一层解码单元104生成的第一层 解码信号si ,对由延迟单元105输出的、经延迟预定时间的输入信号S2进 行频谱编码,并将生成的编码符号输出到复用单元103。
复用单元103对由第一层编码单元102求出的编码符号与由频语编码单 元106求出的编码符号进行复用,并将其作为输出编码符号输出到编码装置 100的外部。
图4是表示上述频谱编码单元106内部的主要结构的方框图。该频谱编码单元106主要包括频域变换单元111、频谱变形单元112、 频域变换单元113、扩展频带频谱编码单元114以及复用单元115。
频语编码单元106从第一层解码单元104接收具有有效信号频带为 05k<FL ( k为各子带的频率)的第一信号Sl,并且从延迟单元105接收具有 有效信号频带为0^k<FH (其中FL<FH)的第二信号S2。频镨编码单元106 利用第一信号Sl的频带0^k<FL的频谱来估计第二信号S2的频带FL^k<FH 的频谱,并对该估计信息进行编码并输出。
频域变换单元111对输入的第一信号SI进行频率变换,计算出低频频谱 的第一频谱S1 (k)。另一方面,频域变换单元113对输入的第二信号S2进 行频率变换,计算出宽带的第二频谱S2 (k)。在此所述的频率变换的方法适 用离散傅立叶变换(DFT)、离散余弦变换(DCT)以及变形离散余弦变换 (MDCT)等。另外,Sl (k)为第一频语的频率k的子带的频谱、S2 (k) 为第二频谱的频率k的子带的频谱。
频谱变形单元112将第 一频谱S l(k)进行各种各样的变形来改变第 一频谱 的动态范围,从而调查作为恰当的动态范围的变形方法。而且,将有关该变 形的信息(变形信息)进行编码并提供给复用单元115。有关该频谱变形处 理的详细内容将在后面叙述。另外,频镨变形单元112将动态范围变得恰当 的第一频谱Sl(k)输出到扩展频带频语编码单元114。
扩展频带频谱编码单元114将第二频带S2(k)作为参照信号,估计应当包 含于第一频谱Sl(k)的高频(FI^k<FH)的频语(扩展频带频谱),并将有关 该估计频谱的信息(估计信息)进行编码提供给复用单元115。在此,扩展 频带频谱的估计基于变形后的第一频谱Sl,(k)进行。
然后,复用单元115将由频谱变形单元112输出的变形信息的编码符号 以及由扩展频带频谱编码单元114输出的有关扩展频带频谱的估计信息的编 码符号进行复用并输出。
图5是表示上述频谱变形单元112内部的主要结构的方框图。
频谱变形单元112对第一频谱S1 (k)施加变形,该变形为4吏第一频谱 Sl (k)的动态范围最接近于第二频谱S2 (k)的高频频谱(FI^k<FH)的动 态范围的变形。接下来,将此时的变形信息进行编码并输出。
緩沖单元121暂时存储输入的第一频谱S1 (k),并根据需要将第一频谱 Sl (k)提供给变形单元122。变形单元122按照下述的步骤,对第一频语S1 (k)进行各种各才羊的变 形来生成第一频谱S1, (j, k),并将其提供给子带功率计算单元123。在此, j为用来识别各种变形处理的索引。
子带功率计算单元123将变形第一频谱S1, (j, k)的频域分割成多个子 带,并求出预定范围的子带的功率(子带功率)。譬如,将求解子带功率的范 围设定为FlI^k<FlH时,对该带宽进行N分割时的子带宽BWS表示为下式 (式l)。
BWS= (F1H-F1L+1 ) /N (式l) 因此,第n子带的最小频率FlL (n)以及最大频率F1H (n)分别表示 为(式2)和(式3)。
F1L (n) =FlL+n-BWS (式2)
F1H (n) =F1L+ (n+l ) 'BWS-1 (式3)
其中,n取0 N-l的4直。
此时,子带功率P1 (j, n)如下式(式4)所示计算。
層(")
》r(M)2
pi(乂,一^^- (式4)
蕭s
另外,也可以如下式(式5)所示计算包含于子带的频谱的平均值。
2>r(M)2
w)_ (式5)
5薦
然后将如上所述求出的子带功率P1 (j, n)提供给方差计算单元124。 方差计算单元124为了表示子带功率P1 (j, n)的偏差程度,根据下式 (式6)来计算出方差cj12 (j)。
"12(力=H(PlC/,")—尸1膨朋G.))2 (式6 )
在此,Plmean (j)表示子带功率P1 (j, n)的平均值,并如下式(式7) 计算出来。
尸i膨朋GO = (式7)然后将如上所述计算出来的表示变形信息j的子带功率的偏差程度的方 差cj12 (j )提供给搜索单元125。
子带功率计算单元126以及方差计算单元127,进行与上述子带功率计 算单元123以及方差计算单元124所进行的一系列的处理相同的处理对输 入的第二频谱S2(k),计算出表示子带功率的偏差程度的方差a2"j)。不过, 子带功率计算单元126以及方差计算单元127进行的处理与上述处理的不同 处如下所述。也就是,将计算第二频谱S2 (k)的子带功率的规定范围设定 为F2I^k〈F2H。在此,因为有必要使第一频谱的动态范围接近第二频i普的高 频频谱的动态范围,所以设定F2L以满足FI^F2L〈F2H。而且,没有必要使 对应于第二频谱的子带的数量与第一频谱的子带的数量N相一致。不过,设 定第二频谱的子带数使第一频语的子带宽与第二频谱的子带宽基本一致。
搜索单元125通过搜索来确定第一频谱的子带的方差cj12 (j),使第一频 谱的子带的方差ol2 (j)与第二频谱的子带的方差o22 (j)最为接近。具体 来讲,搜索单元125对所有的变形候补0^j〈J计算出第一频谱的子带的方差 cj12(j),将该计算值与第二频谱的子带的方差cr22 (j)相比较,确定两者最 为接近时的j的值(最优变形信息jopt),并将该jopt输出到频谱变形单元112 的外部以及变形单元128。
变形单元128生成对应于该最优变形信息jopt的经变形的第一频谱Sl, (jopt, k),并将其输出到频谱变形单元112的外部。将最优变形信息jopt 传输到复用单元115,并传输经变形的第一频谱S1, (jopt, k)到扩展频带频 谱编码单元114。
图6是表示上述变形单元122内部的主要结构的方框图。而且,变形单 元128的内部结构基本上与变形单元122相同。
正号/负号提取单元131求出第一频谱的各个子带的符号信息sign (k), 并输出到正号/负号赋予单元134。
绝对值计算单元132对第一频语的各个子带计算振幅的绝对值,并将该 值提供给指数值计算单元133。
指数变量表格135记录用于第一频语的变形的指数变量a(j)。包含于该 表格的变量中的j所对应的值从指数变量表格135输出。具体来讲,在指数 变量表格135中,譬如记录着由4个指数变量组成的指数变量候补,即指数 变量a(j) = {1.0, 0.8, 0.6, 0.4},根据由搜索单元125指定的索引j,选择其中l个指数变量a (j),并提供给指数值计算单元133。
指数值计算单元133利用从指数变量表格135输出的指数变量,计算从
绝对值计算单元132输出的频谱(绝对值)的指数值,也就是计算出对各个
子带的振幅绝对值进行a (j)次乘幂所得的值。
正号/负号赋予单元134,对指数值计算单元133输出的指数值,赋予通
过正号/负号提取单元131于先前求出的符号信息sign (k),作为变形第一频
语Sl,(j, k)输出。
因此,由变形单元122输出的变形第一频镨Sl,(j, k)如下式(式8)表示。<formula>formula see original document page 12</formula>
图7为表示通过上述变形单元122(或变形单元128)得到的变形频谱的 例子的图。
这里,以取指数变量a(j) = U.0, 0.6, 0.2}的情形为例进4亍i^明。 另外,在此为了容易地比较各个频谱,将a(j) = 1.0时的频谱S71向上移动 了 40dB,将a(j) =0.6时的频谱S72向上移动了 20dB。从该图可以得知, 通过指数变量a (j)能够改变频谱的动态范围。
如上所述,根据本实施方式的编码装置(频i普编码单元106),使用通过 第一信号(0^k<FL)求出的第一频谱,估计第二信号(0^k<FH)求出的第二 频谱的高频部分(FI^k<FH),并对估计信息进行编码时,不直接使用第一频 谱而是对第一频谱施加变形后再进行上述估计。此时,将表示如何进4亍变形 的信息(变形信息)也一并进行编码,传输到解码端。
对第一频镨施加变形的具体方法为,将第一频谱分割成子带,对每个子 带求出包含于各个子带的频谱的绝对振幅的平均(子带平均振幅),将第一频 谱变形以使对这些平均振幅进行统计处理而求出的方差与根据第二频谱的高 频部分的频谱同样求出的子带平均振幅的方差最为接近。也就是,将第一频 谱变形以使第 一频谱的绝对振幅的平均摆动范围与第二频谱的高频频谱的绝 对振幅的平均摆动范围成为相等的值。而且,对表示该具体的变形方法的变 形信息进行编码。另外,也可以利用包含于各个子带的频谱的功率来代替子 带平均振幅。
进一步具体地说,上述具体的变形方法就是通过对第一频谱的频谱进行a乘幂(0^^1),来控制子带内的频谱的绝对振幅的偏差(摆动)。而且,将 有关所使用的a的信息传输到解码端。
通过采用上述结构,即使当第 一频谱的动态范围与第二频谱的高频部分 的动态范围大小不同时,也能够恰当地调整估计频谱的动态范围,由此提高 解码信号的主观质量。
另外,在上述的结构中,通过将第一频谱整体进行a乘幂(OSxSl ),对 频谱的振幅施加一致性限制。由此能够钝化锐利(陵峭')的谙峰。另外,譬 如只是对预定值以上的谱峰进行消峰而变形时,有可能导致频谱变得不连续 而产生奇怪的噪声,但是通过采用上述的结构,则能够使频谱变得平滑而防 止发生奇怪的噪声。
另外,在本实施方式中,以作为表示频语的绝对振幅的偏差的程度(摆 动幅度)的指标使用方差时的情形为例进行了说明,但本发明并不只限于此, 譬如也可以适用标准偏差等其他的指标。
另外,在本实施方式中,以在编码装置100的变形单元122 (或变形单 元128)中使用指数函数的情形为例进行了说明,但是也可以使用以下示出 的方法。
图8是表示变形单元的其他变化形式(变形单元122a)的结构的方框图。 对于与变形单元122 (或变形单元128)相同的构成要素赋予相同的编号,并 省略其说明。
在上述的变形单元122 (或变形单元128)中,因为使用指数函数,所以 计算量具有变大的趋势。于是,通过不使用指数函数而变化频谱的动态范围 的方法来避免计算量的增加。
绝对值计算单元132计算输入的第一频i普Sl (k)的各个频谱的绝对值, 并将其输出到平均值计算单元142以及变形频i普计算单元143。平均值计算 单元142按照下式(式9 )来计算频谱的绝对值的平均值Slmean。
<formula>formula see original document page 13</formula> (式9)
乘数表格144中记录着用于变形频谱计算单元143的乘数的候补,基于 搜索单元125指定的索引选择一个乘数,并输出到变形频谱计算单元143。 在此,假设乘数表格中记录着乘数g (j) = U.O, .0.9, 0.8, 0.7}的4个候补。变形频谱计算单元143利用由绝对值计算单元132输出的第一频谱的绝 对值与由乘数表格144输出的乘数g (j),将变形频谱S1, (k)的绝对值通过 下式(式10)计算出来,并输出到正号/负号赋予单元134。
a "| = g(力 &W| + (1 - . (式10 )
(k)赋予由变形频谱计算单元143输出的变形频谱S1, (k)的绝对值,生成
并输出由下式(式ii)表示的最后的变形频谱sr (k)。 W,"i/禍何M)1 (式ii)
另外,在本实施方式,以变形单元包括正号/负号提取单元、绝对值计算 单元、正号/负号赋予单元的情形为例进行了说明,但当输入的频语恒定为正 时,不需要这些结构。
接下来,详细说明分层解码装置150的结构,该解码装置能够对由上述 分层编码装置IOO生成的编码符号进行解码。
图9是表示本实施方式的分层解码装置150的主要结构的方框图。 分离单元151对输入的编码符号进行分离处理,并生成用于第一层解码 单元152的编码符号S51与用于频谱解码单元153的编码符号S52。第一层 解码单元152利用通过分离单元151得到的编码符号解码出信号频带0^k<FL 的解码信号,并将该解码信号S53提供给频谱解码单元153。另外,第一层 解码单元152的输出同时连接于解码装置150的输出端子。由此,当需要输 出由第一层解码单元152生成的第一层解码信号时,可以经由该输出端子输 出。
由分离单元151分离出的编码符号S52与由第一层解码单元152输出的 第一层解码信号S53提供给频谱解码单元153。频谱解码单元153进行后述 的频语解码,生成信号频带O^^FH的宽带解码信号,并将其输出。在频谱 解码单元153中,将由第一层解码单元152提供的第一层解码信号S53作为 第一信号并进行处理。
图IO是表示上述频谱解码单元153内部的主要结构的方框图。 该频谱解码单元153输入编码符号S52以及第一层解码信号S53 (有效 频域为0^k<FL的第一信号)。分离单元161从输入的编码符号S52中,将由上述的编码端的频谱变形 单元112生成的变形信息与扩展频带频语编码信息分离开来,将变形信息输 出到变形单元162,将扩展频带频谱编码信息输出到扩展频带频谱生成单元 163。
频域变换单元164对输入的时域信号的第一层解码信号S53进行频率变 换而计算第一频谱S1 (k)。该频率变换的方法使用离散傅立叶变换(DFT)、 离散余弦变换(DCT)以及变形离散余弦变换(MDCT)等。
变形单元162基于由分离单元161提供的变形信息,对由频域变换单元 164提供的第一频谱S1 (k)施加变形来生成变形第一频语S1, (k)。另外, 该变形单元162内部的结构与业已说明的编码端的变形单元122 (参照图6) 一样,因此省略对其说明。
扩展频带频镨生成单元163,利用变形后的第一频谱S1, (k),生成应当 包含于第一频谱Sl ( k )的扩展频带FI^k<FH的第二频谱的估计值S2" ( k ), 并将该第二频谱的估计值S2" (k)提供给频谱构成单元165。
频谱构成单元165将由频域变换单元164提供的第一频语S1 (k)与由 扩展频带频谱生成单元163提供的第二频谱的估计值S2" (k)结合起来生成 解码频谱S3 (k)。该解码频谱S3 (k)如下式(式12)所示。
该解码频谱S3 (k)提供给时域变换单元166。
时域变换单元166将在解码频谱S3 (k)被变换为时域信号后,根据需 要进4亍开窗(windowing)以及叠力口 ( superposition addition)等处J里,以避免 在帧之间发生不连续的现象,并输出最后的解码信号。
如上所述,根据本实施方式的解码装置(频谱解码单元153),能够对由 本实施方式的编码装置编码的信号进^f亍解码。 (实施方式2 )
在本发明的实施方式2中,利用作为内部状态持有第一频谱的音调滤波 器来估计第二频谱,并对该音调滤波器的特性进行编码。
本实施方式的分层编码装置的结构与实施方式1所示的分层编码装置相 同,因此利用图11的方框图来说明结构的不同之处,即频谱编码单元201。 并且,对于与实施方式1所示的频谱编码单元106 (参照图4)相同的构成要
(式12)素赋予相同的编号,并省略对其说明。
内部状态设定单元203使用通过频谱变形单元112生成的变形第一频谱 Sl, (k)来设定用于滤波单元204的内部状态S (k)。
滤波单元204基于由内部状态设定单元203设定的内部状态S (k)与由 延迟系数设定单元206提供的延迟系数T来进行滤波,而计算出第二频谱的 估计值S2"(k)。另外,本实施方式对使用通过下式(式13)表示的滤波器 的情形进行说明。
= ^- (式13)
在此,T表示为由延迟系数设定单元206提供的系数,而假设M-1。如 下式(式14 )所示,滤波单元204的滤波处理通过主要使用按照升序以降低 了频率T的频谱为中心乘上相应的系数(3i并进行相加,来计算出估计值。
,=土/ ,.雄—r—0 (式14)
!■=-1
按照该式的处理在FI^k〈FH的范围内进行。在此,S(k)表示滤波器 的内部状态。此时,计算出的S (k)(其中FI^k<FH)作为第二频谱的估计 值S2" ( k )使用。
搜索单元205计算由频域变换单元113提供的第二频谱S2 (k)与由滤 波单元204提供的第二频谱的估计值S2" (k)的相似程度。
另外,该相似程度存在各种各样的定义,但是在本实施方式中,使用以 下的相似程度首先将滤波器系数^以及(3,视为0,基于最小平方差(a minimum square error)所定义的、按照下式(式15 )来计算出的相似程度。
/ra-l 、2
冊一' 》2W.S"2W 五=5>2时—-^ (式15 )
根据该方法,在计算出最优的延迟系数T之后确定滤波器系数(3i。在此 E表示S2 (k)与S2" (k)之间的最小平方差。另外,上式(式15)的右边 第一项为与延迟系数T无关的固定值,因此能够搜索出生成使(式15)的右 边第二项为最大的S2" (k)的时延迟系数T。本实施方式中,将(式15)的右边第二项称为相似程度。
延迟系数设定单元206将包含于预先规定的搜索范围TMIN ~ TMAX的 延迟系数T依次输出到滤波单元204。因此,在滤波单元204中,当每次由 延迟系数设定单元206提供延迟系数T时,都在具有FL^k<FH的范围的S( k ) 归零后进行滤波,而搜索单元205则每次都计算出相似程度。搜索单元205 从TMIN ~ TMAX的范围中确定使计算出的相似程度为最大时的系数Tmax, 将该系数Tmax提供给滤波器系数计算单元207、频谱轮廓编码单元208以及 复用单元115。
滤波器系数计算单元207利用由搜索单元205提供的系数Tmax求出滤 波器系数(3i。在此,所求滤波器系数Pi使按照下式(式16)的平方差E成为<formula>formula see original document page 17</formula>(式16)
滤波器系数计算单元207将多个pi的组合预先作为表格来持有,确定使 上式(式16)的平方差E成为最小的Pi的组合,将该编码输出到复用单元115, 并将滤波器系数Pi提供给频语轮廓编码单元208。
频谱轮廓编码单元208利用由内部状态设定单元203提供的内部状态S (k)、由搜索单元205提供的延迟系数Tmax以及由滤波器系数计算单元207 提供的滤波器系数l3i,进行滤波处理,求出频带为FI^k〈FH的第二频谱的估 计值S2"(k)。接下来,频谱轮廓编码单元208利用第二频语的估计值S2" (k)和第二频谱S2 (k)对频语轮廓的调整系数进行编码。
在本实施方式中,说明了将该频谱轮廓信息用每个子带的频语功率来表 示的情形。此时、第j个子带的频谱功率如下式(式17)所示。 朋(乂)
<formula>formula see original document page 17</formula> (式17)
在此,BL (j)表示第j个子带的最小频率,BH (j)表示第j个子带的 最大频率。视如此求出的第二频谱的子带的频谱功率为第二频镨的频率轮廓 信息。
同样,频语轮廓编码单元208按照下式(式18 )计算第二频语的估计值 S2" (k)的子带的频谱功率B" (j),并按照下式(式19)计算每个子带的变化量V (j)。
肪(力
b"(7)= xs'雄)2 (式i8)
(式19)
接下来,频谱轮廓编码单元208对变化量V (j)进行编码并将该编码送 到复用单元115。
复用单元115将以下的信息复用并输出由频谱变形单元112得到的变 形信息;由搜索单元205得到的最优延迟系数Tmax的信息;由滤波器系数 计算单元207得到的滤波器系数的信息;由频谱轮廓编码单元208得到的频 谱轮廓调整系数的信息。
如上所述,根据本发明的实施方式,利用具有作为内部状态的第一频i普 的音调滤波器来估计第二频镨,因此只需要对该音调滤波器的特性进行编码, 就能够实现低比特率。
在本实施方式中,虽然说明了包括频域变换单元的情形,但是这些结构 为将时域作为输入时所需的结构,当直接输入频镨时,则无需频域变换单元。
另外,本实施方式虽然在上述(式13)中以M= 1的情形为例进行了说 明,但是M的值不只限定为1,可以使用O以上的整数。
另外,本实施方式虽然以音调滤波器利用上述(式13 )的滤波器函数(传 递函数)的情形为例进行了说明,但是音调滤波器也可以为一次的音调滤波 器。
图12是表示实施方式的频谱编码单元201的其它变化形式(频谱编码单 元201a)的结构的方框图。并且,对于与频谱编码单元201相同的构成要素 赋予相同的编号,并省略对其说明。
用于滤波单元204的滤波器如下式(式20) —样简略。
P(z)-:^f (式20) l一z
该式为上述(式13)中,取M-O、 (3。= 1时的滤波器函数。 通过该滤波器生成的第二频谱的估计值S2" (k)可以利用下式(式21 ),将离开T的内部状态S (k)的低频频谱依次复制而求出。 ,=举-r) (式21)
另外,搜索单元205与上述同样地搜索使上述(式15)成为最小的系数 T而确定最优的系数Tmax。如此求出的系数Tmax提供给复用单元115。
通过采用上述结构,用于滤波单元204的滤波器的结构可以变得简便, 并无需滤波器系数计算单元207,因此通过较少的计算量来进行第二频谱的 估计。也就是,根据该结构,编码装置的结构变得简便,因此能够减少编码 处理的计算量。
接下来,详细说明解码端的频谱解码单元251的结构,该频谱解码单元 能够对由上述频谱编码单元201 (或频谱编码单元201a)生成的编码符号进 行解码。
图13是表示本实施方式的频语解码单元251的主要结构的方框图。并且, 该频谱解码单元251具有与实施方式1所示的频谱解码单元153(参照图10) 相同的基本结构,对于相同的构成要素赋予相同的编号,并省略对其说明。 不同之处在于扩展频带频谱生成单元163a的内部结构。
(k)来设定用于滤波单元253的滤波器的内部状态S (k)。
滤波单元253根据由编码端的频谱编码单元201 (201a)生成的编码符 号,经由分离单元161而得到有关滤波器的信息。具体来讲,使用频谱编码 单元201时,得到延迟系数Tmax以及滤波器系数使用频谙编码单元201a 时,只得到延迟系数Tmax。而且,滤波单元253将由变形单元162生成的变 形第一频谱S1, (k)作为滤波器的内部状态S (k),基于得到的滤波器信息 进行滤波而计算出解码频谱S" (k)。该滤波方法有赖于编码端的频谱编码单 元201 (201a)所用的滤波器函数,使用频语编码单元201时,在解码端也按 照上述(式13 )来进行滤波,而使用频谱编码单元201a时,在解码端也按照 上述(式20)来进行滤波。
频谱轮廓解码单元254基于由分离单元161提供的频谱轮廓信息来解码 频谱轮廓信息。本实施方式以使用每个子带的变化量的量化值Vq (j)的情 形为例来说明。
频语调整单元255在由滤波单元253得到的解码频谱S" (k)上,按照下式(式22)乘上由频谱轮廓解码单元254得到的每个子带的变化量的量化 值Vq(j),由此调整频谱S" (k)的频域FL^k〈FH的频谱形状,而生成第二 频谱的估计值S2" (k)。
<formula>formula see original document page 20</formula>(式22)
在此,BL(j)以及BH(j)分别表示第j个子带的最小频率、最大频率。 将按照上述(式22)计算出的第二频谱的估计值S2" (k)提供给频谱构成单 元165。
频谱构成单元165如在实施方式1所述,将第一频谱S1 (k)与第二频 镨的估计值S2" (k)结合起来生成解码频谱S3 (k),并提供给时域变换单元 166。
如上所述,根据本实施方式的解码装置(频谱解码单元251 ),能够对由 本实施方式的编码装置编码的信号进行解码。 (实施方式3 )
图14是表示本发明实施方式3的频谱编码单元的主要结构的方框图。在 图14中,与图4具有相同名称以及相同编号的模块具有相同的功能,因此省 略对其说明。在本实施方式3中,基于编码端、解码端共用的信息来调整频 谱的动态范围。因此,无需输出表示调整频谱的动态范围的动态范围系数的 编码符号。因为无需输出将表示调整频谱的动态范围的动态范围系数的编码 符号,所以能够降低比特率。
图14中的频镨编码单元301在频域变换单元111与扩展频带频谙编码单 元114之间,具有动态范围计算单元302、变形信息估计单元303以及变形 单元304来代替图4中的频谱变形单元112。实施方式1中的频谱变形单元 112将第一频谱Sl(k)进行各种各样的变形来改变第一频谱的动态范围,从而 调查作为恰当的动态范围的变形方法,并将该变形信息进行编码且输出。另 一方面,本实施方式3则基于编码端以及解码端共用的信息来进行该变形信 息的估计,并根据该估计变形信息来进行第一频谱S1 (k)的变形。
因此,本实施方式3具有动态范围计算单元302、变形信息估计单元303 以及根据该估计变形信息来进行第一频语S1 (k)变形的变形单元304来代 替频谱变形单元112。另外,变形信息通过在频谱编码单元以及频语解码单 元的内部分别进行的估计而求出,无需由频谱编码单元301将变形信息作为编码符号输出,因此无需在图4的频谱编码单元106中设置的复用单元115。
由频域变换单元111输出第 一频谱Sl( k),提供给动态范围计算单元302 以及变形单元304。动态范围计算单元302将第一频谱S1 (k)的动态范围量 化,并将其结果作为动态范围信息输出。与实施方式l同样,量化动态范围 的方法将第一频谱的频域分割成多个子带,求出规定范围的子带的功率(子 带功率),计算出该子带功率的方差,并将该方差作为动态范围信息输出。
接下来,使用图15说明变形信息估计单元303。变形信息估计单元303 从由动态范围计算单元302输入动态范围信息,并提供给切换单元305。切 换单元305基于所述动态范围信息,从存储于变形信息表格306的估计变形 信息的候补中选择1个估计变形信息并输出。变形信息表格306中记录着取 0~ 1之间的值的多个估计变形信息的候补,这些候补通过学习而预先确定, 以对应于动态范围信息。
图16是表示变形单元304的主要结构的方框图。与图6具有相同名称以 及相同编号的模块具有相同的功能,因此省略对其说明。图16的变形单元 304中的指数值计算单元307按照由变形信息估计单元303提供的估计变形 信息(取0 ~ 1之间的值),将由绝对值计算单元132输出的频谱的绝对振幅 的指数值,即通过估计变形信息进行乘幂的值,输出到正号/负号赋予单元 134。正号/负号赋予单元134,对指数值计算单元307输出的指数值,赋予通 过正号/负号提取单元131于先前求出的符号信息,作为变形第一频谱输出。
如上所述,根据本实施方式的编码装置(频谱编码单元301),使用通过 第一信号求出的第一频谱(OSk<FL),估计从第二信号求出的第二频谙 (0^k<FH)的高频部分(FI^k<FH),并将估计信息进行编码时,不直接使 用第一频谱而是对第一频谱施加变形后再进行上述估计,由此能够恰当地调 整估计频谱的动态范围来提高解码信号的主观质量。此时,对于表示如何进 行变形的信息(变形信息),因为基于在解码端、编码端共用的信息(本实施 方式中为第一频谙)来确定变形信息,所以无需将有关变形信息的编码符号 传输到解码装置,因此能够降低比特率。
另外,变形信息估计单元303中,也可以使用将第一频谱的动态范围信 息作为输入值,将估计变形信息作为输出值的映射函数,来代替利用变形信 息表格306而建立第一频谱的动态范围信息与估计变形信息的对应关系。此 时,作为函数输出值的估计变形信息限定取0 1之间的值。图17是表示本实施方式3的频谱解码单元353的主要结构的方框图。在 该结构中,与图IO具有相同名称以及相同编号的模块具有相同的功能,因此 省略对其说明。在频域变换单元164与扩展频带频镨生成单元163之间,具 有动态范围计算单元361、变形信息估计单元362以及变形单元363。图10 中的变形单元162输入由编码端的频语变形单元112生成的变形信息,并基 于该变形信息对由频域变换单元164提供的第一频谱S1 (k)施加变形。相 对于此,本实施方式3则与上述频谱编码单元301相同基于编码端以及解 码端的共用的信息来进行该变形信息的估计,并根据该估计变形信息来进行 第一频谱S1 (k)的变形。
因此,本实施方式3具有动态范围计算单元361、变形信息估计单元362 以及变形单元363。另外,与上述频谱编码单元301相同,变形信息通过在 频谱解码单元的内部进行的估计而求出,输入的编码符号中未包含变形信息, 因此无需图10中的设置于频谱解码单元153的分离单元161。
由频域变换单元164输出第 一频镨Sl( k),提供给动态范围计算单元361 以及变形单元363。有关动态范围计算单元361、变形信息估计单元362以及 变形单元363的接下来的操作,与业已说明的编码端的频谱编码单元301(参 照图14)内的动态范围计算单元302、变形信息估计单元303以及变形单元 304相同,因此省略对其说明。另外,变形信息估计单元362中的变形信息 表格记录着与频谱编码单元301中的变形信息估计单元303中的变形信息表 格306相同的估计变形信息的候补。
另外,有关扩展频带频谱生成单元163、频谱构成单元165以及时域变 换单元166的操作与实施方式1的图IO示意的相同,省略对其说明。
如上所述,根据本实施方式的解码装置(频谱解码单元353 ),能够对由 本实施方式的编码装置编码的信号进行解码,由此能够恰当地调整估计频谱 的动态范围来提高解码信号的主观质量。
另外,本实施方式中,估计变形信息通过变形信息估计单元303求出, 但是也可以将该估计变形信息适用于实施方式1的图4示意的频语编码单元 106,并将该估计变形信息提供给频谱变形单元112,频谱变形单元112将由 变形信息估计单元303提供的估计变形信息作为基准,将其附近的变形信息 从指数变量表格135中选择出来,并从该限定的变形信息中通过搜索单元125 确定最恰当的变形信息。在该结构中,最终所选择的变形信息的编码符号表示为对于作为上述基准的估计变形信息的相对值。如此能将正确的变形信息 进行编码并向解码单元传输,因此能够得到维持解码信号的主观质量并减少 表示变形信息的比特数的效果。 (实施方式4)
本发明的实施方式4中,基于有第一层编码单元提供的音调增益,确定
输出给频谱编码单元内的变形单元的估计变形信息。
图18是表示本实施方式的分层编码装置400的主要结构的方框图。在图
18中,与图3具有相同名称以及相同编号的模块具有相同的功能,因此省略 对其i兑明。
本实施方式4中的分层编码装置400,将由第一层编码单元402求出的 音调增益提供给频镨编码单元406。具体来讲,在第一层编码单元402中, 在由第一层编码单元402固有的自适应码本(图中未示出)输出的自适应码 矢量上所乘的自适应码矢量增益,作为音调增益输出,并输入给频谱编码单 元406。该自适应码矢量增益具有当输入信号的周期性强时取大值,当输入 信号的周期性弱时取小值的特点。图19是表示本实施方式4的频谱编码装 置406的主要结构的方框图。在图19中,与图14具有相同名称以及相同编 号的模块具有相同的功能,因此省略对其说明。变形信息估计单元411使用 由第一层编码单元402提供的音调增益来输出估计变形信息。变形信息估计 单元411具有上述图15的变形信息估计单元303相同的结构。不过,变形信 息表格是对应音调增益而设计的。另外,在本实施方式中,也可以采用利用 映射函数的结构来代替利用变形信息表格的结构。
如上所述,根据本实施方式的编码装置(频谱编码单元406),能够考虑 输入信号的周期性而恰当地调整估计频镨的动态范围,来提高解码信号的主 观质量。
接下来,详细说明分层解码装置450的结构,该解码装置能够对由上述 分层编码装置400生成的编码符号进行解码。
图20是表示本实施方式的分层解码装置450的主要结构的方框图。在图 20中,由第一层解码单元452输出的音调增益提供给频谱解码单元453。在 第一层解码单元452中,在由第一层解码单元452固有的自适应码本(图中 未示出)输出的自适应码矢量上所乘的自适应码矢量增益,作为音调增益输 出,并输入给频谱解码单元453。图21是表示本实施方式4的频谱解码单元453的主要结构的方框图。变 形信息估计单元461使用由第一层解码单元452提供的音调增益来输出估计 变形信息。变形信息估计单元461具有于上述图15的变形信息估计单元303 相同的结构。不过,变形信息表格与变形信息估计单元411中的一样,是对 应音调增益而设计的。另外,在本实施方式中,也可以釆用利用映射函数的 结构来代替利用变形信息表格的结构。
如上所述,根据本实施方式的解码装置(频谱解码单元453 ),能够对由 本实施方式的编码装置编码的信号进行解码,并能够考虑输入信号的周期性 而恰当地调整估计频谱的动态范围,来提高解码信号的主观质量。
另外,也可以采用除了音调增益同时使用音调周期(通过搜索第一层编 码单元402中固有的自适应码本的结果而得到的延迟)来估计变形信息的结 构。此时,通过利用音调周期,能够进行分别对音调周期短的语音(譬如女 性的声音)以及音调周期长的语音(譬如男性的声音)恰当的变形信息的估 计,从而提高估计的准确度。
另外,本实施方式中,估计变形信息通过变形信息估计单元411求出, 但是也可以与实施方式3相同将该估计变形信息适用于实施方式1的图4 示意的频谱编码单元106,并将该估计变形信息提供给频谱变形单元112,频 谱变形单元112将由变形信息估计单元411提供的估计变形信息作为基准, 将其附近的变形信息从指数变量表格135中选择出来,并从该限定的变形信 息中通过搜索单元125确定最恰当的变形信息。在该结构中,最终所选择的 变形信息的编码符号表示为对于作为上述基准的估计变形信息的相对值。如 此能对正确的变形信息进行编码并向解码单元传输,因此能够得到维持解码 信号的主观质量并减少表示变形信息的比特数的效果。 (实施方式5 )
本发明的实施方式5中,基于由第一层编码单元提供的LPC系数,确定 输出到频语编码单元内的变形单元的估计变形信息。
本实施方式5的分层编码装置的结构与上述图18—样。不过,由第一层 编码单元402输出给频语编码单元406的参数为LPC系数而不是音调增益。
实施方式的频谱编码单元406的主要结构为如图22所示的结构。与上述 图19的不同之处在于,提供给变形信息估计单元511的参数为LPC系数而 不是音调增益以及变形信息估计单元511内部的结构。图23是表示本实施方式的变形信息估计单元511的主要结构的方框图。 变形信息估计单元511包括判断表格512、类似程度判断单元513、变形信 息表格514以及切换单元515。变形信息表格514与图15中的变形信息表格 306同样地记录着估计变形信息的候补。不过,该估计变形信息的候补是对 应LPC系数而设计的。判断表格512中记录着LPC系数的候补,判断表格 512与变形信息表格514设有相互对应的关系。也就是,当从判断表4各512 中选择第j个的LPC系数的候补时,适合于该LPC系数候补的估计变形信息 存储为变形信息表格514的第j个。LPC系数具有能够用较少的参数准确地 表现频谱的轮廓(频谱包络)的特点,能够将该频语轮廓与控制动态范围的 估计变形信息对应起来。本实施方式采用了利用该特点的结构。
相似程度判断单元513从判断表格512中求出与第 一层编码单元402提 供的LPC系数最为相似的LPC系数。该相似程度判断中,通过判断表格512, 求出LPC系数之间的距离(失真)、或者求出将LPC系数变换为LSP (Line Spectrum Pair )系数等的其他的参数后的两者的失真,并求出使该失真为最小 时的LPC系数。
表示使失真为最小(即相似程度最大)时的判断表格512中的LPC系数 候补的索引,由相似程度判断单元513输出,并提供给切换单元515。切换 单元515选择该索引表示的估计变形信息的候补,并由变形信息估计单元511输出。
如上所述,根据本实施方式的编码装置(频谱编码单元406),能够考虑 输入信号的频谱轮廓而恰当地调整估计频谱的动态范围,来提高解码信号的 主观质量。
接下来,说明本实施方式5的分层解码装置的结构,该解码装置能够对 由本实施方式5的分层编码装置生成的编码符号进行解码。
本实施方式5的分层解码装置的结构与上述图20—样。不过,由第一层 解码单元452输出给频谱解码单元453的参数为LPC系数而不是音调增益。
实施方式的频谙解码单元453的主要结构如图24所示。与上述图21的 不同之处在于,提供给变形信息估计单元561的参数为LPC系数而不是音调 增益以及变形信息估计单元561内部的结构。
变形信息估计单元561内部的结构,与图22中的频谱编码单元406中的 变形信息估计单元511,即图23所示的相同,存储于判断表格512以及变形信息表格514的信息也是编码端和解码端共用的。
如上所述,根据本实施方式的解码装置(频语解码单元453 ),能够对由 本实施方式的编码装置编码的信号进行解码,并能够考虑输入信号的频i普4仑 廓而恰当地调整估计频语的动态范围,从而提高解码信号的主观质量。
另外,本实施方式中,估计变形信息通过变形信息估计单元511求出, 但是也可以与实施方式4相同将该估计变形信息适用于实施方式1的图4 示意的频谱编码单元106,并将该估计变形信息提供给频谱变形单元112,频 谱变形单元112将由变形信息估计单元511提供的估计变形信息作为基准, 从指数变量表格135中选择其附近的变形信息,并从该限定的变形信息中通 过搜索单元125确定最恰当的变形信息。在该结构中,最终所选择的变形信 息的编码符号表示为对于作为上述基准的估计变形信息的相对值。如此能对 正确的变形信息进行编码并向解码单元传输,因此能够得到维持解码信号的 主观质量并减少表示变形信息的比特数的效果。 (实施方式6)
本发明的实施方式6的分层编码装置的基本结构与实施方式1所示的分 层编码装置一样,所以省略对其说明,以下只对与频i普变形单元112的结构 不同的频谱变形单元612进行说明。
频谱变形单元612将以下的变形施加于第一频谱S1 (k)(0^k<FL),使 第一频语S1 (k)的动态范围接近于第二频谱S2(k)的高频部分(FI^k〈FH) 的动态范围。频谱变形单元612对有关该变形的变形信息进行编码且输出。
图25是用于说明本实施方式的频谱变形方法的图。
该图示出了第一频语S1 (k)的振幅的分布。第一频谱S1 (k)显示出 因频率k (0^k<FL)的值而各异的振幅。于是,如果横轴取振幅,纵轴取该 振幅出现的概率,则如图所示,出现以振幅的平均值ml为中心的类似正态 分布的分布。
本实施方式中,首先将该分布粗分为距离平均值ml较近的组(图中的 区域B)和距离平均值ml较远的组(图中的区域A)。接下来,求出这两组 的振幅的代表值,具体来讲,求出包含于区域A的频谱的振幅的平均值和包 含于区域B的频谱的振幅的平均值。在此,振幅使用将设平均值ml设为零 而换算出来时的振幅的绝对值(从各值减去平均值ml)。譬如,区域A由振 幅比平均值ml大的和振幅比平均值ml小的两个区域构成,通过"^殳平均值ml为零而换算的处理,则包含于两个区域的频语的振幅的绝对值具有相同的 值。因此,譬如区域A的平均值,相当于将第一频谱中换算后的振幅(绝对 值)比较大的频谱汇成一个组并将该组的振幅的代表值计算出来;区域B的 平均值,相当于将第一频谱中换算后的振幅(绝对值)比较小的频语汇成一 个组并将该组的振幅的代表值计算出来。由此,这两个代表值为概括地表现 第 一频谱的动态范围的参数。
其次,在本实施方式,对第二频谱进行与对第一频语进行的相同的处理,而 求出对应于第二频谱的各组的代表值。接下来,求出区域A的第一频谱的代 表值与第二频谱的代表值的比(具体来讲为,第二频语的代表值对第一频谱 的代表值的比),以及求出区域B的第一频谱的代表值与第二频谱的代表值的 比。因此,能够大概地计算出第一频谱的动态范围与第二频谱的动态范围的 比。本实施方式的频谱变形单元将该比作为频谱的变形信息进行编码且输出。
图26是表示频谱变形单元612内部的主要结构的方框图。
频语变形单元612大致分为对第一频谱的上述各组进行代表值计算的 系统;对第二频谱的上述各组进行代表值计算的系统;基于这两个系统计算 出来的代表值,确定变形信息的变形信息确定单元626;以及,基于该变形 信息来生成变形频谱的变形频谱生成单元627。
计算第一频谱的代表值的系统,具体来讲,包括偏差程度计算单元 621-1、第一阈值设定单元622-1、第二阈值设定单元622-1、第一平均频谱计 算单元624-1以及第二平均频谱计算单元625-1。计算第二频谱的代表值的系 统、基本上与计算第一频谱的代表值的系统具有相同的结构,对图中相同的 结构编上相同的编号,编号后面的分支号表示处理系统的不同。并且对于相 同的结构要素省略对其说明。
偏差程度计算单元621-1根据输入的第一频谱S1 (k)的振幅分布,计 算与第一频谱的平均值ml的"偏差程度,,,并输出到第一阈值设定单元622-1 以及第二阈值设定单元623-1。"偏差程度"具体来讲是第一频镨的振幅分布的 标准偏差cj1。
第一阈值设定单元622-1利用由偏差计算单元621-1求出的第一频_潜的 标准偏差cjl来求出第一阈值TH1。在此第一阈值TH1是指第一频谱中用来 指定包含于上述区域A的绝对振幅比较大的频谱的阈值,是将标准偏差cj1 乘上预定的常数a的值。第二阈值设定单元623-1的操作与第一阈值设定单元622-1的操作相同, 求出的第二阈值TH2是指第 一频谱中用来指定包含于区域B的绝对振幅比较 小的频谱的阈值,是将标准偏差cjl乘上预定的常数b (<a)的值。
第一平均频谱计算单元624-1求出位于第一阈值TH1外侧的频谱,即包 含于区域A的频谱的振幅的平均值(以下称为第一平均值),并输出到变形 信息确定单元626。
具体来讲,第一平均频谱计算单元624-1将第一频谱的各个子带的频谱 的振幅(但是为换算前的值)与第一频谱的平均值ml加上第一阈值TH1的 值(ml + THl )进行比较,指定具有比该值还大的振幅的频谦(步骤1 )。接 下来,第一平均频谱计算单元624-1将第一频谱的各个子带的频谱的振幅与 第一频谱的平均值ml减去第一阈值TH1的值(ml-TH1)进行比较,指定 具有比该值还小的振幅的频谱(步骤2)。然后,对由步骤1以及步骤2求出 的频谱的振幅进行上述设平均值ml为零的换算,求出得到的换算值的绝对 值的平均值,并输出到变形信息确定单元626。
第二平均频谱计算单元625-1求出位于第二阈值TH2内侧的频i普,即包 含于区域B的频谱的振幅的平均值(以下称为第二平均值),并输出到变形信 息确定单元626。具体的操作与第一平均频谱计算单元624-1相同。
上述处理求出的第 一平均值以及第二平均值为第 一频镨的区域A以及区 域B的代表值。
求出第二频谱的代表值的处理基本上与上述相同。不过,第一频-潜与第 二频谱为不同的频谱,所以相当于第 一阔值TH1的第三阈值TH3为在第二频 谱的标准偏差cj1上乘上预定的常数c的值;相当于第二阈值TH2的第四阔 值TH4为在第二频谱的标准偏差dl上乘上预定的常数d (<c)的值。
变形信息确定单元626利用由第一平均频谱计算单元624-1得到的第一 平均值、由第二平均频谱计算单元625-1得到的第二平均值、由第三平均频 谱计算单元624-2得到的第三平均值以及由第四平均频谱计算单元625-2得到 的第四平均值,如以下所示确定变形信息。
即,变形信息确定单元626计算第一平均值与第三平均值的比(以下称 为第一增益),以及第三平均值第四平均值的比(以下称为第二增益)。然后, 因为变形信息确定单元626在内部具有预先存储变形信息的多个编码^f夷补的 数据表格,将第一增益以及第二增益与这些编码候补相比较,选择最为相似的编码候补,并将表示该编码候补的索引作为变形信息输出。而且,该索引
还送到变形频谱生成单元627。
变形频谱生成单元627利用作为输入信号的第一频语、由第一阈^[直-没定 单元622-1得到的第一阈值TH1、由第二阈值设定单元623-1得到的第二阈 值TH2以及由变形信息确定单元626输出的变形信息,进行第一频谱的变形 处理,并将生成的变形频谱输出。
图27、图28是用于说明变形频谱的生成方法的图。
变形频谱生成单元627利用变形信息,计算第一平均值与第三平均值的 比的解码值(以下称为解码第一增益),以及第二平均值与第四平均值的比的 解码值(以下称为解码第二增益)。这些对应关系如图27所示。
接下来,变形频谱生成单元627通过比较第一频谱的振幅值与第一阈值 TH1,指定属于区域A的频谱,并将这些频谱乘上解码第一增益。同样地, 变形频谦生成单元627通过比较第一频谱的振幅值与第二阈值TH2,指定属 于区域B的频语,并将这些频谱乘上解码第二增益。
另一方面,如图28所示,在第一频谱中,对于夹在第一阈值TH1与第 二阈值TH2之间的区域(以下称为区域C)所属的频谱,不存在编码信息。 于是,变形频谱生成单元627使用具有解码第一增益与解码第二增益的中心 值的增益。譬如,如图28所示,根据基于解码第一增益、解码第二增益、第 一阈值TH1以及第二阈值TH2的特性曲线,求出对应某振幅x的解码增益y, 并将该增益乘上第一频谱的振幅即可。也就是,解码增益y为解码第一增益 以及解码第二增益的线性插值。
图29是表示用于解码装置的频谱变形单元662内部的主要结构的方框 图。另外,该频谱变形单元662对应于实施方式1所示的变形单元162。
因为基本#:作与上述频谱变形单元612相同,省略对其详细说明。该频
谱变形单元662只以第 一频谱为处理对象,因此处理系统为 一个。
如上所述,根据本实施方式,分别掌握第一频镨的振幅的分布以及第二 频谱的振幅的分布,分成绝对振幅比较大的组与绝对振幅比较小的组,并求 出各组的振幅的代表值。而且,通过求出第一频谱和第二频谱的各组的振幅 的代表值的比,得到第一频谱以及第二频谱之间的动态范围的比,即得到频 谱的变形信息,并将其进行编码。由此,无需使用如指数函数那样的计算量 大的函数而得到变形信息。另外,根据本实施方式,利用第一频语以及第二频语的振幅的分布求出 标准偏差,并基于该标准偏差求出第一阈值 第四阈值。由此设定基于实际 的频谱的阈值,因此能够提高变形信息的编码精确度。
另外,根据本实施方式,利用解码第一增益以及解码第二增益对第一频 谱进行增益调整,由此控制第一频谱的动态范围。而且,确定解码第一增益 以及解码第二增益,以使得第一频谱接近第二频谱的高频部分。因此,第一 频谱的动态范围接近第二频谱的高频部分的动态范围。而且,解码第一增益 以及解码第二增益的计算无需使用如指数函数那样的计算量大的函数。
另外,本实施方式以解码第一增益比解码第二增益大的情形为例进行了 说明,根据语音信号的性质,也有解码第二增益比解码第一增益大的情形。 也就是,第二频谱的高频部分动态范围比第一频谱的动态范围大的情形。这 样的现象多在输入语音信息为如摩擦音的声音时发生。在该情形也能够适用 本实施方式的频谱变形方法。
另外,在本实施方式中,将频谱分成绝对振幅较大的组与绝对振幅较小 的组两个组,并以该情形为例进行了说明,但是为了提高动态范围的再现性, 也可以分成更多的组。
另外,在本实施方式中,将平均值作为基准来换算振幅,而且基于该换 算后的振幅将频谱分为振幅比较大的组和振幅比较小的组,并以该情形为例 进行了说明,但是直接使用原来的振幅值,并基于该振幅对频谱进行分组也 可以。
另外,在本实施方式中,使用标准偏差来计算频谱的绝对振幅的偏差, 并以该情形为例进行了说明,但是并不只限于此,譬如作为与标准偏差同样 的统计参数也可以利用方差。
另外,在本实施方式中,使用各组的频谱的绝对振幅的平均值作为各组 的频谱振幅的代表值,并以该情形为例进行了说明,但是并不只限于此,譬 如也可以利用各组的频谱的绝对振幅的中心值。
另外,在本实施方式中,以使用各频谱的振幅值来调整动态范围的情形 为例进行了说明,但是也可以使用频谱的功率值来代替振幅值。
另外,在求出所对应各组的代表值时,譬如像MDCT系数那样,当从一 开始频谱的振幅就具有正或者负的符号时,无需将平均值换算为零,只要利 用频谱的振幅的绝对值来求出各组所对应的代表值即可。以上,说明了本发明的各个实施方式。
本发明的编码装置以及解码装置,不为上述各实施方式所限定,可以加 以各种变更来实施。
本发明的编码装置以及解码装置,可以配置于移动台通信系统的通信终 端装置以及基站装置,并且可以以此提供具有同样作用效果的通信终端装置 以及基站装置。
另外,在此举了将本发明适用于可扩展编码方式的例子来说明,本发明 还可以适用于其他的编码方式。
另外,在此举了通过硬件来构成本发明的例子来说明,本发明还可以通 过软件来实现。譬如,通过编程语言,对本发明的编码方法(解码方法)的 算法进行记述,并在内存中保存该程序并通过信息处理装置来实行,从而能 够实现与本发明的编码装置(解码装置)相同的功能。
另外,上述的各功能模块,典型地由集成电路LSI (大规模集成电路)
来实现。这些既可以分别实行单芯片化,也可以包含其中一部分或者是全部 而实行单芯片化。
另外,在此虽然称做LSI,但根据集成度的不同也可以称为IC (集成电 路)、系统LSI (系统大规模集成电路)、超LSI (超大规模集成电路)、极大 LSI (极大规模集成电路)。
另外,集成电路化的技术不只限于LSI,也可以使用专用电路或通用处 理器来实现。也可以利用LSI制造后能够编程的FPGA ( Field Programmable GateArray,现场可编程门阵列),或可以利用将LSI内部的电路块连接或设 定重新配置的可重配置处理器(Reconfigurable Processor )。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了替换LSI 集成电路的技术,当然也可以利用该技术来实现功能块的集成化。也有应用 生物工程学技术等的可能性。
本说明书根据2004年5月14日申请的日本专利特愿2004-145425、 2004 年11月5日申请的日本专利特愿2004-322953号以及2005年4月28日申请 的曰本专利特愿2005-133729。该内容全部包括在此作为参考。
工业实用'l"生
本发明的编码装置、解码装置以及编码/解码的方法能够适用于可扩展编 码/解码等。
权利要求
1.一种解码装置,包括变换单元,将对包含于编码装置所生成的编码中的低频频谱部分的编码进行解码所得的信号变换成频域信号而生成第一低频频谱;变形信息估计单元,使用所述第一低频频谱的频谱轮廓信息估计变形信息,所述变形信息用于对所述第一低频频谱的振幅进行一致性限制;限制单元,使用估计出的所述变形信息,对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱;以及解码单元,对包含于所述编码装置所生成的编码中的高频频谱部分的编码基于所述第二低频频谱进行解码而生成高频频谱,并且对所述编码进行解码,来调整所述高频频谱的振幅。
2. 如权利要求1所述的解码装置,其中,所述限制单元使用从0到1的范围内的预定值对所述第一低频频谱的振幅一致地进行乘幂,由此生成所述第二低频频谱。
3. 如权利要求1所述的解码装置,其中,所述解码单元使用音调滤波器生成所述高频频谱,所述音调滤波器具有所述第二4氐频频谱作为内部状态。
4. 如权利要求1所述的解码装置,其中,所述解码单元复制所述第二低频频谱而生成所述高频频谱部分。
5. 如权利要求1所述的解码装置,其中,所述变形信息估计单元使用音调信息作为所述第 一低频频语的频谱轮廓信息估计变形信息,所述音调信息表示包含于所述编码装置所生成的编码中的周期性,所述变形信息用于对所述第 一低频频谱的振幅进行一致性限制。
6. 如权利要求5所述的解码装置,其中,所述变形信息估计单元使用由音调增益与音调周期中的至少一个而构成的所述音调信息来估计所述变形信自
7. 如权利要求1所述的解码装置,其中,所述变形信息估计单元包括频谱轮廓信息存储单元,存储频谱轮廓信息的多个候补;以及动态范围信息存储单元,存储动态范围信息的多个候补,其中,所述变形信息估计单元从所述频谱轮廓信息存储单元中选择与所述第一低频频谱的频谱轮廓信息对应的频谱轮廓信息的候补,并且从所述动态范围信息存储单元中选择与所述选择出的频谱轮廓信息的候补对应的动态范围信息的候补,由此估计所述变形信息。
8. —种包括权利要求1所述的解码装置的通信终端装置。
9. 一种包括权利要求1所述的解码装置的基站装置。
10. —种解码方法,包括变换步骤,将对包含于编码装置所生成的编码中的低频频谱部分的编码进行解码所得的信号变换成频域信号而生成第一低频频谱;变形信息估计步骤,使用所述第一低频频谱的频谱轮廓信息估计变形信息,所述变形信息用于对所述第一低频频谱的振幅进行一致性限制;限制步骤,使用估计出的所述变形信息,对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱;以及解码步骤,对包含于所述编码装置所生成的编码中的高频频谱部分的编码基于所述第二低频频谱进行解码而生成高频频谱,并且对所述编码进行解码,来调整所述高频频谱的振幅。
全文摘要
本发明公开一种解码装置,包括变换单元,将对包含于编码装置所生成的编码中的低频频谱部分的编码进行解码所得的信号变换成频域信号而生成第一低频频谱;变形信息估计单元,使用所述第一低频频谱的频谱轮廓信息估计变形信息,所述变形信息用于对所述第一低频频谱的振幅进行一致性限制;限制单元,使用估计出的所述变形信息,对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱;以及解码单元,对包含于所述编码装置所生成的编码中的高频频谱部分的编码基于所述第二低频频谱进行解码而生成高频频谱,并且对所述编码进行解码,来调整所述高频频谱的振幅。
文档编号G10L21/02GK101656074SQ20091017758
公开日2010年2月24日 申请日期2005年5月13日 优先权日2004年5月14日
发明者押切正浩, 江原宏幸 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1