可扩展解码装置及可扩展编码装置的制作方法

文档序号:2829232阅读:339来源:国知局
专利名称:可扩展解码装置及可扩展编码装置的制作方法
技术领域
本发明涉及在移动通信系统或使用互联网协议的分组通信系统等中,进行语音信号或音频信号的通信时所使用的通信可扩展解码装置及可扩展编码装置。
背景技术
为有效利用移动通信系统中的电波资源等,需要以低比特率来压缩语音信号。另一方面用户却希望提高通话语音的质量及实现较高的临场感的通话服务。为实现该目的,除需提高语音信号的质量以外,还需对语音以外的频带更宽的音频信号等信号进行高质量地编码。
再者,在多种多样的网络混杂的环境中,期待一种语音编码方法可以灵活地应对不同网络之间的通信、利用不同服务的终端之间的通信、不同处理性能的终端之间的通信以及除两者间通信以外的多方的相互通信等。
再者,期待可以在传输路径差错(特别是以IP网为代表的分组交换网中的分组丢失)上也有某种容错性的语音编码方式。
可以满足这些要求的其中一种语音编码方法为可扩展频带语音编码方式。可扩展频带语音编码方法为,分层地对语音信号进行编码的方法,随着编码层次数量的增加编码质量得以提高的编码方法。由于可以通过增减编码层次数量使比特率可变,因此能够有效地使用传输路径的容量。
另外,可扩展频带语音编码方法中,解码器端只要能够接收最低基本层的编码数据即可,且可以容许追加层的编码信息在传输路径上某种程度的丢失,因此,传输路径差错的容错性较强。另外,随着编码层次的增加,进行编码的语音信号的频带变宽。例如,对于基本层(核心层)使用以往的电话频带语音的编码方式。另外,在追加的层(扩展层)中,构成可以对诸如7kHz频带的宽带语音进行编码的层。
这样,频带扩展语音编码方式中,由于在核心层对电话频带语音信号进行编码,在扩展层对高质量的宽带信号进行编码,因此可扩展频带语音编码方式,对于电话频带语音服务终端及高质量宽带语音服务终端来说均能使用,并且也能够对应含有双方终端的多地点间的通信。另外,由于编码信息具有层次性,通过调整传输方法能够提高差错的容错性,而且还能够容易地通过编码侧或从传输路径上控制比特率。基于上述原因,可扩展频带语音编码方式,作为今后的用于通信的语音编码方式受到瞩目。
作为上述的可扩展频带语音编码方式的一例,有例如非专利文献1记载的方式。
非专利文献1记载的可扩展频带语音编码方式中,用每个频带的标定因子和微细结构信息对MDCT系数进行编码。标定因子被哈夫曼(Huffman)编码,微细结构被向量量化。使用标定因子的解码结果计算各个频带的听觉重要度的同时决定对各个频带的比特分配。事先将各个频带的带宽设定成各自不等,频域越高带宽越宽的状态。
另外,传输信息被分类成如下的4个组。
A核心编解码编码信息B高频域的标定因子编码信息C低频域的标定因子编码信息D频谱详细结构的编码信息另外,解码端进行如下的处理。
(情况1)A的信息完全无法接收时,进行帧丢失补偿处理而生成解码语音。
(情况2)只接收到A的信息时,输出核心编解码的解码信号。
(情况3)除A的信息以外还接收到B的信息时,通过对核心编解码的解码信号进行镜像处理(Mirroring)来生成高频域,并通过核心编解码的解码信号生成具有更宽的频带的解码信号。用解码后的B的信息来生成高频域的频谱形状。镜像处理在有声帧中进行,且以使协调结构(谐波结构)不发生变形的方法进行。在无声帧中用随机噪声生成高频域。
(情况4)除A与B的信息以外还接收到C的信息时,只使用A与B的信息进行与情况3相同的解码处理。
(情况5)除A、B及C的信息以外还接收到D的信息时,在能够全部接收A~D的信息的频带进行完全的解码处理,在无法接收D的信息的频带通过对低频域端的解码信号频谱进行镜像处理而对微细频谱解码。即使D的信息没有被接收,但是由于可以接收到B与C的信息,因此利用这些B与C的信息对频谱包络信息进行解码。镜像处理在有声帧中进行,且以使协调结构(谐波结构)不发生变形的方式进行。在无声帧中使用随机噪声来生成高频域。
非专利文献1B.Kovesi et al,“A scalable speech and audio coding schemewith continuous bitrate flexibility,”in proc.IEEE ICASSP 2004,pp.I-273--I-276发明内容发明需要解决的问题上述以往的技术(非专利文献1)中,通过镜像处理来生成高频域。此时,由于进行使谐波结构不变形的镜像处理,因而谐波结构得以维持。然而,低频域的谐波结构却成为镜像出现在高频域中。一般来说,对于有声信号,谐波结构越往高频域越容易变形,因此在高频域多数情况下显示不出在低频域那样显著的谐波结构。换而言之,在低频域中,即使倍音(harmonics)的波谷较深,而在高频域也会出现倍音的波谷较浅或有时谐波结构本身不清晰。因此,上述的以往技术,容易在高频域出现过度的谐波结构,而解码语音信号的质量恶化。
本发明的目的为提供可扩展解码装置及可扩展编码装置,即使在用低频域频谱来生成高频域频谱从而对语音(音频)信号进行解码的情况下,也能够获得高频域频谱的恶化较少的高质量解码语音(音频)信号。
解决该问题的方案本发明的可扩展解码装置采用具有第一解码单元,将低频带的编码信息解码而获得低频带的解码信号;第二解码单元,从所述低频带的解码信号与高频带的编码信息中获得高频带的解码信号,所述第二解码单元包括变换单元,对所述低频带的解码信号进行变换而获得低频带的频谱;调整单元,对所述低频带的频谱实以振幅调整;生成单元,使用振幅调整后的低频带的频谱及所述高频带的编码信息,模拟地生成高频带地频谱的结构。
发明的有益效果根据本发明,即使在用低频域频谱生成高频域频谱从而对语音(音频)信号进行解码的情况下,也能够获得高频域频谱的恶化较少的高质量的解码语音(音频)信号。


图1是示意本发明实施方式1的可扩展解码装置的结构的方框图;图2是示意本发明的实施方式1的可扩展编码装置的结构的方框图;图3是示意本发明的实施方式1的第二层解码单元的结构的方框图;图4是示意本发明的实施方式1的第二层编码单元的结构的方框图;图5是示意本发明的实施方式1的频谱解码单元的结构的方框图;图6是示意本发明的实施方式1的频谱解码单元的结构的方框图;图7是示意本发明的实施方式1的频谱解码单元的结构的方框图;图8是示意本发明的实施方式1的频谱解码单元的结构的方框图;图9是示意本发明的实施方式1的频谱解码单元的结构的方框图;图10是示意本发明的实施方式1的频谱解码单元的结构的方框图;图11是示意本发明实施方式1的高频域频谱解码单元中生成高频域分量的处理情况的模式图;图12是示意本发明的实施方式1的频谱解码单元的结构的方框图;图13是示意本发明的实施方式1的频谱解码单元的结构的方框图;图14是示意本发明的实施方式2的第二层解码单元的结构的方框图;图15是示意本发明的实施方式2的第二层编码单元的结构的方框图;图16是示意本发明的实施方式2的频谱解码单元的结构的方框图;图17是示意本发明的实施方式2的频谱解码单元的结构的方框图;图18是示意本发明的实施方式2的第一频谱编码单元的结构的方框图;图19是示意本发明的实施方式2的扩展频带解码单元的结构的方框图;图20是示意本发明的实施方式2的扩展频带解码单元的结构的方框图;图21是示意本发明的实施方式2的扩展频带解码单元的结构的方框图;图22是示意本发明的实施方式2的扩展频带解码单元的结构的方框图;图23是示意本发明的实施方式2的扩展频带解码单元中生成高频域分量的处理情况的模式图;图24是示意本发明的实施方式2的扩展频带编码单元的结构的方框图;图25是示意本发明的实施方式2的可扩展解码装置的分离单元接收的比特流内容的模式图;图26是示意本发明的方式3的可扩展频带解码单元的结构的方框图;
具体实施例方式
以下针对本发明的实施方式,参照附图详细地进行说明。
(实施方式1)图1为表示例如形成频带可扩展语音(音频)信号解码装置等的可扩展解码装置100的结构的方框图。
可扩展解码装置100具有分离单元101、第一层解码单元102及第二层解码单元103。
分离单元101,接收由后述的可扩展编码装置传送的比特流,分离成用于第一层的编码参数和用于第二层的编码参数,并分别输出给第一层解码单元102及第二层解码单元103。
第一层解码单元102,将从分离单元101输入的用于第一层的编码参数解码,并输出第一层解码信号。也将该第一层解码信号输出给第二层解码单元103。
第二层解码单元103,对从分离单元101输入的用于第二层的编码参数,用从第一层解码单元102输入的第一层解码信号进行解码,并输出第二层解码信号。
在图2中示出一例与图1的可扩展解码装置100对应的可扩展编码装置200的结构。
在图2中,第一层编码单元201,对输入的语音信号(原信号)进行编码,并将所获得的编码参数输出给第一层解码单元202及复用单元203。第一层编码单元201,在进行编码时,通过进行下采样处理或低通滤波处理等来实现第一层与第二层的频带可扩展性。
第一层解码单元202,根据从第一层编码单元201输入的编码参数生成第一层的解码信号,并输出给第二层编码单元204。
第二层编码单元204,对输入的语音信号(原信号),用从第一层解码单元202输入的第一层解码信号来编码,并将得到的编码参数输出给复用单元203。第二层编码单元204,在进行编码时,对应于第一层编码单元201进行的处理(下采样处理或低通滤波处理),进行第一层解码信号的上采样处理,或使第一层解码信号的相位与输入语音信号的相位匹配的相位调整处理。
复用单元203,将从第一层编码单元201输入的编码参数与从第二层编码单元204输入的编码参数复用,输出比特流。
接着,对图1所示的第二层解码单元103更详细地进行说明。图3是表示第二层解码单元103的结构的方框图。第二层解码单元103具有分离单元301、标定系数解码单元302、微细频谱解码单元303、频域变换单元304、频谱解码单元305及时域变换单元306。
分离单元301,将输入的用于第二层的编码参数分离表示成标定系数的编码参数(标定系数参数)和表示频谱详细结构的编码参数(微细频谱参数),并分别输出给标定系数解码单元302和详细频谱解码单元303。
标定系数解码单元302,将输入的标定系数参数解码而获得低频域标定系数和高频域标定系数,将这些解码标定系数输出给频谱解码单元305的同时,输出给微细频谱解码单元303。
微细频谱解码单元303,用从标定系数解码单元302输入的解码标定系数计算各个频带的听觉重要度,并求取分配给各个频带的微细频谱信息的比特数。接着,微细频谱解码单元303,将从分离单元301输入的微细频谱参数解码得到各个频带的解码微细频谱信息,并输出给频谱解码单元305。另外,计算听觉重要度时也可以使用第一层解码信号的信息,这种情况下,频域变换单元304的输出也输入给微细频谱解码单元303。
频域变换单元304,将输入的第一层解码信号变换成频域的频谱参数(例如MDCT系数),并输出给频谱解码单元305。
频谱解码单元305,基于从频域变换单元304输入的变换成频域的第一层解码信号、从标定系数解码单元302输入的解码标定系数(低频域及高频域)及从微细频谱解码单元303输入的解码微细频谱信息,对第二层解码信号的频谱进行解码,并输出给时域变换单元306。
时域变换单元306,将频谱解码单元305输入的第二层解码信号的频谱变换成时域的信号,并作为第二层解码信号输出。
在图4中示出与图3的第二层解码单元103对应的第二层编码单元204的结构的一例。
在图4中,输入信号输入给听觉掩蔽计算单元401及频域变换单元402A。
听觉掩蔽计算单元401,对具有事先规定的带宽的每个子带计算听觉掩蔽,并将该听觉掩蔽输出给标定系数编码单元403及微细频谱编码单元404。
就人的听觉特性来说,存在在听见某个信号时,频率与该信号接近的声音即使传入耳朵也很难听见的称为听觉掩蔽的特性。基于该听觉掩蔽特性使用上述听觉掩蔽,对于难于听见量化失真的频率的频谱分配较少的量化比特数,而对于容易听见量化失真的频率的频谱分配较多的量化比特数,由此能够实现有效的频谱编码。
频域变化单元402A,将输入的语音信号变换成频域的频谱参数(例如MDCT系数),并输出给标定系数编码单元403及微细频谱编码单元404。频域变换单元402B,将输入的第一层解码信号变换成频域的频谱参数(例如MDCT系数),并输出给标定系数编码单元403及微细频谱编码单元404。
标定系数编码单元403,用从听觉掩蔽计算单元401输入的听觉掩蔽信息,对从频域变换单元402A输入的频谱参数与从频域变换单元402B输入的第一层解码频谱之间的差分频谱进行编码而获得标定系数参数,并将该标定系数参数输出给编码参数复用单元405及微细频谱编码单元404。另外,此处图中示意将高频域频谱的标定系数参数与低频域频谱的标定系数参数分别输出的示例。
微细频谱编码单元404,将从标定系数编码单元403输入的标定系数参数(低频域及高频域)解码得到解码标定系数(低频域及高频域),并对频域变换单元402A输入的频谱参数与频域变换单元402B输入的第一层解码频谱的差分频谱用解码标定系数(低频域及高频域)进行归一化。微细频谱编码单元404,将该归一化后的差分频谱编码,并将该编码后的差分频谱(微细频谱编码参数)输出给编码参数复用单元405。此时,微细频谱编码单元404,用解码标定系数(低频域及高频域)来计算微细频谱每个频带的听觉重要度,根据听觉重要度进行比特分配。计算该听觉重要度时,也可以使用第一层解码频谱。
编码参数复用单元405,将从标定系数编码单元403输入的高频域频谱标定系数参数及低频域频谱标定系数参数,与从微细频谱编码单元404输入的微细频谱编码参数进行复用,并作为第一频谱编码参数输出。
接下来,更详细地说明图3所示的频谱解码单元305。图5~图9为表示频谱解码单元305的结构的方框图。
图5表示用于实施第一层解码信号、所有解码标定系数(低频域及高频域)及所有微细频谱解码信息全部被正常接收的情况下的处理的结构。
图6表示用于实施高频域的微细频谱解码信息的一部分没有被接收的情况下的处理的结构。与图5的不同之处在于,加法器A的输出结果输出给高频域频谱解码单元602。应该使用没有被接收的高频域微细频谱解码信息来解码的频带的频谱,通过后述的方法模拟地生成。
图7表示用于实施高频域的微细频谱解码信息完全没有被接收的情况(并且包括低频域的微细频谱解码信息的一部分都没有被接收的情况)下的处理的结构。与图6的不同之处在于,微细频谱解码信息不输出给高频域频谱解码单元702。应使用没有被接收的高频域微细频谱解码信息而被解码的频带的频谱,通过后述的方法模拟地生成。
图8表示在所有的微细频谱解码信息没有被接收,而且低频域的解码标定系数的一部分没有被接收的情况下所实施的处理的结构。与图7的不同之处在于,微细频谱解码信息没有被输入,没有来自低频域解码单元801的输出,不存在加法器B。应该使用没有被接收的高频域微细频谱解码信息来解码的频带的频谱,通过后述的方法模拟地生成。
图9表示在只有高频域的解码标定系数被接收的情况(包括一部分高频域解码标定系数没有被接收的情况)下实施的处理的结构。与图8的不同之处在于,没有低频域的解码标定系数的输入,没有低频域频谱解码单元。后面叙述有关只根据所接收的高频域解码标定系数来模拟地生成高频域的频谱的方法。
图5的频谱解码单元305具有低频域频谱解码单元501、高频域频谱解码单元502、加法器A及加法器B。
低频域频谱解码单元501,用从标定系数解码单元302输入的低频域的解码标定系数和从微细频谱解码单元303输入的微细频谱解码信息,对低频域频谱进行解码,并输出给加法器A。一般来说,通过在微细频谱解码信息上乘以解码标定系数来计算解码频谱。
加法器A,将从低频域频谱解码单元501输入的解码低频域频谱(残差)与从频域变换单元304输入的第一层解码信号(频谱)相加,求解码低频域频谱并输出给加法器B。
高频域频谱解码单元502,用从标定系数解码单元302输入的高频域的解码标定系数和微细频谱解码单元303输入的微细频谱解码信息,对高频域频谱进行解码并输出给加法器B。
加法器B,将从加法器A输入的解码低频域频谱与从高频域频谱解码单元502输入的解码高频域频谱合并而生成全频带(合并了低频域与高频域的全频带)的频谱,并作为解码频谱输出。
图6与图5相比,只有高频域频谱解码单元602的动作不同。
高频域频谱解码单元602,用从标定系数解码单元302输入的高频域的解码标定系数和从微细频谱解码单元303输入的高频域的微细频谱解码信息,对高频域的频域进行解码。此时,由于一部分频带的高频域微细频谱解码信息没有被接收,而相应的频带的高频域频域无法被正确解码。因此,高频域频谱解码单元602,用解码标定系数、从加法器A输入的低频域的解码频域及被接收且可以正确解码的高频域的频谱,模拟地生成高频域的频谱。具体的生成方法将在后面叙述。
图7为在图5及图6中完全没有接收到高频域微细频谱解码信息的情况下的动作。这种情况下,高频域频谱解码单元702,只使用从标定系数解码单元302输入的高频域的解码标定系数,对高频域的频谱进行解码。
另外,低频域频谱解码单元701,用从标定系数解码单元302输入的低频域的解码标定系数和从微细频谱解码单元303输入的低频域的微细频谱解码信息,对低频域的频谱进行解码。此时,由于一部分频带的低频域微细频谱解码信息没有被接收,而不对该一部分频带进行解码处理,当作零频谱。这种情况下,经由加法器A及加法器B输出的该频带的频谱即为第一层解码信号(频谱)本身。
图8为在图7中低频域微细频谱解码信息完全没有被接收的情况下的动作。低频谱解码单元801,虽然被输入低频域的解码标定系数,但由于完全没有被输入微细频谱解码信息,因此不进行解码处理。
图9为在图8中低频域的解码标定系数完全没有输入进来的情况下的动作。不过,在高频域频谱解码单元902中,一部分的解码标定系数(高频域)没有输入进来时,将该频带的频谱作为零来输出。
接下来,关于摸拟地生成高频域频谱的方法,以图9为例进行说明。在图9中,摸拟地生成高频域频谱的为高频域频谱解码单元902。更为详细地表示高频域频谱解码单元902的结构图为图10。
图10的高频域频谱解码单元902具有振幅调整单元1011、摸拟频谱生成单元1012及标定单元1013。
振幅调整单元1011,对从频域变换单元304输入的第一层解码信号频谱的振幅进行调整,并输出给摸拟频谱生成单元1012。
摸拟频谱生成单元1012,用从振幅调整单元1011输入的振幅调整后的第一层解码信号频谱摸拟地生成高频域的频域,并输出给标定单元1013。
标定单元1013,对从摸拟生成频谱生成单元1012输入的频谱进行标定,并输出给加法器B。
图11是表示一例摸拟地生成高频域频谱的上述一系列处理情况的模式图。
首先,进行第一层的解码信号频谱的振幅调整。振幅调整的方法,例如可以在对数领域将振幅调整为其常数倍(γ×S,γ为0≤γ≤1范围内的振幅调整系数(实数),S为对数频谱),或在线性领域将振幅调整为其常数次方(sγ、s为线性频谱)。另外,作为用于振幅调整的调整系数,可以使用对于有声声音将低频域的倍音的波谷深度与高频域的倍音的波谷深度匹配时所需系数的代表性系数。另外,调整系数可以是固定的常数,不过最好是准备多个调整系数,该调整系数对应于表示低频域频谱的倍音的波谷深度的指标(例如,直接性的有低频域中的频谱振幅的分散值等,间接性的有第一层编码单元201中的音调增益值等),根据上述指标选择性地使用对应的调整系数。另外,也可以使用低频域的频谱形状(包络)信息或音调周期信息等,根据每个母音的特征,选择性地使用调整系数。另外,也可以将最合适的调整系数作为另外的传输信息在编码器端进行编码后传输。
接下来,用振幅调整后的频谱模拟地生成高频域的频谱。作为生成方法,在图11中表示将高频域频谱作为低频域频谱的镜像来生成的镜像处理的示例。除镜像处理之外,还有将振幅调整后的频谱在频率轴的高频域方向上移动来生成高频域频谱的方法,和使用根据低频域频谱求出的音调延迟量对振幅调整后的频谱,在频率轴方向上进行音调滤波处理来生成高频域频谱的方法等。无论哪种方法,生成的高频域的结构不变形,同时低频谱的结构与生成的高频谱的结构连续性地连接。
最后,对编码单位的每个频带进行振幅的标定来生成高频域频谱。
图12表示,第一层的频谱信息(例如解码LSP参数等)从第一层解码单元102被输入到振幅调整单元1211的情况。这种情况下,振幅调整单元1211,根据输入的第一层的频谱信息来决定用于振幅调整的调整系数。另外,在决定调整系数时,除第一层的频谱信息以外,也可以使用第一层的音调信息(音调周期或音调增益)。
图13为振幅调整系数另外地向振幅调整单元1311输入的情况。这种情况下,振幅调整系数在编码器端被量化·编码后传输。
(实施方式2)图14为示意本发明实施方式2的第二层解码单元103的结构的方框图。
图14的第二层解码单元103具有分离单元1401、频谱解码单元1402A、扩展频带解码单元1403、频谱解码单元1402B、频域变换单元1404及时域变换单元1405。
分离单元1401,将用于第二层的编码参数分离成第一频谱编码参数、扩展频带编码参数及第二频谱编码参数,并分别输出给频谱解码单元1402A、扩展频带解码单元1403、频谱解码单元1402B。
频域变换单元1404,将从第一层解码单元102输入的第一层解码信号变换成频域的参数(例如MDCT系数等),并作为第一层解码信号频谱输出给频谱解码单元1402A。
频谱解码单元1402A,将从分离单元1401输入的第一频谱编码参数解码得到的第一层的编码误差的量化频谱添加在从频域变换单元1401输入的第一层的解码信号频谱上,并作为第一解码频谱输出给扩展频带解码单元1403。另外,在频谱解码单元1402A主要改善相对低频域分量的第一层编码差错。
扩展频带解码单元1403,根据从分离单元1401输入的扩展频带编码参数对各种参数进行解码,并基于从频谱解码单元1402A输入的第一解码频谱,用解码后的各种参数来解码和生成高频域的频谱。接着,扩展频带解码单元1403,将全频带的频谱作为第二解码频谱输出给频谱解码单元1402B。
频谱解码单元1402B,将从分离单元1401输入的第二频谱编码参数解码得到的第二解码频谱的编码差错量化后的频谱添加在从扩展频带解码单元1403输入的第二解码频谱上,并作为第三解码频谱输出给时域变换单元1405。
时域变换单元1405,将从频谱解码单元1402B输入的第三解码频谱变换成时域的信号,并作为第二层解码信号输出。
另外,图14中,也可以采用不存在频谱解码单元1402A、频谱解码单元1402B的一方或双方的结构。在不存在频谱解码单元1402A的结构的情况下,从频域变换单元1404输出的第一层解码信号频谱就输入到扩展频带解码单元1403。另外,在不存在频谱解码单元1402B的结构的情况下,从扩展频带解码单元1403输出的第二解码频谱就输入到时域变换单元1405。
在图15中表示与图14的第二层解码单元103对应的一例第二层编码单元204的结构。
图15中,语音信号(原信号)被输入到听觉掩蔽计算单元1501及频域变换单元1502A。
听觉掩蔽计算单元1501,用输入的语音信号计算听觉掩蔽,并输出给第一频谱编码单元1503、扩展频带编码单元1504及第二频谱编码单元1505。
频域变换单元1502A,将输入的语音信号变换成频域的频谱参数(例如MDCT系数),并输出给第一频谱编码单元1503、扩展频带编码单元1504及第二频谱编码单元1505。
频域变换单元1502B,将输入的第一层解码信号变换成MDCT等频谱参数,并输出给第一频谱编码单元1503。
第一频谱编码单元1503,用从听觉掩蔽计算单元1501输入的听觉掩蔽,对从频域变换单元1502A输入的输入语音信号频谱与从频域变换单元1502B输入的第一层解码频谱之间的差分频谱进行编码,并作为第一频谱编码参数输出,同时将通过对第一频谱编码参数进行解码所获得的第一解码频谱输出给扩展频带编码单元1504。
扩展频带编码单元1504,用从听觉掩蔽计算单元1501输入的听觉掩蔽,对从频域变换单元1502A输入的输入语音信号频谱与从第一频谱编码单元1503输入的第一解码频谱之间的误差频谱进行编码,并作为扩展频带编码参数输出,同时将对扩展频带编码频谱进行解码得到的第二解码频谱输出给第二频谱编码单元1505。
第二频谱编码单元1505,用从听觉掩蔽计算单元1501输入的听觉掩蔽,对从频域变换单元1502A输入的输入语音信号频谱与从扩展频带编码单元1504输入的第二解码频谱之间的误差频谱进行编码,并作为第二频谱编码参数输出。
接下来,在图16及图17中示意图14的频谱解码单元1402A、1402B的具体示例。
图16中,分离单元1601将输入的编码参数分离成表示标定系数的编码参数(标定系数参数)和表示频谱详细结构的编码参数(微细频谱参数),并分别输出到标定系数解码单元1602及微细频谱解码单元1603。
标定系数解码单元1602,对输入的标定系数参数进行编码从而获得低频域标定系数及高频域标定系数,并将这些解码标定系数输出给频谱解码单元1604,同时也输出到微细频谱解码单元1603。
微细频谱解码单元1603,用从标定系数解码单元1602输入的解码标定系数来计算各个频带的听觉重要度,并求分配给各个频带的微细频谱信息的比特数。接着,微细频谱解码单元1603,对从分离单元1601输入的微细频谱参数进行解码而获得各个频带的解码微细频谱信息,并输出给频谱解码单元1604。另外,也可以使用解码频谱A的信息来计算听觉重要度。这种情况下的结构为,解码频谱A也被输入到微细频谱解码单元1603。
频谱解码单元1604,根据输入的解码频谱A、从标定系数解码单元1602输入的解码标定系数(低频域及高频域)及从微细频谱解码单元1603输入的解码微细频谱信息而对解码频谱B进行解码并输出。
下面说明图16与图14的对应关系,图16所示的结构为频谱解码单元1402A的结构时,那么图16的编码参数相当于图14的第一频谱编码参数,图16的解码频谱A相当于图14的第一层解码信号频谱,图16的解码频谱B相当于图14的第一解码频谱。另外,图16所示的结构为频谱解码单元1402B的结构时,图16的编码参数相当于图14的第二频谱编码参数,图16的解码频谱A相当于图14的第二解码频谱,图16的解码频谱B相当于图14的第三解码频谱。
图18中表示一例与图16的频谱解码单元1402A、1402B对应的第一频谱编码单元1503的结构。图18表示图15中的第一频谱编码单元1503的结构。图18所示的第一频谱编码单元1503由图4所示标定系数编码单元403、微细频谱编码单元404、编码参数复用单元405及图16所示频谱解码单元1604构成,它们的动作与在图4及图16中所作的说明相同,因此这里省略说明。另外,若将图18的第一层解码频谱置换成第二解码频谱,第一频谱编码参数置换成第二频谱编码参数的话,图18所示的结构就成为图15中的第二频谱编码单元1505的结构。不过,第二频谱编码单元1505的结构中,除去了频谱解码单元1604。
图17表示不使用标定系数的情况下的频谱解码单元1402A、1402B的结构。这种情况下、频谱解码单元1402A、1402B具有听觉重要度及比特分配计算单元1701、微细频谱解码单元1702及频谱解码单元1703。
在图17中,听觉重要度及比特分配计算单元1701,根据输入的解码频谱A求各个频带的听觉重要度,并求根据听觉重要度决定的各个频带的比特分配。将求出的听觉重要度及比特分配的信息输出给微细频谱解码单元1702。
微细频谱解码单元1702,根据听觉重要度及比特分配计算单元1701输入听觉重要度及比特分配信息,对输入的编码参数进行解码而获得各个频带的解码微细频谱信息,并输出给频谱解码单元1703。
频谱解码单元1703,将从微细频谱解码单元1702输入的微细频谱解码信息添加在输入的解码频谱A上,作为解码频谱B输出。
下面说明图17与图14的对应关系,图17所示的结构为频谱解码单元1402A的结构时,图1 7的编码参数相当于图14的第一频谱编码参数,图17的解码频谱A相当于图14的第一层解码信号频谱,图17的解码频谱B相当于图14的第一解码频谱。另外,图17所示的结构为频谱解码单元1402B的结构时,图17的编码参数相当于图14的第二频谱编码参数,图17的解码频谱A相当于图14的第二解码频谱,图17的解码频谱B相当于图14的第三解码频谱。
另外,与图16和图18的对应相同,能够构成与图17的频谱解码单元1402A、1402B对应的第一频谱编码单元。
接下来,用图19~图23说明图14所示的扩展频带解码单元1403的详细结构。
图19表示扩展频带解码单元1403的结构的方框图。图19所示的扩展频带解码单元1403具有分离单元1901、振幅调整单元1902、滤波器状态设定单元1903、滤波单元1904、频谱残差形状码本1905、频谱残差增益码本1906、乘法器1907、标定因子解码单元1908、标定单元1909及频谱合成单元1910。
分离单元1901,将从图14的分离单元1401输入的编码参数分离成振幅调整系数编码参数、延迟量编码参数、残差形状编码参数、残差增益编码参数、标定因子编码参数,并分别输出给振幅调整单元1902、滤波单元1904、频谱残差形状码本1905、频谱残差增益码本1906、标定因子解码单元1908。
振幅调整单元1902,将从分离单元1901输入的振幅调整系数编码参数解码,用解码后的振幅调整系数,调整从图14的频谱解码单元1402A输入的第一解码频谱的振幅,并将调整后的第一解码频谱输出给滤波器状态设定单元1903。振幅调整,例如若将第一解码频谱设为S(n),振幅调整系数设为γ,则以{S(n)}γ表示的方法来进行。在此,S(n)为线性领域的频谱振幅,n为频率。
滤波器状态设定单元1903,将振幅调整后的第一解码频谱设定为,由传达函数P(z)=(1-z-T)-1表示的音调滤波器的滤波状态。具体来说,滤波器状态设定单元1903,将振幅调整后的第一解码频谱S1
代入生成频谱缓存S
中,并将代入后的生成频谱缓存输出给滤波单元1904。在此,z为z变换中的变量。z-1为复数变量,被称为延迟运算符。另外,T为音调滤波器的延迟量,Nn为第一解码频谱的有效频谱点数(相当于作为滤波器状态使用的频谱的上限频率),生成频谱缓存S[n]为在n=0~Nw范围内定义的排列变量。另外,Nw为频带扩展后的频谱点数,通过本滤波处理生成(Nw-Nn)点的频谱。
滤波单元1904,用从分离单元1901输入的延迟量编码参数T,对从滤波器状态设定单元1903输入的生成频谱缓存S[n]进行滤波处理。具体来说,滤波处理单元1904,通过S[n]=S[n-T]+g C[n],n=Nn~Nw来生成S[n]。在此,g表示频谱残差增益,C[n]表示频谱残差形状向量,gC[n]由乘法器1907输入。生成的S[Nn~Nw]输出给标定单元1909。
频谱残差形状码本1905,将从分离单元1901输入的残差形状编码参数解码,并与解码结果对应的频谱残差形状向量输出给乘法器1907。
频谱残差增益码本1906,将从分离单元1901输入的残差增益编码参数解码,并将与解码结果对应的残差增益输出给乘法器1907。
乘法器1907,将从频谱残差形状码本1905输入的残差形状向量C[n]与从频谱残差增益码本1906输入的残差增益g相乘,并将相乘的结果gC[n]输出给滤波单元1904。
标定因子解码单元1908,将从分离单元1901输入的标定因子编码参数解码,并将解码标定因子输出给标定单元1909。
标定单元1909,将从滤波单元1904输入的频谱S[Nn~Nw]与从标定因子解码单元1908输入的标定因子相乘,然后输出给频谱合成单元1910。
频谱合成单元1910,分别将从图14的频谱解码单元1402A输入的第一解码频谱代入低频域(S
),将从标定单元1909输入的频谱代入高频域(S[Nn~Nw]),并将获得的频谱作为第二解码频谱输出到图14的频谱解码单元1402B。
接下来,图20中表示将无法完全接收频谱残差编码参数和频谱残差增益编码参数的情况下的扩展频带解码单元1403的结构。这种情况下,能够完全接收的信息为,振幅调整系数的编码参数,延迟量编码参数,标定因子编码参数。
在图20中,由于除了分离单元2001及滤波单元2002以外的结构与图19的各部分相同,所以省略其说明。
图20中,分离单元2001将从图14的分离单元1401输入的编码参数分离成振幅调整系数编码参数、延迟量(lag)编码参数、标定因子编码参数,并分别输出给振幅调整单元1902、滤波单元2002、标定因子解码单元1908。
滤波单元2002,用从分离单元2001输入的延迟量编码参数T,对从滤波器状态设定单元1903输入的生成频谱缓存S[n]进行滤波处理。具体来说,滤波单元2002,通过S[n]=S[n-T],n=Nn~Nw来生成S[n],并将生成的S[Nn~Nw]输出给标定单元1909。
接下来,图21中表示延迟量编码参数都不能接收的情况下的扩展频带解码单元1403的结构。这种情况下,可以完全接收的信息为,振幅调整系数的编码参数、标定因子编码参数。
在图21中,图20中的滤波器状态设定单元1903及滤波单元2002被置换为模拟频谱生成单元2102。在图21中,由于除了分离单元2101及模拟频谱生成单元2102以外的结构与图19中的各部分相同,所以省略其说明。
在图21中,分离单元2101,将从图14的分离单元1401输入的编码参数分离成振幅调整系数编码参数和标定因子编码参数,并分别输出给振幅调整单元1902,标定因子解码单元1908。
模拟频谱生成单元2102,用从振幅调整单元1902输入的振幅调整后的第一解码频谱来模拟地生成高频域频谱,并输出给标定单元1909。作为高频域频谱的具体生成方法有,基于将高频域频谱作为低频域频谱的镜像来生成的镜像处理的方法,将振幅调整后的频谱向频率轴的高频域方向移动的方法,根据低频域频谱求出音调延迟量,并使用该音调延迟量对振幅调整后的频谱在频率轴方向上进行音调滤波处理的方法等。另外,在解码中的帧被判断为无声帧的情况下,也可以使用随机地生成的噪音频谱来生成模拟频谱。
接下来,图22中表示振幅调整信息都不能接收的情况下的扩展频带解码单元1403的结构。这种情况下,可以完全接收的信息为标定因子编码参数。在图22中,由于除了分离单元2201及模拟频谱生成单元2202以外的结构与图19中的各部分相同,所以省略其说明。
在图22中,分离单元2201从图14的分离单元1401输入的编码参数中分离出标定因子编码参数,并输出给标定因子解码单元1908。
模拟频谱生成单元2202,用第一解码频谱来模拟地生成高频域频谱,并输出给标定单元1909。作为高频域频谱的具体生成方法有,基于将高频域频谱作为低频域频谱的镜像来生成的镜像处理的方法,将振幅调整后的频谱向频率轴的高频域方向移动的方法,根据低频域频谱求出音调延迟量,并使用该音调延迟量对振幅调整后的频谱在频率轴方向上进行音调滤波处理的方法等。另外,解码中的帧被判断为无声帧的情况下,也可以使用随机地生成地噪音频谱来生成模拟频谱。另外,振幅调整的方法,例如可以在对数领域将振幅调整为其常数倍(γ×S,S为对数频谱),或在线性领域将振幅调整为其常数次方(sγ、s为线性频谱)。另外,作为用于振幅调整的调整系数,可以使用对于有声声音将低频域的倍音的波谷深度与高频域的倍音的波谷深度匹配时所需系数的代表性系数。另外,调整系数可以是固定的常数,不过最好是准备多个调整系数,该调整系数对应于表示低频域频谱的倍音的波谷深度的指标(例如,直接性的有低频域中的频谱振幅的分散值等,间接性的有第一层编码单元201中的音调增益值),根据上述指标选择性地使用对应的调整系数。另外,也可以使用低频域的频谱形状(包络)信息或音调周期信息等,根据每个母音的特征选择性地使用调整系数。更具体地说,由于与实施方式1中说明的模拟频谱的生成相同,所以这里省略说明。
图23表示在图20的结构中生成高频域分量的一连串动作的模式图。如图23所示,首先进行第一解码频谱的振幅调整。接着,将振幅调整后的第一解码频谱作为音调滤波器的滤波信息,在频率轴方向上进行滤波处理(音调滤波)生成高频域分量。接着,对生成的高频域分量按标定系数的每个频带进行标定而生成最终的高频域频谱。接着,将生成的高频域频谱与第一解码频谱合并而生成第二解码频谱。
用图24表示一例与图19的扩展频带解码单元1403对应的扩展频带编码单元1504的结构。
在图24中,振幅调整单元2401,用从频域变换单元1502A输入的输入语音信号频谱,对从第一频谱编码单元1503输入的第一解码频谱进行振幅调整,并将振幅调整后的编码参数输出,同时将振幅调整后的第一解码频谱输出给滤波器状态设定单元2402。振幅调整单元2401进行的振幅调整,使第一解码频谱的最大振幅频谱与最小振幅频谱之比(动态范围)接近输入语音信号频谱的高频域的动态范围。作为振幅调整的方法,例如有上述列举的方法。另外,也可以使用例如式(1)的变换式进行振幅调整。S1为变换前的频谱,S1′为变换后的频谱。
S1′(k)=sign(S1(k))·|S1(k)|γ…(1)其中,sign()为颠倒正号/负号的函数,γ表示0≤γ≤1范围内的实数。使用式(1)的情况下,振幅调整单元2401,从事先准备的多个候选中选择振幅调整后的第一解码频谱与输入语音信号频谱的高频域部分的动态范围最为接近时的振幅调整系数γ,并将该选择出的振幅调整系数γ的编码参数输出到复用单元203。
滤波器状态设定单元2402,与图19的滤波器状态设定单元1903相同地,将从振幅调整单元2401输入的振幅调整后的第一解码频谱设定为音调滤波器的内部状态。
延迟量设定单元2403,让延迟量T在事先设定的搜索范围TMIN~TMAX内一点点地改变,同时顺次地输出给滤波单元2404。
频谱残差形状码本2405存储有多个频谱残差形状向量的候选,根据来自搜索单元2406的指示,从所有的或事先限定的候选中顺次选择并输出频谱残差形状向量。同样地,频谱残差增益码本2407存储有多个频谱残差增益的候选,根据来自搜索单元2406的指示从所有的或事先限定的候选中顺次选择并输出频谱残差增益。
乘法单元2408,将从频谱残差形状码本2405输出的频谱残差形状向量的候选与从频谱残差增益码本2407输出的频谱残差增益的候选相乘,并将相乘的结果输出到滤波单元2404。
滤波单元2404,使用由滤波器状态设定单元2402设定的音调滤波器的内部状态、从延迟量设定单元2403输出的延迟量T及增益调整后的频谱残差形状向量进行滤波,计算输入语音信号频谱的估计值。该动作与图19的滤波单元1904的动作相同。
搜索单元2406,从延迟量、频谱残差形状向量及频谱残差增益的多个组合中,通过基于合成的分析方法(AbS;Analysis by Synthesis)决定使输入语音信号频谱(原频谱)的高频域部分与滤波单元2404的输出信号的互相相关为最大时的组合。此时,利用听觉掩蔽决定听觉上最为类似的组合。另外,考虑在后续阶段中进行的基于标定因子的标定来进行搜索。由搜索单元2406决定的延迟量的编码参数、频谱残差形状向量的编码参数及频谱残差增益的编码参数输出到复用单元203及扩展频带解码单元2409。
另外,在上述的基于AbS的编码参数决定方法中也可以同时决定音调系数、频谱残差形状向量及频谱残差增益。或者,也可以顺次地决定音调系数T、频谱残差形状向量、频谱残差增益,以减少计算量。
扩展频带解码单元2409,使用从振幅调整单元2401输出的振幅调整系数的编码参数,和从搜索单元2406输出的延迟量的编码参数、频谱残差形状向量的编码参数及频谱残差增益的编码参数,对第一解码频谱进行解码处理,生成输入语音信号频谱的估计频谱(即,标定前的频谱),并输出到标定因子编码单元2410。解码顺序与图19的扩展频带解码单元1403相同(不过,图19的标定单元1909及频谱合成单元1910的处理除外)。
标定因子编码单元2410,使用从频域变换单元1502A输出的输入语音信号频谱(原频谱)的高频域部分、从扩展频带解码单元2409输出的估计频谱及听觉掩蔽,对听觉上最合适的估计频谱的标定因子(标定系数)进行编码,并将其编码参数输出给复用单元203。
图25为示意图1的分离单元101接收的比特流的内容的模式图。如此图所示,比特流中多个编码参数被时间复用。另外,图25的左侧表示MSB(MostSignificant Bit,比特流中重要度最高的比特),右侧表示LSB(Least SignificantBit,比特流中重要度最低的比特)。这样,通过排列编码参数,在传输路径上丢弃部分的比特流时,从LSB端开始顺次地丢弃,能够丢弃引起的质量恶化抑制到最小限度。从LSB开始丢弃到(1)的情况下可以用图20所说明的方法进行解码处理,从LSB开始丢弃到(2)的情况下可以用图21所说明的方法进行解码处理,从LSB开始丢弃到(3)的情况下可以使用图22所说明的方法进行解码处理。另外,从LSB开始丢弃到(4)的情况下,将第一层解码信号作为输出信号。
另外,对于从LSB端优先地丢弃编码参数的网络的实现方法,不进行特别的限定。例如,也可以使用对在图25中分割开的各编码参数赋予优先顺序,通过用不同的分组来传送来进行优先控制的分组网。
另外本实施方式,在图19中表示了具有频谱残差形状码本1905、频谱残差增益码本1906、乘法器1907的结构,不过也可以采用不具有这些部分的结构。这种情况下,编码器端无需传送残差形状向量的编码参数及残差增益的编码参数,而能够以低比特率进行通信。另外,这种情况下的解码步骤,与用图19进行的说明的不同之处仅在于,没有频谱残差信息(形状、增益)的解码处理。也就是说,解码处理步骤为用图20进行说明的处理步骤,对于比特流来说,图25中(1)的位置为LSB。
(实施方式3)本实施方式表示实施方式2中的图14所示的第二层解码单元103的扩展频带解码单元1403的其它结构。在本实施方式,使用根据该帧与前帧的扩展频带编码参数解码的解码参数,与相对该帧的接收比特流的数据丢失信息,决定该帧的解码参数并对第二解码频谱进行解码。图26是表示本发明的实施方式3的扩展频带解码单元1403的结构的方框图。图26的扩展频带解码单元1403中,振幅调整系数解码单元2601根据振幅调整系数编码参数,对振幅调整系数进行解码。延迟量解码单元2602,根据延迟量编码参数,对延迟量进行解码。解码参数控制单元2603,使用基于扩展频带编码参数被解码的各解码参数、接收数据丢失信息及从各缓存2604a~2604e输出的前帧的各解码参数,来决定用于该帧的第二解码频谱解码的解码参数。缓存2604a~2604e为分别存储该帧的解码参数的振幅调整系数、延迟量、残差形状向量、频谱残差增益、标定因子的缓存。另外,图26中除此以外的结构与图19的扩展频带解码单元1403的结构相同,因此省略其说明。
接下来,对这样构成的扩展频带解码单元1403的动作进行说明。
首先,该帧的第二层编码数的一部分的扩展频带编码参数所包含的各解码参数,即标定因子、延迟量、振幅调整系数、残差形状向量、频谱残差增益各自的编码参数,分别由解码单元1908、2602、2601、1905、1906解码。接着,在解码参数控制单元2603中,使用被解码的各解码参数及它们的前帧的解码参数,基于接收数据丢失信息,决定用于该帧的第二解码频谱解码的解码参数。
在此,接收数据丢失信息是,由于丢失(包括分组丢失,或由于传送差错而检测出差错的情况等),扩展频带解码单元1403中无法使用扩展频带编码参数的哪些部分的信息。
接着,使用由解码参数控制单元2603获得的该帧的解码参数及第一解码频谱,第二解码频谱得以解码。其具体动作与实施方式2中图19的扩展频带解码单元1403相同,因此省略其说明。
接下来,下面来说明解码参数控制单元2603的第一种动作形态。
在第一种动作形态中,解码参数控制单元2603,用前一帧的对应频带的解码参数来代用由于丢失而没有得到的编码参数的对应频带的解码参数。
具体来说,假设SF(n,m)第n帧的第m频带的标定因子,T(n,m)第n帧的第m频带的延迟量,γ(n,m)第n帧的第m频带的振幅调整系数,c(n,m)第n帧的第m频带的残差形状向量,g(n,m)第n帧的第m频带的频谱残差增益,m=ML~MH,ML第二层中高频域频带的最低频带的号码,MH第二层中高频域频带的最高频带的号码,那么,接收数据丢失信息表示出该帧的第m频带的上述任何一个编码参数丢失而无法接收的情况下,前帧(第n-1帧)的第m频带的解码参数就作为所述丢失的该编码参数对应的解码参数被输出。
也就是说,当标定因子丢失时SF(n,m)←SF(n-1,m)当延迟量丢失时T(n,m)←T(n-1,m)当振幅调整系数丢失时γ(n,m)←γ(n-1,m)当残差形状向量丢失时c(n,m)←c(n-1,m)当频谱残差增益丢失时g(n,m)←g(n-1,m)。
另外,也可以用下面的(a)或(b)中的任意一方来代替上述的情况。
(a)在丢失了上述5种参数中任意一个的频带中,使用前帧的对应参数作为与5种所有的或任意的组合相关联的多种解码参数。
(b)在丢失了上述5种参数中任意一个的频带中,将残差形状向量及(或)频谱残差增益设为“0”。
另一方面,在没有发生丢失的频带中,直接输出用接收到的该帧的编码参数进行解码的解码参数。
接着,由上述所得的该帧的高频域频率所有的频带的解码参数SF(n,m)、T(n,m)、γ(n,m)、c(n,m)、g(n,m):m=ML~MH作为该帧的解码参数输出。
另外,在丢失了所有的第二层的编码参数时,在第二层的帧补偿中,使用前帧的对应解码参数作为该帧的高频域频率的所有频带的扩展频带解码参数。
另外,上述的说明中,对在发生丢失的帧中一直使用前帧的解码参数进行解码的形态进行了说明,作为其它的形态也可以是,基于前帧与该帧的信号的相关性,只有在相关性大于阈值时才用上述说明的方法进行解码,而在相关性小于阈值时,则根据实施方式2用限于该帧内的方法进行解码。这种情况下,作为表示前帧与该帧的信号的相关性的指标,例如有从第一层的编码参数获得的LPC参数等频谱包络信息、音调周期或音调增益参数等有关信号的有声定常性的信息、使用第一层的低频域解码信号和第一层的低频域解码频谱本身等计算出的前帧与该帧之间的相关系数或频谱距离等。
接下来,下面说明解码参数控制单元2603的第二种动作形态。
在第二种动作形态中,解码参数控制单元2603,对于发生了该帧的数据丢失的频带,使用前帧的该频带的解码参数、前帧及该帧的与该频带相邻的频带的解码参数,求该频带的解码参数。
具体来说,当接收数据丢失信息表示该帧的第m频带的编码参数丢失而接收不到时,使用前帧(第n-1帧)的第m频带的解码参数、前帧及该帧的与该频带相邻的频带(前帧与该帧中相同的频带)的解码参数作为所述丢失的该编码参数对应的解码参数,如下地获得解码参数。
也就是说,当标定因子丢失时SF(n,m)←SF(n-1,m)*SF(n,m-1)/SF(n-1,m-1)
当延迟量丢失时T(n,m)←T(n-1,m)*T(n,m-1)/T(n-1,m-1)当振幅调整系数丢失时γ(n,m)←γ(n-1,m)*γ(n,m-1)/γ(n-1,m-1)当频谱残差增益丢失时g(n,m)←g(n-1,m)*g(n,m-1)/g(n-1,m-1)当残差形状向量丢失时c(n,m)←c(n-1,m)或0。
另外,也可以用下面的(a)或(b)中的任意一方来代替上述的情况。
(a)在只要丢失了上述5种参数中任意一个的频带中,使用根据上述操作求出的参数作为与5种所有的或任意的组合相关联的多种解码参数。
(b)在只要丢失了上述5种参数中任意一个的频带中,将残差形状向量及(或)频谱残差增益设为“0”。
另一方面,在没有发生丢失的频带中,将用接收到的该帧的编码参数进行解码的解码参数直接输出。
接着,由上述所得的该帧的高频域频率所有的频带的解码参数SF(n,m)、T(n,m)、γ(n,m)、c(n,m)、g(n,m):m=ML~MH作为该帧的解码参数输出。
另外,以上以该频带m的相邻频带为m-1的例子进行了说明,不过也可以使用频带m+1的参数。但是,相邻频带也发生编码参数丢失时,也可以使用没有发生丢失的最接近的频带等其它频带的解码参数。
另外,也可以与上述的第一种动作形态相同地,基于前一帧的信号与该帧的信号之间的相关性,只有在相关性大于阈值时才使用上述说明的方法进行解码。
再者,在上述5种解码参数中,也可以仅对一部分的参数(标定因子,或标定因子及振幅调整系数)使用通过以上说明的处理计算出的解码参数,其余的解码参数使用前帧的该频带的参数来进行解码,或以实施方式2所说明的方法进行解码。
再者,作为其它的动作形态还有,在将多个编码帧集中复用在一个分组中来传输的系统中,优先地保护(不丢失)时间上为将来的编码参数的控制的形态。在该形态中,接收端在对集中接收多个帧的比特流进行解码之际,也可以使用该帧的前后帧的编码参数,以与上述第一种动作形态或第二种动作形态相同的方法对发生丢失的该帧的编码参数进行解码。此时,求作为前帧的解码参数与后续帧的解码参数的中间值的内插值,作为解码参数来使用。
另外,也可以采用如下的形态。
(1)对于扩展频带编码参数发生丢失的频带,在图14所示的第二层解码单元103内的频谱解码单元1402B中,不进行解码频谱的相加运算。
(2)对于扩展频带解码单元1403,其结构也可以不具有频谱残差形状码本、频谱残差增益码本、乘法器。
另外,上述的实施方式1~3中示意的均为2层结构的示例,也可以是3层以上的结构。
以上,对于根据本发明的可扩展解码装置及可扩展编码装置的实施方式进行了说明。
本发明的可扩展解码装置及可扩展编码装置,并不局限于上述的实施方式1~3,可以进行各种变更来实施。
本发明的可扩展解码装置及可扩展编码装置,可以安装在移动通信系统中的通信终端装置及基站装置上,由此能够提供具有与上述同样的作用效果的通信终端装置及基站装置。
另外,此处以通过硬件构成本发明的情况为例进行了说明,本发明也可以通过软件来实现。
另外,在上述各实施方式的说明中使用的各功能块,最为典型的是通过集成电路LSI来实现,可以将各功能个别芯片化,也可以将全部或一部分功能芯片化。
此处所称的LSI,根据集成度的不同也可称作IC、系统LSI、超级LSI、超大LSI等。
集成电路化的方法并不局限于LSI,也可以通过专用电路或通用处理器来实现。也可以在制造LSI后,使用可编程的FPGA(Field Programmable GateArray),或LSI内部的电路块的连接或设定可以重新构成的可重构处理器。
再者,根据半导体技术的进步或派生出的其他技术,若有可以替代LSI的集成电路化技术问世的话,当然也可以利用该技术进行功能块的集成化。也有应用生物技术的可能性。
本发明的可扩展解码装置的主要特征如下所示。
第一,在本发明中,在通过镜像处理进行高频域生成时,由于对进行镜像处理的原来的低频域频谱的变动幅度进行调整之后再进行镜像处理,因此可以传输也可以不传输有关变动幅度调整的信息。这样,能够接近符合实际的高频域频谱的谐波结构,而能够避免生成过度的谐波结构。
第二,在本发明中,在由于传输路径差错等而接收不到延迟量信息时,对编码后的高频域分量进行解码时,由于以基于上述第一特征的原理进行镜像处理,进行高频域分量的解码处理,因而不使用延迟量信息也能够生成在高频域具有谐波结构的频谱。另外,还能够将谐波结构的强度调整到适当的电平。另外,也可以用其它的方法替代镜像处理来生成模拟频谱。
第三,本发明在使用按标定因子、振幅调整系数、延迟量、频谱残差的顺序构成的比特流,且接收不到频谱残差信息的情况下,仅以标定因子、振幅调整系数及延迟量信息来生成解码信号,在接收不到延迟量信息及频谱残差信息的情况下,以基于上述第二特征的解码原理来进行解码处理。由此,在本发明应用于传输路径差错或编码信息的消失、丢弃的发生率被设计成,按标定因子、振幅调整系数、延迟量、频谱残差的顺序增大(即,使标定因子的差错保护为最强,或在传输路径上被优先传输)的系统中的情况下,能够将由传输路径差错引起的解码语音的质量恶化控制在最小限度。另外,由于解码语音的质量按上述的各参数单位慢慢地变化,而能够实现比以往更为细致的可扩展性。
第四,本发明的扩展频带解码单元具有缓存器,分别存储根据前一帧的解码所使用的扩展频带编码参数被解码的解码参数;解码参数控制单元,使用该帧及前一帧的各解码参数、对于该帧的接收比特流的数据丢失信息,来决定该帧的解码参数,其中,使用该帧的第一解码频谱及从解码参数控制单元输出的解码参数,生成第二解码频谱。由此,当丢失了一部分或全部的利用将低频域频谱作为内部状态的滤波器对高频域频谱进行编码而得到的扩展频带编码数据,而无法用来解码的情况下,取而代之能够使用相似性较高的前帧的解码参数来进行丢失补偿,而在发生数据丢失时也能够进行高质量的信号解码。
在上述的第四特征中,解码参数控制单元也可以对于该帧发生数据丢失的频带,使用前一帧的该频带及前一帧的与该帧的该频带相邻的频带的解码参数,求该频带的解码参数。这样,在使用相似性较高的前一帧的编码参数时,能够利用与补偿对象的频带相邻的频带的时间性变化关系,能够进行精度更高的补偿。
本说明书基于2004年11月5日提出的日本专利申请2004-322954,其内容全部包含于此。
工业实用性本发明的可扩展解码装置及可扩展编码装置,适用于移动通信系统或使用了互联网协议的分组通信系统等用途。
权利要求
1.一种扩展解码装置,包括第一解码单元,对低频带的编码信息进行解码而获得低频带的解码信号;以及第二解码单元,从所述低频带的解码信号及高频带的编码信息获得高频带的解码信号;所述第二解码单元具有变换单元,将所述低频带的解码信号变换而获得低频带的频谱;调整单元,对所述低频带的频谱实以振幅调整;以及生成单元,使用振幅调整后的低频带的频谱和所述高频带的编码信息,模拟地生成高频带的频谱。
2.根据权利要求1所述的可扩展解码装置,其中,所述生成单元,对振幅调整后的低频带的频谱采用镜像处理来模拟地生成所述高频带的频谱。
3.根据权利要求1所述的可扩展解码装置,其中,所述生成单元,在所述高频带的编码信息的至少一部分无法解码的情况下,模拟地生成所述高频带的频谱。
4.根据权利要求1所述的可扩展解码装置,其中,所述生成单元,对振幅调整后的低频带的频谱采用音调滤波处理来模拟地生成所述高频带的频谱。
5.根据权利要求1所述的可扩展解码装置,其中,所述高频带的编码信息,按标定因子、振幅调整系数、延迟量、频谱残差的顺序构成重要度从高到低的顺序,所述生成单元,在所述的高频带的编码信息中缺少所述的频谱残差的情况下,使用所述标定因子、所述振幅调整系数、所述延迟量,模拟地生成所述高频带的频谱。
6.根据权利要求1所述的可扩展解码装置,其中,所述高频带的编码信息,按标定因子、振幅调整系数、延迟量、频谱残差的顺序构成重要度从高到低的顺序,所述生成单元,在所述高频带的编码信息中缺少所述延迟量及所述频谱残差的情况下,对振幅调整后的低频带的频谱采用镜像处理,模拟地生成所述高频带的频谱。
7.根据权利要求1所述的可扩展解码装置,其中,所述高频带的编码信息按标定因子、振幅调整系数、延迟量、频谱残差的顺序构成重要度从高到低的顺序,所述生成单元,在缺少所述标定因子、所述振幅调整系数、所述延迟量及所述频谱残差中至少一个的情况下,使用与缺少的信息对应的过去的信息,模拟地生成所述高频带的频谱。
8.一种可扩展编码装置,由原信号生成低频带的编码信息和高频带的编码信息,输出给权利要求1所述的可扩展解码装置,该可扩展编码装置包括第一编码单元,对所述原信号进行编码而获得所述低频带的编码信息;以及第二编码单元,使用将从所述低频带的编码信息的解码信号中获得的低频带的频谱作为内部状态的滤波器,获得所述原信号的频谱的高频带部分的估计值,同时将表示所述滤波器特性的信息作为所述高频带的编码信息输出。
全文摘要
公开了可扩展解码装置,即使在通过使用低频域频谱生成高频域频谱来对语音信号进行解码的情况下,也能够得到高频域频谱的恶化较少的高质量的解码语音信号。该装置中,振幅调整单元(1211)根据第一层频谱信息的特征,使用不同的调整系数,进行第一层解码信号频谱的振幅调整,并输出给模拟频谱生成单元(1012),模拟频谱生成单元(1012)使用从振幅调整单元(1211)输出的振幅调整后的第一层解码信号频谱,模拟地生成高频域的频谱并输出给标定单元(1013),标定单元(1013)将从模拟频谱生成单元(1012)输入的频谱标定后输出给加法器B。
文档编号G10L21/02GK101048649SQ20058003736
公开日2007年10月3日 申请日期2005年11月2日 优先权日2004年11月5日
发明者江原宏幸, 押切正浩, 吉田幸司 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1