编码装置、解码装置以及其方法

文档序号:2823082阅读:167来源:国知局
专利名称:编码装置、解码装置以及其方法
技术领域
本发明涉及将信号编码传输的通信系统中使用的编码装置、解码装置以及其方 法
背景技术
在以因特网通信为代表的分组通信系统或移动通信系统等系统中,在传输语音/ 音乐信号时,为了提高语音/音乐信号的传输效率,通常使用压缩/编码技术。另外,近年 来,除了对语音/音乐信号单纯地以低比特率进行编码之外,对于将更宽带的语音/音乐信 号进行编码的技术的需求不断提高。对于这种需求,开发了各种各样的技术,以对宽带的语音/音乐信号进行编码也 不使编码后的信息量大幅度增加。例如,在专利文献1中,在变换一定时间的输入音响信号 所得的频谱数据中,生成频率的高频部分的特征作为辅助信息,并将其与低频部分的编码 信息一起输出。具体而言,将频率的高频部分的频谱数据分为多个组,并在各个组中,将确 定与该组的频谱最近似的低频部分的频谱的信息作为辅助信息。另外,在专利文献2中,举 出了如下的技术,即将高频信号分割为多个子带,对每个所述子带,判定子带内的信号与 低频信号的相似度,并根据该判定结果,变更辅助信息的结构(子带内的振幅参数、相似的 低频信号的位置参数、高频/低频间的残差信号参数)。专利文献1 特开2003-140692号公报专利文献2 特开2004-4530号公报

发明内容
发明需要解决的问题然而,在上述专利文献1和专利文献2中,为了生成高频信号(高频部分的频谱数 据),对高频信号的每个子带(组),分别独立地进行与高频部分相似的低频信号的判定,不 能说具有足够的编码效率。尤其是在以低比特率对辅助信息进行编码时,使用计算出的辅 助信息生成的解码语音的质量不充分,根据情况也有可能产生异常噪声。本发明的目的在于,提供能够基于宽带信号的低频部分的频谱数据,对高频部分 的频谱数据高效率地进行编码,改善解码信号的质量的编码装置、解码装置以及其方法。解决问题的方案本发明的编码装置所采用的结构包括第一编码单元,对输入信号的规定频率以 下的低频部分进行编码而生成第一编码信息;解码单元,对所述第一编码信息进行解码而 生成解码信号;以及第二编码单元,将所述输入信号的比所述规定频率高的高频部分分割 为多个子带,从所述输入信号或所述解码信号,通过使用相邻的子带的估计结果估计所述 多个子带的各个子带而生成第二编码信息。本发明的解码装置所采用的结构包括接收单元,接收由编码装置生成的第一编 码信息和第二编码信息,所述第一编码信息是对输入信号的规定频率以下的低频部分进行编码而获得的信息,所述第二编码信息是将所述输入信号的比所述规定频率高的高频部分 分割为多个子带,从所述输入信号、或者对所述第一编码信息进行解码而获得的第一解码 信号,使用相邻的子带的估计结果估计所述多个子带的各个子带而获得的信息;第一解码 单元,对所述第一编码信息进行解码而生成第二解码信号;以及第二解码单元,使用由采用 所述第二编码信息获得的、相邻的子带的解码结果,从所述第二解码信号估计所述输入信 号的高频部分,从而生成第三解码信号。本发 明的编码方法,包括以下步骤对输入信号的规定频率以下的低频部分进行 编码而生成第一编码信息;对所述第一编码信息进行解码而生成解码信号;以及将所述输 入信号的比所述规定频率高的高频部分分割为多个子带,并从所述输入信号或者所述解码 信号,使用相邻的子带的估计结果估计所述多个子带的各个子带,从而生成第二编码信息。本发明的解码方法,包括以下步骤接收由编码装置生成的第一编码信息和第二 编码信息,所述第一编码信息是对输入信号的规定频率以下的低频部分进行编码而获得的 信息,所述第二编码信息是将所述输入信号的比所述规定频率高的高频部分分割为多个子 带,从所述输入信号、或者对所述第一编码信息进行解码而获得的第一解码信号,使用相邻 的子带的估计结果估计所述多个子带的各个子带而获得的信息;对所述第一编码信息进行 解码而生成第二解码信号;以及使用由采用所述第二编码信息获得的、相邻的子带的解码 结果,从所述第二解码信号估计所述输入信号的高频部分,从而生成第三解码信号。发明的效果根据本发明,在基于低频部分的频谱数据生成作为编码对象的信号的高频部分的 频谱数据时,通过利用高频的子带间的相关,进行基于相邻的子带的编码结果的编码,能够 对宽带信号的高频部分的频谱数据高效率地进行编码,能够改善解码信号的质量。


图1是用于说明本发明的编码中包含的搜索处理的概要的图。图2是表示具有本发明的实施方式1的编码装置和解码装置的通信系统的结构的 方框图。图3是表示图2所示的编码装置的内部的主要结构的方框图。图4是表示图3所示的第2层编码单元的内部的主要结构的方框图。图5是用于说明图4所示的滤波单元中的滤波处理的详情的图。图6是表示在图4所示的搜索单元中对子带SBp搜索最佳基音系数Tp’的处理的 步骤的流程图。图7是表示图2所示的解码装置的内部的主要结构的方框图。图8是表示图7所示的第2层解码单元的内部的主要结构的方框图。图9是表示本发明的实施方式2的编码装置的内部的主要结构的方框图。图10是表示本发明的实施方式2的解码装置的内部的主要结构的方框图。图11是表示本发明的实施方式3的编码装置的内部的主要结构的方框图。图12是表示图11所示的第2层编码单元的内部的主要结构的方框图。图13是表示本发明的实施方式3的解码装置的内部的主要结构的方框图。图14是表示图13所示的第2层解码单元的内部的主要结构的方框图。
图15是表示本发明的实施方式4的编码装置的内部的主要结构的方框图。图16是表示图15所示的第1层编码单元的内部的主要结构的方框图。图17是表示图15所示的第2层编码单元的内部的主要结构的方框图。图18是表示本发明的实施方式4的解码装置的内部的主要结构的方框图。图19是表示图18所示的第1层解码单元的内部的主要结构的方框图。
图20是表示图18所示的第2层解码单元的内部的主要结构的方框图。图21是表示本发明的实施方式5的第2层编码单元的内部的主要结构的方框图。图22是表示本发明的实施方式6的第2层编码单元的内部的主要结构的方框图。图23是表示本发明的实施方式6的第2层解码单元的内部的主要结构的方框图。
具体实施例方式以下,参照附图详细地说明本发明的实施方式。另外,作为本发明的编码装置和解 码装置,以语音编码装置和语音解码装置为例进行说明。首先,使用图1说明本发明的编码中包含的搜索处理的概要。图1的(a)表示输入 信号的频谱,图1的(b)表示对输入信号的低频部分的编码数据进行解码所得的频谱(第 1层解码频谱)。另外,这里,举例说明将电话频带(0 3. 4kHz)的信号频带扩展为宽带 (0 7kHz)的信号的情况。也就是说,输入信号的采样频率为16kHz,并且从低频编码单元 输出的解码信号的采样频率为8kHz。这里,在对输入信号的高频部分进行编码时,将输入信 号的频谱的高频部分分割为多个子带(在图1中为从1st到5th为止的五个子带结构),对 每个子带,搜索对于第1层解码频谱最近似高频部分的频谱的部分。在图1中,第1搜索范围和第2搜索范围表示搜索分别与第1子带(1st)和第2 子带(2nd)相似的解码低频频谱(后述的第1层解码频谱)的一部分(频带)的范围。这 里,第1搜索范围例如取Tmin (OkHz)到Tmax为止的范围。频率A表示通过搜索发现的与第 1子带相似的解码低频频谱的部分频带1st'的开始位置,频率B表示频带1st'的末端部 分。接下来,在进行与第2子带(2nd)对应的搜索时,利用搜索已经结束的第1子带(1st) 的搜索结果。具体而言,在与第1子带(1st)最近似的部分1st'的末端部分附近的范围、 即第2搜索范围中,进行与第2子带(2nd)近似的解码低频频谱的部分频带的搜索。进行 了与第2子带对应的搜索的结果,例如与第2子带相似的解码低频频谱的部分频带2nd'的 开始位置为C,末端部分为D。与第3子带、第4子带、第5子带各自对应的搜索也同样地使 用与相邻的前一个子带对应的搜索的结果进行。由此,能够进行利用了子带间的相关的高 效率的近似部分搜索,能够提高高频部分的频谱的编码性能。另外,在图1中,举例说明了 输入信号的采样频率为16kHz的情况,但本发明并不限于此,也同样地能够适用于输入信 号的采样频率为8kHz、或者32kHz等的情况。也就是说,本发明不受到输入信号的采样频率 的限制。(实施方式1)图2是表示具有本发明的实施方式1的编码装置和解码装置的通信系统的结构的 方框图。在图2中,通信系统包括编码装置和解码装置,它们处于各自经由传输路径而可通 信的状态。另外,编码装置和解码装置通常都被安装在基站装置或者通信终端装置等上使 用。
编码装置101对输入信号进行每N样本划分(N为自然数),将N样本作为一帧,
对每帧进行编码。这里,假设将作为编码的对象的输入信号表示为Xn(n = 0.....Ν-1)。η
表示在被每N样本划分了的输入信号中,第η+l信号要素。编码后的输入信息(编码信息) 通过传输路径102,被发送到解码装置103。解码装置103接收通过传输路径102从编码装置101发送的编码信息,将其解码, 获得输出信号。图3是表示图2所示的编码装置101的内部的主要结构的方框图。在将输入信号 的采样频率设为SRinput时,下采样处理单元201将输入信号的采样频率从SRinput下采样到 SRbase(SRbase < SRinput)为止,将进行了下采样的输入信号作为下采样后输入信号,输出到第 1层编码单元202。第1层编码单元202对从下采样处理单元201输入的下采样后输入信号,例如使 用CELP(Code Excited Linear Prediction,码激励线性预测)方式的语音编码方法进行编 码而生成第1层编码信息,并将生成的第1层编码信息输出到第1层解码单元203和编码 信息合并单元207。第1层解码单元203对从第1层编码单元202输入的第1层编码信息,例如使用 CELP方式的语音解码方法进行解码而生成第1层解码信号,并将生成的第1层解码信号输 出到上采样处理单元204。上采样处理单元204将从第1层解码单元203输入的第1层解码信号的采样频率 从SRbase上采样到SRinput为止,并将进行了上采样的第1层解码信号作为上采样后第1层解 码信号,输出到正交变换处理单元205。正交变换处理单元205在内部具有缓冲器Uifl1^P buf2n(n = 0.....N_l),对输
入信号Xn和从上采样处理单元204输入的上采样后第1层解码信号yn进行改进离散余弦 变换(MDCT -Modified Discrete Cosine Transform)。接下来,说明正交变换处理单元205的正交变换处理的计算步骤和向内部缓冲器 的数据输出。首先,正交变换处理单元205通过下式(1)和式(2),以“0”作为初始值分别将缓 冲器bufln和buf2n进行初始化。bufln = 0(n = 0, —, Ν-1)...(1)buf2n = 0(η = 0,…,Ν-1)... (2)接下来,正交变换处理单元205对输入信号Xn和上采样后第1层解码信号yn,根据 下式(3)和式⑷进行MDCT处理,求输入信号的MDCT系数(以下,称为“输入频谱”)S2 (k) 和上采样后第1层解码信号In的MDCT系数(以下,称为“第1层解码频谱” )Sl (k)。湖謂—严+ 1+,+ ]…⑶_)二|於>[(2” + 1+二灿 + 1)1 一,...," —D …⑷这里,k表示一帧中各个样本的索引。正交变换处理单元205通过下式(5)求作 为使输入信号Xn与缓冲器bunn结合的矢量的xn’。另外,正交变换处理单元205通过下式 (6)求作为使上采样后第1层解码信号In与缓冲器buf2n结合的矢量的yn’。
权利要求
编码装置,包括第一编码单元,对输入信号的规定频率以下的低频部分进行编码而生成第一编码信息;解码单元,对所述第一编码信息进行解码而生成解码信号;以及第二编码单元,将所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号或所述解码信号,通过使用相邻的子带的估计结果估计所述多个子带的各个子带而生成第二编码信息。
2.如权利要求1所述的编码装置, 所述第二编码单元包括分割单元,将所述输入信号的所述高频部分分割为N个子带,获得所述N个子带各自的 开始位置和带宽作为频带分割信息,其中,N为大于1的整数;滤波单元,对所述解码信号进行滤波,生成从第一估计信号到第N估计信号为止的N个 第η估计信号,其中,η= 1,2,...,Ν;设定单元,使在所述滤波单元中使用的基音系数变化并进行设定; 搜索单元,从所述基音系数中,搜索使所述第η估计信号与第η子带的相似程度为最大 的系数作为第η最佳基音系数;以及复用单元,将从第一最佳基音系数到第N最佳基音系数为止的N个最佳基音系数与所 述频带分割信息进行复用而获得所述第二编码信息,所述设定单元使为了估计第一子带而在所述滤波单元中使用的基音系数,在规定的范 围中变化并进行设定,使为了估计第二子带之后的第m子带而在所述滤波单元中使用的基 音系数,在与第m-1最佳基音系数对应的范围、或者所述规定的范围中变化并进行设定,其 中,m = 2,3, . . . , N。
3.如权利要求2所述的编码装置,所述设定单元将包含所述第m-1最佳基音系数的规定宽度的范围作为与所述第m-1最 佳基音系数对应的范围设定所述基音系数。
4.如权利要求2所述的编码装置,所述设定单元将包含所述第m-1子带的带宽和所述第m-1最佳基音系数相加所得的基 音系数的规定宽度的范围作为与所述第m-1最佳基音系数对应的范围设定所述基音系数。
5.如权利要求2所述的编码装置,所述设定单元使为了估计所述第二子带之后的所有的第m子带的各个子带而在所述 滤波单元中使用的基音系数,在与所述第m-1最佳基音系数对应的范围中变化并进行设定。
6.如权利要求2所述的编码装置,所述设定单元使为了估计所述第二子带之后的第m子带中每隔规定数的第m子带而在 所述滤波单元中使用的基音系数,在所述规定的范围中变化并进行设定,使为了估计除此 之外的第m子带而在所述滤波单元中使用的基音系数,在与所述第m-1最佳基音系数对应 的范围中变化并进行设定。
7.如权利要求2所述的编码装置,所述设定单元在所述多个子带中高频的子带越高,将所述解码信号的越低的频带作为所述规定的范围设定所述基音系数。
8.如权利要求2所述的编码装置,所述设定单元在所述多个子带中高频的子带越高,将所述解码信号的越高的频带作为 所述规定的范围设定所述基音系数。
9.如权利要求2所述的编码装置,还包括判定单元,计算所述第m子带与第m-1子带之间的相关作为第m相关,判定N-I个所述 第m相关的各个相关是否为规定级别以上,所述设定单元使为了估计在所述判定单元中所述第m相关被判定为规定级别以上的 所述第m子带而在所述滤波单元中使用的所述基音系数,在与所述第m-1最佳基音系数对 应的范围中变化并进行设定,使为了估计在所述判定单元中所述第m相关被判定为比规定级别低的所述第m子带而 在所述滤 波单元中使用的所述基音系数,在所述规定的范围中变化并进行设定。
10.如权利要求2所述的编码装置,还包括判定单元,计算所述第m子带与所述第m-1子带之间的相关作为第m相关,判定N-I个 所述第m相关中规定级别以上的所述第m相关的数是否为规定数以上,所述设定单元在由所述判定单元判定出所述规定级别以上的所述第m相关的数为规 定数以上时,使为了估计所述第二子带之后的所有的所述第m子带的各个子带而在所述滤 波单元中使用的所述基音系数,在与所述第m-1最佳基音系数对应的范围中变化并进行设 定,在由所述判定单元判定出所述规定级别以上的所述第m相关的数比规定数小时,使为 了估计所述第二子带之后的所有的所述第m子带的各个子带而在所述滤波单元中使用的 所述基音系数,在所述规定的范围中变化并进行设定。
11.如权利要求9所述的编码装置,所述判定单元计算所述N个子带各自的频谱平坦度测量,并计算所述第m子带与所述 第m-1子带的频谱平坦度测量之差或者之比的绝对值的倒数作为所述第m相关。
12.如权利要求9所述的编码装置,所述判定单元计算所述N个子带各自的能量,并计算所述第m子带与所述第m-1子带 的所述能量之差或者之比的绝对值的倒数作为所述第m相关。
13.如权利要求2所述的编码装置,所述设定单元将所述m-1最佳基音系数的值与预先设定的阈值比较,并根据比较结 果,增加或者减少搜索为了估计所述第m子带而在所述滤波单元中使用的基音系数时的搜 索项数。
14.如权利要求2所述的编码装置,所述设定单元将所述第m-1最佳基音系数的值与预先设定的阈值比较,并根据比较结 果,切换为了估计所述第m子带而在所述滤波单元中使用的基音系数的设定方法。
15.如权利要求14所述的编码装置,所述设定单元切换使基音系数在所述规定的范围中变化并进行设定的方法和使基音 系数在与所述第m-1最佳基音系数对应的范围中变化并进行设定的方法。
16.通信终端装置,具有权利要求1所述的编码装置。
17.基站装置,具有权利要求1所述的编码装置。
18.解码装置,包括 接收单元,接收由编码装置生成的第一编码信息和第二编码信息,所述第一编码信息 是对输入信号的规定频率以下的低频部分进行编码而获得的信息,所述第二编码信息是将 所述输入信号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号、或者对 所述第一编码信息进行解码而获得的第一解码信号,使用相邻的子带的估计结果估计所述 多个子带的各个子带而获得的信息;第一解码单元,对所述第一编码信息进行解码而生成第二解码信号;以及第二解码单元,使用由采用所述第二编码信息获得的、相邻的子带的解码结果,从所述 第二解码信号估计所述输入信号的高频部分,从而生成第三解码信号。
19.通信终端装置,具有权利要求18所述的解码装置。
20.基站装置,具有权利要求18所述的解码装置。
21.编码方法,包括以下步骤对输入信号的规定频率以下的低频部分进行编码而生成第一编码信息;对所述第一编码信息进行解码而生成解码信号;以及将所述输入信号的比所述规定频率高的高频部分分割为多个子带,并从所述输入信号 或者所述解码信号,使用相邻的子带的估计结果估计所述多个子带的各个子带,从而生成 第二编码信息。
22.解码方法,包括以下步骤接收由编码装置生成的第一编码信息和第二编码信息,所述第一编码信息是对输入信 号的规定频率以下的低频部分进行编码而获得的信息,所述第二编码信息是将所述输入信 号的比所述规定频率高的高频部分分割为多个子带,从所述输入信号、或者对所述第一编 码信息进行解码而获得的第一解码信号,使用相邻的子带的估计结果估计所述多个子带的 各个子带而获得的信息;对所述第一编码信息进行解码而生成第二解码信号;以及使用由采用所述第二编码信息获得的、相邻的子带的解码结果,从所述第二解码信号 估计所述输入信号的高频部分,从而生成第三解码信号。
全文摘要
在从解码信号的低频估计高频的频带扩展中提高解码信号的质量。第1层编码单元(202)对输入信号的规定频率以下的低频部分进行编码而生成第1层编码信息,第1层解码单元(203)对第1层编码信息进行解码而生成第1层解码信号,第2层编码单元(206)将输入信号的比规定频率高的高频部分分割为多个子带,使用与低频侧相邻的子带的估计结果,从输入信号或者第1层解码信号估计多个子带的各个子带,并生成包含该多个子带的估计结果的第2编码信息。
文档编号G10L21/04GK101971253SQ200980108430
公开日2011年2月9日 申请日期2009年3月13日 优先权日2008年3月14日
发明者山梨智史, 押切正浩 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1