用于高频带宽扩展的对信号进行编码和解码的设备和方法

文档序号:2832877阅读:261来源:国知局
专利名称:用于高频带宽扩展的对信号进行编码和解码的设备和方法
技术领域
以下描述的一个或多个实施例涉及一种对音频信号(诸如语音信号或音乐信号)进行编码或解码的方法和设备,更具体地,涉及一种对音频信号中与高频域对应的信号进行编码和解码的方法和设备。
背景技术
与对应于低频域的信号相比,对应于高频域的信号对于频域的精细结构较不敏感。因此,需要提高编码效率来克服在对音频信号编码时可用的比特的限制。因此,大量的比特可被分配给对应于低频域的信号,而较少数量的比特可被分配给对应于高频域的信号。这样的方案可应用于频带复制(SBR)技术。基于人类的听觉对于高频带信号具有相对较低分辨力的事实,SBR技术可用于通过将高频带分量信号表示为包络,并在高频带分量信号的解码期间合成高频带分量信号来提高编码效率。在SBR技术中,需要一种改进的用于扩展高频域的带宽的方法。

发明内容
通过提供一种编码设备来实现以上和/或其它方面,所述编码设备包括:下采样单元,对时域输入信号进行下采样;核心编码单元,对下采样的时域输入信号进行核心编码;频率变换单元,将核心编码的时域输入信号变换为频域输入信号;扩展编码单元,使用频域输入信号的基础信号执行带宽扩展编码。扩展编码单元可包括:基础信号产生器,使用频域输入信号的频谱来产生频域输入信号的基础信号;因子估算器,使用基础信号来估算能量控制因子;能量提取器,从频域输入信号提取能量;能量控制器,使用能量控制因子控制提取的能量;能量量化器,对受控的能量进行量化。基础信号产生器可包括:人工信号产生器,通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号;包络估算器,使用窗口估算人工信号的包络;包络应用器,将估算的包络应用于人工信号。应用估算的包络的意思是用估算的人工信号的包络来划分人工信号。因子估算器可包括:第一音调计算单元,计算频域输入信号的高频部分的音调;第二音调计算单元,计算基础信号的音调;因子计算单元,使用高频部分的音调和基础信号的音调来计算能量控制因子。还可通过提供一种编码设备来实现以上和/或其它方面,所述编码设备包括:下采样单元,对时域输入信号进行下采样;核心编码单元,对下采样的时域输入信号进行核心编码;频率变换单元,将核心编码的时域输入信号变换为频域输入信号;扩展编码单元,使用频域输入信号的特征,并使用频域输入信号的基础信号来执行带宽扩展编码。扩展编码单元可包括:基础信号产生器,使用频域输入信号的频谱,产生频域输入信号的基础信号;因子估算器,使用基础信号和频域输入信号的特征来估算能量控制因子;能量提取器,从频域输入信号提取能量;能量控制器,使用能量控制因子控制提取的能量;能量量化器,对受控的能量进行量化。还可通过提供一种编码设备来实现以上和/或其它方面,所述编码设备包括:编码模式选择单元,使用频域输入信号和时域输入信号选择带宽扩展编码的编码模式;扩展编码单元,使用频域输入信号和选择的编码模式执行带宽扩展编码。扩展编码单元可包括:能量提取器,基于编码模式,从频域输入信号提取能量;能量控制器,基于编码模式控制提取的能量;能量量化器,基于编码模式对受控的能量进行量化。通过提供一种解码设备来实现以上和/或其它方面,所述解码设备包括:核心解码单元,对时域输入信号进行核心解码,其中,所述时域输入信号包括在比特流中并被核心编码;上采样单元,对核心解码的时域输入信号进行上采样;频率变换单元,将上采样的时域输入信号变换为频域输入信号;扩展解码单元,使用时域输入信号的能量并使用频域输入信号执行带宽扩展解码。扩展解码单元可包括:反量化器,对时域输入信号的能量进行反量化;基础信号
产生器,使用频域输入信号来产生基础信号;增益计算单元,使用反量化的能量和基础信
号的能量来计算增益,增益被应用于基础信号;增益应用器,应用针对每个频带的计算的增.、/■
Mo基础信号产生器可包括:人 工信号产生器,通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号;包络估算器,使用包含在比特流中的窗口来估算基础信号的包络;包络应用器,将估算的包络应用于人工信号。通过提供一种编码方法来实现以上和/或其它方面,所述编码方法包括:对时域输入信号进行下采样;对下采样的时域输入信号进行核心编码;将时域输入信号变换为频域输入信号;使用频域输入信号的基础信号来执行带宽扩展编码。还通过提供一种编码方法来实现以上和/或其它方面,所述编码方法包括:使用频域输入信号和时域输入信号选择带宽扩展编码的编码模式;使用频域输入信号和选择的编码模式执行带宽扩展编码。通过提供一种解码方法来实现以上和/或其它方面,所述解码方法包括:对时域输入信号进行核心解码,其中,所述适于输入信号包含在比特流中并被核心编码;对核心解码的时域输入信号进行上采样;将上采样的时域输入信号变换为频域输入信号;使用时域输入信号的能量并使用频域输入信号来执行带宽扩展解码。示例实施例的其它方面、特征和/或优点将部分地在以下的描述中阐述,通过描述部分将是清楚的,或者可通过本公开的实践而得知。根据示例实施例,可提取输入信号的基础信号,并且可使用输入信号的高频域的音调并使用基础信号的音调来控制输入信号的能量,因此可以有效地扩展高频域的带宽。


结合附图,通过以下的实施例的说明,这些和/或其它方面和优点将会变得清楚和更容易理解,其中:
图1不出根据不例实施例的编码设备和解码设备的框图;图2示出图1的编码设备的示例的框图;图3示出图1的编码设备的核心编码单元的框图;图4示出图1的编码设备的扩展编码单元的示例的框图;图5示出图1的编码设备的扩展编码单元的另一示例的框图;图6示出扩展编码单元的基础信号产生器的框图;图7示出扩展编码单元的因子估算器的框图;图8示出图1的编码设备的能量量化器的操作的流程图;图9示出根据示例实施例的量化能量的操作的示图;图10示出根据示例实施例的产生人工信号的操作的示图;图1lA和图1lB示出根据示例实施例的估计包络的窗口的示例的示图;图12示出图1的解码设备的框图;图13示出图12的扩展解码单元的框图;图14示出扩展解码单元的反量化器的操作的流程图;图15示出根据示例实施例的编码方法的流程图;图16示出根据示例实施例的解码方法的流程图;图17示出图1的编码设备的另一示例的框图;图18示出图17的编码设备的能量量化器的操作的框图;图19示出根据示例实施例的使用非均等比特分配方法量化能量的操作的示图20示出根据示例实施例的使用帧内预测执行向量量化(VQ)的操作的示图;图21示出根据示例实施例的使用频率加权方法量化能量的操作的示图;图22示出根据示例实施例的执行多级分割VQ和使用帧内预测的VQ的操作的示图;图23示出图13的反量化器的操作的框图;图24示出图1的编码设备的另一示例的框图。
具体实施例方式现在将详细参照示例实施例,实施例的示例在附图中示出,其中,相同的标号始终表示相同的部件。以下通过参照附图描述示例实施例以解释本公开。图1不出根据不例实施例的编码设备101和解码设备102的框图。编码设备101可产生输入信号的基础信号,并可将产生的基础信号发送到解码设备102。这里,基础信号可基于低频信号被产生,并可表示低频信号的包络信息被白化的信号,因此,基础信号可以是激励信号。当接收到基础信号时,解码设备102可对从基础信号解码得到输入信号。换而言之,编码设备101和解码设备102可执行超宽频带带宽扩展(SWBBWE)。特别地,基于从0千赫兹(KHz)到6.4KHz的低频域中的解码的宽频带(WB)信号,可执行SWB BffE以产生与SWB对应的从6.4KHz到16KHz的高频域。这里,16KHz可根据情况而改变。另外,可基于以线性预测域(LPD)为基础的码激励线性预测(CELP)通过语音编解码器来产生解码的WB信号,或者可通过在频域中执行量化的方案来产生解码的WB信号。在频域中执行量化的方案可包括例如基于修改的离散余弦变换(MDCT)执行的高级音频编码(AAC)方案。以下,将进一步描述编码设备101和解码设备102的操作。图2示出图1的编码设备101的配置的框图。参照图2,编码设备101可包括例如下采样单元201、核心编码单元202、频率变换单元203和扩展编码单元204。下采样单元201可对时域输入信号进行下采样以用于WB编码。由于时域输入信号(即,SWB信号)通常具有32KHz采样率,因此需要将采样率转换为适合于WB编码的采样率。例如,下采样单元201可将时域输入信号从32KHz采样率下采样到12.8KHz的采样率。核心编码单元202可对下采样的时域输入信号进行核心编码。换而言之,核心编码单元202可执行WB编码。例如,核心编码单元202可还行CELP型WB编码。频率变换单元203可将时域输入信号变换为频域输入信号。例如,频率变换单元203可使用快速傅里叶变换(FFT)或MDCT来将时域输入信号变换为频域输入信号。以下,假设采用MDCT。扩展编码单元204可使用频域输入信号的基础信号执行带宽扩展编码。特别地,扩展编码单元204可基于频域输入信号执行SWB BffE编码。另外,扩展编码单元204可使用频域输入信号的特征以及频域输入信号的基础信号的特征执行带宽扩展编码。这里,根据频域输入信号的特征的源,扩展编码单元204可如图4或图5被配置。将参照以下的图4和图5进一步描述扩展编码单元204的操作。在图2中,上边的路径指示核心编码,下边的路径指示带宽扩展编码。具体地,输入信号的能量信息可通过SWB BffE编码被传递到解码设备102。图3示出核心编码单元202的框图。参照图3,核心编码单元202可包括例如信号分类器301和编码器302。信号分类器301可对具有12.SKHz采样率的下采样的输入信号的特征进行分类。特别地,信号分类器301可根据频域输入信号的特征,确定将应用到频域输入信号的编码模式。例如,在国际电信联盟-电信标准(ITU-T)G.718编解码器中,信号分类器301可将语音信号确定为有声语音编模式(voiced speech encoding mode)、无声语音编码模式(unvoiced speech encoding mode)、瞬态编石马模式(transient encoding mode)和通用编码模式(generic encoding mode)中的一个或多个。在此示例中,无声语音编码模式可被设计为对无声的语音帧和大部分的不活动帧进行编码。编码器302可执行基于信号分类器301所分类的频域输入信号优化的编码。图4示出图2的扩展编码单元204的示例的框图。参照图4,扩展编码单元204可包括例如基础信号产生器401、因子估算器402、能量提取器403、能量控制器404和能量量化器405。在示例中,扩展编码单元204可在没有接收到编码模式的输入的情况下估算能量控制因子。在另一示例中,扩展编码单元204可基于从核心编码单元202接收的编码模式估算能量控制因子。基础信号产生器401可使用频域输入信号的频谱来产生输入信号的基础信号。基础信号可表不用于基于WB信号执行SWB BWE的信号。换句话说,基础信号可表不用于形成低频域的精细结构的信号。将参照图6进一步描述产生基础信号的操作。在示例中,因子估算器402可使用基础信号估算能量控制因子。特别地,编码设备101可将输入信号的能量信息发送到解码设备102,以便在解码设备102中产生SWB域中的信号。另外,因子估算器402可估算能量控制因子,从而控制感觉方面中的能量。将参照图7进一步描述估算能量控制因子的操作。在另一示例中,因子估算器402可使用基础信号和频域输入信号的特征估算能量控制因子。在此示例中,可从核心编码单元202接收频域输入信号的特征。能量提取器403可从频域输入信号提取能量。提取的能量可被发送到解码设备102。这里,可针对每个频带提取能量。能量控制器404可使用能量控制因子控制提取的能量。特别地,能量控制器404可将能量控制因子应用到针对每个频带提取的能量,并可控制能量。能量量化器405可量化受控的能量。能量可被转换为分贝(dB)标度,并可被量化。特别地,能量量化器405可获取全局能量(S卩,总能量),并可对全局能量执行标量量化(SQ),并对全局能量和每个频带的能量之间的差执行标量量化。另外,第一频带可直接量化能量,后面的频带可对当前频带和先前频带之间的差进行量化。此外,能量量化器405可直接针对每个频带对能量进行量化,而不使用频带之间的差值。当针对每个频带量化能量时,可使用SQ或向量量化(VQ)。下面将参照图8和图9进一步描述能量量化器405。图5示出扩展编码单元204的另一示例的框图。图5的扩展编码单元204还可包括信号分类器501,并且因此可与图4的扩展编码单元204不同。例如,因子估算器402可使用基础信号和频域输入信号的特征来估算能量控制因子。在此示例中,可从信号分类器501而不是核心编码单元202接收频域输入信号的特征。信号分类器501可使用MDCT频谱,基于频域输入信号的特征对具有32KHz采样率的输入信号进行分类。特别地,信号分类器501可根据频域输入信号的特征确定将被应用于频域输入信号的编码模式。当输入信号的特征被分类时,可从信号提取能量控制因子并可控制能量。在实施例中,可仅从适合用于估算能量控制因子的信号提取能量控制因子。例如,不包括音调分量的信号(诸如噪声信号或无声语音信号)可能不适合用于估算能量控制因子。这里,当输入信号被分类为无声语音编码模式时,扩展编码单元204可执行带宽扩展编码,而不是估算能量控制因子。图5中示出的基础信号产生器401、因子估算器402、能量提取器403、能量控制器404和能量量化器405可执行与图4中示出的基础信号产生器401、因子估算器402、能量提取器403、能量控制器404和能量量化器405相同的功能,因此将省略对其的进一步描述。图6不出基础信号产生器401的框图。参照图6,基础信号产生器401可包括例如人工信号产生器601、包络估算器602和包络应用器603。人工信号产生器601可通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号。特别地,人工信号产生器601可复制频域输入信号的低频频谱,并可在SWB域中产生人工信号。将参照图10进一步描述产生人工信号的操作。
包络估算器602可使用窗口来估算基础信号的包络。基础信号的包络可用于移除SffB域中的人工信号的频谱中所包括的低频域的包络信息。可使用位于预定频率之前或之后的频谱来确定预定频率索引的包络。另外,可通过移动平均来估算包络。例如,当MDCT用于变换频率时,可使用MDCT变换后的频谱的绝对值来估算基础信号的包络。这里,包络估算器602可形成白化频带(whitening band),并可将每个白化频带的频率幅度的平均值估算为每个白化频带中包含的频率的包络。包含在白化频带中的频谱的数量可被设置为少于用于提取能量的频带的数量。当每个白化频带的频率幅度的平均值被估算为包含在每个白化频带中的频率的包络时,包络估算器602可发送包括白化频带中的频谱的数量的信息,并可调整基础信号的平滑度。特别地,包络估算器602可基于白化频带是包括八个频谱还是三个频谱来发送包括白化频带中的频谱的数量的信息。例如,当白化频带包括三个频谱时,与包括八个频谱的白化频带相比,可产生更加平坦的基础信号。另外,包络估算器602可基于在核心编码单元202的编码期间使用的编码模式来估算包络,而不是发送包括白化频带中的频谱的数量的信息。核心编码单元202可基于输入信号的特征将输入信号分类为有声语音编码模式、无声语音编码模式、瞬态编码模式和通用编码模式,并可对输入信号进行编码。这里,包络估算器602可基于根据输入信号的特征的编码模式来控制包含在白化频带中的频谱的数量。在一示例中,当输入信号基于有声语音编码模式被编码时,包络估算器602可形成具有三个频谱的白化频带,并可估算包络。在另一示例中,当输入信号基于除了有声语音编码模式之外的编码模式被编码时,包络估算器602可形成具有三个频谱的白化频带,并可估算包络。包络应用器603可将估算的包络应用于人工信号。将估算的包络应用于人工信号的操作被称为“白化”,人工信号可被包络平滑。包络应用器603可将人工信号划分为每个频率索引的包络,并可产 生基础信号。图7示出因子估算器402的框图。参照图7,因子估算器402可包括例如第一音调计算单元701、第二音调计算单元702和因子计算单元703。第一音调计算单元701可计算频域输入信号的高频部分的音调。换而言之,第一音调计算单元701可计算SWB域(即,输入信号的高频部分)的音调。第二音调计算单元702可计算基础信号的音调。可通过测量频谱平坦度来计算音调。特别地,可使用如下的等式I来计算音调。可基于频谱的几何平均和算术平均之间的关系来测量频域平坦度。[等式I]
(iV-11、
ni_ T = min(10 * 1u 10 - / 厂.0.999)
V iVJT:音调,S(k):频谱,N:频谱系数的长度,r:常数
因子计算单元703可使用高频域的音调和基础信号的音调来计算能量控制因子。这里,可使用以下的等式2来计算能量控制因子:[等式2]
权利要求
1.一种编码设备,包括: 处理器,控制一个或多个处理器可运行的单元; 核心编码单元,对下采样的时域输入信号进行核心编码; 频率变换单元,将时域输入信号变换为频域输入信号; 扩展编码单元,使用频域输入信号的基础信号以及频域输入信号来执行带宽扩展编码。
2.如权利要求1所述的编码设备,其中,扩展编码单元包括: 基础信号产生器,使用频域输入信号的频谱来产生频域输入信号的基础信号; 因子估算器,使用基础信号和频域输入信号来估算能量控制因子; 能量提取器,从频域输入信号提取能量; 能量控制器,使用能量控制因子控制提取的能量; 能量量化器,对受控的能量进行量化。
3.如权利要求2所述的编码设备,其中,基础信号产生器包括: 人工信号产生器,通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号; 包络估算器,使用窗口估算人工信号的包络; 包络应用器,将估算的包络应用于人工信号来产生基础信号。
4.如权利要求3所述的编码设备,其中,窗口的尖峰与基础信号的包络被估算的频率索引对应, 其中,包络估算器基于音调或相关性的比较结果来选择窗口,并使用选择的窗口估算基础信号的包络。
5.如权利要求3所述的编码设备,其中,包络估算器将白化频带的频率幅度的平均值估算为所述白化频带中包含的频率的包络。
6.如权利要求5所述的编码设备,其中,包络估算器基于核心编码模式控制包含在白化频带中的频谱的数量,并估算基础信号的包络。
7.如权利要求2所述的编码设备,其中,因子估算器包括: 第一音调计算单元,计算频域输入信号的高频部分的音调; 第二音调计算单元,计算基础信号的音调; 因子计算单元,使用高频部分的音调和基础信号的音调来计算能量控制因子。
8.如权利要求2所述的编码设备,其中,能量控制器在能量控制因子小于预定能量控制因子时控制提取的能量。
9.如权利要求2所述的编码设备,其中,能量量化器选择能量向量的子向量,量化选择的子向量,并使用插值误差来对未被选择子向量进行量化。
10.如权利要求9所述的编码设备,其中,能量量化器选择子向量,并按照规则的间隔来量化选择的子向量。
11.如权利要求9所述的编码设备,其中,能量量化器选择子向量候选,并执行包括至少两级的多级向量量化(VQ)。
12.如权利要求9所述的编码设备,其中,能量量化器产生用于针对每个子向量候选使得每一级中的均方差(MSE)或加权均方差(WMSE)最小化的索引集,并选择所有级中的MSE或WMSE的总和最小的子向量候选。
13.如权利要求9所述的编码设备,其中,能量量化器产生用于针对每个子向量候选使得每一级中的MSE或丽SE最小化的索引集,通过反量化操作恢复能量向量,并选择使得恢复的能量向量和原始能量向量之间的MSE或WMSE最小化的子向量候选。
14.一种编码设备,包括: 处理器,控制一个或多个处理器可运行的单元; 核心编码单元,对下采样的时域输入信号进行核心编码; 频率变换单元,将时域输入信号变换为频域输入信号; 扩展编码单元,使用频域输入信号,并使用频域输入信号的基础信号来执行带宽扩展编码。
15.如权利要求14所述的编码设备,其中,扩展编码单元包括: 基础信号产生器,使用频域输入信号的频谱,产生频域输入信号的基础信号; 因子估算器,使用基础信号和频域输入信号的特征来估算能量控制因子; 能量提取器,从频域输入信号提取能量; 能量控制器,使用能量控制因子控制提取的能量; 能量量化器,对受控的能量进行量化。
16.如权利要求15所述 的编码设备,其中,扩展编码单元还包括:信号分类器,使用频域输入信号的频谱,基于频域输入信号的特征对频域输入信号进行分类, 其中,因子估算器使用由信号分类器确定的频域输入信号的特征来估算能量控制因子。
17.如权利要求15所述的编码设备,其中,因子估算器使用由核心编码单元确定的频域输入信号的特征估算能量控制因子。
18.如权利要求15所述的编码设备,其中,基础信号产生器包括: 人工信号产生器,通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号; 包络估算器,使用窗口估算人工信号的包络; 包络应用器,将估算的包络应用于人工信号来产生基础信号。
19.如权利要求18所述的编码设备,其中,窗口的尖峰与基础信号的包络被估算的频率索引对应, 其中,包络估算器基于音调或相关性的比较结果来选择窗口,并使用选择的窗口估算基础信号的包络。
20.如权利要求18所述的编码设备,其中,包络估算器将白化频带的频率幅度的平均值估算为所述白化频带中包含的频率的包络。
21.如权利要求20所述的编码设备,其中,包络估算器基于核心编码模式控制包含在白化频带中的频谱的数量,并估算基础信号的包络。
22.如权利要求14所述的编码设备,其中,因子估算器包括: 第一音调计算单元,计算频域输入信号的高频部分的音调; 第二音调计算单元,计算基础信号的音调; 因子计算单元,使用高频部分的音调和基础信号的音调来计算能量控制因子。
23.如权利要求15所述的编码设备,其中,能量控制器在能量控制因子小于预定能量控制因子时控制提取的能量。
24.如权利要求15所述的编码设备,其中,能量量化器选择能量向量的子向量,量化选择的子向量,并使用插值误差来对未被选择子向量进行量化。
25.如权利要求24所述的编码设备,其中,能量量化器选择子向量,并按照规则的间隔来量化选择的子向量。
26.如权利要求24所述的编码设备,其中,能量量化器选择子向量候选,并执行包括至少两级的多级向量量化(VQ)。
27.—种编码设备,包括: 处理器,控制一个或多个处理器可运行的单元; 能量提取器,基于编码模式从频域输入信号提取能量; 能量控制器,基于编码模式控制提取的能量; 能量量化器,基于编码模式量化受控的能量。
28.—种编码设备,包括: 处理器,控制一个或多个处理器可运行的单元; 编码模式选择单元,使用频域输入信号和时域输入信号选择带宽扩展编码的编码模式; 扩展编码单元,使用频域输入信号和选择的编码模式执行带宽扩展编码。
29.如权利要求28所述的编码设备,其中,编码模式选择单元使用频域输入信号和时域输入信号对频域输入信号进行分类,基于通过对频域输入信号分类而获得的信息来确定带宽扩展编码模式的编码模式,并基于确定的编码模式确定频带的数量。
30.如权利要求28所述的编码设备,其中,扩展编码单元包括: 能量提取器,基于编码模式,从频域输入信号提取能量; 能量控制器,基于编码模式控制提取的能量; 能量量化器,基于编码模式对受控的能量进行量化。
31.如权利要求30所述的编码设备,其中,能量提取器基于编码模式提取与频带对应的能量。
32.如权利要求30所述的编码设备,其中,能量控制器使用基于频域输入信号的基础信号估算的能量控制因子来控制能量。
33.如权利要求30所述的编码设备,其中,能量量化器基于编码模式使用针对频域输入信号优化的方案来量化能量。
34.如权利要求33所述的编码设备,其中,当编码模式是瞬态模式时,能量量化器通过将频率加权方法应用于频带来量化能量。
35.如权利要求34所述的编码设备,其中,频率加权方法用于为具有高感知重要性的低频带分配权重来量化能量。
36.如权利要求33所述的编码设备,其中,当编码模式是普通模式或谐波模式时,能量量化器通过将非均等比特分配方法应用于频带来量化能量。
37.如权利要求36所述的编码设备,其中,非均等比特分配方法用于为具有高感知重要性的低频带分配比高频带更多的比特来量化能量。
38.如权利要求30所述的编码设备,其中,能量量化器预测包括至少两个元素的量化目标向量的代表值,对预测的代表值和量化目标向量的所述至少两个元素中的每一个之间的误差信号执行向量量化(VQ)。
39.一种解码设备,包括: 处理器,控制一个或多个处理器可运行的单元; 核心解码单元,对包括在比特流中的时域输入信号进行核心解码; 上采样单元,对核心解码的时域输入信号进行上采样; 频率变换单元,将上采样的时域输入信号变换为频域输入信号; 扩展解码单元,使用频域输入信号的能量执行带宽扩展解码。
40.如权利要求39所述的解码设备,其中,扩展解码单元包括: 反量化器,对时域输入信号的能量进行反量化; 基础信号产生器,使用频域输入信号来产生基础信号; 增益计算单元,使用反量化的能量和基础信号的能量来计算增益,增益被应用于基础信号; 增益应用器,应用针对每个频 带的计算的增益。
41.如权利要求40所述的解码设备,其中,反量化器选择能量向量的子向量,反量化选择的子向量,对反量化的子向量进行插值,将插值误差值与插值的子向量相加,并最终反量化能量。
42.如权利要求40所述的解码设备,其中,基础信号产生器包括: 人工信号产生器,通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号; 包络估算器,使用包含在比特流中的窗口来估算基础信号的包络; 包络应用器,将估算的包络应用于人工信号。
43.如权利要求40所述的解码设备,其中,增益计算单元和增益应用器设置用于应用能量平滑的子频带,并使用插值来产生每个子频带的能量,其中,针对每个子频带计算增.、Mo
44.一种编码方法,包括: 对下采样的时域输入信号进行核心编码; 将时域输入信号变换为频域输入信号; 通过处理器,使用频域输入信号的基础信号来执行带宽扩展编码。
45.如权利要求44所述的编码方法,其中,执行带宽扩展编码的步骤包括: 使用频域输入信号的频谱来产生频域输入信号的基础信号; 使用基础信号来估算能量控制因子; 从频域输入信号提取能量; 使用能量控制因子控制提取的能量; 对受控的能量进行量化。
46.如权利要求45所述的编码方法,其中,产生频域输入信号的基础信号的步骤包括: 通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号; 使用窗口估算基础信号的包络;将估算的包络应用于人工信号。
47.如权利要求46所述的编码方法,其中,窗口的尖峰与基础信号的包络被估算的频率索引对应, 其中,估算基础信号的包络的步骤包括:基于音调或相关性的比较结果来选择窗口,并使用选择的窗口估算基础信号的包络。
48.如权利要求46所述的编码方法,其中,估算基础信号的包络的步骤包括:将白化频带的频率幅度的平均值估算为所述白化频带中包含的频率的包络。
49.如权利要求48所述的编码方法,其中,估算基础信号的包络的步骤包括:基于核心编码模式控制包含在白化频带中的频谱的数量,并估算基础信号的包络。
50.如权利要求45所述的编码方法,其中,估算能量控制因子的步骤包括: 计算频域输入信号的高频部分的音调; 计算基础信号的音调; 使用高频部分的音调和基础信号的音调来计算能量控制因子。
51.如权利要求45所述的编码方法,其中,控制提取的能量的步骤包括:在能量控制因子小于预定能量控制因子时控制提取的能量。
52.如权利要求45所述的编码方法,其中,量化步骤包括:选择能量向量的子向量,量化选择的子向量,并使用插值误差来对未被选择子向量进行量化。
53.如权利要求52所述的编码方法,其中,量化步骤包括:选择子向量,并按照规则的间隔来量化选择的子向量。
54.如权利要求52所述的编码方法,其中,量化步骤包括:选择子向量候选,并执行包括至少两级的多级向量量化(VQ)。
55.如权利要求54所述的编码方法,其中,量化步骤包括:产生针对每个子向量候选使得每一级中的均方差(MSE)或加权均方差(WMSE)最小化的索引集,并选择所有级中的MSE或WMSE的总和最小的子向量候选。
56.如权利要求54所述的编码方法,其中,量化步骤包括:产生针对每个子向量候选使得每一级中的MSE或丽SE最小化的索引集,通过反量化操作恢复能量向量,并选择使得恢复的能量向量和原始能量向量之间的MSE或WMSE最小化的子向量候选。
57.—种编码方法,包括: 对下采样的时域输入信号进行核心编码; 将核心编码的时域输入信号变换为频域输入信号; 通过处理器,使用频域输入信号的特征,并使用频域输入信号的基础信号来执行带宽扩展编码。
58.如权利要求57所述的编码方法,其中,执行带宽扩展编码的步骤包括: 使用频域输入信号的频谱,产生频域输入信号的基础信号; 使用基础信号和频域输入信号的特征来估算能量控制因子; 从频域输入信号提取能量; 使用能量控制因子控制提取的能量; 对受控的能量进行量化。
59.如权利要求58所述的编码方法,其中,执行带宽扩展编码的步骤还包括:使用频域输入信号的频谱,基于频域输入信号的特征对频域输入信号进行分类, 其中,估算能量控制因子的步骤包括:使用在所示分类中确定的频域输入信号的特征来估算能量控制因子。
60.如权利要求58所述的编码方法,其中,估算能量控制因子的步骤包括:使用在核心编码中确定的频域输入信号的特性估算能量控制因子。
61.如权利要求58所述的编码方法,其中,产生基础信号的步骤包括: 通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号; 使用窗口估算人工信号的包络; 将估算的包络应用于人工信号。
62.如权利要求61所述的编码方法,其中,窗口的尖峰与基础信号的包络被估算的频率索引对应, 其中,估算人工信号的包络的步骤包括:基于音调或相关性的比较结果来选择窗口,并使用选择的窗口估算基础信号的包络。
63.如权利要求61所述的编码方法,其中,估算人工信号的包络的步骤包括:将白化频带的频率幅度的平均值估算为所述白化频带中包含的频率的包络。
64.如权利要求63所述的编码方法,其中,估算人工信号的包络的步骤包括:基于核心编码模式控制包含在白化频带中的频谱的数量,并估算基础信号的包络。
65.如权利要求58所述的编码方法,其中,估算能量控制因子的步骤包括: 计算频域输入信号的高频部分的音调; 计算基础信号的音调; 使用高频部分的音调和基础信号的音调来计算能量控制因子。
66.如权利要求58所述的编码方法,其中,控制提取的能量的步骤包括:在能量控制因子小于预定能量控制因子时控制提取的能量。
67.如权利要求58所述的编码方法,其中,量化能量的步骤包括:选择能量向量的子向量,量化选择的子向量,并使用插值误差来对未被选择子向量进行量化。
68.如权利要求67所述的编码方法,其中,量化能量的步骤包括:选择子向量,并按照规则的间隔来量化选择的子向量。
69.如权利要求67所述的编码方法,其中,量化能量的步骤包括:选择子向量候选,并执行包括至少两级的多级向量量化(VQ)。
70.—种编码方法,包括: 基于编码模式从频域输入信号提取能量; 基于编码模式控制提取的能量; 通过处理器,基于编码模式量化受控的能量。
71.—种编码方法,包括: 使用频域输入信号和时域输入信号选择带宽扩展编码的编码模式; 使用频域输入信号和选择的编码模式执行带宽扩展编码。
72.如权利要求71所述的编码方法,其中,选择带宽扩展编码的编码模式的步骤包括: 使用频域输入信号和时域输入信号对频域输入信号进行分类; 基于通过对频域输入信号分类而获得的信息来确定带宽扩展编码模式的编码模式,并基于确定的编码模式确定频带的数量。
73.如权利要求71所述的编码方法,其中,执行带宽扩展编码的步骤包括: 基于编码模式,从频域输入信号提取能量; 基于编码模式控制提取的能量; 基于编码模式对受控的能量进行量化。
74.如权利要求73所述的编码方法,其中,提取能量的步骤包括:基于编码模式提取与频带对应的能量。
75.如权利要求73所述的编码方法,其中,控制提取的能量的步骤包括:使用基于频域输入信号的基础信号估算的能量控制因子来控制能量。
76.如权利要求73所述的编码方法,其中,量化能量的步骤包括:基于编码模式使用针对频域输入信号优化的方案来量化能量。
77.如权利要求76所述的编码方法,其中,量化能量的步骤包括:当编码模式是瞬态模式时,通过将频率加权方法应用于频带来量化能量。
78.如权利要求77所述的编 码方法,其中,频率加权方法用于为具有高感知重要性的低频带分配权重来量化能量。
79.如权利要求76所述的编码方法,其中,量化能量的步骤包括:当编码模式是普通模式或谐波模式时,通过将非均等比特分配方法应用于频带来量化能量。
80.如权利要求79所述的编码方法,其中,非均等比特分配方法用于为具有高感知重要性的低频带分配比高频带更多的比特来量化能量。
81.如权利要求73所述的编码方法,其中,量化能量的步骤包括:预测包括至少两个元素的量化目标向量的代表值,对预测的代表值和量化目标向量的所述至少两个元素中的每一个之间的误差信号执行向量量化(VQ)。
82.—种解码方法,包括: 对包括在比特流中的时域输入信号进行核心解码; 对核心解码的时域输入信号进行上采样; 将上采样的时域输入信号变换为频域输入信号; 通过处理器,使用频域输入信号的能量并使用频域输入信号来执行带宽扩展解码。
83.如权利要求82所述的解码方法,其中,执行带宽扩展解码的步骤包括: 对时域输入信号的能量进行反量化; 使用频域输入信号来产生基础信号; 使用反量化的能量和基础信号的能量来计算增益,增益被应用于基础信号; 应用针对每个频带的计算的增益。
84.如权利要求83所述的解码方法,其中,反量化步骤包括:选择能量向量的子向量,反量化选择的子向量,对反量化的子向量进行插值,将插值误差值与插值的子向量相加,并最终反量化能量。
85.如权利要求84所述的解码方法,其中,产生基础信号的步骤包括: 通过复制和折叠频域输入信号的低频部分来产生与高频部分对应的人工信号; 使用包含在比特流中的窗口来估算基础信号的包络; 将估算的包络应用于人工信号。
86.如权利要求84所述的解码方法,其中,计算增益的步骤包括:设置用于应用能量平滑的子频带,并通过插值来产生每个子频带的能量,其中,针对每个子频带计算增益。
87.一种存储了 用于使计算机实现权利要求44的方法的程序的非暂时性计算机可读记录介质。
全文摘要
提供了一种用于高频带宽扩展的对信号进行编码和解码的设备和方法。编码设备可对时域输入信号进行下采样,可对下采样的时域输入信号进行核心编码,可将核心编码的时域输入信号变换为频域输入信号,并可使用频域输入信号的基础信号来执行带宽扩展编码。
文档编号G10L19/20GK103210443SQ201180054965
公开日2013年7月17日 申请日期2011年9月15日 优先权日2010年9月15日
发明者成昊相, 朱基岘, 吴殷美 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1