频带扩展方法、频带扩展装置、程序、集成电路及音频解码装置的制作方法

文档序号:2832685阅读:346来源:国知局
专利名称:频带扩展方法、频带扩展装置、程序、集成电路及音频解码装置的制作方法
技术领域
本发明涉及将音频信号的频带扩展的频带扩展方法等。
背景技术
音频频带扩展(BWE)技术是为了将宽频带的音频信号以低位速率高效率地编码而在近年来的音频编解码器中普遍使用的技术。其原理是使用原来的高频(HF)内容的参量(parametric)表现、从低频(LF)数据合成高频(HF)的近似。

图1是表示基于这样的BWE技术的音频编解码器的图。在该音频编解码器的编码器中,将宽频带音频信号首先分离为LF部分和HF部分(101及103),将该LF部分以保持波形的方式编码(104)。另一方面,(一般在频率域中)分析LF部分与HF部分的关系(102), 用1组HF参数表示。通过将HF部分用参数表示,能够将多路复用的(10 波形数据及HF 参数以低位速率向解码器发送。在解码器中,首先将LF部分解码(107)。为了将原来的HF部分近似,将解码后的 LF部分变换为频率域(108),将得到的LF频谱按照解码后的一部分HF参数修正(109),生成HF频谱。将HF频谱还按照解码后的一部分HF参数再通过后处理而精细化(110)。将精细化后的HF频谱变换为时间域(111),组合到延迟后的(112)LF部分中。结果,输出重构的最终的宽频带音频信号。另外,在BWE技术中,重要的步骤之一是从LF频谱生成HF频谱(109)。用来实现它的方法有几种,例如有将LF部分复制到HF位置的方法、非线性处理、或上采样 (upsampling)等。使用这样的BWE技术的最周知的音频编解码器是MPEG-4 HE-AAC,所以,BffE技术被作为SBR(频谱频带复制)或SBR技术规定。在SBR中,HF部分通过简单地将QMF(正交镜像滤波器)显示内的LF部分复制到HF频谱位置上而生成。这样的频谱复制处理也被称作修补(patching),该处理简单,并且在多数情况下被证明是有效率的。但是,只有很少的LF部分频带能够执行的、非常低的位速率(例如, < 20kbits/s mono)下的SBR技术有可能带来粗糙或不愉快的音质等那样的不希望的听感的现象(例如,参照非专利文献1)。因而,为了避免在以低位速率编码的情况下举出的、起因于镜像或复制处理的现象,将标准的SBR技术改良,通过以下的主要的变更进行扩展(例如,参照非专利文献2)。(1)将修补算法从复制方式变更为相位声码器驱动的修补方式。(2)将适应性时间分辨率提高到后处理参数用。进行第1变更(上述(1))的结果,用多个整数系数使LF频谱扩散,由此在本质上确保HF的谐波的连续性。特别是,因为拍音的影响而引起的不希望的粗糙感在低频与高频的边界、以及不同的高频部分间的边界处不发生(例如,参照非专利文献1)。此外,通过第2变更(上述(2)),能够容易地使精细化的HF频谱对再现的频带中的信号的摇摆更加适应。因为新的修补保持了谐波关系,所以将其称作谐波频带扩展(HBE)。关于超过标准的SBR的先行技术的HBE的效果,还通过低位速率下的音频编码的实验进行了确认(例如, 参照非专利文献1)。另外,上述两个变更仅对HF频谱发生器产生影响(109),HBE中的其他方法与SBR 完全相同。图2是表示先行技术的HBE中的HF频谱发生器的图。另外,HF频谱发生器由图 1的T-F变换108及HF重构109构成。输入某信号的LF部分,假设其HF频谱由从第2次 (具有最低频率的HF补丁(patch))到第T次(具有最高频率的HF补丁)的(T-I)个HF 谐波补丁(在各修补工程中制作1个HF补丁)构成。在先行技术的HBE中,这些HF补丁都从相位声码器并行地独立生成。如图2所示,具有不同的伸展系数O到k)的(T-I)个相位声码器OOl 203) 用于将输入的LF部分伸展。伸展后的输出具有不同的长度,对于这些输出,使其通过带通滤波器O04 206),并且进行再采样O07 209),将时间扩展变换为频率扩展,从而生成 HF补丁。通过将伸展系数设定为再采样系数的2倍,HF补丁维持信号的谐波构造,具有LF 部分的2倍的长度。并且,HF补丁全部被延迟调整OlO 212),将再采样处理为一个原因的、各种潜在的延迟进行补偿。在最后的步骤中,将延迟调整后的全部的HF补丁合计,并且变换到QMF域(213),制作成HF频谱。上述HF频谱发生器具有非常多的运算量。带来运算量的主要是因为时间扩展处理,该时间扩展处理通过在相位声码器中采用的一系列的短时间傅立叶变换(STFT)及逆短时间傅立叶变换(ISTFT)、以及对时间伸展后的HF部分采用的、后续的QMF处理来实现。以下介绍相位声码器及QMF变换的概况。相位声码器是通过使用频率域变换而实现时间伸展效果的周知的技术。S卩,是将局部性的频谱特征维持而不变更、并且将信号的经时变化修正的技术。其基本的原理如下。图3A及图;3B是表示由相位声码器进行的时间伸展的原理的图。如图3A所示,将音频划分为重叠的块,调整跳距(hop size)(连续的块间的时间间隔)在输入时及输出时不相同的块间的间隔。这里,由于输入跳距Ra比输出跳距Rs小, 结果,原来的信号被以以下的(式1)所示的比r扩展。[数式1]
Rr 二 f …(式 D
Rs如图IBB所示,将调整间隔后的块以需要频率域变换的相干方式叠加。一般,将输入块变换为频率,将相位适当修正后,将新的块变换为原来的输出块。按照上述原理,几乎全部的典型的相位声码器采用短时间傅立叶变换(STFT)作为频率域变换,需要分析的明示的顺序、以及用于时间伸展的修正及再合成。QMF组将时间域显示变换为时间一频率域结合显示(反之也同样),它在频谱频带复制(SBR)、参量立体声编码(PS)、及空间音频编码(SAC)等的基于参量的编码方式中被普遍使用。这些滤波器组的特征是,复数频率(子带)域信号通过系数2高效率地被过采样。 由此,能够不产生因混叠(aliasing)带来的畸变地进行子带域信号的后处理。
更详细地讲,如果设实数值的离散时间信号为χ (η),则通过QMF组的分析,用以下的(式2)求出复数子带域信号%(η)。[数式2]
权利要求
1.一种频带扩展方法,从低频带信号生成全频带信号,包括第1变换步骤,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频QMF频谱;变调步骤,对上述低频带信号适用互不相同的移位系数,由此生成变调后的多个信号;高频生成步骤,将变调后的上述多个信号在QMF域进行时间伸展,由此生成高频QMF频谱;频谱修正步骤,对上述高频QMF频谱进行修正,以满足高频能量及音调的条件;以及全频带生成步骤,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
2.如权利要求1所述的频带扩展方法, 上述高频生成步骤包括第2变换步骤,将变调后的上述多个信号变换到QMF域,由此生成多个QMF频谱; 谐波补丁生成步骤,将上述多个QMF频谱利用互不相同的多个伸展系数在时间维度方向上伸展,由此生成多个谐波补丁 ;调整步骤,对上述多个谐波补丁进行时间调整;以及合计步骤,将时间调整后的上述谐波补丁合计。
3.如权利要求2所述的频带扩展方法, 上述谐波补丁生成步骤包括计算步骤,计算上述QMF频谱的振幅及相位; 相位操作步骤,操作上述相位,由此生成新的相位;以及QMF系数生成步骤,对上述振幅和上述新的相位进行组合,由此生成新的QMF系数的组。
4.如权利要求3所述的频带扩展方法,在上述相位操作步骤中,基于QMF系数的组整体的原来的相位,生成上述新的相位。
5.如权利要求3或4所述的频带扩展方法,在上述相位操作步骤中,对QMF系数的组反复进行操作; 在上述QMF系数生成步骤中,生成多个上述新的QMF系数的组。
6.如权利要求3、4或5所述的频带扩展方法,在上述相位操作步骤中,根据QMF子带指标进行不同的操作。
7.如权利要求5所述的频带扩展方法,在上述QMF系数生成步骤中,将多个上述新的QMF系数的组交叠相加,由此生成与时间伸展后的音频信号对应的QMF系数。
8.一种频带扩展方法,从低频带信号生成全频带信号,包括第1变换步骤,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频QMF频谱;低次谐波补丁生成步骤,在上述QMF域对上述低频带信号进行时间伸展,由此生成低次谐波补丁;高频生成步骤,对上述低次谐波补丁适用互不相同的移位系数,由此生成变调后的多个信号,从上述多个信号生成高频QMF频谱;频谱修正步骤,对上述高频QMF频谱进行修正,以满足上述高频能量及音调的条件;以及全频带生成步骤,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
9.如权利要求8所述的频带扩展方法, 上述低次谐波补丁生成步骤包括第2变换步骤,将上述低频带信号变换为第2低频QMF频谱; 带通步骤,对上述第2低频QMF频谱进行带通处理;以及伸展步骤,将带通后的上述第2低频QMF频谱在时间维度方向上伸展。
10.如权利要求9所述的频带扩展方法,上述第2低频QMF频谱具有比上述第1低频QMF频谱高的频率分辨率。
11.如权利要求8、9或10所述的频带扩展方法, 上述高频生成步骤包括补丁生成步骤,对上述低次谐波补丁进行带通处理,由此生成多个带通后的补丁 ; 高次生成步骤,将带通后的上述多个补丁分别映射到高频而生成多个高次谐波补丁 ;以及合计步骤,将上述多个高次谐波补丁和上述低次谐波补丁合计。
12.如权利要求11所述的频带扩展方法, 上述高次生成步骤包括分解步骤,将带通后的补丁中的各QMF子带分为多个次子带; 映射步骤,将上述多个次子带映射到多个高频QMF子带;以及组合步骤,将上述多个次子带的映射结果进行组合。
13.如权利要求12所述的频带扩展方法, 上述映射步骤包括划分步骤,将QMF子带的上述多个次子带划分为阻带部分和通带部分; 频率计算步骤,利用基于补丁的次数的系数,计算上述通带部分上的多个次子带的变位后的中心频率;第1映射步骤,将上述通带部分上的多个次子带根据上述中心频率映射到多个高频 QMF子带;以及第2映射步骤,与上述通带部分上的多个次子带相应地将上述阻带部分上的多个次子带映射到高频QMF子带。
14.一种频带扩展装置,从低频带信号生成全频带信号,具备第1变换部,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频 QMF频谱;变调部,对上述低频带信号适用互不相同的移位系数,由此生成变调后的多个信号; 高频生成部,将变调后的上述多个信号在QMF域进行时间伸展,由此生成高频QMF频谱;频谱修正部,对上述高频QMF频谱进行修正,以满足高频能量及音调的条件;以及全频带生成部,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
15.一种频带扩展装置,从低频带信号生成全频带信号,具备第1变换部,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频 QMF频谱;低次谐波补丁生成部,在上述QMF域对上述低频带信号进行时间伸展,由此生成低次谐波补丁 ;高频生成部,对上述低次谐波补丁适用互不相同的移位系数,由此生成变调后的多个信号,从上述多个信号生成高频QMF频谱;频谱修正部,对上述高频QMF频谱进行修正,以满足上述高频能量及音调的条件;以及全频带生成部,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
16.一种程序,用来从低频带信号生成全频带信号,使计算机执行如下步骤第1变换步骤,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频QMF频谱;变调步骤,对上述低频带信号适用互不相同的移位系数,由此生成变调后的多个信号;高频生成步骤,将变调后的上述多个信号在QMF域进行时间伸展,由此生成高频QMF频谱;频谱修正步骤,对上述高频QMF频谱进行修正,以满足高频能量及音调的条件;以及全频带生成步骤,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
17.一种程序,用来从低频带信号生成全频带信号,使计算机执行如下步骤第1变换步骤,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频QMF频谱;低次谐波补丁生成步骤,在上述QMF域对上述低频带信号进行时间伸展,由此生成低次谐波补丁;高频生成步骤,对上述低次谐波补丁适用互不相同的移位系数,由此生成变调后的多个信号,从上述多个信号生成高频QMF频谱;频谱修正步骤,对上述高频QMF频谱进行修正,以满足上述高频能量及音调的条件;以及全频带生成步骤,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
18.一种集成电路,从低频带信号生成全频带信号,具备第1变换部,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频 QMF频谱;变调部,对上述低频带信号适用互不相同的移位系数,由此生成变调后的多个信号; 高频生成部,将变调后的上述多个信号在QMF域进行时间伸展,由此生成高频QMF频频谱修正部,对上述高频QMF频谱进行修正,以满足高频能量及音调的条件;以及全频带生成部,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
19.一种集成电路,从低频带信号生成全频带信号,具备第1变换部,将上述低频带信号变换到正交镜像滤波器组即QMF域,由此生成第1低频 QMF频谱;低次谐波补丁生成部,在上述QMF域对上述低频带信号进行时间伸展,由此生成低次谐波补丁 ;高频生成部,对上述低次谐波补丁适用互不相同的移位系数,由此生成变调后的多个信号,从上述多个信号生成高频QMF频谱;频谱修正部,对上述高频QMF频谱进行修正,以满足上述高频能量及音调的条件;以及全频带生成部,对修正后的上述高频QMF频谱和上述第1低频QMF频谱进行组合,由此生成上述全频带信号。
20.一种音频解码装置,具备分离部,从编码信息分离被编码的低频带信号; 解码部,对上述被编码的低频带信号进行解码;变换部,将通过上述解码部的解码生成的低频带信号变换到正交镜像滤波器组即QMF 域,由此生成低频QMF频谱;变调部,对所生成的上述低频带信号适用互不相同的移位系数,由此生成变调后的多个信号;高频生成部,将变调后的上述多个信号在QMF域进行时间伸展,由此生成高频QMF频谱;频谱修正部,对上述高频QMF频谱进行修正,以满足高频能量及音调的条件; 全频带生成部,对修正后的上述高频QMF频谱和上述低频QMF频谱进行组合,由此生成全频带信号;以及逆变换部,将上述全频带信号从正交镜像滤波器组即QMF域的信号变换为时间域的信号。
21.一种音频解码装置,具备分离部,从编码信息分离编码的低频带信号; 解码部,对上述编码的低频带信号进行解码;变换部,将通过上述解码部的解码生成的低频带信号变换到正交镜像滤波器组即QMF 域,由此生成低频QMF频谱;低次谐波补丁生成部,在上述QMF域对上述低频带信号进行时间伸展,由此生成低次谐波补丁 ;高频生成部,对上述低次谐波补丁适用互不相同的移位系数,由此生成变调后的多个信号,从上述多个信号生成高频QMF频谱;频谱修正部,对上述高频QMF频谱进行修正,以满足高频能量及音调的条件; 全频带生成部,对修正后的上述高频QMF频谱和上述低频QMF频谱进行组合,由此生成全频带信号;以及逆变换部,对上述全频带信号从正交镜像滤波器组即QMF域的信号变换为时间域的信号。
全文摘要
提供一种能够减少频带扩展的运算量、并且抑制扩展的频带的品质下降的频带扩展方法。在该频带扩展方法中,通过将低频带信号变换到QMF域,生成第1低频QMF频谱(S11),通过对低频带信号适用互不相同的移位系数,生成变调后的多个信号(S12),通过在QMF域进行时间伸展,生成高频QMF频谱(S13),对该高频QMF频谱进行修正(S14),对修正后的高频QMF频谱与第1低频QMF频谱进行组合(S15)。
文档编号G10L21/02GK102473417SQ20118000321
公开日2012年5月23日 申请日期2011年6月6日 优先权日2010年6月9日
发明者则松武志, 周欢, 张国成, 石川智一, 钟海珊 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1