叉积增强的谐波转置的制作方法

文档序号:2826082阅读:211来源:国知局
叉积增强的谐波转置的制作方法
【专利摘要】本发明涉及使用用于高频重建(HFR)的谐波转置方法的音频编码系统。描述了一种用于从信号的低频分量生成信号的高频分量的系统和方法。该系统包括提供信号的低频分量的多个分析子带信号的分析滤波器组。该系统还包括非线性处理单元,其通过改变所述多个分析子带信号中的第一分析子带信号和第二分析子带信号的相位并且通过混合相位改变的分析子带信号而生成具有合成频率的合成子带信号。最后,该系统包括用于从合成子带信号生成信号的高频分量的合成滤波器组。
【专利说明】叉积增强的谐波转置
[0001]本发明申请是国际申请日为2010年I月15日、国际申请号为“PCT/EP2010/050483”、国家申请号为“201080004764.8”、发明名称为“叉积增强的谐波转置”的发明专利申请的分案申请。
【技术领域】
[0002]本发明涉及使用用于高频重建(HFR)的谐波转置(transposition)方法的音频编码系统。
【背景技术】
[0003]HFR技术(例如频谱复制(SBR)技术)使得显著改进传统感知音频编解码器的编码效率。与MPEG-4高级音频编码(AAC)组合,它形成非常有效的音频编解码器,已将其用在XM卫星无线电系统和全球数字无线电系统(Digital Radio Mondiale)中。AAC和SBR的组合被称为aacPlus。这是MPEG-4标准的部分,其中,它被称作高效AAC规格(HighEfficiency AAC Profile)。通常,HFR技术可以通过后向和前向兼容的方式与任何感知音频编解码器组合,因此提供使已经建立的广播系统(类似于Eureka DAB系统中使用的MPEG层-2)升级的可能性。HFR转置方法也可以与语音编解码器组合以允许超低比特率的宽带语音。
[0004]HRF之后的基本构思是观测到通常存在信号的高频率范围的特性与同一信号的低频率范围的特性之间的强相关性。因此,通过从低频率范围到高频率范围的信号转置可以实现对于信号的原始输入高频率范围的表示的良好近似。
[0005]WO 98/57436中建立了这种转置的构思,以作为用于从音频信号的较低频带重建高频带的方法。通过在音频编 码和/或语音编码中使用该构思可以获得比特率的大量节省。下文中,将提到音频编码,但应注意描述的方法和系统同样可应用于语音编码并且可应用在统一的语音和音频编码(USAC)中。
[0006]在基于HFR的音频编码系统中,低带宽信号被提供给核心波形编码器,使用通常以非常低的比特率被编码的并且描述目标谱形状的附加边信息和低带宽信号的转置在解码器侧再生成较高频率。对于低比特率,在核心编码的信号的带宽窄的情况下,重建具有感知愉悦特性的高带(即音频信号的高频率范围)变得愈加重要。以下提及谐波频率重建方法的两种变型,一个被称为谐波转置,而另一个被称为单边带调制。
[0007]WO 98/57436中定义的谐波转置的原理是具有频率ω的正弦波映射成具有频率Τω的正弦波,其中,T>1是定义转置阶的整数。谐波转置的有吸引力的特征在于,其通过等于转置阶的因子(即通过等于T的因子)将源频率范围扩展到目标频率范围。对于复杂音乐材料,谐波转置良好地执行。此外,谐波转置呈现低交叉频率,即,从低于交叉频率的相对小的低频率范围可以生成高于交叉频率的大的高频率范围。
[0008]与谐波转置对照,基于单边带调制(SSB)的HFR将具有频率ω的正弦波映射成具有频率ω + Λ ω的正弦波,其中,△ ω是固定频率偏移。已经观测到若给定具有低带宽的核心信号,则由于SSB转置会导致失谐振铃假声(ringing artifact)。还应注意,对于低交叉频率(即小的源频率范围),谐波转置将需要比基于SSB的转置更少数目的补丁块(patch),以填充期望的目标频率范围。以举例的方式,如果应填充(ω,4ω]的高频率范
围,则使用转置阶Τ=4,谐波转置可以从( + 的低频率范围填充该频率范围。另一方面,
使用相同低频率范围的基于SSB的转置必须使用的频率偏移,并且需要重复处
理四次以填充高频率范围(ω,4ω]。
[0009]另一方面,如已经在WO 02/052545 Al中指出的那样,谐波转置对于具有显著周期结构的信号具有缺点。这些信号是具有频率Ω、2Ω、3Ω、...的谐波相关的正弦波的叠加,其中,Ω是基频。
[0010]在阶T的谐波转置时,输出正弦波具有频率ΤΩ、2ΤΩ、3ΤΩ、...,在T>1的情况下,其仅是期望的全谐波序列的严格子集。关于所得音频质量,通常将感知与转置的基频τ Ω对应的“鬼影(ghost)”音调。一般,谐波转置产生编码的和解码的音频信号的“金属”声音
特性。通过将若干转置阶T=2、3.....Tmax加到HFR可以将该情况减缓到一定程度,但如果
要避免多数谱隙,则该方法在计算上是复杂的。
[0011]WO 02/052545Α1中已经提出了当使用谐波转置时用于避免“鬼影”音调出现的替选解决方案。该解决方案在于使用两种类型的转置,即典型谐波转置和特殊“脉冲转置”。描述的方法教导对于被检测为具有类似脉冲串(pulse-train)特性的周期的音频信号的部分切换到专用“脉冲转置”。该方法的问题在于,与基于高分辨率滤波器组的谐波转置相t匕,对复杂音乐材料应用“脉冲转置” 一般使得质量下降。因此,必须相当谨慎地调谐检测机制,以使得对于复杂材料不使用脉冲转置。不可避免地,单音调乐器和声音有时将被分类为复杂信号,由此调用谐波转置并且因此丢失谐波。此外,如果在单音调信号或具有较弱复杂背景中的主要音调的信号的中间发生切换,则在具有非常不同的谱填充特性的这两种转换方法之间切换自身将生成可听见的假声。

【发明内容】

[0012]本发明提供一种用于完成由于周期信号的谐波转置而产生的谐波序列的方法和系统。频域转置包括步骤:将来自分析滤波器组的非线性改变的子带信号映射到合成滤波器组的选择的子带。非线性改变包括相位改变或相位旋转,其是在幅度调整之后可以在复滤波器组域中通过幂法则获得的。而现有技术转置一次分开地改变一个分析子带,本发明教导将用于每个合成子带的至少两个不同分析子带的非线性组合相加。待混合的分析子带之间的间隔可以与待转置的信号的主分量的基频有关。
[0013]在多数常见形式中,本发明的数学描述是使用一组频率分量ωι、ω2.....ω,来创
建新的频率分量
[0014]ω =T1 ω ω 2+...+Tk ω κ,
[0015]其中,系数?\、Τ2.....Tk是整数转置阶,它们的和是总转置阶T=TJT2+...+!^通
过用因子!^!^.....Tk改变K个适当选取的子带信号的相位并且将结果重组为具有等于改
变的相位之和的相位的信号,来获得这种效果。重要的是,注意,由于各转置阶是整数,因此准确定义了所有这些相位操作并且它们是不模糊的,并且只要总转置阶满足T > 1,这些整数中的一些甚至可以是负数。
[0016]现有技术方法与情况K=I对应,本发明教导使用K > 2。描述的文本主要处理情况K=2, T≥2,由于其足以解决手上的多数具体问题。但应注意,认为情况Κ>2同样被本文献公开和涵盖。
[0017]本发明使用来自较高数目的较低频带分析信道(即较高数目的分析子带信号)的信息,以将来自分析滤波器组的非线性改变的子带信号映射到合成滤波器组的选择的子带。转置不仅是一次分开地修改一个子带,而且其将用于每个合成子带的至少两个不同分析子带的非线性组合相加。如已经提到的,阶T的谐波转置被设计为将频率ω的正弦波映射为具有频率Τω的正弦波,其中,Τ>1。根据本发明,具有音调(pitch)参数Ω和索引0〈r〈T的所谓的叉积增强被设计为将具有频率(ω,ω + Ω)的正弦波的对映射为具有频率(T-r) ω+(ω + Ω)=Τω+Ω的正弦波。应理解,对于这些叉积转置,通过利用范围从I到T-1的索引r将音调参数Ω的所有叉积加到阶T的谐波转置上,将生成具有周期Ω的周期信号的所有部分频率。
[0018]根据本发明的一方面,描述了一种用于从信号的低频分量生成该信号的高频分量的系统和方法。应注意,在系统的背景中以下描述的特征同样可应用于本发明的方法。例如,信号可以是音频和/或语音信号。该系统和方法可被用于统一的语音和音频信号编码。信号包括低频分量和高频分量,其中,低频分量包括低于特定交叉频率的频率,而高频分量包括高于交叉频率的频率。在特定情况下,可能需要从信号的低频分量估计其高频分量。通过举例的方式,特定音频编码方案仅对音频信号的低频分量进行编码,并且目的是可通过使用关于原始高频分量的包络的特定信息仅从解码的低频分量重建该信号的高频分量。在此描述的系统和方法可以用在这样的编码和解码系统的背景下。
[0019]用于生成高频分量的系统包括分析滤波器组,其提供信号的低频分量的多个分析子带信号。这样的分析滤波器组可以包括具有恒定带宽的一组带通滤波器。注意,在语音信号的背景下,也可以有利地使用具有对数带宽分布的一组带通滤波器。分析滤波器组的目的是将信号的低频分量分离成其频率贡献。这些频率贡献将反映在分析滤波器组生成的多个分析子带信号中。通过举例的方式,包括乐器演奏的音符的信号将被分离成具有用于与演奏的音符的谐波频率对应的子带的显著幅度的分析子带信号,而其它子带将呈现具有低幅度的分析子带信号。
[0020]该系统还包括:非线性处理单元,其用于通过改变或旋转所述多个分析子带信号中的第一分析子带信号和第二分析子带信号的相位并且通过混合相位改变的分析子带信号而生成具有特定合成频率的合成子带信号。通常,第一分析子带信号和第二分析子带信号不同。换句话说,它们与不同子带对应。非线性处理单元可以包括其内生成有合成子带信号的所谓的交叉项处理单元。合成子带信号包括合成频率。通常,合成子带信号包括来自特定合成频率范围的频率。合成频率是在该频率范围内的频率,例如频率范围的中心频率。合成频率以及还有合成频率范围通常高于交叉频率。通过类似的方式,分析子带信号包括来自特定分析频率范围的频率。这些分析频率范围通常低于所述交叉频率。
[0021]相位改变的操作可以包括转置分析子带信号的频率。典型地,分析滤波器组得到可被表示为包括幅度和相位的复指数的复分析子带信号。复子带信号的相位与子带信号的频率对应。通过取得子带信号的转置阶T'次的幂,可以执行借助于特定转置阶T'的这些子带信号的转置。这导致复子带信号的相位乘以转置阶T'。因此,转置的分析子带信号呈现比初始相位或频率大T'倍的相位或频率。该相位改变操作也可以被称为相位旋转或相位相乘。
[0022]此外,该系统包括:合成滤波器组,其用于从合成子带信号生成信号的高频分量。换句话说,合成滤波器组的目的在于,合并来自可能的多个合成频率范围的可能的多个合成子带信号,并且在时域中生成所述信号的高频分量。应注意,对于包括基频(例如基频Ω)的信号,有利的是,合成滤波器组和/或分析滤波器组呈现与信号的基频相关联的频率间隔。具体地说,有利的是,选取具有足够低频率间隔或足够高分辨率的滤波器组以解析基频Ω。
[0023]根据本发明的另一方面,非线性处理单元或非线性处理单元内的交叉项处理单元包括第一转置阶和第二转置阶的多输入单输出单元,其从分别呈现第一分析频率和第二分析频率的第一分析子带信号和第二分析子带信号生成合成子带信号。换句话说,多输入单输出单元执行第一分析子带信号和第二分析子带信号的转置,并且将两个转置的分析子带信号合并为合成子带信号。第一分析子带信号被相位改变,或将其相位乘以第一转置阶,并且第二分析子带信号被相位改变,或将其相位乘以第二转置阶。在复分析子带信号的情况下,这种相位改变操作包括:将各分析子带信号的相位乘以各转置阶。混合两个转置的分析子带信号,以得到具有合成频率的混合的合成子带信号,该合成频率与乘以第一转置阶的第一分析频率加上乘以第二转置阶的第二分析频率对应。该混合步骤可以包括两个转置的复分析子带信号的相乘。两个信号之间的这种相乘可以包括它们的采样的相乘。上述特征也可以通过公式表示。设第一分析频率是ω,并且第二分析频率是(ω + Ω)。应注意,这些变量也可以表示两个分析子带信号的各分析频率范围。换句话说,频率应理解为表示特定频率范围或频率子带内包括的所有频率,即第一和第二分析频率也应理解为第一和第二分析频率范围或第一和第二分析子带。此外,第一转置阶可以是(T-r),第二转置阶可以是r。有利的是,限制转置阶以使得T>1并且I ( r〈T。对于这些情况,多输入单输出单元可以得至IJ具有(T-r).ω+r.(ω + Ω)的合成频率的合成子带信号。
[0024]根据本发明的另一方面,该系统包括多个多输入单输出单元和/或多个非线性处理单元,其生成具有合成频率的多个部分合成子带信号。换句话说,可以生成覆盖相同合成频率范围的多个部分合成子带信号。在这样的情况下,子带求和单元被设置为混合所述多个部分合成子带信号。混合的部分合成子带信号于是表示合成子带信号。混合操作可以包括:将所述多个部分合成子带信号加到一起。其也可以包括:从所述多个部分合成子带信号确定平均合成子带信号,其中,合成子带信号可以根据它们对于合成子带信号的相关性而被加权。混合操作也可以包括:选择例如具有超过预定义阈值的幅度的多个子带信号中的一个或一些。应注意,有利的是,将合成子带信号乘以增益参数。注意,在存在多个部分合成子带信号的情况下,这样的增益参数可有助于合成子带信号的归一化。
[0025]根据本发明的另一方面,非线性处理单元还包括:直接处理单元,其用于从所述多个分析子带信号中的第三分析子带信号生成另一合成子带信号。这样的直接处理单元可以执行例如WO 98/57436中描述的直接转置方法。如果该系统包括附加直接处理单元,则其需要提供用于混合对应合成子带信号的子带求和单元。这样的对应合成子带信号通常是覆盖相同合成频率范围和/或呈现相同合成频率的子带信号。子带求和单元可以根据以上概述的方面进行混合。如果例如来自组成合成子带信号的交叉项的一个或更多个分析子带信号的幅度的最小值小于信号的幅度的预定义分数,则也可以忽略特定合成子带信号,尤其是生成在多输入单输出单元中的特定合成子带信号。信号可以是信号的低频分量或特定分析子带信号。该信号也可以是特定合成子带信号。换句话说,如果用于生成合成子带信号的分析子带信号的幅度或能量太小,则该合成子带信号可以不用于生成信号的高频分量。例如,通过确定分析子带信号的多个邻近采样上的时间平均或滑动窗平均,对于每个采样可以确定能量或幅度,或对于一组采样可以确定能量或幅度。[0026]直接处理单元可以包括第三转置阶T'的单输入单输出单元,其从呈现第三分析频率的第三分析子带信号生成合成子带信号,其中,第三分析子带信号通过第三转置阶T,被相位改变,或将其相位乘以第三转置阶T',并且其中,T'大于I。合成频率于是与乘以第三转置阶的第三分析频率对应。应注意,该第三转置阶T'优选地等于以下介绍的系统转置阶T。
[0027]根据本发明的另一方面,分析滤波器组具有N个分析子带,所述N个分析子带具有基本恒定子带间隔Δω。如上所述,该子带间隔△ ω可以与信号的基频相关联。分析子带与分析子带索引η相关联,其中,n e (1,...,N)。换句话说,可以通过子带索引η来标识分析滤波器组的分析子带。以类似的方式,可以利用子带索引η来标识包括来自对应分析子带的频率范围的频率的分析子带信号。
[0028]在合成侧,合成滤波器组也具有与合成子带索引η相关联的合成子带。该合成子带索引η也标识包括来自具有子带索引η的合成子带的合成频率范围的频率的合成子带信号。如果该系统具有系统转置阶,(也被称为总转置阶)Τ,则合成子带通常具有Λ ω.Τ的基本恒定子带间隔,即,合成子带的子带间隔比分析子带的子带间隔大T倍。在这些情况下,具有索引η的合成子带和分析子带均包括通过因子或系统转置阶T而彼此有关的频率范围。通过举例的方式,如果具有索引η的分析子带的频率范围是[(η-1).ω,η.ω],则具有索引η的合成子带的频率范围是[Τ.(η-1).ω,Τ.η.ω]。
[0029]假定合成子带信号与具有索引η的合成子带相关联,则本发明的另一方面在于,在多输入单输出单元中从第一分析子带信号和第二分析子带信号生成具有索引η的该合成子带信号。第一分析子带信号与具有索引n-Pl的分析子带相关联,第二分析子带信号与具有索引η+Ρ2的分析子带相关联。
[0030]以下,概述了用于选择索引偏移的对(Pl,P2)的若干方法。通过所谓的索引选择单元可以执行该方法。典型地,选择索引偏移的最佳对,以生成具有预定义合成频率的合成子带信号。在第一种方法中,从存储在索引存储单元中的对(P1, P2)的有限列表选择索引偏移P1和巧。从索引偏移对的该有限列表可以选择对(P1, P2),使得包括第一分析子带信号的幅度和第二分析子带信号的幅度的集合的最小值被最大化。换句话说,对于索引偏移P1和P2的每一可能的对,可以确定对应分析子带信号的幅度。在复分析子带信号的情况下,幅度对应于绝对值。例如,通过确定分析子带信号的多个邻近采样上的时间平均或滑动窗平均,对于每个采样可以确定幅度,或对于一组采样可以确定幅度。这分别得到第一分析子带信号和第二分析子带信号的第一幅度和第二幅度。考虑第一幅度和第二幅度的最小值,并且选择该最小幅度值为最高的索引偏移对(P1, P2)。[0031]在另一方法中,从对(Pl,P2)的有限列表选择索引偏移PdPP2,其中,通过公式Pl=r.1和p2=(T-r).1确定有限列表。在这些公式中,I是正整数,取值例如从I到10。在用于转置第一分析子带(I1-P1)的第一转置阶是(T-r)并且用于转置第二分析子带(n+p2)的第二转置阶是r的情况下,该方法尤其有用。假设系统转置阶T是固定的,则可以选择参数I和r以使得包括第一分析子带信号的幅度和第二分析子带信号的幅度的集合的最小值被最大化。换句话说,通过如上所述的最大-最小优化方法可以选择参数I和r。
[0032]在另一方法中,基于潜在信号的特性可以选择第一分析子带信号和第二分析子带信号。注意,如果信号包括基频Ω,Β卩如果信号是具有脉冲串式特性的周期性信号,则有利的是,考虑该信号特性来选择索引偏移P1和&。从信号的低频分量可以确定基频Ω,或从包括低频分量和高频分量的原始信号可以确定基频Ω。在第一种情况下,使用高频重建在信号解码器处可以确定基频Ω,而在第二种情况下,通常会在信号编码器处确定基频Ω,然后传送到对应信号解码器。如果使用具有子带间隔△ ω的分析滤波器组,并且如果用于转置第一分析子带(I1-P1)的第一转置阶是(T-r),并且如果用于转置第二分析子带(n+p2)的第二转置阶是r,则可以选择P1和p2,使得它们的和Pl+P2近似于分数Ω / Λ ω,并且它们的分数P1A^近似于r/ (T-r)。在特定情况下,选择P1和p2,使得分数P1A^等于r/ (T-r)。
[0033]根据本发明的另一方面,用于生成信号的高频分量的系统还包括:分析窗,其在预定义时间k周围隔离预定义时间间隔的低频分量。该系统可以还包括:合成窗,其在预定义时间k周围隔离预定义时间间隔的高频分量。这些窗对于具有随时间改变的频率贡献的信号特别有用。它们允许分析信号的瞬时频率组成。与滤波器组组合,这种时间相关频率分析的典型示例是短时间傅立叶变换(STFT)。应注意,分析窗一般是合成窗的时间扩展版本。对于具有系统阶转置T的系统,时域中的分析窗可以是具有扩展因子T的时域中的合成窗的时间扩展版本。
[0034]根据本发明的 另一方面,描述了一种用于对信号进行解码的系统。该系统采用信号的低频分量的编码的版本,并且包括根据上述系统的转置单元,用于从信号的低频分量生成信号的高频分量。典型地,这种解码系统还包括:核心解码器,其用于对信号的低频分量进行解码。该解码系统还可以包括:上采样器,其用于执行低频分量的上采样,以得到上采样的低频分量。如果在编码器处已经下采样信号的低频分量,则这可以是需要的,利用如下事实:与原始信号相比,低频分量仅覆盖减少的频率范围。此外,该解码系统可以包括:输入单元,其用于接收包括低频分量的编码的信号;以及输出单元,其用于提供包括低频分量和生成的高频分量的解码的信号。
[0035]该解码系统还可以包括:包络调整器,其用于对高频分量整形。虽然使用本发明中描述的高频重建系统和方法从信号的低频率范围可以再生成信号的高频率,但有利的是,从原始信号提取关于其高频分量的谱包络的信息。该包络信息然后可以提供给解码器,以生成良好地近似原始信号的高频分量的谱包络的高频分量。通常在解码系统处在包络调整器中执行该操作。为接收与信号的高频分量的包络有关的信息,该解码系统可以包括:包络数据接收单元。然后可以在分量求和单元中对再生的高频分量和解码的可能上采样的低频分量求和,以确定解码的信号。
[0036]如上所述,用于生成高频分量的系统可以使用关于要被转置和混合以生成特定合成子带信号的分析子带信号的信息。为此,该解码系统还可以包括:子带选择数据接收单元,其用于接收允许第一分析子带信号和第二分析子带信号的选择的信息,从第一分析子带信号和第二分析子带信号生成合成子带信号。该信息可以与编码的信号的特定特性有关,例如,信息可以与信号的基频Ω相关联。信息也可以与要选择的分析子带直接有关。通过举例的方式,信息可以包括可能的索引偏移的对(P1, P2)的列表或第一分析子带信号和第二分析子带信号的可能的对的列表。
[0037]根据本发明的另一方面,描述了一种编码的信号。该编码的信号包括与解码的信号的低频分量有关的信息,其中,低频分量包括多个分析子带信号。此外,编码的信号包括与选择所述多个分析子带信号中的两个以通过转置选择的两个分析子带信号生成解码的信号的高频分量有关的信息。换句话说,编码的信号包括信号的低频分量的可能编码的版本。此外,它提供例如可能的索引偏移对(Pl,P2)的列表或信号的基频Ω的信息,这将允许解码器基于本文献中概述的叉积增强的谐波转置方法再生成信号的高频分量。
[0038]根据本发明的另一方面,描述了一种用于对信号进行编码的系统。该编码系统包括:分离单元,其用于将信号分离成低频分量和高频分量;以及核心编码器,其用于对低频分量进行编码。它还包括:频率确定单元,其用于确定信号的基频Ω ;以及参数编码器,其用于对基频Ω进行编码,其中,基频Ω用在解码器中,以再生成信号的高频分量。该系统可以还包括:包络确定单元,其用于确定高频分量的谱包络;以及包络编码器,其用于对谱包络进行编码。换句话说,编码系统移除原始信号的高频分量并且通过核心编码器(例如AAC或杜比D编码器)对低频分量进行编码。此外,编码系统分析原始信号的高频分量,并且确定在解码器处使用的信息的集合,以再生成解码的信号的高频分量。信息的集合可以包括信号的基频Ω和/或高频分量的谱包络。
[0039]编码系统还可以包括:分析滤波器组,其提供信号的低频分量的多个分析子带信号。此外,它可以包括:子带对确定单元,其用于确定用于生成信号的高频分量的第一子带信号和第二子带信号;以及索引编码器,其用于对表示确定的第一子带信号和第二子带信号的索引号进行编码。换句话说,编码系统可以使用本文献中描述的高频重建方法和/或系统,以确定分析子带,从所述分析子带可以生成信号的高频子带以及最终为高频分量。关于这些子带的信息(例如索引偏移对(Pl,P2)的有限列表)然后可以被编码并且提供给解码器。
[0040]如以上所强调的,本发明还包括用于生成信号的高频分量的方法、以及用于对信号进行解码和编码的方法。在系统的背景下上文中概述的特征同样可应用于对应的方法。以下概述了根据本发明的方法的选择的方面。以类似的方式,这些方面也可应用于本文献中概述的系统。
[0041]根据本发明的另一方面,描述了一种用于从信号的低频分量执行高频分量的高频重建的方法。该方法包括步骤:提供来自第一频带的低频分量的第一子带信号以及来自第二频带的低频分量的第二子带信号。换句话说,从信号的低频分量隔离两个子带信号,第一子带信号包括第一频带,第二子带信号包括第二频带。优选地,两个频率子带不同。在另一步骤中,分别通过第一转置因子和第二转置因子转置第一子带信号和第二子带信号。根据用于转置信号的已知方法可以执行每个子带信号的转置。在复子带信号的情况下,可以通过利用各转置因子或转置阶改变相位或者通过将相位乘以各转置因子或转置阶来执行转置。在另一步骤中,混合转置的第一子带信号和第二子带信号,以得到包括来自高频带的频率的高频分量。
[0042]可以执行转置,使得高频带与乘以第一转置因子的第一频带和乘以第二转置因子的第二频带之和相对应。此外,转置步骤可以包括步骤:将第一子带信号的第一频带乘以第一转置因子,并且将第二子带信号的第二频带乘以第二转置因子。为了简化说明并且不限制其范围,针对单个频率的转置来说明本发明。然而,应注意,不仅针对单个频率而且针对整个频带(即针对频带内包括的多个频率)来执行转置。实际上,在本文献中,频率的转置和频带的转置应理解为可互换。然而,需要意识到分析滤波器组和合成滤波器组的不同频率分辨率。
[0043]在上述方法中,提供步骤可以包括:通过分析滤波器组对低频分量进行滤波以生成第一子带信号和第二子带信号。另一方面,混合步骤可以包括:将第一转置的子带信号和第二转置的子带信号相乘以得到高子带信号,以及将高子带信号输入到合成滤波器组以生成高频分量。到某种频率表示和来自某种频率表示的其它信号变换也是可能的并且在本发明的范围内。这些信号变换包括傅立叶变换(FFT,DCT)、小波变换、正交镜像滤波(QMF)等。此外,这些变换还包括窗函数,目的是隔离“要变换的”信号的减少的时间间隔。可能的窗函数包括高斯窗、余弦窗、汉明窗、汉宁窗、矩形窗、巴特利特窗、布莱克曼窗等。在本文献中,术语“滤波器组”可以包括与任何这些窗函数可组合的任何这些变换。
[0044]根据本发明的另一方面,描述了一种用于对编码的信号进行解码的方法。编码的信号是从原始信号得到的,并且仅表示低于交叉频率的原始信号的频率子带的部分。该方法包括步骤:提供编码的信号的第一频率子带和第二频率子带。这可以通过使用分析滤波器组完成。然后,分别通过第一转置因子和第二转置因子来转置频率子带。这可以通过利用第一转置因子执行第一频率子带中信号的相位改变或相位相乘并且通过利用第二转置因子执行第二频率子带中信号的相位改变或相位相乘而完成。最后,从第一转置的频率子带和第二转置的频率子带生成高频率子带,其中高频率子带高于交叉频率。高频率子带可以与乘以第一转置因子的第一频率子带和乘以第二转置因子的第二频率子带之和相对应。
[0045]根据本发明的另一方面,描述了一种用于对信号进行编码的方法。该方法包括步骤:对信号进行滤波,以隔离信号的低频率;以及对信号的低频分量进行编码。此外,提供信号的低频分量的多个分析子带信号。这可以通过使用本文献中描述的分析滤波器组完成。然后,确定用于生成信号的高频分量的第一子带信号和第二子带信号。这可以使用本文献中概述的高频重建方法和系统完成。最后,对表示确定的第一子带信号和第二子带信号的信息进行编码。这种信息可以是原始信号的特性,(例如信号的基频Ω)、或与选择的分析子带有关的信息(例如索引偏移对(Pl,P2))。
[0046]应注意,可以任意地组合本发明的上述实施例和方法。具体地说,应注意,针对系统概述的方面也可应用于本发明包括的对应方法。此外,应注意,本发明的公开内容还覆盖除了后面提到的从属权利要求中明显给出的权利要求组合之外的其它权利要求组合,即,能够以任何顺序和任何形式组合权利要求及其技术特征。
【专利附图】

【附图说明】
[0047]现在将以并非限制本发明的范围的说明性示例的方式来描述本发明。将参照附图来描述本发明,在附图中:[0048]图1图示了 HFR增强的音频解码器的操作;
[0049]图2图示了使用若干阶的谐波转置器的操作;
[0050]图3图示了频域(FD)谐波转置器的操作;
[0051]图4图示了交叉项处理的本发明使用的操作;
[0052]图5图示了现有技术的直接处理;
[0053]图6图示了单个子带的现有技术的直接非线性处理;
[0054]图7图示了本发明的交叉项处理的部件;
[0055]图8图示了交叉项处理块的操作;
[0056]图9图示了图8的MISO系统中的每一个中包含的本发明的非线性处理;
[0057]图10至图18图示了示例性周期信号的谐波转置的本发明的效果;
[0058]图19图示了短时间傅立叶变换(STFT)的时间-频率分辨率;
[0059]图20图示了在合成侧使用的窗函数及其傅立叶变换的示例性时间进展。
[0060]图21图示了正弦输入信号的STFT ;
[0061]图22图示了在分析侧使用的根据图20的窗函数及其傅立叶变换;
[0062]图23和图24图示了用于合成滤波器组子带的交叉项增强的适当的分析滤波器组子带的确定;
[0063]图25、图26和图27图示了描述的直接项和交叉项谐波转置方法的实验结果。
[0064]图28和图29图示了分别使用本文献中概述的增强的谐波转置方案的编码器和解码器的实施例;以及
[0065]图30图示了图28和图29所示的转置单元的实施例。
【具体实施方式】
[0066]下述实施例仅说明所谓的叉积增强的谐波转置的本发明的原理。应理解,在此描述的布置和细节的修改和变形对于本领域技术人员将是明显的。因此,目的是仅由所附本发明权利要求的范围而不是以这里的实施例的描述和说明的方式提出的具体细节来限制。
[0067]图1图示了 HFR增强的音频解码器的操作。核心音频解码器101输出低带宽音频信号,该低带宽音频信号被馈送到可能需要的用以按照期望的全采样率产生最终音频输出贡献(contribution)的上采样器104。对于双速率系统需要这种上采样,其中,在以全采样频率处理HFR部分的同时,带有限核心音频编解码器以外部音频采样率的一半操作。因此,对于单速率系统,省略该上采样器104。101的低带宽输出还被发送到输出转置的信号(即包括期望的高频率范围的信号)的转置器或转置单元102。包络调整器103在时间和频率上可以对该转置的信号整形。最终音频输出是低带宽核心信号与包络调整的转置的信号之和。
[0068]图2图示了与图1的转置器102对应的谐波转置器201的操作,谐波转置器201
包括不同转置阶T的若干转置器。待转置的信号传递到分别具有转置阶T=2、3.....Tfflax的
单独转置器201-2、201-3.....201-Tmax的组。通常,转置阶Tmax=3对于大多数音频编码应
用是足够的。在202中对不同转置器201-2,201-3,...>201-Tmax的贡献求和,以得到混合的转置器输出。在第一实施例中,该求和操作可以包括将各贡献加到一起。在另一实施例中,利用不同权重将贡献加权以使得减轻将多个贡献加到特定频率上的效果。例如,第三阶贡献可以与比第二阶贡献更低的增益相加。最后,求和单元202可以根据输出频率有选择 地将贡献相加。例如,第二阶转置可被用于第一较低目标频率范围,而第三阶转置可被用于 第二较高目标频率范围。
[0069]图3图示了频域(FD)谐波转置器(例如201的单独块之一,即转置阶T的转置器 201-T之一)的操作。分析滤波器组301输出复子带,复子带被递送到非线性处理302,非 线性处理302根据选取的转置阶T来改变子带信号的相位和/或幅度。改变的子带被馈送 到合成滤波器组303,合成滤波器组303输出转置的时域信号。在如图2所示的不同转置阶
的多个并行转置器的情况下,在不同转置器201-2、201-3.....201-T_之间可以共享一些
滤波器组操作。可以针对分析或合成来进行滤波器组的共享。在共享合成303的情况下, 在子带域中(即在合成303之前)可以执行求和202。
[0070]图4除了直接处理401之外还图示了交叉项处理402的操作。在图3的频域谐波 转置器的非线性处理块302内并行执行交叉项处理402和直接处理401。将转置的输出信 号混合(例如相加)以提供联合转置的信号。转置的输出信号的这种混合包括转置的输出 信号的叠加。可选地,在增益计算中可以实现交叉项的选择性相加。
[0071]图5更详细地图示了在图3的频域谐波转置器内图4的直接处理块401的操作。 单输入单输出(SIS0)单元401-1、. . ?、401-n、. . .、401-N将来自源范围的每个分析子带映 射到目标范围中的一个合成子带。根据图5,通过SIS0单元401-n将索引n的分析子带映 射到相同索引n的合成子带。应注意,合成滤波器组中具有索引n的子带的频率范围可以 根据谐波转置的确切版本或类型而变化。在图5所示的版本或类型中,分析组301的频率 间隔是比合成组303的频率间隔更小的因子T。因此,合成组303中的索引n与比分析组 301中的具有相同索引n的子带的频率高T倍的频率相对应。通过举例的方式,分析子带 [(n-1) w, nw]被转置为合成子带[(n-1) T w , nT w ] ?
[0072]图6图示了 401-n的SISO单元中的每一个中包含的单个子带的直接非线性处理。 块601的非线性执行复子带信号的相位与等于转置阶T的因子的相乘。可选的增益单元 602改变相位改变的子带信号的幅度。在数学方面,SIS0单元401-n的输出y可以写为至 SIS0系统401-n的输入x和增益参数g的函数,如下:
[0073]y=g ? VT 其中,v=x/|x|h/t. (!)
[0074]这也可以写为:
【权利要求】
1.一种用于对音频信号进行编码的系统,包括: -分离单元,其用于将所述音频信号分离成低频分量和高频分量; -核心编码器,其用于对所述低频分量进行编码; -频率确定单元,其用于确定所述音频信号的基频Ω ;以及 -参数编码器,其用于对与所述基频Ω相关联的信息进行编码,其中,与所述基频Ω相关联的信息被用于再生所述音频信号的高频分量。
2.如权利要求1所述的系统,还包括: -包络确定单元,其用于确定所述高频分量的谱包络;以及 -包络编码器,其用于对所述谱包络进行编码。
3.一种用于对音频信号进行解码的系统,所述系统包括: -核心解码器(101),其用于对所述音频信号的低频分量进行解码; -分析滤波器组(301),其用于提供所述音频信号的低频分量的多个分析子带信号; -子带选择接收单元,其用于接收允许从所述多个分析子带信号选择第一分析子带信号(801)和第二分析子带信号(802)的信息,从所述第一分析子带信号(801)和所述第二分析子带信号(802)生成合成子带信号(803);其中,所述信息与所述音频信号的基频Ω相关联;以及 -合成滤波器组(303),其用于从所述合成子带信号生成所述音频信号的高频分量。
4.如权利要求3所述的系统,其中, -所述分析滤波器组(301)具有N个分析子带,所述N个分析子带具有基本恒定子带间隔Δ ω ; -分析子带与分析子带索引η相关联,其中,n e (I,...,N); -所述合成滤波器组(303)具有合成子带; -所述合成子带与合成子带索引η相关联;以及 -具有索引η的所述合成子带和所述分析子带均包括通过因子T而彼此有关的频率范围。
5.如权利要求4所述的系统,其中, -所述合成子带信号(803)与具有索引η的所述合成子带相关联; -所述第一分析子带信号(801)与具有索引n-Pl的分析子带相关联; -所述第二分析子带信号(802)与具有索引η+ρ2的分析子带相关联;以及 -所述系统还包括用于选择P1和P2的索引选择单元。
6.如权利要求5所述的系统,其中,所述索引选择单元能够操作以基于所述音频信号的基频Ω选择索引偏移P1和ρ2。
7.如权利要求6所述的系统,其中, -所述索引选择单元能够操作以选择所述索引偏移P1和P2,使得: -所述索引偏移的和Pl+P2近似于分数Ω/Λ ω ;以及 -所述分数P1Z7P2近似于r/ (T-r),其中I≤r〈T。
8.如权利要求6所述的系统,其中, -所述索引选择单元能够操作以选择所述索引偏移P1和P2,使得: -所述索引偏移的和Pl+P2近似于分数Ω/Λ ω ;以及-所述分数P1A^等于r/ (T-r),其中I ( r〈T。
9.如权利要求7或8所述的系统,其中T=2且r=l。
10.如权利要求3所述的系统,还包括: -分析窗(2001),其在预定义时间k周围隔离预定义时间间隔的低频分量;以及 -合成窗(2201),其在预定义时间k周围隔离预定义时间间隔的高频分量。
11.如权利要求10所述的系统,其中, -所述合成窗(2201)是所述分析窗(2001)的时间定标版本。
12.如权利要求3所述的系统,还包括, -上采样器(104),其用于执行所述低频分量的上采样以得到上采样的低频分量; -包络调整器(103),其用于对所述高频分量整形;以及 -分量求和单元,其用于把解码的音频信号确定为所述上采样的低频分量和所述调整的高频分量之和。
13.如权利要求12所述的系统,还包括: -包络接收单元,其用于接收与所述音频信号的高频分量的包络有关的信息。
14.如权利要求12所述的系统,还包括: -输入单元,其用于接收包括`所述低频分量的音频信号;以及 -输出单元,其用于提供包括所述低频分量和所述生成的高频分量的解码的音频信号。
15.如权利要求3所述的系统,还包括:第一和第二转置阶的多输入单输出单元(800-n),其用于分别从具有第一分析频率和第二分析频率的所述第一分析子带信号(801)和所述第二分析子带信号(802)生成具有合成频率的所述合成子带信号(803);其中,所述合成频率与乘以所述第一转置阶的所述第一分析频率加上乘以所述第二转置阶的所述第二分析频率对应。
16.如权利要求15所述的系统,其中, -所述第一分析频率是ω ; -所述第二分析频率是(ω + Ω); -所述第一转置阶是(T-r); -所述第二转置阶是r; -T>1 ;以及 -1 ( r<T ; 使得所述合成频率是(T-r).ω+r.(ω + Ω)。
17.如权利要求3所述的系统,还包括: -增益单元(902),其用于将所述合成子带信号(803)乘以增益参数。
18.如权利要求3所述的系统,其中, -所述分析滤波器组(301)呈现与所述音频信号的基频Ω相关联的频率间隔。
19.一种编码的音频信号,包括: -与音频信号的低频分量有关的信息,其中,所述低频分量包括多个分析子带信号;以及 -与选择所述多个分析子带信号中的两个分析子带信号有关的信息,用于通过转置所选择的两个分析子带信号来生成所述音频信号的高频分量;其中所述信息与所述音频信号的基频Ω相关联。
20.一种用于对编码的音频信号进行解码的方法,其中,所述编码的音频信号 -是从原始音频信号得到的;以及 -仅表示所述原始音频信号的低于交叉频率(1005)的频率子带的部分; 其中,所述方法包括: -对来自所述编码的音频信号的低频分量进行解码; -提供所述低频分量的多个分析频率子带信号; -接收允许从所述多个分析子带信号选择第一分析子带信号(801)和第二分析子带信号(802)的信息,从所述第一分析子带信号(801)和所述第二分析子带信号(802)生成合成子带信号(803);其中,所述信息与所述音频信号的基频Ω相关联;以及 -从所述合成子带信号(803)生成(303)高频率分量,其中,所述高频分量包括高于所述交叉频带的合成频率。
21.一种用于对音频信号进行编码的方法,包括: -对所述音频信号滤波以隔离所述音频信号的低频分量; -对所述音频信号的低频分量进行编码; -提供所述音频信号的低频分量的多个分析子带信号; -确定用于生成所述音频信号的高频分量的第一分析子带信号和第二分析子带信号;以及 -对表示所述第一分析子带信号和所述第二分析子带信号的信息进行编码;其中所述信息与所述音频信号的基频Ω相关联。
22.—种存储介质,包括适用于在处理器上执行并且用于当在计算设备上执行时执行权利要求20或21所述的方法步骤的软件程序。
【文档编号】G10L21/038GK103632678SQ201310292414
【公开日】2014年3月12日 申请日期:2010年1月15日 优先权日:2009年1月16日
【发明者】拉尔斯·维尔默斯, 佩尔·赫德林 申请人:杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1