子带域中改进的频谱平移/折叠的制作方法

文档序号:2823198阅读:357来源:国知局
专利名称:子带域中改进的频谱平移/折叠的制作方法
技术领域
本发明涉及一种改进高频重建(HFR)技术的新方法和设备,可应用于音频信源编码系统。利用这种新方法可以大大减小计算复杂性。这是借助于子带域中频率平移和折叠而实现的,最好是,它与频谱包络调整过程相结合。通过不和谐防护带滤波的概念,本发明还改进感觉音频质量。本发明给出低复杂性,中等质量HFR方法并且涉及PCT专利频谱带复制(SBR)[WO 98/57436]。
背景技术
某个频率之上的原始音频信息被高斯噪声或人为低频带信息所代替的方案统称为高频重建(HFR)方法。除了噪声插入或诸如整流的非线性之外,现有技术的HFR方法一般利用所谓的拷贝技术,用于产生高频带信号。这些技术主要采用宽带线性频率偏移,即,平移,或频率倒置线性偏移,即,折叠。现有技术的HFR方法主要是为了改进语音编解码器的性能。然而,利用感觉准确的方法,高频带再生中的最近发展已使HFR方法成功地应用于自然音频编解码器,编码音乐或其他复杂的节目材料,PCT专利[WO 98/57436]。在某些条件下,简单的拷贝技术在编码复杂节目材料时也是适用的。这些技术在中级质量应用中已产生合理的结果,特别是用于编解码器装置,其中对于整个系统的计算复杂性有严格的约束。
人类话音和大多数乐器产生准稳定的音调信号,这些信号从振荡系统发出。根据傅里叶理论,任何周期性信号可以表示成频率为f,2f,3f,4f,5f等的正弦波之和,其中f是基频。这些频率形成一个调和级数。音调亲合性是指感觉音调或谐波之间的关系。在自然声音再现中,这种音调亲合性是受不同类型话音或所用乐器的控制和确定。总的HFR技术思想是根据现有低频带建立的信息代替原始高频信息,和随后给这个信息加上频谱包络调整。现有技术HFR方法建立高频带信号,其中音调亲合性往往是不可控制和受损的。这些方法产生非谐波频率分量,它给复杂节目材料造成感觉的假象。这种假象在编码文献中称之为“刺耳”发声,听众的感觉到的是声音失真。
与和谐(悦耳)相反,感觉的不和谐(刺耳)出现在相邻音调或泛音发生干扰的时候。各种研究人员解释了不和谐理论,其中包括Plomp和Levelt[“Tonal Consonance and Critical Bandwidth”R.Plomp,W.J.M.Levelt,JASA,Vol.38,1965],该理论指出,若频率之差约在两个泛音所在临界频带带宽的5至50%以内,则认为这两个泛音是不和谐的。频率变换到临界频带所用的标度称之为Bark标度。一个Bark相当于一个临界频带的频率距离。例如,以下的函数关系式可用于频率(f)到Bark标度(z)的转换z(f)=26.811+1960f-0.53---[Bark]---(1)]]>Plomp指出,若两个泛音的频率之差约小于所在临界频带的5%,或相当地,若两个泛音的频率间隔小于0.05Bark,则人类听觉系统不能辨别这两个泛音。另一方面,若两个泛音的频率间隔大于0.5Bark,则感觉到这两个泛音为分开的音调。
不和谐理论部分地解释为什么现有技术的方法给出不满意的结果。一组和谐泛音的频率上移可能变成不和谐泛音。此外,在平移频带样本与低频带之间的交叉区,泛音能够发生干扰,按照不和谐规则,因为这些泛音可能不在可接受的偏差范围内。

发明内容
本发明提供一种改进信源编码系统中平移或折叠技术的新方法和设备。其目的包括大大减小计算复杂性和减小感觉假象。本发明展示一种分抽样数字滤波器组作为频率平移或折叠装置的新实施方案,还提供低频带与平移或折叠频带之间改进的交叉准确度。此外,本发明指出避免感觉不和谐的交叉区得益于被滤波。滤波区称之为不和谐的防护带,利用分抽样滤波器组,本发明能够以不复杂和准确的方式减小不和谐泛音。
新滤波器组基的平移或折叠过程可以有利地与频谱包络调整过程相结合。于是,用于包络调整的滤波器组也可用于频率平移或折叠过程,所以,不需要使用分开的滤波器组或频谱包络调整过程。本发明以低计算代价提供唯一和灵活的滤波器组基设计,因此,建立一种非常有效的平移/折叠/包络调整系统。
此外,本发明有利地与PCT专利[SE00/00159]中描述的自适应噪声背景相加方法进行组合。这个组合可以改进困难节目材料条件下的感觉质量。
我们提出的子带域基平移或折叠技术包括以下步骤-通过数字滤波器组的分析部分,滤波低频带信号以得到一组子带信号;-在数字滤波器组的合成部分,从相邻的低频带频道到相邻的高频带频道修补一些子带信号;-按照所需的频谱包络,调整修补的子带信号;和-通过数字滤波器组的合成部分,滤波调整的子带信号,以非常有效的方法得到包络调整和频率平移或折叠的信号。
本发明引人注目的应用涉及改进各种类型的中级质量编解码器的应用,例如,MPEG 2 Layer III,MPEG 2/4 AAC,Dolby AC-3,NTTTwin VQ,AT&T/Lucent PAC,等等,其中这些编解码器用在低比特率。本发明在各种语音编解码器中也是非常有用的,例如,G.729MPEG-4 CELP和`HVXC等,可以改进感觉质量。上述的编解码器在多媒体,电话工业,互联网以及专业多媒体应用中得到广泛的使用。


参照附图,借助于几个具体例子描述本发明,这些例子不限制本发明的范围或精神,其中图1表示按照本发明在编码系统中结合滤波器组基的平移或折叠;图2表示最大抽取滤波器组的基本结构;
图3表示按照本发明的频谱平移;图4表示按照本发明的频谱折叠;和图5表示按照本发明利用防护频带的频谱平移。
具体实施例方式
数字滤波器组基的平移和折叠现在描述新滤波器组基的平移或折叠技术。利用滤波器组的分析部分,把所考虑的信号分解成一系列子带信号。通过分析和合成子带频道的重新连接,于是,这些子带信号被修补以实现频谱平移或折叠或二者的组合。
图2表示最大抽取滤波器组分析/合成系统的基本结构。分析滤波器组201把输入信号分割成几个子带信号。合成滤波器组202组合子带样本以重建原始信号。利用最大抽取滤波器组的实施方案可以大大减小计算成本,应当理解,实现本发明可以利用几种类型的滤波器组或变换,包括余弦或复指数调制的滤波器组,子波变换的滤波器组解释,其他非相等带宽滤波器组或变换,以及多维滤波器组或变换。
在以下典型而非限制性的描述中,我们假设,L频道滤波器组把输入信号x(n)分割成L个子带信号。利用抽样频率fS,输入信号的频带限制到频率fC。最大抽取滤波器组的分析滤波器(图2)标记为Hk(z)203,其中k=0,1,…,L-1。在传输通过抽取器204之后,子带信号vk(n)被最大地抽取,每个信号的抽样频率为fS/L。在内插205和滤波206之后,具有合成滤波器Fk(z)的合成部分重新组合子带信号以产生 此外,本发明还完成 的频谱重建,给出增强的信号y(n)。
重建范围起始频道标记为M,它是由以下的公式确定M=floor{fCfS2L}-----(2)]]>源区频道的数目标记为S(1≤S≤M)。按照本发明,通过 的平移并结合包络调整,利用修补子带信号完成频谱重建,νM+k(n)=eM+k(n)νM-S-P+k(n) (3)其中k∈
,(-1)S+P=1,即,S+P是偶数,P是整数偏移(0≤P≤M-S)和eM+k(n)是包络校正。按照本发明,通过 的折叠,利用修补子带信号完成频谱重建,νM+k(n)=eM+k(n)ν*M-P-S-k(n) (4)其中k∈
,(-1)S+P=-1,即,S+P是奇整数,P是整数偏移(1-S≤P≤M-2S+1)和eM+k(n)是包络校正。算符[*]表示复共轭。通常,在达到预期的高频带宽量之前,重复修补过程。
应当注意,通过利用子带域基的平移和折叠,实现低频带与平移或折叠频带样本之间改进的交叉准确度,因为所有信号是通过有匹配频率响应的滤波器组频道进行滤波。
若x(n)的频率fC太高,或相当地,若fS太低,不允许实现有效的频谱重建,即,M+S>L,则在分析滤波之后可以增大子带频道的数目。利用QL频道合成滤波器组滤波子带信号,其中仅利用L个低频带频道,和上抽样因子Q是这样选取的,使QL是整数值,它导致抽样频率为Qfs的输出信号。因此,扩展滤波器组起的作用是,它似乎是后面有上抽样器的L频道滤波器组。在此情况下,由于没有利用L(Q-1)个高频带滤波器(馈入零),音频带宽不发生变化,该滤波器组仅仅重建 的上抽样版本。然而,若修补L个子带信号到高频带频道,则按照公式(3)或(4), 的带宽就增大。利用这种方案,上抽样过程与合成滤波相结合。应当注意,可以利用任何规模的合成滤波器组,导致输出信号有不同的抽样率。
参照图3,考虑16频道分析滤波器组中的子带频道。输入信号x(n)的频率范围高达Nyquist频率(fC=fS/2)。在第一次迭代中,16个子带扩展到23个子带,利用以下参数M=16,S=7,和P=1完成按照公式(3)的频率平移。这个操作表示在图中从点a到点b的子带修补。在下一次迭代中,23个子带扩展到28个子带,公式(3)中使用新的参数M=23,S=5,和P=3。这个操作表示在图中是从点b到点c的子带修补。然后,可以利用28频道滤波器组合成如此产生的子带。这就产生抽样频率为28/16fS=1.75fS的临界抽样输出信号。也可以利用32频道滤波器组合成子带信号,其中4个最高频道中馈入零,在图中用虚线表示,从而产生抽样频率为2fS的输出信号。
利用相同的分析滤波器组和相同频率范围的输入信号,图4表示按照公式(4)在两次迭代中利用频率折叠的修补。在第一次迭代中,M=16,S=8,和P=-7,16个子带扩展到24个。在第二次迭代中,M=24,S=8,和P=-7,子带数目从24个扩展32个。利用32频道滤波器组合成这些子带。在抽样频率为2fS的输出信号中,这种修补产生两个重建的频带,一个频带是由于子带信号修补到频道16至23,它是频道8至15提取的带通信号的折叠版本;而另一个频带是由于修补到频道24至31,它是相同带通信号的平移版本。
高频重建中的防护频带由于相邻频带的干扰,即,平移频带样本与低频带交叉区附近泛音之间的干扰,感觉不和谐可能在平移或折叠过程中得到发展。这种类型不和谐在谐波丰富,多音调节目材料中是很普遍的。为了减小不和谐,可以插入防护频带,且这些防护频带最好是由零能量的小频带组成,即,低频带信号与复制频谱带之间交叉区的滤波是利用带阻或陷波滤波器。若利用防护频带减小不和谐,则感觉到较少的感知退化。防护频带的带宽最好是在0.5Bark左右。若小于0.5Bark,则可能产生不和谐;若大于0.5Bark,则可能产生梳状滤波器的声音特征。
在滤波器组基的平移或折叠中,可以插入防护频带,且这些防护频带最好是由设置成零的一个或几个子带频道组成。利用防护频带,公式(3)和公式(4)分别改变成公式(5)和公式(6)νM+D+k(n)=eM+D+k(n)νM-S-P+k(n)(5)和νM+D+k(n)=eM+D+k(n)ν*M-P-S-k(n) (6)D是小的整数,它代表用作防护频带的滤波器组中频道数目。在公式(5)中,P+S+D应当为偶整数;而在公式(6)中,P+S+D应当为奇整数。P的取值与以前的值相同。图5表示利用公式(5)修补32频道滤波器组的情况。输入信号的频率范围高达fC=5/16fS,在第一次迭代中,使M=20。信源频道的数目选取为S=4和P=2。此外,D的选取最好是使防护频带的带宽为0.5Bark。此处,D=2,使防护频带的带宽为fS/32Hz。在第二次迭代中,参数的选取为M=26,S=4,D=2和P=0。在图5中,防护频带是用虚线连接的子带表示。
为了使频谱包络连续,利用随机白噪声信号,即,利用白噪声代替零馈入到子带中,可以部分地重建不和谐防护频带。较好的方法是利用PCT专利申请[SE00/00159]中描述的自适应噪声背景相加(ANA)方法。这个方法估算原始信号中高频带的噪声背景,并以明确的方式把合成噪声加到解码器中的重建高频带。
实际方案利用任意的编解码器,本发明可以在各种存储或传输音频信号的系统中实施。图1表示音频编码系统的解码器。分路器101从比特流中分出包络数据和其他HFR有关的控制信号,并馈入相关部分到任意的低频带解码器102。低频带解码器102产生馈入到分析滤波器组104的数字信号。包络数据在包络解码器103中被解码,形成的频谱包络信息与来自分析滤波器组的子带样本一起馈入到与平移或折叠结合的包络调整滤波器组单元105。按照本发明,这个单元105平移或折叠低频带信号以形成宽带信号,并加上发射的频谱包络。然后,处理后的子带样本馈入到合成滤波器组106,合成滤波器组106可以与分析滤波器组104有不同的规模。最后,数字宽带输出信号被DAC 107转换成模拟输出信号。
上述的实施例仅仅说明利用滤波器组基频率平移或折叠方法改进高频重建(HFR)技术的本发明原理。应当明白,对于本领域其他专业人员,对此处描述的装置和细节作各种改动和变化是显而易见的。所以,本发明的内容仅仅受专利申请的权利要求书范围所限制,而不受描述和解释实施例所提供的具体细节所限制。
权利要求
1.一种增强高频重建技术的方法,组合频率平移或折叠与频谱包络调整,其特征是-通过数字滤波器组的分析部分,滤波低频带信号以得到一组子带信号;-在数字滤波器组的合成部分中,从所述滤波器组的相邻频道到相邻频道修补一些所述子带信号,其中从频率指数为k的频道到频率指数为j≠k的频道,修补每个所述子带信号;-按照所需的频谱包络,调整所述修补的子带信号;和-通过数字滤波器组的所述合成部分,滤波所述调整的子带信号;从而得到包络调整和频率平移或折叠的信号。
2.按照权利要求1的方法,其特征是,所述数字滤波器组是借助于低通原型滤波器的余弦或正弦调制得到的。
3.按照权利要求1的方法,其特征是,所述数字滤波器组是借助于低通原型滤波器的复指数调制得到的。
4.按照权利要求2-3的方法,其特征是,所述低通原型滤波器设计成这样,使所述数字滤波器组频道的过渡带仅与相邻频道的通带重叠。
5.按照权利要求1-4的方法,其特征是,馈入零或高斯噪声到数字滤波器组中所述合成部分的一个或几个频道;从而衰减不和谐有关的假象。
6.按照权利要求5的方法,其特征是,馈入零或高斯噪声的所述频道带宽约为半个Bark。
7.按照权利要求1-6的方法,其特征是,所述滤波器组是利用高频重建(HFR)的音频编码系统中的部分解码器。
8.一种利用高频重建技术增强信源编码系统的设备,其中所述设备是解码器,用于解码编码器编码的信号,且所述设备组合频率平移或折叠与频谱包络调整,其特征是-所述解码器中的解码装置,用于解码低频带音频信号以形成第一信号;-所述解码器中的分解装置,用于分解所述第一信号成一些子带信号;-所述解码器中的频谱平移或折叠装置,用于修补一些所述子带信号;-所述解码器中的调整装置,用于频谱包络调整所述修补的子带信号;和-所述解码器中的装置,用于把所述调整的子带信号重新组合成输出信号;从而得到频谱包络调整和频率平移或折叠的输出信号。
全文摘要
本发明涉及一种利用频率平移或折叠或二者组合改进高频重建(HFR)技术的新方法和设备。本发明可应用于音频信源编码系统,和大大减小计算的复杂性。这是借助于子带域中的频率平移或折叠实现的,最好是,它与相同域中的频谱包络调整相结合。还提出不和谐防护频带滤波的概念。本发明提供一种可应用于语音和自然音频编码的低复杂性,中级质量HFR方法。
文档编号G10L21/038GK1430777SQ01809978
公开日2003年7月16日 申请日期2001年5月23日 优先权日2000年5月23日
发明者拉斯·古斯塔夫·里尔耶尔德, 珀·埃克斯特兰德, 弗雷德里克·汉, 克里斯托佛·克迂尔灵 申请人:编码技术瑞典股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1