利用非一致滤波器库的音频编码的制作方法

文档序号:2819395阅读:217来源:国知局
专利名称:利用非一致滤波器库的音频编码的制作方法
技术领域
本发明涉及音频信号的编码和译码。


图1(a)显示一个包括传统的M信道分析滤波器库10和合成滤波器库12的系统的基本方框图。分析滤波器库包括数字滤波器Hk(z),k=0...,M-1,的集合,每个具有相关的输出信道和公共的输入x(n)。合成滤波器库包括滤波器Fk(z)的集合,每个具有相关的输入信道和公共的输出y(n)。在分析滤波器库10中,每个信道按因子M被分样,以及在合成滤波器库12中,每个信道按因子M被内插。如果内插的程度等于分样的程度,正如本例中那样,则滤波器库被精确(critically)采样,以及如果所有的滤波器具有相同的带宽,则滤波器库是一致的滤波器库。
由分析滤波器库10输出的M信道可以以任意的多种方式被处理。例如,如果分析滤波器库10形成音频编码器的一部分,则对于给定的更新时间间隔,信道数据和(可能地)滤波器库结构可被编码成代表音频信号x(n)的比特流。如果合成滤波器库12形成音频译码器的一部分,则合成滤波器库结构与信道数据相组合,生成信号y(n)。替换地,两个库10,12可被包括在一个音频处理系统中,在其中例如信号x(n)受到某种形式的后处理,而被处理的信号y(n)被存储在贮存媒体中,或在传输媒体上被传送。
在余弦调制滤波器(CMF)库中,分析和合成滤波器是单个原型滤波器的余弦调制的型式。用于分析和合成滤波器的已知的公式是hk(n)=2p0(n)cos[(2k+1)2Mπn+ϵk],]]>k=0,...,M-1fk(n)=2p0(n)cos[(2k+1)2Mπn+γk],]]>其中ϵk=-π2M(2k+1)α2+π2β]]>并且γk=π2M(2k+1)α2+π2β]]>其中α∈Z是调制相位,以及对于余弦调制β=0,而对于正弦调制β=1。
已经知道,在诸如数字信号的编码那样的应用中利用一致的CMF库,有时称为准QMF(正交镜像滤波器)库或调制的叠盖(lapped)变换。术语完全重建(perfect reconstruction,PR)被应用到滤波器库,其中输出y(n)是输入x(n)的缩放的和延时的版本。用于PR一致CMF库的设计的理论是早已建立的,在以上的情形下,PR性质可以通过适当地选择α和原型滤波器P0而被满足。对于本说明来说,示例的P0是具有通带[-π2M+ϵ,π2M-ϵ]]]>(对于ϵ<π2M]]>)和无限衰减的阻带、长度为N的实系数线性相位低通滤波器,见图2,也就是|P0(ejω)|=0 对于|ω|≥π2M+ϵ,ϵ<π2M]]>某些应用要求使用非一致的滤波器库,即,其滤波器具有变化带宽的滤波器库。例如,在音频编码中,希望提供可适配于输入信号的时间-频率能量分布和特性的滤波器库。非一致的滤波器库的设计通常是相当复杂的,但某些最近的方法允许设计非一致的CMF库。
例如,H.S.Malvar,“Biorthogonal and non-uniform lappedtransforms for transform coding with reduced blocking and ringingartefacts(用于具有减小的阻塞和人工振铃产物的变换编码的双正交和非一致叠盖变换)”,IEEE Trans.Signal Processing,vol.46,No.4,pp.1043-1053,1998年4月;和H.S.Malvar,“Enhancing theperformance of sub-band audio coders for speech signals(用于语音信号的子带音频编码器的性能增强)”,Proc.Int.Symp.Circuitsand Systems’98,nn.90-101,1998年6月;以及美国专利No.6,115,689,Malvar揭示了用于构建非一致调制的叠盖变换(MLT)的方法。这牵涉到组合非一致MLT的子带滤波器,以及这里将称为子带合并。组合的子带滤波器比非组合的滤波器具有更好的时间局部化(timelocalization),但以频率局部化(frequency localization)的降低为代价。由于非一致滤波器库是通过简单地采用一致MLT滤波器的线性组合而得到的,所以该方法允许有效地实施时间变化的变换。Malvar揭示了子带合并可以在音频与语音编码中被有利地使用来减小人工振铃产物,例如混响和预回波。然而,这种变换的设计在几个方面受到限制只有2个或4个子带滤波器可被组合,以及仅仅组合固定数目的高频系数对,即,16×2滤波器,8×4滤波器。而且,没有揭示系统性设计规程。具体地,在组合的4子带滤波器的情形下,困难的参量组被选择来提供需要的输出。
按照本发明,提供了按照权利要求1的方法。
本发明提供一种子带合并方法,它允许以系统的方式组合任意数目的子带。优选实施例显示,从一致的CMF库开始,可以采用组成滤波器的线性组合,使得最终得到的组合的滤波器具有良好的频率选择特性和平坦的通带响应。
现在参照附图描述本发明的实施例,其中图1(a)是传统的分析/合成滤波器库的方框图;图1(b)是按照本发明优选实施例的分析/合成滤波器库的方框图;图2显示在本发明的优选实施例中采用的原型滤波器P0的特性;图3(a)和(b)比较优选实施例的滤波器库的时域响应与现有技术的滤波器库的时域响应,(a)是指现有技术,(b)是指优选实施例;图4(a)和(b)比较优选实施例的滤波器库的幅度响应与现有技术的滤波器库的幅度响应,(a)是指现有技术,(b)是指优选实施例;图5显示按照本发明的滤波器库的实际的实施例。
在本发明的优选实施例中,图1(b),M信道最大分样的一致CMF库10,12包括理想地通过如图2所示的单个原型滤波器P0的余弦调制得到的滤波器Hk(z),Fk(z)。局部化模块14根据在给定的时间间隔内的信号x(n)的时频能量分布和信号特性而确定为了有利于增加的时间分辨率最好将频率分段去局部化(delocalization),以提供改进的编码的信号质量。(替换地,模块14可确定,如果将频率分段去局部化,则有可能降低总的比特率,而同时保持相同的质量水平。)因此,在图1(b)的例子中,模块14确定,包括一致滤波器库中任意数目p<M的相邻滤波器的x组滤波器,要被组合在分段矩阵S1,...Sx中,以提供非一致的滤波器库。
(虽然对于本发明并不必要,但在本说明书中假设,在分段后产生总共M个输出信道。)包括信道数据和在任何给定时间间隔中要被利用的频率分段的指示的编码信号在分段逆矩阵S-11,...S-1x漭中被译码,以便提供对于一致的合成滤波器库12的输入。
对于具有适当的频率响应的非一致滤波器库,它的滤波器的幅度特征必须呈现良好的频率选择性和平坦的通带响应。为了说明本发明提供了这些选择性和响应特性,我们考虑一个合并的滤波器Hp,k(z)是从一致CMF库中的第k个滤波器开始的p个相邻滤波器的线性组合,即,
Hp,k(z)=Σi=0p-1bk+iHk+i(z),k=0,...,M-p]]> 是幅度为1的组合系数。如果|Hp,k(z)|2(或等价地|Σi=0p-1bk+iHk+i(z)|2]]>)等于Σi=0p-1|Hk+i(z)|2,]]>则Hp,k(z)具有平坦的通带响应和类似于基础的均匀间隔开的子带滤波器的转换带宽。如果原型滤波器满足关于阻带减小的条件(如示例的P0),则在滤波器Hk(z)与H1(z)(对于k-1>2)之间没有频谱重叠,这样Σi=0p-1|Hk+i(ejω)|2=c,]]>对于|ω|∈[kπ2M+ϵ,(k+p)π2M-ϵ],c≠0]]>,而在它的阻带中为零。
然而,将会看到,原型滤波器P0在实际的应用中不能被实施,因为它需要无限长度滤波器。所以,在实际的情形下,在非相邻的滤波器的频率域中确实存在重叠项,这导致组合的滤波器的通带中的起伏,然而,通过使原型滤波器的阻带衰减保持为高,这些起伏可被保持最小。
以下给出关于调制相位(即,关于一致滤波器库)和组合系数的必要和充分条件,以使得最终得到的组合滤波器确实展现所需要的频率行为。
对于图2的原型滤波器P0和 k=0,...,M-1,我们然后有|Σi=0p-1bk+iHk+i(z)|2=Σi=0p-1|Hk+i(z)|2,]]>对于1≤p≤M和0≤k≤M-p,当且仅当α=(N-1)-M(2m+1),m∈Z,以及k-k+1=nπ,n∈N。
可以看到,关于α的条件是对作为基础的一致CMF库的新限制,但情况并非如此。从文献已知的大多数CMF库满足关于α的条件,因为它抵消了在ω∈{0,π}时的一阶混叠和幅度失真。至于bk的条件,这相当于选择只在正负号上不同的、幅度1的组合系数,组合运算可以由矩阵乘法代表。考虑其中组合两个滤波器(p=2)的例子。如果我们把包含一致CMF库分析滤波器的冲击响应的矩阵A定义为 则包含非一致CMF库分析滤波器的冲击响应的矩阵A’可以通过矩阵乘法A’=SA而被创建,其中
组合系数bk在S的块-对角线单元的行中找到,在本例中它是尺寸为2的Hadamard矩阵-非奇异矩阵。
在p>2的情形下,S中的非奇异块-对角线单元尺寸为pxp,具有条目±1。在优选实施例中,这样的非奇异矩阵是尺寸N>p的Hadamard矩阵的pxp主子矩阵。
因此,按照本发明,代表想要的滤波器库结构的PR非一致CMF库可以通过分量滤波器和来自Hadamard矩阵的非奇异块的矩阵乘法被提供到编码器中。
在译码器中,对于p=2n,n∈N,分段信号A’=SA可以与矩阵S的转置ST相乘,以提供原始信号的缩放版本。因此,变换AS→STA’可以通过适当地缩放组合系数bk而被做成么正的(unitary)(归一正交的),这样,假设原先的一致滤波器库是么正的,则非一致滤波器库也是么正的。例如,对于p=4,矩阵S是11111-11-111-1-11-1-11]]>把这个矩阵乘以它的转置矩阵,可以提供具有4的单元幅度的单位矩阵,这样,在这种情形下,系数bk=1/2应当被使用于么正系统。类似地,对于p=2,应当使用bk=1/2.]]>对于p≠2n,n∈N,在综合运算中必须使用逆矩阵而不是转置矩阵,这样SS-1给出单位矩阵。(这样,不会像在p=2n时那样在计算上有效。)分段矩阵S,S-1可被实施为级联到任何的一致滤波器库。例如,图5显示了分析滤波器库10’在MPEG编码器中利用的形式。在这种情形下,输入信号x(n)通过抽头延时线被连接,使每个接连地延时的信号按因子M被分样。通过与图1(a)和(b)所示的方案相比较,本方案意味着只有分样的信号被滤波,而不是反过来的情况。分样的信号由各对滤波函数Gm(-z2)进行滤波,且它们的输出在余弦调制模块内被交叉链接,该余弦调制模块产生M个输出信道。
正如在图1(b)的情形下,其中局部化模块14确定,在给定的子带中的频率去局部化将通过改进时间分辨率而改进响应的质量,相邻滤波器输出信道的一个或多个组随之在分段矩阵系统S内被相应组合,S包括如上所述的Hadamard矩阵的一个或多个主子矩阵。
因此,在任何更新时间间隔内,这些滤波器输出信道组可被分段,以组合单独的滤波器,这样,使得频率选择去局部化而同时提高比特流的时间分辨率。由局部化模块14用来确定最佳时间-频率分段的特定方法,超出了本说明书的范围,但某些内容在例如Malvar的文章中被讨论。然而,一般地,这些牵涉到对于比特速率的花费函数平衡失真,以及可以单独地被应用于频率分段,或与自适应时间分段系统组合。
为了把按照本发明合并的滤波器库与在Malvar文章中揭示的滤波器库的结果进行比较,4个子带滤波器被组合在64信道MLT中。在图3和4上分别显示了组合滤波器最终得到的时间和频率响应。图3(a)和4(a)显示了在Malvar文章中揭示的结果,而图3(b)和4(b)显示了本发明的结果。通过观察附图,可以看到,对于可比较的时间局部化,本发明给出更好的频率响应。
因此,在相对于例如Malvar来说要求可比较的质量水平的场合下,包括按照本发明优选实施例的分段矩阵的音频编码器可以降低比特速率,这样节省了总的带宽。替换地,对于相同的比特速率将提供改进的质量。
权利要求
1.一种编码音频信号(x(n))的方法,该方法包括以下步骤把所述信号(x(n))作为输入提供到一致的分析滤波器库(10),所述分析滤波器库包括多个余弦调制的滤波器(Hk(z)),每个滤波器提供相应的输出信号;确定(14)所述分析滤波器库的非一致的分段,其中三个或多个滤波器的至少一个组要对于所述音频信号的至少一个时间间隔被组合;把所述至少一个组的滤波器与相应的分段矩阵(S1...Sx)组合,每个矩阵包括Hadamard矩阵的pxp主子矩阵,其中p等于在组内要被组合的滤波器的数目;以及在比特流中编码所述滤波器和所述分段矩阵的输出以及所述分段的相应指示。
2.按照权利要求1的方法,还包括以下步骤把每个Hadamard矩阵的系数与组合系数(bk)相乘,以使得所述矩阵组合是正交的。
3.一种解码比特流的方法,该方法包括以下步骤读出所述比特流,以提供相应于在非一致合成滤波器库中的频带的多个数据信道;根据所述比特流确定所述合成滤波器库的非一致分段,其中三个或多个数据信道的至少一个组要对于所述比特流的至少一个时间间隔被组合;把所述至少一个组的数据信道与相应的分段矩阵(S-11...S-1x)组合,每个矩阵包括Hadamard矩阵的pxp主子矩阵,其中p等于在组内要被组合的滤波器的数目;以及将所述至少一个组合的输出作为相应的信道输入而提供到包括多个余弦调制的滤波器(Fk(z))的一致合成滤波器库(12),所述滤波器提供公共输出信号(y(n))。
4.按照权利要求3的方法,其中p等于2的整数幂,以及其中每个分段矩阵包括pxp的Hadamard矩阵的转置。
5.按照权利要求3的方法,其中p不等于2的整数幂,以及其中每个分段矩阵包括pxp的Hadamard矩阵的逆矩阵。
6.按照权利要求4或5的方法,还包括以下步骤把每个Hadamard矩阵的系数与组合系数(bk)相乘,以使得所述矩阵组合是么正的。
7.音频编码器,包括用于把音频信号(x(n))作为输入提供到一致的分析滤波器库(10)的装置,所述分析滤波器库包括多个余弦调制滤波器(Hk(z)),每个滤波器提供相应的输出信号;用于确定(14)所述分析滤波器库的非一致分段的装置,其中三个或多个滤波器的至少一个组要对于所述音频信号的至少一个时间间隔被组合;用于把所述至少一个组的滤波器与相应的分段矩阵(S1...Sx)组合的装置,每个矩阵包括Hadamard矩阵的pxp主子矩阵,其中p等于在组内要被组合的滤波器的数目;以及编码器,用于在比特流中提供所述滤波器和所述分段矩阵的输出,以及所述分段的相应指示。
8.音频播放器,包括用于读出比特流,以提供相应于在非一致合成滤波器库中的频带的多个数据信道的装置;用于根据所述比特流确定所述合成滤波器库的非一致分段的装置,其中三个或多个数据信道的至少一个组要对于所述比特流的至少一个时间间隔被组合;用于把所述至少一个组的数据信道与相应的分段矩阵(S-11...S-1x)组合的装置,每个矩阵包括Hadamard矩阵的pxp主子矩阵,其中p等于在组内要被组合的滤波器的数目;以及用于将所述至少一个组合的输出作为相应输入而提供到包括多个余弦调制的滤波器(Fk(z))的一致合成滤波器库(12)的装置,所述滤波器提供公共输出信号(y(n))。
9.包括如权利要求7中所述的音频编码器和如权利要求8中所述的音频播放器的音频系统。
10.包括多个信道的数据的比特流,该多个信道相应于非一致合成滤波器库中的频带,所述非一致合成滤波器库包括多个余弦调制的滤波器(Fk(z));所述比特流还包括所述合成滤波器库的非一致分段的指示,其中三个或多个数据信道的至少一个组要对于所述比特流的至少一个时间间隔与相应的分段矩阵(S-11...S-1x)组合,每个矩阵包括pxp的Hadamard矩阵,其中p等于在组内要被组合的滤波器的数目。
11.其上存储如在权利要求10中所述的比特流的贮存媒体。
全文摘要
一种编码音频信号(x(n))的方法,包括把信号(x(n))作为输入提供到一致的余弦调制滤波器库(10)。对于该滤波器库确定非一致的分段,其中三个或多个滤波器的至少一个组要在音频信号的至少一个时间间隔内被组合。该至少一个组的滤波器与相应分段矩阵(S
文档编号G10L19/02GK1545697SQ02816277
公开日2004年11月10日 申请日期2002年8月14日 优先权日2001年8月21日
发明者O·A·尼亚穆特, O A 尼亚穆特, R·休斯登斯, 沟撬 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1