用于处理去相干信号或组合信号的设备和方法

文档序号:2825031阅读:241来源:国知局
专利名称:用于处理去相干信号或组合信号的设备和方法
技术领域
本发明涉及信号的时间包络整形,具体来说,涉及在重建立体声或多声道音频信号期间从下混频信号和附加控制数据得到的去相干信号的时间包络整形。
背景技术
音频编码中最新的进展使人们能够根据立体声(或单)信号和相应的控制数据重建音频信号的多声道表现。这些方法大大地不同于较早的基于矩阵的解决方案,诸如Dolby Prologic (杜比定向逻辑解码器),因为附加控制数据被发送用来根据发送的单声道或立体声声道控制环绕声道的重建,也称为上混频。这样的参数性多声道音频解码器根据M个发送的声道和附加控制数据重建N个声道,其中N >M。使用附加控制数据造成比起发送所有的N个声道低得多的数据速率,使得编码非常有效,而同时保证与M声道设备和N声道设备的兼容性。M声道可以是单个单声道、立体声声道、或5.1声道表现。因此,有可能具有7. 2声道原始信号,被下混频到5. 1声道后向兼容的信号,和空间音频参数,使得空间音频解码器能够以小的附加比特率开销重现原始7. 2声道的非常相似的版本。这些参数性环绕编码方法通常包括根据时间和频率变量ILD (信道间电平差)和 ICC(信道间相干性)量的环绕信号的参数化。这些参数例如描述在原始多声道信号的声道对之间的功率比率和相干性。在解码器处理时,通过分布在由发送的ILD参数描述的所有声道对之间的接收的下混频声道的能量而得到重新创建的多声道信号。然而,由于多声道信号可以具有在所有的声道之间的等功率分布,虽然在不同的声道中的信号是非常不同的,因此给出非常大范围的声音的收听感觉,通过把信号与该信号的去相干的版本混频,得到正确的宽广度,正如ICC参数描述的。信号的去相干的版本,常常称为湿信号,是通过将信号(也称为干信号)传送通过诸如全通滤波器那样的交混回响器而得到的。来自去相干器的输出具有通常是非常平坦的时间响应。因此,狄拉克输入信号给出衰减的噪声突发输出。当混频去相干的信号和原始信号时,对于某些瞬时信号类型、如鼓掌欢呼信号来说,重要的是对去相干信号的时间包络进行整形,以更好地匹配于干信号的时间包络。无法做到这一点,则由于前回声型的人工产物,将导致较大的房间尺寸和不自然的声音瞬态变化的感觉。在其中多声道重建是在具有低时间分辨率的频率变换域中完成的系统中,可以利用时间包络整形技术,类似于用于对量化噪声进行整形所使用的技术,诸如感知的音频编码解码器、如 MPEG-4 AAC 的时间噪声整形[J. Herre 和 J. D. Johnston,“Enhancing the performanceof perceptual audio coding by using temporal noise shaping (TNS)in 101st AES Convention, Los Angeles, November 1996]。这是借助于在频率采样点的预测而完成的,其中时间包络是通过在频率方向上对干信号的线性预测而估计出来的,并且所得到的滤波器再次在频率方向上被施加到湿信号。人们例如可以考虑延时线作为去相干器,以及诸如鼓掌欢呼或开枪那样的强瞬变信号作为要被上混频的信号。当没有执行包络整形时,信号的延时的版本与原始信号相组合,以重建立体声或多声道信号。这样,瞬变信号在上混频信号中出现两次,分开延时,造成不想要的回声型效应。为了对特别关键的信号达到好的结果,去相干信号的时间包络需要以非常高的时间分辨率整形,这样,通过将它的能量减小到在当时被包含在载波信道中的能量,而抵消瞬变信号的延时回声,或者屏蔽它。去相干信号的这个宽带增益调节可以在短到Ims的窗口上完成[美国专利申请, "Diffuse Sound Shaping for BCC Schemes and theLike”,No. 11/006492,12/7/2004]。 对于去相干信号的增益调节的这种高的时间分辨率不可避免地导致附加失真。为了使得对于非关键信号的附加失真最小化,即,其中去相干信号的时间整形不是至关重要的,在编码器或解码器中引入检测机制,它按照某种预定的标准接通或关断时间整形算法。缺点在于, 该系统会变得对于检测器调谐极其敏感。在以下说明中,术语去相干信号或湿信号被用于下混频信号的可能的增益调节的 (按照ILD和ICC参数)去相干的版本,以及术语下混频信号、直接信号或干信号被用于可能的增益调节的下混频信号。在现有技术实施方案中,高时间分辨率增益调节,即基于短到毫秒的干信号的采样的增益调节,导致对于非关键的信号的很大的附加失真。这些是具有平滑的时间演变的非瞬变信号,例如音乐信号。对于这样的非关键信号的关断增益调节的现有技术方法引入音频感知质量对于预测机制的新的和强的依赖性,这当然是最不利的,并且当检测失败时, 这甚至会引入附加失真。

发明内容
本发明的目的是提供这样一种概念对去相干信号的包络更有效地进行整形,避免引入附加信号失真。按照本发明的第一方面,这个目的是借助于用于一种处理从原始信号得到的去相干信号或通过组合原始信号与去相干信号而得到的组合信号的设备达到的,该设备包括 频谱平整器,用于对于去相干信号、从去相干信号得到的信号、原始信号、从原始信号得到的信号、或组合信号进行频谱平整,以得到平整的信号,频谱平整器用来使得平整信号比起在平整之前的相应信号有更平坦的频谱;以及时间包络整形器,用于通过使用关于平整信号的信息对去相干信号或组合信号进行时间包络整形。按照本发明的第二方面,这个目的是借助于一种空间音频解码器达到的,该空间音频解码器包括输入接口,用于接收从具有至少两个声道的多声道信号得到的原始信号和用于接收描述在多声道信号的第一声道与第二声道之间的相互关系的空间参数;去相干器,用于使用空间参数从原始信号得到去相干信号;频谱平整器,用于对于去相干信号、从去相干信号得到的信号、原始信号、从原始信号得到的信号、或组合信号进行频谱平整,以得到平整的信号,频谱平整器用来使得平整信号比起在平整之前的相应信号有更平坦的频谱;以及时间包络整形器,用于使用关于平整信号的信息对去相干信号或组合信号进行时间包络整形。按照本发明的第三方面,这个目的是借助于一种具有用于处理从原始信号得到的去相干信号或通过组合原始信号与去相干信号而得到的组合信号的设备的接收机或音频播放器达到的,包括频谱平整器,用于对于去相干信号、从去相干信号得到的信号、原始信号、从原始信号得到的信号、或组合信号进行频谱平整,以得到平整的信号,频谱平整器用来使得平整信号比起在平整之前的相应信号有更平坦的频谱;以及时间包络整形器,用于使用关于平整信号的信息对去相干信号或组合信号进行时间包络整形。按照本发明的第四方面,这个目的是借助于一种用于处理从原始信号得到的去相干信号或通过组合原始信号与去相干信号而得到的组合信号的方法达到的,该方法包括 对于去相干信号、从去相干信号得到的信号、原始信号、从原始信号得到的信号、或组合信号进行频谱平整,以得到平整的信号,平整的信号比起在平整之前的相应信号有更平坦的频谱;以及使用关于平整信号的信息对去相干信号或组合信号进行时间包络整形。按照本发明的第五方面,这个目的是借助于一种接收或音频播放的方法达到的, 该方法具有用于处理从原始信号得到的去相干信号或通过组合原始信号与去相干信号而得到的组合信号的方法,该方法包括对于去相干信号、从去相干信号得到的信号、原始信号、从原始信号得到的信号、或组合信号进行频谱平整,以得到平整的信号,平整的信号比起在平整之前的相应信号有更平坦的频谱;以及使用关于平整信号的信息对去相干信号或组合信号进行时间包络整形。按照本发明的第六方面,这个目的是借助于一种计算机程序达到的,该计算机程序在计算机上运行时执行按照以上的方法权利要求中任一项的方法。本发明是基于发现当频谱平整器被用来对去相干信号或组合信号和原始信号的频谱进行频谱平整,以使用平整的频谱得到描述在平整的频谱之间的能量分布的增益因子时,以及当这样得到的增益因子被包络整形器用来对去相干信号或组合信号的时间包络进行整形时,从原始信号得到的去相干信号的包络或通过组合原始信号和去相干信号而得到的组合信号的包络可以被整形而不会引入附加失真。平整频谱具有以下优点瞬变信号几乎不会受到平整影响,因为这些信号已具有相当平坦的频谱。而且,对于非瞬变信号得到的增益因子更接近于1。所以,在解码过程期间整形瞬变信号和不改变非瞬变信号的两个要求可以一次满足,而不必接通和关断包络整形。同样的优点对于整形作为原始信号与从所述原始信号得到的去相干信号的组合的组合信号也适用。这样的组合可以通过首先从原始信号得到去相干信号、然后简单地把这两个信号相加而得到。例如,可能的前回声类型的人工产物可以在组合信号中通过使用组合信号的平整的频谱和原始信号的平整的频谱以得到被用于整形的增益因子来整形组合信号而被有利地抑制。本发明涉及对在多声道音频信号重建时经常使用的去相干信号的时间包络进行整形的问题。本发明提出了一种新的方法,它保持对于鼓掌欢呼信号的高的时间分辨率,而同时使得对于其它信号类型引入的失真最小。本发明指导了一种执行短时间能量调节的新的方法,这很大地减小了所引入的失真量,使得算法更加可靠和更少地依赖于控制时间包络整形算法的操作的非常精确的检测器。本发明包括以下特性-在大大长于对于时间包络整形所使用的时间段的时间段内,执行直接声音信号或从直接声音信号得到的信号的频谱平整;-在大大地长于对于时间包络整形所使用的时间段的时间段内,执行去相干信号的频谱平整;-根据长时间的频谱平整的信号计算对于包络整形所使用的短的时间段的增益因子;-借助于LPC(线性预测编码)在时域中执行频谱平整;-在滤波器库的子频带域中执行频谱平整;-根据时间包络的预测,在频率方向之前执行频谱平整;-根据时间包络的预测,对于频率方向执行能量校正。通过本发明,将全部或大大地减小以下的问题,这些问题是当试图进行去相干信号的非常短时间的宽带能量校正时引起的-在不需要时间整形的场合下,特别是对于信号段引入大量失真的问题;-由于对于任意信号引入的失真,引起对于表示何时应当操作短时间能量校正的对检测器高度依赖性的问题。本发明概述了一种用于计算需要的增益调节的新颖的方法,它保持高的时间分辨率,同时使得附加失真最小化。这意味着,利用本发明的空间音频系统不是那么依赖于对非关键项目关断时间整形算法的检测机制,因为对其中不需要时间整形的项目的附加失真保持为最小。这种新颖的算法还概述了当在变换域内在频率方向上借助于线性预测估计它时如何得到要被加到湿信号的干信号的时间包络的改进的估计。在本发明的一个实施例中,在从干信号得到湿信号后,在1到2上混频器的信号传输路径内采用了用于处理去相干信号的根据本发明的设备。首先,对于大量连续的时域采样(帧)计算湿信号和干信号的频谱平整的表示。 根据湿信号和干信号的这些频谱平整的表示,然后计算用来调节湿信号的少量采样的能量的增益因子。通过频谱平整,瞬变信号的频谱(其本身是相当平坦的)很难被改变,而周期信号的频谱被很大地修改。因此使用平整的频谱的信号表示达到以下效果当瞬变信号占优时主要对去相干的湿信号的包络进行整形,而当平滑的或周期性信号承载干信道中的大部分能量时,仅仅对湿信号的包络进行整形。因此,本发明大大地减小了被加到信号的失真量,特别是对于其中基本上不需要时间包络整形的信号段。而且,避免了对于表示何时应当施加短时间能量校正的现有技术检测器的高度依赖性。在本发明的另一个实施例中,根据本发明的设备作用在由上混频器得到的上混频的(组合的)单音信号,该上混频器组合原始信号和从原始信号得到的去相干信号,以计算上混频的单音信号。这样的上混频是在重建多声道信号期间用于得到具有多声道信号的相应原始声道的声学特性的各个声道的标准策略。由于根据本发明的设备可以在这样的上混频后被应用,现在已有的装置可以很容易地扩展。在本发明的再一个实施例中,去相干信号的时间包络整形在滤波器库的子频带域内实施。所以,对于大量的连续采样,对于每个子频带分别得到不同子频带信号的平整的频谱表示。根据频谱平整后的长期的频谱,对于代表原始信号的低得多的时间周期的采样,计算用来按照干信号整形湿信号的包络的增益因子。对于重建的音频信号的感知质量的优点是与对于上述的例子的优点相同的。此外,在滤波器库表示内实施本发明概念的可能性具有优点,即使用滤波器库表示的现在已有的多声道音频解码器可被修改用来实施本发明的概念,而不用花费很大的结构和计算方面的努力。在本发明的再一个实施例中,湿信号的时间包络整形是在子频带域内通过使用线性预测实施的。所以,线性预测在滤波器库的频率方向上被应用,允许以比起在滤波器库中本身可得到的更高的时间分辨率来对信号进行整形。再次通过估计滤波器库的用于多个连续子频带采样的增益曲线而计算最后的能量校正。在本发明的上述的实施例的修改方案中,描述频谱加白的参数的估值在滤波器库的多个相邻的时间采样上被平滑。所以,当存在瞬态信号时应用错误地得到的反向滤波器来加白频谱的风险进一步减小。


图Ia显示在1到2上混频器级内根据本发明的设备的应用;图Ib显示根据本发明的设备的应用的另一个例子;图加显示根据本发明的设备的其他布置的可能性;图2b显示根据本发明的设备的布置的其他例子;图3a显示在多声道音频解码器内根据本发明的设备的使用;图北显示在另一个多声道音频解码器内的根据本发明的设备;图如显示根据本发明的设备的一个优选实施例;图4b显示图如的根据本发明的设备的修改方案;图如显示线性预测编码的一个例子;图4d显示在线性预测编码时带宽扩展因子的应用;图fe显示本发明的频谱平整器;图恥显示长期能量校正的应用方案;图6显示用于短期能量校正的应用方案;图7a显示在QMF滤波器库设计内的根据本发明的设备;图7b显示图7a的根据本发明的设备的细节;图8显示在多声道音频解码器内根据本发明的设备的使用;图9显示在基于QMF的设计中反向滤波后根据本发明的设备的应用;图10显示具有滤波器库代表的信号的时间对频率的表示;图11显示具有根据本发明的解码器的传输系统。
具体实施例方式图1示出了一个1到2声道参数性上混频设备100,用来通过附加地使用空间参数把提交的单声道105上混频成两个立体声声道107和108。参数性上混频设备100具有参数性立体声上混频器110、去相干器112和用于处理去相干信号114的根据本发明的设备。
传送的单音信号105被输入到参数性立体声上混频器110以及去相干器112中, 去相干器112通过使用去相干法则从传送的信号105得到去相干信号,该去相干法则例如通过仅仅在给定的时间内延时信号而被实施。由去相干器112产生的去相干信号被输入到根据本发明的设备(整形器)114,该整形器另外接收传送的单音信号作为输入。传送的单音信号需要得到被用来整形去相干信号的包络的整形法则,正如在以后的段落中更详细地描述的。最后,去相干信号的包络整形的表示被输入到参数性立体声上混频器中,上混频器从传送的单音信号105和从去相干信号的包络整形表示得到立体声信号的左声道107和右声道108为了更好地了解本发明概念和本发明的不同实施例,在下面的段落中说明通过使用附加提交的专门参数把传送的单音信号变换成立体声信号的上混频处理过程。从现有技术已知,两个音频声道可以根据下混频声道和一组承载关于其上进行下混频的两个原始声道的能量分布的信息以及关于两个原始声道之间的相关性的信息的空间参数被重建。图1的实施例示例地说明本发明的框架工作。在图1中,下混频的单音信号105被馈送到去相干器单元112以及上混频模块 110。去相干器112创建具有相同频率特性和相同长期能量的输入信号105的去相干版本。 上混频模块根据空间参数计算上混频矩阵,并且合成输出声道107和108。上混频模块110 可以按照下式说明
'Ym'c, 0_cos( + β)sin(a + y0)'X[k]J2W.0 Cr _cos (-α + β)sin {-a + β)QW
‘、.-其中参数Cl,cr, α和β是从在比特流中传送的ILD参数和ICC参数得到的。 号X[k]是接收到的下混频信号105,信号Q[k]是去相干信号,即输入信号105的去相干版本。输出信号107和108用Y1 DO ^P Y2[k]表示。新的模块114被设计用来对作为去相干器模块112的输出的信号的时间包络进行整形,使得该时间包络匹配于输入信号的包络。模块100的细节将在以后的一节中详细地说明。从以上说明和从图1可以看到,上混频模块生成下混频信号与该下混频信号的去相干版本的线性组合。因此可以看到,去相干信号与下混频信号的相加可以在如上所述的上混频器内或在后面的级中完成。因此,以上的两个输出声道107和108可以由四个输出声道代替,其中两个保持第一声道的去相干版本和直接信号版本,两个保持第二声道的去相干版本和直接信号版本。这是通过用下式替代以上的上混频公式而达到的
'YiwelIk]C,0"cos(a + j9)sin (α + / )‘0 “0cV-cos(- + / )sin (-a + β)QW'YldryIk]0_cos(ar + β)sin (α + β)'X[k]Y2diyW0c。cos (-α + β)sin (-α + β)0 随后通过下式得到重建的输出声道
、'YldryIk]J2 [k]_Y2dry[k\"Γ
在给出以上说明后,可以看到,根据本发明的设备可以在最后的上混频之前以及在上混频之后被实施为解码方案,如图1所示。而且,根据本发明的设备可以被用来在时域以及在QMF子频带域中整形去相干信号的包络。图Ib显示本发明的另一个优选实施例,其中根据本发明的整形器114被用来整形从传送的单音信号105得到的组合信号118和从传送的单音信号105得到的去相干信号 116。图Ib的实施例是基于图1的实施例。所以,具有相同的功能的部件具有相同的附图标记。去相干器112从传送的单音信号105得到去相干信号116。混频器117接收去相干信号116和传送的单音信号105作为输入,并通过组合传送的信号105与去相干信号116 而得到组合信号118。在本上下文中,组合可以是指从两个或多个输入信号得到一个单个信号的任何适当的方法。在最简单的例子中,组合信号118可以通过简单地相加传送的单音信号105和去相干信号116而得到。整形器114接收要被整形的组合信号118作为输入。为了得到用于整形的增益因子,传送的单音信号105也被输入到整形器114中。在整形器114的输出端处得到具有去相干信号分量和原始信号分量的局部去相干信号119,而不会引入附加的可听见的人工产物。图2显示一种结构,其中湿信号部分的包络整形可以在上混频后进行。图2显示根据本发明的参数性立体声上混频器120和去相干器112。单音信号105 被输入到去相干器112和被输入到参数性立体声上混频器120。去相干器112从单音信号 105得到去相干信号,并把去相干信号输入到参数性立体声上混频器120中。参数性立体声上混频器120是基于已在图1中描述的参数性立体声上混频器110。参数性立体声上混频器120与参数性立体声上混频器110的不同处在于,参数性立体声上混频器120得到左声道的干信号部分12 和湿信号部分122b以及右声道的干信号部分12 和湿信号部分 124b。换句话说,参数性立体声上混频器120分别上混频这两个声道的干信号部分和湿信号部分。这可以按照以上给出的公式实施。由于左声道的湿信号部分122b和右声道的湿信号部分12 已被上混频,但还没有被整形,在图2所示的本发明的上混频装置中附加地存在第一整形器126a和第二整形器 126b。第一整形器126a在它的输入端处接收要被整形的湿信号和作为参考信号的左声道的干信号部分12 的拷贝。在第一整形器126a的输出端处,提供整形的湿信号U8a。第二整形器126b在它的输入端处接收右声道的干信号部分12 和右声道的湿信号部分1Mb, 以及得到右声道的整形的湿信号128b作为它的输出。为了最后得到想要的左信号107和右信号108,在本发明的装置中存在第一混频器129a和第二混频器U9b。第一混频器129a 在它的输入端处接收左声道的干信号部分12 的拷贝和整形的湿信号128a,以(在它的输出端)得到左信号107。第二混频器129b以类似的方式,通过在它的输入端处接收右声道的干信号部分12 和整形的右湿信号U8b,得到右声道108。正如从图2可以看到的,这个装置可以作为图1所示的实施例的替代例工作。图2b显示本发明的一个优选实施例,它是先前在图2中显示的实施例的修改方案,所以具有相同的部件采用相同的附图标记。
在图2b所示的实施例中,湿信号122b首先与它的对应的干信号12 混频,以得到左边的中间声道IA以及湿信号124b与它的对应的干信号12 混频,以得到右边的中间声道R*。因此,生成包括左侧信息的声道和包括右侧信息的声道。然而,仍旧有通过湿信号分量122b和124b引入可听见的人工产物的可能性。所以中间信号L*和R*通过附加地接收干信号部分12 和12 作为输入的相应整形器126a和126b被整形。因此,最后可以得到具有想要的空间特性的左声道107和右声道108。简短地说,图2b所示的实施例与图加所示的实施例的不同处在于,湿信号和干信号首先被上混频,然后对这样得到的组合信号(L*和R*)进行整形。因此,图2b显示解决共同问题的替代装置,它具有两个声道而没有由所使用的去相干信号部分引起可听见的失真。组合两个信号部分得到要被整形的组合信号的其它方法,诸如,例如相乘或折叠信号, 也适合于实施使用信号的频谱平整表示进行整形的本发明的概念。如图3所示,两个声道重建模块可被级联成树结构系统,它从单个下混频声道130 迭代地重建例如5. 1声道。这被概述于图3a,其中几个根据本发明的上混频模块100被级联,以从单音下混频声道130重建5. 1声道。图3a所示的5. 1声道音频解码器132包括被排列成树状结构的几个1到2上混频器100。上混频是通过单声道的随后上混频到立体声声道而迭代地完成的,正如本领域中已知的,然而它使用本发明的1到2上混频器模块100,它包括用于处理去相干信号来增强重建的5. 1音频信号的感知质量的本发明的设备。本发明建议,来自去相干器的信号必须经过它的时间包络的精确整形,以免当信号与它的对应的干信号混频时引起不想要的人工产物。时间包络的整形可以如图1所示在去相干器单元后直接进行,或者作为替代,上混频可以在去相干器后分开地对干信号和湿信号执行,并且两个信号的最后的相加是在合成滤波后在时域中完成的,如图2所示。这也可以作为替代地在滤波器库域中执行。为了支持上述的分开生成干信号和湿信号,在本发明的另一个实施例中使用如图 3b所示的分级级联结构。图北显示第一分级级联解码器150,包括多个级联的修改的上混频模块152 ;和第二分级级联解码器154,包括多个级联的修改的上混频模块156。为了达到分开地生成干信号和湿信号路径,单音下混频信号130被分割并被输入到第一分级级联解码器150以及第二分级级联解码器154中。第一分级级联解码器150的修改的上混频模块152与5. 1声道音频解码器132的上混频模块100的不同之处在于,它们在它们的输出端处只提供干信号部分。相应地,第二分级级联解码器154的修改的上混频模块156在它们的输出端处只提供湿信号部分。所以,通过实施与图3a中相同的分级级联结构,5. 1声道信号的干信号部分由第一分级级联解码器150生成,而5. 1声道信号的湿信号部分由第二分级级联解码器154生成。因此,湿信号和干信号的生成例如可以在滤波器库域内执行,而两个信号部分的组合可以在时域中执行。本发明还建议,被用于提取以后用于整形湿信号的时间包络的估计的包络的信号在估计处理过程之前将经受长期频谱平整或加白操作,以使得当使用非常短的时间段、即 Ims范围的时间段修改去相干信号时引入的失真最小化。去相干的信号的时间包络的整形可以借助于在子频带域或在时域的短期能量调节被完成。如本发明引入的加白步骤保证了能量估计在尽可能大的频率片上进行计算。换句话说,由于信号段的持续时间是极其短的,重要的是在尽可能大的频率范围上估计短期能量,以使得对于能量计算所使用的“数据点的数目”最大化。然而,如果一部分频率范围比起其余部分是占优的,即具有陡峭的频谱斜率,则有效的数据点的数目变为过小,并且所得到的估计容易随不同的估计而变化,给应用的增益值加上不必要的起伏。本发明还建议,当去相干信号的时间包络借助于在频率方向上的预测被整形时 [J. Herre禾口J. D.Johnston,“Enhancing the performanceof perceptual audio coding by using temporal noise shaping (TNS),,,in 101st AES Convention, Los Angeles,November 1996],被用来估计预测器频谱应当经受加白级,以便得到应当被应用到去相干信号的时间包络的良好的估值。此时也不希望让估计基于小部分的频谱,如对于未进行频谱加白的陡峭斜率频谱的那种情形。图如显示在时域中工作的本发明的一个优选实施例。用于处理去相干信号的本发明设备200接收要被整形的湿信号202和干信号204作为输入,其中湿信号202是在以前的步骤中从干信号204得到的(图4中未示出)。用于处理去相干信号202的设备200具有在干信号的信号路径上的第一高通滤波器206、第一线性预测装置208、第一反向滤波器210和第一延时装置212 ;以及在湿信号的信号路径上的第二高通滤波器220、第二线性预测装置222、第二反向滤波器224、低通滤波器2 和第二延时装置228。该设备还包括增益计算器230、乘法器(包络整形器)232和加法器(上混频器)234。在干信号一侧,干信号的输入被分割并被输入到第一高通滤波器206和第一延时装置212。高通滤波器206的输出端被连接到第一线性预测装置208的输入端和第一反向滤波器210的第一输入端。第一线性预测装置208的输出端被连接到反向滤波器210的第二输入端,并且反向滤波器210的输出端被连接到增益计算器230的第一输入端。在湿信号路径中,湿信号202被分割并被输入到第二高通滤波器220的输入端和低通滤波器226的输入端。低通滤波器226的输出端被连接到第二延时装置228。第二高通滤波器220的输出端被连接到第二线性预测装置222的输入端和第二反向滤波器224的第一输入端。第二线性预测装置222的输出端被连接到第二反向滤波器224的第二输入端,它的输出端被连接到增益计算器230的第二输入端。包络整形器232在第一输入端处接收在第二高通滤波器220的输出端处提供的高通滤波的湿信号202。包络整形器232的第二输入端被连接到增益计算器230的输出端。包络整形器232的输出端被连接到加法器234的第一输入端, 它在第二输入端处接收从第一延时装置212的输出端提供的延时的干信号,并且它还在第三输入端处接收通过第二延时装置228的输出端提供的延时的湿信号的低频部分。在加法器232的输出端处,提供完全处理的信号。在图如所示的本发明的优选实施例中,来自去相干器的信号(湿信号202)和相应的干信号204被分别输入到第二高通滤波器220和第一高通滤波器206,在其中两个信号以约2kHz的截止频率被高通滤波。湿信号202也被具有与第二高通滤波器220的阻带相同的通带的低通滤波器2 进行低通滤波。去相干(湿)信号202的时间包络整形因此只在大于2kHz的频率范围内进行。湿信号202的低通部分(没有经受时间包络整形)被第二延时装置208延时,以补偿当整形去相干信号202的高通部分的时间包络时引起的延时。 同样的情形对于干信号部分204也是成立的,它接收来自第一延时装置212的相同的延时,以使得在加法器234处,湿信号202的处理后的高通滤波部分、湿信号202的延时后的低通部分、和延时的干信号204可被相加或上混频,以产生最后处理的上混频信号。按照本发明,在高通滤波后,要估计长期频谱包络。重要的是,对于长期频谱包络估计所使用的时间段大大地长于被用来进行实际的时间包络整形的时间段。频谱包络估计和随后的反向滤波,典型地工作在20ms范围内的时间段,而时间包络整形的目的是以Ims 范围内的精度整形时间包络。在如图如所示的本发明的优选实施例中,频谱加白通过反向滤波执行,第一反向滤波器210作用在干信号上而第二反向滤波器2M作用在湿信号202 上。为了得到对于第一反向滤波器210和第二反向滤波器224的需要的滤波器参数,借助于第一线性预测装置208和第二线性预测装置222的线性预测,估计信号的频谱包络。信号的频谱包络H(Z)可以通过使用如以下公式描述的线性预测而得到
权利要求
1.一种用于处理从原始信号得到的去相干信号或通过组合原始信号和去相干信号而得到的组合信号的设备,包括频谱平整器,用于对从去相干信号通过对所述去相干信号或组合信号进行高通滤波或上混频或执行滤波器库操作而得到的信号进行频谱平整以得到第一平整信号,并对从原始信号通过对所述原始信号进行高通滤波或上混频或执行滤波器库操作而得到的信号进行频谱平整以得到第二平整信号,该频谱平整器用来使得平整后的信号比起在平整之前的相应信号有更平坦的频谱;以及时间包络整形器,用于通过使用通过比较包括在第一平整信号和第二平整信号的相应部分内的能量而得到的增益因子对去相干信号进行时间包络整形。
2.按照权利要求1的设备,其中频谱平整器用来平整去相干信号或组合信号的包含第一时间段的第一部分;以及其中时间包络整形器用来整形去相干信号或组合信号的包含第二时间段的第二部分, 其中第一时间段比第二时间段要长。
3.按照权利要求2的设备,其中第一时间段的长度大于第二时间段的长度的10倍。
4.按照权利要求1的设备,其中频谱平整器用来借助于使用通过线性预测编码得到的滤波器系数的滤波来平整频谱。
5.按照权利要求4的设备,其中频谱平整器用来借助于使用通过时间方向上的线性预测得到的滤波器系数的滤波来平整频谱。
6.按照权利要求1的设备,其中频谱平整器用来得到在时域中的信号的频谱平整的表示。
7.按照权利要求1的设备,其中频谱平整器用来得到在子频带域中的信号的频谱平整的表示。
8.按照权利要求1的设备,其中频谱平整器和时间包络整形器用来处理大于给定的频率阈值的全频谱去相干信号的所有的频率。
9.一种用于处理从原始信号得到的去相干信号或通过组合原始信号与去相干信号而得到的组合信号的方法,该方法包括对从去相干信号通过对所述去相干信号或组合信号进行高通滤波或上混频或执行滤波器库操作而得到的信号进行频谱平整以得到第一平整信号,并对从原始信号通过对所述原始信号进行高通滤波或上混频或执行滤波器库操作而得到的信号进行频谱平整以得到第二平整信号,平整后的信号比起在平整之前的相应信号有更平坦的频谱;以及通过使用通过比较包括在第一平整信号和第二平整信号的相应部分内的能量而得到的增益因子对去相干信号或组合信号进行时间包络整形。
10.一种空间音频解码器,包括输入接口,用于接收从具有至少两个声道的多声道信号得到的原始信号和用于接收描述在多声道信号的第一声道与第二声道之间的相互关系的空间参数;去相干器,用于通过使用空间参数从原始信号得到去相干信号;频谱平整器,用于对从去相干信号通过对所述去相干信号或组合信号进行高通滤波或上混频或执行滤波器库操作而得到的信号进行频谱平整以得到第一平整信号,并对从原始信号通过对所述原始信号进行高通滤波或上混频或执行滤波器库操作而得到的信号进行2=频谱平整以得到第二平整信号,频谱平整器用来使得平整后的信号比起在平整之前的相应信号有更平坦的频谱;以及时间包络整形器,用于通过使用通过比较包括在第一平整信号和第二平整信号的相应部分内的能量而得到的增益因子对从去相干信号得到信号进行时间包络整形。
11.一种接收机,具有如权利要求1所述的用于处理去相干信号或组合信号的设备。
12.—种音频播放器,具有如权利要求1所述的用于处理去相干信号或组合信号的设备。
13.一种接收方法,该方法具有如权利要求9所述的用于处理去相干信号或组合信号的方法。
14.一种音频播放的方法,该方法具有如权利要求9所述的用于处理去相干信号或组合信号的方法。
全文摘要
本发明涉及用于处理去相干信号或组合信号的设备和方法,当频谱平整器在使用平整的频谱得到描述在平整的频谱之间的能量分布的增益因子之前用来对去相干信号和原始信号的频谱进行频谱平整时,以及当这样得到的增益因子被包络整形器用来对去相干信号的包络进行时间整形时,从原始信号得到的去相干信号的时间包络可以被整形而不会引入附加失真。
文档编号G10L19/00GK102163429SQ201110062800
公开日2011年8月24日 申请日期2006年4月5日 优先权日2005年4月15日
发明者克利斯托夫·克约尔灵, 卓尔根·赫瑞, 拉斯·维勒莫斯, 萨斯查·迪斯查 申请人:弗劳恩霍夫应用研究促进协会, 杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1