基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法

文档序号：2834567阅读：314来源：国知局

专利名称：基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法
技术领域：
本发明涉及音频源编码系统，但是同样的方法也可应用于许多其他技术领域中。介绍了可用于利用立体声属性的参数表示的音频编码系统的不同技术。
背景技术：
本发明涉及音频信号的立体声声像的参数编码。用于描述立体声声像属性的典型参数是声道间强度差异(IID)、声道间时间差异(ITD)和声道间相干(IC)。为了基于这些参数重建立体声声像，要求一种能够根据IC参数重建两个声道间的正确相关级别的方法。这是通过去相关方法来实现的。
有几种创建去相关后的信号的方法可用。理想情况下，要求具有全通频率响应的线性时不变(LTI)函数。用于实现这一点的一种明显方法是通过使用恒定延迟。但是，使用延迟或任何其他LTI全通函数，将会导致加上未经处理的信号后的非全通响应。在延迟的情况下，结果将会是典型梳状滤波器。梳状滤波器通常给出不合需要的“金属”声音，即使立体声加宽效果有效，该声音也会大大降低原始声音的自然度。
现有技术还已知通过沿频率轴向IID值添加随机序列来生成去相关后的信号的频域方法，其中不同序列用于不同音频声道。通过随机序列修改进行的频域去相关的一个问题是引入了前回声。主观测试表明对于非静止信号，前回声比起后回声来恼人得多，已确立的心理声学原理也支持这一点。此问题可通过就瞬态内容而言针对信号特性而动态自适应变换尺寸来减小。但是，切换变换尺寸始终是硬(即二元)判决，它影响整个信号带宽并且难以用鲁棒的方式来实现。
美国专利申请公布US 2003/0219130 A1公开了基于相干的音频编码和合成。具体而言，通过为每个临界频带修改听觉情景参数，从单声道(mono)音频信号合成听觉情景，所述参数例如是临界频带内的每个子频带的耳间级别差异(ILD)和/或耳间时间差异(ITD)，其中修改是基于临界频带的平均估计相干的。基于相干的修改产生了具有对象宽度的听觉情景，这精确地匹配了原始输入听觉情景中的对象的宽度。立体声参数是公知的BCC参数，其中BCC代表技术心理声学编码(binaural cue coding)。当生成两个不同的去相关后的输出声道时，由离散付立叶变换所获得的频率系数被一起聚集在单个临界频带中。基于声道间相干测量，加权因子被乘以伪随机序列，该序列优选地被选择为使得对于所有临界频带方差大致恒定，并且在每个临界频带内平均值为0。相同的序列适用于每个不同帧的频谱系数。

发明内容
本发明的目的是提供一种用于参数性编码的多声道信号的解码概念或用于生成这种信号的编码概念，这种信号产生良好的音频质量和良好的编码效率。
此目的是通过用于根据权利要求1的用于生成去相关信号的装置、根据权利要求13的多声道解码器、根据权利要求20的生成去相关信号的方法、根据权利要求21的多声道解码方法、根据权利要求22的对立体声信号编码的装置或根据权利要求26的对立体声信号编码的方法或者根据权利要求27的计算机程序来实现的。
本发明基于在使用混响滤波器(reverberation filter)时在解码侧发现获得一个用于基于输入单声道信号生成多声道信号的第一和第二声道的良好的去相关信号，该混响滤波器向输入信号引入了整数延迟或者优选地引入了分数延迟。重要的是，此混响滤波器不被应用到整个输入信号。相反，几个混响滤波器被应用到原始输入信号即单声道信号的几个子带，以便当应用付立叶变换时，利用混响滤波器进行的混响滤波不被应用于时域或频域中，即所到达的域中。发明性地，利用混响滤波器为子带进行的混响滤波是在子带域中单独执行的。
子带信号包括至少两个子带采样的序列，子带采样的序列代表子带信号的带宽，该带宽小于输入信号的带宽。显然，子带信号的频率带宽高于归因于由付立叶变换获得的频率系数的频率带宽。子带信号优选地由滤波器组生成，该滤波器组例如具有32或64个滤波器组信道，而对于同一示例，FFT将会具有1.024或2.048个频率系数，即频率信道。
子带信号可以是通过对一批输入信号采样进行滤波而获得的子带信号。或者，子带滤波器组也可被连续应用，而没有按批进行的处理。但是对于本发明按批进行的处理是优选的。
由于混响滤波不被应用到整个信号，而是按照子带应用的，所以避免了由梳状滤波导致的“金属”声。
当子带的两个连续子带采样之间的采样周期对于解码器端的良好声音印象来说太大时，在混响滤波器中最好使用分数延迟，例如子带信号的采样周期的0.1至0.9之间的延迟，并且最好是子带信号的采样周期的0.2至0.8之间的延迟。注意，在临界采样情况下，当利用具有64个滤波器组信道的滤波器组生成64个子带信号时，子带信号中的采样周期比原始输入信号的采样周期大64倍。
这里要注意延迟是混响设备中使用的滤波过程的不可缺少的部分。输出信号由输入信号的多个延迟后的版本构成。最好将信号延迟子带采样周期的若干分之几，以便在子带域中实现良好的混响设备。
在本发明的优选实施例中，由每个子带中的每个混响滤波器引入的延迟以及优选地分数延迟对于所有子带是相等的。然而，对于每个子带，滤波器系数是不同的。优选使用IIR滤波器。根据实际情形，可利用收听测试来经验地确定不同滤波器的分数延迟和滤波器系数。
由混响滤波器组进行滤波的子带构成去相关信号，该去相关信号将被与原始输入信号即单声道信号相混合，以获得解码后的左声道和解码后的右声道。去相关信号与原始信号的这一混合是基于与参数性编码的信号一起传输的声道间相干参数来执行的。为了获得不同的左声道和右声道，即不同的第一和第二声道，将去相关信号与单声道信号混合以获得第一输出声道与将去相关信号与单声道信号混合以获得第二输出声道是不同的。
为了在编码侧获得高效效率，利用立体声参数集合的自适应式确定，而执行多声道编码。为此，编码器除了包括用于计算单声道信号的装置以及用于生成立体声参数集合的装置外，还包括用于确定左声道和右声道的后续部分的立体声参数集合的有效性的装置。优选地，该用于确定的装置可操作以在确定立体声参数集合不再有效时激活所述用于生成的装置，以便为开始于第二时间边界处的左声道和右声道的部分计算第二立体声参数集合。此第二时间边界也是通过所述确定有效性的装置来确定的。
于是编码后的输出信号包括单声道信号，第一立体声参数集合和与第一参数集合相关联的第一时间边界以及第二立体声参数集合和与第二立体声参数集合相关联的第二时间边界。在解码侧，解码器将会使用有效立体声参数集合，直到达到新的时间边界。当达到此新的时间边界时，利用新的立体声参数集合执行解码操作。
与现有技术方法(即执行按批进行的处理，因而执行立体声参数集合的按批确定)相比，所发明的自适应地确定编码侧所确定的不同时间边界的立体声参数集合的方式一方面提供了高编码效率，另一方面提供了高编码质量。这是因为对于相对静止的信号，相同的立体声参数集合可用于许多批的单声道信号采样，而不会引入可听误差。另一方面，当考虑非静止信号时，所发明的自适应立体声参数确定提供了增大的时间分辨率，以便每个信号部分具有其最优立体声参数集合。
本发明通过用混响单元作为去相关器，其用滤波器组中的分数延迟线实现，并且利用去相关后的混响信号的自适应级别调整，从而提供了对现有技术问题的解决方案。
以下将概述本发明的几个方面。
本发明的一个方面是用于通过以下步骤延迟信号的方法通过复数滤波器组的一解析部分对实数值时域信号进行滤波；修改从滤波获得的复值子带信号；通过滤波器组的合成部分对修改后的复值子带信号进行滤波；并取复值时域输出信号的实部，其中输出信号是从合成滤波获得的信号之和。
本发明的另一方面是一种用于通过利用复值有限冲击响应滤波器对每个复值子带信号进行滤波来修改复值子带信号的方法，其中用于第n号子带的有限冲击响应滤波器是离散时间付立叶变换，其具有以下形式其中参数τ＝T/L，并且其中合成滤波器组具有L个子带，并且在以输出信号采样为单位测量的情况下所需延迟为T。
本发明的另一个方面是用于通过滤波而修改复值子带信号的方法，其中滤波器Gτ(ω)大致满足Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)＝1，其中Vτ(ω)是序列vτ(k)=AikΣlp(l)p(l-T-Lk),]]>的离散时间付立叶变换，p(l)是所述复滤波器组的原型滤波器，A是适当的实数规一化因子。
本发明的另一方面是用于通过滤波而修改复值子带信号的方法，其中滤波器Gτ(ω)满足Gτ(-ω)＝Gτ(ω+π)*，以便偶数索引的冲击响应采样是实值的，而奇数索引的冲击响应采样是纯虚值的。
本发明的另一方面是一种用于通过以下步骤对输入信号的立体声属性进行编码的方法在编码器处计算描述每个立体声参数集合在时间中的位置的时间栅格参数，并且在解码器数根据该时间栅格应用参数性立体声合成，其中立体声参数集合的数目是任意的。
本发明的另一方面是一种用于对输入信号的立体声属性进行编码的方法，其中在立体声参数集合的时间暗示(time cue)与帧开始一致的情况下，第一立体声参数集合的时间本地化之处被明确用信令通知，而不是发送时间指针。
本发明的另一方面是一种用于通过以下步骤生成用于参数性立体声重建的立体声相关的方法在解码器处，应用人工混响过程以合成侧边信号。
本发明的另一方面是一种通过以下步骤生成用于参数性立体声重建的立体声去相关的方法在解码器处，在复调制的滤波器组内利用每个滤波器组信道中的相位延迟调整而进行混响过程。
本发明的另一方面是一种用于通过以上步骤生成用于参数性立体声重建的立体声去相关的方法在解码器处，混响过程利用一个检测器，其被设计用于查找其中混响尾部可能不必要的信号而使得混响尾部被衰减或去除。

现将通过参考附图以不限制本发明的范围或精神的示例性示例的方式来描述本发明，附图中图1示出所发明的装置的框图；图2示出用于生成去相关后的信号的装置的框图；图3示出根据本发明基于重建后的立体声子带信号分析单个声道和合成立体声声道；图4示出基于信号特性将参数性立体声参数集合分成时间片段的框图；图5示出基于信号特性将参数性立体声参数集合分成时间片段的示例。
具体实施例方式
下述实施例仅用于例示本发明用于参数性立体声编码的原理。要理解对这里所描述的配置和细节的修改和变化对于本领域的技术人员来说是显而易见的。因此，希望仅由紧随之后的专利权利要求书的范围所限，而不由通过描述和说明这里的实施例而提供的特定细节所限。
将信号延迟一个采样的若干分之几可通过几种现有技术插值方法来实现。但是，当原始信号是作为过采样的复数值采样而获得的时，会出现特殊情况。通过仅为对应于恒定时间延迟的每个qmf施加某个因数的相位延迟，从而来在qmf组中执行分数延迟，会导致严重的假象。
通过根据一种允许对任何复指数调制的滤波器组中的任意延迟的高质量逼近的新颖方法来使用补偿滤波器，可有效避免这一点。详细描述如下。
连续时间模型为了易于计算，这里将通过利用合成波形的连续时间加窗变换来模拟复指数调制的L频带滤波器组un，k(t)＝v(t-k)exp[iπ(n+1/2)(t-k+θ)]，(1)其中n，k是整数，n≥0，θ是固定相位项。离散时间信号的结果是通过利用间隔1/L对t-变量进行适当的采样而获得的。假设实值窗口v(t)被选择为使得对于实值信号x(t)，它保持非常高的精度x(t)=2Re{Σn=0∞Σk=-∞∞cn(k)un,k(t)}···(2)]]>如果cn(k)=&Integral;-∞∞x(t)un,k*(t)dt,···(3)]]>其中*表示复共轭。还假设v(t)本质上频带受限于频率区间[-π，π]。考虑通过利用具有冲击响应hn(k)的滤波器对离散时间分析采样cn(k)滤波，来对每个频带n进行的修改，dn(k)=Σlhn(l)cn(k-l).···(4)]]>则修改后的合成y(t)=2Re{Σn=0∞Σk=-∞∞dn(k)un,k(t)}···(5)]]>在频域中可被计算为y^(ω)=H(ω)x^(ω),···(6)]]>其中表示f(t)的付立叶变换，并且H(ω)=Σn=-∞∞Hn(ω)|v^(ω-π(n+1/2))|2.···(7)]]>这里，Hn(ω)＝∑khn(k)exp(-ikω)是在n≥0情况下频带n中应用的滤波器的离散时间付立叶变换，并且对于n＜0，Hn(ω)＝H-1-n(-ω)*(8)这里观察到由于窗口v(t)的特殊设计，特殊情况Hn(ω)＝1导致(7)中H(ω)＝1。另一个感兴趣的情况是Hn(ω)＝exp(-iω)，其给出H(ω)＝exp(-iω)，以使得y(t)＝x(t-1)。
所提议的解决方案为了实现大小为τ的延迟，以便y(t)＝x(t-τ)，问题在于对于n≥0设计滤波器Hn(ω)，以使得H(ω)＝exp(-iτω)，(9)其中H(ω)由(7)和(8)给出。这里提议的特定解决方法是应用滤波器这里Gτ(-ω)＝Gτ(ω+π)*意味着对于所有n与(8)的一致性。将(10)插入到(7)的右手侧导致H(ω)＝exp(-iωτ)[Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)](11)其中在b(ω)=exp(iτω)|v^(ω)|2]]>的情况下Vτ(ω)＝∑nb(ω-π(2n+1/2))。基本计算显示Vτ(ω)是以下变量的离散时间付立叶变换vτ(k)=ik&Integral;-∞∞v(t)v(t-τ-k)dt.···(12)]]>通过在最小二乘意义上解以下线性系统可获得对理想延迟的非常良好的逼近Vτ(ω)Gτ(ω)+Vτ(ω+π)Gτ(ω+π)＝1(13)其中FIR滤波器Gτ(ω)=Σk=-NMgτ(k)exp(-ikω).]]>就滤波器系数而言，方程(13)可写为2Σlvτ(2k-l)gτ(l)=δ[k],···(14)]]>其中对于k＝0，δ[k]＝1，对于k≠0，δ[k]＝0。
在具有原型滤波器p(k)的离散时间L频带滤波器组的情况下，所获得以采样为单位的延迟为Lτ，计算(12)被替换为vτ(k)=ikΣlp(l)p(l-T-Lk),···(15)]]>其中T是最接近Lτ的整数。这里p(k)被其支持以外的零所扩展。对于有限长度原型滤波器，只有有限多个vτ(k)不等于零，并且(14)是线性方程组。未知gτ(k)的数目通常被选择为较小的数字。对于良好的QMF滤波器组设计，3-4个抽头就已经给出非常好的延迟性能。此外，滤波器抽头gτ(k)对延迟参数τ的依赖性通常可由低阶多项式来成功模拟。
用信号通知立体声参数的自适应时间栅格参数性立体声系统通常导致就有限时间或频率分辨率而言的折衷，以便使所输送的数据最小化。但是，从心理声学中所公知的是，某些空间暗示可能比其他的更重要，这导致了丢弃不太重要的暗示的可能性。因此，时间分辨率不必是恒定的。通过使时间栅格与空间暗示同步，可实现比特率上的巨大增益。通过为对应于固定大小的时间片段的每个数据帧发送可变数目的参数集合，可以很容易地实现这一点。为了使参数集合与相应的空间暗示同步，必须发送描述每个参数集的时间位置的额外的时间栅格数据。这些时间指针的分辨率可被选择为相当低，以保持数据总量最小。参数集合的时间暗示与帧的开头一致的特殊情况可被明确地用信号通知，以避免发送该时间指针。
图4示出用于对具有可变的和信号相关的时间边界的时间片段执行参数分析的所发明的装置。所发明的装置包括装置401，用于将输入信号划分成一个或几个时间片段。分隔时间片段的时间边界由装置402提供。装置402使用检测器，其特别设计来用于抽取与确定在何处设置时间边界有关的空间暗示。装置401输出划分成一个或多个时间片段的所有输入信号。此输出被输入到装置403，以便为每个时间片段进行单独的参数分析。装置403为每个被分析的时间片段输出一个参数集合。
图5示出时间栅格生成器能够如何对假设的输入信号执行操作的示例。在此示例中，如果不存在其他时间边界信息，则对于每个数据帧使用一个参数集合。因此，当不存在其他时间边界信息时，使用数据帧的固有时间边界。图5中所示的时间边界是来自图4中的装置402的输出。图5中所示的时间片段是由图4中的装置401提供的。
用于对立体声信号编码以获得一个单声道输出信号和该立体声的参数集合的装置，包括用于通过由加权加法组合立体声信号的左声道和右声道来计算所述单声道信号的装置。此外，装置403利用左声道的一部分和右声道的一部分来生成第一立体声参数集合，开始于第一时间边界处的所述部分被连接到一个装置，该装置用于确定左声道和右声道的后续部分的第一立体声参数集合的有效性。
用于确定的装置是由图1中的装置402和401共同形成的。
具体而言，所述用于确定的装置可操作以便在确定此第一立体声参数集合不再有效时生成第二时间边界并且激活用于生成的装置，以便生成开始于第二时间边界处的左声道和右声道的部分的第二立体声参数集合。
图4中未示出的是用于输出单声道信号、第一立体声参数集合和与第一立体声参数集合相关联的第一时间边界以及第二立体声参数集合和与第二立体声参数集合相关联的第二时间边界，作为参数编码后的立体声信号的装置。用于确定立体声参数集合的有效性的装置可包括瞬态检测器，因为很可能在一个瞬态之后，必须生成新的立体声参数，这是因为信号已大大改变其形状。或者，用于确定有效性的装置可包括综合分析设备，其适用于对单声道信号和立体声参数集合解码，以获得解码后的左声道和解码后的右声道，以便将解码后的左声道和解码后的右声道与左声道和右声道相比较，从而在解码后的左声道和解码后的右声道与左声道和右声道的差异大于预定阈值时，激活所述用于生成的装置。
数据帧1对应于参数集合1的时间片段开始于数据帧1的开头处，这是因为在此数据帧中不存在其他时间边界信息。
数据帧2此数据帧中存在两个时间边界。对应于参数集合2的时间片段开始于此数据帧中的第一时间边界处。对应于参数集合3的时间片段开始于此数据帧中的第二时间边界处。
数据帧3此数据帧中存在一个时间边界。对应于参数集合4的时间片段开始于此数据帧中的时间边界处。
数据帧4此数据帧中存在一个时间边界。此时间边界与数据帧4的开始边界一致，并且不必被用信号通知，这是因为这是由缺省情况所处理的。因此，可去除此时间边界信号。对应于参数集合5的时间片段开始于数据帧4的开头处，即使在没有用信号通知此时间边界的情况下也是如此。
利用人工混响作为用于参数性立体声重建的去相关方法在参数性立体声系统中进行立体声合成的一个至关重要的部分是减小左声道和右声道之间的相干，以便产生立体声声像的宽度。这可通过将原始单声道信号的滤波后版本添加到侧边信号来完成的，其中侧边信号和单声道信号分别由以下式子定义单声道信号＝(左+右)/2，侧边信号＝(左-右)/2。
为了不太多改变音色，所考虑的滤波器优选地应该具有全通特性。一个成功的方法是使用与用于人工混响过程类似的全通滤波器。人工混响算法通常要求高时间分辨率，以给出在时间上符合要求地散布的冲击响应。使人工混响算法基于诸如复qmf组这样的复滤波器组具有重大优点。滤波器组使得很有可能令混响属性就例如混响均衡、衰减时间、密度和音色而言具有频率选择性。但是，滤波器组实现方式通常用时间分辨率来交换较高的频率分辨率，这通常使得难以实现在时间上足够平滑的混响过程。为了处理此问题，一种新颖的方法是使用分数延迟逼近，该分数延迟逼近是通过仅为每个对应于恒定时间延迟的qmf声道施加某个因数的相位延迟来进行的。此原始分数延迟方法引入了严重的时间拖尾效应，幸运的是，在这种情况下是非常需要这种拖尾效应的。时间拖尾效应对混响算法非常需要的时间散布作出贡献，并且随着相位延迟接近pi/2或-pi/2而变得更大。
由于自然原因，人工混响过程是具有无限冲突响应的过程，并且提供自然的指数衰减。在[PCT/SE02/01372]中指出，如果混响单元被用于生成立体声信道，则在声音真正结束之后，混响衰减有时是不必要的。但是，只要通过更改混响信号的增益，就可容易地衰减或完全去除这种不必要的混响尾部。被设计用于查找声音结尾的检测器可用于该用途。如果混响单元在某个特定信号处生成假象，例如在瞬态信号，则用于这些信号的检测器也可用于衰减这些信号。
图1示出在参数性立体声系统中使用的信号的去相关方法的发明装置。发明装置包括用于提供多个子带信号的装置101。提供装置可以是复QMF滤波器组，其中每个信号与子带索引相关联。
由图1中的装置101输出的子带信号被输入到用于提供去相关后的信号102的装置102中，以及用于修改子带信号的装置103和106中。来自102的输出被输入到用于修改信号的装置104和105中，并且103、104、105和106的输出被输入到用于将子带信号相加的装置107和108中。
在目前描述的本发明的实施例中，用于修改子带信号的装置103、104、105和106通过将子带信号乘以增益因子，来调整去相关后的信号和作为101的输出的未经处理的信号的水平，以便每对之和产生一个信号，该信号的去相关后的信号量由控制参数给定。应该注意，用于修改的装置103-106中使用的增益因子不限于正值。它也可为负值。
来自用于使子带信号相加的装置107和108的输出被输入到用于提供时域信号的装置109和110。来自109的输出对应于重建后的立体声信号的左声道，来自110的输出对应于重建后的立体声信号的右声道。在这里所描述的实施例中，相同的去相关器被用于两个输出声道，而用于将去相关后的信号与未经处理的信号相加的装置对于两个输出声道是不同的。从而目前描述的实施例确保了两个输出信号可以相同并且完全被去相关，这取决于提供到用于调整信号水平的装置的控制数据以及提供到用于使信号相加的装置的控制数据。
在图2中，显示了用于提供去相关后的信号的装置的框图。输入子带信号被输入到用于对子带信号滤波的装置201。在目前描述的本发明的实施例中，滤波步骤是包含了全通滤波的混响单元。所使用的滤波器系数是由用于提供滤波器系数的装置202提供的。当前被处理的子带信号的子带索引被输入到202。在本发明的一个实施例中，基于提供到202的子带索引计算不同的滤波器系数。201中的滤波步骤依赖于输入子带信号的延迟后的采样以及滤波过程中的中间信号的延迟后的采样。
本发明的必要特征是用于提供整数子带采样延迟和分数子带采样延迟的装置由203提供。201的输出被提供到用于调整子带信号的水平的装置204，并且还输入到用于估计子带信号的信号特性的装置205。在本发明的优选实施例中，被估计的特性是子带信号的瞬态行为。在此实施例中，检测的瞬态被以信号方式通知给用于调整子带信号的水平的装置204，以便在瞬态通过期间信号的水平被降低。来自204的输出是输入到图1的104和105的去相关后的信号。
在图3中，示出了单个解析滤波器组和两个合成滤波器组。解析滤波器组301在单声道输入信号上进行操作，而合成滤波器组302和303在重建后的立体声信号上进行操作。
因此，图1示出用于生成去相关信号的所发明的装置，它由标号102表示。如图1或3所示，此装置包括用于提供多个子带信号的装置，其中一个子带信号包括至少两个子带采样的序列，所述子带采样的序列代表子带信号的带宽，其小于输入信号的带宽。每个子带信号被输入到用于滤波的装置201。每个用于滤波的装置201包括混响滤波器，以便获得多个混响后的子带信号，其中多个混响后的子带信号一起表示所述去相关信号。优选地，如图2所示，可以对混响后的子带信号进行按照子带的后处理，该后处理是由受块205控制的块204所执行的。
每个混响滤波器被设置到某个延迟，优选地被设置到分数延迟，并且每个混响滤波器具有几个滤波器系数，这些滤波器系数取决于子带索引，如图2所示。此意味着最好对每个子带使用相同延迟，但对不同子带使用不同的滤波器系数集合。这由图2中的装置203和202表示，虽然这里要提到，最好在运送去相关设备时固定地确定延迟和滤波器系数，其中延迟和滤波器系数可利用收听测试等来经验地确定。
多声道解码器由图1示出，并包括用于生成相关信号的发明装置，该装置在图1中表示为102。图1中所示的多声道解码器是用于对单声道信号和相关联的声道间相干测量结果进行解码的，该声道间相干测量结果代表多个原始声道间的相干，其中单声道信号是从多个原始声道导出的。图1中的块102构成用于为单声道信号生成去相关信号的生成器。块103、104、105、106和107以及108构成混合器，该混合器用于根据第一混合模式将单声道信号与去相关信号混合以获得第一解码后输出信号，以及根据第二混合模式将单声道信号与去相关信号混合以获得第二解码后输出信号，其中混合器可操作以基于作为单声道信号的侧带信息而传输的声道间相干测量结果来确定第一混合模式和第二混合模式。
混合器优选地可操作以基于不同子带的分离的声道间相干测量结果而在子带域中混合。在这种情况下，多声道解码器还包括装置109和110，用于在时域中转换来自子带域的第一和第二解码输出信号，以获得时域中第一解码输出信号和第二解码输出信号。因此用于生成去相关信号的发明装置102和图1所示的所发明的多声道解码器在子带域中进行操作，并且执行子带域到时域转换，作为最后的步骤。
根据实际情况，所发明的设备可在硬件或硬件中或包括硬件组成部分和软件组成部分的固件中实现。当部分或全部在软件中实现时，本发明还是计算机程序，该计算机程序具有当在计算机上运行时执行所发明的方法的计算机可读代码。
权利要求
1.用于利用输入信号生成去相关信号的装置(102)，包括装置(101)，用于提供多个子带信号，其中一个子带信号包括至少两个子带采样的一个序列，所述子带采样的序列代表所述子带信号的带宽，所述带宽小于所述输入信号的带宽；以及装置(201)，用于利用混响滤波器对每个子带信号滤波以获得多个混响后的子带信号，其中多个混响后的子带信号一起表示所述去相关信号。
2.如权利要求1所述的装置，其中所述用于滤波的装置(201)可操作以向所述子带信号施加延迟。
3.如权利要求2所述的装置，其中所述用于滤波的装置(201)可操作以向子带信号施加一个分数延迟，所述分数延迟大于“0”并小于所述子带信号的采样周期。
4.如权利要求3所述的装置，其中所述分数延迟小于所述子带信号的采样周期的0.9，并大于所述子带信号的采样周期的0.1。
5.如前述权利要求之一所述的装置，其中所述用于滤波的装置(201)适合于具有全通特性。
6.如前述权利要求之一所述的装置，其中所述混响滤波器(201)可操作以向每个子带信号施加相同延迟。
7.如前述权利要求之一所述的装置，其中所述混响滤波器(201)适合于为每个子带信号具有不同的滤波器系数集合。
8.如前述权利要求之一所述的装置，其中所述混响滤波器可操作以向所述子带信号中引入预定相位延迟。
9.如前述权利要求之一所述的装置，其中子带的数目小于或等于128并大于1。
10.如前述权利要求之一所述的装置，其中所述输入信号包括一批预定数目的输入采样，并且其中子带信号的数目小于输入采样的数目。
11.如权利要求10所述的装置，其中所述子带采样的数目乘以所述子带的数目产生所述输入采样的预定数目。
12.如前述权利要求之一所述的装置，其中所述用于提供的装置(101)是复数正交镜像滤波器。
13.用于对单声道信号和相关联的声道间相干测量结果进行解码的多声道解码器，所述声道间相干测量结果代表多个原始声道间的相干，所述单声道信号是从多个原始声道导出的，所述解码器包括生成器(102)，用于根据权利要求1至12之一从所述单声道信号生成一个去相关信号；混合器(103、104、105、106、107、108)，用于根据第一混合模式将所述单声道信号与所述去相关信号混合以获得第一解码后输出信号，以及根据第二混合模式将所述单声道信号与所述去相关信号混合以获得第二解码后输出信号，其中所述混合器可操作以基于所述声道间相干测量结果而确定所述第一混合模式和所述第二混合模式。
14.如权利要求13所述的多声道解码器，其中所述混合器可操作以基于不同子带的分离的声道间相干测量结果而在子带域中混合，并且还包括装置(109，110)，用于在时域中转换来自所述子带域的所述第一和所述第二解码后输出信号，以获得时域的第一和第二解码后输出信号。
15.如权利要求13或14所述的多声道解码器，其中所述多个原始声道包括左立体声声道和右立体声声道，并且其中所述第一解码后输出信号是解码后的左立体声声道，并且其中所述第二解码后输出信号是解码后的右立体声声道。
16.如权利要求13至15之一所述的多声道解码器，其中所述混合器包括装置(103、106)，用于修改所述单声道信号的子带，或者包括装置104和105，用于修改所述去相关信号的子带。
17.如权利要求16所述的多声道解码器，其中所述用于修改的装置被实现为信号水平修改设备。
18.如权利要求16或17所述的多声道解码器，其中所述混合器包括加法器(107)，用于将所述单声道信号的未经修改的子带与所述去相关信号的修改后的子带相加，或者用于将所述单声道信号的修改后的子带与所述去相关信号的未修改的子带相加，或者用于将所述单声道信号的修改后的子带与所述去相关信号的修改后的子带相加，以获得第一解码后输出声道或第二解码后输出声道的子带。
19.多声道解码器，其中所述生成器(102)包括用于提供所述单声道信号的多个子带的滤波器组，所述滤波器组具有连接到混合器和混响滤波器(201)的子带输出以用于所述子带。
20.用于利用输入信号生成去相关信号的方法，包括提供(101)多个子带信号，其中一个子带信号包括至少两个子带采样的一个序列，所述子带采样的序列代表所述子带信号的带宽，所述带宽小于所述输入信号的带宽；并且利用混响滤波器为每个子带信号滤波(201)以获得多个混响后的子带信号，其中多个混响后的子带信号一起表示所述去相关信号。
21.用于对单声道信号和相关联的声道间相干测量结果进行解码的多声道解码方法，所述声道间相干测量结果代表多个原始声道之间的相干，所述单声道信号是从多个原始声道导出的，所述方法包括根据权利要求20的方法从所述单声道信号生成(102)去相关信号；根据第一混合模式将所述单声道信号与所述去相关信号混合(103、104、105、106、107、108)以获得第一解码后输出信号，以及根据第二混合模式将所述单声道信号与所述去相关信号混合(103、104、105、106、107、108)以获得第二解码后输出信号，其中所述混合器可操作以基于所述声道间相干测量结果而确定所述第一混合模式和所述第二混合模式。
22.用于对立体声信号编码以获得单声道输出信号和立体声参数集合的装置，包括用于通过组合所述立体声信号的左声道和右声道来计算所述单声道信号的装置；用于利用所述左声道的一部分和所述右声道的一部分来生成第一立体声参数集合的装置(403)，所述部分开始于第一时间边界处；用于确定第一立体声参数集合对所述左声道和所述右声道的后续部分的有效性的装置(401、402)，其中所述用于确定的装置可操作以便生成第二时间边界，并且在确定所述第一立体声参数集合不再有效时激活所述用于生成的装置，以便生成开始于所述第二时间边界处的、用于左信号和右信号的部分的第二立体声参数集合；以及用于输出所述单声道信号、所述第一立体声参数集合和与所述第一参数集合相关联的所述第一时间边界、以及所述第二立体声参数集合和与所述第二立体声参数集合相关联的所述第二时间边界的装置。
23.如权利要求22所述的装置，其中所述用于生成的装置可操作以计算声道间时间差异参数、声道间水平差异参数和/或声道间相干参数来作为所述立体声参数集合。
24.如权利要求22或23所述的装置，其中所述用于确定的装置包括瞬态检测器，其被配置为在检测到一个瞬态时激活所述用于生成的装置，并且生成所述瞬态的时刻作为所述第二时间边界。
25.如权利要求22至24中任何一项所述的装置，其中所述用于确定的装置是综合分析设备，其适用于对所述单声道信号和所述立体声参数集合解码，以获得解码后的左声道和解码后的右声道；将所述解码后的左声道和所述解码后的右声道与所述左声道和所述右声道相比较；并且在所述解码后的左声道和所述解码后的右声道与所述左声道和所述右声道的差异大于预定阈值时，激活所述用于生成的装置。
26.用于对立体声信号编码以获得单声道输出信号和立体声参数集合的方法，包括通过组合所述立体声信号的左声道和右声道来计算所述单声道信号；利用所述左声道的一部分和所述右声道的一部分来生成(403)第一立体声参数集合，所述部分开始于第一时间边界处；通过以下步骤确定(401、402)第一立体声参数集合对所述左声道和所述右声道的后续部分的有效性生成第二时间边界，并且在确定所述第一立体声参数集合不再有效时进行所述生成步骤，以便生成开始于所述第二时间边界处的、用于左信号和右信号的部分的第二立体声参数集合；以及输出所述单声道信号、所述第一立体声参数集合和与所述第一参数集合相关联的所述第一时间边界以及所述第二立体声参数集合和与所述第二立体声参数集合相关联的所述第二时间边界。
27.计算机程序，其具有当在计算机上运行时执行如权利要求20、21、26所述的方法的计算机可读代码。
全文摘要
用于利用输入信号生成去相关信号的合成器可在多个子带信号上进行操作，其中一个子带信号包括至少两个子带采样的序列，该子带采样的序列代表子带信号的带宽，该带宽小于输入信号的带宽。合成器包括第一级(201)，用于利用混响滤波器对每个子带信号滤波以获得多个混响后的子带信号，其中多个混响后的子带信号一起表示去相关信号。此去相关信号被用于基于参数编码后的立体声信号重建信号，该立体声信号由单声道信号和相干测量结果组成。
文档编号G10L19/008GK1781338SQ200480011462
公开日2006年5月31日申请日期2004年4月30日优先权日2003年4月30日
发明者约纳斯·恩德加德, 拉斯·维尔莫斯申请人:编码技术股份公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：约纳斯.恩德加德;拉斯.维尔莫斯
技术所有人：编码技术股份公司
我是此专利的发明人

上一篇：低速存储器判定树的制作方法
上一篇：语音对话设备、方法和机器人设备的制作方法