产生多通道输出信号的装置和方法

文档序号:2829169阅读:180来源:国知局
专利名称:产生多通道输出信号的装置和方法
技术领域
本发明涉及多通道解码,具体地,涉及多通道解码,其中存在至少两个传输通道,即多通道解码是立体声兼容的。
背景技术
近来,多通道音频再现技术正变得越来越重要。这也许是因为诸如熟知的mp3技术之类的音频压缩/编码技术可以通过因特网或其它具有有限带宽的传输信道,来分发音频记录。由于mp3编码技术可以以立体声格式,即包括第一或左立体声通道和第二或右立体声通道的音频记录的数字表达,来分发所有记录,所以mp3编码技术变得如此出名。
然而,传统的双通道音响系统具有基本的缺陷。因此,开发出环绕技术。除了两个立体声通道L和R之外,所推荐的多通道环绕表达还包括附加的中央通道C和两个环绕通道Ls、Rs。这个基准声音格式也被称为三/二立体声,表示三个前部通道和两个环绕通道。通常,需要五个传输通道。在回放环境中,需要在相应五个不同位置处的至少五个扬声器,以在离五个放置好的扩音器特定距离处获得最佳效果。
现有领域中已知多种技术,用于减少多通道音频信号的传输所需的数据量。这些技术被称为联合立体声技术。为此,参考图10,图10示出了联合立体声设备60。该设备可以是实现例如强度立体声(IS)或技术心理声学编码(BCC)的设备。这种设备通常接收至少两个通道(CH1、CH2、...CHn)作为输入,并输出单个载波通道和参数数据。定义参数数据,以便在解码器中可以计算原始通道(CH1、CH2、...CHn)的近似。
通常,载波通道包括子带采样、频谱系数、时域采样等,提供了底层信号的比较细致的表达,但是参数数据不包括这种频谱系数的采样,而是包括控制参数,以控制某种重构算法,例如通过乘法的加权、时移、频移、...。因此,参数数据仅包括信号或有关通道的比较粗略的表达。以数量为例,载波通道所需的数据量在60-70kbit/s的范围内,而一个通道的参数辅助信息所需的数据量在1.5-2.5kbit/s的范围内。参数数据的一个示例是公知的缩放因子、下面将描述的强度立体声信息或技术心理声学参数。
在AES preprint 3799,″Intensity Stereo Coding″,J.Herre,K.H.Brandenburg,D.Lederer,February 1994,Amsterdam中描述了强度立体声编码。通常,强度立体声的概念是基于要应用于立体声音频通道的数据的主轴变换的。如果大部分数据点集中在第一主轴附近,则可以通过在编码之前使两个信号转动特定角度,来实现编码增益。然而,对于实际的立体声再现技术,并不能总是这样。因此,通过使第二正交分量不在比特流中传输,来修改该技术。因此,左和右通道的重构信号包括同一传输信号的不同加权或缩放的版本。然而,重构信号的幅度不同,但是其相位信息是相同的。然而,通过选择性缩放操作,保留了两个原始音频通道的能量-时间包络,其中选择性缩放操作通常以频率选择性方式操作。这符合人类对高频声音的感知,在高频,由能量包络确定主要的空间方位信息。
此外,实际上,从左通道和右通道的和信号中,而不是转动两个分量,来产生传输的信号,即载波通道。此外,频率选择性地来执行该处理,即,与每个缩放因子的波段(即编码器的频率分割)无关地,产生用于执行缩放操作的强度立体声参数。优选地,组合两个通道,以形成组合的或“载波”通道,并且除了组合的通道之外,基于第一通道的能量、第二通道的能量或者组合通道的能量,来确定强度立体声信息。
在AES convention paper 5574,″Binaural cue coding applied tostereo and multi-channel audio compression″,C.Faller,F.Baumgarte,May 2002,Munich中描述了BCC技术。在BCC编码中,使用具有重叠窗的基于DFT的变换,将多个音频输入通道转换为频谱表达。将产生的均匀频谱划分为每个均具有索引的非重叠分割。每个分割具有与等价矩形带宽(ERB)成比例的带宽。在每帧k内,针对每个分割,估计通道间幅度差(ICLD)和通道间时间差(ICTD)。量化和编码ICLD和ICTD,产生BCC比特流。相对于基准通道,对于每个通道,给定通道间幅度差和通道间时间差。然后,根据指定的公式,计算参数,所述公式取决于要处理的信号的某些分割。
在解码器一侧,解码器接收单声道信号和BCC比特流。将单声道信号变换为频域,并输入到空间合成块,空间合成块还接收解码的ICLD和ICTD值。在空间合成块中,使用BCC参数(ICLD和ICTD)值来执行单声道信号的加权操作,以便合成多通道信号,在频率/时间转换之后,所述多通道信号表示原始多通道音频信号的重构。
在BCC的情况下,联合立体声模块60操作用于输出通道辅助信息,使得参数通道数据是量化且编码的ICLD或ICTD参数,其中,原始通道之一用作编码通道辅助信息的基准通道。
通常,载波通道由参与的原始通道之和形成。
当然,上述技术仅给解码器提供了单声道表达,解码器只能处理载波通道,而不能够处理参数数据,以产生多于一个输入通道的一个或多个近似。
在美国专利申请公开US2003,0219130 A1、2003/0026441 A1和2003/0035553 A1中详细描述了公知为技术心理声学编码(BCC)的音频编码技术。还可以参考“Binaural Cue Coding.Part IISchemes andApplications”,C.Faller and F.Baumgarte,IEEE Trans.On Audio andSpeech Proc.,Vol.11,No.6,Nov.1993。将所引用美国专利申请公开和作者为Faller和Baumgarte的有关BCC技术的两个所引用技术公开的全部内容合并在此以作参考。
下面,参考图11至13,来详细描述用于多通道音频编码的典型通用的BCC方案。图11示出了用于多通道音频信号的编码/传输的这样一种通用技术心理声学编码方案。在下混块114中将BCC编码器112的输入110处的多通道音频输入信号下混。在本示例中,输入110处的原始多通道信号是5通道的环绕信号,具有左前通道、右前通道、左环绕通道、右环绕通道和中央通道。例如,下混块114通过将这五个通道简单相加为单声道信号,来产生和信号。在使用多通道输入信号的技术中已知其它的下混方案,可以获得具有单个通道的下混信号。该单个通道在和信号线路115处输出。由BCC分析块116获得的辅助信息在辅助信息线路117处输出。在BCC分析块中,如上所述来计算通道间幅度差(ICLD)和通道间时间差(ICTD)。近来,BCC分析块116已经增强为还能够计算通道间相关性值(ICC值)。优选地以量化和编码形式,将和信号以及辅助信息发送到BCC解码器120。BCC解码器将发送的和信号分解为多个子带,并应用缩放、延迟和其它处理,以产生输出多通道音频信号的子带。执行该处理,使得输出121处重构多通道信号的ICLD、ICTD和ICC参数(方位信息)与在输入110处进入BCC编码器112的原始多通道信号的相应方位信息类似。为此,BCC解码器120包括BCC合成块122和辅助信息处理块123。
下面,参考图12来解释BCC合成块122的内部组成。线路115上的和信号输入时间/频率转换单元或滤波器组FB 125。在块125的输出处,存在N个子带信号,在极限情况下,当音频滤波器组125执行1∶1变换,即从N个时域采样中产生N个频谱系数的变换时,存在频谱系数块。
BCC合成块122还包括延迟级126、幅度修改级127、相关性处理级128以及逆滤波器组级IFB 129。在级129的输出处,可以将在5通道环绕系统的情况下具有5个通道的重构多通道音频信号输出到如图11所示的一组扩音器124。
如图12所示,通过元件125,将输入信号s(n)转换为频域或滤波器组域。使元件125输出的信号倍增,使得如乘法节点130所示,获得同一信号的多个版本。原始信号的版本数目与要重构的输出信号中输出通道的数目相等。通常,节点130处的原始信号的每个版本经过特定延迟d1、d2、...、di、...、dN。由图11中的辅助信息处理块123计算延迟参数,并且从BCC分析块116所确定的通道间时间差中推导出。
对于乘法参数a1、a2、...、ai、...、aN同样如此。由辅助信息处理块123根据BCC分析块116所计算出的通道间幅度差,来计算a1、a2、...、ai、...、aN。
BCC分析块116所计算的ICC参数用于控制块128的功能,使得在块128的输出处获得经过延迟和幅度处理的信号之间的某种相关性。这里要注意,级126、127、128之间的顺序可以与图12所示的不同。
这里要注意,在音频信号的帧方式处理中,以帧方式执行BCC分析,即时间变化地、且以频率方式,来执行BCC分析。这意味着,对于每个频谱波段,获得BCC参数。这意味着,在音频滤波器组125将输入信号分解为例如32带通信号的情况下,BCC分析块获得例如32波段的一组BCC参数。当然,在图12中详细示出的图11的BCC分析块122执行重构,在示例中,该重构同样基于32波段。
下面,参考图13,图13示出了确定某些BCC参数的设置。通常,可以在通道对之间定义ICLD、ICTD和ICC参数。然而,优选地,在基准通道和每个其它通道之间确定ICLD和ICTD参数。这在图13A中示出了。
可以以不同方式定义ICC参数。最一般地,可以在编码器中估计如图13B所示的所有可能的通道对之间的ICC参数。在这种情况下,解码器可以合成ICC,使得ICC与所有可能通道对之间的原始多通道信号近似相同。然而,建议每一次仅估计最强的两个通道之间的 ICC参数。图13C示出了该方案的一个示例,其中,一次估计了通道1和2之间的ICC参数,而另一次,计算了通道1和5之间的ICC参数。解码器则合成解码器中最强通道之间的通道间相关性,并应用一些启发式规则来计算和合成剩下的通道对的通道间相干性。
例如,关于基于传输的ICLD参数的乘法参数a1、aN的计算,参考上述AES会议文章5574。ICLD参数表示原始多通道信号中的能量分布。不失一般性,图13A示出了表示所有其它通道与左前通道之间的能量差的四个ICLD参数。在辅助信息处理块123中,从ICLD参数中推导出乘法参数a1、...、aN,使得所有重构的输出通道总能量与传输的和信号的能量相同(或成比例)。确定这些参数的一种简单方式是2阶段过程,其中,在第一阶段,将左前通道的乘法因子设置为1(unity),而图13A中其它通道的乘法因子设置为传输的ICLD值。然后,在第二阶段,计算所有五个通道的能量,并将其与传输的和信号的能量相比较。然后,使用对于所有通道都相等的缩减因子,将所有通道缩减,其中,选择缩减因子,使得在缩减之后所有的重构输出通道的总能量与传输的和信号的总能量相等。
当然,存在其它计算乘法因子的方法,这些方法并不依赖于2阶段过程,而可以只需要1阶段过程。
关于延迟参数,要注意,当左前通道的延迟参数d1被设置为零时,可以直接使用BCC编码器发送的延迟参数ICTD。由于延迟并不改变信号的能量,所以这里不必进行缩放。
关于BCC编码器发送到BCC解码器的通道间相干性度量ICC,要注意,可以通过修改乘法因子a1、...、aN,例如将所有子带的加权因子与范围[20log10(-6)和20log10(6)]的随机数相乘,来进行相干性操作。优选地,选择伪随机序列,使得对于所有的临界波段,方差近似恒定,并且在每个临界波段内平均为零。将相同序列应用于每个不同帧的光谱系数。因此,通过修改伪随机序列的方差,来控制听觉图像宽度。较大的方差产生较大的图像宽度。可以在宽度为临界波段的各个波段内执行方差修改。这使得在听觉场景中同时存在多个对象,每个对象具有不同的图像宽度。伪随机序列的适当幅度分布是在对数标度上的均匀分布,如美国专利申请2003-0219130 A1中所述的。然而,所有的BCC合成处理涉及单个输入通道,如图11所示的BCC编码器发送到BCC解码器的和信号。
为了以兼容的方式,即以比特流格式(对于标准的立体声解码器而言也是可以理解的),来传输五个通道,使用在″MUSICAM surrounda universal multi-channel coding system compatible with ISO 11172-3″,G.Theile and G.Stoll,AES preprint 3403,October 1992,San Francisco中描述的所谓矩阵化法。将五个输入通道L、R、C、Ls和Rs馈入执行矩阵化操作的矩阵化设备,来根据五个输入通道计算基本或兼容的立体声通道Lo、Ro。具体地,如下来计算这些基本立体声通道Lo/RoLo=L+xC+yLsRo=R+xC+yRsx和y是常数。其它三个通道C、Ls、Rs就像它们在扩展层中一样传输,除了基本立体声层,扩展层还包括基本立体声信号Lo/Ro的编码版本。关于比特流,该Lo/Ro基本立体声层包括诸如缩放因子和子带采样之类的报头信息。多通道扩展层,即中央通道和两个环绕通道,包括在多通道扩展字段中,多通道扩展字段也被称为辅助数据字段。
在解码器一侧,执行逆矩阵化操作,以便使用基本立体声通道Lo、Ro和三个附加通道来形成五通道表达中的左和右通道的重构。此外,根据辅助信息来解码三个附加通道,以获得原始多通道音频信号的解码五通道或环绕表达。
在公开″Improved MPEG-2 audio multi-channel encoding″,B.Grill,J.Herre,K.H.Brandenburg,E.Eberlein,J.Koller,J.Mueller,AESpreprint 3865,February 1994,Amsterdam中描述了多通道编码的另一方法,其中,为了获得后向兼容,考虑后向兼容模式。为此,使用兼容矩阵,从原始五个输入通道中获得两个所谓的下混通道Lc、Rc。此外,可以动态地选择作为辅助数据传输的三个辅助通道。
为了采用立体声不相干性,将联合立体声技术应用于通道组,例如左通道、右通道和中央通道的三个前面通道。为此,组合这三个通道以获得组合的通道。将该组合通道量化并封装到比特流中。然后,将该组合通道与相应的联合立体声信息一起输入到联合立体声解码模块,以获得联合立体声解码通道,即联合立体声解码左通道、联合立体声解码右通道和联合立体声解码中央通道。这些联合立体声解码通道与左环绕通道和右环绕通道一起输入到兼容矩阵块,以形成第一和第二下混通道Lc、Rc。然后,将两个下混通道的量化版本和组合通道的量化版本与联合立体声编码参数一起封装到比特流中。
因此,使用强度立体声编码,在“载波”数据的单个部分中传输一组独立原始通道信号。解码器然后根据所包括信号的原始能量-时间包络再次缩放,将其重构为相等数据。因此,传输的通道的线性组合将导致与原始下混截然不同的结果。这发生在基于强度立体声概念的任何一种联合立体声编码中。对于提供可兼容下混通道的编码系统,存在直接结果如上述公开所示通过解矩阵进行的重构具有由不完善的重构引起的伪像(artifact)。使用所谓的联合立体声预失真方案,其中在编码器中的矩阵化之前执行左、右和中央通道的联合立体声编码,以消除该问题。按照这种方式,由于在编码器一侧,联合立体声信号用于产生下混通道,所以重构的解矩阵方案引入了很少的伪像。因此,将不完善的重构过程移到了兼容下混通道Lc和Rc,在此,很可能由音频信号本身掩盖不完善的重构过程。
尽管这种系统由于解码器一侧的解矩阵而产生了很少的伪像,然而,它具有一些缺陷。一个缺陷在于,不是从原始通道,而是从原始通道的强度立体声编码/解码版本中,推导出立体声兼容的下混通道Lc和Rc。因此,在兼容下混通道中包括由于强度立体声编码系统而引起的数据丢失。因此,仅对兼容通道而不对增强强度立体声编码通道进行解码的唯立体声(stereo-only)解码器提供受到包括数据丢失的强度立体声所影响的输出信号。
此外,除了两个下混通道之外,还必须传输完整的附加通道。该通道是组合通道,组合通道是由左通道、右通道和中央通道的联合立体声编码形成的。此外,必须将用于根据组合通道来重构原始通道L、R、C的强度立体声信息发送到解码器。在解码器处,执行逆矩阵化,即解矩阵操作,以从两个下混通道中推导出环绕通道。此外,使用传输的组合通道和传输的联合立体声参数,通过联合立体声解码,来近似原始的左、右和中央通道。注意,通过组合通道的联合立体声解码,推导出原始的左、右和中央通道。
图11所示的BCC方案的改进是具有至少两个音频传输通道的BCC方案,从而可以实现立体声兼容处理。在编码器中,将C输入通道下混到E传输音频通道。估计特定输入通道对之间的ICTD、ICLD和ICC方位信息,作为频率和时间的函数。将估计的方位信息作为辅助信息发送到解码器。具有C输入通道和E传输通道的BCC方案表示为C-2-E BCC。
一般而言,BCC处理是传输的通道的频率选择性的时变后处理。下面,根据隐式理解,将不引入频率波段索引。而是,假设如xn、sn、yn、an等的变量是维度(1,f)的矢量,其中f表示频率波段的编号。
在C.Faller and F.Baumgarte,″Binaural Cue Coding applied tostereo and multi-channel audio compression,″in Preprint 112thConv.Aud.Engl.Soc.,May 2002、F.Baumgarte and C.Faller,″Binaural Cue Coding-Part IPsychoacoustic fundamentals and design principles,″IEEE Trans.On Speech and Audio Proc.,vol.11,no.6,Nov.2003以及C.Faller and F.Baumgarte,″Binaural Cue Coding-Part II;Schemes and applications,″IEEE Trans.On Speech and Audio Proc.,vol.11,no.6,Nov.2003中描述了所谓的常规BCC方案。这里,将图11所示的单个传输的音频通道作为用于立体声或多通道音频回放的已有单声道系统的后向兼容扩展。由于传输的单个音频通道是有效的单声道信号,所以它适用于由传统的接收机来回放。
然而,多数安装的音频广播基础设施(模拟和数字收音机、电视等)和音频存储系统(塑料盘、压缩磁带、压缩盘、VHS视频、MP3声音存储器等)是基于双通道立体声的。另一方面,符合5.1标准(Rec.ITU-R BS.775,Multi-Channel Stereophonic Sound System with orwithout Accompanying Picture,ITU,1993,http://www.itu.org)的“家庭影院系统”越来越普及。因此,如在J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatiblecoding of multi-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004中描述,具有两个传输通道的BCC尤其专注于扩展现有多通道环绕的立体声系统。在这点上,参考2004年1月20日递交的美国序列号10/762,100的美国专利申请″Apparatus and method for constructing amulti-channel output signal or for generating a downmix signal″。
在模拟域中,例如“Dolby Surround”、“Dolby Pro Logic”和“DolbyPro Logic II”(J.Hull,″Surround sound past,present,and future,″Techn.Rep.,Dolby Laboratories,1999,www.dolby.com/tech/;R.Dressler,″Dolby Surround Prologic II Decoder-Principles of operation,″TechnRep.,Dolby Laboratories,2000,www.dolby.com/tech/)的矩阵化算法已经普及多年。这种算法应用“矩阵化”,以将5.1音频通道映射到立体声兼容通道对。然而,与在J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatible coding ofmulti-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004中所述的离散音频通道相比,矩阵化算法仅提供明显减少的灵活性和质量。如果在混合5.1环绕的音频信号的情况下考虑了矩阵化算法的限制,则如J.Hilson,″Mixing with Dolby Pro Logic II Technology,″Tech.Rep.,Dolby Laboratories,2004,www.dolby.com/tech/PLII.Mixing.JimHilson.html中所述,可以减少一些这种不完善的效果。
C-to-2 BCC可以看作具有与具有附加辅助信息的矩阵化算法类似功能的方案。然而,更一般化地,它支持从任意数目的原始通道映射到任意数目的传输通道。C-to-E BCC是针对数字域的,并且其低比特率附加辅助信息通常可以以后向兼容的方式包括在已有数据传输中。这意味着,传统接收机将忽略附加的辅助信息,并直接回放2个传输通道,如在J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatible coding ofmulti-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004中所述。长远目标是实现与所有原始音频通道的离散传输类似的音频质量,即明显比传统矩阵化算法要好的质量。
下面,参考图6a,以说明传统编码器下混操作,根据五个输入通道,即左通道L或x1、右通道R或x2、中央通道C或x3、左环绕通道sL或x4以及右环绕通道sR或x5,来产生两个传输通道。图6a示意地示出了下混情况。显而易见的有,使用左通道x1、中央通道x3和左环绕通道x4形成第一传输通道y1。此外,从图6a可见,使用右通道x2、中央通道x3和右环绕通道x5形成右传输通道y2。
图6c示出了通常优选的下混规则或下混矩阵。显而易见的有,中央通道x3由加权因子1/加权,这意味着中央通道x3的能量的第一一半进入左传输通道或第一传输通道Lt,而中央通道的能量的第二一半引入第二传输通道或右传输通道Rt。因此,下混将输入通道映射到传输通道。下混通常由(m,n)矩阵描述,用于将n个输入样本映射到m个输出样本。该矩阵的项是在求和以形成相关输出通道之前应用于相应通道的权重。
存在不同的下混方法,这些下混方法可以在ITU推荐(Rec.ITU-RBS.775,Multi-Channel Stereophonic Sound System with or withoutAccompanying Picture,ITU,1993,http://www.itu.org)中找到。此外,关于不同的下混方法,参考J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatiblecoding of multi-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004,Section 4.2。可以在时域或频域执行下混。它可以是以信号自适应方式时变的,或频率(波段)相关的。图6a的右边矩阵示出了通道分配,并给出如下 因此,对于5-to-2 BCC的重要情况,根据右、右后和中央,计算出一个传输通道,并根据左、左后和中央计算出另一个传输通道,与图6c中所示的下面的下混矩阵相对应。
D52=101210011201]]>在该下混矩阵中,可以选择加权因子,使得每列中值的平方和是1,每个输入信号的功率均匀地分布在下混的信号中。当然,也可以使用其它的下混方案。
具体地,参考图6b或7b,图6b或7b示出了编码器下混方案的具体实施方式
。示出了一个子带的处理。在每个子带中,控制缩放因子e1和e2,以使下混信号中的信号分量的响度“相等”。在这种情况下,在频域执行下混,变量n(图7b)表示频域子带时间索引,k是变换的时域信号块的索引。具体地,注意,加权设备对中央通道进行加权,然后中央通道的加权版本由各个求和设备引入左传输通道和右传输通道。
参考图7a、7b和7c,示出解码器中相应的上混操作。在解码器中,必须计算上混,将传输通道映射到输出通道。上混由(i,j)矩阵(i行,j列)描述,用于将i个传输样本映射到j个输出样本。再次,该矩阵的项是在求和以形成相关输出通道之前应用于相应通道的权重。可以在时域或频域执行上混。此外,上混可以是以信号自适应方式时变的,或者频率(波段)相关的。与下混矩阵相反,因为在BCC处理中要进一步修改这些上混的通道,所以矩阵项的绝对值并不表示输出通道的最终权重。具体地,使用如ICLD等的空间方位信息所提供的信息,来进行修改。在本示例中,所有的项设置为0或1。
图7a示出了5扬声器环绕系统的上混情况。除了每个扬声器之外,还示出了用于BCC合成的基本通道。具体地,关于左环绕输出通道,使用第一传输通道y1。对于左通道一样。该通道用作基本通道,也称为“左传输通道”。
关于右输出通道和右环绕输出通道,还使用相同的通道,即第二或右传输通道y2。关于中央通道,要注意,根据图7c所示的上混矩阵,即通过对两个传输通道求和,来形成用于BCC中央通道合成的基本通道。
图7b示出了给出两个传输通道、产生5通道输出信号的过程。这里,在频域进行上混,其中变量n表示频域子带时间索引,k是转换的时域信号块的索引。这里要注意,在使用相同基本通道的通道对之间,即分别在左和左后之间、以及在右和右后之间,应用ICTD和ICC合成。图7b中A表示的两个块包括用于2通道ICC合成的方案。
在编码器处估计的、用于计算解码器输出信号合成的所有参数所需的辅助信息包括下面的方位信息ΔL12、ΔL13、ΔL14、ΔL15、τ14、τ25、c14和c25(ΔLij是通道i和j之间的幅度差,τij是通道i和j之间的时间差,cij是通道i和j之间的相关性系数)。这里要注意,也可以使用其它幅度差。存在在解码器处有足够信息(即缩放因子、延迟等)可用于计算BCC合成的要求。
下面,参考图7d,来进一步示出每个通道的幅度修改(即ai的计算)和随后的整体归一化(图7b中未示出)。优选地,通道间幅度差ΔLi作为辅助信息发送,即作为ICLD来发送。对于通道信号,必须使用基准通道Fref和要计算的通道(即Fi)之间的指数关系。这在图7d的顶部示出了。
图7b中未示出的是随后的或最后的整体归一化,可以在相关块A之前或在相关块A之后进行该归一化。当相关块影响由ai加权的通道的能量时,整体归一化应该在相关块A之后进行。为了确保所有输出通道的能量与所有的传输通道的能量相等,如图7d所示地对基准通道进行缩放。优选地,基准通道是平方传输通道之和的根。
下面,描述与这些下混/上混方案相关联的问题。当考虑图6和图7所示的5-to-2 BCC方案时,下面的问题将变得显而易见。
原始中央通道被引入两个传输通道,因此,还被引入重构的左和右输出通道。
此外,在该方案中,共同的中央组成在两个重构的输出通道中具有相同的幅度。
此外,在解码期间,原始中央信号由从传输的左和右通道中推导出的中央信号替代,因此不能与重构的左和右通道独立(即非相关)。
这个效果对所感知的以所有音频通道之间的高度非相关性(即,低相关性)为特征的非常宽的声音图像的信号的声音质量有不利的影响。这种信号的示例是当使用具有足够宽的间距以产生原始多通道信号的不同麦克风时欢呼听众的声音。对于这种信号,解码声音的声音图像变窄,并且其自然宽度减小。

发明内容
本发明的目的是提供一种高质量多通道重构概念,该概念产生具有改进声音感知的多通道输出信号。
根据本发明的第一方面,该目的是由一种使用E个传输通道,并使用与输入通道相关的参数辅助信息,产生具有K个输出通道的多通道输出信号的装置来实现的,该多通道输出信号与具有C个输入通道的多通道输入信号相对应,所述E个传输通道表示以C个输入通道作为输入的下混操作的结果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一传输通道和第二传输通道中引入了第一输入通道,还在第一传输通道中引入了第二输入通道,所述装置包括抵消通道计算器,用于使用与包括在第一传输通道、第二传输通道中的第一输入通道相关的信息或参数辅助信息,来计算抵消通道;合并器,用于将抵消通道和第一传输通道或其处理版本合并,以获得第二基本通道,与第一输入通道对第一传输通道的影响相比,第二基本通道中第一输入通道的影响减小;以及通道重构器,用于使用第二基本通道和与第二输入通道相关的参数辅助信息,来重构与第二输入通道相对应的第二输出通道,并使用不同于第二基本通道的第一基本通道和与第一输入通道相关的参数辅助信息,来重构与第一输入通道相对应的第一输出通道,第一基本通道与第二基本通道的不同之处在于与第二基本通道相比,第一通道的影响更高。
根据本发明的第二方面,该目的是由一种使用E个传输通道,并使用与输入通道相关的参数辅助信息,产生具有K个输出通道的多通道输出信号的方法来实现的,该多通道输出信号与具有C个输入通道的多通道输入信号相对应,所述E个传输通道表示以C个输入通道作为输入的下混操作的结果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一传输通道和第二传输通道中引入了第一输入通道,还在第一传输通道中引入了第二输入通道,所述方法包括使用与包括在第一传输通道、第二传输通道中的第一输入通道相关的信息或参数辅助信息,来计算抵消通道;将抵消通道和第一传输通道或其处理版本合并,以获得第二基本通道,与第一输入通道对第一传输通道的影响相比,第二基本通道中第一输入通道的影响减小;以及使用第二基本通道和与第二输入通道相关的参数辅助信息,来重构与第二输入通道相对应的第二输出通道,并使用不同于第二基本通道的第一基本通道和与第一输入通道相关的参数辅助信息,来重构与第一输入通道相对应的第一输出通道,第一基本通道与第二基本通道的不同之处在于与第二基本通道相比,第一通道的影响更高。
根据本发明的第三方面,该目的是由具有程序代码的计算机程序来实现的,当在计算机上运行所述程序时,所述程序代码执行产生多通道输出信号的方法。
这里要注意,优选地,K与C相等。然而,还可以重构更少的输出通道,例如三个输出通道L、R、C,而不重构Ls和Rs。在这种情况下,K(=3)个输出通道与原始C(=5)个中的三个输入通道L、R、C相对应。
本发明是基于以下发现的为了改进多通道输出信号的声音质量,通过合并传输通道和在接收机或解码器一端计算的抵消通道,来计算某个基本通道。计算抵消通道,使得通过合并抵消通道和传输通道而获得的修改基本通道所具有的中央通道的影响减小,所述中央通道即引入两个传输通道的通道。换句话说,与不计算这种抵消通道并且不将抵消通道合并到传输通道的情况相比,中央通道的影响减小,即引入两个传输通道的通道(在执行下混和随后的上混操作时不可避免地发生)的影响减小。
与现有技术相反,例如,并不将左传输通道简单地用作用于重构左或左环绕通道的基本通道。与之相反,通过与抵消通道合并,来修改左传输通道,使得在用于重构左或右输出通道的基本通道中原始中央通道的影响减小,甚至完全抵消。
本发明中,在解码器处,使用已经在解码器或多通道输出发生器处出现的与原始中央通道有关的信息,来计算抵消通道。与中央通道有关的信息包括在左传输通道、右传输通道和参数辅助信息中,例如包括在中央通道的幅度差、时间差或相关性参数中。取决于某些实施例,可以将所有这些信息用于获得高质量的中央通道抵消。然而,在其它更低级的实施例中,仅使用与中央输入通道有关的这些信息中的一部分。该信息可以是左传输通道、右传输通道或参数辅助信息。此外,还可以使用在编码器中估计并发送到解码器的信息。
因此,在5-to-2情况下,不直接将左传输通道或右传输通道用于左和右重构,而是通过与抵消通道合并来修改,以获得修改的基本通道,修改的基本通道不同于相应的传输通道。优选地,还将取决于在编码器处执行以产生传输通道的下混操作的附加加权因子包括在抵消通道计算机中。在5-to-2情况下,计算至少两个抵消通道,从而每个传输通道可以与指定的抵消通道合并,以分别获得用于重构左和左环绕输出通道以及右和右环绕输出通道的修改的基本通道。
本发明可以并入多个系统或应用程序,所述系统包括例如数字视频播放器、数字音频播放器、计算机、卫星接收机、电缆接收机、地面广播接收机和家庭娱乐系统。


下面,通过参考附图来描述本发明的优选实施例,附图中图1是产生传输通道和与输入通道有关的参数辅助信息的多通道编码器的方框图;图2是根据本发明的用于产生多通道输出信号的优选装置的示意方框图;图3是根据本发明第一实施例的本发明装置的示意图;图4是图3的优选实施例的电路实现;图5a是根据本发明第二实施例的本发明装置的方框图;图5b是图5a所示的动态上混的数学表达;图6a是用于示出下混操作的总图;图6b是用于实现图6a的下混操作的电路图;图6c是下混操作的数学表达;图7a是在立体声兼容情况下用于指示用于上混的基本通道的示意图;图7b是在立体声兼容情况下用于实现多通道重构的电路图;图7c是在图7b中使用的上混矩阵的数学表达;图7d是每个通道的幅度修改以及随后的整体归一化的数学表达;图8示出了编码器;图9示出了解码器;图10示出了现有技术的联合立体声编码器;图11是现有技术的BCC编码器/解码器系统的方框图表示;图12是图11的BCC合成块的现有技术的实现的方框图;以及图13是用于确定ICLD、ICTD和ICC参数的公知方案的表示。
具体实施例方式
在给出优选实施例的详细描述之前,总括地描述本发明的问题和解决该问题的解决方案。用于改进重构输出通道的听觉空间图像的本发明技术适用于在C-to-E参数多通道系统中将输入通道混入多于一个传输通道的所有情况。优选实施例是在技术心理声学编码(BCC)系统中的本发明的实现。为了简化讨论,但是不丧失一般性,针对以后向兼容方式来编码/解码5.1环绕信号的BCC方案的特定情况,来描述本发明的技术。
上述听觉图像宽度减小的问题多数发生在包含来自不同方向的独立快速重复瞬变的音频信号中,例如在任意一种现场录音中的听众的欢呼信号。尽管原理上可以通过使用ICLD合成的更高时间分辨率来解决图像宽度减小的问题,但是这会导致增加的辅助信息速率,并且还需要改变所使用的分析/合成滤波器组的窗的大小。这里要注意,由于时间分辨率的增加自动地意味着频率分辨率的减小,这还可能导致对音调分量的负面影响。
然而,本发明是一种简单的概念,没有这些缺点,并且目的在于减小辅助通道中中央通道信号分量的影响。
如结合图7a-7d所讨论的,5-to-2 BCC的五个重构输出通道的基本通道是S1~(k)=y1~(k)=x1~(k)+x3~(k)/2+x4~(k)]]>s2~(k)=y2~(k)=x2~(k)+x3~(k)/2+x5~(k)]]>s3~(k)=y1~(k)+y2~(k)=x1~(k)+x2~(k)+2x3~(k)+x4~(k)+x5~(k)]]>s4~(k)=s1~(k)]]>s5~(k)=s2~(k)]]>注意,原始中央通道信号分量x3在中央基本通道子带s3(因子1/)中表现出3dB的放大,并且在剩下(辅助通道)基本通道子带中表现出3dB的衰减。
根据本发明,为了进一步减小辅助基本通道子带中中央通道信号分量的影响,如图2所示,应用下面的一般概念。
优选地,通过将最终解码的中央通道信号缩放为由相应幅度信息(例如BCC情况下的ICLD值)描述的希望目标幅度,来计算最终解码的中央通道信号的估计。优选地,在谱域计算该解码中央信号,以便节省计算,即不应用合成滤波器组的处理。
此外,可以加权与抵消通道相对应的该中央解码信号或中央重构信号,然后合并到其它输出通道的两个基本通道信号中。优选地,该合并是减法。然而,当加权因子具有不同的符号时,加法也会导致在用于重构左或右输出通道的基本通道中中央通道的影响的减小。该处理会形成用于重构左和左环绕或者用于重构右或右环绕的修改的基本通道。优选地,-3dB的加权因子是优选的,但是任意其它的值也是可以的。
代替在图7b中使用的原始传输基本通道信号,将修改的基本通道信号用于计算其它输出通道(即除了中央通道之外的通道)的解码输出通道。
下面,参考图2来讨论本发明概念的方框图。图2示出了用于产生具有K个输出通道的多通道输出信号的装置,该多通道输出信号与具有C个输入通道的多通道输入信号相对应,使用E个传输通道(所述E个传输通道表示以C个输入通道作为输入的下混操作的结果),并使用与输入通道相关的参数辅助信息,其中C≥2,C>E,并且C≥K>1。并且,下混操作有效地在第一传输通道和第二传输通道中引入了第一输入通道。本发明的装置包括抵消通道计算器20,用于计算输入合并器22的至少一个抵消通道21,合并器22在第二输入23处直接接收第一传输通道或接收第一传输通道的处理版本。通过处理器24来执行对第一传输通道的处理以获得第一传输通道的处理版本,在一些实施例中,处理器24可以出现,但是通常情况下,处理器24是可选的。合并器操作用于获得输入通道重构器26的第二基本通道25。
通道重构器使用第二基本通道25和在另一输入27处输入通道重构器26的与原始左输入通道有关的参数辅助信息,来产生第二输出通道。在通道重构器的输出处,获得第二输出通道28,第二输出通道28可能是重构的左输出通道,而在图7b的场景中,左输出通道是由基本通道产生的,与图7b的情况相比,原始输入中央通道的影响较小或完全抵消。
尽管如图7b所示所产生的左输出通道包括如上所述的特定影响,在如图2所示所产生的第二基本通道中,由于抵消通道和第一传输通道或处理的第一传输通道的合并,这种特定的影响减小了。
如图2所示,抵消通道计算机20使用解码器处可用的与原始中央通道有关的信息,即用于产生多通道输出信号的信息,来计算抵消通道。该信息包括与第一输入通道30有关的参数辅助信息,或者包括第一传输通道31(由于下混操作还包括与中央通道有关的一些信息),或者包括第二传输通道32(由于下混操作还包括与中央通道有关的信息)。优选地,将所有这些信息用于中央通道的最佳重构以获得抵消通道21。
下面将参考图3和4来描述这种最佳实施例。与图2相反,图3示出了图2的2折(2-fold)设备,即用于抵消左基本通道s1中以及右基本通道s2中中央通道的影响的设备。图2的抵消通道计算器20包括中央通道重构设备20a和加权设备20b,以在加权设备的输出处获得抵消通道21。图2中的合并器22是简单的减法器,操作用于从第一传输通道21中减去抵消通道21以获得用于重构第二输出通道(例如左输出通道)以及可选的左环绕输出通道的第二基本通道25(就图2而言)。可以在中央通道重构设备20a的输出处获得重构的中央通道x3(k)。
图4示出了实现为电路图的优选实施例,其使用参考图3所讨论的技术。此外,图4示出了最适用于并入直接频率选择性BCC重构设备的频率选择性处理。
通过在求和器40中对两个传输通道求和,来进行中央通道重构26。然后,将通道幅度差的参数辅助信息或者如在图7d中所讨论的从通道间幅度差推导出的因子a3用于产生在图2中在第一基本通道输入29处输入通道重构器26的第一基本通道的修改版本(就图2而言)。可以将在乘法器41的输出处的重构中央通道用于中央通道输出重构(在图7d中描述的通用归一化之后)。
为了确认在用于左和右重构的基本通道中中央通道的影响,应用在图4中由乘法器42示出的加权因子1/。然后,将重构且再次加权的中央通道反馈到与图2中合并器22相对应的求和器43a和43b。
因此,第二基本通道s1或s4(或者s2或s3)与传输通道y1的不同在于与图7b中的情况相比,中央通道的影响减小了。
产生的基本通道子带以数学表达给出如下
s1~(k)=y1~(k)-a3(k)(y~1(k)+y2~(k))/2]]>s2~(k)=y2~(k)-a3(k)(y1~(k)+y2~(k))/2]]>s3~(k)=y1~(k)+y2~(k)]]>s4~(k)=s1~(k)]]>s5~(k)=s2~(k)]]>因此,图4的设备提供了从辅助通道的基本通道减去中央通道子带估计以便提高通道之间的独立性,从而提供重构的输出多通道信号的更好的空间宽度。
根据下面将参考图5a和图5b描述的本发明另一实施例,确定与在图3中计算的抵消通道不同的抵消通道。与图3/图4实施例相反,用于计算第二基本通道s1(k)的抵消通道21不是从第一传输通道以及第二传输通道中推导出的,而是使用在图5a中由乘法设备51示出的特定加权因子x_lr,仅从第二传输通道y2(k)中推导出的。因此,图5a中的抵消通道21与图3中的抵消通道不同,但是也有助于减小中央通道对用于重构第二输出通道(即左输出通道x1(k))的基本通道s1(k)的影响。
在图5a的实施例中,还示出了处理器24的优选实施例。具体地,处理器24实现为另一乘法设备52,其通过乘法因子(1-x_lr)来应用乘法。优选地,如图1a所示,处理器24应用于第一传输通道的乘法因子取决于乘法因子51,乘法因子51用于与第二传输通道相乘以获得抵消通道21。最后,将合并器22的输入23处的第一传输通道的处理版本用于合并,所述合并包括从第一传输通道的处理版本中减去抵消通道21。所有这些再次产生第二基本通道25,该第二基本通道25具有原始中央输入通道的减小的或完全抵消的影响。
如图5a所示,重复相同的过程,以在右/右环绕重构设备的输入处获得第三基本通道s2(k)。然而,如图5a所示,通过将第二传输通道y(k)的处理版本与另一抵消通道53合并而获得第三基本通道s2(k),所述另一抵消通道53是通过在具有乘法因子x_r1的乘法设备54中的乘法、从第一传输通道y1(k)中推导出的,x_r1可以与设备51的x_lr相等,但是也可以与之不同。如图5a所示处理第二传输通道的处理器是乘法设备55。在图5a中,由参考数字56表示用于将第二抵消通道53和第二传输通道y2(k)的处理版本合并的合并器。图2的抵消通道计算器还包括用于计算抵消系数的设备,在图5a中由参考数字57表示该设备。设备57操作用于获得如通道间幅度差等的与原始或输入中央通道有关的参数辅助信息。图3中的设备20a也是一样的,但是中央通道重构设备20a还包括用于接收如幅度值或通道间幅度差等的参数辅助信息的输入。
下面的方程s1~(k)=y1~(k)-a3(k)(y1~(k)+y2~(k))/2=(1-a32)y1~(k)-a32y2~(k)]]>s2~(k)=y2~(k)-a3(k)(y1~(k)+y2~(k))/2=(1-a32)y2~(k)-a32y1~(k)]]>Xlr=Xrl=a32]]>示出了图5a的实施例的数学描述,并在其右侧,一方面示出了抵消通道计算器中的抵消处理,另一方面还示出了处理器(图2中的21、24)。在此所示的该特定实施例中,因子x_lr和x_rl彼此相等。
以上实施例清楚地显示出,本发明包括重构基本通道由左和右传输通道的信号自适应线性合并组成的结构。图5a中示出了这种拓扑结构。
从不同角度看,本发明的设备还可以理解为动态上混过程,其中针对每个子带和每个时刻k使用不同上混矩阵。图5b示出了这种动态上混矩阵。注意,对于每个子带,即对于图4中滤波器组设备的每个输出,存在这样的上混矩阵U。关于时间相关的方式,注意,图5b包括时间索引k。当具有针对每个时间索引的幅度信息时,上混矩阵将在每个时刻之间不同。然而,当将相同的幅度信息a3用于由输入滤波器组FB变换为频率表达的整个值块时,则对于例如1024或2048个采样值的整个块,将出现一个值a3。在这种情况下,上混矩阵将沿时间方向在不同块之间改变,而不是在不同值之间改变。然而,存在用于平滑参数幅度值的技术,使得可以在特定频率波段中的上混期间获得不同幅度的修改因子a3。
一般而言,还可以使用不同的计算输出中央通道的因子和“动态上混”的因子,这产生作为上述a3的缩放版本的因子a3。
在优选实施例中,通过辅助信息从编码器至解码器的确切传输,自适应地控制中央分量抵消的加权强度。在这种情况下,图2所示的抵消通道计算器20还包括控制输入,所述控制输入接收计算用于指示左和中央通道或者右和中央通道之间的直接相互关联的显式控制信号。在这点上,该控制信号将不同于中央通道和左通道之间的幅度差,因为这些幅度差与一种虚拟基准通道相关,该虚拟基准通道可以是第一传输通道中的能量和和第二传输通道中的能量和,如图7d顶部所示。
这种控制参数例如可以指示中央通道低于阈值,且正在逼进0,而在左或右通道中存在高于阈值的信号。在这种情况下,抵消通道计算器对于相应控制信号的足够反应是关闭通道抵消,并应用如图7b所示的正常上混方案,以避免输入中不存在的中央通道的“过抵消”。关于这一点,这是如上所述的控制加权强度的一种极端情况。
优选地,从图4可知,并不执行时间延迟处理操作用于计算重构中央通道。这在不必考虑任何时间延迟的反馈工作中是有利的。然而,当原始中央通道用作用于计算时间差di的基准通道时,这可以不损失质量地获得。对于任何相关性度量也是如此。优选地,不执行任何相关性处理用于重构中央通道。取决于相关性计算的类型,当原始中央通道用作任何相关性参数的基准时,这可以不损失质量地获得。
注意,本发明不取决于特定下混方案。这意味着可以使用自动下混或者由音响工程师执行的手动下混方案。甚至可以使用自动产生的参数信息以及手动产生的下混通道。
取决于应用环境,本发明的构成或产生方法可以以硬件或软件实现。实现方式可以是数字存储介质,例如具有电可读控制信号的盘或CD,这种介质可以与可编程计算机系统协作,以便可以执行本发明的方法。因此,一般而言,本发明还涉及一种计算机程序产品,具有存储在机器可读载体上的程序代码,当计算机程序产品在计算机上运行时,该程序代码适用于执行本发明的方法。因此,换言之,本发明还涉及一种具有程序代码的计算机程序,当计算机程序在计算机上运行时,所述程序代码用于执行这些方法。
本发明可以与多种不同的应用程序或系统结合或与之合并,这些系统包括电视系统或电子音乐分发系统、广播、流和/或接收系统。这些系统包括用于通过例如地面、卫星、电缆、互联网、内联网或物理介质(例如压缩盘、数字多媒体盘、半导体芯片、硬盘驱动器、存储卡等)的解码/编码传输的系统。本发明还可以在游戏系统中采用,所述游戏系统包括例如交互式软件产品,意欲与想要娱乐(动作、角色扮演、战略、冒险、模仿、竞赛、运动、娱乐厅、纸牌和棋盘游戏)和/或想要在多个机器、平台或媒介上发布的教育的用户进行交互。此外,本发明可以并入音频播放器或CD-ROM/DVD系统。本发明还可以并入包括数字解码能力的PC软件应用程序(例如播放器、解码器)和包括数字编码能力的软件应用程序(例如编码器、ripper、记录器和点播机)。
权利要求
1.一种装置,用于使用E个传输通道,并使用与输入通道相关的参数信息,产生具有K个输出通道的多通道输出信号,该多通道输出信号与具有C个输入通道的多通道输入信号相对应,所述E个传输通道表示以C个输入通道作为输入的下混操作的结果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一传输通道和第二传输通道中引入了第一输入通道,还在第一传输通道中引入了第二输入通道,所述装置包括抵消通道计算器(20),用于使用与包括在第一传输通道、第二传输通道中的第一输入通道相关的信息或参数信息,来计算抵消通道(21);合并器(23),用于将抵消通道(21)和第一传输通道(23)或其处理版本合并,以获得第二基本通道(25),与第一输入通道对第一传输通道的影响相比,第二基本通道中第一输入通道的影响减小;以及通道重构器(26),用于使用第二基本通道和与第二输入通道相关的参数信息,来重构与第二输入通道相对应的第二输出通道,并使用不同于第二基本通道的第一基本通道和与第一输入通道相关的参数信息,来重构与第一输入通道相对应的第一输出通道,第一基本通道与第二基本通道的不同之处在于与第二基本通道相比,第一通道的影响更高。
2.根据权利要求1所述的装置,其中,合并器(22)操作用于从第一传输通道或其处理版本减去抵消通道。
3.根据权利要求1或2所述的装置,其中,抵消通道计算器(20)操作用于使用第一传输通道和第二传输通道,来计算第一输入通道的估计,以获得抵消通道(21)。
4.根据权利要求1至3之一所述的装置,其中,参数信息包括第一输入通道和基准通道之间的差值参数,并且抵消通道计算器(20)操作用于计算第一传输通道和第二传输通道之和,并且使用所述差值参数来加权所述和。
5.根据权利要求1至4之一所述的装置,其中,下混操作使得第一输入通道在缩放了下混因子之后被引入第一传输通道,并且抵消通道计算器(20)操作用于使用缩放因子来缩放第一和第二传输通道之和,其中所述缩放因子取决于所述下混因子。
6.根据权利要求5所述的装置,其中,加权因子等于下混因子。
7.根据权利要求1至6之一所述的装置,其中,抵消通道计算器(20)操作用于确定第一和第二传输通道之和,以获得第一基本通道。
8.根据权利要求1至7之一所述的装置,还包括处理器(24),处理器(24)操作用于通过使用第一加权因子来加权,以处理第一传输通道,并且抵消通道计算器(20)操作用于使用第二加权因子来加权第二传输通道。
9.根据权利要求8所述的装置,其中,参数信息包括第一输入通道和基准通道之间的差值参数,并且抵消通道计算器(20)操作用于根据差值参数来确定第二加权因子。
10.根据权利要求8或9所述的装置,其中,第一加权因子等于(1-h),其中h是实数值,并且第二加权因子等于h。
11.根据权利要求10所述的装置,其中,参数信息包括幅度差值,并且h是从参数幅度差值推导出的。
12.根据权利要求11所述的装置,其中,h等于从除以基于下混操作的因子的幅度差中推导出的值。
13.根据权利要求10所述的装置,其中,参数信息包括第一通道和基准通道之间的幅度差,并且h等于1√2×10L/20,其中L是幅度差。
14.根据权利要求1至13之一所述的装置,其中,参数信息还包括基于第一输入通道和第二输入通道之间的关系的控制信号,以及抵消通道计算器(20)由所述控制信号控制,以主动地增加或减少抵消通道的能量,或者甚至使抵消通道计算完全失效。
15.根据权利要求1至14之一所述的装置,其中,下混操作还操作用于将第三输入通道引入第二传输通道,所述装置还包括另一合并器,用于将抵消通道和第二传输通道或其处理版本合并以获得第三基本通道,与第一输入通道对第二传输通道的影响相比,第三基本通道中第一输入通道的影响减小;以及通道重构器,用于使用第三基本通道和与第三输入通道相关的参数信息,来重构与第三输入通道相对应的第三输出通道。
16.根据权利要求1至15之一所述的装置,其中,参数信息包括通道间幅度差、通道间时间差、通道间相位差或通道间相关性值,以及通道重构器(26)操作用于对基本通道应用上述组参数中的任意一个,来获得粗略的输出通道。
17.根据权利要求16所述的装置,其中,通道重构器(26)操作用于缩放粗略的输出通道,使得最终重构的输出通道中的总能量与E个传输通道的总能量相等。
18.根据权利要求1至17之一所述的装置,其中,以波段方式给出参数信息,并且抵消通道计算器(20)、合并器(22)和通道重构器(26)操作用于使用以波段方式给出的参数信息,来处理多个波段,以及所述装置还包括时间/频率转换单元(IFB),用于将传输通道转换为具有频率波段的频率表达;以及频率/时间转换单元,用于将重构的频率波段转换为时域。
19.根据权利要求1至18之一所述的装置,还包括选自以下组中的系统数字视频播放器、数字音频播放器、计算机、卫星接收机、电缆接收机、地面广播接收机和家庭娱乐系统;以及所述系统包括通道计算器、合并器和通道重构器。
20.一种方法,使用E个传输通道,并使用与输入通道相关的参数信息,产生具有K个输出通道的多通道输出信号,该多通道输出信号与具有C个输入通道的多通道输入信号相对应,所述E个传输通道表示以C个输入通道作为输入的下混操作的结果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一传输通道和第二传输通道中引入了第一输入通道,还在第一传输通道中引入了第二输入通道,所述方法包括使用与包括在第一传输通道、第二传输通道中的第一输入通道相关的信息或参数信息,来计算(20)抵消通道;将抵消通道和第一传输通道或其处理版本合并(22),以获得第二基本通道,与第一输入通道对第一传输通道的影响相比,第二基本通道中第一输入通道的影响减小;以及使用第二基本通道和与第二输入通道相关的参数信息,来重构(26)与第二输入通道相对应的第二输出通道,并使用不同于第二基本通道的第一基本通道和与第一输入通道相关的参数信息,来重构与第一输入通道相对应的第一输出通道,第一基本通道与第二基本通道的不同之处在于与第二基本通道相比,第一通道的影响更高。
21.一种具有程序代码的计算机程序,当在计算机上运行所述程序时,所述程序代码实现一种方法,所述方法使用E个传输通道,并使用与输入通道相关的参数信息,产生具有K个输出通道的多通道输出信号,该多通道输出信号与具有C个输入通道的多通道输入信号相对应,所述E个传输通道表示以C个输入通道作为输入的下混操作的结果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一传输通道和第二传输通道中引入了第一输入通道,还在第一传输通道中引入了第二输入通道,所述方法包括使用与包括在第一传输通道、第二传输通道中的第一输入通道相关的信息或参数信息,来计算(20)抵消通道;将抵消通道和第一传输通道或其处理版本合并(22),以获得第二基本通道,与第一输入通道对第一传输通道的影响相比,第二基本通道中第一输入通道的影响减小;以及使用第二基本通道和与第二输入通道相关的参数信息,来重构(26)与第二输入通道相对应的第二输出通道,并使用不同于第二基本通道的第一基本通道和与第一输入通道相关的参数信息,来重构与第一输入通道相对应的第一输出通道,第一基本通道与第二基本通道的不同之处在于与第二基本通道相比,第一通道的影响更高。
全文摘要
一种产生多通道输出信号的装置,执行中央通道抵消,以获得改进的用于重构左侧输出通道或右侧输出通道的基本通道。具体地,该装置包括抵消通道计算器(20),用于使用与在解码器处可用的原始中央通道相关的信息来计算抵消通道。该设备还包括合并器(22),用于将传输通道与抵消通道合并。最后,该装置包括重构器(26),用于产生多通道输出信号。由于中央通道抵消,通道重构器(26)不仅使用不同基本通道来重构中央通道,还使用与传输通道不同的基本通道来重构左和右输出通道,所述左和右输出通道具有原始中央通道的减小或甚至完全抵消的影响。
文档编号G10L19/00GK1985303SQ200580023131
公开日2007年6月20日 申请日期2005年5月12日 优先权日2004年7月9日
发明者于尔根·赫勒, 克里斯托弗·法勒, 萨沙·迪施, 约翰内斯·希尔珀特 申请人:弗劳恩霍夫应用研究促进协会, 杰尔系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1