音频通道空间转换的制作方法

文档序号:7737967阅读:177来源:国知局
专利名称:音频通道空间转换的制作方法
技术领域
本发明涉及音频信号处理。更特别地,本发明涉及将表示声场的多个音频输入通道转换成表示同一声场的一个或多个音频输出通道,其中,各通道是表示从某方向到达的音频的单个音频流。
背景技术
虽然人只有两个耳朵,但是我们依赖于诸如头相关传递函数(HRTF)和头移动的多个局部提示作为三维实体收听声音。因此,完全保真声音再现需要完全3D声场的保持和再现或者至少其知觉提示。不幸的是,声音记录技术不面向3D声场的捕获、不面向声音的 2D平面的捕获,甚至不面向声音的ID线的捕获。当前的声音记录技术严格地面向音频的零维度、离散通道的捕获、保存和呈现。自从爱迪生的声音记录的原创发明以来对于提高保真度的大多数努力着眼于改善他的原始模拟调制沟槽圆柱/盘介质的缺点。这些缺点包含有限的、不均勻的频率响应、 噪声、失真、变音、颤振、速度精度、磨损、灰尘和复制产生损失。虽然存在多个零星的对于孤立的改善的尝试(包含电子放大、带记录、噪声减少和成本高于一些汽车的记录播放器), 但是,个体通道质量的传统问题没有被最终解决,直到卓越的总体数字记录的开发,特别是音频光盘的引入。从那里起,除了进一步将数字记录的质量扩展到24位/96kHz采样的一些努力之外,音频再现研究的主要努力着眼于主要通过使用知觉编码器减少保持个别通道质量所需要的数据量以及增加空间保真度。后一种问题是本文件的主题。提高空间保真度的努力沿两个前沿进展尝试传输全声场的知觉提示,以及尝试传输对于实际原声场的近似。使用前一种方法的系统的例子包含双耳记录和基于二扬声器的虚拟环绕声系统。这些系统表现大量的不幸的缺点,特别是在沿一些方向将声音可靠地局部化以及需要使用头戴听筒或固定的单个收听者位置方面。为了向多个收听者呈现空间声音,不管是在客厅还是在诸如电影院的商业场所, 唯一可行的替代方案已尝试近似实际原声场。考虑到声音记录的离散通道本质,目前为止的大多数的努力涉及可被认为是保守的通道的数量的增加就不令人惊讶了。代表性系统包含早期50年代的盘形单声道三扬声器胶片声带、常规的立体声、60年代的四声道系统、 70mm胶片上的五通道离散磁性声带、70年代的使用矩阵的Dolby环绕声、90年代的AC-3 5. 1 通道声音以及最近的 Surround-EX6. 1 通道声音。“Dolby”、“Pro Logic”和“Surround EX”是Dolby Laboratories Licensing Corporation的商标。或多或少地,与单声道呈现相比,这些系统提供增强的空间呈现。但是,混合大量的通道在内容产生器上导致更多的时间和更大的成本代价,并且,得到的感觉典型地是数个散射、离散通道中的一个而不是连续的声场。在美国专利4799260中描述了 Dolby Pro Logic解码的各方面,在此加入其全部内容作为参考。在“Digital Audio Compression Standard(AC-3, E-AC-3),Revision B, Advanced Television Systems Committee, 14 June 2005 中阐述了 AC-3 的细节。当声场被表征时,原则上解码器能够对于任何输出扬声器导出最佳信号馈送。这里,被提供给这种解码器的通道将被不同地称为“主要的”、“被传送的”和“被输入的”通道, 并且,具有不与输入通道中的一个的位置对应的位置的任何输出通道将被称为“中间”通道。输出通道也可具有与输入通道的位置一致的位置。

发明内容
编码或下混合根据本发明的编码或下混合方面,一种用于将M个音频输入通道转换至N个音频输出通道的方法,所述M个音频输入通道中的每一个与一空间方向相关联,所述N个音频输出通道中的每一个与一空间方向相关联,其中M和N全部是正整数,M是3或更大,并且 N是3或更大,该方法包括从所述M个音频输入通道导出所述N个音频输出通道,其中所述 M个音频输入通道中的一个或多个与不同于与所述N个音频输出通道中的任一个相关联的空间方向的空间方向相关联,所述M个音频输入通道中的所述一个或多个中的至少一个被映射到所述N个输出通道中的至少三个输出通道的对应集合。该至少三个输出通道的集合可与连续空间方向相关联。N可是5或更大,并且所述导出可将所述M个音频输入通道中的所述一个或多个中的所述至少一个映射到所述N个输出通道中的三个、四个或五个输出通道的对应集合。所述N个输出通道中的至少三个、四个或五个输出通道的集合可与连续空间方向相关联。在具体实施例中,M可至少为6,N可至少为5,并且M个音频输入通道可分别和与和N个音频输出通道相关联的五个空间方向对应的五个空间方向、以及不与所述N个音频输出通道相关联的至少一个空间方向相关联。所述N个音频输出通道中的每一个可与公共平面中的空间方向相关联。M个音频输入通道的相关联空间方向中的至少一个可位于与所述N个音频输出通道相关联的平面上方或者位于所述平面下方。M个音频输入通道的相关联空间方向中的至少一些可相对于基准空间方向改变距离。在具体实施例中,与N个音频输出通道相关联的空间方向可包括左、中心、右、左环绕和右环绕。与M个音频输入通道相关联的空间方向可包括左、中心、右、左环绕、右环绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中心环绕和抬高的右环绕。与M个音频输入通道相关联的空间方向可进一步包括抬高的顶部。解码或上混合根据本发明的解码或上混合方面,一种用于将N个音频输入通道转换至M个音频输出通道的方法,所述N个音频输入通道中的每一个与一空间方向相关联,所述M个音频输出通道中的每一个与一空间方向相关联,其中M和N全部是正整数,N是3或更大,并且M是 1或更大,该方法包括从所述N个音频输入通道导出所述M个音频输出通道,其中所述M个音频输出通道中的一个或多个与不同于与所述N个音频输入通道中的任一个相关联的空间方向的空间方向相关联,所述M个音频输出通道中的所述一个或多个中的至少一个被从所述N个输入通道中的至少三个输入通道的对应集合导出。可至少部分地通过近似所述N 个输入通道中的至少三个输入通道的互相关性,从所述N个输入通道中的所述至少三个输入通道的对应集合导出所述M个音频输出通道中的所述一个或多个中的至少一个。近似所述互相关性可包括计算所述N个输入通道中的所述至少三个输入通道中的每一对的公共能量。任何所述对的公共能量可具有最小值。导出的M个音频输出通道的幅值可基于所述 N个输入通道中的所述至少三个输入通道的任一对的公共能量的最低估计幅值。当所述N 个输入通道中的所述至少三个输入通道的任一对的公共能量为零时,导出的M个音频输出通道的幅值可被取为零。可从共享N个输入通道中的公共对的各组N个输入通道导出多个被导出的M个音频输出通道,其中计算公共能量可包括补偿N个输入通道的被共享的公共对的公共能量。所述近似可包括按层级顺序处理多个被导出的M个音频通道,使得每个导出的音频通道可根据由中导出该音频通道的输入通道的数量分级,最大的输入通道的数量具有最高的等级,该近似根据多个被导出的M个音频通道的层级顺序依次处理多个被导出的M个音频通道。

计算公共能量可进一步包括补偿与具有较高层级等级的被导出的音频通道有关的N个输入通道的被共享的公共对的公共能量。所述N个输入通道中的至少三个输入通道的集合可与连续空间方向相关联。N可是5或更大,并且所述导出可将所述M个音频输入通道中的所述一个或多个中的所述至少一个映射到所述N个输入通道中的三个、四个或五个输入通道的对应集合。所述N个输入通道中的至少三个、四个或五个输入通道的集合可与连续空间方向相关联。在具体实施例中,M可至少为6,N可为5,并且至少六个输出音频输入通道可分别和与和N个音频输入通道相关联的五个空间方向相对应的五个空间方向、以及不与所述N 个音频输入通道相关联的至少一个空间方向相关联。所述N个音频输入通道中的每一个可与公共平面中的空间方向相关联。M个音频输入通道的相关联空间方向中的至少一个可位于与所述N个音频输出通道相关联的平面上方或者位于所述平面下方。M个音频输入通道的相关联空间方向中的至少一些可相对于基准空间方向改变距离。在具体实施例中,与N个音频输出通道相关联的空间方向可包括左、中心、右、左环绕和右环绕。与M个音频输出通道相关联的空间方向可包括左、中心、右、左环绕、右环绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中心环绕和抬高的右环绕。与N个音频输入通道相关联的空间方向可进一步包括抬高的顶部。根据本发明的其他方面的第一方面,一种用于将M个音频输入信号转换至N个音频输出信号的方法,所述M个音频输入信号中的每一个与一方向相关联,所述N个音频输出信号中的每一个与一方向相关联,其中N大于M,M为2或更大,并且N是等于3或更大的正整数,该方法包括提供M:N可变矩阵,将M个音频输入信号施加到所述可变矩阵,从所述可变矩阵导出所述N个音频输出信号,并且响应于输入信号控制所述可变矩阵以使得当输入信号高度相关时由输出信号产生的声场在输入信号的标称前进主方向上具有紧凑声音图像,该图像随着相关性降低而从紧凑向宽扩散,并且随着相关性继续降低至高度不相关而逐渐拆分成多个紧凑声音图像,所述多个紧凑声音图像中的每一个位于与一输入图像相关联的方向上。根据本发明的其他方面的此第一方面,该可变矩阵可响应于(1)输入信号的相对电平以及(2)输入信号的互相关性的度量而被控制。在该情况下,对于具有在由最大值和基准值限定边界的第一范围中的值的输入信号的互相关性的度量,声场可在所述互相关性的度量为所述最大值时具有紧凑声音图像,并且可在所述互相关性的度量为所述基准值时具有宽扩散的图像,并且对于具有在由所述基准值和最小值限定边界的第二范围中的值的输入信号的互相关性的度量,声场可在所述互相关性的度量为所述基准值时具有宽扩散的图像,并且可在所述互相关性的度量为所述最小值时具有多个紧凑声音图像,所述多个紧凑声音图像中的每一个位于与一输入图像相关联的方向上。根据本发明的其他方面的另外方面,一种用于将M个音频输入信号转换至N个音频输出信号的方法,所述M个音频输入信号中的每一个与一方向相关联,所述N个音频输出信号中的每一个与一方向相关联,其中N大于M,M为3或更大,该方法包括提供多个m:η可变矩阵,其中m是M的子集并且η是N的子集,给所述多个可变矩阵中的每一个施加所述M 个音频输入信号的对应子集,从所述多个可变矩阵中的每一个导出所述N个音频输出信号的对应子集,响应于被施加给所述多个可变矩阵中的每一个的所述输入信号的子集控制该可变矩阵,以使得当被施加给该可变矩阵的所述输入信号的子集高度相关时由从该可变矩阵导出的输出信号的对应子集产生的声场在所述输入信号的所述子集的标称前进主方向上具有紧凑声音图像,该图像随着相关性降低而从紧凑向宽扩散,并且随着相关性继续降低至高度不相关而逐渐拆分成多个紧凑声音图像,所述多个紧凑声音图像中的每一个位于与被施加给该可变矩阵的一输入图像相关联的方向上,并且从N个音频输出通道的子集导出所述N个音频输出信号。根据本发明的其他方面的此另外方面,可变矩阵还可响应于补偿接收相同输入信号的一个或多个其他可变矩阵的影响的信息被控制。此外,从N个音频输出通道的子集导出所述N个音频输出信号还可包括补偿产生相同输出信号的多个可变矩阵。根据本发明的其他方面的这样的另外方面,多个可变矩阵中的每一个可响应于(a)被施加到该可变矩阵的输入信号的相对电平以及(b)输入信号的互相关性的度量而被控制。根据本发明的其他方面的还另外方面,一种用于将M个音频输入信号转换至N个音频输出信号的方法,所述M个音频输入信号中的每一个与一方向相关联,所述N个音频输出信号中的每一个与一方向相关联,其中N大于M,并且M为3或更大,该方法包括提供响应于控制矩阵系数或控制矩阵输出的缩放因子的M: N可变矩阵,将所述M个音频输入信号施加到所述可变矩阵,提供多个m:n可变矩阵缩放因子生成器,其中m是M的子集并且η 是N的子集,向所述多个可变矩阵缩放因子生成器中的每一个施加所述M个音频输入信号的对应子集,从所述多个可变矩阵缩放因子生成器中的每一个导出用于所述N个音频输出信号的对应子集的可变矩阵缩放因子的集合,响应于被施加给所述多个可变矩阵缩放因子生成器中的每一个的输入信号的子集控制该可变矩阵缩放因子生成器,使得当由该可变矩阵缩放因子生成器生成的缩放因子被施加给所述Μ:Ν可变矩阵时,由所产生的输出信号的相应子集生成的声场在产生所述被施加的缩放因子的所述输入信号的子集高度相关时在所述输入信号的所述子集的标称前进主方向上具有紧凑声音图像,该图像随着相关性降低而从紧凑向宽扩散,并且随着相关性继续降低至高度不相关而逐渐拆分成多个紧凑声音图像,所述多个紧凑声音图像中的每一个位于与产生被施加的缩放因子的一输入图像相关联的方向上,并且从所述可变矩阵导出所述N个音频输出图像。根据本发明的其他方面的此还另外方面,可变矩阵缩放因子生成器还可响应于补偿接收相同输入信号的一个或多个其他可变矩阵缩放因子生成器的影响的信息被控制。 此外,从所述可变矩阵导出所述N个音频输出信号可包括补偿产生用于相同输出信号的缩放因子的多个可变矩阵缩放因子生成器。根据本发明的其他方面的这样的另外方面,多个可变矩阵缩放因子生成器中的每一个可响应于(a)被施加到该可变矩阵缩放因子生成器的输入信号的相对电平以及(b)输入信号的互相关性的度量而被控制。如文中使用的,“通道”是代表从一方向(考虑到较近或较远的虚拟或投影通道,例如方位角、高度以及可选地距离)到达的音频或者与其相关联的单个音频流。根据本发明,代表声场的M个音频输入通道被转换成代表同一声场的N个音频输出通道,其中每一通道是代表从一方向到达的音频的单个音频流,M和N都是正整数,并且M 至少为2并且N至少为3,并且N大于M。生成输入通道的一个或多个集合,每个集合具有一个或多个输出通道。每个集合通常与两个或更多个空间相邻输入通道相关联,并且通过确定该两个或更多个输入通道的相关性的度量以及该两个或更多个输入通道的电平相互关系的度量,来生成一集合中的每个输出通道。互相关性的度量优选地是零时间偏移互相关性的度量,其是公共能量电平与输入信号能量电平的几何平均值的比。公共能量电平优选地是被平滑化或平均化的公共能量电平,并且输入信号能量电平是被平滑化的或被平均化的输入信号能量电平。在本发明的一个方面,输出通道的多个集合可与多于两个的输入通道相关联,并且一种处理可根据层级顺序确定与输出通道的每个集合相关联的输入通道的相关性,使得每个集合或多个集合根据与其的输出通道或多个输出通道相关联的输入通道的数量被分级,最大的输入通道的数量具有最高的等级,并且该处理根据多个集合的层级顺序依次处理所述多个集合。此外,根据本发明的一个方面,该处理考虑了处理更高阶集合的结果。本发明的某些重放或解码方面假设代表从一方面给到达的音频的M个音频输入通道中的每一个由每个源方向(即,源方向被假定主要映射到最近的一个或多个输入通道)的被动矩阵最近邻居幅值扫调编码生成,而不需要附加的侧链信息(侧链或辅助信息的使用是可选的),使得其可与现有混合技术、控制台和格式相容。尽管这样的源信号可通过明确采用被动编码矩阵来生成,但是大多数常规记录技术本质上可生成这样的源信号 (因此,构成“有效编码矩阵”)。本发明的某些重放或解码方面还与诸如可通过5个真实方向麦克风得到的自然记录源信号大大相容,这是因为考虑到一些可能的延时,从中间方向到达的声音趋向于主要映射到最近的麦克风(在水平阵列中,具体映射到最近的麦克风对)。根据本发明的各方面的解码器或解码处理可被实现为耦合的处理模块或模块化函数(下文“模块”或“解码模块”)的网格,每一解码模块被用于典型地由与解码模块相关联的最近空间邻近输入通道中的两个或更多个通道,生成一个或多个输出通道(或者可替换地,控制可用于生成一个或多个输出通道的信号)。输出通道典型地代表在与特定解码模块相关联的最近空间邻近输入通道中的音频信号的相对比例。如下文更详细解释的,解码模块在模块共享输入的意义上相互松散地耦合,并且存在解码模块的层级体系。模块被根据与它们相关联的输入通道的数量分层级地排序(具有最高数量的相关联输入通道的一个或多个模块的等级最高)。监控器或监控函数管理模块,以使得公共输入信号在模块之间或之中被相等地共享,并且较高等级的解码器模块可可影响较低等级的模块。每个解码器模块可实际上包括矩阵,从而其可直接生成输出信号,或者每个解码器模块可生成控制信号,该控制信号与由其它解码器模块生成的控制信号一起被用于改变可变矩阵的系数或者固定矩阵的输入或者输出的缩放因子,以便生成所有输出信号。解码器模块模拟人耳的工作以尝试提供听觉明晰的再现。解码器模块和模块函数作为其的一个方面的根据本发明的信号转换可被应用于宽带信号,或者被应用于多频带处理器的各频带,并且依赖于实现,可每个样本执行一次或者样本的每个块执行一次。多频带实施例可采用滤波器组,诸如离散临界带滤波器组或具有与相关联解码器相容的频带结构的滤波器组,或变换配置,诸如FFT (快速傅立叶变换)或MDCT (修改的离散余弦变换) 线性滤波器组。本发明的另一方面是接收N个输出通道的扬声器的量可通过对虚拟成像的明智依赖被减小至合乎实际的量,该虚拟成像是在空间中的除扬声器所在位置之外的位置处产生被感觉到的声音图像。尽管虚拟成像的最普遍使用是在两个扬声器之间的图像的立体声再现中,但是,通过在通道之间扫调单声道信号,如作为本发明的一个方面被设想的虚拟成像可包括幻觉投影图像的呈现,其提供了超出房间的墙壁之外或者在房间的墙壁内部的听觉引向。虚拟成像不被认为是用于具有稀疏数量的通道的成组表现的可行技术,因为其需要收听者距两个扬声器等距或基本等距。例如,在电影院中,左前部和右前部扬声器间隔过远以至于不能使得大部分观众获得中央图像的有用幻觉成像,因此考虑到中心通道作为大部分对话的来源的重要性,作为替代,使用物理中心扬声器。因为扬声器的密度增加,对于大部分观众,至少在扫调平滑的程度上,在任何扬声器对之间的虚拟成像可行的点将被达到;通过足够的扬声器,扬声器之间的间隙因而不再被察觉到。信号分布如上所述,互相关性的度量确定模块中的主导(公共信号分量)与非主导(非公共信号分量)能量的比,以及模块的输出通道之中的非主导信号分量的扩散程度。可通过考虑对于二输入模块的情况在不同条件下对于模块的输出通道的信号分布,更好地理解这一点。除非另外指出,文中所阐述的原理直接延伸到较高等级的模块。信号分布所遇到的问题是常常存在过少的信息以至于不能恢复原信号幅值分布, 该信息远少于信号本身。可利用的基本信息是在各模块输入处的信号电平以及被平均化的输入信号的交叉乘积、公共能量电平。零时间偏移互相关性是公共能量电平相对于输入信号能量电平的几何平均值的比。互相关性的重要性在于其用作所有输入共用的信号的净幅值的度量。如果存在被扫调至模块的输入之间的任何地方的单个信号(“内部”和“中间”信号),所有输入将具有相同波形(虽然可能具有不同幅值),并且在这些条件下,相关性将为1.0。在另一个极端情况,如果所有输入信号都是独立的,这意味着不存在公共信号分量,相关性将为0。在0和 1.0中间的相关性的值可被认为对应于在输入处的一些单个的、公共信号分量和独立信号分量的中间平衡电平。因此,任何输入信号条件可被分成公共信号、“主导”信号和在减去公共信号的贡献之后剩余的输入信号分量,包括“所有其余”信号分量(“非主导”或残余信号能量)。如上所说,公共或“主导”信号幅值不一定比残余或非主导信号电平响亮。例如,考虑被映射到单个Lt/Rt(左总体和右总体)对的成弧形的五个通道 (L(左)、MidL (中间左侧)、C(中心)、MidR(中间右侧)、R(右侧))的情况,希望在该单个Lt/Rt对中恢复原始的五个通道。如果所有五个通道具有等幅值的独立信号,然后Lt和 Rt的幅值将相等,具有对应于在0和1之间的互相关性的中间值的公共能量的中间值(由于Lt和Rt是非独立的信号)。可在不利用来自MidL和MidR的信号的情况下通过合适地选择L、C和R的电平而实现相同的电平。因此,二输入、五输出模块可能仅馈送对应于主导方向的输出通道(在此情况下,C),以及对应于在从Lt和Rt输入去除C能量之后的输入信号残余的输出通道(L,R),而没有向MidL和MidR输出通道供给信号。这种结果是不希望的,不必要地关闭通道几乎总是一个坏的选择,这是因为信号条件中的小的扰动将造成“关闭”通道在开通和关闭之间反复,导致烦人的颤动声音(“颤动”是通道快速开通和关闭), 当“关闭”通道被隔离地收听时尤其如此。因此,当对于给定的一组模块输入信号值存在多种可能的输出信号分布时,从个体通道质量的角度考虑的守恒方法是与信号条件一致地在模块的输出通道中尽可能均勻地扩散非主导信号分量。本发明的一个方面根据三路拆分、而不是“主导”对比“非主导” 两路拆分在服从信号条件的情况下均勻地扩散可用信号能量。优选地,三路拆分包含主导 (公共)信号分量、填充(均勻扩散)信号分量、和输入信号分量残余。不幸的是,仅存在足以进行两路拆分(主导信号分量和所有其它信号分量)的信息。文中描述了一种用于实现三路拆分的合适方法,其中对于高于特定值的相关值,两路拆分采用主导和扩散非主导信号分量;对于低于该值的相关值,两路拆分采用扩散的非主导信号分量和残余。公共信号在 “主导”和“均勻扩散”之间被分开。“均勻扩散”分量包括“主导”和“残余”信号分量两者。 因此,“扩散”包含公共(相关)和残余(不相关)信号分量的混合。在处理之前,对于给定模块的给定输入/输出通道配置,对应于接收相同信号幅值的所有输出通道计算相关值。该相关值可被称为“randonuxcor”值。对于单个、居中导出的中间输出通道和两个输入通道,randonuxcor值可计算为0. 333。对于三个相等地扩散的中间通道以及两个输入通道,randonuxcor值可计算为0. 483。尽管已发现这样的时间值提供了令人满意的结果,但是它们不是关键的。例如,分别为大约0.3和0.5的值可用。换句话说,对于具有M个输入和N个输出模块,存在可被认为代表所有N个输出中的相等能量的特定的M个输入的相关度。这可通过将M个输入考虑它们好像已使用接收N个相等能量的独立信号的被动N到M矩阵被导出来得出,但是当然,可通过其它手段导出实际输出。此阈值相关值是“randonuxcor”,并且其可代表两个操作区之间的分割线。然后,在处理期间,如果模块的互相关值大于或等于randonuxcor值,则其被缩放到1. 0至0的范围scaled_xcor =(才百关值-random_xcor) / (l-random_xcor)“scalecLxcor”值代表高于均勻扩散电平的主导信号的量。所有剩下的可被均勻分布到模块的其它输出通道。但是,存在附加的应被考虑的因子,即当输入信号的标称前进主方向变得越来越多地偏离中心时,如果维持对于所有输出通道的相等分布,则扩散能量的量应被逐渐减少,或者可替换地,扩散能量的量应被维持,但是分布到输出通道的能量应相对于主导能量的 “偏心度”而被减少——换句话说,沿输出通道的能量渐缩。在后一种情况下,需要附加的处理复杂度以维持输出功率等于输入功率。应注意,文中对于“功率”的一些引用从严格的观点看指的是“能量”。对“功率”的引用在文献中被普遍使用。另一方面,如果当前相关值小于randonuxcor值,则主导能量被认为是0,均勻扩散的能量被逐渐减小,并且残余信号(所有剩下的)被允许在输入处累积。在相关值=0 时,不存在内部信号,仅有直接映射到输出通道的独立的输入信号。本发明的此方面的操作可被如下地进一步解释a)当实际相关值大于randonuxcor时,存在足够的能量,使得认为存在将在两个相邻输出之间被引导(扫调)(或者,当然,如果其方向恰好与一个输出重合,则被提供给该个输出)的主导信号;从输入中减去分配给该主导信号的能量以得到在所有输出之间(优选地均勻地)分布的残余。b)当实际相关值正好为randonuxcor时,输入能量(可被认为全部是残余)在所有输出之中均勻地分布(这是randonuxcor的定义)。c)当实际相关值小于randonuxcor时,不存在对于主导信号足够的公共能量,从而输入的能量被按依赖于重要程度的比例在输出之中分布。这就好像将相关部分作为残余处理以在所有输出中均勻分布,并且将不相关部分就好像要被发送给对应于输入的方向的输出的多个主导信号。在相关值为0的极端情况下,每个输入仅被馈送到一个输出位置(通常为多个输出中的一个输出,但是其可是两个输出之间的扫调位置)。因此,在完全相关到零相关之间存在连续性,在完全相关的情况下,根据输入的相对能量单个信号在两个输出之间被扫调,通过randonuxcor,输入在所有输出之中均勻地分布,在零相关的情况下,M个输入被独立地馈送给M个输出位置。相互作用补偿如上文所述,根据本发明的一个方面的通道转换可被认为涉及“模块”的网格。由于多个模块可共享给定的输入通道,因此在模块之间可存在相互作用,并且除非采取一些补偿,否则该相互作用可能使性能劣化。尽管通常不能根据信号将“去往”的模块而在输入处对信号进行分离,但是估计信号被每个连接的模块所使用的量可改进得到的相关性和方向估计,得到改进的总体性能。如上所述,存在两种模块相互作用涉及处于共同的或较低的层级水平的模块 (即具有相似数量的输入或较少输入的模块)的模块相互作用,该模块被称为“邻居”,以及涉及与给定模块相比处于较高层级水平(具有较多输入)但是共享一个或多个公共输入的模块的模块相互作用,这种模块被称为“高等级邻居”。考虑在共同层级水平的第一邻居补偿。为了理解由邻居相互作用造成的问题,考虑具有相同的L/R(左和右)输入信号的隔离的两输入模块。这对应于在输入之间的中途的单个主导(公共)信号。公共能量为A2,并且相关值为1.0。假设第二二输入模块,具有在其的L/R输入处的公共信号B、公共能量B2,以及也具有相关值1. 0。如果这两个模块连接在公共输入处,则在该输入处的信号将是A+B。假设信号A和B是独立的,则然后AB的平均乘积将为0,从而第一模块的公共能量将为A (A+B) = A2+AB = A2,并且第二模块的公共能量将为B(A+B) =b2+ab = b2。因此,公共能量未受相邻模块影响,只要它们处理独立信号即可。这通常是正确的假设。如果信号不是独立的,是相同的或者至少基本共享公共信号分量,则该系统将以与人耳的响应一致的方式进行反应——即公共输入将较大,导致得到的音频图像被朝公共输入牵引。在此情况下,由于公共输入比任何外部输入多信号幅值(A+B),各模块的L/R输入幅值比偏移,这使得方向估计偏向公共输入。在该情况下,两个模块的相关值现在稍小于1.0,这是因为在成对输入处的波形是不同的。由于相关值确定非主导信号分量的扩散程度以及主导(公共信号分量)与非主导(非公共信号分量)能量的比,未被补偿的公共输入信号使得各模块的非公共信号分布扩散。为了进行补偿,估计可归因于各模块的各输入的“公共输入电平”的度量,然后,每个模块被告知在各模块输入处的相同层级水平的所有相邻电平的这样的公共输入电平能量的总量。文中描述了计算可归因于模块的各输入的公共输入电平的度量的两种方式一种方式基于模块的输入的公共能量(在下一段中描述),另一种方式更精确但是需要更大的计算资源,其基于模块的内部输出的总能量(下文结合图6A的布置进行描述)。根据计算可归因于模块的各输入的公共输入电平的度量的第一方式,模块的输入信号的分析不能使得直接求出在各输入处的公共输入电平,仅求出总公共能量的一部分, 其是公共输入能量电平的几何平均值。由于在各输入处的公共输入能量电平不能超过该输入处的总能量电平,该总能量电平被测量并且已知,因此将总公共能量乘以因子以得到与观测的输入电平成比例的估计的公共输入电平,随后进行量化。一旦对于网格中的所有模块计算了公共输入电平的总体(不管公共输入电平的度量是基于第一计算方式还是基于第二计算方式)、各模块被告知在各输入处的所有相邻模块的总的公共输入电平,被称为模块的在其各输入处的“邻居电平”的量。模块然后从在其各输入处的输入电平中减去邻居电平以得到经补偿的输入电平,其被用于计算相关性和方向(输入信号的标称前进主方向)。对于上述例子,相邻电平最初为0,从而由于公共输入具有比任一端部输入更多的信号,因此第一模块在该输入处要求超过A2的公共输入功率电平,并且第二模块在同一输入处要求超过B2的公共输入电平。由于这两个要求都多于在该电平的可用能量,因此该要求被分别限制为A2和B2。由于不存在与该公共输入连接的其它模块,因此各公共输入电平对应于领域模块的邻居电平。因此,由第一模块看到的经补偿的输入功率电平为(A2+B2) -B2 = A2并且,由第二模块看到的经补偿的输入功率电平为(A2+B2) -A2 = B2但是,这些正好是将在模块被隔离的情况下被看到的电平。因此,得到的相关值将为1.0,并且如所希望的,在合适的幅值下,主导方向将在中心。然而,被恢复的信号本身将不被完全隔离——第一模块的输出将具有一些B信号分量,并且反之依然,但是这是矩阵系统的局限性,并且如果在多频带基础上执行该处理,则混合的信号分量将处于相似频率,稍微未决地呈现它们之间的区别。在更复杂的情况下,补偿通常将不那么精确,但是通过该系统的体验可了解到在实践中,该补偿减轻了相邻模块相互作用的大部分影响。在已经建立了用于邻居电平补偿的原理和信号的情况下,到高等级邻居电平补偿的扩展是相当简单明了的。这应用于其中处于不同层级水平的两个或更多个模块共享多于一个的公共输入通道的情况。例如,可存在与二输入模块共享两个输入的三输入模块。所有三个输入共用的信号分量也将是二输入模块的两个输入共用的,并且在未补偿的情况下,将被各模块在不同的位置呈现。更一般地,可存在所有三个输入共用的信号分量,以及仅二输入模块的输入共用的第二分量,需要它们的影响被尽可能多地分隔开以便进行输出声场的正确呈现。因此,如上述的公共输入电平所具体表现的,在二输入计算可被适当地执行之前,三输入公共信号应被从输入中减去。实际上,在进行低等级计算之前,高等级公共信号元素不仅应被从低等级模块的输入电平中减去,而且还应从其的被观测的公共能量电平的度量中减去。这不同于处于相同层级水平的模块的公共输入电平的影响,该影响不影响相邻模块的公共能量电平的度量。因此,高等级邻居电平应被与相同等级邻居电平分开考虑和采用。在高等级邻居电平已向下传递给层级较低的模块的同时,低等级模块的剩余公共电平也应在层级体系中被向上传递,这是因为如上所述,低等级模块如同普通邻居那样对高等级模块起作用。一些量是互相依存的并且难以同时求出。为了避免执行复杂的联立求解资源密集计算,可将先前计算的值传递给相关模块。在不同层级水平的模块公共输入电平的潜在相互依赖性可利用如上所述的先前的值被解决,或者从最高层级水平到最低层级水平以重复序列(即,环路)执行计算。可替换地,尽管包含并非微不足道的计算开销,但是联立方程求解也是可能的。尽管所述的相互作用补偿技术仅提供了用于复杂信号分布的近似正确值,但是它们被认为对未能考虑模块相互作用的网格布置进行了改进。


图IA是示意性地示出按测试布置的方式的理想化编码和/或解码布置的顶视平面图,该测试布置使用房间墙壁周围的16通道水平阵列、在水平阵列之上设置成圆形的6 通道阵列和单个天花板(顶部)通道。图IB是示意性示出使用房间墙壁周围的16通道水平阵列、在该水平阵列之上设置成圆形的6个通道阵列和单个天花板(顶部)通道的理想化的替代性编码和/或解码布置的顶视平面图。图2是提供实现图IA的解码例子的通过中心监控器操作的多个模块的多频带变换实施例的概观的功能框图。图2'是提供实现图IB的解码例子的通过中心监控器操作的多个模块的多频带变换实施例的概观的功能框图。图3是可用于理解诸如图2和2'的监控器201的监控器或图2'可确定端点缩放因子的方式的功能框图。图4A 4C示出根据本发明的一个方面的模块的功能框图。图5是表示由成三角形关系的输入通道馈送的三输入模块、三个内部输出通道和主导方向的假想布置的示意图。该视图可用于理解主导信号分量的分布。图6A和图6B是分别示出用于⑴响应各输入处的总能量产生模块的各输入的总估计能量和(2)响应输入信号的交叉相关性的度量产生模块的端点中的每一个的多余端点能量缩放因子分量的一个适当的布置的功能框图。图7是示出图4C的“求和和/或取较大者”块367的优选功能的功能框图。图8是本发明的一个方面响应交叉相关性的度量产生缩放因子分量的方式的理想化表现。
图9A和图9B到图16A和图16B是示出输入信号条件的各种例子得出的模块的输出缩放因子的理想化呈现的一系列视图。
具体实施例方式为了测试本发明的各方面,部署这样一种布置,该布置在具有四个墙壁的房间的各墙壁上具有5个扬声器(每个拐角处各有一个扬声器,在各拐角之间具有均勻分隔开的三个扬声器)、考虑到公共的拐角扬声器共16个扬声器的水平阵列,加上以约45度的垂直角度在位于中心的收听者之上的6个扬声器的环,加上单个在正上方的扬声器(共23个扬声器),加上亚低音扬声器/LFE (低频率效果)通道(总共24个扬声器),所有的扬声器被对于24通道回放设置的个人计算机馈送。虽然通过当前的用语,该系统可被称为23. 1通道系统,但是,为了简单,这里将被称为24通道系统。图IA是示意性地按上述的试验布置的方式的理想化解码布置的顶视平面图。该图还呈现了 23. 1源通道被下混合到6. 1通道的理想化编码布置,该6. 1通道由如在一般使用的系统中标准的5. 1通道(左、右、左环绕、右环绕和LFE)、加上一个附加的通道(顶部通道)构成。返回图IA的描述,作为解码或上混合布置,五个宽范围水平输入通道被示出在外部圆上的正方形1'、3'、5'、9'和13'。垂直或顶部通道被示为在中心的虚线正方形 23',该垂直或顶部通道可通过相关或产生的回响从五个宽范围输入导出或者作为第六通道(如上面以及图2那样)被单独供给。二十三个宽范围输入通道被示为填充数字的圆1 23。十六个输出通道的外部圆处于水平面上,六个输出通道的内部圆为水平面之上四十五度。输出通道23处于一个或更多个收听者正上方。五个二输入解码模块由围绕该外部圆的、连接在各对的水平输入通道之间的括号24-28勾画。五个附加的二输入垂直解码模块被连接垂直通道与水平输入中的每一个的括号29 33勾画。如输出通道21和输入通道 9、13和23之间的箭头所示,从三输入解码模块34导出作为抬高的中心后部通道的输出通道21。因此,三输入模块34的层级比其的二输入较低等级相邻模块27、32和33高一个等级(LEVEL)。在本例子中,各模块与相应的一对或三个最接近的空间相邻输入通道相关。本例子中的各模块具有至少三个相同等级的邻居。例如,模块25、28、29是模块24的邻居。虽然图IA所示的解码模块以不同方式具有三个、四个或五个输出通道,但是,解码模块可具有任何合理的数量的输出通道。输出通道可位于两个或更多个输入通道中间或者处于与输入通道相同的位置。因此,在图IA例子中,输入通道地点(LOCATION)中的每一个也是输出通道。两个或三个解码模块共享各输入通道。虽然图IA的布置使用五个模块(24 28)(各具有两个输入)和五个输入(1 ‘、 3'、5'、9'和13')以导出代表房间的四个墙壁周围的地点的十六个水平输出(1 16),但是,可以通过最少三个输入和三个模块(各具有两个输入,每个模块与另一个模块共享一个输入)获得类似的结果。通过使用每个模块具有按圆弧或线的方式的多个输出通道的多个模块(诸如图 1A、图1B、图2和图2 ‘的例子),在小于零的相关性被解码为指示向后方向的现有技术解码器中所遇到的解码模糊可被避免。以下结合图IB的描述来描述图IA的编码/解码布置的替代方案。
虽然输入和输出通道可由它们的物理位置或者至少它们的方向表征,但是,用矩阵表征它们是有用的,原因是它提供了良好限定的信号关系。各矩阵元素(行i,列j)是使输入通道i与输出通道j相关的传递函数。矩阵元素通常是带符号的乘法系数,但也可包含相位或延迟项(原理上,任何过滤器),并且可以是频率的函数(在离散频率方面,在各频率处为不同矩阵)。在向固定矩阵的输出施加的动态缩放因子的情况下,这是简单明了的, 但是,它还通过对于各矩阵元素或者对于比简单缩放因子复杂的矩阵元素具有单独的缩放因子而适于可变矩阵,其中,矩阵元素自身是变量(例如可变延迟)。在将物理位置映射到矩阵元素时存在一定的灵活性;原理上,本发明的各方面的实施例可处理输入通道向任何数量的输出通道的映射以及相反的映射,但是,最一般的情况是假定仅通过简单缩放因子将信号映射到最接近的输出通道,为了节省功率,该简单缩放因子的平方和为1.0。常常通过正弦/余弦扫调(panning)函数完成这种映射。例如,对于两个输入通道和它们之间的线上的三个内部输出通道加上与输入位置一致的两个端点输出通道(即,M:N模块,其中,M为2并且N为5),可以假定跨度表示90 度的圆弧(正弦或余弦从0变为1或者从1变为0的范围),使得各通道以90度/4间隔= 22. 5度分隔开,从而给出(cos (角度),sin (角度))的通道矩阵系数Lout coeffs = cos(0), sin(O) = (1,0)MidLout coeffs = cos (22. 5), sin (22. 5) = (. 92, . 38)Cout coeffs = cos (45),sin (45) = (· 71,· 71)MidRout coeffs = cos (67. 5,sin (67. 5) = (· 38,· 92)Rout coeffs = cos (90),sin (90) = (0,1)因此,对于具有固定系数和由各矩阵输出处的缩放因子控制的变量增益的矩阵的情况,在五个输出通道中的每一个处输出的信号为(这里,“SF”是用于由下标标识的特定输出的缩放因子)Lout = Lt (SFl)MidLout = ((· 92) Lt+ (· 38) Rt)) (SFmwl)Cout = ((· 45) Lt+ (· 45) Rt)) (SFc)MidRout = ((· 38) Lt+ (· 92) Lt)) (SFmwe)Rout = Rt (SFe)一般地,给定输入通道的阵列,可以在概念上通过直线将最接近的输入相结合,从而表示潜在的解码器模块。(它们是“潜在的”,因为如果不存在需要从模块导出的输出通道,那么不需要该模块)。对于典型的布置,可从二输入模块导出两个输入通道之间的线上的任何输出通道(如果源和传送通道处于公共的平面中,那么任何一个源出现于至多两个输入通道中,在这种情况下使用多于两个的输入没有好处)。处于输入通道的相同位置的输出通道是可能多于一个的模块的端点通道。不处于线上或与输入处于同一位置(例如,在由三个输入通道形成的三角形的内部或外部)的输出通道需要具有多于两个的输入的模块。当公共信号占据多于两个的输入通道时,具有多于两个的输入的解码模块是有用的。例如,这在源通道和输入通道不在平面中时会出现源通道可映射到多于两个的输入通道。这在将24个通道(16个水平环通道、6个抬高的环通道,1个垂直通道,加上LFE)映射到6. 1通道(包含复合的垂直或顶部通道)的图IA的例子中出现。在这种情况下,抬高的环中的中心后通道不在两个源通道之间的直达线中,它处于由Ls(13)、Rs(9)和顶部(23) 通道形成的三角形的中间,因此,需要三输入模块以提取它。将抬高的通道映射到水平阵列的一种方式是将它们中的每一个映射到多于两个的输入通道。这允许将图IA例子的24个通道映射到常规的5. 1通道阵列。在该替代方案中,多个三输入模块可提取抬高的通道,并且,剩余信号分量可被二输入模块处理,以提供通道的主水平环。在下文进一步结合图IB 和图2'描述这种替代方案。一般地,不需要检查输入通道之间的信号公共性的所有可能组合。对于平面通道阵列(例如,表示水平排列方向的通道),执行空间相邻通道的成对类似性比较通常就够了。对于在罩盖或球表面中布置的通道,信号公共性可扩展到三个或更多个通道。也可使用信号公共性的使用和检测以传输常规的信号信息。例如,垂直或顶部信号分量可通过映射到水平五通道阵列的所有五个全范围通道而被呈现。在下文进一步结合图IB和图2' 描述这种替代方案。关于哪些输入通道组合连同默认输入/输出映射矩阵一起分析公共性的决定仅需在配置转换器或转换器函数时对于每个输入/输出通道转换器或转换器函数布置进行一次。“初始映射”(在处理之前)导出使输入/输出通道配置与通道的空间取向相关的被动“主”矩阵。作为一种替代方案,本发明的处理器或处理部分可产生时变缩放因子,每个输入通道一个,其修正否则将是简单的、被动矩阵的输入信号电平或矩阵系数本身。如下所述,缩放因子继而从(a)主导、(b)均勻散布(填充)和(c)剩余(端点)信号分量导出。主矩阵对于配置诸如图IA和IB的例子中示出的并且下文结合图2和2’进一步描述的模块的布置是有用的。通过检查主矩阵,例如可推断出需要多少解码器模块、它们如何连接、各具有多少输入和输出通道、以及与各模块的输入和输出相关的矩阵系数。这些系数可从主矩阵取得;除非输入通道也是输出通道(即,端点),否则仅需要非零值。每个模块优选地具有“局部”矩阵,其是主矩阵的可应用于特定模块的部分。在如图IA和2的例子的多模块布置的情况下,模块可为了产生如下文结合图2、2’以及4A 4C 描述的用于控制主矩阵的缩放因子(或矩阵系数)或者为了产生输出信号的子集而使用局部矩阵,该输出信号由中心处理器(诸如结合图2和2’描述的监控器)组合。在后一种情况下,这种监控器以这样的方式补偿具有公共输出信号的模块所产生的相同输出信号的多个版本,该方式类似于图2和2’的监控器201确定最终缩放因子以替换由对于相同输出通道产生初步缩放因子的模块产生的初步缩放因子。在产生除输出信号之外的缩放因子的多个模块的情况下,这样的模块可经由监控器从主矩阵连续获得与自身有关的矩阵信息,而不是具有局部矩阵。但是,如果模块具有其自身的局部矩阵,则需要较少的计算开销。在单个、孤立模块的情况下,该模块具有局部矩阵,其是唯一需要的矩阵(实际上,该局部矩阵是主矩阵),并且局部矩阵被用于产生输出信号。除非另外指示,否则参照模块产生缩放因子的替换方案描述本发明的具有多个模块的实施例。在模块的局部矩阵中仅具有一个非零系数(系数为1. 0,由于系数的平方和为 1. 0)的任何解码模块输出通道是端点通道。具有一个以上的非零系数的输出通道是内部输出通道。考虑一个简单的示例。如果输出通道01和02两者被从输入通道Il和输出通道 12导出(但是具有不同的系数值),然后尤其需要在Il和12之间连接的用于产生输出01 和02的二输入模块。在更复杂的情况下,如果存在5个输入和16个输出,并且一个解码器模块具有输入Il和12并且馈送输出01和02,则01 = AI1+BI2+0I3+0I4+0I5(应注意,输入通道13、14或15没有贡献),以及02 = CI1+DI2+0I3+0I4+0I5(应注意,输入通道13、14或15没有贡献)然后,解码器可具有两个输入(II和12),两个输出、以及使它们相关的缩放因子为01 = AI1+BI2,禾口02 = CI1+DI2.在单个、孤立模块的情况下,主矩阵或局部矩阵可具有用于提供不只乘法的功能的矩阵元素。例如,如上所述,矩阵元素可包括过滤器函数(例如相位或延迟项)和/或作为频率的函数的过滤器。可应用的过滤的一个示例是可呈现幻觉投影图像的纯延迟的矩阵。实际上,这样的主矩阵或局部矩阵可例如被分成两个功能,一个采用导出系数来导出输出通道,并且第二个应用过滤器功能。图2是提供实施图IA的例子的多频带变换实施例的概观的功能框图。图2’是提供实施图IB的例子的多频带变换实施例的概观的功能框图。其与图2的不同之处在于图2的模块中的若干个模块(即,模块29-34)接收不同的输入集合(这样的模块由数字 29’-34指示;图2’还具有附加模块、模块35’)。除了在一些模块输入中的区别之外,,图 2和2’相同,并且相应的元件使用相同的附图标记。在图2和2’两者中,例如具有多个交织音频信号通道的PCM音频输入被施加到包括去交织器的监控器或监控函数201 (下文“监控器201”),该去交织器恢复由被交织的输入承载的六个音频信号通道(1’,3’,5’,9’,13’ 和23’)中的每一个的分离流,并且将每一个应用于时域_频域变换或变换函数(下文“前馈变换”)。可替换地,音频通道可被在分离流中接收,在此情况下不需要去交织器。如上所述,根据本发明的信号转换可应用于宽带信号,或应用于多频带处理器中的每个频带,该多频带处理器可采用滤波器组(例如离散临界频带滤波器组或具有与相关联的解码器相容的频带结构的滤波器组),或变换配置(诸如FFT(快速傅立叶变换)或 MDCT (修改的离散余弦变换)线性滤波器)。图2、2’、4A 4C以及其它附图在多频带变换配置的上下文中被描述。图1A、1B、2、2’以及其它附图中为了简化而未示出的是可选的LFE输入通道(图 IA和2中的潜在第七输入通道,以及图IB和2’中的潜在第六输入通道)和输出通道(图 IA和2中的潜在第24个输出通道)。LFE通道通常可以与其它输入和输出通道相同的方式、但是以固定为“1”的其自身的缩放因子以及也固定为“1”的其自身的矩阵系数,被处理。在源通道不具有LFE但是输出通道具有LFE (例如,2. 5 1上混合)的情况下,可使用应用于通道的和的低通滤波器(例如,转折频率为120Hz的五阶Butterworth滤波器)导出LFE通道,或者为了避免通道相加时消除,可采用通道的相位相关的和。在输入具有LFE 通道但是输出没有的情况下,可将LFE通道添加到输出通道的一个或多个中。
继续图2和2,的描述,模块24-34(图2,中的24-28以及29”至35,)以图IA 和IB所示的方式接收六个输入1’,3’,5’,9’,13’以及23’中的合适的输入。每个模块产生如图IA和IB中所示对于与其相关联的音频输出通道中的每个被输出的初步缩放因子 (“PSF”)。因此,例如,模块24接收输入1,和3,,并且产生初步缩放因子输出PSF1、PSF2 和PSF3。可替换地,如上所述,每个模块可对于与其相关联的音频输出通道中的每一个产生初步的一组音频输出。如下文进一步描述的,每个模块还可与监控器201通信。如果有的话,从监控器201向各个模块发送的信息可包括邻居等级信息以及高等级的邻居等级信息。从各模块发送到监控器的信息可包括可归因于模块的输入中的每一个的输出内部的总估计能量。模块可被认为是图2和2’的整体系统的控制信号产生部的一部分。诸如图2和2’的监控器201的监控器可执行多种不同的功能。监控器可例如确定是否多于一个的模块在使用,并且如果否,则监控器不需要执行与邻居等级有关的任何功能。在初始化期间,监控器可告知该模块或各模块其具有的输入和输出的数量、使它们相关的矩阵系数以及信号的采样率。如已经提及的,可读取交织PCM样本的块并且将它们去交织为分离通道。其可例如响应于指示源信号被限制幅值以及限制程度的附加信息,应用时域中的非限制操作。如果系统以多频带模式操作,则其可将开窗法和滤波器组(例如, FFT、MDCT等)应用于每个通道(从而多个模块不执行显著增加处理开销的冗余变换),并且将变换值的流传递至每个模块以便处理。每个模块向监控器传递回缩放因子的二维阵列一个缩放因子用于各输出通道的各子频带中的所有变换分段(当在多频带变换配置中时,否则,每个输出通道一个缩放因子),或者可替换地,输出信号的二维阵列用于每个输出通道的各子频带的复变换分段的全体(ensemble)(当在多频带变换配置中时,否则,每个输出通道一个输出信号)。监控器可平滑化缩放因子,并且将它们应用于信号路径矩阵化(矩阵203,下文所述)以获得(在多频带变换配置中)输出通道复谱。可替换地,当模块产生输出信号时,监控器可导出输出通道(在多频带变换配置中,输出通道复谱),补偿产生相同输出信号的局部矩阵。然后可对于每个输出通道执行逆变换加上开窗和叠加(在 MDCT的情况下),将输出样品交织以形成复合多通道输出流(或可选地,可省略交织以便提供多个输出流),并且将其发送到输出文件、声卡或其它最终目的地。尽管各种功能可如文中所述地由一个监控器执行或者由多个监控器,本领域普通技术人员将认识到,这些功能中的不同的一个或全部可在模块自身中执行而不是由全部或一些模块共用的监控器执行。例如,如果仅存在单个、孤立模块,在模块功能和监控器功能之间不需要区分。尽管在多模块的情况下,公共监控器可通过消除或减少冗余处理任务减少所需要的总处理功率,但是公共监控器的消除或其的简化允许模块容易地彼此相加,例如以升级到更多的输入通道。返回图2和2 ’的描述,六个输入1’、3 ’、5 ’、9 ’、13 ’和23 ’还被应用于可变矩阵或可变矩阵化函数203 (下文“矩阵203”)。矩阵203可被认为是图2和2’的系统的信号路径的一部分。矩阵203还作为输入从监控器201接收用于图IA和IB例子的23个输出通道中的每一个的最终缩放因子SFl到SF23的集合。最终缩放因子可被认为作为图2和2’ 的系统的控制信号部的输出。如下文进一步描述的,监控器201优选地作为对于该矩阵的最终缩放因子传递用于每个“内部”输出通道的初步缩放因子,但是监控器响应于其从模块接收到的信息确定用于每个端点输出通道的最终缩放因子。“内部”输出通道在每个模块的两个或更多个“端点”输出通道中间。可替换地,如果模块产生输出信号而不是缩放因子, 则不需要矩阵203 ;监控器本身产生输出信号。在图IA和IB例子中,假设端点输出通道与输入通道地点重合,但是如另外进一步描述地,它们不必须重合。因此,输出通道2、4、6-8、10-12、14-16、17、18、19、20、21和22 是内部输出通道。内部输出通道21在三个输入通道(输入通道9’、13’和23’)中间或者被它们支撑(bracket),而其他内部通道均在两个输入通道中间(或被它们支撑)。由于对于在模块之间或之中被共享的这些端点输出通道(即,输出通道1、3、5、9、13和23)存在多个初步缩放因子,监控器20从缩放因子SFl到SF23之中确定最终端点缩放因子(SF1、SF3 等)。最终内部输出缩放因子(SF2、SF4、SF6等)与初步缩放因子相同。图IA和2的布置的缺陷为多个输入源通道被映射到6. 1通道(5. 1通道加上顶部抬高通道),呈现与现有5. 1通道水平平面阵列系统(诸如Dolby Digital胶片声带中或者在 DVD 上使用的那些(“Dolby,,和"Dolby Digital ” 是 Dolby Laboratories Licensing Corporation的商标))不相容的下混合。如上所述,一种将抬高的通道映射到水平平面阵列的方式是将它们中的每一个映射到两个以上的输入通道。例如,允许图IB离子的24个原始源通道被映射到常规5. 1通道阵列(见下文表A,其中附图标记1至23指的是图IB中的方向)。在这样的变型中,多个两个以上输入模块(图IB中未示出)可提取“距离变化的”面内(在由标准5. 1通道阵列建立的收听区域外部或内部)或面外(高于该平面——“抬高的”或者低于该通道—— “降低的”)通道,并且剩余信号分量可由二输入模块处理以提取水平通道。“距离变化的” 通道可被馈送给放置在房间内部的实际扬声器以提供可变距离呈现;以及可被投影到收听空间的内部或外部作为虚拟内部或外部通道。垂直或顶部信号分量可通过例如映射到水平的五通道阵列的全部五个通道来被呈现。因此,5. 1声道下混合可通过常规5. 1通道解码器播放,而根据图IB和2B的例子的解码器可恢复对于原始24个通道的近似或者一些其它所希望的输出通道配置。因此,根据图IB和2’的例子的替换方案以及如表A所示,每个标准水平源通道被映射到5. 1通道下混合的一个或两个下混合通道,而其他源通道均被映射到5. 1通道下混合的两个以上的通道。因此,对于图IA和IB例子的23. 1通道源布置,各个通道可被如下地映射
权利要求
1.一种用于将M个音频输入通道转换至N个音频输出通道的方法,所述M个音频输入通道中的每一个与一空间方向相关联,所述N个音频输出通道中的每一个与一空间方向相关联,其中M和N全部是正整数,M是3或更大,并且N是3或更大,所述方法包括从所述M个音频输入通道导出所述N个音频输出通道,其中所述M个音频输入通道中的一个或多个与不同于与所述N个音频输出通道中的任一个相关联的空间方向的空间方向相关联,所述M个音频输入通道中的所述一个或多个中的至少一个被映射到所述N个输出通道中的至少三个输出通道的对应集合。
2.根据权利要求1所述的方法,其中,所述至少三个输出通道的集合与连续空间方向相关联。
3.根据权利要求1所述的方法,其中,N是5或更大,并且所述导出将所述M个音频输入通道中的所述一个或多个中的所述至少一个映射到所述N个输出通道中的三个、四个或五个输出通道的对应集合。
4.根据权利要求3所述的方法,其中,所述N个输出通道中的至少三个、四个或五个输出通道的集合与连续空间方向相关联。
5.根据权利要求1-4中任一个所述的方法,其中M至少为6,N至少为5,并且所述M个音频输入通道分别和与和N个音频输出通道相关联的五个空间方向对应的五个空间方向、 以及不与所述N个音频输出通道相关联的至少一个空间方向相关联。
6.根据权利要求1-5中任一个所述的方法,其中所述N个音频输出通道中的每一个与公共平面中的空间方向相关联。
7.根据权利要求6所述的方法,其中,所述M个音频输入通道的相关联空间方向中的至少一个位于与所述N个音频输出通道相关联的平面上方或者位于所述平面下方。
8.根据权利要求6或7所述的方法,其中,所述M个音频输入通道的相关联空间方向中的至少一些相对于基准空间方向而距离改变。
9.根据权利要求1-8中任一个所述的方法,其中,与N个音频输出通道相关联的空间方向包括左、中心、右、左环绕和右环绕。
10.根据权利要求9所述的方法,其中,与M个音频输入通道相关联的空间方向包括左、 中心、右、左环绕、右环绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中心环绕和抬高的右环绕。
11.根据权利要求10所述的方法,其中,与M个音频输入通道相关联的空间方向进一步包括抬高的顶部。
12.一种包括适于执行根据权利要求1-11中任一个所述的方法的所有步骤的装置的设备。
13.一种计算机程序,所述计算机程序存储在计算机可读介质上,用于使得计算机执行根据权利要求1-11中任一个所述的方法。
14.一种用于将N个音频输入通道转换至M个音频输出通道的方法,所述N个音频输入通道中的每一个与一空间方向相关联,所述M个音频输出通道中的每一个与一空间方向相关联,其中M和N全部是正整数,N是3或更大,并且M是1或更大,所述方法包括从所述N个音频输入通道导出所述M个音频输出通道,其中所述M个音频输出通道中的一个或多个与不同于与所述N个音频输入通道中的任一个相关联的空间方向的空间方向相关联,所述M个音频输出通道中的所述一个或多个中的至少一个被从所述N个输入通道中的至少三个输入通道的对应集合导出。
15.根据权利要求14所述的方法,其中,至少部分地通过近似所述N个输入通道中的至少三个输入通道的互相关性,从所述N个输入通道中的所述至少三个输入通道的对应集合导出所述M个音频输出通道中的所述一个或多个中的至少一个。
16.根据权利要求15所述的方法,其中,近似所述互相关性包括计算所述N个输入通道中的所述至少三个输入通道中的每一对的公共能量。
17.根据权利要求16所述的方法,其中,任何所述对的公共能量具有最小值。
18.根据权利要求16或17所述的方法,其中,导出的M个音频输出通道 的幅值基于所述N个输入通道中的所述至少三个输入通道的任一对的公共能量的最低估计幅值。
19.根据从属于权利要求16的权利要求18所述的方法,其中,当所述N个输入通道中的所述至少三个输入通道的任一对的公共能量为零时,导出的M个音频输出通道的幅值被取为零。
20.根据权利要求15-19中任一个所述的方法,其中,从共享N个输入通道中的公共对的各组N个输入通道导出多个被导出的M个音频输出通道,其中计算公共能量包括补偿N 个输入通道的被共享的公共对的公共能量。
21.根据权利要求20所述的方法,其中,所述近似包括按层级顺序处理多个被导出的 M个音频通道,使得每个导出的音频通道根据从中导出该音频通道的输入通道的数量分级, 最大的输入通道的数量具有最高的等级,该近似根据多个被导出的M个音频通道的层级顺序依次处理所述多个被导出的M个音频通道。
22.根据权利要求21的方法,其中,计算公共能量进一步包括补偿与具有较高层级等级的被导出的音频通道有关的N个输入通道的被共享的公共对的公共能量。
23.根据权利要求14-22中任一个所述的方法,其中,所述N个输入通道中的至少三个输入通道的集合与连续空间方向相关联。
24.根据权利要求14-22中任一个所述的方法,其中,N是5或更大,并且所述导出将所述M个音频输入通道中的所述一个或多个中的所述至少一个映射到所述N个输入通道中的三个、四个或五个输入通道的对应集合。
25.根据权利要求24所述的方法,其中,所述N个输入通道中的至少三个、四个或五个输入通道的集合与连续空间方向相关联。
26.根据权利要求14-25中任一个所述的方法,其中M至少为6,N为5,并且至少六个输出音频输入通道分别和与和N个音频输入通道相关联的五个空间方向相对应的五个空间方向、以及不与所述N个音频输入通道相关联的至少一个空间方向相关联。
27.根据权利要求14-27中任一个所述的方法,其中所述N个音频输入通道中的每一个与公共平面中的空间方向相关联。
28.根据权利要求27所述的方法,其中,所述M个音频输入通道的相关联空间方向中的至少一个位于与所述N个音频输出通道相关联的平面上方或者位于所述平面下方。
29.根据权利要求27或28所述的方法,其中,所述M个音频输入通道的相关联空间方向中的至少一些相对于基准空间方向而距离改变。
30.根据权利要求14-29中任一个所述的方法,其中,与所述N个音频输出通道相关联的空间方向包括左、中心、右、左环绕和右环绕。
31.根据权利要求30所述的方法,其中,与所述M个音频输出通道相关联的空间方向包括左、中心、右、左环绕、右环绕、抬高的左前部、抬高的中前部、抬高的右前部、抬高的左环绕、抬高的中心环绕和抬高的右环绕。
32.根据权利要求31所述的方法,其中,与N个音频输入通道相关联的空间方向进一步包括抬高的顶部。
33.一种包括适于执行根据权利要求14-32中任一个所述的方法的所有步骤的装置的设备。
34.一种计算机程序,所述计算机程序存储在计算机可读介质上, 用于使得计算机执行根据权利要求14-32中任一个所述的方法。
全文摘要
从M个音频输入通道导出N个音频输出通道,所述M个音频输入通道被转换至所述N个音频输出通道,所述M个音频输入通道中的每一个与一空间方向相关联,所述N个音频输出通道中的每一个与一空间方向相关联,其中M和N全部是正整数,M是3或更大,并且N是3或更大。其中,所述M个音频输入通道中的一个或多个与不同于与所述N个音频输出通道中的任一个相关联的空间方向的空间方向相关联,并且所述M个音频输入通道中的所述一个或多个中的至少一个被映射到所述N个输出通道中的至少三个输出通道的对应集合。所述至少三个输出通道的集合与连续空间方向相关联。
文档编号H04S3/02GK102273233SQ200980151223
公开日2011年12月7日 申请日期2009年12月16日 优先权日2008年12月18日
发明者M·F·戴维斯 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1