音频通道空间转换的制作方法_2

文档序号:8514910阅读:来源:国知局
对 电平W及(2)输入信号的互相关性的度量而被控制。在该情况下,对于具有在由最大值和 基准值限定边界的第一范围中的值的输入信号的互相关性的度量,声场可在所述互相关性 的度量为所述最大值时具有紧凑声音图像,并且可在所述互相关性的度量为所述基准值时 具有宽扩散的图像,并且对于具有在由所述基准值和最小值限定边界的第二范围中的值的 输入信号的互相关性的度量,声场可在所述互相关性的度量为所述基准值时具有宽扩散的 图像,并且可在所述互相关性的度量为所述最小值时具有多个紧凑声音图像,所述多个紧 凑声音图像中的每一个位于与一输入图像相关联的方向上。
[0027] 根据本发明的其他方面的另外方面,一种用于将M个音频输入信号转换至N个音 频输出信号的方法,所述M个音频输入信号中的每一个与一方向相关联,所述N个音频输出 信号中的每一个与一方向相关联,其中N大于M,M为3或更大,该方法包括提供多个m:n可 变矩阵,其中m是M的子集并且n是N的子集,给所述多个可变矩阵中的每一个施加所述M 个音频输入信号的对应子集,从所述多个可变矩阵中的每一个导出所述N个音频输出信号 的对应子集,响应于被施加给所述多个可变矩阵中的每一个的所述输入信号的子集控制该 可变矩阵,W使得当被施加给该可变矩阵的所述输入信号的子集高度相关时由从该可变矩 阵导出的输出信号的对应子集产生的声场在所述输入信号的所述子集的标称前进主方向 上具有紧凑声音图像,该图像随着相关性降低而从紧凑向宽扩散,并且随着相关性继续降 低至高度不相关而逐渐拆分成多个紧凑声音图像,所述多个紧凑声音图像中的每一个位于 与被施加给该可变矩阵的一输入图像相关联的方向上,并且从N个音频输出通道的子集导 出所述N个音频输出信号。
[0028] 根据本发明的其他方面的此另外方面,可变矩阵还可响应于补偿接收相同输入信 号的一个或多个其他可变矩阵的影响的信息被控制。此外,从N个音频输出通道的子集导 出所述N个音频输出信号还可包括补偿产生相同输出信号的多个可变矩阵。根据本发明的 其他方面的该样的另外方面,多个可变矩阵中的每一个可响应于(a)被施加到该可变矩阵 的输入信号的相对电平W及化)输入信号的互相关性的度量而被控制。
[0029] 根据本发明的其他方面的还另外方面,一种用于将M个音频输入信号转换至N个 音频输出信号的方法,所述M个音频输入信号中的每一个与一方向相关联,所述N个音频 输出信号中的每一个与一方向相关联,其中N大于M,并且M为3或更大,该方法包括提供 响应于控制矩阵系数或控制矩阵输出的缩放因子的M:N可变矩阵,将所述M个音频输入信 号施加到所述可变矩阵,提供多个m:n可变矩阵缩放因子生成器,其中m是M的子集并且n 是N的子集,向所述多个可变矩阵缩放因子生成器中的每一个施加所述M个音频输入信号 的对应子集,从所述多个可变矩阵缩放因子生成器中的每一个导出用于所述N个音频输出 信号的对应子集的可变矩阵缩放因子的集合,响应于被施加给所述多个可变矩阵缩放因子 生成器中的每一个的输入信号的子集控制该可变矩阵缩放因子生成器,使得当由该可变矩 阵缩放因子生成器生成的缩放因子被施加给所述M:N可变矩阵时,由所产生的输出信号的 相应子集生成的声场在产生所述被施加的缩放因子的所述输入信号的子集高度相关时在 所述输入信号的所述子集的标称前进主方向上具有紧凑声音图像,该图像随着相关性降低 而从紧凑向宽扩散,并且随着相关性继续降低至高度不相关而逐渐拆分成多个紧凑声音图 像,所述多个紧凑声音图像中的每一个位于与产生被施加的缩放因子的一输入图像相关联 的方向上,并且从所述可变矩阵导出所述N个音频输出图像。
[0030] 根据本发明的其他方面的此还另外方面,可变矩阵缩放因子生成器还可响应于补 偿接收相同输入信号的一个或多个其他可变矩阵缩放因子生成器的影响的信息被控制。此 夕F,从所述可变矩阵导出所述N个音频输出信号可包括补偿产生用于相同输出信号的缩放 因子的多个可变矩阵缩放因子生成器。根据本发明的其他方面的该样的另外方面,多个可 变矩阵缩放因子生成器中的每一个可响应于(a)被施加到该可变矩阵缩放因子生成器的 输入信号的相对电平W及化)输入信号的互相关性的度量而被控制。
[0031] 如文中使用的,"通道"是代表从一方向(考虑到较近或较远的虚拟或投影通道,例 如方位角、高度W及可选地距离)到达的音频或者与其相关联的单个音频流。
[0032] 根据本发明,代表声场的M个音频输入通道被转换成代表同一声场的N个音频输 出通道,其中每一通道是代表从一方向到达的音频的单个音频流,M和N都是正整数,并且M 至少为2并且N至少为3,并且N大于M。生成输入通道的一个或多个集合,每个集合具有 一个或多个输出通道。每个集合通常与两个或更多个空间相邻输入通道相关联,并且通过 确定该两个或更多个输入通道的相关性的度量W及该两个或更多个输入通道的电平相互 关系的度量,来生成一集合中的每个输出通道。互相关性的度量优选地是零时间偏移互相 关性的度量,其是公共能量电平与输入信号能量电平的几何平均值的比。公共能量电平优 选地是被平滑化或平均化的公共能量电平,并且输入信号能量电平是被平滑化的或被平均 化的输入信号能量电平。
[0033] 在本发明的一个方面,输出通道的多个集合可与多于两个的输入通道相关联,并 且一种处理可根据层级顺序确定与输出通道的每个集合相关联的输入通道的相关性,使得 每个集合或多个集合根据与其的输出通道或多个输出通道相关联的输入通道的数量被分 级,最大的输入通道的数量具有最高的等级,并且该处理根据多个集合的层级顺序依次处 理所述多个集合。此外,根据本发明的一个方面,该处理考虑了处理更高阶集合的结果。
[0034] 本发明的某些重放或解码方面假设代表从一方面给到达的音频的M个音频输入 通道中的每一个由每个源方向(即,源方向被假定主要映射到最近的一个或多个输入通 道)的被动矩阵最近邻居幅值扫调编码生成,而不需要附加的侧链信息(侧链或辅助信息 的使用是可选的),使得其可与现有混合技术、控制台和格式相容。尽管该样的源信号可 通过明确采用被动编码矩阵来生成,但是大多数常规记录技术本质上可生成该样的源信号 (因此,构成"有效编码矩阵")。本发明的某些重放或解码方面还与诸如可通过5个真实 方向麦克风得到的自然记录源信号大大相容,该是因为考虑到一些可能的延时,从中间方 向到达的声音趋向于主要映射到最近的麦克风(在水平阵列中,具体映射到最近的麦克风 对)。
[0035] 根据本发明的各方面的解码器或解码处理可被实现为禪合的处理模块或模块化 函数(下文"模块"或"解码模块")的网格,每一解码模块被用于典型地由与解码模块相关 联的最近空间邻近输入通道中的两个或更多个通道,生成一个或多个输出通道(或者可替 换地,控制可用于生成一个或多个输出通道的信号)。输出通道典型地代表在与特定解码模 块相关联的最近空间邻近输入通道中的音频信号的相对比例。如下文更详细解释的,解码 模块在模块共享输入的意义上相互松散地禪合,并且存在解码模块的层级体系。模块被根 据与它们相关联的输入通道的数量分层级地排序(具有最高数量的相关联输入通道的一 个或多个模块的等级最高)。监控器或监控函数管理模块,W使得公共输入信号在模块之间 或之中被相等地共享,并且较高等级的解码器模块可可影响较低等级的模块。
[0036] 每个解码器模块可实际上包括矩阵,从而其可直接生成输出信号,或者每个解码 器模块可生成控制信号,该控制信号与由其它解码器模块生成的控制信号一起被用于改变 可变矩阵的系数或者固定矩阵的输入或者输出的缩放因子,W便生成所有输出信号。
[0037] 解码器模块模拟人耳的工作W尝试提供听觉明晰的再现。解码器模块和模块函数 作为其的一个方面的根据本发明的信号转换可被应用于宽带信号,或者被应用于多频带处 理器的各频带,并且依赖于实现,可每个样本执行一次或者样本的每个块执行一次。多频带 实施例可采用滤波器组,诸如离散临界带滤波器组或具有与相关联解码器相容的频带结构 的滤波器组,或变换配置,诸如FFT(快速傅立叶变换)或MDCT(修改的离散余弦变换)线 性滤波器组。
[0038] 本发明的另一方面是接收N个输出通道的扬声器的量可通过对虚拟成像的明智 依赖被减小至合乎实际的量,该虚拟成像是在空间中的除扬声器所在位置之外的位置处产 生被感觉到的声音图像。尽管虚拟成像的最普遍使用是在两个扬声器之间的图像的立体声 再现中,但是,通过在通道之间扫调单声道信号,如作为本发明的一个方面被设想的虚拟成 像可包括幻觉投影图像的呈现,其提供了超出房间的墙壁之外或者在房间的墙壁内部的听 觉引向。虚拟成像不被认为是用于具有稀疏数量的通道的成组表现的可行技术,因为其需 要收听者距两个扬声器等距或基本等距。例如,在电影院中,左前部和右前部扬声器间隔过 远W至于不能使得大部分观众获得中央图像的有用幻觉成像,因此考虑到中屯、通道作为大 部分对话的来源的重要性,作为替代,使用物理中屯、扬声器。
[0039] 因为扬声器的密度增加,对于大部分观众,至少在扫调平滑的程度上,在任何扬声 器对之间的虚拟成像可行的点将被达到;通过足够的扬声器,扬声器之间的间隙因而不再 被察觉到。
[0040] 信号分布
[0041] 如上所述,互相关性的度量确定模块中的主导(公共信号分量)与非主导(非公 共信号分量)能量的比,W及模块的输出通道之中的非主导信号分量的扩散程度。可通过 考虑对于二输入模块的情况在不同条件下对于模块的输出通道的信号分布,更好地理解该 一点。除非另外指出,文中所阐述的原理直接延伸到较高等级的模块。
[0042] 信号分布所遇到的问题是常常存在过少的信息W至于不能恢复原信号幅值分布, 该信息远少于信号本身。可利用的基本信息是在各模块输入处的信号电平W及被平均化的 输入信号的交叉乘积、公共能量电平。零时间偏移互相关性是公共能量电平相对于输入信 号能量电平的几何平均值的比。
[0043] 互相关性的重要性在于其用作所有输入共用的信号的净幅值的度量。如果存在被 扫调至模块的输入之间的任何地方的单个信号("内部"和"中间"信号),所有输入将具有 相同波形(虽然可能具有不同幅值),并且在该些条件下,相关性将为1.0。在另一个极端 情况,如果所有输入信号都是独立的,该意味着不存在公共信号分量,相关性将为0。在0和 1. 0中间的相关性的值可被认为对应于在输入处的一些单个的、公共信号分量和独立信号 分量
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1