用于在多声道音频格式之间进行转换的方法和设备的制作方法

文档序号:2831748阅读:442来源:国知局
专利名称:用于在多声道音频格式之间进行转换的方法和设备的制作方法
技术领域
本发明涉及一种关于如何以最大可能的质量在不同的多声道音频格式之间 进行转换的技术,而不限于特定的多声道表示。即本发明涉及一种允许在任意 多声道格式之间进行转换的技术。
背景技术
通常,在多声道再现和收听中,收听者被多个扬声器环绕。存在捕获针对
特定设置(set-up)的音频信号的各种方法。再现时的一个通常目标是再现原始 记录的声音事件的空间合成,即各个音频源的源点(origin),如管弦乐队内喇 叭的位置。多个扬声器设置是相当常见的,并且可以产生不同的空间感。不使 用特殊的后生产技术,通常己知的两声道立体声设置可以仅在两个扬声器之间 的线上重建听觉事件。这主要通过所谓的"振幅-移动(panning)"来实现,其中 取决于音频源相对于扬声器的位置,与一个音频源相关的信号的振幅分布在两 个扬声器之间。这通常在记录或后续的混音期间进行。即来自相对于收听位置 较远左侧的音频源将主要通过左扬声器再现,而在收听位置前面的音频源将通 过这两个扬声器以相同的振幅(电平)再现。然而,不能再现从其他方向发出 的声音。
因此,通过使用分布在收听者周围的更多扬声器,可以覆盖更多方向,并 且可以产生更加自然的空间感。可能最公知的多声道扬声器布局是5.1标准 (ITU-R775-1),其包括5个扬声器,将这些扬声器相对于收听位置的方位角预 先确定为0°、 ±30°和±110°。这表示在记录或混音期间,将信'号调整为特定扬 声器配置,而且根据该标准的再现设置的偏差将导致再现质量降低。
也提出了具有位于不同方向上的不同数目的扬声器的多个其他系统。专业 和专用系统(尤其在影院和声音装置中)也包括不同高度的扬声器。
近年来提出了被称为DirAC的通用音频再现系统,其能够记录并再现针对
5任意扬声器设置的声音。DirAC的目的是使用具有任意几何设置的多声道扬声 器系统,尽可能精确地再现现有声学环境的空间感。在记录环境中,以全向麦 克风(W)和允许测量声音到达方向以及声音扩散的麦克风组来测量环境的响 应(可以是连续记录的声音或脉冲响应)。在以下段落中以及在本申请中,术语 "扩散"应被理解为针对声音的非方向性测量。即,以相等的强度从所有方向 到达收听或记录位置的声音是最大扩散的。量化扩散的通常方式是使用来自区 间
的扩散值,其中,值l埤述了最大扩散声音,而值O描述了理想定向 声音,即仅从一个可清晰辨识的方向发出的声音。 一个通常已知的测量声音到 达的方向的方法是应用与笛卡尔坐标轴对齐的3个八字(figure-of-eight)麦克 风(XYZ)。已设计出被称作"声场麦克风"的专用麦克风,该麦克风直接产生 所有期望的响应。然而,如以上所提及的,W、 X、 Y和Z信号也可以根据离 散全向麦克风组进行计算。
近来,Goodwin和Jot提出了利用伴随的方向数据,将任意多个声道的音 频格式存储至音频的一个或两个下混音声道的方法。该格式可以应用于任意的 再现系统。使用"Gerzon矢量(包括速度矢量和能量矢量)"来计算定向数据(即, 具有与音频源的方向有关的信息的数据)。速度矢量是从收听位置指向扬声器的 矢量的加权和,其中每个权重是扬声器的给定时间/频率瓦(tile)处的频谱的幅 值。能量矢量是类似的加权矢量和。然而,权重是扬声器信号的短时能量估计, 即其描述了稍微平滑的信号或包含在有限长度时间间隔内的信号中的信号能量 的积分。具有充分根据的是,这些矢量共有的缺点是与实际的或感知的量不相 关。例如,没有适当地考虑扬声器相对于彼此的相对相位。例如,这表示,如 果将宽带信号馈入相反相位的收听位置之前的立体声设置的扬声器,则收听者 将感知到来自周围方向的声音,收听位置中的声场将具有从一侧到另一侧(例 如,从左侧到右侧)的声音能量振荡。在这种场景下,Gerzon矢量将会指向前 方,显然这并不表示实际的或感知的情况。 .
自然地,市场上存在多个多声道格式或表示,存在能够在不同表示之间转 换的需求,从而可以利用最初针对可选的多声道表示而开发的设置来再现各个
6表示。即例如,可能需要5.1声道与7.1或7.2声道之间的转换,以使用现有的 7.1或7.2声道回放设置来回放通常在DVD上使用的5.1多声道表示。多种音频 格式使音频内容生产变得困难,因为所有格式需要特定的混频和存储/传输格 式。因此,用于不同再现设置上的回放的不同记录格式之间的转换是必需的。
提出了多种方法将特定音频格式的音频转换为另一音频格式。然而,总是 将这些方法调整为特定多声道格式或表示。即这些仅可应用于从一个特定的预 定多声道表示至另一特定的多声道表示的转换。
通常,再现声道数量的减少(所谓"下混音(downmix)")比再现声道数 量的增加("上混音(upmix)")更易实现。针对一些标准的扬声器再现设置, 例如ITU提供了关于如何使用较少个数的再现声道下混音至再现设置的推荐。 在这些所谓的"ITU"下混音等式中,将输出信号导出为输入信号的简单静态线 性组合。通常,再现声道数量的减少导致所感知的空间图像的恶化,即空间音 频信号的再现质量发生恶化。
为了从大量再现声道或再现扬声器中可能的获益,开发出用于特定类型转 换的上混音技术。通常研究的问题是如何转换2声道立体声音频以使用5声道 环绕扬声器系统进行再现。这种2至5上混音的一种方式或实现是使用所谓的 "矩阵"解码器。这种解码器普遍用于通过立体声传输结构(特别是早期的用 于电影和家庭影院的环绕声音)来提供或上混音5.1多声道声音。基本思想是 再现声音图像前的立体声信号中同相的声音分量,并将异相分量置入后扬声器。 可选的2至5上混音方法提出提取立体声信号的环境分量并经由5.1设置的后 扬声器再现这些分量。近来,C. Faller在"Parametric Multi-channel Audio Coding: Synthesis of Coherence Cues", IEEE Trans. On Speech and Audio Proc.vol.14, no.l,2006年1月中提出了遵循在更加合理的基础上使用数学上更好的实现的相 同基本思想的方式。
近来公开的标准MPEG环绕执行从一个或两个下混音和传输的声道至用于 再现或回放的最终声道(通常是5.1)的上混音。这通过使用空间边信息(side information)(与BCC技术类似的边信息)或没有边信息,或通过使用立体声下混音的两声道之间的相位关系("非引导模式"或"增强矩阵模式")来实现。 在前面的段落中描述的用于格式转换的所有方法特别应用于源和目的地音 频再现格式的特定配置,因而并不通用。即,不能执行任意的输入多声道表示 至任意的输出多声道表示的转换。.即,现有的转换技术专门针对输入多声道音 频表示和输出多声道表示而关于扬声器数量及其精确位置做出调整。
自然地,期望有一种针对可应用于输入和输出多声道表示的任意组合的多 声道转换的概念。

发明内容
根据本发明的一实施例, 一种用于将空间音频信号的输入多声道表示转换 为不同的输出多声道表示的设备包括分析器,用于导出空间音频信号的中间 表示,所述中间表示具有指示空间音频信号的部分的源点方向的方向参数;以 及信号编排器(composer),用于使用空间音频信号的中间表示来产生空间音频 信号的输出多声道表示。 .
其中使用中间表示,该中间表示具有指示空间音频信号的部分的源点方向 的方向参数,只要已知输出多声道表示的扬声器配置,便可以实现任意的多声 道表示之间的转换。重要的是,注意不必提前(即在转换设备的设计期间)知 道输出多声道表示的扬声器配置。由于转换设备和方法是通用的,所以可以在 接收侧改变提供作为输入多声道表示并针对特定扬声器设置而设计的多声道表 示,以适合可用的再现设置,从而增强空间音频信号再现的再现质量。
根据本发明的另一实施例,在不同频带内分析空间音频信号的部分的源点 方向。这样,针对空间音频信号的有限宽度频率部分,导出不同的方向参数。 例如,为了导出有限宽度频率部分,可以使用滤波器组或傅立叶变换。根据另 一实施例,选择针对其分别执行分析的频率部分或频带,以匹配人类听觉处理
的频率分辨率。这些实施例可以具有以下优点与人类听觉系统本身可以确定
音频信号的源点方向一样好地执行空间音频信号的部分的源点方向。因此,当 重构这种被分析的信号并经由任意扬声器设置回放时,所执行的分析在确定音 频对象或信号部分的源点的过程中不存在潜在的精度损失。根据本发明的另一实施例,另外导出属于中间表示的一个或更多个下混音 声道。g卩,从与和输入多声道表示相关联的扬声器相对应的音频声道中导出下 混音声道,然后将该下混声道用于产生输出多声道表示或用于产生与和输出多 声道表示相关联的扬声器相对应的音频声道。
例如,可以从普通5.1声道音频信号的5.1输入声道中产生单声道下混音声 道。例如,这可以通过计算所有单独音频声道之和来执行。基于这个导出的单 声道下混音声道,信号编排器可以将与所分析的输入多声道表示的部分相对应 的单声道下混音声道的该部分分发给由方向参数指示的输出多声道表示的声 道。即,将所分析的来自空间音频信号较远左侧的频率/时间或信号部分重新分 发给输出多声道表示的扬声器,该扬声器位于相对于收听位置的左侧。
通常,本发明的一些实施例允许以如下方式来分发空间音频信号的部分 针对与更靠近所述方向参数所指示的方向的扬声器相对应的声道,以及更远离 该方向的声道,前者的信号分发强度大于后者的信号分发强度。即无论在输出 多声道表示中如何定义用于再现的扬声器的位置,也会尽可能好地实现适合可 用的再现设置的空间重新分发。'
根据本发明的一些实施例,可以利用其确定空间音频信号的部分的源点方 向的空间分辨率比与输入多声道表示的单个扬声器相关联的三维空间角大得 多。即,可以利用比通过将音频声道简单地从一个独特的设置重新分发至另一
特定设置(如通过将5.1设置的声道重新分发给7.1或7.2设置)而实现的空间分 辨率更高的精度来导出空间音频信号的部分的源点方向。
总之,本发明的一些实施例允许用于格式转换的增强方法的应用,该方法 是通用的,并且不依赖于特定的期望目标扬声器布局/配置。 一些实施例通过提 取方向参数(与DirAC类似),然后将该参数用于合成具有N2个声道的输出信号, 而把具有N1个声道的输入多声道音频格式(表示)转换为具有N2个声道的输出 多声道格式(表示)。此外,根据一些实施例,根据N1个输入信号(与根据输 入多声道表示的扬声器相对应的音频声道)计算NO个下混音声道,然后将该N0 个下混音声道用作使用所提取的方向参数进行解码处理的基础。


以下将参照附图对本发明的多个实施例进行描述。
图1示出了导出指示了音频信号的部分的源点方向的方向参数的图示; 图2示出了基于5. 1声道表示而导出方向参数的另一实施例; 图3示出了产生输出多声道表示的示例;
图4示出了从5. 1声道设置到8. 1声道设置的音频转换的示例; 图5示出了用于多声道音频格式之间的转换的本发明的设备示例。
具体实施例方式
本发明的一些实施例导出了空间音频信号的中间表示,所述空间音频信号 具有指示空间音频信号的部分的源点方向的方向参数。 一种可能是导出指示空 间音频信号的部分的源点方向的速度矢量。将参照图l,在以下段落中描述这样 实施的一实施例。
在细述概念之前,应注意,可以将以下分析同时应用于下层(underlying) 空间音频信号的多个单独的频率或时间部分。然而为了简单起见,将仅针对一 特定频率或时间或时间/频率部分来描述该分析。该分析基于在位于坐标系中心 的记录位置2处记录的声场的能量分析,如图1所示。
该坐标系是笛卡尔坐标系,具有彼此垂直的x轴4和y轴6。使用右手系,图l 中未示出的z轴指向从绘图平面伸出的方向。 -
针对方向分析,假设记录了4个信号(被称为B格式信号)。记录一个全向 信号w,即以(理想状态)相等的灵敏度接收来自所有方向的信号的信号。此 外,记录三个方向信号X、 Y和Z,它们具有沿笛卡尔坐标系的轴向指示的灵敏 度分布。图l中给出了所使用的麦克风的可能的灵敏度图案的示例,示出了两个 "八字"图案8a和8b,指向轴向。另外在图l所示坐标系的二维投影中示出了两 个可能的音频源10和12。
对于方向分析,通过(1)式,针对不同频率部分(由索引i来描述)编排 瞬时速度矢量(在时间索引n处)。
v(n,i)=X(n,i) ex +Y(n,i) ey +Z(n,i) ez (1)艮口,所产生的矢量具有与坐标系轴相关联的麦克风的单独记录的麦克风信
号作为分量。在上文和下文的等式中,通过两个索引(n,i)以时间(n)和频率 (i)对量进行索引化。艮口
ex, ey和^表示笛卡尔单位矢量。
使用同时记录的全向信号w,将瞬时强度I计算为
I(n,i) =w(n,i)v(n,i) (2)
根据以下公式导出瞬时能量
E(n,i"wV,i)+llvl卩(n,i) (3)
其中|| ll表示矢量范数。
艮口,导出允许两个信号间的可能干扰的强度量(由于可能出现正和负的振 幅)。另外,导出能量,该能量自然不允许两个信号间的干扰,因为能量不包含 允许信号抵消的负值。 .
有利地,可以使用强度和能量信号的这些特性来导出具有高精度的信号部 分的源点方向,如以下将要解释的,保留音频声道的虚拟(virtual)相关(声道 间的相对相位)。
一方面,可以将瞬时强度矢量用作指示空间音频信号的部分的源点方向的 矢量。然而,该矢量可能经受快速改变,因而在信号再现中产生伪信号(artifact)。 因此可选地,可以根据以下公式,使用利用汉宁窗(Hanning window) W^勺短 时平均来计算瞬时方向
其中,'W2是用于短时平均D的汉宁窗。
即可选地,可以导出具有指示空间音频信号的源点方向的参数的短时平均 方向矢量。
可选地,可以如下计算扩散测量值K其中,Wi(m)是在-M/2与M/2之间定义的用于短时平均的窗函数。
应再次注意,如此执行导出,从而保留音频声道的虚拟相关。即适当考虑 相位信息,这并不是针对仅基于能量估计的方向估计的情况(例如Gerzon矢量)。 以下简单示例将用于对此进行更加详细的解释。考虑通过立体声系统的两 个扬声器回放的理想扩散信号。因.为信号是扩散的(源自所有方向),所以通过 两个扬声器以相等的强度进行回放。然而,因为感知应是扩散的,所以需要180 度的捐移。在这种场景下,单纯基于能量的方向估计将产生恰好指向两个扬声 器之间的中点位置的方向矢量,这必定是未反映现实的不期望的结果。
根据上述本发明的概念,保留音频声道的虚拟相关,同时估计方向参数(方 向矢量)。在该特定示例中,方向矢量将会是零,指示声音并不源自一个独特的 方向,很清楚这不是现实中的情况。相应地,等式(5)的扩散参数是l,理想 地匹配了真实情况。
此外,以上等式中的汉宁窗可针对不同频带具有不同长度。 作为该分析的结果,针对频率部分的每个时间片,导出指示空间音频信号 的部分的源点方向的方向矢量或方向参数,针对所述方向矢量或方向参数执行 分析。可选地,可以导出指示空间音频信号的部分的方向扩散的扩散参数。如 上所述,根据等式(4)导出的扩散值描述了最大扩散信号,即以相等强度源自 所有方向的信号。
相反,小扩散值属于主要源自一个方向的信号部分。
图2示出了根据ITU-775-l,从具有五个声道的输入多声道表示中导出方向 参数的示例。首先,通过仿真相应多声道音频设置的无回声记录,将多声道输 入音频信号(即,输入多声道表示)变换为B格式。相对于具有x轴22和y轴24 的笛卡尔坐标系的中心20,右后侧(RR)的扬声器26位于11(T角处。右前侧 (RF)扬声器28位于+30° ,中心扬声器位于O。,左前侧(LF)扬声器32位于 -31° ,而左后侧(LR)扬声器34位于-110° 。实践中,可以通过应用简单的矩 阵化操作来仿真无回声记录,输入多声道表示的几何设置是已知的。
可以通过采用对所有扬声器信号(即同与输入多声道表示相关联的扬声器
12相对应的所有音频声道)的直接求和来获得全向信号W。通过把由扬声器和相 应笛卡尔轴之间夹角的余弦而加权的扬声器信号相加,即要仿真的偶极子麦克
风的最大灵敏度方向,可以形成偶极子或"八字"信号X、 Y和Z。令Ln是指向 第n扬声器的2维或3维笛卡尔矢量,以及V是指向与偶极子麦克风相对应的笛卡 尔轴向的单位矢量。这样,加权因子是cos(angle(Ln,V))。例如,可以将方向信
号X写作
<formula>formula see original document page 13</formula>
其中Cn表示第n声道的扬声器信号,N是声道数。术语夹角必须解释为操作符, 计算两个给定矢量之间的空间夹角。也就是说,例如在图2所示的二维情况下的 Y轴24和左前侧扬声器32之间的夹角40 (e)。
例如,可以如图l所示并如相应描述来执行方向参数的其他导出,g卩,音频 信号X、 Y和Z可以根据人类听觉系统的频率分辨率来分为多个频带。依据每个 频率声道中的时间,对声音的方向(即空间音频信号的部分的源点方向)以及 (可选的)扩散进行分析。可选地,也可以使用不同于扩散的信号相异性的另 一测量来替换声音扩散,例如与空间音频信号相关联的(立体声)声道之间的 相干性。 .
作为简化的例子,如果如图2所指示存在一个音频源44,其中该源仅对特定 频带内的信号有贡献,则将导出指向该音频源44的方向矢量46。通过指示源自 音频源44的空间音频信号的部分的方向的方向参数(矢量分量)来表示方向矢 量。在图2的再现设置中,该信号将主要通过如由与该扬声器相关联的符号波形 所示的左前侧的扬声器32来再现。然而,也将从左后侧扬声器32对较小信号部 分进行回放。因此,与X坐标22相关联的麦克风的方向信号将从左前侧声道32 (与左前侧扬声器32相关联的音频声道)和左后侧声道34接收信号分量。
根据上述实施方式,与y轴相关联的方向信号Y也将接收由左前侧扬声器32 所回放的信号部分,基于方向信号X和Y的方向分析将能够以高精度重构来自方 向矢量46的声音。为了最终转换为期望的多声道表示(多声道格式),使用指示音频信号的部 分的源点方向的方向参数。可选地,可以使用一个或更多个(NO)附加音频下
混音声道。例如,该下混音声道可以是全向声道w或任何其^lr单声道。然而,
针对空间分布,仅使用与中间表示相关联的单个声道具有小的负面影响。艮卩, 只要导出方向参数或方向数据,并且可以将它们用于重构或产生输出多声道表
示,便可以使用诸如立体声混频之类的若干个下混音声道、声道W、 X和Y或B 格式的所有声道。可选地,也可以直接使用图2中的5个声道或与输入多声道表 示相关联的声道的任意组合,作为可能的下混音声道的替换。当仅存储一个声 道时,可能在扩散声音的再现中出现质量恶化。
图3示出了使用明显不同于图2的扬声器设置来再现音频源44的信号的示 例,图2的扬声器设置是从中导出参数的输入多声道表示。作为示例,图3示出 了沿收听位置(LP) 60前的直线同等分布的六个扬声器50a至50f,如图2所介绍 的,该收听位置60定义了具有x轴22和y轴24的坐标系的中心。由于前面的分析 提供了描述指向音频信号源44的方向矢量46的方向的方向参数,所以可以容易 地通过把要再现的空间音频信号的部分重新分发到靠近音频源44方向的扬声 器,即通过靠近那些由方向参数所指方向的扬声器,来导出适于图3的扬声器设 置的输出多声道表示。即,相对于与远离方向参数所指示的方向的扬声器相对 应的音频声道,强化与该方向的辯声器相对应的音频声道。即,可以操作扬声 器50a和50b (例如使用振幅移动)以再现信号部分,扬声器50c至50f不会再现 该特定信号部分,而是可以将它们用于再现扩散声音或具有不同频带的其他信 号部分。
使用利用方向参数来产生空间音频信号的输出多声道表示的信号编排器, 也可以被解释为将中间信号解码为具有N2个输出声道的期望的多声道输出格 式。典型地,在与分析所产生的音频下混音声道或信号所在的相同频带中对该 音频下混音声道或信号进行处理。可以按照与DirAC类似的方式执行解码。在 可选的扩散声音的再现中,典型地,用于表示非扩散流的音频是可选的NO个下 混音声道信号之一或其线性组合。'针对可选的扩散流创建,存在若干个综合选项,以根据输出多声道表示来 创建与扬声器相对应的输出信号或输出声道的扩散部分。如果仅存在一个下混 音声道的传输,则必须使用该声道来为每个扬声器创建非扩散信号。如果存在 更多声道的传输,则存在如何创建扩散声音的更多选项。例如,如果在转换过 程中使用立体声下混音,则明显合适的方法是将左下混音声道应用至左侧的扬 声器,.并将右下混音声道应用至右侧的扬声器。如果使用若干下混音声道进行 转换(即,N0>1),则可以将每个扬声器的扩散流计算为这些下混音声道的不
同加权的和。例如, 一种可能可以是传输B格式信号(如先前所描述的声道X、 Y、 Z和W)并计算每个扬声器的虚拟心形麦克风信号的信号。
下文以列表描述了将输入多声道表示转换为输出多声道表示的可能过程。 在本示例中,以仿真的B格式麦克风来记录声音,然后由信号编排器进行进一步 处理,以便以多声道或单声道扬声器设置进行收听或回放。参照示出5.1声道输 入多声道表示至8声道输出多声道表示的转换的图4来解释单个步骤。基础是N1 声道音频格式(Nl在特定示例中是5)。为了将输入多声道表示转换为不同的输 出多声道表示,可执行以下步骤。
1. 如在记录部分70中所示出的,仿真具有N1个音频声道(5个声道)的任 意多声道音频表示的无回声记录(使用布局中心72处的仿真的B格式麦克风)。
2. 在分析步骤74中,仿真的麦克风信号被分至频带,并在方向分析步骤76 中,导出仿真的麦克风信号的部分的源点方向。此外可选地,可以在扩散终止 步骤78中确定扩散(或相干性)。
如先前所提及的,可以不使用B格式中间步骤来执行方向分析。即,通常 必须基于输入多声道表示来导出空间音频信号的中间表示,其中,该中间表示 具有指示空间音频信号的部分的源点方向的方向参数。
3. 在下混音步骤80中,导出NO个下混音音频信号,用作输出多声道表示的 转换/创建的基础。在合成步骤82中,对NO个下混音音频信号进行解码或通过适 合的综合方法(例如,使用振幅移动或等同的适合技术)上混音至需要N2个音 频声道的任意扬声器设置。
15可以通过多声道扬声器系统(例如,具有在图4的回放场景84中指示的8个 扬声器)再现该结果。然而,由于概念的通用性,也可以针对单声道扬声器设
置执行转换,提供了仿佛以一个单方向麦克风记录空间音频信号的效果。
图5示出了用于在多声道音频格式之间转换的设备100的示例的原理草图。 设备100用于接收输入多声道表示(representation) 102。 设备100包括用于导出空间音f页信号的中间表示106的分析器104,中间表示 106具有指示空间音频信号的部分的源点方向的方向参数。
此外,设备100包括信号编排器108,用于使用空间音频信号的中间表示 (106)产生空间音频信号的输出多声道表示110。
总之,先前描述的转换设备和转换方法的实施例提供了一些优点。首先, 实际上可以以这种方式对任何输入音频格式进行处理。此外,转换过程可以产 生针对任何扬声器布局(包括非标准扬声器布局/配置)的输出,而不需要针对 输入扬声器布局/配置和输出扬声器布局/配置的新组合特别调整新的关系。此 外,音频再现的空间分辨率在扬声器数量增加时增加,这与现有实现相反。
依据本发明方法的特定实现rf求,可以以硬件或软件来实现本发明的方法。 可以使用与可编程计算机系统协作从而执行本发明方法的数字存储介质(尤其 是其上存储有电可读控制信号的盘、DVD或CD)来执行该实现。因而通常本发 明是具有存储在机器可读载体上的程序代码的计算机程序产品,该程序代码操 作用于当计算机程序产品运行在计算机上时执行本发明的方法。换言之,因而 本发明的方法是具有程序代码的计算机程序,用于当计算机程序在计算机上运 行时执行本发明方法中的至少一种。
尽管已经参照特定实施例特别示出并描述了以上内容,但是本领域技术人 员将会理解,可以在不偏离本发明的精神和范围的情况下做出形式和细节上的 各种其他改变。应理解,可以在适合于不同实施例的过程中做出各种改变,而 不会偏离这里所公开的、并由所附权利要求所限定的更宽的概念。
权利要求
1、一种用于将空间音频信号的输入多声道表示转换为不同的输出多声道表示的设备,包括分析器,用于导出空间音频信号的中间表示,所述中间表示具有指示空间音频信号的部分的源点方向的方向参数;以及信号编排器,用于使用空间音频信号的所述中间表示来产生空间音频信号的输出多声道表示。
2、 如权利要求1所述的设备,其中所述分析器操作用于依据与所述输入多声道 表示相关联的音频声道的虚拟相关来导出方向参数。
3、 如权利要求l所述的设备,其中所述分析器操作用于导出保留了与所述输入 多声道表示相关联的音频声道的相对相位信息的方向参数。
4、 如权利要求l所述的设备,其中所述分析器操作用于导出针对空间音频信号 的有限宽度频率部分的不同的方向参数。
5、 如权利要求l所述的设备,其中所述分析器操作用于导出针对空间音频信号 的有限长度时间部分的不同的方向参数。 '
6、 如权利要求4所述的设备,其中所述分析器操作用于导出针对与频率部分相 关联的空间音频信号的有限长度时间部分的不同的方向参数,其中与空间音频 信号的第一频率部分相关联的第一时间部分的长度不同于与空间音频信号的第 二不同频率部分相关联的第二时间部分的长度。
7、 如权利要求l所述的设备,其中所述分析器操作用于导出方向参数,所述方 向参数描述指向空间音频信号的部分的源点方向的矢量。
8、 如权利要求l所述的设备,其中所述分析器还操作用于导出与中间表示相关 联的一个或更多个音频声道。
9、 如权利要求8所述的设备,其中所述分析器操作用于导出与和输入多声道表 示相关联的扬声器相对应的音频声道。
10、 如权利要求8所述的设备,其中所述分析器操作用于导出一个下混音声道,作为与和输入多声道表示相关联的扬声器相对应的音频声道之和。
11、 如权利要求8所述的设备,其中所述分析器操作用于导出与笛卡尔坐标系 的轴向相关联的至少一个音频声道。
12、 如权利要求ll所述的设备,其中所述分析器操作用于导出至少一个音频声 道,所述至少一个音频声道构建了与和输入多声道表示相关联的扬声器相对应 的音频声道的加权和。
13、 如权利要求11所述的设备,其中操作所述分析器,使得能够根据以下公式, 通过与和输入多声道表示相关联、并指向方向"的所有n个扬声器相对应的n 个音频声道a的组合,来导出与笛卡尔坐标系的轴向V相关联的至少一个音频声道X:<formula>formula see original document page 3</formula>
14、 如权利要求1所述的设备,其中所述分析器还操作用于导出扩散参数,所 述扩散参数指示空间音频信号的部分的源点方向的扩散。
15、 如权利要求1所述的设备,其中所述信号编排器操作用于将空间音频信号 的部分分发到与和输出多声道表示相关联的多个扬声器相对应的多个声道。
16、 如权利要求15所述的设备,其中操作所述信号编排器,使得以如下方式来 分发空间音频信号的部分针对与更靠近所述方向参数所指示的方向的扬声器 相对应的声道,其信号分发强度大于与和更远离该方向的扬声器相对应的声道 的信号分发强度。
17、 如权利要求14所述的设备,其中操作所述信号编排器,使得在所述扩散参 数指示较高扩散时,与所述扩散参数指示较低扩散时相比较,以更加均匀的强 度向与和所述输出多声道表示相关联的扬声器相对应的声道分发空间音频信号 的部分。
18、 如权利要求l所述的设备,还包括输入接口,用于接收输入多声道表示。
19、 如权利要求l所述的设备,还包括输入表示解码器,用于导出与和输入多声道表示相关联的所有扬声器相对 应的多个音频声道。
20、 如权利要求15所述的设备,其中所述信号编排器还包括输出声道编码器, 所述输出声道编码器用于基于与和输出声道表示相关联的扬声器相对应的音频 声道,导出输出多声道表示。
21、 如权利要求l所述的设备,还包括用于提供输出多声道表示的输出接口。
22、 一种用于将空间音频信号的输入多声道表示转换为不同的输出多声道表示的方法,所述方法包括导出空间音频信号的中间表示,所述中间表示具有指示空间音频信号的部分的源点方向的方向参数;以及使用空间音频信号的中间表示来产生空间音频信号的输出多声道表示。
23、 一种计算机程序,用于在计算机上运行时,实现用于将空间音频信号的输 入多声道表示转换为不同的输出多声道表示的方法,所述方法包括导出空间音频信号的中间表示,所述中间表示具有指示空间音频信号的部 分的源点方向的方向参数;以及使用空间音频信号的中间表示来产生空间音频信号的输出多声道表示。
全文摘要
将空间音频信号的输入多声道表示转换为不同的输出多声道表示,其中导出空间音频信号的中间表示,所述中间表示具有指示空间音频信号的部分的源点方向的方向参数;以及使用空间音频信号的中间表示来产生空间音频信号的输出多声道表示。
文档编号G10L19/00GK101669167SQ200880009025
公开日2010年3月10日 申请日期2008年2月1日 优先权日2007年3月21日
发明者J·赫尔, V·普尔基 申请人:弗劳恩霍夫应用研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1