基于多声道音频内容分析的上混检测的制作方法_3

文档序号：8386000阅读：来源：国知局

或多个统计模型的输入声道的概率。所计算的概率提供可测量的精确的：（1)对生成给定输入内容的特定上混器的识别，或者（2)输入内容的特定实例通过某一上混器被上混的检测。
[0044] 示例的基于阶次分析的特征提取处理
[0045] 为了创建多声道内容，上混器从立体声内容估计直达信号分量和周围环境信号分量。一般来说，可以根据下面的式1描述从立体声推导多声道内容的上混器。
[0046] y = Ax (1)
[0047] 在式1中，变量"x"表示2X1列矢量，其表示来自输入的L和R立体声声道的信号分量。系数"A"表示NX 2矩阵，其将这两个输入信号分量路由到总数为"N"（其大于2) 个的输出声道。乘积"y"包括NXl输出列矢量，其表示上混器的N个输出声道的信号分量。乘积y包括X中的两个独立信号的线性组合。因此，乘积 y的内在阶次不超过二（2)。
[0048] 图2A描绘了根据本发明的实施例的基于阶次分析的特征检测的示例处理200的流程图。从y的协方差矩阵估计y的阶次使得可以确定N输出声道信号是否具有低阶次。例如，音频内容的"块"或时间部分可以是在该时间部分的持续时间上被采样的。音频内容块可被以诸如每秒48, 000个采样的特定采样速率进行离散采样。具有10秒持续时间的音频内容块因此对应于〇1111111^_161^1：11'1/ = (1〇8)*(4883115)168/8)= 48,000 个米样，由此可以估计其协方差矩阵。在从协方差矩阵计算阶次估计之前，按时间对齐H个上混器输出声道中的信号，并且对Ls和Rs环绕声道上的去相关器进行逆操作。
[0049] 在步骤201中，在时间上对齐输出y中的信号以去除有时可能被引入到前（例如， L、C和R)声道与环绕（例如，Ls和Rs)声道之间的时间延迟。例如，Dolby Prologic?和一些其他上混器在环绕声道Ls和Rs与前声道L、C和R之间引入大约IOms的延迟。实施例用于在计算阶次估计之前去除这些延迟。
[0050] 在步骤202中，对环绕声道Ls和Rs上的去相关器进行逆操作以使得在它们之间可以存在去相关器差异。例如，Dolby Broadcast Upmixer?对于声道Ls使用第一去相关器，对于声道Rs使用与第一去相关器不同的第二去相关器。实施例应用Ls第一去相关器的逆函数和Rs第二去相关器的逆函数来将在计算阶次估计之前每个环绕声道的去相关器之间的差异考虑在内。
[0051] 在步骤203中，计算总和，该总和确定协方差矩阵的元素。实施例计算总和来根据下面的式2确定协方差矩阵的第"（i，j) "元素"Cov(i，j) "。
[0052] Cov (i，j) = I/ (chunk_length) 2 k- (yik- y J (yjk- y J (2)
[0053] 在式2中，变量y JP y」分别表示来自声道"i"和声道"j"的采样值的均值，"k" 表示块的从1至最大chunk_length的部分的持续时间的范围：k = 1，2,…，chunk_length。
[0054]在步骤204中，计算归一化的协方差矩阵Covn=(l/max_cov)* (Cov)，其中，"max_ cov"表示NXN协方差矩阵中的最大值。
[0055] 在步骤205中，计算该NXN Cov1^g阵的特征值e e2~eN。
[0056] 在步骤206中，实施例根据下面的式3计算阶次估计特征。
[0057] rank_estimate = IoglO [ (1/N-2) (2 kek) / (1/2 (ejej) ] ? (3)
[0058] 在式3中，"k"的范围为k = 3,4,…，N。分子"（l/N-2)(2k ek)"表示从3开始至 N的特征值中的平均能量的测量。分母l/2(ei+e 2)表示头2个重要特征值上的平均能量的测量。对于等于2的阶次，比率（l/N-2)(2k ekV(l/2(ei+e2))等于0。对于该比率大于0 的值指示阶次大于2。
[0059] 图2B描绘了基于本发明的实施例的示例实现的阶次估计的第一比较250。分布 251绘制了对于像这样创建的（因此不是从立体声内容上混的）离散5. 1内容（例如，5. 1 内容的原始实例）的示例阶次估计。分布252绘制了对于使用Dolby PrologicIItm(PLIItm) 从立体声内容上混的5. 1内容的示例阶次估计，Dolby PrologicIItm在集中于"音乐"的操作模式下对源立体声内容进行处理。比较250显示出，PLII?上混的5. 1内容在多于99% 的IOs内容块上包括接近于0的阶次估计值。相反，比较250显示出，离散5. 1内容阶次估计对于大约50%的IOs内容块包括超过2的值。实施例使用所计算的阶次估计特征来区别具有不同性质或特性的上混器和/或检测特定去相关器在上混期间的使用。
[0060] 例如，实施例使用rank_estimate特征来区别具有宽带操作特性的第一上混器（诸如Dolby Prologic?上混器）与具有多带操作特性的第二上混器（诸如Dolby Broadcast Upmixer?)。在表征宽带上混器（比如，Prologic?)时，变量y和X在以上式 l(y = Ax)中包括时域采样。相反，多带上混器（比如，Broadcast Upmixer?)用变量y和 X表征，变量y和X在式1中都包括子带能量，并且其中的混合矩阵系数A可以在不同子带上变化。
[0061] 实施例用于通过如下处理来区别宽带上混器与多带上混器，该处理计算并且比较与每个上混器相关联的阶次估计。从由时域采样估计的协方差矩阵计算一阶估计（rank_ estimate_l)。从由子带能量值估计的协方差矩阵计算二阶估计（rank_estimate_2)。用对于rank_estimate_l计算的、匹配、等于或接近地逼近对于rank_estimate_2计算的值的值来检测宽带上混。相反，用对于rank_estimate_l计算的、超过对于rank_estimate_2计算的值的值和/或对于rank_estimate_2计算的、更接近地近似或逼近值零（0)(其对应于阶次2)的值来检测多带上混。
[0062] 另举一例，实施例通过使用rank_estimate特征检测在上混期间在环绕声道Ls和 Rs上使用的特定去相关器。诸如Dolby Broadcast Upmixer?的一些上混器在左环绕Ls信号和右环绕Rs信号中的每个上使用一对匹配的、互补的或补充的去相关器以提供更扩散的声场。因此，对于基于从时域采样估计的协方差矩阵的rank_estimate_l，阶次估计将超过2,这是因为去相关的环绕声道Ls和Rs未被考虑在内。
[0063] 实施例使用"正确的"去相关器（即，在上混期间使用的去相关器）对环绕声道Ls 和Rs中的每个执行逆去相关。因此，基于经逆去相关的声道Ls和Rs的时域采样计算阶次估计，这实现了更接近地逼近值2的阶次估计。实施例因此通过下述步骤检测或识别在环绕声道Ls和Rs上使用的特定的去相关器：
[0064] ?基于从时域采样估计的协方差矩阵计算rank_estimate_l ;
[0065] ?对左环绕声道Ls和右环绕声道Rs执行逆去相关处理；和
[0066] ?基于在逆去相关之后从时域采样估计的协方差矩阵计算rank_estimate_2。
[0067] 如果右声道Rs去相关器用于逆去相关，则rank_estimate_l的值超过rank_ estimate_2的值。然而，如果在上混期间不对环绕声道应用去相关，则rank_estimate_2超过 rank_estimate_l〇
[0068] 图2C描绘了基于本发明的实施例的示例实现的阶次估计的第二比较275。分布 276绘制了在执行逆去相关之前关于Dolby Broadcast Upmixer?的rank_estimate_l的分布。分布277绘制了在执行逆去相关之后关于同一上混器的rank_estimate_2的分布。
[0069] 示例信号泄漏分析处理
[0070

完整全部详细技术资料下载

当前第3页1 2 3 4 5