分解音频信号的制作方法_2

文档序号:9580340阅读:来源:国知局
(3)
[0043] 江节^、~州、~卞,服;^4^〇%刀^、卜川、」丨~的位置来确定时域中的地位统计。 大的位置统计值指示该成分的大部分是扩散的。
[0044] 备选地,通过计算成分在当前时间的位置与该成分的重心位置之间的平方欧式距 离或者余弦距离来确定位置统计。重心位置可以通过在一段时间内对该成分的位置求平均 来估计。重心位置还可以被估计为使得重心位置与不同时间的位置之间的距离和在一段时 间内最小。应当注意,可以使用任何其他方式来估计重心位置,并且本发明的范围在此不受 限制。
[0045] 根据本发明的实施例,所确定的重心位置的准确度可能受执行统计的时间段影 响。例如,如果该时间段过长,则统计可能跨不同音频信号源而执行,并且得到的重心位置 可能不太准确。在一个实施例中,为了进一步增加所确定的重心位置的准确度,可以检测不 同音频信号源之间的顺变,并且可以在顺变发生之后对重心位置进行重置。
[0046] 如上所述,也可以在频域执行统计。通常而言,直达成分的位置在多个声道中跨子 频带比较一致,而扩散成分的位置跨子频带比较多变。因此,成分在频域中的位置统计可以 指示该成分的方向性和扩散性。根据本发明的实施例,成分在频域中的位置统计可以由该 成分在多个声道中的位置跨子频带的变化来表示。
[0047] 在一个实施例中,频域中的位置统计可以通过比较成分在不同子频带中的位置来 确定。具体方式类似于通过比较成分在不同时间的位置来确定时域中的位置统计的方式, 因此为了简洁的目的将省略具体说明。
[0048] 在另一实施例中,可以跨全频带估计重心位置,并且可以通过计算成分在子频带 中的位置与成分在全频带中的重心位置之间的距离来确定位置统计。
[0049] 例如,假设单位向
r表示成分C1>f在子频带f中在Μ个声道中的位置, 其中f= 1,...,F代表子频带索引,并且F代表子频带的总数目。为了简洁的目的,在其他 地方除非特别指出省略了脚标f。可以利用如单位向:
I示的F个位置来估计重心 位]
U使得重心位置与所有子频带中的位置之间的距离和最小。在一个实施例中, 该距离可以是平方欧式距离或余弦距离。
[0050] 备选地,可以通过对成分在全频带中的位置求平询来估计重心位置。可以通过成 分(;,f在个体子频带的位置距其重心位置的距萬,来 指示成分的扩散性。
[0051] 出于示例的目的,以上描述了仅使用一个重心位置的示例。在输入音频信号复杂, 例如包括多个直达信号的情况下,可以估计多个重心位置。在这种情况下,可以计算距这些 重心位置的距离,并且选择最小距离作为统计目标。
[0052] 除了成分在多个声道中的位置统计之外,描述该成分的时间和/或频谱特性的音 频纹理特征也可以反映该成分的方向性和扩散性特性。在另一实施例中,特定于一个成分 的局部特征可以包括该成分的音频纹理特征,比如过零率、梅尔频率倒谱系数(MFCC)、诸如 频谱平坦度的子频带频谱分布、频谱波峰、频谱通量、频谱峰值等。
[0053] 如上所述,在从输入音频信号获得一组弱相关成分之后,除了特定于一个成分的 局部特征,还可以提取与整组成分有关的全局特征。通常而言,具有最大功率的成分包含最 主要的直达信号还有在空间上与最主要的信号一致的较不主要的信号和扩散信号的一部 分。当直达信号在空间上彼此一致时,具有较小功率的成分可能是扩散信号。当直达信号 在空间上不一致时,具有较小功率的成分可能包含另一直达信号以及在空间上与该直达信 号一致的扩散信号的一部分。因此,成分的功率分布可以指示音频信号的方向性和扩散性。
[0054] 在一个实施例中,可以基于成分的功率分布来提取全局特征。根据本发明的实施 例,功率分布可以在时域、在全频带或在子频带中确定。
[0055] 基于功率分布的全局特征可以包括例如成分的功率之间的差。通常而言,如果一 个成分包含具有最大功率的最主要的直达信号,则其与另一成分的功率差将大于两个扩散 成分之间的功率差。因此,功率差越大,该成分越有可能包含主要直达信号。
[0056] 如
良示成分的归一化功率,则可以例如如 等式(4)中将每两个相邻成分的功率之差计算为:
[0057] -t -j. - t
[0058] 备选地或附加地,可以计算功率差之和
其指示音频信号中的直 达号是多还是少。
[0059] 如果将改组成分视为具有Μ个结果的随机变量,则可以将归一化功率 …々M]视为每个结果的概率。则可以如在等式(5)中将成分的熵计算为:
[0060:
(5)
[0061] 以上计算的熵可以指示跨成分的功率分布有多平坦。如果熵较大,则跨成分的功 率分布可能较平坦。其指示方向性可能不是主要的。因此,除了成分的功率之间的差之外, 全局特征还可以包括基于成分的归一化功率计算的熵。
[0062] 如以上参照图1所述,用于分解音频信号的过程可以在时域执行。备选地,可以将 音频信号转换到频域,使得可以在全频带或子频带对该信号施加分解。与全频带或时域过 程相比,子频带过程更精细并且更细致,其可以按子频带展现主要成分。如果直达信号在子 频带中较稀疏,则更可能通过子频带过程将检测的直达信号作为所考虑的子频带中的主要 直达信号。因此,通过子频带过程在个体子频带中获得的较主要成分之间的功率和位置与 通过全频带过程或者时域过程获得的较主要成分的功率和位置之差可以指示输入音频信 号中的直达信号的数目,例如一个或多个直达信号。
[0063] 举例而言,假设单位向I 表示子频带f中的较主要的成分C1>f的位置,成分 Ci,f是通过子频带过程获得的成分中具有较大功率的成分,并且ACl<f表示其功率;单位向
I示较主要的成分的位置,成分亡1是通过全频带过程或时域过程获得的成分中 具有较大功率的成分,并且表示其功率。全局特征可以包括如以下给出的特征△λ知AD:
[0065] 在某些实施例中,该成分可以是通过子频带过程或者通过全频带过程或时域过程 获得的成分中具有最大功率的最主要的成分。
[0066] 如果Δ λ和AD很小,则输入音频信号很可能仅包括一个直达信号。如果Δ λ 和AD很大,则输入音频信号可能包括多于一个直达信号。
[0067] 备选地或附加地,除了如上所述的局部和全局特征本身之外,还可以使用这些特 征的运动平均和/或运动方差作为代表性特征。
[0068] 仍然参考方法200,在步骤S203,至少部分地基于在步骤S202提取的特征来确定 与该组弱相关成分相关联的一组增益。根据本发明的实施例,每个增益指示相关联的成分 的扩散部分的比例。因为一个成分是由直达和/或扩散部分组成的,所以指示相关联的成 分的扩散部分的比例的增益也可以指示该成分的直达部分的比例。换言之,增益可以指示 相关联的成分有多大部分是直达的或者扩散的。
[0069] 如上所述,归因于成分之间的弱相关性,从成分中提取的特征更能代表音频信号 的方向性和扩散性特性,因此给予该特征确定的增益可以更准确。
[0070] 根据本发明的实施例,可以使用局部特征和全局特征中的至少一个作为用于确定 增益的因子。针对一个成分的增益例如利用通过成倍增加以及按比例缩放该因子来确定。
[0071] 为了改善保真度,可以对所确定的增益应用平滑处理。例如,可以通过对在不同时 间或者不同子频带确定的增益求平均来对与成分相关联的增益进行平滑。
[0072] 附加地,可以对所确定的增益应用重新初始化处理。例如,当检测到不同音频信号 源之间的瞬变时,可以执行初始化,以避免跨不同音频信号源所确定的增益进行过平滑,以 使得可以进一步提高所确定的增益的准确性。
[0073]然后,方法200继续道步骤S204,其中通过将该组增益应用到该组成分来分解来 自至少两个不同声道的多个音频信号。
[0074] 根据本发明的实施例,音频信号的分解过程是对成分以及相关联的增益进行的逆 变换操作。例如,假设行向量$di//use代表通过分解得到的Μ个扩散信号,并代表与成分
[Q ... CM]相关联的增益。每个增益对应于一个成分。以被计算如下:
[0075]
[0076] 应当注意,如上讨论的对扩散信号的确定仅出于说明目的,还可以应用根据本发 明的实施例的分解方法来确定音频信号中的直达信号。
[0077] 利用方法200,可以根据基于输入音频信号生成的弱相关的信号成分对输入音频 信号的方向性和扩散性特性进行比较准确的分析,并且因此对音频信号的直达-扩散分解 可以比较准确,并且进而可以创建更具沉浸感的声场。
[0078] 图3和图4示出了用于确定与弱相关成分相关联的增益的某些示例实施例,这些 实施例可以在图1中的框102处实施。
[0079] 图3示出了根据本发明的一个实施例的用于确定增益的方法300的流程图。
[0080] 通常而言,在来自多个声道的音频信号中,可以包括来自一个或多个直达声音源 的一个或多个直达信号。音频信号中包括的直达信号越多,该音频信号的方向性越复杂。
[0081] 根据本发明的实施例,音频信号可以属于以下情形之一 :(1)音频信号仅包括扩 散信号;(2)音频信号除了扩散信号之外还包括一个直达信号;(3)音频信号除了扩散信号 之外还包括多个直达信号。
[0082] 相应地,在情形(1)中,所有成分可能主要对音频信号的扩散性做出贡献;而在情 形(2)和(3)中,最主要的成分可能对音频信号的扩散性做贡献。由于情形(2)和(3)中 的直达信号的数目不同,居中的主要成分可能或者对音频信号的方向性或者对音频信号的 扩散性做贡献。具体而言,在情形(2)中,居中的主要成分可能对扩散性做出较大贡献,而 在情形(3)中,居中的主要成分可能对方向性做出较大贡献。根据本发明的实施例,可以基 于例如指示音频信号术语那种情形的音频信号的复杂度来调整增益。
[0083] 如图3所示,在步骤S301,可以确定多个音频信号的复杂度以指示该多个音频信 号中的直达信号的数目。
[0084] 在一个实施例中,可以使用硬判决来确定音频信号的复杂度。也就是说,确定音频 信号属于以上情形之一。在另一实施例中,可以使用软判决来确定音频信号属于一种情形 的概率。例如可以使用值为0到1的得分来表示音频信号与一种情形之间的匹配程度。 [0085]如以上参考图2所述,通过子频带过程在个体子频带中获得的最主要的成分与通 过全频带过程或者时域过程获得的最主要成分的功率和位置之差可以指示输
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1