音频信号处理的制作方法

文档序号:10536414阅读:394来源:国知局
音频信号处理的制作方法
【专利摘要】本发明的实施方式涉及音频信号处理。具体而言,公开了一种用于处理时域音频信号的方法。该方法包括对所述时域音频信号进行滤波,以获得时域滤波信号。该方法还包括将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。还公开了相应的系统和计算机程序产品。
【专利说明】
音频信号处理
技术领域
[0001] 本发明总体上涉及音频信号处理,更具体地,涉及用于处理时域音频信号的方法 和系统。
【背景技术】
[0002] 为了对音频信号进行增强处理或者查看音频信号的特定频带的特性,通常需要首 先将该音频信号的频率分成多个频带。然后,利用各种音频增强算法,例如动态均衡、响度 补偿、噪声抑制等,对音频信号的多个频带中的每个频带独立地进行处理。通常采用等效矩 形带宽(equivalent rectangular bandwidth, ERB)滤波器组将音频信号的频率分成多个 频带。
[0003] 由于上述增强处理操作实际上或多或少地等效于利用不同的滤波器对输入的音 频信号进行卷积,因此为了有效地实现该卷积操作,ERB滤波器组的传统实现方式通常在很 大程度上依赖于频域处理。在ERB滤波器组,输入的时域音频信号首先被分成加窗的非重 叠帧/重叠帧以及不加窗的非重叠帧/重叠帧,随后采用快速傅里叶变换(FFT)将其转换 成线性频点。然后,将这些线性频点组合成具有不同带宽的不同ERB频带,以便进一步进行 增强处理。为了获得处理后的时域信号,需要利用快速傅里叶逆变换(IFFT)将处理后的频 点转换回时域。这种实现方式固有地为多速率系统,并且很有可能在对个别频点进行操作 期间引入谐波失真。此外,在ERB滤波器组的传统实现方式中,输入的样本即频点必须被组 成帧。这意味着不得不引入额外的帧延迟。
[0004] 由此,本领域中需要一种能够实现完美重建和无谐波失真的音频信号处理的解决 方案。

【发明内容】

[0005] 为了解决上述以及其他潜在的问题,本发明提出一种用于处理时域音频信号的方 法和系统。
[0006] 在一方面,本发明的实施方式提供了一种用于处理时域音频信号的方法。该方法 包括:对所述时域音频信号进行滤波,以获得时域滤波信号;以及将所述时域音频信号与 所述时域滤波信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个 频带的所述时域音频信号。这方面的实施方式还包括相应的计算机程序产品。
[0007] 在另一方面,本发明的实施方式提供了一种用于处理时域音频信号的系统。该系 统包括:滤波单元,被配置为对所述时域音频信号进行滤波,以获得时域滤波信号;以及相 减单元,被配置为将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波 信号互补的时域互补信号,从而获得多个频带的所述时域音频信号
[0008] 通过下文描述将会理解,根据本发明的实施方式,能够通过将时域音频信号与时 域滤波信号相减而获得与该时域滤波信号互补的时域互补信号。因而,时域滤波信号与时 域互补信号的总和严格地等于输入的时域音频信号。换言之,输出信号的总和严格地等于 输入信号,因而能够实现输入信号的完美重建。此外,由于所有信号均以单一速率运行在时 域,意味着没有像多速率系统那样进行信号的下采样和上采样,因而不会引起谐波失真。本 发明的实施方式所带来的其他益处将通过下文描述而清楚。
【附图说明】
[0009] 通过参考附图阅读下文的详细描述,本发明实施例的上述以及其他目的、特征和 优点将变得易于理解。在附图中,以示例而非限制性的方式示出了本发明的若干实施例,其 中:
[0010] 图1示出了根据本发明的示例实施方式的用于处理时域音频信号的方法的流程 图;
[0011] 图2示出适于实施根据本发明的示例实施方式的用于处理时域音频信号的方法 的多级滤波器组;
[0012] 图3示出用于图2中第1级的示例构建块;
[0013] 图4示意性地示出使音频信号x(n)通过图3所示构建块时的频率响应的幅度;
[0014] 图5不出说明图2中的某一级的输入与输出之间的关系的图;
[0015] 图6示出用于滤出图5中的频带1的原型滤波器的幅度响应;
[0016] 图7示出图6所示原型滤波器的内插版本;
[0017] 图8示出优化后的滤波器及其原始对称的线性相位滤波器的冲击响应;
[0018] 图9-11示出根据本发明的一个示例实施方式设计的滤波器组的特性;
[0019] 图12示出根据本发明的示例实施方式的用于处理时域音频信号的系统的框图; 以及
[0020] 图13示出适于实现本发明的示例实施方式的计算机系统的框图。
[0021 ] 在各个附图中,相同或对应的标号表相同或对应的部分。
【具体实施方式】
[0022] 下面将参考附图中示出的若干示例实施例来描述本发明的原理。应当理解,描述 这些实施例只是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方 式限制本发明的范围。
[0023] 首先参照图1,其示出了根据本发明的示例实施方式的用于处理时域音频信号的 方法100的流程图。
[0024] 在步骤S101,对时域音频信号进行滤波,以获得时域滤波信号。根据本发明的实施 方式,所述时域音频信号可以在某个频率范围内。该频率范围可以预先定义,例如根据人类 听觉特性或者模型来定义。例如,可以预先定义待处理的时域音频信号在〇_24kHz范围内, 包括人类用户对其敏感的20Hz-20kHz的频率范围。
[0025] 在步骤S102,将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域 滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。
[0026] 由此,时域滤波信号与时域互补信号的总和严格地等于输入的时域音频信号。换 言之,输出信号的总和严格地等于输入信号,因而利用根据本发明实施方式的方法能够实 现输入信号的完美重建。
[0027] 根据本发明的实施方式,该方法进一步包括对所述时域滤波信号和所述时域互补 信号迭代地进行所述滤波和所述相减,以获得期望数目的所述频带。
[0028] 根据本发明的实施方式,期望数目的所述频带可以预先定义,例如根据人类听觉 特性或者模型来定义。在某些实施方式中,通过将〇_24kHz的频率范围分成20个频带来获 得期望数目的所述频带。例如,可以基于ERB频率标度(scale)来将0-24kHz的频率范围 分成20个频带。
[0029] 根据本发明的实施方式,对时域音频信号进行滤波包括对该时域音频信号进行低 通滤波以获得第一低通滤波信号,将时域音频信号与时域滤波信号相减包括将该时域音频 信号与该第一低通滤波信号相减,以获得与该第一低通滤波信号互补的第一互补信号。具 体而言,在低通滤波中采用的通带的截止频率可以至少部分地基于期望获得的频带来确 定,如下文所述。
[0030] 然后,在第一低通滤波信号和第一互补信号上迭代地进行所述滤波和所述相减, 直至获得期望数目的频带。
[0031] 在下文中将参照图2-11来详细描述根据本发明的实施方式的用于处理时域音频 信号的方法。
[0032] 图2示出了适于实施根据本发明的示例实施方式的用于处理时域音频信号的 方法的多级滤波器组200。滤波器组200包括以树形结构布置的多个级,即第1级、第2 级......第M级。
[0033] 时域音频信号x (n)被输入到第1级。如上所述,时域音频信号x (n)的频率范围 可以预先定义。例如,时域音频信号x(n)可以在0-24kHz范围内。
[0034] 时域音频信号x(n)被滤波器组200分成期望数目的频带的信号。所述期望数目 的频带例如可以为ERB频带或Bark频带。出于说明目的,下文中将以ERB频带为例进行描 述。
[0035] 具体而言,每个ERB频带的中心频率可以通过如下等式来确定:
(等式1)
[0037] 其中f?表示每个ERB频带的中心频率,B表示范围在1到20内的频带索引。
[0038] 表1示意性地示出了通过等式1获得的20个ERB频带的相应中心频率。
[0040] 表 1
[0041] 应当注意,上面的示例仅仅是出于说明目的,在实施中可以采用任何其他适合的 频率范围和/或频带数目。例如,在〇_24kHz频率范围内的输入音频信号可以基于Bark频 率标度被分成24个频带。应当理解,以Hz为单位的频率与Bark频率标度之间的转换是已 知的,因此在此省略其详述。
[0042] 可以利用各种音频增强算法对期望数目的频带中的每个频带独立地进行处理。由 于所有信号均以单一速率在时域被处理,意味着没有像多速率系统那样进行信号的下采样 和上采样,因而利用所提出的方法不会引起谐波失真。
[0043] 第1级、第2级......第M级中的每一级包括具有相同结构的一个或多个构建块。 图3示出了用于图2中第1级的示例构建块300。构建块300适于实施根据本发明的示例 实施方式的用于处理时域音频信号的方法。
[0044] 构建块300包括滤波器301和减法器302。输入的时域音频信号x(n)经滤波器 301滤波后产生时域滤波信号Hs。减法器302将时域音频信号x(n)与时域滤波信号Hs相 减而产生与时域滤波信号Hs互补的互补信号He。
[0045] 根据一个实施方式,滤波器301被配置成低通滤波器,用于对时域音频信号x(n) 进行低通滤波以产生第一低通滤波信号Hs。然后,减法器302将时域音频信号x(n)与第一 低通滤波信号Hs相减而产生与第一低通滤波信号Hs互补的第一互补信号He。
[0046] 在一个具体实施例中,采用最大误差最小化准则(minimax criterion)将低通滤 波器301设计成有限长单位冲激响应(FIR)滤波器,其中最大误差最小化准则也被称为切 比雪夫准则(Chebyshev criterion)。在该实施例中,输入的时域音频信号x(n)的全频带 (full-band)由低通滤波器301分成两部分:频带1至频带15,以及频带16至频带20。低 通滤波器301的期望的通带截止频率基于频带15的中心频率来确定。换言之,低通滤波 器301的期望的通带截止频率约为5543Hz。对于低通滤波器301而言,通带和截止带波纹 (ripple)均等于-30dB。而且,低通滤波器301被设计为具有线性相位特性。
[0047] 图4示意性地示出了使时域音频信号x(n)通过图3所示(包括低通滤波器301 和减法器302的)构建块时的频率响应的幅度。如图4所示,输入的时域音频信号x(n)通 过低通滤波器301和减法器302后产生标记为401的第一低通滤波信号以及标记为402的 第一互补信号,第一互补信号402与第一低通滤波信号401互补。从图4中可以看出,第一 低通滤波信号401与第一互补信号402的总和恰好等于输入的时域音频信号x (n)。从图4 中还可以看出,低通滤波器301的通带截止频率约为5543Hz。
[0048] 返回到图2,第一低通滤波信号Hs与第一互补信号He被进一步输入到随后的第2 级.......第M级,以迭代地进行滤波和相减。
[0049] 具体地,对第一互补信号He迭代地进行滤波和相减包括:对第一互补信号He进行 低通滤波,以获得第二低通滤波信号;将第一互补信号He与第二低通滤波信号相减,以获 得与第二低通滤波信号互补的第二互补信号;以及对第二低通滤波信号和第二互补信号迭 代地进行低通滤波和相减。
[0050] 下面以图4所示的频率响应为例进行描述。如图4所示,曲线402表示第一互补 信号He。为了对第一互补信号He进行低通滤波以获得例如在5000-10000HZ频带内的第二 低通滤波信号,对第一互补信号He进行低通滤波时所采用的通带截止频率应当被确定为 高于10000Hz。就此而言,可以通过确定适当的通带截止频率来对第一互补信号He进行低 通滤波,从而获得期望频带内的第二低通滤波信号。
[0051] 对于上述具体实施例,如上所述,输入的时域音频信号x(n)的全频带由低通滤波 器301分成两部分:频带1至频带15,以及频带16至频带20。随着逐级进行滤波,某些级的 输入,尤其是在后的几级的输入的频带变窄。实际上,如果设计一个全频带滤波器而仅滤出 窄带信号的一部分,其成本是非常高的。相反地,通过在所设计的原型滤波器中内插简单地 多的滤波器同样可以达到相同的滤波效果。这将在频率范围内产生多个不期望的副本,而 随后通过应用相对简单的滤波器即可去除这些不期望的副本,从而得到期望频带的信号。 为了说明这一点,下面参照图5-7来描述如何执行内插操作。
[0052] 图5不出了说明图2中的某一级的输入与输出之间的关系的图。如图5所不,某 一级的输入仅包括频带1和频带2的信号,如标记501所示。期望通过该级滤出标记为502 的频带1的信号,并且同时输出与频带1互补的、标记为503的频带2的信号。由于频带2 的信号可以通过将输入信号501与频带1的信号相减来获得,因此不需要对频带2的信号 执行乘法操作。因而,需要将该级中的滤波器设计为滤出频带1。可以理解,直接实现用于 滤出频带1的滤波器将需要非常多的乘法操作,因为频带1的过渡带带宽相当窄,这意味着 需要非常长的滤波器。根据本发明的一个实施方式,执行以下操作来降低用于滤出频带1 的滤波器的设计复杂度。
[0053] 首先,设计具有如图6所示的幅度响应的原型滤波器。从图6可以看出,该原型滤 波器的过渡带带宽比用于滤出频带1的滤波器的过渡带带宽要宽得多。这意味着该原型滤 波器是非常短的。
[0054] 然后,为了获得所期望的用于滤出频带1的滤波器,应当使该原型滤波器的过渡 带带宽变窄。用于使过渡带带宽变窄的一种方式是在该原型滤波器中内插预定数目的冲击 响应。图7示出了内插后的原型滤波器。图7所示的滤波器将发挥与所期望的用于滤出频 带1的滤波器相同的作用,而其复杂度比所期望的滤波器要低得多。因此,通过将这一思想 应用于所有级中的所有滤波器,可以显著减低实施复杂度,意味着需要少得多的乘法操作。 用于在原型滤波器中内插冲击响应的很多技术是已知的并且可以用于本发明的实施方式。 本发明的范围在这方面不受限制。
[0055] 返回到图2,经过第M级处理之后,滤波器组200输出频带1、频带2......频带N 的信号。可以理解,滤波器组200的级数M可以至少部分地基于待输出的频带的数目N来 确定。
[0056] 从图2可以看出,时域滤波信号Hs与其互补信号He的总和等于输入的时域音频 信号x(n)。换言之,每个构建块的输出信号的总和均等于该构建块的输入信号。因而,所输 出的频带1、频带2......频带N的信号的总和等于输入的时域音频信号x(n)。这意味着 利用图2所示的滤波器组200能够实现信号的完美重建。
[0057] 此外,图2所示结构的另一优点在于,如果仅期望处理频带1、频带2......频带 N中的某些频带,那么可以在某些级抽出(tap out)这些频带,从而避免了实现随后的所有 级。相比于传统的基于FFT的实现方式,在该实现方式中不得不应用完整的FFT以获得所 有的频点,但是可能仅对其中的某些频点感兴趣,所提出的方案可以在很大程度上降低复 杂度。
[0058] 为了降低整个滤波器组200的群时延,需要降低每一级中的每个滤波器的群时 延。在采用ERB频带的情况下,由于前几个ERB频带具有非常陡的过渡带,因此显然其冲击 响应是非常长的,因而需要占用大量时间来处理。因此,需要对前几个ERB频带进行优化以 显著降低群时延。本质上,这可以通过将滤波器的频率响应稍向左移来实现。这将不可避 免的产生频率响应失真。然而,只要所产生的失真在可接受水平内,所设计的滤波器则可以 认为是可接受的。
[0059] 对于由其滤波器系数h = [h_0h_l. . . h_N]来规定的线性相位滤波器,需要找到这 样一种最优方案,其中滤波器的频率响应在通带内具有预定义的群时延,并且同时仍保持 适当的截止带衰减。可以采用很多已知的优化技术,例如加权最小平方(weighted least squares,WLS)以及二阶维规划(second order cone programming,SOCP)等。具体地,在米 用WLS的情况下,用于频率响应中的每个频点的权重(weight)被迭代地调整。在采用S0CP 的情况下,滤波器系数被直接优化以聚合成一种全局最优方案。
[0060] 图8分别示出了优化后的滤波器及其原始对称的线性相位滤波器的冲击响应。在 图8中,曲线801表示优化后的滤波器的冲击响应,而曲线802表示与优化后的滤波器对应 的原始对称的线性相位滤波器的冲击响应。从曲线801可以看出,优化后的滤波器具有降 低的群时延并且在通带内具有接近线性的相位。如图8所示,具有优化后的低群时延的冲 击响应801的主瓣向左进行了移动,意味着该滤波器将对输入的音频信号更快速地做出响 应。
[0061] 出于说明的目的,以上对第1级中的滤波器的设计过程进行了描述。应当理解,在 设计M级中的每一级的滤波器时采用不同的原型滤波器。此外,M级中的每一级的滤波器 基于相应级的输入频带和期望从其输出的频带来设计。
[0062] 图9-11示出了根据本发明的一个示例实施方式设计的滤波器组200的特性。在 图9-11所示的实施方式中,如上所述的例如内插和降低群时延的优化操作被应用于所有 级中的所有滤波器。具体地,图9示出了全部20个频带的幅频响应,图10示出了滤波器组 200的总冲击响应,图11示出了滤波器组200的总频率响应。图11 (a)表明输入的音频信 号的所有频率分量在通过根据本发明的实施方式设计的滤波器组后获得相同的增益1。图 11 (b)表明输入的音频信号的所有频率分量在通过根据本发明的实施方式设计的滤波器组 时被延迟相同的时间。因而,从图10和11可以看出,总冲击响应表明实现了完美重建。换 言之,通过根据本发明的实施方式设计的滤波器组能够实现输入音频信号的完美重建。此 外,在该实施方式中,在48kHz米样速率下,482个样本的群延迟为10ms,并且对每个输入样 本需执行215次乘法操作。
[0063] 此外,由于滤波器组200的所有操作实质上均为滤波操作,因此能够采用现代数 字信号处理器(DSP)有效地执行这些操作,在该DSP中可以完全利用乘法和加法(MAC)操 作。因此,滤波器组200具有低复杂度并且是DSP友好的。此外,由于滤波器系数全部为实 数且输入信号为实信号,因而无需复杂的乘法操作和FFT。
[0064] 图12示出根据本发明的示例实施方式的用于处理时域音频信号的系统1200的框 图。如图12所示,系统1200包括:滤波单元1201,被配置为对所述时域音频信号进行滤波, 以获得时域滤波信号;以及相减单元1202,被配置为将所述时域音频信号与所述时域滤波 信号相减,以获得与所述时域滤波信号互补的时域互补信号,从而获得多个频带的所述时 域音频信号。
[0065] 在某些实施方式中,系统1200进一步包括迭代单元,其被配置为对所述时域滤波 信号和所述时域互补信号迭代地进行所述滤波和所述相减,以获得期望数目的所述频带。
[0066] 在某些实施方式中,滤波单元1201进一步被配置为对所述时域音频信号进行低 通滤波,以获得第一低通滤波信号。
[0067] 在某些实施方式中,相减单元1202进一步被配置为将所述时域音频信号与所述 第一低通滤波信号相减,以获得与所述第一低通滤波信号互补的第一互补信号。
[0068] 在某些实施方式中,所述迭代单元进一步被配置为:对所述第一互补信号进行低 通滤波,以获得第二低通滤波信号;将所述第一互补信号与所述第二低通滤波信号相减,以 获得与所述第二低通滤波信号互补的第二互补信号;以及对所述第二低通滤波信号和所述 第二互补信号迭代地进行所述低通滤波和所述相减。
[0069] 在某些实施方式中,滤波单元1201和所述迭代单元进一步被配置为具有线性相 位特性。
[0070] 在某些实施方式中,滤波单元1201和所述迭代单元中的每一个均包括内插单元, 所述内插单元被配置为在所述低通滤波期间,至少部分地基于所述期望数目的所述频带来 内插预定数目的冲击响应。
[0071] 在某些实施方式中,所述期望数目的所述频带具有不同的频带宽度。在某些实施 方式中,所述期望数目的所述频带包括等效矩形带宽ERB频带或Bark频带。
[0072] 为清晰起见,在图12中没有示出系统1200的某些可选部件。然而,应当理解,上 文参考图1到图2所描述的各个特征同样适用于系统1200。而且,系统1200中的各部件 可以是硬件模块,也可以是软件单元模块。例如,在某些实施例中,系统1200可以部分或者 全部利用软件和/或固件来实现,例如被实现为包含在计算机可读介质上的计算机程序产 品。备选地或附加地,系统1200可以部分或者全部基于硬件来实现,例如被实现为集成电 路(1C)、专用集成电路(ASIC)、片上系统(S0C)、现场可编程门阵列(FPGA)等。本发明的范 围在此方面不受限制。
[0073] 下面参考图13,其示出了适于用来实现本发明实施例的计算机系统1300的示意 性框图。如图13所示,计算机系统1300包括中央处理单元(CPU) 1301,其可以根据存储在 只读存储器(ROM) 1302中的程序或者从存储单元1308加载到随机访问存储器(RAM) 1303 中的程序而执行各种适当的动作和处理。在RAM 1303中,还存储有设备1300操作所需的 各种程序和数据。CPU 130UR0M 1302以及RAM 1303通过总线1304彼此相连。输入/输 出(I/O)单元1305也连接至总线1304。
[0074] 以下部件连接至I/O接口 1305 :包括键盘、鼠标等的输入单元1306 ;包括诸如阴 极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出单元1307 ;包括硬盘等的存储 单元1308 ;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信单元1309。通信单元 1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至I/O接口 1305。 可移动介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动1310 上,以便于从其上读出的计算机程序根据需要被安装入存储单元1308。
[0075] 特别地,根据本发明的实施例,上文参考图1和图2描述的过程可以被实现为计算 机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可 读介质上的计算机程序,所述计算机程序包含用于执行方法1〇〇和/或方法200的程序代 码。在这样的实施例中,该计算机程序可以通过通信单元1309从网络上被下载和安装,和 /或从可拆卸存储单元1311被安装。
[0076] -般而言,本发明的各种示例实施例可以在硬件或专用电路、软件、逻辑,或其任 何组合中实施。某些方面可以在硬件中实施,而其他方面可以在可以由控制器、微处理器或 其他计算设备执行的固件或软件中实施。当本发明的实施例的各方面被图示或描述为框 图、流程图或使用某些其他图形表示时,将理解此处描述的方框、装置、系统、技术或方法可 以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计 算设备,或其某些组合中实施。
[0077] 而且,流程图中的各框可以被看作是方法步骤,和/或计算机程序代码的操作生 成的操作,和/或理解为执行相关功能的多个耦合的逻辑电路元件。例如,本发明的实施 例包括计算机程序产品,该计算机程序产品包括有形地实现在机器可读介质上的计算机程 序,该计算机程序包含被配置为实现上文描述方法的程序代码。
[0078] 在本公开的上下文中,机器可读介质可以是包含或存储用于或有关于指令执行系 统、装置或设备的程序的任何有形介质。机器可读介质可以是机器可读信号介质或机器可 读存储介质。机器可读介质可以包括但不限于电子的、磁的、光学的、电磁的、红外的或半 导体系统、装置或设备,或其任意合适的组合。机器可读存储介质的更详细示例包括带有 一根或多根导线的电气连接、便携式计算机磁盘、硬盘、随机存储存取器(RAM)、只读存储器 (ROM)、可擦除可编程只读存储器(EPROM或闪存)、光存储设备、磁存储设备,或其任意合适 的组合。
[0079] 用于实现本发明的方法的计算机程序代码可以用一种或多种编程语言编写。这些 计算机程序代码可以提供给通用计算机、专用计算机或其他可编程的数据处理装置的处理 器,使得程序代码在被计算机或其他可编程的数据处理装置执行的时候,引起在流程图和/ 或框图中规定的功能/操作被实施。程序代码可以完全在计算机上、部分在计算机上、作为 独立的软件包、部分在计算机上且部分在远程计算机上或完全在远程计算机或服务器上执 行。
[0080] 另外,尽管操作以特定顺序被描绘,但这并不应该理解为要求此类操作以示出的 特定顺序或以相继顺序完成,或者执行所有图示的操作以获取期望结果。在某些情况下,多 任务或并行处理会是有益的。同样地,尽管上述讨论包含了某些特定的实施细节,但这并不 应解释为限制任何发明或权利要求的范围,而应解释为对可以针对特定发明的特定实施例 的描述。本说明书中在分开的实施例的上下文中描述的某些特征也可以整合实施在单个实 施例中。相反地,在单个实施例的上下文中描述的各种特征也可以分离地在多个实施例或 在任意合适的子组合中实施。
[0081] 针对前述本发明的示例实施例的各种修改、改变将在连同附图查看前述描述时对 相关技术领域的技术人员变得明显。任何及所有修改将仍落入非限制的和本发明的示例实 施例范围。此外,前述说明书和附图存在启发的益处,涉及本发明的这些实施例的技术领域 的技术人员将会想到此处阐明的本发明的其他实施例。
【主权项】
1. 一种用于处理时域音频信号的方法,所述方法包括: 对所述时域音频信号进行滤波,以获得时域滤波信号;以及 将所述时域音频信号与所述时域滤波信号相减,以获得与所述时域滤波信号互补的时 域互补信号,从而获得多个频带的所述时域音频信号。2. 根据权利要求1所述的方法,进一步包括: 对所述时域滤波信号和所述时域互补信号迭代地进行所述滤波和所述相减,以获得期 望数目的所述频带。3. 根据权利要求1或2所述的方法,其中对所述时域音频信号进行滤波包括: 对所述时域音频信号进行低通滤波,以获得第一低通滤波信号。4. 根据权利要求3所述的方法,其中将所述时域音频信号与所述时域滤波信号相减包 括将所述时域音频信号与所述第一低通滤波信号相减,以获得与所述第一低通滤波信号互 补的第一互补信号。5. 根据权利要求4所述的方法,其中对所述时域互补信号迭代地进行所述滤波和所述 相减包括: 对所述第一互补信号进行低通滤波,以获得第二低通滤波信号; 将所述第一互补信号与所述第二低通滤波信号相减,以获得与所述第二低通滤波信号 互补的第二互补信号;以及 对所述第二低通滤波信号和所述第二互补信号迭代地进行所述低通滤波和所述相减。6. 根据权利要求1至5中任一项所述的方法,其中所述滤波包括应用具有线性相位特 性的滤波器。7. 根据权利要求2至6中任一项所述的方法,进一步包括: 在所述低通滤波期间,至少部分地基于所述期望数目的所述频带来内插预定数目的冲 击响应。8. 根据权利要求2至7中任一项所述的方法,其中所述期望数目的所述频带具有不同 的频带宽度。9. 根据权利要求2至8中任一项所述的方法,其中所述期望数目的所述频带包括等效 矩形带宽ERB频带或Bark频带。10. -种用于处理时域音频信号的系统,所述系统包括: 滤波单元,被配置为对所述时域音频信号进行滤波,以获得时域滤波信号;以及 相减单元,被配置为将所述时域音频信号与所述时域滤波信号相减,以获得与所述时 域滤波信号互补的时域互补信号,从而获得多个频带的所述时域音频信号。11. 根据权利要求10所述的系统,进一步包括: 迭代单元,被配置为对所述时域滤波信号和所述时域互补信号迭代地进行所述滤波和 所述相减,以获得期望数目的所述频带。12. 根据权利要求10或11所述的系统,其中所述滤波单元进一步被配置为对所述时域 音频信号进行低通滤波,以获得第一低通滤波信号。13. 根据权利要求12所述的系统,其中所述相减单元进一步被配置为将所述时域音 频信号与所述第一低通滤波信号相减,以获得与所述第一低通滤波信号互补的第一互补信 号。14. 根据权利要求13所述的系统,其中所述迭代单元进一步被配置为: 对所述第一互补信号进行低通滤波,以获得第二低通滤波信号; 将所述第一互补信号与所述第二低通滤波信号相减,以获得与所述第二低通滤波信号 互补的第二互补信号;以及 对所述第二低通滤波信号和所述第二互补信号迭代地进行所述低通滤波和所述相减。15. 根据权利要求10至14中任一项所述的系统,其中所述滤波单元和所述迭代单元进 一步被配置为具有线性相位特性。16. 根据权利要求11至15中任一项所述的系统,其中所述滤波单元和所述迭代单元中 的每一个均包括内插单元,所述内插单元被配置为在所述低通滤波期间,至少部分地基于 所述期望数目的所述频带来内插预定数目的冲击响应。17. 根据权利要求11至16中任一项所述的系统,其中所述期望数目的所述频带具有不 同的频带宽度。18. 根据权利要求11至17中任一项所述的系统,其中所述期望数目的所述频带包括等 效矩形带宽ERB频带或Bark频带。19. 一种用于处理时域音频信号的计算机程序产品,所述计算机程序产品被有形地存 储在非瞬态计算机可读介质上,并且包括机器可执行指令,所述指令在被执行时使得所述 机器执行根据权利要求1到9中任一项所述的方法的步骤。
【文档编号】G10L21/0332GK105895113SQ201410253259
【公开日】2016年8月24日
【申请日】2014年6月6日
【发明人】施栋, 孙学京, G·迪金斯, D·麦格拉斯
【申请人】杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1