用于确定对于混响感知水平的度量的装置与方法、音频处理器及用于处理信号的方法

文档序号:2825603阅读:186来源:国知局
用于确定对于混响感知水平的度量的装置与方法、音频处理器及用于处理信号的方法
【专利摘要】一种用于确定在包括直接信号分量(100)和混响信号分量(102)的混合信号中对混响感知水平的度量的装置,其包括响度模型处理器(104),该响度模型处理器包括用于滤波该原始信号分量(100)、该混响信号分量(102)或该混合信号的感知滤波级,其中该感知滤波级被配置为模型化实体的听觉感知机构而获得滤波后的直接信号、滤波后的混响信号、或滤波后的混合信号。该装置还包括用于使用该滤波后的直接信号估计第一响度度量,并用于使用该滤波后的混响信号或该滤波后的混合信号估计第二响度度量的响度估计器,其中,该滤波后的混合信号从该直接信号分量及该混响信号分量的混叠得出。该装置还包括用于组合该第一与第二响度度量(106、108)而获得对于混响感知水平的度量(112)的组合器(110)。
【专利说明】用于确定对于混响感知水平的度量的装置与方法、音频处理器及用于处理信号的方法
【技术领域】
[0001]本案有关于音频信号处理,特别是有关于可用于人工混响器的音频处理。
【背景技术】
[0002]确定对于混响(reverberation)感知水平的度量最好应用于人工混响处理器以自动化方式操作,并需要将其参数调整适应于输入信号,以使该混响的感知水平匹配目标值的情况中。须注意术语混响虽然暗示相同主旨,但显然不具有共同接受的定义,因而使得术语混响难以在收听测试及预测方案中作为量化度量。
[0003]人工混响处理器经常被实现为线性非时变系统,并在往返信号路径中操作,如第6图所示,具有前置延迟d、混响脉冲响应(RIR)、及用于控制直接混响比(DRR)的定标(scaling,比例换算)因子g。当实现为参数混响处理器时,其具有多个参数特征,例如用于控制RIR的形状及密度,及在一个或多个频带中针对多声道处理器的RIR的声道间相干性(ICC)0
[0004]图6显示在输入600输入的直接信号X [k],及此信号被转发至加法器602,该加法器602用于将加信号加至输出自加权器604的混响信号分量r [k],该加权器604在其第一输入接收由混响滤波器606所输出的信号,及在其第二输入接收增益因子g。混响滤波器606可具有连接在混响滤波器606上游的选择性延迟级608,但因实际上混响滤波器606将包含其本身的若干延迟,故在方块608的延迟可包括在混响滤波器606中,使得图6的上支路可以只包含合并该延迟及该混响,或只合并混响而无任何额外延迟的单个的滤波器。混响信号分量由滤波器606输出,此混响信号分量可由乘法器606响应于增益因子g修改来获得处理混响信号分量r[k],其然后组合在600输入的直接信号分量来最终地在加法器602的输出获得混合信号m[k]。注意术语“混响滤波器”指人工混响的普通实现方式(或如等价于FIR滤波的卷积,或如使用递归结构的实现方式,诸如反馈延迟网络或全通滤波器及反馈巢式滤波器网络,或其它递归滤波器),但标示产生混响信号的通用处理。这样的处理可能涉及非线性处理或时变处理,诸如信号幅值或延迟长度的低频调制。在这样的情况下,术语“混响滤波器”将不适用于线性非时变(LTI)系统的严格技术意义。实际上,“混响滤波器”是指输出混响信号的处理,可能地包括从内存读取计算的或记录的混响信号的机构。
[0005]感知水平、距离、室内大小、特色及音质等这些参数对所得音频信号有影响。此外,混响的感知特性取决于输入信号的时间特性及频谱特性[I]。将注意力集中在一项重要的感觉、即响度上,可观察到感知混响的响度与输入信号的非平稳性单调相关。直观而言,包络中变化大的音频信号激励高水平的混响,而允许其于较低水平变成可听闻的。在典型方案中,其中,以分贝为单位表示的长期DRR为正,在其能量包络增加的瞬时,直接信号几乎可完全掩蔽混响信号。另一方面,每当信号结束时,先前激励的混响尾部在间隙中变明显,该间隙超过由后掩蔽的斜坡(slope)(至多200毫秒)及听觉系统积分时间(中等水平至多200毫秒)所确定的最短时间。
[0006]为了示出此点,图4a示出合成音频信号及人工混响信号的时间信号包络,图4b示出预测响度及使用响度计算模型计算的部分响度函数。具有短的前置延迟50毫秒的RIR被用于此处,删除早期反射并以指数性衰减白噪声合成混响的后期部分[2]。输入信号已根据谐波宽带信号及包络函数产生,以感知有短衰减的一个事件及有长衰减的第二事件。虽然长事件产生较多总混响能量,但不意外的是短声音被感知为有较多混响。当较长事件的衰减斜坡掩蔽混响时,短声音在混响建立前已经消失,因而开放间隙,在该间隙中混响被感知。请注意此处使用的掩蔽定义包括完全掩蔽及部分掩蔽[3]。
[0007]虽然已经多次获得这样的观察[4、5、6],但仍然值得强调,原因在于其定性地示出为何部分响度模型可应用于本工作的背景下。实际上,已经指出混响的感知来自于听觉系统中的流隔离处理[4、5、6],且受直接声音造成混响的部分掩蔽的影响。
[0008]前文考虑推动响度模型的使用。相关研究由Lee等人进行,其注意力焦点聚焦在当直接收听时RIR的主观衰减率的预测[7],及回放水平对混响的效应[8]。使用以响度为基础的早期衰减时间的混响预测器在[9]中被提出。与该项研究工作相反地,本文提出的预测方法以部分响度的计算模型(及以其简化版本寻求低复杂度实现方式)处理直接信号及混响信号,及由此考虑输入(直接)信号对感觉的影响。近来,Tsilfidis及Mourjopoulus [10]研究用于单声道录音中的后期混响的抑制的响度模型。直接信号的估值是使用频谱减法而根据混响输入信号来计算的,利用控制混响处理的计算听觉掩蔽模型导出混响掩蔽指数。
[0009]多声道合成器及其它装置的特征是加入混响来从感知观察点让声音变得更佳。另一方面,产生的混响为人工信号,当以低水平加至信号时几乎无法听闻,但当以高水平添加时导致不自然且不怡人声音的最终混合信号。让情况变得更恶化的是如在图4a及4b背景下的讨论,混响的感知水平具有强信号依赖性,因此某个混响滤波器对多个信号中的一种信号可能效果极佳,但对不同种信号可能没有听觉效果,或甚至更差地可能产生严重听觉假影。
[0010]与混响有关的另一问题是混响后的信号是用于实体或个体诸如人类的耳朵的,产生具有直接信号分量及混响信号分量的混合信号的最终目标是该实体感知此混合信号或“混响后的信号”为声音良好或声音自然。但听觉感知机构或声音如何由个体实际上感知的机制不仅就人类听觉有作用的频带而言是强非线性的,同时也就在该频带内部的信号处理而言也是强非线性的。此外,已知人类的声音感知不太受声压水平的控制,声压水平例如可由数字样本求平方算出,反而声音感知较受响度感觉控制。此外,针对包括直接信号分量及混响信号分量的混合信号,混响分量的响度感觉不仅取决于直接信号分量类别,同时也取决于直接信号分量的水平或响度。
[0011]因此存在对于确定在由直接信号分量及混响信号分量所组成的混合信号中对于混响感知水平的度量的需求,以处理前述与实体的听觉感知机构有关的问题。

【发明内容】

[0012]因此本发明的目的是提供一种用于确定混响感知水平的度量的装置或方法,或提供一种以改良特性处理音频信号的音频处理器或方法。[0013]该目标通过根据权利要求1所述的用于确定混响感知水平的度量的装置、根据权利要求10所述的确定混响感知水平的度量的方法、根据权利要求11所述的音频处理器、根据权利要求14所述的处理音频信号的方法、或根据权利要求15所述的计算机程序而予实现。
[0014]本发明基于确立信号中混响感知水平的度量是由响度模型处理器所确定,该响度模型处理器包括感知滤波级,以使用该感知滤波器来滤波直接信号分量、混响信号分量或混合信号分量从而模型化实体的听觉感知机构。基于感知滤波后的信号,响度估计器使用该滤波后的直接信号估计第一响度度量,并使用该滤波后的混响信号或该滤波后的混合信号估计第二响度度量。然后,组合器组合该第一度量与第二度量而获得对于混响感知水平的度量。更明确言之,优选通过计算差值来组合两个不同响度度量的方式提供了相比于对该直接信号或混合信号的感觉来说,混响感有多强的量化值或度量。
[0015]为了计算响度度量,可运用绝对响度度量,更明确言之,直接信号、混合信号或混响信号的绝对响度度量。可选地,当在响度模型中,第一响度度量是通过使用直接信号作为刺激及混响信号作为噪声而确定,第二响度度量是通过使用混响信号作为刺激及直接信号作为噪声计算时,也可计算部分响度。更明确言之,通过在组合器内组合这两个度量,获得混响感知水平的有效度量。所发现的是这种有效度量无法通过产生单一响度度量而单独确定,举例言之,通过单独使用直接信号或单独使用混合信号或单独使用混响信号。取而代之,由于人类听觉的交互依赖性,组合从这三个信号中任意两个不同地得出的度量,可以高度准确地确定或模型化信号的混响的感知水平。
[0016]优选地,响度模型处理器提供时/频变换,并获取耳传递函数和听觉模型所模型化的实际上出现在人类听觉的激励模式。
[0017]在优选实施方式中,对于混响感知水平的度量被转发至预测器,该预测器实际上以有效的标度诸如桑尼(Sone)标度提供混响的感知水平。该预测器优选通过收听测试数据训练(train),优选线性预测器的预测器参数包括常数项和定标因子。常数项优选取决于实际使用的混响滤波器特性,在混响滤波器的一个实施方式中,针对用在人工混响器中的直接的众所周知的混响滤波器可被给定特性参数T6(l。但例如即使该特性为未知,当混响信号分量并非独立可行,反而在本发明装置处理前已经从混合信号分开时,可推导出对该常数项的估计。
【专利附图】

【附图说明】
[0018]随后将就附图描述本发明的优选实施方式,附图中:
[0019]图1为用于确定混响感知水平的度量的装置或方法的框图;
[0020]图2a为响度模型处理器的优选实施方式的说明图;
[0021]图2b示出响度模型处理器的又一优选实施方式;
[0022]图3示出响度模型处理器的又一优选实现方式;
[0023]图4a、图4b示出时间信号包络及相对应响度及部分响度的实例;
[0024]图5a、图5b示出用于训练预测器的实验数据的信息;
[0025]图6示出人工混响处理器的框图;
[0026]图7示出依据本发明的实施方式指示评估量表的三个表;[0027]图8示出被实现以出于人工混响的目的使用混响感知水平的度量的音频信号处
理器;
[0028]图9示出依赖混响的时间平均感知水平的预测器的优选实现方式;及
[0029]图10示出用于计算特异性响度的优选实施方式的、得自1997年Moore Glasberg、Baer公开文献的等式。
【具体实施方式】
[0030]混响的感知水平取决于输入音频信号及脉冲响应二者。本发明的实施方式针对当晚期混响出现在数字音频效应时,量化此项观察及基于直接信号及混响信号的分开信号路径而预测晚期混响的感知水平。发展出该问题的解决的方式及随后通过考虑混响时间对预测结果的影响加以延伸。这导致具有两个输入变量的线性回归模型,其可以高准确度预测感知水平,如从收听测试得出的实验数据所示。具有不同复杂化度及计算复杂度的这种模型的变化例被就其准确度作比较。应用用途包括控制用于音频信号的自动混合的数字音频效应。
[0031]本发明的实施方式不仅可用于当直接信号及混响脉冲响应(RIR)为可各自单独取得时,预测语音及乐音的混响的感知水平。在其中出现混响后的信号的其它实施方式中,也适用本发明。但于此种情况下,将可包括直接/周围分离器或直接/混响分离器来从混合信号中分离直接信号分量及混响后的信号分量。然后这种音频处理器可用来改变该信号中的直接/混响比以产生更好的声音的混响后的信号或更好的声音的混合信号。
[0032]图1示出确定对于在混合信号中混响感知水平的度量的装置,包含直接信号分量或原始信号(dry signal,干燥信号)分量100以及混响信号分量102。原始信号分量100及混响信号分量102被输入响度模型处理器104。响度模型处理器被配置为接收直接信号分量100及混响信号分量102,及如第2a图的示出,额外包括感知滤波级104a及随后连接的响度计算器104b。响度模型处理器在其输出产生第一响度度量106及第二响度度量108。两个响度度量被输入组合器110,用于组合第一响度度量106及第二响度度量108来最终获得混响感知水平的度量112。依据该实现方式,感知水平的度量112可输入预测器114用于基于针对不同信号帧的至少两个感知水平的度量的平均值而预测混响的感知水平,如后文将就图9的背景详细说明。但图1的预测器114是选择性的,并且实际上将感知水平的度量变换成某个数值范围或单位范围,诸如桑尼(Sone)单位范围,该范围可用于给定与响度有关的量化数值。但未由预测器114处理的感知水平的度量112的其它用途也可用在例如图8的音频处理器中,该音频处理器并非必要依赖由预测器114的输出值,反而也可以直接形式或优选地,以一种平滑的形式处理感知水平的度量112,在该处随着时间的平滑化为优选,以便没有对混响后的信号的强变化水平校正,或如下所述的图6示出或图8示出的增益因子g的强变化水平校正。
[0033]更明确言之,感知滤波级被配置为滤波直接信号分量、混响信号分量或混合信号分量,其中,该感知滤波级被配置为模型化诸如人类的一个实体的听觉感知机构而获得滤波后的直接信号、滤波后的混响信号或滤波后的混合信号。依据该实现方式,该感知滤波级可包含并行操作的两个滤波器,或可包含储存装置和单个的滤波器,原因在于一个且同一个滤波器实际上可用于滤波三个信号亦即混响信号、混合信号及直接信号中的每一个。但在此背景中,发现虽然图2a示出η个滤波器模型化该听觉感知机构,但实际上两个滤波器就够了,或单个滤波器滤波由混响信号分量、混合信号分量及直接信号分量所组成的组群中的两个信号。
[0034]响度计算器104b或响度估计器被配置为用于使用该滤波后的直接信号估计第一响度相关的度量,并使用该滤波后的混响信号或滤波后的混合信号估计第二响度的度量,在此处,该混合信号从该直接信号分量与混响信号分量的混叠导出。
[0035]图2c示出计算对于混响感知水平的度量的四种优选模式。实施方式I依赖部分响度,其中,直接信号分量X及混响信号分量r 二者被用于响度模型处理器,但其中,为了确定第一响度度量EST1,混响信号被用作为刺激而直接信号被用作为噪声。为了确定第二响度度量EST2,情况改变,直接信号分量被用作为刺激及混响信号分量被用作为噪声。然后,由组合器所产生的校正感知水平的度量是第一响度度量ESTl与第二响度度量EST2间的差值。
[0036]但额外存在有其它计算上有效的实施方式,指示于图2c的行2、3、及4。这样的更具运算效率的度量依赖于计算包含混合信号m、直接信号X、及混响信号η的三个信号的总响度。取决于图2c末列指示的由组合器所执行的要求计算,第一响度度量ESTl为混合信号或混响信号的总响度,及第二响度度量EST2为直接信号分量X或混合信号分量m的总响度,其中,实际组合如图2c示出。
[0037]在又一实施方式中,响度模型处理器104在频域操作,如参考图3详加说明。在这种情况下,响度模型处理器,特别是响度计算器104b针对各频带提供第一度量及第二度量。全部η个频带的这样的第一度量随后在用于第一分支的加法器104c和用于第二分支的加法器104d相加或组合来最终地获得针对宽带信号的第一度量及针对宽带信号的第二度量。
[0038]图3示出已经就图1、图2a、图2b、图2c在某些方面讨论的响度模型处理器的优选实施方式。更明确言之,感知滤波级104a包括针对各个分支的时频变换器300,其中在图3的实施方式中,x[k]指示刺激及n[k]指示噪声。时/频变换信号被转发至耳传递函数方块302 (请注意另外,耳传递函数可在时频变换器的前运算,获得相似的结果,但有较高运算负荷),该方块302的输出被输入运算激励模式方块304,接着是时间积分方块306。然后在方块308,计算本实施方式的特异性响度,其中,方块308相对应于图2a的响度计算器方块104b。接着执行在方块310的频率积分,其中,方块310相对应于已经如图2b的104c及104d描述的加法器。须注意方块310产生针对刺激及噪声第一集合的第一度量,和针对刺激及噪声第二集合的第二度量。更明确言之,考虑图2b,用于计算第一度量的刺激为混响信号且噪声为直接信号;而对于计算第二度量,情况改变,刺激为直接信号分量且噪声为混响信号分量。因此为了产生两个不同响度度量,图3示出的处理程序执行两次。但唯一的改变出现在方块308,方块308有不同操作如后文在图10的背景进一步讨论,因此方块300至306示出的步骤只需执行一次,而时间积分方块306的结果可被储存以计算针对图2c中实施方式I的第一估计响度和第二估计响度。应注意针对图3c的其它实施方式2、3、4,方块308被以针对各分支的个别方块“计算总响度”置换,其中,在本实施方式中,无论哪个信号被考虑为刺激或噪声,该方块都是一样的。
[0039]接着讨论图3示出响度模型的进一步细节。[0040]图3中响度模型的实现方式遵照[11、12]的说明而有修改,容后详述。预测的训练和有效化使用得自[13]所述收听测试的数据,并容后详述。响度模型的施加用于预测晚期混响的感知水平也容后详述。之后是实验结果。
[0041 ] 本章节描述部分响度模型的实现方式、被用作为混响的感知水平的计算预测的背景真值(ground truth)的收听测试数据、以及基于该部分响度模型的所提出的预测方法。
[0042]响度模型计算当以掩蔽信号n[k]同时出现时,信号X[k]的部分响度Nx,n[k]。
[0043]Nx;n[k]=f(x[k],n[k]).(I)
[0044]虽然早期模型处理稳定背景噪声下的响度感知,但有某些工作研究在共同调制随机噪声背景[14]、复合环境声音[12]背景、及乐音信号[15]背景中的响度感知。图4b示出这里使用的响度模型计算的图4a所示实例信号的各分量的总响度及部分响度。
[0045]本研究工作使用的模型类似[11、12]中的模型,该模型由Fletcher、Munson、Stevens、及Zwicker的早期模型绘制,有若干修改容后详述。响度模型的框图显示于图3。输入信号使用短时间傅里叶变换(STFT)而在频域处理。在[12]中,6个不等长度的离散傅里叶变换(DFT)用来在全部频率获得频率分辨率及时间分辨率与人类听觉系统的良好匹配。在本工作中,为了运算效率只使用一个DFT长度,具有以48kHz取样率的21毫秒帧长度、50%重叠、及Hann窗口函数。通过外耳及中耳的传递被以固定滤波器模拟。激励函数使用水平依赖性激励模式,针对在相等矩形带宽(ERB)上隔开的40个听觉滤波带来进行计算。除了因STFT的开窗(windowing)所致的时间积分外,递归积分以25毫秒的时间常数实现,这只有在激励信号衰减时才有效。
[0046]特异性部分响度亦即在各个听觉滤波带激起的部分响度根据[11]的等式(17)至
(20),从得自关注信号(刺激)及关注噪声的激励水平求出,示出在第10图。这样的等式涵盖四个情况:信号高于噪 声中的听觉阈值或否,以及混合信号的激励小于IOOdB或否。若无任何关注信号馈送入该模式,即n[k]=0,则结果等于刺激x[k]的总响度Nx[k]。
[0047]更明确言之,图10示出公开文献“阈值、响度及部分响度的预测模型”,B.C.J.Moore> B.R.Glasberg、T.Baer, J.Audio Eng.Soc.第 45 卷第 4 期 1997 年 4 月的等式17、18、19、20。本参考文献描述连同背景声音一起出现的信号情况。虽然背景可以是任意类型的声音,但在本参考文献中称作为“噪声”来区别背景与任何待判定其响度的信号。噪声的存在减低信号的响度,此效应称作为部分掩蔽。当信号的响度水平从阈值升高至高于阈值20至30dB时,信号的响度极为快速地增高。该文章内,假设噪声中出现的信号的部分响度可通过在频率上加和相对于频率信号的部分特异性响度(基于ERB标度)来计算。通过考虑四个有限情况,可推导出用于计算部分特异性响度的等式。Esrc表示由信号激发的激励,及Enmse表示由噪声激发的激励。假设ESK>ET_且Esrc+ENrasE〈101(l。总特异性响度N’ τοτ定义如下:
[0048]N’ T0T=C {[ (Esig+Enoise) G+A] a_Aa}
[0049]假设收听者可区分(partition)信号的特异性响度与噪声的特异性响度之间的在给定中心频率的特异性响度,但认为总特异性响度。
[0050]N XOT-N sig+Nnoise.[0051]此项假设是恒定的,原因在于在大部分测量部分掩蔽的实验中,收听者首先单独听到噪声,及然后听到噪声加信号。假设单独噪声高于阈值,单独噪声的特异性响度为[0052]N,N0ISE=C [(EN0ISEG+A)a_Aa].[0053]因此,若信号的特异性响度单纯通过从总特异性响度所得噪声的特异性响度推导,则结果将为
[0054]N,SIG=C {[ (Esig+Enoise) G+A] a-Aa} -C [ (EnoiseG+A) a_Aa]
[0055]实际上,在信号与噪声之间区分特异性响度的方式显然随信号与噪声间的相对激励而改变。
[0056]考虑四个情况,指示如何在不同信号水平分配特异性响度。SEthen表示当正弦信号在背景噪声的被掩蔽阈值时,由正弦信号激起的峰值激励。当Esk远低于Ethkn时,全部特异性响度被分配给该噪声,该信号的部分特异性响度趋近于零。第二,当Enmse远低于Ethkq时,该部分特异性响度趋近于当信号为无噪声(in quiet)时的值。第三,当信号在其被掩蔽阈值时,具有激励Ethkn,认为部分特异性响度等于针对信号在绝对阈值的值。最后,当信号位于窄带中间并远高于其被掩蔽阈值时,信号响度趋近于其未经掩蔽的值。因此,该信号的部分特异性响度也趋近于其未经掩蔽值。
[0057]考虑这样的各种边界状况的暗示。在被掩蔽阈值,特异性响度等于当信号为无噪声时在阈值的响度。该特异性响度比从如上方等式预测的特异性响度更低,推定原因在于该信号的若干特异性响度被分配给噪声。为了获得该信号的正确特异性响度,假设分配给该噪声的特异性响度以因子B增加,其中,
【权利要求】
1.一种用于确定对在由直接信号分量(100)和混响信号分量(102)所组成的混合信号中的混响的感知水平的度量的装置,所述装置包含: 响度模型处理器(104),包括用于滤波所述原始信号分量(100)、所述混响信号分量(102)或所述混合信号的感知滤波级,其中,所述感知滤波级被配置为用于模型化实体的听觉感知机构以获得滤波后的直接信号、滤波后的混响信号、或滤波后的混合信号; 响度估计器,用于使用所述滤波后的直接信号估计第一响度度量,并用于使用所述滤波后的混响信号或所述滤波后的混合信号估计第二响度度量,其中,所述滤波后的混合信号从所述直接信号分量与所述混响信号分量的混叠得出;以及 组合器(110),用于组合所述第一响度度量与所述第二响度度量(106、108)以获得对于所述混响的感知水平的度量(112)。
2.根据权利要求1所述的装置,其中,所述响度估计器(104b)被配置为:估计所述第一响度度量,以使所述滤波后的直接信号被视为刺激,并且所述滤波后的混响信号被视为噪声;或估计所述第二响度度量(108),以使所述滤波后的混响信号被视为刺激,并且所述滤波后的直接信号被视为噪声。
3.根据权利要求1或2所述的装置,其中,所述响度估计器(104b)被配置为计算所述第一响度度量为所述滤波后的直接信号的响度,或计算所述第二响度度量为所述滤波后的混响信号或所述混合信号的响度。
4.根据任一前述权利要求所述的装置,其中,所述组合器(110)被配置为使用所述第一响度度量(106)和所述第二响度度量(108)计算差值。
5.根据权利要求1所述装置,还包括: 预测器(114),用于 基于对于不同信号帧(k)的所述感知响度的至少两个度量的平均值(904)来预测所述混响的感知水平。
6.根据权利要求5所述的装置,其中,所述预测器(114)被配置为在预测(900)中使用常数项(901、903)、取决于所述平均值(904)的线性项、及定标因子(902)。
7.根据权利要求5或6所述的装置,其中,所述常数项(903)取决于描述用于在人工混响器内产生所述混响信号的所述混响滤波器(606)的所述混响参数。
8.根据任一前述权利要求所述的装置,其中,所述滤波级包括时频变换级(300), 其中,所述响度估计器(104b)被配置为对多个频带获得的结果进行加和(104c、104d),以推导对包括所述直接信号分量和所述混响信号分量的宽带混合信号的所述第一响度度量和所述第二响度度量(106、108)。
9.根据任一前述权利要求所述的装置,其中,所述滤波级(104a)包含: 耳传递滤波器(302)、激励模式计算器(304)、和时间积分器(306)来推导所述滤波后的直接信号、所述滤波后的混响信号、或所述滤波后的混合信号。
10.一种确定在包括直接信号分量(100)和混响信号分量(102)的混合信号中对混响感知水平的度量的方法,所述方法包括: 滤波(104)所述原始信号分量(100)、所述混响信号分量(102)或所述混合信号,其中,所述滤波使用感知滤波级执行,所述感知滤波级被配置为用于模型化实体的听觉感知机构以获得滤波后的直接信号、滤波后的混响信号、或滤波后的混合信号; 使用所述滤波后的直接信号估计第一响度度量;使用所述滤波后的混响信号或所述滤波后的混合信号估计第二响度度量,其中,所述滤波后的混合信号是从所述直接信号分量和所述混响信号分量的混叠得出;以及 组合(110)所述第一响度度量与所述第二响度度量(106、108)以获得对所述混响的感知水平的度量(I 12)。
11.一种用于从直接信号分量(800)产生混响后的信号(808)的音频处理器,所述音频处理器包括: 混响器(801),用于混响所述直接信号分量(800)以获得混响后的信号分量(806); 根据权利要求1至9中任一项所述的用于确定在包含所述直接信号分量和所述混响后的信号分量的所述混响后的信号中对于所述混响的感知水平的度量的装置; 控制器(803),用于接收由用于确定所述混响感知水平的度量的装置(802)所产生的所述感知水平(R),并用于根据所述感知水平和目标值来产生控制信号(804); 处置器(805 ),用于根据所述控制值(804 )处置所述原始信号分量(800 )或所述混响信号分量(806);以及 组合器(807),用于组合所述处置后的原始信号分量及所述处置后的混响信号分量,或用于组合所述原始信 号分量和所述处置后的混响信号分量,或用于组合所述处置后的原始信号分量和所述混响信号分量以获得所述混合信号(808)。
12.根据权利要求11所述的装置,其中,所述处置器(805)包括用于通过增益值加权所述混响信号分量的加权器,所述增益值由所述控制信号确定,或 其中,所述混响器(801)包括可变滤波器,所述滤波器可响应于所述控制信号(804)而进行变化。
13.根据权利要求12项的装置,其中,所述混响器(801)具有固定滤波器, 其中,所述处置器(805)具有所述加权器以产生所述处置后的混响信号分量,以及 其中,所述加法器(807)被配置为将所述直接信号分量和所述处置后的混响信号分量相加获得所述混合信号(808 )。
14.一种用于从直接信号分量(800)产生混响后的信号(808)的处理音频信号的方法,所述方法包括: 混响(801)所述直接信号分量(800)以获得混响后的信号分量(806); 根据权利要求10所述的确定在包括所述直接信号分量和所述混响后的信号分量的所述混响后的信号中对于混响感知水平的度量的方法; 接收通过用于确定混响感知水平的度量的所述方法(802)所产生的所述感知水平CR), 根据所述感知水平和目标值而产生(803)控制信号(804); 根据所述控制值(804)处置(805)所述原始信号分量(800)或所述混响信号分量(806);以及 组合(807)所述处置后的原始信号分量和所述处置后的混响信号分量,或组合所述原始信号分量和所述处置后的混响信号分量,或组合所述处置后的原始信号分量和所述混响信号分量以获得所述混合信号(808)。
15.一种具有程序代码的计算机程序,当所述计算机程序在计算机上运行时所述程序代码用于执行根据权利要求10或14所述的方法。
【文档编号】G10K15/12GK103430574SQ201280011192
【公开日】2013年12月4日 申请日期:2012年2月24日 优先权日:2011年3月2日
【发明者】克里斯蒂安·乌勒, 约尼·保卢斯, 于尔根·赫莱, 彼得·普罗克因, 奥利弗·黑尔慕斯 申请人:弗兰霍菲尔运输应用研究公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1