自动响度控制的制作方法

文档序号:7542073阅读:167来源:国知局
自动响度控制的制作方法
【专利摘要】一种改进的自动响度控制系统和方法包括:控制施加至输入音频信号的增益/衰减并且提供为放大的/衰减的输入音频信号的输出音频信号;根据输入音频信号来评估输入音频信号的实际响度并且根据音量控制输入来评估输入音频信号的期望响度;以及根据输入音频信号的实际响度和期望响度来评估施加至输入音频信号的增益/衰减。
【专利说明】自动响度控制
【技术领域】
[0001]本文中公开的系统和方法涉及尤其用于音频再现系统的自动响度控制系统和方法。
【背景技术】
[0002]任何类型的音频内容均可以音频信号的形式存储在诸如CD、DVD、半导体存储器、硬盘等的多种大容量存储介质上。高效音频信号压缩方法(如MP3)允许存储甚至更多的音频内容(例如但不限于较小存储介质上的具有多个不同种类和艺术家的音乐)。不同的内容可合并成播放列表。广播可为包括音乐和语音、电台节目和广告等在内的不同音频内容的来源。单独的或彼此组合的各种内容可提供具有强烈变化的信号级和信号动态的音频信号,所述音频信号由于具有不同的响度级而被听众察觉。然而,通常认为过度的响度级、高动态等会令人不悦或甚至令人烦恼。常见的自动响度控制系统和方法旨在整平此类响度波动,但其不能足够有效或者会使音频内容劣化。为了解决这些和其它所关注的问题,改进的自动响度控制(ALC)系统和方法将有所帮助。

【发明内容】

[0003]一种改进的自动响度控制系统包括:具有增益/衰减控制输入、音频信号输入、音频信号输出的可控增益/衰减单元,并且其在音频信号输出与音频信号输入之间的增益/衰减由增益/衰减控制输入信号控制。增益/衰减评估单元连接至可控增益/衰减单元的增益/衰减控制输入并且具有实际响度输入和期望响度输入。实际响度评估单元连接在可控增益/衰减单元的音频信号输入之间并且向增益/衰减评估单元提供实际响度输入。期望响度评估单元连接至增益/衰减评估单元的期望响度输入并且具有音量控制输入。增益/衰减评估单元被配置用于根据提供至期望响度评估单元的音量控制输入和可控增益/衰减单元的音频信号输入的信号来控制可控增益/衰减单元。
[0004]一种改进的自动响度控制方法包括:控制施加至输入音频信号的增益/衰减并且提供为放大的/衰减的输入音频信号的输出音频信号;根据输入音频信号来评估输入音频信号的实际响度并且根据音量控制输入来评估输入音频信号的期望响度;以及根据输入音频信号的实际响度和期望响度来评估施加至输入音频信号的增益/衰减。
【专利附图】

【附图说明】
[0005]下文根据附图中各图所示出的示例性实施方案对各具体实施方案进行更加详细地描述。除非另外说明,相似或相同的部分在所有的图中用相同的参考标号来标记。
[0006]图1为示出响度与响度级之间关系的图。
[0007]图2为示出人耳的f等响度级曲线的图。
[0008]图3为示出具有频率独立增益/衰减控制的示例性自动响度控制系统的框图。
[0009]图4为示出具有频率独立增益/衰减控制的另一示例性自动响度控制系统的框图。
[0010]图5为示出具有频率依赖增益/衰减控制的示例性自动响度控制系统的框图。
[0011]图6为示出具有频率依赖增益/衰减控制的另一示例性自动响度控制系统的框图,所述自动响度控制系统涉及合成背景噪声。
[0012]图7为示出各种车速下车辆内部背景噪声的典型特性的图。
[0013]图8为示出具有频率依赖动态增益/衰减控制的示例性自动响度控制系统的框图,所述自动响度控制系统利用心理声学模型(PAM)来计算输入信号的频谱响度。
[0014]图9为示出具有频率依赖动态增益/衰减控制的另一示例性自动响度控制系统的框图,所述自动响度控制系统涉及合成背景噪声以限定由音量设置控制的响度的期望频谱轨迹。
[0015]图10为示出具有频率依赖动态增益/衰减控制的另一示例性自动响度控制系统的框图,所述自动响度控制系统涉及由音量设置控制的期望合成背景噪声的频谱响度曲线。
[0016]图11为示出用于在改进的ALC系统中实现期望响度曲线的示例性心理声学建模单元的框图。
[0017]图12为示出具有频率依赖动态增益/衰减控制的示例性自动响度控制系统的框图,所述自动响度控制系统涉及听觉拾取的背景噪声。
[0018]图13为示出具有频率依赖动态增益/衰减控制的另一示例性自动响度控制系统的框图,所述自动响度控制系统涉及听觉拾取的背景噪声。
[0019]图14为示出具有频率依赖动态增益/衰减控制的另一示例性自动响度控制系统的框图,所述自动响度控制系统涉及听觉拾取的背景噪声。
[0020]图15为示出不同有色噪声的频率特性的框图。
【具体实施方式】
[0021 ] 根据美国国家标准学会的〃美国国家心理声学术语(American nationalpsychoacoustical terminology) 〃,S3.20, 1973,美国标准协会,〃响度〃被定义为〃声音按照其从安静到响亮的范围排序的听觉属性〃。换言之,响度为声音的质量,其主要是物理强度的心理关联(量级)。对响度的感知与声压级和声音持续时间有关。人的听觉系统会整合(均化)600-1,OOOrns窗口内的声压级(SPL)的效应。例如,当将20、50、100、200ms的样本播放达到最多大约I秒时(此刻对响度的感知将稳定),将感知到恒定SPL的声音的响度增加。对于大于I秒的长持续时间声音,对响度的瞬间感知将基于对前600-1,OOOrns的整

口 ο
[0022]就长于I秒的声音的SPL与响度之间的关系而言,其可近似地由相对于声压或声强绘制的幂函数斯蒂文思幂定律(Stevens Power Law)来表示。随后进行更加精确的测量,其显示响度在低级别和高级别下快速增长(具有较高的指数),在中等级别下增长不快(具有较低的指数)。
[0023]用于度量响度的单位是宋(响度N)和方(响度级L)。对于逸出的均匀噪声信号,宋与方之间的关系如图1所示。均匀的逸出噪声旨在表示平均音频信号。窄带信号,特别是周期信号表现出不同的关系。[0024]人耳的敏感度随着频率变化,如图2的图所示。该图中的每个线条表示要感知为等响度的频率所需的SPL,据此实线描绘出根据IS0226:2003修订本的等响度线,并且标记有"ο"的线条描绘出针对40方的初始ISO标准。该图表明,人对2 - 4kHz左右的声音最为敏感,其中敏感度在此区域的任一侧均会下降。响度感知的完整模型包括通过每种声音的频率和持续时间对SPL的整合。
[0025]当同时听到两种声音时,一种声音可能〃掩蔽〃另一种声音,这意味着听众仅会听到两种声音中较响的声音。这被称为同时掩蔽或听觉掩蔽。同时掩蔽仅在一种声音几乎完全覆盖另一种声音的时频分布时发生。较响的信号可称为"掩蔽信号",而较静的信号可称为"被掩蔽信号"。如果在每个频率上掩蔽信号和信号两者的响度与单独的掩蔽信号的响度之间的差值低于响度的最小可觉差(JND)(约ldB),则发生同时掩蔽。
[0026]时域掩蔽也称为〃异时掩蔽",其在突然刺激声音使得恰好在刺激之前或刺激之后存在的其它声音无法听见时发生。使得恰好在掩蔽信号之前的声音模糊的掩蔽称为后向掩蔽或超前掩蔽,而使得恰好在掩蔽信号之后的声音模糊的掩蔽称为前向掩蔽或滞后掩蔽。时域掩蔽的效率从掩蔽信号的起始到偏移以指数衰减,其中起始衰减持续大约20ms,偏移衰减持续大约100ms。与同时掩蔽类似,时域掩蔽反映出听觉系统所进行的频率分析。当具有相似频率的两个音调一起播放时,其组合响度为其强度之和的立方根。当各频率相隔比一个临界频带更远时,它们的响度级反而会叠加在一起。
[0027]现参照图3,示出示例性自动响度控制系统,其连接在音频信号源I与扬声器2之间。该系统包括可控增益/衰减单元3,例如,具有可控增益或衰减器的放大器或允许同时控制增益和衰减的倍增器,视情况而定。音频源I生成输入音频信号X [k],该音频信号被提供至心理声学建模(PAM)单元如响度建模单元4和提供至可控增益/衰减单元3的音频信号输入。响度建模单元4通过电例如数字信号并且根据(数字)心理声学掩蔽模型来重现人耳的声学掩蔽行为或其选定的掩蔽效应。
[0028]响度建模单元4将·表示输入音频信号x[k]的经计算的(宽频带)响度(级)曲线的响度信号LoudSig[k]提供至响度级计算单元5,响度级计算单元5计算输入音频信号x[k]的响度级信号LoudLevsig[k],即其实际响度级。通过音量-响度级转换单元6将期望响度级以期望响度级信号LoudLev1^[Vol]提供。音量-响度级转换单元6可例如利用查表法或转换计算方案。可通过音量控制元件(未示出)如控制轮、电位计、键盘、触摸屏等来选择期望响度级,该音量控制元件向音量-响度级转换单元6提供音量(Vol)设置(或信号)。
[0029]将实际响度级和期望响度级,即响度信号LoudLevsig[k]和LoudLevDes [Vol]馈送入生成控制增益/衰减单元3的增益/衰减控制信号G[k]的增益/衰减计算单元7,使得输入音频信号x[k]被增益/衰减单元3放大/衰减,从而将输出音频信号输出[k]提供至扬声器2。因此,控制施加至输入音频信号的增益/衰减并且以输出音频信号输出(k)的形式提供放大的/衰减的输入音频信号。根据输入音频信号来确定(例如计算)输入音频信号的实际响度,并根据音量控制输入来确定(例如计算)输入音频信号的期望响度。根据输入音频信号的实际响度和期望响度来确定待施加至输入音频信号的增益/衰减。
[0030]在图4中,示出根据音量(Vol)设置生成期望响度级信号LoudLevlles [Vol]的替代方式。向音量-响度级转换单元8提供Vol设置以由其提供音量级信号VolLev[Vol]。音量-响度级转换单元8可利用表示响度N与响度级L之间的关系(如图1中所示)的图表或数学方程,其中音量(Vol)对应于响度N并且音量级VolLev [Vol]对应于响度N。将音量级VolLev [Vol]提供至向等响度单元9,等响度单元9提供表示期望宽频带响度的期望响度信号L0UdDes[V0l]。等响度单元9可通过图表、数学算法、软件模型等利用感知等响度级的曲线,也称为等响度曲线或等响度级曲线,如图2的图所示。然后通过响度级计算单元10将期望响度,即期望响度信号LoudDes[Vol]转换成期望响度级信号LoudLeVDes[Vol],将该期望响度级信号提供至增益/衰减计算单元7。
[0031]图3和4的系统对于其中响度的频谱方面不太重要或不占主导(例如与单调或均匀的音频信号一样)的所有应用而言完全足够。然而,在其中所有音频信号频谱分布重要的所有情况中,就频谱特性而言,更先进的系统是有利的。
[0032]参照图5,其基于图4的系统。图4的系统具有频率依赖可控增益/衰减单元,例如代替频率独立增益/衰减单元3的可控均衡(EQ)单元11可代替增益/衰减计算单元7的滤波器系数计算单元12。可除去响度级计算单元5和响度级计算单元10以使得响度建模单元4和等响度单元9直接耦合至可控均衡单元11,从而将实际响度信号LoudSig[k]和期望响度信号Loudltes[Vol]提供至可控均衡单元11。可控均衡单元11向输入音频信号x[k]提供频率依赖增益/衰减。
[0033]有若干种方法来实现可控均衡单元11的均衡功能性。例如,将频域中的快速卷积与时域中的输入音频信号X[k]的快速傅里叶变换(FFT)和频域中的经处理的信号音频信号x[k]的快速傅里叶逆变换结合使用,使得输出音频信号输出[k]处于时域中。另一种选择是用(受限)有限脉冲响应滤波器(FIR)来处理时域中的输入音频信号x[k]。第一种选择需要更大的内存,但计算时间较短;第二中选择需要较小的内存,但计算时间较长。均衡的其它适用方法可包括预测器或预测误差滤波器,其系数可通过使用例如梯度自适应格型(GAL)或莱文森-德宾(Levinson-Durbin)递归算法进行线性预测编码(LPC)分析来确定。
[0034]自动响度控制系统和方法的缺点(尤其是在汽车应用中)是背景噪声。例如在车辆中,扬声器2发出的声学音频信号应可由听众感知,这意味着其必须超过所存在的噪声,但总的音频信号级不应超过某个级以便仍然被感知为是愉悦的。
[0035]参照图6,为了解决背景噪声问题,向图5的系统添加噪声合成器单元13,其利用噪声合成模型并且评估至少一种对应于背景噪声的(非声学)噪声相关信号nrs[k],例如代表车辆速度或车辆引擎的每分转数(rpm)的信号。例如,由电机产生并且主要取决于电机的噪声和/或由车轮或风产生并且主要取决于车辆速度的噪声可能对车辆内部的背景噪声贡献最大。噪声合成器单元13根据经评估的噪声相关信号nrs[k]产生与车辆内部的背景噪声相似或甚至相同的声音,并且将该合成的(例如"估计的〃)噪声以背景噪声信号b[k]的形式作为二次输入提供至响度建模单元4,然后响度建模单元4生成输入音频信号x[k]和背景噪声信号b[k]两者的实际响度信号LoudSig[k]和Loud噪声[k]并且将其提供至滤波器系数计算单元12。滤波器系数计算单元12控制可控均衡单元11的滤波器系数,可控均衡单元11根据两种实际响度信号LoudSig[k]和Loud噪声[k]来提供输入音频信号x[k]的频率依赖增益/衰减。计算可包括将信号LoucLs[Vol]和Loud噪声[k]的最大值进行相互对比,从而形成与实际响度信号LoudSig[k]进行对比的新的基准(而非仅Loudltes[Vol])。新的基准与实际响度信号LoudSig[k]之间的差异指示要达到期望响度而必须对系数进行改变的程度。[0036]可使用背景噪声分布(B卩,各种车速rpm等的实际背景噪声特性来评估车辆内部存在的背景噪声,而非基于表示噪声的信号的估计。图7以噪声SPL(单位dB)和频率f (单位Hz)示出车辆内部针对各种车速的背景噪声的此类(如一次测量的和存储的)特性。可看出,振幅和频率按照速度的分布表现出相似的形状,然而,针对频率的水平根据车辆速度偏移-速度越高,水平越高。通过此背景噪声分布和测定车辆速度的传感器,可易于合成背景噪声。
[0037]图8示出主要在频域中处理信号的改进的ALC系统。在图8的系统中,音频信号源I将位于时域中的输入音频信号x[k]提供至快速傅里叶变换(FFT)单元15,快速傅里叶变换(FFT)单元15将输入音频信号X[k]变换成频域中的输入音频信号Χ(ω)。将输入音频信号Χ(ω)提供至心理声学模型(PAM)单元如心理声学增益成形单元14以及提供至倍增器16,倍增器16还接收来自心理声学增益成形单元14的表示频谱增益系数的信号G(co)并且生成频谱输出音频信号输出(ω),该频谱输出音频信号输出被馈送入快速傅里叶逆变换(IFFT)单元17,在其中变换成时域中的输出音频信号输出[k]。通过另一快速傅里叶变换(FFT)单元18将估计的噪声频谱Ns(co)提供至心理声学增益成形单元14,快速傅里叶变换(FFT)单元18将来自时域的噪声信号\[?变换成频域中估计的噪声频谱Ns(co)。估计的噪声信号ns[k]为背景噪声发生器/合成器20的放大的/衰减的输出信号。根据音量(Vol)设置通过可控增益/衰减单元19将增益/衰减施加至输入音频信号X [k],其可通过心理声学模型(PAM)变换成期望的宽频带响度函数。
[0038]可将线性预测编码(LPC)用作通过缩减长度并且在时域中转换增益/衰减系数g的简单而有效的方g,所述增益/衰减系数g可施加到预测滤波器中。可使用快速傅里叶变换(FFT)(或翘曲快速傅里叶变换(WFFT))进行时间向频谱域的转换,其中某些频谱槽可以心理声学刺激的不同宽度的频带(例如基于Bark标度)归组。
[0039]线性预测编码(LPC)是频 谱估计和合成的方法。在语音编码中,LPC尝试以滤波器系数估计声音的功率谱密度(PSD),当施加至激励源时需要所述滤波器系数来合成所述声音,激励源可为其中谐波具有相同振幅噪声或频带限制脉冲波。在这种情况下的合成应用中,可修改激励波形和滤波器系数(在频率和时域两者中)以创建初始声音的相关变量。
[0040]当计算频率依赖增益系数G(co)时,输入音频信号Χ(ω)的频谱可连同估计的噪声频谱Ns(Co) —起使用。这样做时,除了耳特性的详细再现之外,还考虑了掩蔽效应。人耳的区分频率分解性质可视为早在时间范围向频谱范围的转换期间-例如使用心理声学刺激的滤波器组或WFFT,但这并非强制性的。还可使用常规的FFT,然后以心理声学刺激的组和子带自适应滤波器的可变抽头分布来处理频谱线。
[0041]可在频域中使用快速卷积进行输入音频信号x[k]的均衡。根据FIR滤波器或FFT(快速傅里叶变换)的长度,此方法可显著地缩短计算时间。一般的经验法则是:使用快速卷积可以比在时域中更高的计算效率实施长度为约30个抽头的FIR滤波器。然而,快速卷积可在某些情况下显著地增加内存要求。这不仅是与快速卷积相关的问题;其还发生在频域中每种形式的信号处理时。具有不同宽度的频带的FFT或翘曲FFT(WFFT)或心理声学刺激的滤波器组可用于时间向频域的转换。此处可能已考虑人耳的频率分解特性。然而,如已经提到的,还可使用常规的FFT。在这种情况下,随后以频域中的组来处理频谱线以考虑人耳的频率分解特性。适用的心理声学模型为例如Johnston模型或MPEG模型。[0042]图9中示出图8的改进的系统。在图9的系统中,噪声信号Ns(GJ)的放大/衰减从时域偏移到频域。因此,省略了在时域中操作的可控增益/衰减单元19,而在快速傅里叶变换(FFT)单元18与心理声学增益成形单元14之间添加了在频域中操作的可控增益/衰减单元21。
[0043]图10中示出图9的改进的系统。在图10的系统中,省略了在时域中操作的背景噪声发生器/合成器20并且省略了快速傅里叶变换(FFT)单元18,而在可控增益/衰减单元21上游增加了背景噪声合成器22。图10的系统在性能方面效率高并且使得任何方式的有色噪声信号或其功率谱密度(PSD)根据心理声学频谱例如Bark标度直接进行处理,并且在应用心理声学模型之前由音量(Vol)设置直接进行控制。从图10可看出,不需要在时域中操作的额外的噪声发生器/合成器和具有例如Bark标度的FFT。根据基准信号(规定为期望噪声)和输入音频信号例如音乐信号)的响度/掩蔽阈值之间的差值通过频率依赖增M /裳减(G (ω))控制来在图10的系统(如在图8和9的系统中)中进彳丁均衡。
[0044]可通过诸如传声器的声学传感器来拾取瞬时噪声信号,而非根据非声学传感器信号近似或估计噪声信号。此类传声器可在车辆内部接近听众的头部布置。在图12、13和14中,描述了利用声学噪声传感器和甚至更先进的心理声学建模的ALC系统。
[0045]参照图11,用于改进的ALC系统的示例性心理声学建模单元(在频域中)可包括两个提供输出掩蔽阈值MaskThm(m)和MaskThn(m)的掩蔽阈值计算单元23和24。一个掩蔽阈值计算单元(23)解决音频信号的掩蔽,另一个掩蔽阈值计算单元(24)解决关于音量(Vol)设置(和噪声,视情况而定)的掩蔽。掩蔽阈值计算单元23接收表示正常人耳听力的绝对阈值的声压级掩蔽阈值Thm splOn)和阈值Τ,(πι)。掩蔽阈值计算单元24接收表示等响度级曲线的声压级掩蔽阈值Thn spl (m)和阈值Td(m)。阈值Tq(m)由例如存储器25提供;阈值Thmspl (m)和Thn spl (m)由接收阈值Tm (m)、Tn (m)和(如果需要)参考级P_Ref的SPL转换单元26提供;并且阈值Td(Hi)由 等响度单元27提供。向音量-响度级转换单元28提供音量设置Vol以由其提供音量级信号\(m)。音量-响度级转换单元28可利用表示响度N与响度级L之间的关系(如图1中所示)的图表或数学方程,其中音量Vol对应于响度N并且音量级'对应于响度N。将音量级VJm)提供至向等响度单元27。在本文中,k为(离散)时间指数,ω为(离散)频率指数(槽)并且m为某个频群槽的数量(例如在Bark中)。
[0046]如在以上参照图5描述的系统中,在图11的心理声学建模单元的部分中,音量(Vol)设置被转换成响度级VJm)。通过响度级VJm),等响度单元27中选择等响度级曲线中的一条曲线,据此阈值Td(m)表示所选曲线,例如在可在内存消耗方面更有效并且在心理声学方面是有效的心理声学频(Bark)域中。为了增加由曲线数量限定的阈值Td(m)的分辨率,可应用两条相邻曲线之间的插值。
[0047]如图11中所示的心理声学建模单元的部分可集成于与图6、8、9和10中所示的那些类似的ALC系统中。实现此的一种有效方式可仅在心理声学建模过程的后期包括等响度级的Bark标度曲线。内存需求较小,对于1024点FFT而言,因为仅需存储24个Bark值而非513个。该操作可描述如下:
[0048]Tn spl (m),如果 Tn—spl (m) > 增益偏移 Td (m)
[0049]掩蔽Thn(m) = {(I)
[0050]增益偏移Td (m),其他情况[0051]Bark 增益(m) =掩蔽 Thn(m)_ 掩蔽 Thm (m)(2)
[0052]方程⑴描述了所选等响度曲线Td(m)如何可与所测噪声信号Tn spl(Hi)的(多个)掩蔽阈值结合,所选等响度曲线独立于输入音频信号X[k]用作期望响度的基准。可看出,检测两者的最大值,据此在检测最大值之前,对所选等响度曲线Td(Hl)进行加权,以便将曲线偏移到适当的操作范围中。可另外地或替代地在其他地方进行加权,例如在音量-响度级转换单元中。[0053]方程⑵描述了如何计算频谱增益/衰减G(co)。可看出,频谱增益/衰减G(co)对应于输入音频信号(音乐信号)的掩蔽阈值Tm(Hi)与如由方程(I)推导出的既表示背景噪声又表示期望响度的掩蔽阈值!^!!!)的差值。根据方程(2)计算的Bark增益(衰减Kt-Bark增益(m)可为正和负(并且反之亦然)。[0054]Bark增益(衰减)值-Bark增益(m)可根据瞬时音频信号或其掩蔽阈值-掩蔽Thm(m)不仅控制音频信号的响度,还控制其频谱(频率特性)。因此,本文提出的ALC系统和方法可能能够根据当前背景噪声的音频信号和实际响度来调节音频信号的正确实际响度和正确实际心理声学频谱。
[0055]图11的心理声学建模单元还可应用于图12中所示的ALC系统,在该系统中,其被称为心理声学增益成形单元29。在图12的系统中,音频信号源I将输入音频信号x[k],例如来自CD播放器、收音机、盒式放音机等的音乐信号提供至在频域中操作的ALC系统并且将输出音频信号输出[k]提供至扬声器2。扬声器2从信号输出[k]生成声学信号;所述声学信号经由可由传递函数H(Z)描述的传递路径31传递至传声器30。来自传声器30的信号可经由频谱语音抑制装置32、33、34和心理声学增益成形单元29 (两者均在频域中操作)提供至可控频谱增益/衰减单元11,例如可控均衡单元。
[0056]ALC系统还包括用于将来自时域的信号变换成频域中的信号的快速傅里叶变换(FFT)单元35。频谱语音抑制装置32、33、34包括连接在快速傅里叶变换(FFT)单元35下游的平均值计算单元32、后续语音活动解码器(VAD) 33和后续最大量级检测器34,后续最大量级检测器34检测通过VAD33向其提供的信号和从快速傅里叶变换(FFT)单元18接收的信号的最大量级。在平均值计算单元32中,将来自FFT单元35的频域信号均化并且提供至VAD33以抑制来自FFT单元35的信号中的频谱语音信号分量。可使用用于检测和抑制语音分量的任何其它布置方式或方法(例如最小统计算法)来代替VAD。
[0057]可将来自最大量级检测器34的信号提供至心理声学增益成形单元29,心理声学增益成形单元29从快速傅里叶变换(FFT)单元15接收信号并且将信号传输至频谱增益/衰减单元11。增益/衰减单元11连接在快速傅里叶变换(FFT)单元15下游,快速傅里叶变换(FFT)单元15接收信号x[k]并且将其变换成频谱信号Χ(ω)。可将信号Χ(ω)提供至频域自适应滤波器(FDAF) 36、心理声学增益成形单元29和增益/衰减单元11 (如倍增器),增益/衰减单元11还可接收表示频谱增益/衰减系数G(co)的频谱增益/衰减信号并且生成频谱信号输出(ω),频谱信号输出(ω)被馈送入快速傅里叶逆变换(IFFT)单元17,在其中变换成时域输出音频信号输出[k]。
[0058]在频域中操作的自适应滤波器36接收表示所讨论的环境中的总声级的时域传声器信号d[k],其中总声级包括来自扬声器2的声音输出和该环境中的环境噪声(例如扬声器-房间-传声器系统)。来自快速傅里叶变换(FFT)单元35的信号Χ(ω)可用作自适应滤波器36的基准信号。将由自适应滤波器36输出的信号Υ(ω)提供至快速傅里叶逆变换(IFFT)单元37并且变换成信号y [k]。在减法器38中,将信号y [k]从来自传声器30的信号中减去并且作为信号s[k]+n[k]提供至FFT单元35。
[0059]将音量(Vol)设置提供至心理声学增益成形单元29和在时域中操作的增益/衰减单元19,增益/衰减单元19将来自噪声发生器20的噪声信号放大/衰减并且向快速傅里叶变换(FFT)单元18提供放大的/衰减的噪声信号\[10。由快速傅里叶变换(FFT)单元18提供的信号Ν3(ω)被馈送入最大量级检测器34,最大量级检测器34还接收来自VAD33的信号Ν_(ω)并且将信号N~(ω)提供至心理声学增益成形单元29。向VAD33提供来自平均值计算单元32的信号S_(co)+N_(co),该信号表示来自快速傅里叶变换(FFT)单元35的均化信号S(?)+N(co)。
[0060]在图11的ALC系统中,除了测量的、估计的或以其它方式评估的背景噪声之外,还将音频信号输入到响度/掩蔽模型中。当可具有任何着色和任何级别的噪声被输入到响度/掩蔽模型中时,自动计算或选择相关的等响度曲线。因此,当很早就结合背景噪声和期望响度(基准)时,无需提供多组等响度级曲线。
[0061]从图12中可看出,噪声发生器20在时域中生成任何方式的有色噪声信号,该有色噪声信号在增益/衰减单元19中根据音量(Vol)设置加权(g)并且随后变换成频域,在频域中,确定其PSD并且与由信号N~(ω)表示的估计的背景噪声的PSD进行比较。在此比较中确定由信号Ν_(ω)表示的最大值并且该最大值随后被馈送入掩蔽模型(例如Johnston模型)。
[0062]图13中示出图12的改进的系统。在图13的系统中,放大/衰减从时域偏移到频域。因此,省略了在时域中操作的可控增益/衰减单元19,而在快速傅里叶变换(FFT)单元18与最大量级检测器34之间添加了在频域中操作的可控增益/衰减单元21。
[0063]图14中示出图13的 改进的系统。在图14的系统中,省略了在时域中操作的背景噪声合成器20并且省略了快速傅里叶变换(FFT)单元18,而在可控增益/衰减单元21下游增加了背景噪声合成器22。
[0064]在上述示例性系统中,利用计算或估计单元和方法进行评估,但也可应用任何其它类型的评估单元或方法。此外,在以上参照图9和10描述的系统的简单构造中,应用于背景噪声的心理声学模型可通过含有表示掩蔽阈值的数据的图表来建立。这些数据通过对应于背景噪声的信号,例如表示速度、rpm等的信号来选择。因此,对应于背景噪声的信号未变换成表示背景噪声的信号,并由此用于直接确定掩蔽阈值。
[0065]图15示出不同有色噪声,特别是白噪声WN、粉红噪声PN和(改变的)IEC286噪声IN的频率特性。如果使用心理声学标度如Bark标度,仅需存储每种特性的24个点。为了更大的灵活性,可存储多种噪声特性的特性。
[0066]尽管已公开了各种实施例,但本领域的技术人员显然可在不脱离本发明的精神和范围的情况下根据各实施方案的【具体实施方式】做出改变和修改。对于本领域的熟练的技术人员而言显然可适当地代替执行相同功能的其它部件。对理念的此类修改意欲为所附权利要求所涵盖。
【权利要求】
1.一种自动响度控制系统,其包括 可控增益/衰减单元,其具有增益/衰减控制输入、音频信号输入、音频信号输出,并且其在音频信号输入与音频信号输出之间的增益/衰减由增益/衰减控制输入信号控制; 增益/衰减评估单元,其连接至所述可控增益/衰减单元的所述增益/衰减控制输入,并且具有实际响度输入和期望响度输入; 实际响度评估单元,其连接在所述可控增益/衰减单元的所述音频信号输入之间,并且向所述增益/衰减评估单元提供所述实际响度输入;和 期望响度评估单元,其连接至所述增益/衰减评估单元的所述期望响度输入,并且具有音量控制输入; 其中所述增益/衰减评估单元被配置用于根据提供至所述期望响度评估单元的所述音量控制输入和所述可控增益/衰减单元的所述音频信号输入的信号来控制所述可控增益/衰减单元。
2.根据权利要求1所述的系统,其中所述增益/衰减计算单元和所述实际响度评估单元中的至少一者进一步包括心理声学建模单元。
3.根据权利要求2所述的系统,其中所述心理声学建模单元利用心理声学掩蔽模型。
4.根据权利要求2或3所述的系统,其中所述心理声学建模单元利用心理声学频标。
5.根据权利要求2-4中一项所述的系统,其中所述心理声学建模单元接收表示或对应于环境背景噪声的信号。
6.根据权利要求1-5中的一项所述的系统,其中所述心理声学建模单元接收表示期望响度的信号。
7.根据权利要求6所述的系统,其中所述心理声学建模单元接收来自最大量级比较器的信号,所述信号提供所述背景噪声和所述输入音频信号的最大量级中的较高的一者。
8.根据权利要求1-7中的一项所述的系统,其中所述增益/衰减评估单元和所述可控增益/衰减单元被配置用于对所述增益/衰减提供频率依赖控制,以在音频信号输入与音频信号输出之间提供频率依赖增益/衰减。
9.根据权利要求1-8中的一项所述的系统,其中所述可控增益/衰减单元被配置用于在所述频域中操作。
10.一种自动响度控制方法,其包括: 控制施加至输入音频信号的增益/衰减并且提供输出音频信号,所述输出音频信号为放大的/衰减的输入音频信号; 根据所述输入音频信号来评估所述输入音频信号的实际响度,并且根据音量控制输入来评估所述输入音频信号的期望响度;和 根据所述输入音频信号的所述实际响度和所述期望响度来评估施加至所述输入音频信号的所述增益/衰减。
11.根据权利要求10所述的方法,其中增益/衰减计算和实际响度评估中的至少一者利用心理声学模型。
12.根据权利要求11所述的方法,其中所述心理声学模型包括心理声学掩蔽模型。
13.根据权利要求11或12所述的方法,其中所述心理声学模型利用心理声学频标。
14.根据权利要求11-13中的一项所述的方法,其中所述心理声学模型包括对表不环境背景噪声的信号的评估。
15.根据权利要求11-14中的一项所述的方法,其中所述心理声学模型包括对表不期望响度的信号的评估。
16.根据权利要求10-15中的一项所述的方法,其进一步包括接收提供所述背景噪声和所述输入音频信号的最大量级中的较高的一者的信号。
17.根据权利要求10-16中的一项所述的方法,其中所述音频信号的所述增益/衰减是频率依赖的。
18.根据权利要求10-17中的一项所述的方法,其中所述音频信号的增益/衰减的施加在所述频域进行。
【文档编号】H03G7/00GK103580631SQ201310331512
【公开日】2014年2月12日 申请日期:2013年8月1日 优先权日:2012年8月1日
【发明者】M.克里斯托夫 申请人:哈曼贝克自动系统股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1