基于响度的音频信号补偿的制作方法

文档序号:12136547阅读:530来源:国知局
基于响度的音频信号补偿的制作方法与工艺

本发明涉及用于音频信号处理的系统、方法和技术,具体地,适用于适应不同水平的音频音量(或响度)的处理和/或补偿。



背景技术:

通常,音频信号以特定音量水平产生(例如,记录),但是然后以不同的音量水平被回放。不幸的是,由于人类响度感知的不一致性,该情形通常提出了对于感知音频质量的问题。具体地,人类听觉系统的灵敏度随频率和音量而变化。例如,当在深夜以低音量观看电影时,可能注意到电影声音主要或仅仅被减小为对话,而诸如脚步声的其它(例如,背景)声音变得听不见。这是由于人类听觉系统对特别低或特别高的频率不是非常灵敏而发生的,并且灵敏度的这种降低的严重性在低回放音量变得更糟糕。

因此,期望自适应地补偿在任何回放水平声音分量的所感知的音量的不同,以使得即使回放音量改变,这些分量的所感知的相对响度也不改变。在以上示例中,这表示在任何回放水平与对话相比诸如脚步声的背景声音将听起来同样大。

响度补偿的构思可追溯至1930年代。1935格鲁诺“Tombstone”台式收音机使用模拟电路来产生如下响度补偿频率响应曲线,该曲线:1)较强地提升了低音并且较弱地提升了高音,以及2)随着用户设置的回放音量而变化。该电路基本上固化了响度补偿的基本原理:随着用户设置的回放音量(即,回放装置的音量旋钮的位置)变化的低音和高音提升。

当代的响度补偿技术不是非常不同的,除了采用数字动态均衡器(具体地,架滤波器(shelf filter))以使得音频工程师能够针对耳朵的喜好而对频率范围和提升水平进行微调之外。该微调通常是针对一对回放水平而进行的,然后使用内插来适应其它回放水平。



技术实现要素:

以上方案和现有技术中的类似方案采用对人类响度感知机制的粗略和经验性近似。另一方面,本发明的优选实施例通常提供更精密近似理想响度补偿轮廓而无需费力微调的补偿滤波器。

因此,本发明的一个实施例涉及一种用于基于响度的音频信号补偿的系统。输入线路接受输入音频信号;耦合到输入线路的响度估计器对输入音频信号进行处理以获得音频回放响度水平并且还提供输入音频信号的产生响度水平;以及耦合到响度估计器的输出的滤波器生成器/选择器基于产生响度水平和音频回放响度水平而提供音频补偿滤波器。音频补偿滤波器对输入信号进行处理以提供输出信号。

以上发明内容仅是旨在提供本发明的某些方面的简要描述。可以通过参考权利要求和结合附图的优选实施例的以下详细描述来获得本发明的更完整理解。

附图说明

在以下公开中,参考附图描述本发明。然而,应理解,附图仅描绘了本发明的某些代表性和/或示例性实施例以及特征,并且不旨在以任何方式限制本发明的范围。以下仅是附图中的每个的简要描述。

图1是根据本发明的代表性实施例的音频补偿系统的简化框图。

图2示出了根据ISO 226:2003的各种音量水平的等响度轮廓。

图3示出了某些示例性响度补偿轮廓。

图4示出了某些变型示例性响度补偿轮廓以便限制过度低音增益。

图5是根据本发明的代表性实施例的时域中的回放参考响度估计器的框图。

图6是根据本发明的代表性实施例的频域中的回放参考响度估计器的框图。

图7是用于估计回放参考响度水平并且然后使用基于差值的方案来估计产生(例如,记录)参考响度水平的框图。

图8是用于根据期望响度补偿轮廓来生成滤波器系数的流程图。

图9是示出利用预先存储的补偿滤波器的响度补偿回放系统的框图。

图10是利用短时傅立叶变换(STFT)响度补偿的回放系统的框图。

图11是示出防混叠(anti-aliasing)处理的流程图。

图12是用于使用预先存储的频率响应来执行STFT响度补偿的回放系统的框图。

具体实施方式

为了易于引用,本发明的某些部分被划分成章节。每个章节的总体主题由章节的标题来指示。

在图1中示出了根据本发明的优选实施例的用于音频补偿的系统5的总体配置。如以下更详细地讨论的,系统5的目标之一是使用频率相关增益曲线而为音频信号的不同频率分量提供不同的增益,该频率相关增益曲线根据音频信号正以多大的响声被回放而变化,并且特别与生成原始音频信号(例如,记录在物理介质上)的音量有关。

在这点上,通常将从存储介质(例如,光盘、固态装置或磁介质)检索输入音频信号7以用于回放,并且这里讨论的特定实施例通常将是这样的情形。然而,替代地,可经由任何类型的连接而从本地源接收输入音频信号7和/或通过任何类型的通信信道而从远程源接收输入音频信号7(在任一情况下,例如,使用包括一个或多个转发节点的、一个或多个直接无线和/或硬接线连接和/或网络,诸如因特网)以用于立即回放。在任意情况下,输入信号7在输入到系统5中之前通常将进行某些预处理(用于多种不同目的中的任意目的)。另外,根据特定实施例,系统5可以独立地起作用或者可以是较大系统(通常为音频回放系统)的一部分。

信号7所对应的原始音频信号通常将以一个音量水平生成,但是端用户希望以不同的音量水平进行回放。然而,如本文其它地方更详细地讨论的,音频谱的人类感知基于响度(或音量)而变化,以使得例如被产生(例如,记录)以在第一音量水平对收听者来说在一定意义上“最优”的音频信号(通常包括一个或多个声音)通常在第二音量将没有相同的质量。例如,某些离散声音在第二音量水平可能被感知为过于安静(或者甚至完全不可感知)或者过响,和/或甚至包括多个频率分量的各个声音可能以在第二音量水平相对于“最优”失真的方式被感知。因此,本发明的目标之一是提供用于通过对要回放的音频信号的频谱应用基于响度的差分增益曲线来补偿这些感知差别的系统、方法和技术。

为此,通常期望识别或估计例如产生(例如,记录)原始音频信号的产生响度水平以及端用户实际正播放或期望播放音频信号的回放响度水平。然而,如以下更详细地讨论的,应注意,这样的估计(具体地,针对再现响度水平)不需要是实际值的估计,而是替代地可以是期望产生收听者主观期望的效果的值的估计。

在当前实施例中,这样的估计在处理块10中执行。以下更详细地讨论响度估计器10的具体实施例,并且如所指示的,每个实施例具有其自己的特有益处组合。然而,一般来说,在各个实施例中,响度估计器10可以使用多种不同输入中的任何输入,诸如输入信号7本身、用户输入12和/或各种其它输入14。在各个实施例中,可以在响度估计器10内处理输入信号7以估计瞬时回放响度水平和/或使用指定假设(例如,关于原始音频信号生成系统和/或随后的传送、存储和/或回放系统中的增益)和/或校准信息来估计产生响度水平。

根据特定实施例,用户输入12可以包括用户提供(例如,手动)或者响应于用户采取的动作(例如,语音命令或姿势)而生成的多种不同信号中的任意信号。这样的用户输入12可以包括例如下述中的任意或全部:端用户经由回放装置的用户接口选择的音量水平、与产生响度水平对应的值的选择、表示产生响度水平与回放响度水平之间的差的值的选择和/或表示影响回放响度的任意其它因素或与表示影响回放响度的任意其它因素对应的一个或多个值的选择(诸如室内声学、扬声器或耳机灵敏度、扬声器的数量或布局和/或相对于扬声器的收听者距离)。如果提供,这些用户输入信号12通常反映用户做出的至少一个手动设置。

相反,如果提供,其它输入14通常将自动生成和/或从一些其它源接收(例如,作为伴随输入信号7的元数据,诸如指示特定相对大音频内容(诸如整首歌曲或音频曲目)的瞬时或总体产生响度水平的元数据),并且可反映例如以下的某个方面:原始音频信号生成,原始音频信号存储或传送处理和/或介质,和/或总体音频回放系统(例如,室内声学和/或耳机特性)。例如,其它输入14可以包括回放装置中的放大器的检测特性和/或音频信号的发起者提供的元数据。另外,在一些实施例中,回放装置自动检测正使用的耳机的类型(例如,USB耳机或蓝牙耳机),并且检索指示耳机的灵敏度和/或当前音量设置的预先存储值,该值然后用作一个或多个其它输入14。此外,在一些实施例中,可以由回放装置来执行校准过程,其中,通过回放系统的扬声器播放参考音频信号,并且放置具有已知特性的麦克风(例如,收听者期望的位置),以便检测从扬声器的输入到收听者可能遇到的声音压力水平的总体增益的一个或多个测量值(由此反映扬声器灵敏度与室内声学的组合),这一个或多个测量值然后可以被存储并且稍后被提供作为其它输入14。

在任意情况下,基于(例如,所接收的和/或内部生成的)信息,估计模块10优选地生成至少产生响度和回放响度的估计。根据特定实施例,这些值之一或两者可以对于特定音频(例如,歌曲、歌曲专辑、视频配乐或者音乐或其它音频文件)的整个持续时间是不变的,或者可以以固定的时间间隔(例如,从10毫秒(ms)到10秒的任意地方)或者可变时间间隔(例如,具有一致音频特性的间隔)而动态地估计,和/或可以在收听者期望时变更。

在以下讨论的实施例中,有时仅各种输入7、10和12的子集被讨论和/或示出为被提供到响度估计器10。然而,这样的简化仅是为了易于讨论和/或图示。应理解,在本发明的任意实施例中,这样的输入7、10和12的任意组合或全部可被提供到响度估计器10并且由响度估计器10使用。

以下讨论一般指的是如下实施例:其中,预先记录原始信号,并且通过读取预先记录的信号来生成输入信号7。然而,应理解,这些实施例仅是示例性的,期望不失一般性,并且同样的概念和术语旨在包括原始信号被产生并且然后例如被传送或者提供而没有任何中间记录步骤的情形。即,这里对“记录”、“所记录的”或基础词“记录”的其它变型的各个引用旨在包括生成、产生和/或提供原始信号的任何方式而与信号实际上是否被记录无关,并且这里对词“记录”的任何形式的引用可以以词“生成”、“产生”或“提供”的相应形式来替换。另外,根据本发明的补偿系统5可被插入到期望响度补偿的任何音频信号处理链中,包括但不限于音频混合和/或产生信号链以及回放系统。

再次参照图1,来自模块10的响度估计被提供到滤波器生成器/选择器模块18以基于这样的估计来使用,该滤波器生成器/选择器模块18生成补偿滤波器20或检索预先存储的滤波器20。在优选实施例中,基于ISO226:2003的等响度轮廓而生成或选择补偿滤波器20。然而,在替选实施例中,可替代地使用其它(例如,类似)等响度轮廓和/或可使用其它技术。如本领域公知的,等响度轮廓是在频谱内纯稳定音调被人感知为同样响的声音压力水平(SPL)的轮廓。在ISO 226:2003中,对具有频率f的纯音的SPL(以dB表示为L(f))进行调整,直到其被感知为与1000赫兹(Hz)的参考音调一样响为止,该参考音调的SPL以dB表示为R。因此,轮廓通常以参考音调的响度R来标记,因此,等响度轮廓可以以L(f;R)来表示。R的值也用作响度水平的测量值,其单位(dB)也称为方。在图2中示出了根据ISO 226:2003的对于各种响度水平的等响度轮廓。

如果从等响度轮廓减去参考音调的响度水平,则获得相对响度衰减轮廓:

A(f;R)=L(f;R)-R dB,

其表示人类听觉系统的响度感知机制在频率f施加于输入音调的衰减。在给定输入音频谱X(f)的情况下,在响度方面人感知的信号因此是:

Y(f)=X(f)-A(f;R)dB.

当产生(例如,由艺术家)音频内容时,通常设置特定响度水平,这确立了相应的记录响度水平Rr、记录等响度轮廓Lr(f;Rr)以及记录相对响度衰减轮廓Ar(f;Rr)。如果Xr(f)表示原始音频信号的频率响应,则在响度方面人耳感知的原始信号是:

Yr(f)=Xr(f)-Ar(f;Rr)dB.

这是通常将在产生(例如,记录)期间在谱平衡方面被优化的信号。出于多种原因,回放响度Rp通常不同于记录响度,这多种原因包括记录响度水平的不可用性、不同再现装备、不同声学环境和/或不同优选回放响度水平。令Xp(f)表示该理想回放音频信号的频率响应,其可由与原始音频信号的响度差来定义,如下:

Vd=Xr(f)-Xp(f)dB.

该不同回放响度确立了相应回放响度水平Rp、回放等响度轮廓Lp(f;Rp)和回放相对响度衰减轮廓Ap(f;Rp)。因此,在响度方面人所感知的回放信号是:

Yp(f)=Xp(f)-Ap(f;Rp)dB.

由于相对响度衰减轮廓Ar(f;Rr)和Ap(f;Rp)是不同的,因此所感知的回放谱平衡或声音质量与原始(例如,艺术家或声音工程师所期望的)的不同。为了减轻该问题,滤波器生成器/选择器模块18优选地生成或选择提供例如由G(f;Rr;Rp)表示的响度补偿轮廓的滤波器20,以使得除了响度差之外所感知的回放谱平衡与原始相同,即:

Yr(f)-[Yp(f)+G(f;Rr,Rp)]=Vd

代入,理想响度补偿轮廓是:

G(f;Rr,Rp)=Ap(f;Rp)-Ar(f;Rr).

公式1

图3示出了分别对于Rr=96dB和Rp=0、10、…、90dB的这样响度补偿轮廓。

然而,关于上述理想响度补偿轮廓的潜在问题在于,对于低音的增益可能变得非常高,尤其是对于低回放响度水平。例如,图3中的零方轮廓呈现了几乎40dB的低音增强。这样的低音增强可使得扬声器线圈撞击后板,从而导致失真以及可能的扬声器损坏。因此,在某些实施例中,这样的低音增强被限制。在一个实施例中,例如,选择低音频率fB,并且前述响度补偿轮廓被修改为使得:

图4示出了具有上述修改和具有fB=100Hz的图3的响度补偿轮廓。然而,应理解,可替代地使用用于限制过度增益(尤其是低频增益)的其它方案。

在优选实施例中,模块18首先基于预先存储的等响度轮廓的集合和从模块10接收的响度估计而合成期望补偿轮廓(例如,如上所述),然后基于该期望的补偿轮廓而生成补偿滤波器20(例如,如在以下标题为“基于音量补偿轮廓的滤波器生成”的章节中讨论的)。更优选地,每次从模块10接收的响度估计之一改变时,模块18重复上述步骤。

如图1所示,然后由该当前选择的/生成的补偿滤波器20对输入信号7进行处理以提供输出信号22,该输出信号22通常然后被放大并且用于驱动一个或多个音频输出装置24,诸如扬声器或耳机。然而,输出信号22替代地可以用于任何其它目的。

响度估计

以下是响度估计器10或者至少其部分的特定具体实现的更详细描述,每个具体实现均采用不同的方案,如相应子章节标题所指示的。

用户设置记录和回放响度水平

在该实现中,正回放音频信号的用户选择记录参考响度水平Rr和回放参考响度水平Rp。记录参考响度水平Rr的选择可以是当产生音频内容时的平均信号水平的估计。大约-18dBFS的值被广泛地用在记录工业中,因此,可默认来设置,例如,其中,如果期望,用户/收听者具有在任一方向上修改该值的能力。在这点上,例如,用户可希望将值设置非常高,诸如0dBFS,以给出响度增强的强烈感觉,或者在替选实施例中,这样的值替代地可用作默认值。在任意情况下,在当前实施例中,用户可以在回放之前或期间调整该参数以适合他的/她的偏好。另一方面,回放参考响度水平Rp完全是用户参数,并且通常将被选择以适合关于以多大响声播放音频的用户偏好意向(例如,通过调整回放装置上的音频控制)。

注意,对于每个这样的参数,用户不需要知道基于用户进行的特定设置的、在补偿系统5内将使用的具体值。替代地,例如,用户可仅选择与记录参考响度水平Rr相关的从-10至+10的值(例如,0与上述默认值之一对应,并且每个方向上的最大值与相对于默认值的最大期望偏离对应),并且还选择对于回放响度的从0至10的值,例如,其中,系统5然后将这些所选择的设置转换为相应记录参考响度水平Rr和相应回放参考响度水平Rp。实际上,如上所述,根据各个实施例,要基于特定用户设置使用的特定值还可与关于原始音频信号产生环境和/或回放环境的其它信息14有关(例如,对于回放环境,耳机/扬声器灵敏度、室内声学、放大器增益等)。

用户设置记录响度水平和可变回放响度水平

在该实施例中,如在先前实施例中,记录参考响度水平Rr被设置为固定值(例如,默认地或者基于用户进行的设置),但是根据输入信号7而实时地估计回放参考响度水平Rp。在图5中示出了时域中的回放参考响度估计器10A的一个示例。如所示出的,回放参考响度估计器10A包括带通滤波器42和功率估计器43。带通滤波器42的中心频率优选地被设置为1000Hz(以便与在补偿所基于的等响度轮廓的测量中使用的参考音调对应)。带通滤波器42的带宽可被选择为非常窄(例如,不大于500Hz或1000Hz,诸如具有覆盖1000Hz附近的两个临界频带的通带,通常从800Hz至1250Hz)以得到参考音调附近的功率水平的良好估计。然而,使用窄带宽在参考音调附近的瞬时功率非常低的情形期间(诸如当仅低音吉他存在于输入音频信号中时)可能产生非常低的响度。较宽的带宽(例如,4000Hz至6000Hz,诸如从200Hz至5000Hz的通带)将减轻该问题,但是具有所估计的响度不能准确地反映参考音调(例如,1000Hz)的响度水平的潜在缺点。极端带宽选择可包括全音频带宽,在该情况下,带通滤波器42可完全省略以便节省不必要的计算。更一般地,回放装置中的用于回放参考响度水平Rp的估计的方案优选地与所使用的或者假设已使用的用于估计记录(或其它产生)参考响度水平Rr的方案相同或者至少匹配。

平滑机制优选地包括在功率估计器43中以保证随时间平滑地变化的响度估计。一种这样的实施例使用所计算的功率值的以下滑动(或移动)平均值:

其中,x(n)是输入样本值,并且N是块大小。更简单的实施例是使用

低阶无限脉冲响应(IIR)滤波器,诸如以下的一阶IIR低通滤波器:

P(n)=αP(n-1)+(1-α)x2(n)

公式3

其中,α是滤波器系数并且与采样频率fs和时间常数τ相关,如:

在任意情况下,功率估计器43输出(优选地,平滑后的)响度估计45。

回放参考响度估计器替代地可在频域中实现,诸如图6所示的估计器10B。令X(k)表示输入信号的DFT系数,功率估计器52优选地计算参考音调(例如,1000Hz)的频率附近的功率,作为:

其中,KL和KH是与参考音调附近的频率对应的DFT频点(bin)。

以上获得的功率值可由于DFT的块处理性质而在连续DFT块之间显著地变化,这进而可能导致响度补偿的突然改变。该问题可以由低通滤波器54来减轻,诸如以上公式3中给出的一阶IIR滤波器,以便提供响度估计55。

另外,在上述实施例的某个替选变型中,记录参考响度水平Rr基于其它信息14(诸如与输入信号7所基于的原始信号一起包括的元数据)而被设置为固定值,其中,用户具有或者没有用于调整该默认值的能力,并且根据输入信号7而估计回放参考响度水平Rp(例如,如上所述)。

可变记录和回放参考响度水平

如果假设记录和回放响度水平为相同的,则使用在先前两个子章节中描述的结构、方案和技术而根据输入音频信号7估计的回放参考响度水平也可以用作记录参考响度水平。然而,回放和记录响度水平几乎总是不同的,并且该差别可由响度差参数来提供:

Δp=Rr-Rp,

该响度差参数优选地由用户来设置。然后,一旦根据输入音频信号估计出回放参考响度水平,就可以容易地获得记录参考响度水平作为:

Rr=Rp+Δp.

在图7中示出了用于实现这样的基于差值的方案的结构60,其中,估计器10C可以是例如估计器10A或10B中的任一个。图7中的加法器63的输出处的饱和器62用于保证所计算的记录参考响度水平不超过诸如0dBFS的指定最大值。

基于响度补偿轮廓的滤波器生成

在本发明的优选实施例中,一旦检索到或生成了响度补偿轮廓(例如,如上所述),模块18就生成相应滤波器。以下讨论涉及用于进行可由模块18实现的操作的技术。

以上给出的响度补偿轮廓(即,公式1和公式2)是响度数据可用的频率网格处的幅频响应。期望轮廓优选地被转换为可以用于响度估计的实际滤波器。在图8中示出了并且在以下描述了用于处理期望的响度补偿轮廓101的一种这样的方法100。

初始,在步骤102中,当对于这样的点不存在等响度数据(这是通常情况)时,对输入响度补偿轮廓进行外插以覆盖零和奈奎斯特频率。简单的方案是仅将最近的可用轮廓值复制到这些频率。某个更相关的方案是线性外插,例如,使用与最低频率对应的两个轮廓数据点来构造线性方程以外插零频率以及使用与最高频率对应的两个轮廓数据点来外插奈奎斯特频率。替选地,可结合另外的数据点来使用较高阶的外插。

接下来,在步骤103中,将所得到的响度补偿轮廓再采样为适合于滤波器设计的频率网格。该步骤优选地提供可以在快速傅立叶变换(FFT)中使用的均匀频率网格。线性内插通常对于该目的是足够的,但是可替代地使用诸如样条内插的更复杂方法。

在步骤105中,将所得到的响度补偿轮廓反映在奈奎斯特频率附近的零与奈奎斯特频率之间的频率范围至奈奎斯特频率与采样率之间的频率范围中,以便构造对称幅值响应。这样的步骤保证了随后的响度补偿滤波器仅具有实系数。

在步骤106中,对相位进行合成以便将幅值响应转换为适当的频率响应。简单的方案是将零相位附属于所有频点以及然后延迟随后滤波器的脉冲响应以使得其为原因。另一方案是使用多种方法(诸如基于复杂对数倒频谱的非参数方案的多种方法)根据幅值响应获得最小相位频率响应(例如,如在A.V.Oppenheim和R.W.Schafer,Digital Signal Processing,Englewood Cliffs,NJ:Prentice-Hall,1975中讨论的)。如果要使用IIR滤波器,则由于最小相位通常是用于将幅值响应转换为IIR滤波器系数的大部分算法所假设的或者对于这些大部分算法起最佳作用的,因此最小相位是优选的。

在步骤107中,通常通过生成滤波器系数109而将所得到的频率响应转换为适合于实时实现的滤波器。可使用IIR或有限脉冲响应(FIR)滤波器,并且以下描述用于生成这两个滤波器的技术。

IIR滤波器

如果期望IIR滤波器,则可使用任何适当的滤波器转换方法,诸如在J.O.Smith III,“Introduction to Digital Filters:with Audio Applications”,W3K Publishing,2007中描述的方程误差方法(equation error method)。当IIR滤波器的延迟线被硬接线至其滤波器系数(通常是这样的情况)时,滤波器系数的改变通常使得不同的延迟线成为必要。因此,当响度补偿轮廓随着时间(或者期望潜在地随着时间)变化时,这样的IIR滤波器不是优选的。

FIR滤波器

对于给定阶,所有FIR滤波器可以共享相同的延迟线,因此FIR滤波器更好地允许响度补偿轮廓的动态更新。由于响度补偿轮廓的每次更新需要FIR滤波器系数的新集合的计算,因此简单的和稳定的转换方法是优选的。以下给出了一个这样的示例:

1.将逆FFT应用于在步骤106(图8)中获得的响度补偿频率响应以得到其脉冲响应。

2.如果期望较短的滤波器,则将窗函数应用于脉冲响应。窗的中心与脉冲响应的能量中心对准。

3.如果在步骤106中使用了零相位,则延迟脉冲响应以使得其成为原因。如果在紧接先前的步骤2中使用了加窗,则适当的延迟也是期望的。

如果针对每个输入样本而更新滤波器,则以上过程可能计算强度过大。为了减轻该潜在问题,可如下预先计算FIR滤波器的集合:

1.对记录和回放响度水平的期望动态范围进行量化。为了适应人类响度感知以及使用较小的量化水平集合,优选地使用诸如对数的非均匀量化方案。

2.对于每对量化后的记录和回放响度水平,产生响度补偿滤波器。

3.将补偿滤波器存储在滤波器表中以用于稍后查找。

在图9中示出了然后利用这些存储的补偿滤波器的系统5A。尽管未明确示出,如上所述,其它输入14也可被提供到响度估计器10。

如所示出的以及如以上所讨论的,估计器10生成记录(或其它产生)参考响度水平Rr和回放参考响度水平Rp的估计。然后,分别在量化器121和122中,对这两个估计进行量化(例如,结合预先存储的补偿滤波器的生成而使用上述同一方案)。量化后的值被提供到滤波器查找模块18A(例如,作为查找表的索引),并且选择匹配滤波器20用于对输入音频信号7进行处理。在该特定实施例中,首先在放大器124中对滤波器20的输出进行放大,然后使用该输出来驱动一个或多个扬声器125。

STFT实现

由于补偿滤波器20的每次更新需要不同FIR滤波器的应用,因此可能产生滤波后的音频样本中的一定程度的不连续性,并且该不连续性可能变得可听见。在本发明的某些实施例中,通过引入相邻滤波器产生的音频样本之间的重叠来减轻该不连续性问题。短时傅立叶变换(STFT)中固有的叠加操作也适合该目标。与FFT相关联的计算效率是STFT的其它益处。然而,隐含重叠的其它技术替代地可用于提供相同的或类似的益处。

在图10中示出了用于实现STFT响度补偿的一个系统5B。如上所述,生成器/选择器模块18包括补偿轮廓合成器18C和轮廓至频率响应转换器18D。正向STFT模块141将输入音频信号7(初始在时域中)转换到频域中,以使得在乘法器142中所得到的频率系数可以与模块18提供的频率响应系数相乘。

当前基于STFT的方案的一个特性是时域中的用于响度补偿滤波的卷积被频域中的乘法取代。尽管该方案通常提高了计算效率,但是如果不满足以下大小限制则可引起时域混叠:

ML+F<N

公式4

其中,M是STFT的块大小,L是STFT块的数量,N是DFT大小,并且F是FIR滤波器系数的数量。对于给定M、L和N,防混叠模块143通过将模块18提供的响度补偿滤波器的频率响应转换成具有长度为F的相应脉冲响应的频率响应来增强该限制,其中长度F实际上满足公式4。

根据一个实施例,防混叠模块143对模块18提供的频率响应171实现图11所示的方法170的处理步骤。初始地,在步骤172中,对频率响应171应用反向DFT以便获得其脉冲响应。该DFT的大小可短于用于STFT的DFT大小,以便减轻对于该DFT的计算负荷以及对于轮廓至频率响应转换器18的计算负荷。

在步骤173中,优选地将从步骤172获得的脉冲响应与长度F的窗函数(诸如汉宁窗或布莱克曼窗),以保证所得到的脉冲响应的时间限制满足公式4。

在步骤175中,在根据步骤173的任何变型之后,对脉冲响应进行偏移以实现期望的延迟/相位特性。由于在频域中执行滤波,因此零相位滤波器是可能的。

在步骤176中,对步骤175提供的脉冲响应应用正向DFT,以便获得其频率响应。该DFT优选地具有与STFT相同的大小。

与先前章节中的FIR滤波器的讨论类似,如果以上过程计算强度过大,则可预先计算补偿滤波器频率响应的集合,例如,如下:

1.针对可能的记录和回放响度水平的集合中的每个而对动态范围进行量化。为了适应人类响度感知以及使用较小的量化水平集合,优选地使用诸如对数的非均匀量化方案。

2.对于每对量化后的记录和回放响度水平,生成响度补偿滤波器频率响应。

3.将补偿滤波器频率响应存储在表中以用于稍后查找。

在图12中示出了使用这样的预先存储的滤波器的回放系统5C。参照图12,在每次来自估计器10B的记录和/或回放响度估计更新时,

1.使用在生成预先存储的滤波器响应时(以上讨论)所使用的相同量化方案,分别在量化器202和203内对回放响度水平Rp和记录参考响度水平Rr的估计进行量化。

2.在频率响应查找模块205中,使用所得到的量化索引来查找相应的响度补偿滤波器频率响应。

3.将正向STFT模块141产生的输入信号7的频率系数与在查找模块205中检索到的滤波器频率响应相乘(在乘法器142中),然后在模块144中执行反向STFT,从而提供输入样本7的期望处理。

应注意,尽管在上述实施例中使用了STFT的具体示例,但是可替代地使用其它变换方案。因此,这里对STFT的任何和所有引用可利用对任何频率变换或其它正交变换(就此而言)的引用替换。

另外的实施例

在某些上述实施例中,实时地根据输入信号7动态地估计回放响度水平Rp。该类型的某些更具体实施例还将超过输入信号7本身的其它信息纳入考虑。在这点上,仅关注于输入信号7可能例如由于原始记录(或者产生)信号的实际响度的变化(与其参考响度相比)而导致不适当的补偿。一般而言,原始记录信号在总体参考响度设置的上下文内将呈现瞬时响度的显著变化量(例如,以提供不同的听觉效果)。结果,在回放期间,虽然在不同的总体回放参考响度设置,但是将发生瞬时响度的相同变化。在某些优选实施例中,特别是在不能访问瞬时记录响度水平的实施例中,(例如,在整条音频内容内)估计总体参考响度水平(记录和回放)。然后,在某些具体变型中,补偿轮廓仅基于这些水平。在其它具体变型中,根据回放环境的改变(诸如用户选择的回放响度改变、输出装置24中的任何改变(特别是这种不同输出装置24的灵敏度的改变)和/或室内声学的任何改变,例如,在输出装置24包括一个或多个扬声器的情况下)来修改上述总体回放响度水平。在另外的具体变型中,总体估计响度水平(记录和回放两者)用于确立差别响度(例如,Δp),然后该差别用在诸如系统60(以上结合图7讨论的)的系统中。

系统环境

一般而言,除了明确相反指出之外,这里描述的所有系统、方法、功能和技术可以利用一个或多个可编程通用计算装置来实践。这样的装置(例如,包括这里所述的任何电子装置)通常将包括例如经由例如公共总线彼此耦合的以下部件中的至少一部分:(1)一个或多个中央处理单元(CPU);(2)只读存储器(ROM);(3)随机存取存储器(RAM);(4)其它集成或附接存储装置;(5)用于与其它装置接口的输入/输出软件和电路(例如,使用硬接线连接,诸如串行端口、并行端口、USB连接或火线连接,或者使用无线协议,诸如射频标识(RFID)、任何其它近场通信(NFC)协议、蓝牙或802.11协议);(6)用于例如使用硬接线连接(诸如以太网卡)或无线协议(诸如码分多址(CDMA)、全球移动通信系统(GSM)、蓝牙、802.11协议或者任何其它基于蜂窝或非基于蜂窝的系统)连接到一个或多个网络的软件和电路,这些网络在本发明的许多实施例中进而连接到因特网或任何其它网络;(7)显示器(诸如阴极射线管显示器、液晶显示器、有机发光显示器、聚合物发光显示器或任何其它薄膜显示器);(8)其它输出装置(诸如一个或多个扬声器、耳机、激光或其它光投影仪和/或打印机);(9)一个或多个输入装置(诸如鼠标、一个或多个物理开关或可变控制、触摸板、平板、触敏显示器或其它指向装置、键盘、小键盘、麦克风和/或摄像装置或扫描仪);(10)大容量存储单元(诸如硬盘驱动器或固态驱动器);(11)实时时钟;(12)可拆卸存储读/写装置(诸如闪存驱动器、利用半导体存储器的任何其它便携式驱动器、磁盘、磁带、光磁盘、光盘等);和/或(13)调制解调器(例如,用于发送传真或用于连接到因特网或任何其它计算机网络)。在操作中,在一定程度上由这样的通用计算机执行的用于实现以上方法和功能的处理步骤通常初始存储在大容量存储装置(例如,硬盘或固态驱动器)中,被下载到RAM中,然后由CPU在RAM之外执行。然而,在一些情况下,处理步骤初始存储在RAM或ROM中和/或直接在大容量存储装置之外执行。

可从各种卖方获得用于实现本发明的适当通用可编程装置。在各个实施例中,根据任务的大小和复杂性而使用不同类型的装置。这样的装置可以包括例如大型计算机、多处理器计算机、一个或多个服务器盒、工作站、个人(例如,台式、笔记本、平板或板式)计算机和/或甚至更小的计算机(诸如个人数字助理(PDA)、无线电话(例如,智能电话)或任何其它可编程设施或装置),无论是单独的、硬接线到网络的还是无线连接到网络的都可以。

另外,尽管以上描述了通用可编程装置,但是在替选实施例中,替代地(或者另外地)使用一个或多个专用处理器或计算机。一般地,应注意,除了明确相反指出之外,上述任何功能都可以由执行软件和/固件的通用处理器、专用(例如,基于逻辑的)硬件或这些方案的任何组合来实现,其中,基于已知的工程折中来选择特定实现。更具体地,如本领域技术人员容易想到的,在上述任何处理和/或功能以固定的、预定的和/或逻辑方式来实现的情况下,可以由执行编程(例如,软件或固件)的处理器、逻辑部件(硬件)的适当布置或者这两者的任意组合来完成。换言之,如何将逻辑和/或算术操作转换成用于在处理器内执行这样的操作的指令和/或转换成用于执行这样的操作的逻辑门配置是容易理解的;实际上,编译器通常可用于这两种转换。

应理解,本发明还涉及其上存储有用于执行本发明的方法和功能的软件或固件程序指令(即,计算机可执行处理指令)的机器可读有形(或者非暂态)介质。作为示例,这样的介质包括磁盘、磁带、光学可读取介质(诸如CD和DVD)或者半导体存储器(诸如各种类型的存储卡、USB闪存装置、固态驱动器等)。在每种情况下,介质可采取便携式物品的形式(诸如微型盘驱动器或小盘、磁碟、卡带、盘式磁带、卡、棒等),或者可采取相对较大或不便移动的物品的形式(诸如设置在计算机或其它装置中的硬盘驱动器、ROM或RAM)。如这里所使用的,除非清楚相反指出,对存储在计算机可读或机器可读介质上的计算机可执行处理步骤的引用旨在包括这样的处理步骤存储在单个介质上的情形以及这样的处理步骤跨越多个介质存储的情形。

先前描述主要强调了电子计算机和装置。然而,应理解,可替代地使用任何其它计算装置或其它类型的装置,诸如利用能够执行基本逻辑和/或算术操作的电子、光学、生物和化学处理的任何组合的装置。

另外,在本公开引用处理器、计算机、服务器、服务器装置、计算机可读介质或其它存储装置、客户端装置或任何其它种类的设备或装置的情况下,除了清楚相反指出之外,这样的引用应被理解为包括使用多个这样的处理器、计算机、服务器、服务器装置、计算机可读介质或其它存储装置、客户端装置或任何其它这样的设备或装置。例如,服务器一般可以(以及通常将)使用单个装置或例如具有适当的负载平衡的服务器装置的簇(本地或地理上分散)来实现。类似地,服务器装置和客户端装置通常将配合执行完整方法的处理步骤,例如,其中,每个这样的装置具有其自己的存储这样的处理步骤的一部分的存储装置和其自己的执行这些处理步骤的处理器。

如这里所使用的,术语“耦合”或者该词的任何其它形式旨在表示直接连接或者通过一个或多个其它元件或处理块连接。在附图和/或其讨论中,在各个步骤、模块或处理块被示出和/或讨论为直接连接到彼此的情况下,这样的连接应被理解为可包括另外的元件和/或处理块的耦合。

另外的考虑

在先前讨论中,术语“操作者”、“操作”、“功能”和类似术语可以指的是根据特定实现/实施例的方法步骤或硬件部件。

除非清楚相反指出,在以上讨论中诸如“最优”、“优化”、“最小化”、“最佳”和类似词的词以及表示比较的其它词和前缀不以其绝对意义来使用。替代地,这样的术语通常旨在根据任何其它潜在限制来理解,诸如用户指定限制和目标以及成本和处理限制。

在以上讨论中,通过将某些方法分解为以特定顺序列出的步骤来说明某些方法。然而,应注意,在每个这种情况下,除了明确相反指出或者根据实际考虑要求(诸如来自一个步骤的结果需要执行其它步骤的情况)之外,所指示的顺序不是关键的,而是替代地,所描述的步骤可以重新排序和/或两个或更多个这样的步骤可以并行地执行。

这里对旨在触发、限制、过滤或者影响处理步骤、其它动作、处理步骤或动作的主体或者任何其它活动或数据的“标准”、“多个标准”、“条件”、“多个条件”或类似词的引用旨在表示“一个或多个”,而与使用单数还是复数形式无关。例如,任何标准或条件可以包括动作、事件和/或发生(即,多部分标准或条件)的任何组合(例如,布尔组合)。

类似地,在以上讨论中,功能有时被归于特定模块或部件。然而,功能一般可在任何不同的模块或部件当中根据期望重新分配,从而在一些情况下,完全避免对于特定部件或模块的需要和/或需要添加新的部件或模块。如本领域技术人员所理解的,参考本发明的具体实施例,根据已知工程折中而优选地进行功能的精确分配。

在以上讨论中,词“包括(include)”、“包含(includes)”、“具有(including)”和该词的所有其它形式不应被理解为限制性的,而是这样的词之后的任何具体项应被理解为仅是示例性的。

以上描述了本发明的多个不同实施例,其中每个这样的实施例被描述为包括某些特征。然而,如本领域技术人员所理解的,旨在为结合任何单个实施例的讨论描述的特征不限于该实施例,而是也可包括和/或布置在任何其它实施例的各种组合中。

因此,尽管关于本发明的示例性实施例和附图详细描述了本发明,但是对本领域技术人员来说明显的是,可在不背离本发明的精神和范围的情况下实现本发明的各种调整和修改。因此,本发明不限于图中示出的和以上描述的具体实施例。相反,旨在为不背离本发明的精神的所有这样的变型应被视为在仅由所附权利要求限定的范围中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1