用于调平音频信号的响度变化的系统及方法

文档序号:7544710阅读:430来源:国知局
用于调平音频信号的响度变化的系统及方法
【专利摘要】描述了用于对音频信号的响度变化进行调平的系统及方法。实施方式根据特定标准的响度测量使用感知调平算法和基于标准的响度测量一起来使音频处理伪声最小化,并且确保经处理的音频的测量响度接近于所要求的测量。可以离线地或者实时地使用这些系统和方法。
【专利说明】用于调平音频信号的响度变化的系统及方法
[0001] 相关申请的交叉引用
[0002] 本申请要求于2012年4月12日提交的美国临时专利申请No. 61/623,253和于 2012年12月19日提交的美国临时专利申请No. 61/739,545的优先权,在此通过引用将它 们中的每个的全部内容合并到本文中。

【技术领域】
[0003] 本公开内容一般地涉及信号处理,更具体地,涉及用于对音频信号的响度变化进 行调平的系统及方法。

【背景技术】
[0004] 在许多情况下,尤其对于广播电视网络,响度调平或者音频信号的响亮部分与柔 和部分之间范围的自动减小是所希望的。差的创作实践导致电视节目、广告或这两者中响 度级的广泛变化,并且具有明显不同的响度级的节目或广告频繁地连接。电视观众经常发 觉他们自己对他们的电视或声音重放系统调节音量控制以弥补这些变化;然而,这些观众 的反应时间经常不够快得足以避免烦扰。另外,一些节目(例如电影)具有非常高的动态 范围。对家庭收听来说这些范围通常太宽,其中,听到对话所要求的音量位置可能产生很高 响度级的音效和音乐,这可能干扰家中的其他人。
[0005] 现有的用于响度调平的方法包括压缩器方法和限制器方法。这些方法在时间上对 音频信号水平或功率进行积分。积分时间越短,算法就能够越快地测量和调整响度的短期 波动。积分时间越长,平均响度受到的影响就越大,但是短期波动持续。通常,这些方法通 过同时对整个音频信号,即,所有频率进行增益调整来进行操作。这可能导致可听伪声,例 如"喘息效应"或"抽气效应"。最近,开发出了用于响度测量和调整的心理声学方法,例如 于2007年4月26日公开的Seefeldt等人的美国专利申请公开No. 2007/0092089A1中所 描述的,在此通过引用将其全部内容合并到本文中。这些算法使用谱分析和人类听觉模型 以随频率变化和随所测量的响度级变化的方式来调整音频。这些方法在调整毫秒到秒的时 间尺度的短期响度中表现很好,具有非常少的可听伪声。
[0006] 区别于响度级,也存在用于客观地测量音频信号的感知响度的方法。示例包括A 加权、B加权和C加权功率测量以及响度的心理声学模型,例如在"Acoustics-Method for calculating loudness level"IS0 532(1997)和美国专利申请公开 No. 2007/0092089A1 中所描述的。加权的功率测量通过以下方式操作:获得输入音频信号;施加加强更可被感 知的敏感频率而削弱较不可被感知的敏感频率的已知的滤波器;然后在预定时间长度上对 经滤波的信号的功率求平均。最近开发出的ITU-R BS. 1770-2客观响度测量标准使用类似 于B加权的加权滤波器,并且根据最终平均功率计算来消除音频信号的安静的或静音的部 分。
[0007] 心理声学方法通常更复杂,并且旨在更好地对人耳的工作进行建模。这种心理声 学方法将信号划分成模仿耳朵的频率响应和灵敏度的频带,然后在考虑心理声学现象的情 况下对这些带进行操作和积分,心理声学现象例如频率掩蔽和时间掩蔽以及具有变化的信 号强度的响度的非线性感知。所有这些方法的目的在于得出与音频信号的主观印象密切匹 配的数值测量。通常,这些方法对测量音频信号的例如其中音频信号长度是30秒或更多并 且通常是数分钟或数小时的长期感知的响度是有用的。多年来,这些客观测量算法的发展 和接受伴随有主观测试,即将客观算法的测量与人的收听进行比较。
[0008] 最近,对于广播电视音频信号,尤其对于商业,对保持一致的响度的需求增长。 政府的法规已经推动了这种需求,例如联邦通信委员会出版No. FCC 11-84, "Notice of Proposed Rulemaking :Implementation of the Commercial Advertisement Loudness Mitigation (CALM) Act"。由于广播者拥有具有已知的平均响度和动态的创作好的内容以及 具有未知的平均响度和可能宽的动态的未知内容的混合,所以他们频繁地使用与最终到达 电视观众的实时音频信号一致的响度调平设备。然而,当对音频信号进行水平调整时,通常 对于短期行为优化响度调平器以使伪声最小化,因此,当使用长期测量进行测量时,所调平 的音频信号不一定一致。即,所调平的音频的部分例如30秒或更多的所测量的响度是不一 致的。


【发明内容】

[0009] 因此,在本领域中需要能够执行短期无伪声的响度调平同时确保所调平的音频的 长期响度与已知的测量标准匹配的实时调平方法。本发明的实施方式通过提供对音频信号 的响度变化进行调平的系统和方法满足该需求和其他需求。
[0010] 根据一种实施方式,描述了一种对音频信号的响度变化进行调平的方法。该方法 包括:接收音频信号和音频信号的期望响度;消除音频信号中的伪声;测量音频信号的实 际响度;使用音频信号的期望响度与实际响度之间的差来计算增益值;以及使用增益值来 修改音频信号。
[0011] 根据另一实施方式,描述了一种对音频信号的响度变化进行调平的系统。该系统 包括:短期响度调平模块,其被配置成接收音频信号和音频信号的期望响度,并且消除音频 信号中的伪声;长期响度调平模块,其被配置成测量音频信号的实际响度;响度到增益模 块,其被配置成使用音频信号的期望响度与实际响度之间的差来计算增益值;以及音频修 改模块,其被配置成使用增益值来值修改音频信号。在一种实施方式中,短期响度调平模 块、长期响度调平模块、响度到增益模块和音频修改模块中的至少之一被包括在处理器中。
[0012] 根据另一实施方式,描述了一种嵌入有计算机可执行指令的计算机可读介质,该 指令用于执行以下步骤:接收音频信号和音频信号的期望响度;消除音频信号中的伪声; 测量音频信号的实际响度;使用音频信号的期望响度与实际响度之间的差来计算增益值; 以及使用增益值修改音频信号。
[0013] 根据下面的详细描述,简单地通过示出示例实施方式和实现,包括对于实施本发 明所预期的最佳方式,本发明的其他方面、特征和优点容易显见。在不脱离本发明的精神和 范围的情况下,本发明也能够具有其他不同的实施方式,并且可以在各种方面对其若干细 节进行修改。因此,附图和描述本质上被视为是说明性的而并非限制性的。

【专利附图】

【附图说明】
[0014] 图1是示出根据实施方式的用于实时地对音频信号的响度变化进行调平的系统 的示意功能框图。
[0015] 图2是示出根据实施方式的用于离线地对音频信号的响度变化进行调平的系统 的示意功能框图。
[0016] 图3是示出根据实施方式的用于实时地使用输入信号调整对响度变化进行调平 的系统的示意功能框图。
[0017] 图4是示出根据实施方式的用于离线地使用输入信号调整对响度变化进行调平 的系统的示意功能框图。
[0018] 图5是示出根据实施方式的用于实时地使用输入基准水平调整对响度变化进行 调平的系统的示意功能框图。
[0019] 图6是示出根据实施方式的用于离线地使用输入基准水平调整对响度变化进行 调平的系统的示意功能框图。
[0020] 图7是具有用于使机器执行本文中所描述的一种或更多种方法中的任意方法的 指令集的机器的图形表示。

【具体实施方式】
[0021] 描述了用于对音频信号的响度变化进行调平的系统及方法。在下面的描述中,为 了说明的目的,阐述了大量具体细节以提供对示例实施方式的透彻理解。然而,对本领域 技术人员来说显见的是,可以在没有这些具体细节的情况下或使用等同布置来实践实施方 式。在一些情况下,以框图的形式示出了公知的结构和装置,以避免对实施方式的不必要的 混淆。
[0022] 现在参照附图,在附图中贯穿若干视图相同的附图标记指代相同的或相应的部 分,图1是示出根据实施方式的用于实时地对响度变化进行调平的系统的示意功能框图。 将音频信号110和音频信号的期望响度140输入到短期响度调平模块120中。短期响度调 平模块120调整音频信号110以使听觉调平伪声如"抽气效应"和"喘息效应"最小化。短 期响度调平模块120可以通过美国专利申请公开No. 2007/0092089A1中所描述的方法来实 现该调整,在此通过引用将其全部内容合并到本文中。
[0023] 在一种实施方式中,短期响度调平模块120对数字脉冲编码调制("PCM")音频的 5毫秒的时间间隔即5毫秒周期进行操作。在另一实施方式中,如在模拟系统中,短期响度 调平模块120连续地进行操作。在又一实施方式中,短期响度调平模块120对数字系统中 的每个PCM采样进行操作。
[0024] 短期响度调平模块120也采用音频信号的期望响度140作为输入。在音频信号是 PCM信号的数字系统中,以相对于全尺度PCM的分贝(dB)为单位表示期望响度140。例如, 期望响度140可以是_24dB FS (全尺度)。
[0025] 然后,将由短期响度调平模块120处理的音频信号传递至长期响度调平模块130。 长期响度调平模块130根据所选择的客观响度测量标准例如ITU-R BS. 1770-3(08/2012) 来测量音频信号的实际响度。长期响度调平模块130每个周期,S卩,每当测量音频信号的实 际响度时输出单个响度数。响度数表示音频信号的实际响度。在音频信号是PCM信号的数 字系统中,以相对于全尺度PCM的分贝(dB)为单位表示响度数。
[0026] 在一种实施方式中,将长期响度调平模块130设置为标称积分时间,例如30秒。该 积分时间是长期响度调平模块130用来计算单个响度数的PCM采样的时间间隔。该功能可 以比积分时间间隔更频繁地操作;然而,每当操作时,它输出这样的数:该数表示其接收到 的最后一个"积分时间间隔"PCM采样上的测量。
[0027] 在一种实施方式中,长期响度调平模块130以与短期响度调平模块120相同的速 度例如每5毫秒进行操作。在其他实施方式中,长期响度调平模块130以比短期响度调平 模块120更慢或更快的速度进行操作。例如,长期响度调平模块130可以每20毫秒进行操 作,或者短期响度调平模块120每执行其功能4次长期响度调平模块130操作1次。
[0028] 在一种实施方式中,长期响度调平模块130可以包括以下操作方式:仅当通常表 示0. 5秒的时间间隔的PCM采样的块由ITU-R BS. 1770-1(2006-2007)(在此通过引用将其 全部内容合并到本申请中)中所描述的算法分类为"会话"时才发生PCM采样的积分(以 计算单个响度数)。该方法仅选通对音频信号的会话部分的响度测量。或者,对于实现对响 度测量和控制的监管要求的地理区域(例如,荷兰、德国、奥地利、法国),长期响度调平模 块 130 可以以单独遵守 ITU-R BS. 1770-2(03/2011)或者 ITU-R BS. 1770-3(08/2012)(其 指定基于水平的选通技术,并且在此通过引用将它们的全部内容合并到本文中)的模式来 操作。
[0029] 响度到增益模块150获得响度数并且将它与期望响度140比较。具体地,响度到 增益模块150计算期望响度140与响度数之间的差,并且输出增益值。被音频修改模块170 施加于所调平的音频以产生经修改的音频信号190的该增益使经调平的音频信号的长期 测量更接近期望响度140。
[0030] 增益值的计算包括一些速率限制以防止增益值变化太快和引起听觉伪声。当处理 开始并且长期响度调平模块130还未接收足够的音频采样以输出相应的响度数时,这尤为 重要。在一种实施方式中,响度到增益模块150以与长期响度调平模块130相同的速度例 如20毫秒进行操作,并且在每20毫秒计算的每个增益值之间线性内插施加于经调平的音 频信号的实际增益值。
[0031] 可以根据以下等式来计算增益值(用分贝)。
[0032] D=期望响度-响度数(以dB为单位)[1]
[0033]

【权利要求】
1. 一种对音频信号的响度变化进行调平的方法,所述方法包括: 接收所述音频信号以及所述音频信号的期望响度; 消除所述音频信号中的伪声; 测量所述音频信号的实际响度; 使用所述音频信号的所述期望响度与所述实际响度之间的差来计算增益值;以及 使用所述增益值来修改所述音频信号。
2. 根据权利要求1所述的方法,其中,所述音频信号是脉冲编码调制(PCM)信号。
3. 根据权利要求1所述的方法,其中,根据客观响度测量标准来测量所述音频信号的 所述实际响度。
4. 根据权利要求1所述的方法,其中,当所述音频信号仅包括会话时测量所述音频信 号的所述实际响度。
5. 根据权利要求1所述的方法,其中,间隔地测量所述音频信号的所述实际响度。
6. 根据权利要求1所述的方法,还包括: 存储所述音频信号, 其中,跨整个所述音频信号地测量所述音频信号的所述实际响度。
7. 根据权利要求1所述的方法,还包括: 在消除所述音频信号中的伪声之前,将所述音频信号调整为具有与所述期望响度相等 的平均响度。
8. 根据权利要求1所述的方法,还包括: 在消除所述音频信号中的伪声之前,将与所述音频信号的所述期望响度和平均响度之 间的差相当的固定增益施加于所述音频信号。
9. 一种对音频信号的响度变化进行调平的系统,所述系统包括: 短期响度调平模块,被配置成:接收所述音频信号以及所述音频信号的期望响度,并且 消除所述音频信号中的伪声; 长期响度调平模块,被配置成:测量所述音频信号的实际响度; 响度到增益模块,被配置成:使用所述音频信号的所述期望响度与所述实际响度之间 的差来计算增益值;以及 音频修改模块,被配置成:使用所述增益值来修改所述音频信号。
10. 根据权利要求9所述的系统,其中,所述短期响度调平模块、所述长期响度调平模 块、所述响度到增益模块和所述音频修改模块中的至少之一被包括在处理器中。
11. 根据权利要求9所述的系统,其中,所述音频信号是脉冲编码调制(PCM)信号。
12. 根据权利要求9所述的系统,其中,所述长期响度调平模块被配置成根据客观响度 测量标准来测量所述音频信号的所述实际响度。
13. 根据权利要求9所述的系统,其中,所述长期响度调平模块被配置成当所述音频信 号仅包括会话时测量所述音频信号的所述实际响度。
14. 根据权利要求9所述的系统,其中,所述长期响度调平模块被配置成间隔地测量所 述音频信号的所述实际响度。
15. 根据权利要求9所述的系统,还包括: 存储器, 其中,所述长期响度调平模块被配置成跨整个所述音频信号地测量所述音频信号的所 述实际响度。
16. 根据权利要求9所述的系统,还包括: 响度到基准水平模块,被配置成将与所述音频信号的所述期望响度和平均响度之间的 差相当的固定增益施加于所述音频信号。
17. -种嵌入有计算机可执行指令的计算机可读介质,所述计算机可执行指令用于执 行以下步骤: 接收所述音频信号以及所述音频信号的期望响度; 消除所述音频信号中的伪声; 测量所述音频信号的实际响度; 使用所述音频信号的所述期望响度与所述实际响度之间的差来计算增益值;以及 使用所述增益值来修改所述音频信号。
18. 根据权利要求17所述的计算机可读介质,其中,所述音频信号是脉冲编码调制 (PCM)信号。
19. 根据权利要求17所述的计算机可读介质,其中,根据客观响度测量标准来测量所 述音频信号的所述实际响度。
20. 根据权利要求17所述的计算机可读介质,其中,当所述音频信号仅包括会话时测 量所述音频信号的所述实际响度。
21. 根据权利要求17所述的计算机可读介质,其中,间隔地测量所述音频信号的所述 实际响度。
22. 根据权利要求17所述的计算机可读介质,还包括: 存储所述音频信号, 其中,跨整个所述音频信号地测量所述音频信号的所述实际响度。
23. 根据权利要求17所述的计算机可读介质,还包括: 在消除所述音频信号中的伪声之前,将所述音频信号调整为具有与所述期望响度相等 的平均响度。
24. 根据权利要求17所述的计算机可读介质,还包括: 在消除所述音频信号中的伪声之前,将与所述音频信号的所述期望响度和平均响度之 间的差相当的固定增益施加于所述音频信号。
【文档编号】H03G7/00GK104221284SQ201380019366
【公开日】2014年12月17日 申请日期:2013年4月2日 优先权日:2012年4月12日
【发明者】安德鲁·P·赖利, 迈克尔·史密瑟斯, 杰弗里·里德米勒 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1