具有动态阈值的频带压缩的制作方法

文档序号:8947700阅读:607来源:国知局
具有动态阈值的频带压缩的制作方法
【专利说明】
[0001] 相关申请的交叉引用
[0002] 该专利申请要求2013年4月29日Alan J. Seefeldt提交的题为"Distortion Reducing Multi-band Compressor with Dynamic Thresholds based on a Distortion Audibility Model"的共同未决和共同受让美国临时专利申请No. 61/817, 175(代理人案号 No. D13064USP1)的优先权,出于所有目的通过引用而完整合并到此。
技术领域
[0003] 该专利申请总体上涉及音频呈现,具体地说,涉及在呈现期间的失真减小。
【背景技术】
[0004] 一些音频回放设备(如智能电话和平板设备)包括具有有限输出能力的放大器和 扬声器。在这些设备中,音频回放可能在感知上是失真的,并且一般随着回放级别在呈现 期间增加而强烈地失真。失真的特性一般对于回放设备是频率依赖性的。例如,当在特定 频率处的输出信号达到或超过特定级别时,电视柜可能在受激发的特定频率处展现谐振响 应,产生恼人的震颤。
[0005] 多带压缩可以在回放之前应用于音频信号,以减少失真并且尝试最大化回放设备 上的回放级别。为信号的每个频带指定失真阈值。压缩器将独立增益应用于每个带,以确 保每个带中的信号级别不超过对应失真阈值。

【发明内容】

[0006] 所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系 统、装置、方法和计算机可读存储介质的一些示例。在一些实现方式中,处理具有多个频带 分量的输入信号。可以根据所述频带分量来确定时变阈值。每个时变阈值通常与相应的频 带分量对应。压缩器对每个频带分量执行具有对应时变阈值的压缩运算,以产生多个增益, 其中,每个增益与各个频带分量对应。每个增益应用于受延迟的对应频带分量,以产生多个 受处理的频带分量,其被相加以产生输出信号。
[0007] 在一些实现方式中,确定所述输出信号的感知谱的时变估计。此外,例如,根据失 真模型的响应来确定感知谱估计所引起的失真谱的时变估计。预测在存在感知谱估计的情 况下的所述失真谱估计的能听度测量。可以根据所预测的能听度测量来调整所述时变阈 值。
[0008] 在一些实现方式中,预测所述能听度测量包括:根据感知谱估计来计算掩蔽阈值; 确定失真谱估计与掩蔽阈值之间的差值;以及把所确定的差值的正数值相加,以产生预测 的能听度测量。可以基于感知谱估计参照调性谱来计算所述掩蔽阈值。所述调性谱包括区 分类似噪声的频带分量与类似音调的频带分量的调性值。所确定的差值的相加的正数值可 以加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与 下频带分量之间的频带分量更低的权重。
[0009] 在一些实现方式中,至少部分地根据固定标称阈值来确定时变阈值。因此,可以根 据对应频带分量并且根据相应的固定阈值来确定每个时变阈值。在这些实现方式中,可以 归一化失真的所预测的能听度测量。可以参照一个或更多个固定阈值并且根据应用于偏移 值的归一化的能听度测量来提升或降低所述时变阈值。
[0010] 在一些实现方式中,用于响应于输入音频信号而动态调整压缩阈值的装置包括: 一个或更多个控制器,可操作为使得一些或所有上述操作得以执行。此外,该装置可以包 括:滤波模块,能够对所述输入信号进行滤波,以产生所述频带分量;以及多带滤波器,包 括多个带通滤波器,其中,每个带通滤波器与相应的频带分量相对应。所述装置可以还包 括:一个或更多个放大器,被耦合以接收并且放大所述输出信号,以产生放大的输出信号; 以及一个或更多个扬声器,被耦合以接收并且播放放大的输出信号。
[0011] 在一些实现方式中,非瞬时计算机可读存储介质存储可由计算设备运行以使得一 些或所有上述操作得以执行的指令。计算设备的非限定性示例包括服务器和台式计算机以 及便携式手持设备(如智能电话、平板设备、膝上型设备、便携式音乐播放器等)。在一些实 例中,一个或多个服务器可以被配置为使用所公开的技术中的一个或更多个来处理输入音 频信号,并且作为基于云的服务的一部分而在互联网上把被处理的输出信号组流传送到用 户的设备。
【附图说明】
[0012] 所包括的附图目的是说明性的,并且仅用于提供用于所公开的本发明的系统、装 置、方法和计算机可读存储介质的可能结构和操作的示例。这些附图绝非限制本领域技术 人员在不脱离所公开的实现方式的精神和范围的情况下可以进行的形式和细节方面的任 何改变。
[0013] 图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器 的阈值的失真能听度模型(DAM)的压缩器100的示例。
[0014] 图2示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器 的阈值的方法200的示例。
[0015] 图3示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器 的阈值的方法300的另一示例。
[0016] 图4示出根据一些实现方式执行的用于在存在感知谱估计的情况下预测失真谱 估计的能听度测量的方法400的示例。
[0017] 图5A示出根据一些实现方式的显示器设备上所显示的输入音频信号的频带分量 的能量级别的图形表示500A的示例。
[0018] 图5B示出根据一些实现方式的显示器设备上所显示的由听者感知的所估计的输 出信号谱的对应能量级别的图形表示500B的示例。
[0019] 图6示出根据一些实现方式的用于呈现音频信号的包括压缩器100的回放系统 600的示例。
【具体实施方式】
[0020] 所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系 统、装置、方法和计算机可读存储介质的一些示例。一些所公开的技术包括失真能听度模 型,以确定由多带压缩器可以应用的动态阈值。失真能听度模型被配置为在存在输入信号 的情况下以依赖于动态信号的方式预测由该输入信号所引起的失真的感知能听度。这种所 预测的能听度可以用于动态修改压缩器的阈值。包括所公开的技术的一些设备和系统因此 能够在最小感知失真的情况下增加回放级别。
[0021] 在一些实现方式中,失真能听度模型被配置为预测听者所收听到的信号谱的时变 估计以及该信号所引起的失真谱的时变估计。失真能听度模型然后在存在信号谱估计的情 况下预测该失真谱估计的能听度。以此方式,可以相应地动态调整压缩器的一个或更多个 时变阈值。
[0022] 用于动态调整压缩阈值的所公开的技术可以结合其它压缩处理而得以使用,并且 可以实现于各种设备和系统(如智能电话、平板设备、膝上型计算机、便携式音乐播放器、 电视、监视器以及基于服务器的系统)中。
[0023] 实现所公开的技术的一些设备和系统在传统多带压缩器上改进,其显著地改动音 色一一听者感知的属性,其中,相等响度和音程的两种声音可以感知为不相似。当特定频率 达到失真阈值而其它频率未达到时,一些传统压缩器因改动这些频率之间的相对平衡而引 入缺点。所得声音显现为畸变,导致不自然的收听体验。
[0024] 此外,如果增益过度地强势,则可能不必要地减少回放级别。如果每个带中的阈值 被设置以消除用于在该带处居中的窄带信号的感知失真,则源自穿过压缩器的宽带信号的 衰减一般多于在感知上消除任何所引起的失真所要求的衰减。这归因于这种事实:宽带信 号可以大大掩蔽宽带信号引起的一些失真,而窄带信号在掩蔽其所引起的失真时可能是远 更无效的。
[0025] 图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器 的阈值的失真能听度模型(DAM)的压缩器100的示例。在图1中,以滤波器组104为形式 的滤波模块接收输入音频信号X[n]。滤波器组10
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1