具有动态阈值的频带压缩的制作方法_3

文档序号:8947700阅读:来源:国知局
0)
[0050] 替代地,可以使用掩蔽模型,掩蔽模型根据掩蔽信号的调性来考虑掩蔽的变化 性。通常已知的是,类似音调的信号的掩蔽能力显著小于类似噪声的信号。因此,可以基于 sb[n]参照调性谱来计算掩蔽阈值Mb[n]。调性谱包括区分类似噪声的频带分量与类似音调 的频带分量的调性值。可以使用已知的技术来表征每个带中的sb[n]的调性,以生成调性谱 Tb[n],其中,Tb[n]从0到1变化。0指示类似噪声的信号,1表示类似音调的信号。利用该 调性谱,可以如等式11所表示的那样计算掩蔽阈值:
[0051]Mb[n] =Sb [n]_ (Tb [n]Mtone+(I-Tb [n])MnolJ(11)
[0052] 在一种测试情况下,Mtone= 30dB并且Mncilse= IOdB是适当值的示例,从而得到比 类似噪声的信号小20dB的用于音调信号的掩蔽。
[0053] 在图4中,在408,在各带上对失真谱估计Db[n]与掩蔽阈值Mb[n]进行比较,以确 定Db[n]与Mb[n]之间的任何差值。在412,所确定的差值的任何正数值相加,以产生所预 测的能听度测量A[n]。在一些实现方式中,A[n]被计算为Db[n]与Mb[n]之间的差值的正 数值的加权和,如等式12所示:
[0055] 在等式12中,在一些实现方式中,可以针对比中频带更少地加权的高频带和低频 带在感知上激励加权Wb。
[0056] 在一些其它实现方式中,并非利用显式失真生成和掩蔽模型,可以反而据信号谱 Sb[n]的函数来推导失真能听度的测量。一个这样的示例是该谱的在各带上的标准差,如等 式13所示:
[0058]当标准差很低时,所有带的值大致相同,说明Sb[n]大致是宽带的。在此情况下, Sb[n]应适度良好地掩蔽失真。如果标准差相对较高,则Sb[n]的值显著变化,以指示失真 将是可听的谱中的可能"空洞"。因此,等式13中的值A[n]非常粗略地匹配等式12中的值 A[n]的行为。来自等式13的能听度值可以然后使用与关于失真生成和掩蔽模型所使用的 不同的归一化限制根据等式8而得以归一化,并然后如等式9中那样得以利用,以调整阈值 Db[n]〇
[0059] 图5A示出根据一些实现方式的在显示器设备上所显示的输入音频信号的频带分 量的能量级别的图形表示500A的示例。图5B示出根据一些实现方式的在显示器设备上所 显示的由听者感知的所估计的输出信号谱的对应能量级别的图形表示500B的示例。
[0060] 在图5A和图5B的示例中,图1的压缩器100如上所述处理输入音频信号x[n]。 在图5A中,输入信号的二十个频带分量Xl[n]-x2(:[n]通过图1的滤波器组104生成,并且 被分隔开达人类听力的模仿(mimic)感知分辨率。馈送图1的压缩函数112的每个频带分 量xb[n]的信号能量由图5A中的条504表示。如上所述计算的用于每个频带分量的时变 阈值Djn]-D20[n]由空白分段508表不。从压缩函数112输出的增益gJnH-gajlin]由分段 512描述。
[0061]在图5B中,感知谱估计SjnhS^^n]的能量级别由条514表示。据上述的感知谱 估计sb[n]计算出的掩蔽阈值M1M-M2Jn]在图5B中由分段516表示。由图1的DAM108 所生成的时变阈值D1 [n]-D2[n]在图5B中由空白分段520表示。在图1中,在存在通过压 缩器100播放音频信号的情况下在听者将感知任何所引起的失真之前,DAM108将图5B的时 变阈值D1 [n] -D2。[n] 520增加到最大可能级别。通常,对于宽带信号,时变阈值D1 [n] -D2。[n] 将增加到它们的标称地设置的级别Lb之上,这是因为信号自身将掩蔽任何所引起的失真的 非常重要的部分。对于窄带信号,时变阈值将很可能保留在它们的标称级别附近,这是因为 信号将提供任何所引起的失真的很少掩蔽。
[0062] 图6示出根据一些实现方式的用于呈现音频信号的包括压缩器100的回放系统 600的示例。在图6中,控制器604被配置为实现上述的压缩器100。例如,以上参照图2-图 4所描述的操作中的一个或更多个可以被控制器604执行或被使得由控制器604执行。控 制器604可以具有各种不同配置,如以下更详细地解释的那样。此外,控制器604在图6的 情况下可以在用户设备上实现,或在一些情况下,在一个或更多个服务器上实现。
[0063] 在对于图6所示的示例的替选示例中,实现控制器604的服务器可以在合适的网 络上将音频组流传送到用户的设备。本领域技术人员应理解,该网络提供服务器与用户设 备(如智能电话或平板设备)之间的通信。网络可以是各种网络环境的任何子集或组合,包 括例如基于TCP/IP的网络、电信网络、无线网络、缆线网络、公共网络、私有网络、广域网、 局域网、互联网、WorldWideWeb、内部网、外部网等。
[0064] 返回图6,回放系统600包括数模转换器(DAC) 608,数模转换器(DAC) 608被耦合 为从压缩器100接收输出信号y[n]并且将y[n]转换为模拟信号。虽然DAC608在该示例 中被实现为控制器604的一个处理模块,但本领域技术人员应理解,DAC608可以被构建为 相对于控制器604的分离单元,并且在一些实例中,构建为相对于控制器604所处的服务器 或用户的设备的分离设备。
[0065] 在图6中,预放大器612被親合为接收并且拉升由DAC608所输出的模拟信号的 信号强度。可以使用各种类型的预放大器,如电流灵敏预放大器、寄生电容预放大器、电荷 灵敏预放大器或其某种组合。本领域技术人员应理解,在一些替选示例中,可以从系统600 中省略预放大器612。
[0066] 在图6中,功率放大器616被親合以接收并且放大来自预放大器612的所拉升的 信号,以产生适合于驱动一个或更多个扬声器620的放大的输出信号。在从系统600省略 预放大器612的情况下,功率放大器616可以用集成放大器替换。系统600的放大器和扬 声器可以是如上所述的用户的设备的组件。在一些实现方式中,与用户的设备集成的或处 于连接到用户的设备的分离设备的形式的显示器可以被控制,以显示展示输出信号的频带 以及表征该信号的其它信息(如图5A和图5B中所呈现的信息)的图形数据。在一些其它 情形中,图6的放大器612和扬声器620是公共地址(PA)系统、戏剧或音乐会声音系统或 家用系统(如立体声或家庭影院系统)的一部分。
[0067]可以通过一个或更多个计算设备来实现在此所描述的技术。例如,专用计算设备 的控制器可以硬连线,以执行所公开的操作或使得这些操作得以执行,并且可以包括持续 地被编程以执行操作或使得操作得以执行的数字电子电路(如一个或更多个专用集成电 路(ASIC)或现场可编程门阵列(FPGA))。在一些实现方式中,组合具有定制编程的定制硬 连线逻辑、ASIC和/或FPGA以实现这些技术。
[0068] 在一些其它实现方式中,通用计算设备可以包括合并有被编程以使得所公开的操 作中的一个或更多个被依照固件、存储器、其它存储体或其组合中的程序指令而执行的中 央处理单元(CPU)的控制器。通用计算设备的示例包括服务器、网络设备和用户设备(如 智能电话、平板设备、膝上型设备、台式计算机、便携式媒体播放器、其它各种便携式手持设 备)以及任何其它包括数据处理硬件和/或程序逻辑的设备,以实现所公开的操作或使得 操作得以实现并且执行。计算设备可以包括监视器、打印机、或其它合适的用于将在此所提 及的任何结果提供给用户的显示器。
[0069] 在此使用的术语"存储介质"和"存储媒介"指代存储使得计算机或机器的类型以 特定方式操作的数据和/或指令的任何介质。在此所描述的任何模型、模块、单元、引擎和 操作可以实现为可由控制器的处理器使用任何合适的计算机语言运行的软件代码或被使 得由其实现。软件代码可以存储为用
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1