音频录音的自适应动态范围增强的制作方法

文档序号:7520687阅读:436来源:国知局
专利名称:音频录音的自适应动态范围增强的制作方法
技术领域
本发明一般涉及音频信号处理,更特别地,涉及通过恢复或强调音频流和录音的 动态范围来增强它们。
背景技术
遵照格言“声音越大越好”,在唱片业中以更高水平的响度灌录(master)和发行 唱片成为一般惯例。伴随诸如CD的数字媒体格式的出现,用通过可用于代表编码信号的比 特数限定的最大峰值电平将音乐编码。在达到CD的最大振幅时,通过诸如多频带动态范围 压缩、峰值限制和均衡化的信号处理技术,仍可进一步增加响度感知。通过使用这种数字灌 录工具,录音师可通过压缩瞬态峰值(诸如鼓击)并增加得到的信号的增益使平均信号电平 最大化。极度使用动态范围压缩可将削波和其它可听到的畸变引入到录音的波形中。使用 这种极度动态范围压缩的现代唱片集因此以牺牲音乐再现的质量来得到响度。增加音乐发 行物的响度以匹配竞争发行物的实践可具有两种效果。由于存在可用于录音的最大响度级 (与响度受回放扬声器和放大器限制的回放相反),提升歌曲或音轨的总响度最终产生从开 始到结束最大并且均匀地响亮的片段。这产生具有小的动态范围(在大声部分和安静部分 存在很小的差异)的音乐,这种效果常常被视为艺术家创作表现的疲劳和空白。另一可能的效果是畸变。在数字领域中,它通常被称为削波。数字媒体不能输出比 数字满刻度高的信号,因此不管信号的峰值什么时候被按过该点,这都导致变得被削波的 波形。当出现这种情况时,它有时可产生可听的卡嗒声。但是,类似鼓击的某些声音将仅对 于非常短的时间达到它们的峰值,并且,如果该峰值远比信号的其余部分声音大,那么该卡 嗒声将不被听到。在许多的情况下,鼓击的峰值被削波,但是它不被随意的收听者检测到。图la和图lb提供有害的灌录技术的视觉呈现。图la和图lb所不的首频录首 波形代表原始灌录音轨和已经通过使用不同的技术灌录的同一版本的音轨。图la表示原 始录音,大量峰值的存在表示代表存在于原始性能中的各种类型的力度(dynamics)的高动 态范围。由于诸如鼓击的某些敲击节拍听起来将是有力并且清楚的,因此该录音提供振动 收听体验。相反,在图lb中示出的录音被重新灌录以用于更大声的商业CD发行。存在于 原始录音中的大多数峰值被压缩或者甚至被削波,并且,作为结果,录音的动态范围已经受损。在商业音乐的灌录阶段越来越侵略性地使用动态范围压缩已经产生大量来自消费者、 制作者和艺术家的强烈反对。音频行业为解决该问题所讨论的方法集中于讨论处于问题本源的灌录技术。在 Bob Katz.的Mastering Audio, Second Edition:The Art and the Science 中描述了这样 的一个例子。Katz描述了如何可通过使用处理信号的校准监视以及使用更多适度的压缩 参数在不使最终的结果畸变的情况下对于响度灌录唱片。而大多数的灌录工程师会同意, Katz的方法常常被播音室管理的需求取代。即使更保守的灌录技术变为新的标准,它也解 决不了已被灌录并分发给最终用户的现有录音的主要部分的问题。用于修改音频录音的力度的现有处理技术在现有技术中是已知的。一种这种处理 是响度调平(leveling),其中经受不同程度动态范围压缩的音频材料的觉察响度之间的差 值被归一化为某预定水平。但是,这些方法被用于将从各种源播放的连续音轨的平均响度 归一化,并且不进行任何尝试以恢复过度动态范围压缩内容的动态范围。作为结果,当在更 低的规定收听级别上被播放时,压缩媒体可更加不发出动态表现的声音。另一已知的技术是,如在授权给Bench的发明名称为Dynamic Expander的美国专 利No. 3,978,423中描述的那样,应用向上扩展器(upward expander)。向上扩展器根据固 定“扩展曲线”向音频信号施加时间变化增益,由此输出信号电平比高于选择的阈值的输入 电平大。作为结果,源信号的较大声音部分的振幅增加。但是,这可在输出信号中导致具有 过分强调的瞬态的原本动态的声道(sound track)。另一已知的技术是当检测到瞬态时提升较低和较高频带的动态谱均衡 化。作为结果,产生更动态的输出。在以下的文献中描述了动态谱均衡化X Rodet, F Jaillet, Detection and Modeling of Fast Attack Transients (2001), Proceedings of the International Computer Music Conference ;授权给 Goodwin 等的发明名称为 Transient Detection and Modification in Audio Signals 的美国专利 No. 7, 353, 169 ; 和授权给Avendano等的发明名称为Method for Enhancing Audio Signals的美国专利申 请No. 11/744,465。与前面的方法不同,这些动态增强技术专门地影响信号瞬态。但是,它 影响所有的信号瞬态,甚至是已表现出高力度的那些信号瞬态。动态谱均衡化一般向所有 音频信号内容施加处理,不管它是否需要。对于某些类型的音频内容,这可导致过度动态处 理输出。授权给Hipert等的美国专利No. 6,453,282概括了在离散时间音频域中进行瞬态 检测的方法。由于当总体观看信号时由于瞬态导致的能量变化变得不明显,因此当分析严 重动态范围压缩的材料时,这种时域方法是不可靠的。这导致瞬态信号的错误分类并导致 产生误判(false positive)。鉴于不断增加对于改善音频录音的呈现的关注,在本领域中需要改善音频处理。

发明内容
根据本发明,提供用于调节音频信号的方法和装置。本发明对于音频信号、特别是 对于经受了有害灌录技术的音频信号的动态范围提供强制增强。根据本发明的一个方面,提供一种用于调节音频信号的方法,该方法具有以下的 步骤接收至少一个音频信号,每个音频信号具有至少一个通道,每个通道在时间序列上被分成多个帧;对于多个连续时间段计算音频信号的动态偏移的至少一个测量值;将音频信 号滤波成多个子带,每个帧由至少一个子带代表;从连续时间段导出动态增益因子;分析 帧的至少一个子带以确定是否在帧中存在瞬态;和向具有瞬态的每个帧施加动态增益因子。动态偏移的测量值可由时间段的波峰因数(crest factor)代表。可通过在帧内 取得峰值信号大小的函数与音频信号的平均信号大小的函数的比,计算每个连续时间段的 波峰因数。方法还可包括对于至少一个子带计算子带相对能量函数的步骤。可通过比较帧或该帧的一部分的每个子带中的子带瞬态能量与相对能量阈值并 将通过该相对能量阈值的子带的数量求和,计算每个帧的总体子带瞬态能量。在该帧的 分析中通过相对能量阈值的子带的数量大于预定分数的总子带的情形下,瞬态可存在于帧 中。例如,在对该帧的分析中,通过相对能量阈值的子带的数量大于四分之一的总子带的情 形下,瞬态可存在于帧中。方法通过下述步骤继续,对于分析中的总子带数量,基于通过阈值的子带的数量 计算动态增益加权因子。根据加权因子加权每个帧的动态增益因子。如果对于该帧没有检 测到瞬态,则该帧的先前动态增益可通过使用指数衰减曲线减小为1的值。在向输入信号 施加最终动态增益之前,可进行对于音调状音频的检查,以避免对于存在于输入信号中的 强音调进行可听的调制。如果在子带内检测到强音调,则对于该帧周期不向该子带施加附 加的增益,并且,该子带的动态增益继续以基于先前帧的动态增益值衰减。根据本发明的另一方面,提供一种音频信号处理装置。音频信号处理装置包括用 于接收至少一个音频信号的接收部件,每个音频信号具有至少一个通道,每个通道在时间 序列上被分成多个帧;用于对于多个连续时间段计算音频信号的动态偏移的至少一个测量 值的计算部件;用于将音频信号滤波成多个子带的滤波部件,每个帧由至少一个子带代表; 用于从动态偏移的测量值导出动态增益并分析帧的至少一个子带以确定是否在帧内存在 瞬态并且向具有瞬态的每个帧施加动态增益的导出部件。


参照以下的描述和附图,将更好地理解这里公开的各种实施例的这些和其它特征 和优点,其中,类似的附图标记始终表示类似的部件,并且其中图la是原始音频录音的波形的透视图;图lb是动态范围被过度压缩的重新灌录的音频录音的波形的透视图;图2是根据本发明的实施例的使用用于在多通道扬声器或头戴式耳机上回放的 自适应动态增强的收听环境的示意图;图3是示出根据本发明的实施例的在自适应动态增强处理器之前的可选响度调 平处理块的流程图;图4是示出在根据本发明的一个实施例的用于检测瞬态并因此施加增益的自适 应动态增强处理中采取的步骤的流程图;图5是示出在根据本发明的一个实施例的检测瞬态、针对已知的阈值评价瞬态并 因此施加自适应EQ曲线的自适应动态增强处理中采取的步骤的流程图。
具体实施例方式以下关于附图阐述的详细描述意图是作为本发明的当前优选实施例的描述,并且 不是要代表可以构建或利用本发明的唯一形式。描述结合示出的实施例阐述用于开发和操 作本发明的功能和步骤次序。但是,应当理解可通过也要包含于本发明的精神和范围内的 不同实施例实现相同或等同的功能和次序。还应理解,使用诸如第一和第二等的关系术语 仅用于相互区分实体,而未必要求或隐含这些实体之间的任何实际的这种关系或次序。本发明的目的是解决有害录音技术中的问题,在有害录音技术中,采用侵略性应 用动态范围压缩算法,音频录音被灌录为尽可能的大声。这些录音信号中的瞬态的动态偏 移远比它们应当偏移的低。当在适度的级别上收听时,这产生弱声、沉闷或无生气再现的感 受。本发明分析音频录音的力度,并增强表现有害灌录实践的迹象的瞬态。使用通过 分析源音频录音信号的响度和动态性能得到的智能/自适应处理来设计本发明。除非必 须,避免修改原始音频录音信号的力度。但是,也可由用户调整附加的动态处理的缺省量, 使得任何录音的力度可对于更尖鋭或“更强力”的声音被夸大,或者对于更細微的增强减 小。可以使用本发明以增强源自任何媒体源的任何音乐、电影或游戏声轨和任何收听环境 中的瞬态カ度。现在參照图2,提供示出多个实施例的实现的示意图。图2示出用于在扬声器或 头戴式耳机上回放动态增强的音频录音的音频收听环境。音频收听环境包括至少ー个诸如 DVD或BD播放器、TV调谐器、CD播放器、手持播放器、因特网音频/视频设备或游戏控制台 等的至少ー个消费者电子设备10。消费者电子设备10提供被动态增强以补偿任何有害灌 录技术的源音频录音。在本实施例中,消费者电子设备10与音频再现系统12连接。音频再现系统12通 过动态增强音频录音的自适应动态增强处理(ADE)来处理音频录音。在替代性的实施例中, 独立式消费者电子设备10可通过ADE处理增強音频录音。音频再现系统12包含诸如IBMPowerPC, Inter Pentium ( X86)处理器等的可 代表一个或多个常规类型的这种处理器的中央处理单元(CPU)。随机存取存储器(RAM)暂 时存储由CPU执行的数据处理操作的結果,并且一般通过专用的存储器通道与其互连。音 频再现系统12还可以包含也在i/o总线上与CPU通信的诸如硬盘驱动器的永久存储设备。 也可以连接诸如磁带机、光驱的其它类型的存储设备。图形卡也通过视频总线与CPU连接, 并且向显示监视器传送代表显示数据的信号。诸如键盘或鼠标的外设数据输入设备可以在 USB端口上与音频再现系统连接。USB控制器对于与USB端ロ连接的外设翻译送往和来自 CPU的数据和指令。诸如打印机、麦克风和扬声器等的附加设备可与音频再现系统12连接。音频再现系统12可利用诸如来自Redmond,Washington的微软公司的WINDOWS、来 自Cupertino, CA的苹果公司的MAC OS、和具有X-Windows窗ロ系统的各种UNIX版本等的 具有图形用户界面(GUI)的操作系统。音频再现系统12执行ー个或多个计算机程序。一 般地,操作系统和计算机程序以有形的方式体现于例如包含硬盘驱动器的固定和/或可去 除数据存储设备中的一个或多个的计算机可读介质中。操作系统和计算机程序均可从上述 的数据存储设备被加载到RAM中以供CPU执行。计算机程序可包含指令,这些指令当被CPU 读取和执行时导致其执行步骤以执行本发明的步骤或特征。
以上的音频再现系统12仅代表适于实现本发明的各方面的一个示例性装置。音 频再现系统12可具有许多不同的配置和结构。可以在不背离本发明的范围的情况下很容 易地替代任何这种配置或结构。本领域技术人员可以认识到,上述的次序最常用于计算机 可读介质中,但是,可在不背离本发明范围的情况下,存在能够被替代的其它现有次序。可通过硬件、固件、软件或它们的任意组合实现ADE处理的一个实施例的要素。当 实现为硬件吋,ADE处理可在一个音频信号处理器上被使用,或者分布于各种处理部件之 间。当实现为软件时,本发明的实施例的要素基本上是用于执行必要任务的代码段。软件 优选包含用于实施在本发明的一个实施例中描述的操作的实际代码或模仿或模拟操作的 代码。程序或代码段可被存储于处理器或机器可存取介质中,或者在传送介质上,通过在载 波中体现的计算机数据信号或通过载波调制的信号被传送。“处理器可读或可存取介质”或 “机器可读或可存取介质”可包含可存储、传送或传递信息的任何介质。处理器可读介质的 例子包含电子电路、半导体存储器件、只读存储器(ROM)、闪速存储器、可擦ROM (ER0M)、软 盘、紧致盘(CD) ROM、光盘、硬盘、光纤介质、射频(RF)链接等。计算机数据信号可包含可在 诸如电子网络信道、光纤、空气、电磁、RF链接等的传送介质上传播的任何信号。代码段可通 过诸如因特网、内联网等的计算机网络被下载。可在制造物品中体现机器可存取介质。机 器可存取介质可包含当被机器访问时导致机器执行以下描述的操作的数据。术语“数据”这 里指的是出于机器可读目的编码的任何类型的信息。因此,它可包含程序、代码、数据、文件等。
可通过软件实现本发明的实施例的全部或一部分。软件可具有相互耦合的几个模 块。软件模块与另ー模块耦合以接收变量、參数、自变数、指针等,并且/或者产生或通过结 果、更新的变量、指针等。软件模块也可以是与在平台上运行的操作系统交互作用的软件驱 动器或接ロ。软件模块也可以是配置、建立、初始化、发送和接收送往和来自硬件设备的数 据的硬件驱动器。本发明的一个实施例可被描述为通常示为程序框图、流程图、结构图或框图的处 理。虽然框图可将操作描述为依次的处理,但是可以并行或同时地执行多个操作。另外,操 作的次序可被重新配置。处理在完成其操作时终止。处理可与方法、程序、过程等对应,图2 是示出用于在头戴式耳机14或扬声器16上再现的音频再现系统12的示意图。音频再现 系统12可从各种音频或音频/视频源10接收数字或模拟音频源信号。音频源信号可以是 单个信号、二通道信号(诸如音乐轨道或TV广播)或多通道信号(诸如电影声道)。音频信号 可以是诸如真实世界声音或工程声音等的任何被觉察或不被觉察的声音。音频再现系统12可包含用于连接模拟音频源的模拟数字转换器或数字音频输入 接ロ。它可包含用于处理音频信号的数字信号处理器以及用于将处理的输出信号转换成被 发送到换能器(头戴式耳机14或扬声器16)的电信号的数字模拟转换器和信号放大器。音 频再现系统12可以是专用于音频和/或视频信号的选择、处理和路由的家庭影院接收器或 汽车音响系统。作为替代方案,音频再现系统12和音频信号源中的一个或几个可被一起结 合到诸如便携式媒体播放器、电视机或膝上型计算机的消费者电子设备10中。诸如在电视 机或膝上型计算机的情况下,扬声器16也可被结合到同一电器中。图3是示出ADE处理环境的高层流程图。流程图通过接收输入信号在步骤300上 开始。输入信号是数字音频信号。在本实施例中,在步骤310中,通过响度调平算法处理输入信号,由此,随时间适调整到来的输入信号的增益,使得它具有基本上恒定的平均响度级 (比如说,-20dB相对于OdB的满度)。响度调平算法是可选的特征,并且对于实现ADE处理来 说是不需要的。随后,在320中,如果存在上游增益归一化算法,那么ADE处理可在不导致可 源自信号波形削波的可听的伪信号的情况下,将基准增益电平因子化为扩展到来的信号的 增益所需要的可用的动态余量(headroom)。该通信由虚线箭头表示。ADE动态余量需求也 可将输入的灌录增益和输入信号内容的增益因子化。可通过使用由DYNAMICS ENHANCEMENT LEVEL描述的用户参数缩放施加的动态增强的量。使用输出限制器以确保作为向输入信号 施加需要的动态EQ的结果不出现输出饱和。现在参照图4,示出描述ADE处理的一个实施例的流程图。ADE处理通过接收代表 音频录音的输入信号在步骤400中开始。输入信号是至少一个通道的数字音频信号。输入 信号代表通过模拟/数字转换被转换成数字格式的已被转换成电子信号并被适当地预处 理的有形的物理现象、特别是声音。一般地,如在本领域中已知的那样,会施加模拟滤波、数 字滤波和其它的预处理,以使混淆、饱和或下游的其它信号处理误差最小化。可通过诸如 PCM编码的常规的线性方法代表音频信号。在步骤410中,通过可适当地为互补正交镜像 滤波器组的多抽头、多频带、分析滤波器组滤波输入信号。作为替代方案,可以使用诸如多 相滤波器组的伪正交镜像滤波器(PQMF)。滤波器组产生多个子带信号输出。在本实施例 中,使用这种子带输出中的64个。但是,本领域技术人员很容易认识到输入信号可被滤波 成任意数量的子带。作为滤波功能的一部分,滤波器组应优选还关键地大大削弱每个子带 中的子带信号,特别是将每个子带信号削弱到刚刚足以完全代表每个子带中的信号(“临界 采样”)的更少数量的采样/秒。该子带采样也可模仿人听觉的生理机能。在滤波之后,在步骤420中分析子带以进行瞬态检测。可以设想,不是所有的子带 都被用于瞬态分析,原因是,可以获知,某些频率具有瞬态的可能性很低。在本实施例中,通 过使用在频带上计算能量的加权和的瞬态检测算法来检测瞬态。由于信号能量通常占据叫 低的频率,因此使用附加权重以强调瞬态不再显著的信号的能量。这减少瞬态识别过程中 的“误判”的可能性
其中TEhf (m, c)是瞬时的高频加权瞬态能量,k是频带指数,m是分析巾贞指数,c代 表通道指数,w(k)与第k个频率加权滤波系数对应,以及|G (k,m,c) |代表第c个通道的 第m个分析帧的第k个频带的绝对增益。本领域技术人员可以理解,可根据本发明应用各 种瞬态检测算法,并且以上的例子作为例子被提供且不应被解释为限制本发明的范围。将瞬时的瞬态能量函数与先前的瞬态能量的时间平均相比较。该比较表明可能的 瞬态事件,其中,瞬时的瞬态能量应远大于平均瞬态能量。可通过在每个频带中应用泄漏积 分器滤波器(leaky integrator filter)计算平均瞬态能量TEav :TEav(m, c) = (1_ a TE) TEav(m_l, c) + a TETEHF(m, c)(2)其中,a TE与瞬态能量阻尼因子对应,m代表帧指数,以及c代表通道指数。如果 那么触发瞬态开端,其中,Gteans与一些预定的短暂阈值对
应。一般地,2 3 WG_S的值产生良好的结果,但是,阈值也可根据源材料改变。随后,在CN 102668374 A说明书7/11 页
步骤440中,通过在64个分析频带中的每ー个中取峰值信号电平与先前信号电平的时间平 均的比,计算多频带波峰因数值CF (k, m, c)。
权利要求
1.ー种用于调节音频信号的方法,包括 接收至少一个音频信号,每个音频信号具有至少ー个通道,每个通道在时间序列上被分成多个巾贞; 对于多个连续时间段计算音频信号的动态偏移的至少ー个測量值; 将音频信号滤波成多个子带,每个帧由至少ー个子带代表; 从动态偏移的測量值导出动态增益; 分析帧的至少ー个子带以确定是否在帧中存在瞬态;和 向具有瞬态的每个帧施加动态增益。
2.根据权利要求I所述的方法,其中,动态偏移的测量值是时间段的波峰因数。
3.根据权利要求2所述的方法,其中,通过在帧内取得峰值信号大小的函数与音频信号的平均信号大小的函数的比,计算每个连续时间段的波峰因数。
4.根据权利要求I所述的方法,其中,分析步骤还包含 计算至少ー个子带的子带相对能量函数,所述子带相对能量函数被表示为
5.根据权利要求4所述的方法,其中,通过将帧的每个子带中的子带相对能量与阈值相比较并将通过阈值的子带的数量求和,计算每个帧的总体子带瞬态能量,该总体子带瞬态能量被表示为 TE (m, c) = Σ (RE (k, m, c) > REteesh) 其中 TE(m, c)=在第c个通道的第m个帧上测量的总体子带瞬态能量; RE (k, m, c)=在第c个通道的第m个巾贞的第k个子带上测量的子带相对能量;以及 REthresh=阈值相对能量值。
6.根据权利要求5所述的方法,其中,在该帧的分析中通过阈值的子带的数量大于预定分数的总子带的情形下,瞬态存在于帧中。
7.根据权利要求5所述的方法,还包括以下的步骤 基于通过阈值的子带的数量,计算每个帧的加权因子。
8.根据权利要求7所述的方法,其中,基于加权因子加权每个帧的动态增益。
9.根据权利要求I所述的方法,还包括 导出每个帧中的每个子带的子带增益;和 向每个子带施加子带增益。
10.根据权利要求9所述的方法,其中,通过确定峰值增益电平与时间平均増益的比,计算每个子带的子带波峰因数,该波峰因数被表示为
11.根据权利要求10所述的方法,其中,将子带波峰因数与预定的音调阈值相比,并且如果子带波峰因数低于预定的音调阈值,则子带增益不被进一歩修改。
12.根据权利要求11所述的方法,其中,如果对于具有低于预定的音调阈值的子带波峰因数的每个子带没有检测到瞬态,则通过使用指数衰减曲线减小施加的子带增益。
13.根据权利要求11所述的方法,其中,如果对于具有低于预定的音调阈值的子带波峰因数的每个子带检测到音调成分,则通过使用指数衰减曲线减小施加的子带增益。
14.一种音频信号处理装置,包括 用于接收至少ー个音频信号的接收部件,每个音频信号具有至少ー个通道,每个通道在时间序列上被分成多个帧; 用于对于多个连续时间段计算音频信号的动态偏移的至少ー个测量值的计算部件; 用于将音频信号滤波成多个子带的滤波部件,每个帧由至少ー个子带代表; 用于从动态偏移的測量值导出动态增益并分析帧的至少ー个子带以确定是否在帧内存在瞬态并且向具有瞬态的每个帧施加动态增益的导出部件。
15.根据权利要求14所述的音频信号处理装置,其中,动态偏移的测量值是时间段的波峰因数。
16.根据权利要求15所述的音频信号处理装置,其中,通过在帧内取得峰值信号大小的函数与音频信号的平均信号大小的函数的比,计算每个连续时间段的波峰因数。
17.根据权利要求16所述的音频信号处理装置,其中,计算至少ー个子带的子带相对能量函数,该子带相对能量函数被表示为
18.根据权利要求17所述的音频信号处理装置,其中,通过比较帧的每个子带中的子带瞬态能量与阈值并将通过阈值的子带的数量求和,计算每个帧的总体子带瞬态能量,该总体子带瞬态能量被表示为 TE (m, c) = Σ (RE (k, m, c) > REteesh) 其中 TE(m, c)=在第c个通道的第m个帧上测量的总体子带瞬态能量; RE (k, m, c)=在第c个通道的第m个巾贞的第k个子带上测量的子带相对能量;以及 REthresh=阈值相对能量值。
19.根据权利要求18所述的音频信号处理装置,其中,瞬态存在于帧中,其中通过阈值的子带的数量大于帧中的总子带的四分之一。
20.根据权利要求19所述的音频信号处理装置,其中,基于通过阈值的子带的数量,计算每个帧的加权因子。
21.根据权利要求20所述的音频信号处理装置,其中,根据加权因子对于每个帧将动态增益加权。
22.根据权利要求14所述的音频信号处理装置,其中,分析部件计算每个帧中的每个子带的子带增益,并且,向每个子带施加子带增益。
23.根据权利要求22所述的音频信号处理装置,其中,通过确定峰值增益电平与时间平均増益的比,计算每个子带的子带波峰因数,该波峰因数被表示为
24.根据权利要求23所述的音频信号处理装置,其中,将子带波峰因数与预定的音调阈值相比,并且如果子带波峰因数低于预定的音调阈值,则子带增益不被进一歩修改。
25.根据权利要求23所述的音频信号处理装置,其中,如果对于具有低于预定的音调阈值的子带波峰因数的每个子带没有检测到瞬态,则通过使用指数衰减曲线减小施加的子带增益。
26.根据权利要求23所述的音频信号处理装置,其中,如果对于具有低于预定的音调阈值的子带波峰因数的每个子带检测到音调成分,则通过使用指数衰减曲线减小施加的子带增益。
全文摘要
本发明涉及音频录音的自适应动态范围增强。提供用于调节音频信号的方法和装置。根据本发明的一个方面,提供一种用于调节音频信号的方法,该方法包括以下的步骤接收至少一个音频信号,每个音频信号具有至少一个通道,每个通道在时间序列上被分成多个帧;对于多个连续时间段计算音频信号的动态偏移的至少一个测量值;将音频信号滤波成多个子带,每个帧由至少一个子带代表;从连续时间段导出动态增益因子;分析帧的至少一个子带以确定是否在帧中存在瞬态;和向具有瞬态的每个帧施加动态增益因子。
文档编号H03G7/00GK102668374SQ201080053361
公开日2012年9月12日 申请日期2010年10月8日 优先权日2009年10月9日
发明者E·斯特因, J-M·卓特, M·维尔什 申请人:Dts(英属维尔京群岛)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1