自动调谐音频压缩器以防止失真的制作方法

文档序号：16979466发布日期：2019-02-26 19:22阅读：258来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本公开涉及音频失真，具体涉及通过自动调谐全频带和多频带压缩器和限幅器来防止音频失真的系统和方法。

背景技术：

音频信号的保真度和再现性可以取决于扬声器和麦克风的质量。低质量扬声器或麦克风可能会引入非线性失真，从而改变音频信号并导致瑕疵。非线性失真降低音频再现的音质。

附图说明

参考以下附图和描述可以更好地理解本公开。附图中的元件不一定是按比例绘制的，而是将重点放在了说明本公开的原理。此外，在附图中，类似的参考标记在全部不同视图中表示对应的部分。

图1是执行自动调谐的交通工具的俯视图。

图2是四频带结构的幅度响应。

图3是多频带压缩器/限幅器调谐过程。

图4是具有多频带压缩器/限幅器调谐系统的交通工具。

具体实施方式

非线性扬声器失真的原因很复杂。一些是由扬声器组件的电阻抗变化、阻力型扬声器悬架、扬声器锥体弯曲、反电动势(emf)或多普勒频移引起的。非线性失真的不良影响可以改变音频信号的保真度，使得音频信号不好听，在语音信号的情况下难以理解，或者难以执行后处理。例如，从失真扬声器播出的音乐可能听起来刺耳、低沉、杂碎或有金属感。例如，声学回声消除器(aec)后处理减少麦克风信号上的预估回声，并且假设回声与扬声器输入信号线性相关来进行操作。由扬声器呈现的非线性失真可能违背aec的线性假设并导致回声泄漏，即仅部分消除回声，这导致一些回声分量泄漏至例如免提通话远端的收听者。

通常，当驱动扬声器的信号的电平增加时，扬声器失真趋于增加，并且存在扬声器大致线性地表现的操作范围。为确保系统在线性范围内工作，非线性压缩可能会限制扬声器信号。非线性压缩可以包括全频带或多频带限幅器，以及全频带或多频带压缩器。多频带限幅器或压缩器将输入信号的频谱划分为两个或更多个不同的部分或频带，并且分别对每个频带执行限制或压缩。每个频带可以有其自己独特的压缩或限幅器参数。然后，将被限制或压缩的频带重新组合以形成处理后的输出信号。全频带限幅器或压缩器直接对输入信号执行限制或压缩。

多频带限幅器或压缩器能够压缩或限制音频信号，以调整针对再现信号的扬声器的压缩或响度。例如，如果扬声器主要由于扬声器信号的低频高电平分量而失真，则多频带限幅器可以将扬声器信号分成低频和高频频带，将低频频带限制在可接受的水平，重新组合两个频带，并将处理后的信号发送到扬声器。因此，信号中的高频保持相对不受影响，并且压缩器或限幅器仅对信号做出需要防止失真的最小修改。

为了有效地压缩或限制频谱的不同部分，对许多参数进行调谐。在多频带压缩器中，可能需要调谐一个或多个交叉频率、幅度阈值、压缩比、时间常数、上升和释放时间、超前参数等。由于调谐需要相当多的音频专业知识、时间和主观评估来手动调谐压缩器或限幅器的参数，因此调谐成本过高并且不总是有效或完全地完成。例如，为舱室中的扬声器调谐多频带限幅器或压缩器可能需要几个小时或几天，并且必须针对每个交通工具制造、型号和装饰水平重复这一过程。

自动系统和方法(称为系统)通过产生测试信号，用测试信号扫描一个或多个扬声器，并在一个或多个麦克风处测量一个或多个扬声器响应来自动调谐一个或多个多频带限幅器和/或压缩器。扫描信号可以包括频率和幅度变化的纯音调、扫描和噪声突发。系统可以确定将从扬声器再现的信号的感知质量最大化所需的频带数量、交叉频率、阈值等。

自动系统通过一个或多个换能器或扬声器104-106(以下称为扬声器)中的一个产生并传递时变频率为时间“n”的函数“f1(n)”的正弦扫描信号，并且在图1的交通工具100中所示的一个或多个参考麦克风112-118中的一个处捕捉响应。在捕获信号中，谐波失真分量可能出现在基频乘积处，如等式1所示。

f2(n)＝2*f1(n)，f3(n)＝3*f1(n)，......等式1

当多于一个正弦音调经过活跃扬声器104(例如，正在呈现声音的扬声器)时，在和频和差频处可能发生互调失真。可以使用各种度量来表征活跃扬声器104所呈现的失真。这些度量包括总谐波失真(thd)/总谐波失真加噪声(thd+n)、信噪比(snr)和最大声压级(spl)中的一个或多个。thd+n测量频谱上的相比于基频“f1(n)”处功率的谐波失真加噪声功率和。在操作中，小于约百分之一的thd+n测量值可以指示活跃扬声器104在线性范围内操作，并且不太可能感知到失真。大于约百分之十的thd+n测量值可以表明可感知的失真。

随着正弦扫描信号的幅度电平的增加，扬声器的失真趋于增加。在该系统中，谐波失真加噪声(thd+n)的上限由d(f)表示。低于该上限，失真是听不见的或不影响后处理，例如aec或反馈消除过程。上限可以是频率依赖的，或者是标量，例如1％。作为频率“f”的函数，a(f)是从受到thd+n＜d(f)约束的活跃扬声器输出的最大正弦幅度。换句话说，只要扬声器呈现的作为频率的函数的信号小于a(f)，扬声器就不会显著失真。这被称为失真约束。这通过使正弦扫描信号或其他增加幅度的测试扬声器信号通过扬声器来确定，其从不存在失真的低幅度信号开始，到失真超过d(f)的高幅度信号。利用该约束，系统自动调谐一个或多个多频带限幅器/压缩器参数，使得频率“f”处的输出幅度小于a(f)。

压缩器或限幅器通常降低高输入信号电平下的再现信号的感知响度。在集成于或者是在交通工具信息娱乐系统中使用的耳机、移动电话或扬声器的整体部分的应用中，从换能器获得足够的响度可能是一个目标。因此，该系统调谐一个或多个压缩器和/或限幅器，使得响度的降低最小化。因此，系统自动地调谐各个频带，其中，通过对参数进行编程来调整多频带压缩器/多频带限幅器的交叉频率，从而可以设置各个频带的带宽。自动调整交叉频率和限幅器阈值，以最小化受到失真约束的响度降低。

具有“b”个频带的示例性多频带限幅器可以被编程为具有b-1个交叉频率fc_1，fc_2，...fc_(b-1)。从输入信号产生频带“b”的滤波器的幅度响应表示为h_b(f)。该滤波器可以是有限脉冲响应(fir)或无限脉冲响应(iir)滤波器。设计带通滤波器使得多频带限幅器的总响应(即，在频带上求和)大致平坦，如等式2所示。

对于所有f，sum_bh_b(f)＝1等式2

图2示出了四频带结构的幅度响应h_b(f)，其中截止频率出现在约1000、3000和5000hz。这里，四个频带将频谱分成两个高频带和两个低频带，当它们相加时，呈现为在频率上具有平坦幅度响应1(0db)的全频谱。

等式3表示在限制之前的针对幅度响应x(f)的输入信号(例如，代表性语音信号)在频带“b”的输出处的幅度响应。

x(f)*h_b(f)等式3

多频带压缩器/限幅器阈值t_b由等式4导出。

t_b＝alpha*min_f(a(f)，flo_b＜f＜fup_b)等式4

这里，min_f表示系统在频率范围内导出参数最小值。a(f)是从受到失真约束的活跃扬声器104(或活跃换能器)向外驱动的最大幅度，并且flo_b和fup_b定义频带的上限频率和下限频率，其中所述频带是例如幅度响应h_b(f)降至-6db或-20db以下的频带。等式4确保具有频率“f”的输入信号永远不会导致频带“b”的受限输出电平超过最大幅度“a(f)”而不管输入信号的电平如何。等式4中，alpha是常数(例如，0.5)，其可以在备选的系统中随频率变化。alpha不依赖于活跃扬声器或设置；相反，它决定了系统在封闭环境、房间或交通工具中控制响度的保守程度。

等式4中，t_b为每个频带建立一个阈值；也就是说，每个频带的最大输出电平将满足失真标准。有效地，等式4将取决于频率的最大幅度“a”转换为取决于频带“b”的索引的限幅器阈值“t”。当满足该阈值时，系统确保满足失真约束并且一个或多个多频带限幅器/压缩器在线性范围内操作。如上所述，阈值“t”的值将取决于所使用的频带的数量，或者频带之间的截止频率被优化。

设y_b(f)是在限制或压缩之后的、响应于输入信号“x(f)”的频带“b”的输出的幅度响应，其由等式5大致地表示。

y_b(f)＝min(x(f)*h_b(f)，t_b)等式5

在等式5中，y_b(f)取两项中的最小值：第一项是限制前的频带“b”的幅度响应(x(f)*h_b(f))；第二项是多频带压缩器/限幅器阈值t_b。

当系统在所有频带上对幅度响应进行求和时，它呈现多频带压缩器/限幅器的幅度响应，如等式6所示。

y(f)＝y(f，b，fc_1，...，fc_(b-1))＝sum_by_b(f)等式6

在等式6中，y(f)是原始频带数“b”和交叉频率fc_b的值的函数。

可以通过将输入x(f)与输出y(f)进行比较来计算响度差。各种度量可以执行该比较，例如，a加权声压级(spl)和用于电话的itu-tp.79。在该系统中，l(x，y)是用于计算具有幅度响应x(f)和y(f)的两个信号之间的响度差的函数。在一些系统中，l(x，y)可以是由等式7表示的感知频率加权(w(f))函数。

l(x，y)＝log(sum_fw(f)x(f))-log(sum_fw(f)y(f))等式7

等式7计算两个信号x和y的响度差或l(x，y)。这里，根据例如zwicker响度模型，加权函数w(f)不强调低频，而是强调较高频率。此外，对数(log)函数对电平和响度感知判断之间的大致对数关系进行建模。

在l(x，y)定义为原始输入信号x(f)与压缩器或限幅器y(f)的输出之间的响度差的情况下，系统尝试最小化l(x，y)，使得通过压缩器或限幅器最小程度地减少信号响度。因此，等式8表示被优化的模型。

argmin{b，fc_1，...fc_(b-1)}l(x，y(b，fc_1，...，fc_(b-1)))

等式8

argmin函数指示在可调参数集{b，fc_1，...fc_(b-1)}的整个参数空间中搜索l(x，y)的最小值。例如，通过基于计算机的蛮力(brute-force)搜索技术，通过梯度下降、单纯形(simplex)法或解决方案的系统评估来执行参数优化。该结果计算所导出的频带“b”和交叉频率fc_b的数量，使得针对代表信号x以及按照等式6定义而且受到等式1所示的失真约束的压缩或限制后的信号y的响度降低最小化。在一些系统中，通过多次编程循环或其他自动优化技术来进行优化。

在操作中，系统可以通过图3的过程来优化一个或多个多频带音频限幅器和/或压缩器。在图3中，在302和304，音频源产生并呈现驱动活跃扬声器的频率和幅度变化的一个或多个测试扬声器信号。在306，该过程通过一个或多个麦克风接收并记录活跃扬声器响应。在308，该过程通过上述一个或多个过程来测量活跃扬声器关于频率和幅度的失真。在310，该过程自动地计算和调谐多频带压缩器/限幅器参数。调谐参数可以包括一个或多个交叉频率、幅度阈值、压缩比、时间常数、上升和释放时间段、超前参数等。在可选的312，该过程将一个或多个经调谐的音频压缩器/限幅器应用于扬声器信号，以防止扬声器失真，并且在一些情况下，防止麦克风失真。

图4是具有多频带压缩器/限幅器调谐系统的交通工具的框图。系统400包括处理器402、诸如存储器404(其内容可被处理器402访问)的非暂时性介质、以及i/o接口406。i/o接口406连接设备和本地和/或远程的应用，例如，附加麦克风、音频换能器或扬声器、以及aec和反馈抑制应用。存储器404可以存储指令，当由处理器402执行时，该指令使系统呈现与如本文所述的多频带压缩器/限幅器的调谐相关联的一些或全部功能。例如，存储器404可以存储指令，当由处理器402执行时，该指令使系统呈现与后处理408(例如，aec、反馈抑制等)和计算以及调谐多频带压缩器/限幅器参数410相关联的功能。调谐参数可以包括一个或多个交叉频率、幅度阈值、压缩比、时间常数、上升和释放时间、超前参数等。

处理器402可以包括单个处理器或多个处理器，该多个处理器可以被布置在单个芯片上，布置在多个设备上或分布在一个以上的系统上。处理器402可以是执行体现在存储器404或其它存储器中的计算机可执行指令或计算机代码以执行本文所述系统的一个或多个特征的硬件。处理器402可以包括中央处理单元(cpu)、图形处理单元(gpu)、专用集成电路(asic)、数字信号处理器(dsp)、现场可编程门阵列(fpga)、数字电路、模拟电路、微控制器、任何其它类型的处理器或其任何组合。

所公开的存储器404或存储设备可以保存用于实现上述功能的可执行指令的有序列表。机器可读介质可以选择性地但不限于电子、磁性、光学、电磁、红外或半导体介质。机器可读介质的示例的非穷尽列表包括：便携式磁盘或光盘、诸如随机存取存储器(ram)的易失性存储器、只读存储器(rom)、可擦除可编程只读存储器(eprom或闪速存储器)或数据库管理系统。存储器404可以包括可以设置在一个或多个专用存储器设备或者处理器或其他类似设备上的单个设备或多个设备。当功能或步骤被称为响应于功能或过程，或者作为对功能或过程的响应而发生时，设备功能或步骤必然作为功能或消息的结果而发生。功能或行为仅仅跟随或发生在另一个之后是不够的。此外，当功能指示发生自动回声消除时，通过从发送或接收的信号中减去预估的回声来消除回声。

存储器404还可以存储可由处理器402执行的非暂时性计算机代码。计算机代码可以用诸如c、c++、汇编语言、通道程序代码的计算机语言和/或任何计算机语言组合来编写。存储器404可以在数据结构中存储信息，包括例如多频带压缩器/限幅器可调谐参数，其中包括一个或多个交叉频率、幅度阈值、压缩比、时间常数、上升和释放时间、超前参数等。

还可以响应于存储在非暂时性计算机可读介质中或之上的一个或多个逻辑集或指令集执行附图或所描述的功能、动作或任务。功能、动作或任务独立于特定类型的指令集、存储介质、处理器或处理策略，并且可以由单独或组合操作的软件、硬件、集成电路、固件、微代码等来执行。在一个实施例中，指令存储在可移除介质设备上以供本地或远程系统读取。在其他实施例中，逻辑或指令存储在远程位置，以便通过计算机网络、或通过无线或有形的电话线路或通信线路传送。在其他实施例中，逻辑或指令可以存储在给定的计算机内，例如cpu。

该系统和过程增强并强化了声音再现而不失真。该系统可以自动地调谐多频带压缩器和/或限幅器频带中的一个、多个或全部，而不应用主观的测试标准。该系统在许多不同交通工具模型中可能出现的许多设备上一致地调谐一个或多个音频压缩器和/或限幅器中的全部或一些。该系统可以在诸如信息娱乐处理器和数字信号处理器或dsp之类的交通工具系统中实现，并且与其他系统软件共存和通信。交通工具可以包括但不限于汽车、公共汽车、卡车、拖拉机、摩托车、自行车、三轮车、四轮车或其他轮车、大船、潜艇、小船或其他船舶、直升机、无人机、飞机或其他飞行器、火车、电车或其他有轨交通工具、太空飞船或其他航天器，以及任何其他类型的交通工具，无论是当前存在还是在本公开之后出现的。换句话说，它包括用于运输人或物的设备或结构。该系统易于快速适应不同的交通工具和舱室类型以及不同的声学环境配置。

其他系统、方法、特征和优点对于本领域技术人员在检查附图和详细描述后将是或将变得显而易见。所有这样的附加系统、方法、特征和优点旨在被包括在本描述中，被包括在本公开的范围中，并且由后面的权利要求来保护。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马克·罗伯特·埃夫里
技术所有人：2236008安大略有限公司
我是此专利的发明人

上一篇：压力传感器和用于制造压力传感器的方法与流程
上一篇：微型发光二极管显示面板的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。