音频输入信号的处理的制作方法

文档序号：18270851发布日期：2019-07-27 09:39阅读：624来源：国知局

所提出的技术一般涉及音频处理，以及尤其涉及用于处理音频输入信号的方法、配置成处理音频输入信号的音频滤波器系统、对应计算机程序和计算机程序产品以及音频系统和改进的音频信号。

背景技术：

通常，要求对音频应用进行有效的信号处理。例如，配备有扬声器的设备的朝着小型化和便携性的持续趋势正在提高对信号处理算法的要求。就在回放设备在尺寸上减小（从而降低其声学性能）时，消费者也希望音频性能改善或至少不会下降。

在用于消费者音频设备的音频信号处理的领域中，非常普遍的是，采用几种动态范围处理以使音频信号适应可用硬件和预期的回放环境。通常，当回放设备是微型扬声器（诸如移动电话中使用的微型扬声器）时，期望应用动态范围压缩以便加强音频信号的低电平部分，以便加强可听度和响度。此外，期望采用用于防止音频信号超过扬声器膜偏移（loudspeakermembraneexcursion）和数字幅值的最大允许电平的限制。

用于微型扬声器的处理的最重要的类型之一是限制器。限制器防止信号超过阈值幅值-电平，它们通过应用与量（给定信号超过了阈值电平该量）相当的衰减增益来工作。限制器达到完全衰减的时间通常称为出动时间（attacktime），并且通常与相当大小的前瞻时间（look-aheadtime）结合使用。抑制时刻后限制器增益恢复到中性增益的时间通常称为释放时间。

常规的限制器受到几种类型的伪像（artifact）的影响，所述伪像可能以不同的方式使音频声音变坏。

设置限制器时间常数通常涉及以下两方面之间的折衷：一方面大声但失真的输出，与另一方面较少失真但较弱的输出。通常，较长的时间常数会产生更自然的声音结果，但是这是以响度为代价，这是因为在较长时间内增益保持低。在一种极端下，将出动和释放时间设置为零导致将信号削波到阈值电平。由于增益信号中的强高频内容（当增益信号被应用时增益信号调制输入），导致声音将非常大声但也非常失真。在另一种极端下，非常长的释放时间降低了增益信号中的高频内容的量，然而同时对于许多应用来说降低了太多响度。关于长释放时间的另一个问题是在抑制音频信号的瞬态部分之后的一段时间期间它可能引起不必要的过度抑制。这个伪像有时称为“冲孔”。适度的释放时间设置也具有其问题；即，以所谓的“泵作用（pumping）”形式的听得见的调制，在抑制之后在增益快速恢复时整个信号的电平的听得见的改变。对于具有嵌入宽带背景声音中的瞬态高电平声音的信号，泵作用是尤其听得见的。对于超出阈值电平的低频周期信号，具有短释放时间的限制器可以在波形的每个周期上触发并且在它们调制周期信号时引起失真的声音。常规时域限制器的一般伪像是它们抑制信号的整个频率范围，这可能导致沉闷的或压抑的声音。

因此，一般需要可消除或至少降低所述处理伪像中的一些或所有的解决方案。

技术实现要素：

发明的目的是提供一种用于处理音频输入信号的方法。

另一个目的是提供一种配置成处理音频输入信号的音频滤波器系统。

提供一种用于在由处理器执行时处理音频输入信号的计算机程序也是目的。

另一个目的是提供对应计算机程序产品。

仍有的另一个目的是提供一种包括音频滤波器系统的音频系统。

还有的另一个目的是提供一种改进的音频信号。

由所提出的技术的实施例满足这些和其它目的。

根据第一方面，提供了一种用于处理音频输入信号的方法。该方法包括：

-对输入信号应用非线性时域处理以生成输入信号的处理的副本；

-将输入信号和输入信号的处理的副本变换到频域；

-基于变换的输入信号和输入信号的变换的处理的副本在频域中执行比较；

-基于比较确定至少一个控制参数；

-基于（一个或多个）控制参数执行变换的输入信号的频域处理；以及

-通过将频域处理的信号变换到时域来生成输出信号。

根据第二方面，提供了一种音频滤波器系统，其配置成处理音频输入信号。滤波器系统配置成对输入信号应用非线性时域处理以生成输入信号的处理的副本。滤波器系统还配置成将输入信号和输入信号的处理的副本变换到频域。滤波器系统配置成基于变换的输入信号和输入信号的变换的处理的副本在频域中执行比较。此外，滤波器系统配置成基于所述比较确定至少一个控制参数。滤波器系统还配置成基于（一个或多个）控制参数执行变换的输入信号的频域处理。滤波器系统配置成通过将频域处理的信号变换到时域来生成输出信号。

根据第三方面，提供了一种计算机程序，其用于在由处理器执行时处理音频输入信号，其中所述计算机程序包括指令，其在由处理器执行时促使处理器进行以下操作：

-对输入信号应用非线性时域处理以生成输入信号的处理的副本；

-将输入信号和输入信号的处理的副本变换到频域；

-基于变换的输入信号和输入信号的变换的处理的副本在频域中执行比较；

-基于比较确定至少一个控制参数；

-基于（一个或多个）控制参数执行变换的输入信号的频域处理；以及

-通过将频域处理的信号变换到时域来生成输出信号。

根据第四方面，提供了一种计算机程序产品，其包括有这样的计算机程序存储在其上的计算机可读介质。

根据第五方面，提供了一种音频系统，其包括根据第二方面的滤波器系统。

根据第六方面，提供了一种由根据第一方面的方法生成的音频信号。

以这种方式，所提出的技术提供了用于音频信号处理的有效方法，其中借助于频域处理可将非线性地处理的信号的期望方面施加在原始信号上。

当阅读发明的非限制性实施例的以下详细描述时，将理解其它优势。

附图说明

通过参考与附图一起取得的以下描述，可最好地理解实施例以及其进一步的目的和优势，附图中：

图1是图示用于处理音频输入信号的方法的示例的示意流程图。

图2是图示音频系统的示例的示意框图。

图3是图示根据实施例的音频滤波器系统的示例的示意框图。

图4a-b是分别图示作为幅度对频率和幅度比对频率的频谱的示例的示意图。

图5是图示根据实施例的音频滤波器系统的处理器-存储器实现的示例的示意框图。

图6是图示根据实施例的计算机实现的示例的示意框图。

具体实施方式

在整个附图中，相同的参考标记用于类似或对应元件。

图1是图示用于处理音频输入信号的方法的示例的示意流程图。

基本上，该方法包括以下步骤：

s1：对输入信号应用非线性时域处理以生成输入信号的处理的副本；

s2：将输入信号和输入信号的处理的副本变换到频域；

s3：基于变换的输入信号和输入信号的变换的处理的副本在频域中执行比较；

s4：基于所述比较确定至少一个控制参数；

s5：基于（一个或多个）所述控制参数执行变换的输入信号的频域处理；以及

s6：通过将频域处理的信号变换到时域来生成输出信号。

以这种方式，所提出的技术提供了用于音频信号处理的有效方法，其中借助于频域处理可将非线性地处理的信号的期望方面施加在原始信号上。

作为示例，上述处理增强或抑制输入信号的处理的副本中存在的特性。

例如，该处理可适应于抑制频率分量，使得它们的电平不超过输入信号的处理的副本中的对应频率分量的电平。

在特定示例中，（一个或多个）控制参数包括频率相关增益，并且频域处理包括将输入的频域表示与增益相乘。

可选地，增益的最大衰减可被限制于频率相关阈值，并且频率相关频谱平滑可被应用于增益。

作为示例，比较可包括选择以下项中的最小值：诸如单位的预定值，和未处理的输入的幅度与处理的输入的幅度之间的比。

在特定示例中，输入信号的非线性时域处理包括将输入信号削波到预定电平。

例如，输入信号的非线性时域处理可包括对应于将电动扬声器的膜偏移削波到预定电平的处理。

可被应用于限制器应用的所提出的发明的特定实施例通过分析信号并抑制输入信号的频率分量（根据量，它们促使幅值超出了阈值该量）使得能够降低现有技术的伪像中的至少一些或所有。

将理解，可以以各种方式实现、组合和重新布置本文中描述的方法和布置。

例如，实施例可以在硬件中，或者在用于由合适的处理电路执行的软件中，或其组合中实现。

本文中描述的步骤、功能、过程、模块和/或块可以在使用任何常规技术（诸如分立电路或集成电路技术）的硬件（包括通用电子电路和专用电路两者）中实现。

备选地或作为补充，本文中描述的步骤、功能、过程、模块和/或块中的至少一些可以在诸如计算机程序的软件中实现，以用于由诸如一个或多个处理器或处理单元的合适的处理电路执行。

处理电路的示例包括但不限于一个或多个微处理器、一个或多个数字信号处理器（dsp）、一个或多个中央处理单元（cpu）、视频加速硬件和/或任何合适的可编程逻辑电路，诸如一个或多个现场可编程门阵列（fpga）或一个或多个可编程逻辑控制器（plc）。

还应该理解，可能能够再用（re-use）在其中实现所提出的技术的任何常规设备或单元的一般处理能力。也可能能够再用现有的软件，例如通过对现有软件重新编程或通过添加新的软件部件。

图2是图示音频系统的示例的示意框图。音频系统10基本上包括音频源50、音频滤波器系统100和声音生成系统150。

通常，音频滤波器系统100配置成处理音频输入信号。滤波器系统配置成对输入信号应用非线性时域处理以生成输入信号的处理的副本。滤波器系统配置成将输入信号和输入信号的处理的副本变换到频域。滤波器系统还配置成基于变换的输入信号和输入信号的变换的处理的副本在频域中执行比较。滤波器系统配置成基于所述比较确定至少一个控制参数。滤波器系统配置成基于（一个或多个）所述控制参数执行变换的输入信号的频域处理。滤波器系统还配置成通过将频域处理的信号变换到时域来生成输出信号。

作为示例，滤波器系统可配置成增强或抑制输入信号的处理的副本中存在的特性。

例如，滤波器系统可配置成抑制频率分量，使得它们的电平不超过输入信号的处理的副本中的对应频率分量的电平。

在特定示例中，（一个或多个）控制参数包括频率相关增益，并且频域处理包括将输入的频域表示与增益相乘。

可选地，滤波器系统配置成将增益的最大衰减限制于频率相关阈值，并且将频率相关频谱平滑应用于增益。

作为示例，比较包括选择以下项中的最小值：诸如单位的预定值，和未处理的输入的幅度与处理的输入的幅度之间的比。

在特定示例中，输入信号的非线性时域处理包括将输入信号削波到预定电平。

例如，输入信号的非线性时域处理可包括对应于将电动扬声器的膜偏移削波到预定电平的处理。

可选地，滤波器系统包括用于执行附加信号处理的至少一个后处理阶段。

图3是图示根据实施例的音频滤波器系统的示例的示意框图。

在该特定示例实施例中，对输入信号的副本执行非线性操作。这种非线性操作的第一示例是将信号削波到预定电平。第二示例是使用扬声器偏移和饱和的非线性模型处理输入信号的副本。另外的示例是使用扬声器偏移和饱和的修改的非线性模型处理输入信号的副本，在其中相较于在模型所基于的扬声器中，饱和发生在更低的电平。处理的其它示例也是可能的。

在示例实施例中，时间-到-频率（t2f）变换被应用于来自非线性时域处理块的输入信号和输出信号两者。

这种时间-到-频率（t2f）变换的示例是短时傅里叶变换（stft），在其中借助于快速傅里叶变换（fft）将输入信号的连续重叠帧变换到频域。这种变换的特定示例使用50％的重叠和1024个样本的帧大小。

在示例实施例中，在变换的输入信号和输入信号的变换的处理的副本之间进行比较。这种比较的示例是基于确定两个频谱之间的幅度比：

幅度比（k）=绝对值（x2（k））/绝对值（x1（k））

其中x1（k）对应于在离散频率索引k处的输入信号的频谱，并且x2（k）对应于在离散频率索引k处的输入信号的处理的副本的频谱。

作为示例，比较块的输出可以是频谱幅度比，其是每个离散频率索引的控制参数。

作为示例，可以可选地进一步处理控制参数以便形成频率相关增益。例如，该处理包括：

•通过取单位和频谱幅度比中的最小值来形成中间频谱h'（k）：

对于所有离散频率索引k，h'（k）=min（1.0，幅度比（k））

•通过取频率相关阈值电平和频谱h'（k）中的最大值来形成中间频谱h''（k）：

h''（k）=max（阈值电平（k），h'（k））

•通过在中间频谱h''（k）上跨离散频率索引k应用平滑操作来形成频率相关增益g（k）。

作为示例，频域处理可包括通过乘法将频率相关的实值增益g（k）应用于复值频谱x1（k）。

在示例实施例的下一阶段中，通过将频率-到-时间（f2t）变换应用于频域处理块的输出来形成时域输出信号。这种变换的示例是短时傅里叶变换（stft）的逆或重构阶段，在其中连续输出频谱被借助于快速傅里叶逆变换（ifft）变换到时域，并且然后在通过对加窗的重叠块（windowedoverlappedblock）求和以形成输出信号之前被加窗。

可选地，可包括一个或多个预处理阶段和/或一个或多个后处理阶段，如图3中由可选虚线框所指示。作为示例，可选地可添加附加限制器阶段来作为后处理阶段。

图4a-b是分别图示作为幅度对频率和幅度比对频率的频谱的示例的示意图。

图4a图示了具有两个谐波频谱分量的示例信号输入的幅度频谱，以及所述输入信号的非线性处理的副本的幅度频谱。在处理的信号的频谱中，与输入相比，电平已经改变，并且存在附加频谱分量。

图4b图示了图4a的幅度频谱之间的比，该比在新频谱分量的频率处是无穷的，并且该比在原始频谱分量的频率处低于单位。

图5是图示了根据实施例的基于处理器-存储器实现的布置/系统100的示例的示意框图。在该特定示例中，布置/系统100包括处理器110和存储器120，存储器120包括由处理器110可执行的指令，由此处理器操作以实现本文中描述的所提出的技术的方面，包括处理音频输入信号。

可选地，布置/系统100还可包括通信电路130。通信电路130可包括用于与其它设备进行有线和/或无线通信的功能，但是可简单地是合适的输入/输出（i/o）设备、（一个或多个）输入端口和/或（一个或多个）输出端口。

还可能基于硬件和软件的组合提供解决方案。实际的硬件-软件划分可由系统设计者基于许多因素来决定，所述因素包括处理速度、实现的成本和其它要求。

图6是图示根据实施例的计算机实现200的示例的示意图。在该特定示例中，本文中描述的步骤、功能、过程、模块和/或块中的至少一些在计算机程序225；235（其被加载到存储器220中以用于由包括一个或多个处理器210的处理电路执行）中实现。（一个或多个）处理器210和存储器220彼此互连以使能正常的软件执行。可选的输入/输出设备240还可互连到（一个或多个）处理器210和/或存储器220，以使能相关数据的输入和/或输出，所述相关数据诸如（一个或多个）输入参数和/或（一个或多个）结果输出参数。

术语“处理器”应该在一般意义上被解释为能够执行程序代码或计算机程序指令以执行特定处理、确定或计算任务的任何系统或设备。

因此，包括一个或多个处理器210的处理电路配置成在执行计算机程序225时执行明确定义的处理任务，诸如本文中所述的处理任务。

处理电路不必专用于仅执行上述步骤、功能、过程和/或块，而是还可执行其它任务。

在特定实施例中，计算机程序225；235包括指令，其在由处理器210执行时，促使处理器210执行本文中描述的任务，包括与音频文件管理器系统（audiofilersystem）有关的任务。更具体地，指令在由处理器210执行时促使处理器210进行以下操作：

-对输入信号应用非线性时域处理以生成输入信号的处理的副本；

-将输入信号和输入信号的处理的副本变换到频域；

-基于变换的输入信号和输入信号的变换的处理的副本在频域中执行比较；

-基于所述比较确定至少一个控制参数；

-基于（一个或多个）所述控制参数执行变换的输入信号的频域处理；以及

-通过将频域处理的信号变换到时域来生成输出信号。

所提出的技术还提供了包括计算机程序的载体，其中载体是电子信号、光信号、电磁信号、磁信号、电信号、无线电信号、微波信号或计算机可读存储介质中的一种。

作为示例，软件或计算机程序225；235可被实现为计算机程序产品，其通常被携带或存储在计算机可读介质220；230上，特别是非易失性介质。计算机可读介质可包括一个或多个可移动或不可移动存储器设备，包括但不限于只读存储器（rom）、随机存取存储器（ram）、致密盘（cd）、数字多功能盘（dvd）、蓝光盘、通用串行总线（usb）存储器、、硬盘驱动器（hdd）存储设备、闪速存储器、磁带或任何其它常规存储器设备。因此，计算机程序可被加载到计算机或等效处理设备的操作存储器中，以用于由其处理电路执行。

在由一个或多个处理器执行时，本文中呈现的过程流程可被视为计算机流程。对应装置可被定义为一组功能模块，其中由处理器执行的每个步骤对应于功能模块。在这种情况下，功能模块被实现为在处理器上运行的计算机程序。

因此，驻留在存储器中的计算机程序可被组织为适当的功能模块，其配置成在由处理器执行时执行本文中描述的步骤和/或任务的至少部分。

上面描述的实施例仅作为示例被给出，并且应当理解，所提出的技术不限于此。由本领域技术人员将理解，在不脱离由所附权利要求定义的当前范围的情况下，可对实施例进行各种修改、组合和改变。特别地，在技术上可能的情况下，不同实施例中的不同部分解决方案可被组合在其它配置中。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：M.阿尔布兰特
技术所有人：迪拉克研究公司
我是此专利的发明人

上一篇：一种数据存储方法、装置、计算设备及存储介质与流程
上一篇：一种无铆钉铆接工具的制作方法