一种实现动态范围控制的方法、装置和计算设备与流程

文档序号:18945547发布日期:2019-10-23 01:33阅读:242来源:国知局
一种实现动态范围控制的方法、装置和计算设备与流程

本发明属于声音处理领域,尤其涉及一种实现动态范围控制的方法、装置和计算设备。



背景技术:

动态范围控制(dynamicrangecontrol,drc)是常用于声音大小音量控制的算法,在不同能量大小范围区间里进行不同的处理。噪音闸(noisegate)、扩展器(expander)、压缩器(compressor)和限制器(limiter)是系统里能量由低到高的四个节点,这四个节点将整个系统区分成五个区间。

一般地,除了扩展器闸(expanderthreshold,et)与压缩器闸(compressorthreshold,ct)中间的线性区间(linearregion)外,每个区间皆有各自的时间参数,例如,冲击时间(attacktime,at)和/或回复时间(releasetime,rt)以及增益选择等各别调整以因应不同范围区间有不同行为上的表现。目标静态曲线(staticcurve)描绘了一个系统drc的行为,一般做法都是将这几种范围依照各自需求设定好之后,输入数字数据,经过均方根(rms)和/或峰值(peak)计算,让此几个区间均在同一时间加入判别,以判别计算出来的能量值位于上述五个区间的哪个区间,就由该区分该区间的参数值进行处理。

上述方法虽然在通过均方根(rms)和/或峰值(peak)计算出能量值时有经过时间平均系数(timeaveragingcoefficient,tav)或冲击时间(at)/回复时间(rt)的平滑处理,但对于变动快速的数字数据,时常转换区间做处理是可以預期的;再者,关于尾端的冲击时间/回复时间平滑处理(at/rtsmooth),各个区间设有不同的时间参数来满足各区间所需行为,因此在时常转换区间的过程中,因为计算和/或参数变动多造成衔接不够自然,甚至产生杂音等现象。



技术实现要素:

本发明提供一种实现动态范围控制的方法、装置和计算设备,以解决drc算法中转换区间的衔接不自然,提高语音处理时声音品质和准确性。

本发明第一方面提供了一种实现动态范围控制的方法,所述方法包括:

将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,所述数字数据包括原始数字数据或经所述动态范围控制分系统处理后输出的数字数据,所述动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,所述五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;

以所述原始数字数据或阶段性输出数据作为所述若干动态范围控制分系统中另一分系统的输入,由所述若干动态范围控制系统中另一分系统处理后得到另一阶段性输出数据;

重复上述过程,直至最后一个动态范围控制分系统输出数据,所述最后一个动态范围控制分系统输出的数据作为最终的输出结果。

本发明第二方面提供了一种实现动态范围控制的装置,所述装置包括:

第一输出系统,用于将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,所述数字数据包括原始数字数据或经所述动态范围控制分系统处理后输出的数字数据,所述动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,所述五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;

第二输出系统,用于以所述原始数字数据或阶段性输出数据作为所述若干动态范围控制分系统中另一分系统的输入,由所述若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据;

重复上述过程,直至最后一个动态范围控制分系统输出数据,所述最后一个动态范围控制分系统输出的数据作为最终的输出结果。

本发明第三方面提供了一种计算设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下方法的步骤:

将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,所述数字数据包括原始数字数据或经所述动态范围控制分系统处理后输出的数字数据,所述动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,所述五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;

以所述原始数字数据或阶段性输出数据作为所述若干动态范围控制分系统中另一分系统的输入,由所述若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据;

重复上述过程,直至最后一个动态范围控制分系统输出数据,所述最后一个动态范围控制分系统输出的数据作为最终的输出结果。

本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现以下方法的步骤:

将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,所述数字数据包括原始数字数据或经所述动态范围控制分系统处理后输出的数字数据,所述动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,所述五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;

以所述原始数字数据或阶段性输出数据作为所述若干动态范围控制分系统中另一分系统的输入,由所述若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据;

重复上述过程,直至最后一个动态范围控制分系统输出数据,所述最后一个动态范围控制分系统输出的数据作为最终的输出结果。

从上述本发明提供的技术方案可知,由于是将原始数字数据或一个动态范围控制分系统处理后输出的数据作为另一个动态范围控制分系统的输入,每个动态范围控制分系统即某个区间能够独立处理数字数据,不受其他区间的影响,因此,与现有技术让几个区间均在同一时间对经过rms和/或峰值计算的数据加入判别相比,本发明提供的技术方案解决了drc算法中转换区间的衔接不自然,提高语音处理时声音品质和准确性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的实现动态范围控制的方法的实现流程示意图;

图2是现有技术提供的动态范围控制系统的结构示意图;

图3是本发明实施例提供的动态范围控制分系统的结构示意图;

图4是本发明实施例提供的实现动态范围控制的装置的结构示意图;

图5是本发明实施例提供的目标静态曲线示意图;

图6是本发明实施例提供的实现动态范围控制的装置的结构示意图;

图7是本发明实施例提供的计算设备的结构示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

为了说明本发明的技术方案,下面通过具体实施例来进行说明。

附图1是本发明实施例提供的实现动态范围控制的方法的实现流程示意图,主要包括以下步骤s101至s102,以下详细说明:

s101,将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,其中,数字数据包括原始数字数据或经动态范围控制分系统处理后输出的数字数据,动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间。

需要说明的是,本发明实施例中的“区间”与背景技术提及的区间是同一含义,即由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间。

s102,以原始数字数据或阶段性输出数据作为若干动态范围控制分系统中另一分系统的输入,由若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据。

重复步骤s101和s102的过程,即每次将一个动态范围控制分系统的输出作为另一动态范围控制分系统的输入,直至最后一个动态范围控制分系统输出数据,最后一个动态范围控制分系统输出的数据作为最终的输出结果。

需要说明的是,在本发明实施例中,每一个动态范围控制分系统的平滑处理模块的时间参数,例如,at、rt等与均方根计算模块处理后数据的增益所属区间的固定参数相适应。

作为本发明的实施例,动态范围控制分系统包括延迟模块、相乘器、均方根计算模块、区间判断模块、处理器、平滑处理模块和五个区间中一个区间对应的处理器,其中,延迟模块和均方根计算模块的输入端相连,均方根计算模块的输出端与区间判断模块的输入端相连,区间判断模块的输出端与处理器的输入端相连,处理器的输出端与平滑处理模块的输入端相连,平滑处理模块的输出端与延迟模块的输出端相连,平滑处理模块的输出端以及延迟模块的输出端均与相乘器的输入端相连,如附图3所示。步骤s102所述及的以原始数字数据或阶段性输出数据作为若干动态范围控制分系统中另一分系统的输入,由若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据,即,将一个动态范围控制分系统的输出即yn-1(k)作为另一动态范围控制分系统的输入即xn(k),本质上是如附图3所示的每一个动态范围控制分系统首尾相连成,即,处理器(n-1)所在的动态范围控制分系统的输出端与处理器(n)所在的动态范围控制分系统的输入端相连,从而构成一个新的动态范围控制系统,如附图4所示。附图4所示的动态范围控制系统显然与现有技术即附图2所示的动态范围控制系统不同,两者的处理机制也不同。

作为本发明一个实施例,以原始数字数据或阶段性输出数据作为若干动态范围控制分系统中另一分系统的输入,由所述若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据可以是:将原始数字数据或阶段性输出数据输入均方根计算模块处理;判断均方根计算模块处理后数据的增益所属五个区间中的区间;由均方根计算模块处理后数据的增益所属区间对应的处理器处理后输入至若干动态范围控制分系统中另一分系统的平滑处理模块处理;将另一分系统的平滑处理模块处理后的数据与延迟模块处理后的数据相乘,相乘的结果作为另一阶段性输出数据输出,此处的相乘,可以由附图3或附图4的相乘器实现。

需要说明的是,附图4或步骤s102的实现,着重在先后次序处理时,每个处理器上能得到独立且参数统一上的优点,然而,先后顺序并不是一成不变的架构,而是用户依照不同目标静态曲线(staticcurve)的图型找出最适合的先后顺序。例如,如附图5示例的目标静态曲线(staticcurve)包含的扩展器(expander)、压缩器(compressor),理想曲线要如灰色实线(图中的线性虚线y=x是一条参考曲线,用来和静态曲线做对比,可以快速评估出静态曲线的性能),扩展器闸(et)=-42db、压缩器闸(ct)=-24db,输入为0db时输出为0db、输入为-24db时输出为-12db。此种状况若是由扩展器(expander)先做处理,则在当输入x为-12db时输出y已经达0db,输入x大于-12db,输出y大于0db,在某些数字数据里开始失真,如点虚线所示。因此,在不添加其他处理器的情况下,此种架构应当由压缩器优先于扩展器做处理。

从上述附图1示例的实现动态范围控制的方法可知,由于是将原始数字数据或一个动态范围控制分系统处理后输出的数据作为另一个动态范围控制分系统的输入,每个动态范围控制分系统即某个区间能够独立处理数字数据,不受其他区间的影响,因此,与现有技术让几个区间均在同一时间对经过rms和/或峰值计算的数据加入判别相比,本发明提供的技术方案解决了drc算法中转换区间的衔接不自然,提高语音处理时声音品质和准确性。

请参阅附图6,是本发明实施例提供的实现动态范围控制的装置的示意图。为了便于说明书,仅示出了与本发明有关的部分。图6示例的实现动态范围控制的装置主要包括第一输出系统601和第二输出系统602,详细说明如下:

第一输出系统601,用于将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,其中,数字数据包括原始数字数据或经动态范围控制分系统处理后输出的数字数据,动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;

第二输出系统602,用于以原始数字数据或若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据作为若干动态范围控制分系统中另一分系统的输入,由若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据;

第一输出系统601和第二输出系统602重复上述过程,直至最后一个动态范围控制分系统输出数据,最后一个动态范围控制分系统输出的数据作为最终的输出结果。

需要说明的是,本发明实施例提供的实现动态范围控制的装置,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

可选地,附图6示例的第二输出系统602可以包括第一输入模块、区间判断模块、第二输入模块和相乘器,其中:

第一输入模块,用于将原始数字数据或阶段性输出数据输入均方根计算模块处理;

区间判断模块,用于判断均方根计算模块处理后数据的增益所属五个区间中的区间;

第二输入模块,用于由均方根计算模块处理后数据的增益所属区间对应的处理器处理后输入至若干动态范围控制分系统中另一分系统的平滑处理模块处理;

相乘器,用于将平滑处理模块处理后的数据与延迟模块处理后的数据相乘,相乘的结果作为另一阶段性输出数据输出。

可选地,上述若干动态范围控制分系统中另一分系统的平滑处理模块的时间参数适应于均方根计算模块处理后数据的增益所属区间的固定参数。

可选地,上述动态范围控制分系统包括延迟模块、相乘器、均方根计算模块、区间判断模块、处理器、平滑处理模块和五个区间中一个区间对应的处理器,其中,延迟模块和均方根计算模块的输入端相连,均方根计算模块的输出端与区间判断模块的输入端相连,区间判断模块的输出端与处理器的输入端相连,处理器的输出端与平滑处理模块的输入端相连,平滑处理模块的输出端与延迟模块的输出端相连,平滑处理模块的输出端以及延迟模块的输出端均与相乘器的输入端相连。

图7是本发明一实施例提供的计算设备的结构示意图。如图7所示,该实施例的计算设备7主要包括:处理器70、存储器71以及存储在存储器71中并可在处理器70上运行的计算机程序72,例如实现动态范围控制的方法的程序。处理器70执行计算机程序72时实现上述实现动态范围控制的方法实施例中的步骤,例如图1所示的步骤s101至s102。或者,处理器70执行计算机程序72时实现上述各装置实施例中各模块/单元的功能,例如图6所示第一输出系统601和第二输出系统602的功能。

示例性地,实现动态范围控制的方法的计算机程序72主要包括:将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,其中,数字数据包括原始数字数据或经动态范围控制分系统处理后输出的数字数据,动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;以原始数字数据或阶段性输出数据作为若干动态范围控制分系统中另一分系统的输入,由若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据,重复上述过程,即每次将一个动态范围控制分系统的输出作为另一动态范围控制分系统的输入,直至最后一个动态范围控制分系统输出数据,最后一个动态范围控制分系统输出的数据作为最终的输出结果。计算机程序72可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器71中,并由处理器70执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序72在计算设备7中的执行过程。例如,计算机程序72可以被分割成第一输出系统601和第二输出系统602(虚拟装置中的模块)的功能,各模块具体功能如下:第一输出系统601,用于将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,其中,数字数据包括原始数字数据或经动态范围控制分系统处理后输出的数字数据,动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;第二输出系统602,用于以原始数字数据或若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据作为若干动态范围控制分系统中另一分系统的输入,由若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据;第一输出系统601和第二输出系统602重复上述过程,直至最后一个动态范围控制分系统输出数据,最后一个动态范围控制分系统输出的数据作为最终的输出结果。

计算设备7可包括但不仅限于处理器70、存储器71。本领域技术人员可以理解,图7仅仅是计算设备7的示例,并不构成对计算设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器70可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器71可以是计算设备7的内部存储单元,例如计算设备7的硬盘或内存。存储器71也可以是计算设备7的外部存储设备,例如计算设备7上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器71还可以既包括计算设备7的内部存储单元也包括外部存储设备。存储器71用于存储计算机程序以及计算设备所需的其他程序和数据。存储器71还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置/计算设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,实现动态范围控制的方法的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤,即,将数字数据输入若干动态范围控制分系统中的一个分系统处理后得到阶段性输出数据,其中,数字数据包括原始数字数据或经动态范围控制分系统处理后输出的数字数据,动态范围控制分系统包括均方根计算模块和五个区间中一个区间对应的处理器,五个区间包括由噪音闸、扩展器、压缩器和限制器对待处理语音能量按照大小分成的区间;以原始数字数据或阶段性输出数据作为若干动态范围控制分系统中另一分系统的输入,由若干动态范围控制分系统中另一分系统处理后得到另一阶段性输出数据,重复上述过程,即每次将一个动态范围控制分系统的输出作为另一动态范围控制分系统的输入,直至最后一个动态范围控制分系统输出数据,最后一个动态范围控制分系统输出的数据作为最终的输出结果。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读内存(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1