一种音频信号的自动增益控制方法和装置与流程

文档序号：11154273阅读：504来源：国知局

本发明实施例涉及音频数据处理技术，尤其涉及一种音频信号的自动增益控制方法和装置。

背景技术：

音频信号的处理和播放目前已经广泛应用在各种情景下，例如，实时语音通话过程中，需要在通话终端中将对方的语音信号进行处理而后播放；在歌曲等多媒体音频文件的播放过程中，需要由播放设备将音频信号进行处理而后播放。在音频信号的处理过程中，由于音频源的不同，所以导致存在不同音频信号的音量强度不一样的现象，且伴随有噪声。对于用户而言，希望接听不同人电话时音量能趋于一致，听不同歌曲时，音量能趋于一致。

现有技术为解决音频信号播放音量趋于一致的问题，以往采用用户手动按键来调整的方式，此后又出现了自动增益控制的技术方案。图1为现有技术方案中的自动增益控制方法的输入数据与输出数据的关系示意图，参考图1，X轴表示输入音频信号的音量，Y轴表示输出的音频信号的音量，坐标原点表示音量为无限小，X轴和Y轴的0dB分别表示输入的音频信号的最大音量和可以输出的音频信号的最大音量，X_T为设定的门限值。通过实时检测音频信号各采样点的音量，与设定门限值进行比对，并根据与门限值之间的关系，确定放大或缩小的调整增益，将音量进行增益调整后再播放音频信号。图1中虚线表示未采用现有自动增益控制技术方案处理时，输入音频信号的音量与输出音频信号的音量之间的关系，图1中实线表示采用现有自动增益控制技术方案处理后，输入音频信号的音量与输出音频信号的音量之间的关系。

但是，发明人在进行本发明的研究过程中，发现现有技术存在如下缺陷：当与设定门限值进行比对而调整增益时，会出现音量突变的情况，使得用户收听到的音频信号音量幅度不连续，效果不佳。

技术实现要素：

本发明实施例提供一种音频信号的自动增益控制方法和装置，以实现对音频信号音量的自动增益控制，并改善音量幅度调整的连续性。

第一方面，本发明实施例提供了一种音频信号的自动增益控制方法，包括：

确定音频信号的实际音量与设定音量门限值之间的音量差值；

如果根据所述音量差值确定所述实际音量位于平滑处理区间的范围值内，则根据所述音量差值计算目标音量；

根据所述目标音量对所述音频信号进行调整并输出。

第二方面，本发明实施例提供了一种音频信号的自动增益控制装置，包括：

差值确定模块，用于确定音频信号的实际音量与设定音量门限值之间的音量差值；

计算模块，用于如果根据所述音量差值确定所述实际音量位于平滑处理区间的范围值内，则根据所述音量差值计算目标音量；

调整模块，用于根据所述目标音量对所述音频信号进行调整并输出。

本发明实施例提供的技术方案，通过确定音频信号的实际音量与设定音量门限值之间的音量差值，根据该音量差值确定实际音量位于平滑处理区间的范围值内，则根据该音量差值计算目标音量，根据计算所得的目标音量对上述音频信号进行调整并输出。本发明实施例通过采用上述技术方案，实现了对音频信号音量的自动增益控制，有效改善音频信号音量幅度调整的连续性，使得输出的音频信号更加平滑，提高用户的使用体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据本发明实施例的内容和这些附图获得其他的附图。

图1为现有技术方案中的自动增益控制方法的输入数据与输出数据的关系示意图；

图2是本发明实施例一中的一种音频信号的自动增益控制方法的流程示意图；

图3是本发明实施例二中的一种音频信号的自动增益控制方法的输入数据与输出数据的关系示意图；

图4是本发明实施例二中的另一种音频信号的自动增益控制方法的输入数据与输出数据的关系示意图；

图5是本发明实施例三中的一种音频信号的自动增益控制装置的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图2是本发明实施例一中的一种音频信号的自动增益控制方法的流程示意图，本实施例可适用于对音频信号进行自动增益的情景中，该方法可以由音频信号的自动增益控制装置来执行，如图2所示，该方法具体包括如下步骤：

步骤101、确定音频信号的实际音量与设定音量门限值之间的音量差值。

示例性的，音频信号的实际音量是指输入的音频信号的实际音量，例如，在播放多媒体时，输入的音频信号的音量为多媒体文件的音量，可能出现由于多媒体文件录制环境的不同，使得多媒体文件的声音音量不一致。音量门限值是指输入的音频信号需要进行调整而预设的音量门限值，通常根据经验设定，具体的，可以将图1中的X_T设置为输入的音频信号的音量门限值，一般认为，当输入的音频信号的实际音量小于设定的门限值时，用户听到的声音较小，需要放大音量，当音频信号的实际音量大于设定的门限值时，用户听到的声音较大，需要适当缩小音量。

步骤102、如果根据音量差值确定实际音量位于平滑处理区间的范围值内，则根据该音量差值计算目标音量。

示例性的，平滑处理区间是指需要对输入的音频信号的音量进行平滑处理的区间范围，目标音量是指期望输出的音频信号的音量。当在步骤101中所确定的音量的差值处于平滑处理区间的范围内时，则根据所确定的音量差值计算期望输出的音频信号的音量。通常，为了使得音量调整连续性强，不发生突变，则会根据音量差值来确定渐变的调整增益，使得调整输出的音量变化平滑化。

步骤103、根据目标音量对音频信号进行调整并输出。

示例性的，根据目标音量调整输入的音频信号的实际音量，是输入的音频信号的音量转换为相应的目标音量，并由相关部件输出。

本发明实施例提供的技术方案，通过确定音频信号的实际音量与设定音量门限值之间的音量差值，根据该音量差值确定实际音量位于平滑处理区间的范围值内，则根据该音量差值计算目标音量，根据计算所得的目标音量对上述音频信号进行调整并输出。从而实现了对音频信号音量的自动增益控制，有效改善音频信号音量幅度调整的连续性，使得输出的音频信号更加平滑，提高用户的使用体验。

可选的，根据上述音量差值计算实际音量的调整增益，并且计算所确定的调整增益与音量差值呈目标趋势变化；根据上述音量差值和调整增益计算目标音量。

示例性的，可以根据目标音量与输入的音频信号的实际音量的差值的绝对值来计算相应的调整增益，调整增益具体可以为音频信号音量的相关变化量，增益大于1时，表示增大输入的音频信号的音量，增益小于1时，表示减小输入的音频信号的音量。

示例性的，随着上述音量差值的增大，调整增益可以呈减小的趋势，以使输出的音频信号呈平滑变化趋势，本领域技术人员能够利用已有公式，通过有限次的计算推导，使得输出的音频信号达到平滑变化的效果。可以理解的是，为使输出数据满足不同效果需求，调整增益与音量差值之间的变化趋势也会发生相应的改变。

可选的，确定音频信号的实际音量与设定音量门限值之间的音量差值可以包括：计算音频信号的实际音量与设定音量门限值之间的差值，并求取绝对值，作为音量差值。

示例性的，将输入的音频信号的实时的音量值与设定的音量门限值做减法运算，并求取差值的绝对值，将所得的上述绝对值作为音量差值。通过将音频信号的实际音量与设定音量门限值之间的差值进行取绝对值运算，便于根据上述音量差值快速判断音频信号的实际音量是否处于上述平滑处理区间。

可选的，上述平滑处理区间可以以上述设定音量门限值为中心点，按照设定半径值确定范围值。

示例性的，若在数轴上对输入的音频信号的音量值进行表示，可以以设定的音量门限值为中心，按照设定半径，选取设定的音量门限值的左右两侧的数值区间作为上述平滑处理区间。可以理解的是，在该平滑处理区间内，输出的音频信号存在不平滑的情况，可以根据实际使用需求，选取合适的平滑处理区间范围。通过确定平滑处理区间，便于对输入的音频信号的音量进行精确的平滑处理。

实施例二

本发明实施例以上述实施例为基础，对目标音量的计算进行细化，可适用于对音频信号进行自动增益的情景。图3是本发明实施例二中的一种音频信号的自动增益控制方法的输入数据与输出数据的关系示意图，结合图3，对本发明实施例提供的音频信号的自动增益控制方法进行示例性说明。

如图3所示，其中，X轴表示输入数据，具体为输入的音频信号的音量值；Y轴表示输出数据，具体为输出的音频信号的音量值；坐标原点表示音量趋近于负无穷；X轴和Y轴的0dB分别表示输入的音频信号的音量最大值和输出的音频信号的音量最大值；X_T表示设定音量门限值；W表示平滑处理区间的区间长度；R表示第一压缩率，其中，压缩率是指对输入的音频信号进行压缩的比例，R具体为图3中从X轴的X_T至0dB对应的输入音频信号的音量区间的压缩率；M为线性最大调整量，可以根据输入的音频信号的音量和目标音量来确定。

本发明实施例提供的音频信号的自动增益控制方法具体可以用于播放多媒体文件的情景中，例如播放音乐文件或视频文件等，由于多媒体文件中的音频信号(比如音乐)通常是在录音棚录制的，并且已经由相关工作人员进行了专业处理，因此多媒体文件中的声音基本没有噪声干扰，因而可以不考虑多媒体文件中的噪声。

该方法具体包括如下步骤：

步骤A、确定音频信号的实际音量与设定音量门限值之间的音量差值。

具体的，在图3所示X轴上取任意的x作为音频信号的实际音量，x-X_T即表示上述音量差值。

进一步的，也可以将x-X_T的绝对值，即|x-X_T|作为上述音量差值。

步骤B、如果音量差值位于平滑处理区间内，则按照如下公式(1)，计算目标音量：

y＝M+X_T+W/2R-[x-(X_T+W/2)]²/2R (1)

其中，y为输出数据，具体可以为期望输出的音频信号的音量值，x为输入数据，具体可以为输入的音频信号的实际音量值，X_T、M、W和R参数的意义与图3中相应参数的意义相同。

具体的，可以以X_T表为中心，以W/2为半径，得到平滑处理区间W，当时，表示输入的音频信号的实时音量值x位于W的区间范围值内，此时，按照上述公式(1)计算期望输出的音频信号的音量。

步骤C、如果实际音量位于平滑处理区间的范围值外且小于设定音量门限值，则按照如下公式(2)，计算目标音量：

y＝M+x (2)

其中，公式(2)中各参数的意义与公式(1)中对应的各参数的意义相同。

具体的，当时，则依据上述公式(2)计算期望输出的音频信号的音量。

步骤D、如果实际音量位于平滑处理区间的范围值外且大于设定音量门限值，则按照如下公式(3)，计算目标音量：

其中，公式(3)中各参数的意义与公式(1)中对应的各参数的意义相同。

具体的，当时，则依据上述公式(3)计算期望输出的音频信号的音量。

步骤F、根据目标音量对音频信号进行调整并输出。

示例性的，在实际计算上述目标音量的过程中，根据步骤A中计算所得的音量差值所满足的条件，确定相应的目标音量的计算公式，并计算出输入的音频信号的当前音量值所对应的目标音量值，根据计算所得的目标音量值对输入的音频信号的当前音量值进行调整，并通过相关部件输出。

另外的，图3中的实线为采用本发明实施例提供的技术方案得到的输入的音频信号的音量与输出的音频信号的音量的关系，图3中的虚线为采用现有的自动增益控制的技术方案得到的输入的音频信号的音量与输出的音频信号的音量的关系，可见，采用现有技术与设定门限值进行比对而调整增益时，会出现音量突变的情况，即图3中X_T对应的虚线出现拐点的位置，使得用户收听到的音频信号音量幅度不连续，用户接收到的音频信号的音量不平滑，影响用户的使用体验。

本发明实施例提供的技术方案，通过确定音频信号的实际音量与设定音量门限值之间的音量差值，根据该音量差值确定相应的目标音量计算公式，计算目标音量，并根据计算所得的目标音量对上述音频信号进行调整并输出。通过确定平滑处理区间，对输入的音频信号的音量进行精确的平滑处理，实现了对音频信号音量的自动增益控制，有效改善音频信号音量幅度调整的连续性。通过图3中实线与虚线的对比可见，采用本发明实施例提供的技术方案，能够使得输出的音频信号更加平滑，对输入的音频信号的平滑处理效果显著，大大提高用户的使用体验。

本发明实施例还考虑到实时语音通信的应用情景，由于在实时语音通话过程中用户处于实际环境中，受实时语音通信环境的影响，该情景中输入的音频信号中一般含有一定的噪声干扰，当对输入的音频信号的音量进行放大时，噪声信号也会被放大，因而需要对噪声进行处理，在步骤A之后，步骤F之前，还包括步骤E，具体如下：

步骤E、如果实际音量小于设定噪音门限值，则按照如下公式(4)，计算目标音量：

其中，R₁为第二压缩率，公式(4)中其余各参数与公式(1)中对应的各参数意义相同。

图4是本发明实施例二中的另一种音频信号的自动增益控制方法的输入数据与输出数据的关系示意图，即包含步骤E中对噪声进行处理的情况。如图4所示，R₁为第二压缩率，具体为图4中从X轴的坐标原点至X_N所对应的输入音频信号的音量区间的压缩率，也即图中L所示直线对应的输入音频信号的音量区间的压缩率，X_N表示设定噪音门限值，图4中的其他参数与图3中对应的各参数的意义相同，在此不再赘述。

具体的，当x<X_N时，则依据上述公式(4)计算期望输出的音频信号的音量，从而对噪声进行抑制，降低噪声对实时通话的影响，提高用户的使用体验。

类似的，图4中，当x>X_N时计算x对应的目标音量的过程与图3中相应的过程相同，在此不再赘述。

需要说明的是，本发明实施例提供的技术方案可以适用于各种对音频信号进行自动增益的情景中，并不限于播放多媒体和实时语音通信的使用情景。

实施例三

图5是本发明实施例三中的一种音频信号的自动增益控制装置结构示意图，该装置可由软件和/或硬件实现，可通过执行自动增益控制方法来对音频信号进行增益。如图5所示，该装置包括差值确定模块301、计算模块302和调整模块303。

其中，差值确定模块301，用于确定音频信号的实际音量与设定音量门限值之间的音量差值；

计算模块302，用于如果根据音量差值确定实际音量位于平滑处理区间的范围值内，则根据音量差值计算目标音量；

调整模块303，用于根据目标音量对音频信号进行调整并输出。

本发明实施例提供的音频信号的自动增益控制装置，通过确定音频信号的实际音量与设定音量门限值之间的音量差值，如果根据该音量差值确定实际音量位于平滑处理区间的范围值内，则根据该音量差值计算目标音量，根据计算所得的目标音量对上述音频信号进行调整并输出。从而实现了对音频信号音量的自动增益控制，有效改善音频信号音量幅度调整的连续性，使得输出的音频信号更加平滑，提高用户的使用体验。

在上述实施例的基础上，差值确定模块301具体用于：

计算音频信号的实际音量与设定音量门限值之间的差值，并求取绝对值，作为音量差值。

在上述实施例的基础上，平滑处理区间以设定音量门限值为中心点，按照设定半径值确定范围值。

在上述实施例的基础上，计算模块302具体用于：

如果音量差值位于平滑处理区间内，则按照如下公式，计算目标音量：

y＝M+X_T+W/2R-[x-(X_T+W/2)]²/2R

其中，y为输出数据，x为输入数据，X_T为设定音量门限值，M为线性最大调整量，W为平滑处理区间的区间长度，R为第一压缩率。

在上述实施例的基础上，计算模块302还用于：

如果实际音量位于平滑处理区间的范围值外且小于设定音量门限值，则按照如下公式，计算目标音量：

y＝M+x

在上述实施例的基础上，计算模块302还用于：

如果实际音量位于平滑处理区间的范围值外且大于设定音量门限值，则按照如下公式，计算目标音量：

在上述实施例的基础上，上述计算模块302还用于：

如果实际音量小于设定噪音门限值，则按照如下公式，计算目标音量：

其中，R₁为第二压缩率。

本发明实施例提供的音频信号的自动增益控制装置，与本发明任意实施例所提供的音频信号的自动增益控制方法属于同一发明构思，可执行本发明任意实施例所提供的音频信号的自动增益控制方法，具备执行音频信号的自动增益控制方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明任意实施例提供的音频信号的自动增益控制方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程雪峰;
技术所有人：广州视源电子科技股份有限公司;
我是此专利的发明人

上一篇：声波传输方法及装置与制造工艺
上一篇：一种音频播放方法及音频播放设备与制造工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。