一种音频信号处理方法及装置与流程

文档序号：12476008阅读：338来源：国知局

本发明属于计算机技术领域，尤其涉及一种音频信号处理方法及装置。

背景技术：

音源与拾音器的距离决定了声音的强弱程度，当音源距离拾音器较近时采集到的声音就较强；当音源距离拾音器较远时采集到的声音就较弱。在直录播互动系统中由于不可避免的主观因素，老师和麦克风之间的距离不可能是恒定不变的，导致采集到的声音忽大忽小，严重影响接收方收听的效果。自动增益控制模块(Automatic gain control)则可以通过改变音频信号输入输出压缩比来实现控制声音大小的功能，使得最终输出的声音幅度始终保持在一个恒定的范围内。然而直录播互动系统中由于存在互动的功能，麦克风必然会采集到远端的声音(也就是回声)，经过回音消除模块处理后还是会有一定程度的回声残余，所以单纯使用自动增益控制模块会容易将原本已经减弱的回声再次放大。

技术实现要素：

本发明提供一种音频信号处理方法及装置，以解决上述问题。

本发明公开了一种音频信号处理方法，包括：判断输入的且经过回声消除的当前帧音频信号是否有回声残余；若有回声残余，则根据回声残余数据得到回音残余因子；根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值；根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

本发明还公开了一种音频信号处理装置，包括：回声残余判断单元，用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余；回音残余因子计算单元，用于在有回声残余时，根据回声残余数据得到回音残余因子；增益值计算单元，用于根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值；增益控制单元，用于根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

相较于先前技术，根据本发明提供的技术方案，能够解决经过回声消除之后仍有回声残余影响音频效果的问题，进一步消除回声残余，提高音频质量，此外，还可以通过音频信的自动增益控制，使得最终输出的声音幅度始终保持在一个恒定的范围内，解决采集到的声音忽大忽小、严重影响接收方收听效果的问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1所示为根据本发明的一较佳实施例提供的音频信号处理方法的流程图；

图2所示为根据本发明的另一较佳实施例提供的音频信号处理方法的流程图；

图3所示为根据本发明的又一较佳实施例提供的音频信号处理装置的框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

图1所示为根据本发明的一较佳实施例提供的音频信号处理方法的流程图。如图1所示，本发明的较佳实施例提供的音频信号处理方法包括以下步骤：

步骤102，判断输入的且经过回声消除的当前帧音频信号是否有回声残余。

步骤104，若有回声残余，则根据回声残余数据得到回音残余因子。

步骤106，根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值。

步骤108，根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

在本实施例中，输入的当前帧音频信号是已经经过回声消除的信号，虽然经过回声消除，但仍有回声残余。因此，本发明实施例在对音频信号进行自动增益控制时，考虑到了回声残余，使得音频质量更高。

上述步骤106中，所述根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值具体包括：

根据自动增益控制策略得到所述当前帧音频信号的初始增益值；

对所述初始增益值进行平滑处理；

经过平滑处理的初始增益值除以所述回音残余因子，得到所述自动增益值。

其中，所述自动增益控制策略包括：

计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理，得到平滑幅度值；

根据所述平滑幅度值所处的不同语音值区间，对所述平滑幅度值进行不同的增益值计算，得到所述初始增益值。

其中，根据所述平滑幅度值所处的不同语音值区间，对所述平滑幅度值进行不同的增益值计算，包括：

若所述平滑幅度值大于语音上阈值，则根据第一公式计算出所述初始增益值；

若所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值，则根据第二公式计算出所述初始增益值；

若所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值，则根据第三公式计算出所述初始增益值；

若所述平滑幅度值小于等于所述噪声阈值，则根据第四公式计算出所述初始增益值；

其中，所述第一公式为T_up表示所述语音上阈值，A_smooth是所述平滑幅度值，R_up表示当A_smooth＞T_up时增益值在对数域的斜率，g_moderate表示增益抬升量，

所述第二公式为g＝g_moderate，

所述第三公式为T_down表示语音下阈值，T_noise表示噪声阈值，R_down表示当T_down≥A_smooth＞T_noise时增益值在对数域的斜率，

所述第四公式为g＝g_conceal，g_conceal表示增益压制量。

在本实施例中，通过回声残余数据可以计算出回声残余因子，而回声残余数据是根据当前帧音频信号与参考信号之间的相关性数据而求得，因此将计算出的初始增益值除以所述回音残余因子，考虑到了回声残余的情况，削弱回声残余，然后按照最终得到的增益值对音频信号进行自动增益控制，最大化地避免对残余回声的放大，更符合真实的音频信号。

其中，根据以下公式对所述初始增益值进行平滑处理：

G＝(1-β)×G'+β×g

其中G表示当前帧音频信号的经过平滑处理后的初始增益值，G'表示前一帧音频信号的经过平滑处理后的初始增益值，g是当前帧音频信号的初始增益值，β是平滑因子。

音频信号处理方法还可以包括以下步骤：

若未有回声残余，则根据自动增益控制策略得到所述当前帧音频信号的自动增益值，根据所述自动增益值对所述当前帧音频信号进行自动增益处理。此处的自动增益控制策略与上述自动增益控制策略相同。

图2所示为根据本发明的另一较佳实施例提供的音频信号处理方法的流程图。

如图2所示，首先在本实施例中，输入的音频信号是经过回声消除、降噪处理后的麦克信号。步骤202，判断当前帧音频信号是否为语音帧，若不是语音帧，则不做自动增益处理，否则进入步骤204。

步骤204，判断当前帧音频信号是否有回声残余存在，若有回声残余，则进入步骤206；若无回声残余，则直接进入步骤208。

步骤206，回声残余因子是通过当前帧音频信号与远端参考信号的相关性求得，回音越大，则回音残余因子越大。

步骤208，对当前帧音频信号进行高通滤波，去除低频噪声。

步骤210，对经过高通滤波的音频信号进行降噪处理，去除背景噪声。

步骤212，根据自动增益控制策略得到当前帧音频信号的自动增益值，根据自动增益值对当前帧音频信号进行自动增益处理。

自动增益控制策略包括：

计算当前帧音频信号的平均幅度值并做平滑处理。

A_smooth＝(1-α)×A_smooth+α×A_mp

其中s[i]表示当前帧音频信号中第i个采样点的值，N表示当前帧音频信号包含的总采样点数，A_mp表示当前帧音频信号的平均幅度值，A_smooth是对A_mp平滑后的结果，α是平滑因子。

根据所述平滑幅度值所处的不同语音值区间，对所述平滑幅度值进行不同的增益值计算：

如果A_smooth＞T_up，利用准则1计算初始增益值。

[准则1]

其中T_up表示语音上阈值，R_up表示当A_smooth＞T_up时增益值在对数域的斜率，g_moderate表示增益抬升量。

1如果T_up≥A_smooth＞T_down，则利用准则2计算初始增益值。

[准则2]

g＝g_moderate

其中T_down表示语音下阈值。

如果T_down≥A_smooth＞T_noise，则利用准则3计算初始增益值，否则利用准则4计算初始增益值。

[准则3]

[准则4]

g＝g_conceal

其中T_noise表示噪声阈值，R_down表示当T_down≥A_smooth＞T_noise时增益值在对数域的斜率，g_conceal表示增益压制量。

对初始增益值做平滑处理，得到当前帧音频信号的自动增益值。

G＝(1-β)×G'+β×g

本发明在计算出增益值之后，充分考虑了回声的存在，根据回声残余因子对增益值进行二次处理，最大化地避免对残余回声的放大；将音频信号转换到对数域后再进行自动增益处理，更加符合真实声学模型。

图3所示为根据本发明的又一较佳实施例提供的音频信号处理装置的框图。

如图3所示，根据本发明的实施例的音频信号处理装置300，包括：

回声残余判断单元302，用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余；

回音残余因子计算单元304，用于在有回声残余时，根据回声残余数据得到回音残余因子；

增益值计算单元306，用于根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值；

增益控制单元308，用于根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

其中，所述增益值计算单元306包括：

第一计算子单元3062，用于根据自动增益控制策略得到所述当前帧音频信号的初始增益值；

平滑处理子单元3064，用于对所述初始增益值进行平滑处理；

第二计算子单元3066，用于经过平滑处理的初始增益值除以所述回音残余因子，得到所述自动增益值。

所述增益值计算单元306在未有回声残余时，根据自动增益控制策略得到所述当前帧音频信号的自动增益值；

所述增益控制单元308根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

所述第一计算子单元3062还用于计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理，得到平滑幅度值，以及根据所述平滑幅度值所处的不同语音值区间，对所述平滑幅度值进行不同的增益值计算，得到所述初始增益值。

所述第一计算子单元3062在所述平滑幅度值大于语音上阈值时，根据第一公式计算出所述初始增益值，以及在所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值时，根据第二公式计算出所述初始增益值，以及在所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值时，根据第三公式计算出所述初始增益值，以及在所述平滑幅度值小于等于所述噪声阈值时，根据第四公式计算出所述初始增益值；

其中，所述第一公式为T_up表示所述语音上阈值，A_smooth是所述平滑幅度值，R_up表示当A_smooth＞T_up时增益值在对数域的斜率，g_moderate表示增益抬升量，

所述第二公式为g＝g_moderate，

所述第三公式为T_down表示语音下阈值，T_noise表示噪声阈值，R_down表示当T_down≥A_smooth＞T_noise时增益值在对数域的斜率，

所述第四公式为g＝g_conceal，g_conceal表示增益压制量。

所述平滑处理子单元3064根据以下公式对所述初始增益值进行平滑处理：

G＝(1-β)×G'+β×g

其中，G表示当前帧音频信号的经过平滑处理后的初始增益值，G'表示前一帧音频信号的经过平滑处理后的初始增益值，g是当前帧音频信号的初始增益值，β是平滑因子

相较于先前技术，根据本发明提供的技术方案，能够解决经过回声消除之后仍有回声残余影响音频效果的问题，在自动增益控制的基础上进一步消除回声残余，提高音频质量，此外，还可以通过音频信号的自动增益控制，使得最终输出的声音幅度始终保持在一个恒定的范围内，解决采集到的声音忽大忽小、严重影响接收方收听效果的问题。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾骋
技术所有人：阔地教育科技有限公司
我是此专利的发明人