一种音频信号处理方法及装置与流程

文档序号:12476008阅读:来源:国知局

技术特征:

1.一种音频信号处理方法,其特征在于,包括:

判断输入的且经过回声消除的当前帧音频信号是否有回声残余;

若有回声残余,则根据回声残余数据得到回音残余因子;

根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值;

根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

2.根据权利要求1所述的音频信号处理方法,其特征在于,所述根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值,包括:

根据自动增益控制策略得到所述当前帧音频信号的初始增益值;

对所述初始增益值进行平滑处理;

经过平滑处理的初始增益值除以所述回音残余因子,得到所述自动增益值。

3.根据权利要求1所述的音频信号处理方法,其特征在于,若未有回声残余,则根据自动增益控制策略得到所述当前帧音频信号的自动增益值,根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

4.根据权利要求1所述的音频信号处理方法,其特征在于,所述自动增益控制策略包括:

计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;

根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到所述初始增益值。

5.根据权利要求4所述的音频信号处理方法,其特征在于,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,包括:

若所述平滑幅度值大于语音上阈值,则根据第一公式计算出所述初始增益值;

若所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值,则根据第二公式计算出所述初始增益值;

若所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值,则根据第三公式计算出所述初始增益值;

若所述平滑幅度值小于等于所述噪声阈值,则根据第四公式计算出所述初始增益值;

其中,所述第一公式为Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,

所述第二公式为g=gmoderate

所述第三公式为Tdown表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,

所述第四公式为g=gconceal,gconceal表示增益压制量。

6.根据权利要求2所述的音频信号处理方法,其特征在于,根据以下公式对所述初始增益值进行平滑处理:

G=(1-β)×G'+β×g

其中,G表示当前帧音频信号的经过平滑处理后的初始增益值,G'表示前一帧音频信号的经过平滑处理后的初始增益值,g是当前帧音频信号的初始增益值,β是平滑因子。

7.一种音频信号处理装置,其特征在于,包括:

回声残余判断单元,用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余;

回音残余因子计算单元,用于在有回声残余时,根据回声残余数据得到回音残余因子;

增益值计算单元,用于根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值;

增益控制单元,用于根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

8.根据权利要求7所述的音频信号处理装置,其特征在于,所述增益值计算单元包括:

第一计算子单元,用于根据自动增益控制策略得到所述当前帧音频信号的初始增益值;

平滑处理子单元,用于对所述初始增益值进行平滑处理;

第二计算子单元,用于经过平滑处理的初始增益值除以所述回音残余因子,得到所述自动增益值。

9.根据权利要求7所述的音频信号处理装置,其特征在于,所述增益值计算单元在未有回声残余时,根据自动增益控制策略得到所述当前帧音频信号的自动增益值;

所述增益控制单元根据所述自动增益值对所述当前帧音频信号进行自动增益处理。

10.根据权利要求7所述的音频信号处理装置,其特征在于,所述第一计算子单元还用于计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值,以及根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到所述初始增益值。

11.根据权利要求10所述的音频信号处理装置,其特征在于,所述第一计算子单元在所述平滑幅度值大于语音上阈值时,根据第一公式计算出所述初始增益值,以及在所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值时,根据第二公式计算出所述初始增益值,以及在所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值时,根据第三公式计算出所述初始增益值,以及在所述平滑幅度值小于等于所述噪声阈值时,根据第四公式计算出所述初始增益值;

其中,所述第一公式为Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,

所述第二公式为g=gmoderate

所述第三公式为Tdown表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,

所述第四公式为g=gconceal,gconceal表示增益压制量。

12.根据权利要求8所述的音频信号处理装置,其特征在于,所述平滑处理子单元根据以下公式对所述初始增益值进行平滑处理:

G=(1-β)×G'+β×g

其中,G表示当前帧音频信号的经过平滑处理后的初始增益值,G'表示前一帧音频信号的经过平滑处理后的初始增益值,g是当前帧音频信号的初始增益值,β是平滑因子。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1