1.一种基于逐级幅度补偿网络的单通道语音增强方法,其特征在于,包括:
2.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述幅度谱估计支路包括实数卷积编码器、实数长短时记忆网络lstm及实数卷积解码器;实数卷积编码器对输入的带噪语音信号的幅度谱进行深度特征提取,得到一个具有深度特征信息的特征图,将所述特征图输入实数长短时记忆网络lstm,对时间依赖关系进行建模,再经过实数卷积解码器恢复增强后的语音信号的幅度谱,和原始带噪语音信号的相位一起重构初步增强后的语音信号;
3.根据权利要求2所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述复数卷积编码器由六个卷积块堆叠而成,每一个卷积块由一个复数形式的卷积层、复数形式的批归一化层以及复数形式的带参relu激活函数组成;复数形式的卷积层是由四个卷积层按照复数乘法的运算规则进行模拟得到,设复数形式的滤波器矩阵w=wr+jwi,复数形式的输入向量x=xr+jxi,其中,wr和wi是实数张量滤波器矩阵,xr和xi是实数输入张量,实值部分用来模拟复数运算,则复数卷积运算的输出表示为:
4.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述幅度谱估计支路特征提取路径和复数谱细化支路的特征提取路径均由一个时频域多尺度卷积块组成,时频域多尺度卷积块先分别经过三个卷积核大小为3*1、1*3和3*3的卷积层,三个卷积层的输出拼接后,送入一个卷积块,卷积块由一个卷积核大小为1*1的卷积层、批归一化和sigmoid激活函数组成;幅度谱估计支路的特征提取路径和复数谱细化支路的特征提取路径的输出分别表示为:
5.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述步骤3中,重构最终输出的增强后的语音信号的频谱包括:
6.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述步骤1中,短时傅里叶变换stft包括:
7.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述步骤2中,理想比值掩码irm如下:
8.一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,其特征在于:所述处理器执行所述程序时实现权利要求1-7任意之一所述方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-7任意之一所述方法。