一种基于逐级幅度补偿网络的单通道语音增强方法

文档序号:35814156发布日期:2023-10-22 06:29阅读:111来源:国知局
技术特征:

1.一种基于逐级幅度补偿网络的单通道语音增强方法,其特征在于,包括:

2.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述幅度谱估计支路包括实数卷积编码器、实数长短时记忆网络lstm及实数卷积解码器;实数卷积编码器对输入的带噪语音信号的幅度谱进行深度特征提取,得到一个具有深度特征信息的特征图,将所述特征图输入实数长短时记忆网络lstm,对时间依赖关系进行建模,再经过实数卷积解码器恢复增强后的语音信号的幅度谱,和原始带噪语音信号的相位一起重构初步增强后的语音信号;

3.根据权利要求2所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述复数卷积编码器由六个卷积块堆叠而成,每一个卷积块由一个复数形式的卷积层、复数形式的批归一化层以及复数形式的带参relu激活函数组成;复数形式的卷积层是由四个卷积层按照复数乘法的运算规则进行模拟得到,设复数形式的滤波器矩阵w=wr+jwi,复数形式的输入向量x=xr+jxi,其中,wr和wi是实数张量滤波器矩阵,xr和xi是实数输入张量,实值部分用来模拟复数运算,则复数卷积运算的输出表示为:

4.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述幅度谱估计支路特征提取路径和复数谱细化支路的特征提取路径均由一个时频域多尺度卷积块组成,时频域多尺度卷积块先分别经过三个卷积核大小为3*1、1*3和3*3的卷积层,三个卷积层的输出拼接后,送入一个卷积块,卷积块由一个卷积核大小为1*1的卷积层、批归一化和sigmoid激活函数组成;幅度谱估计支路的特征提取路径和复数谱细化支路的特征提取路径的输出分别表示为:

5.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述步骤3中,重构最终输出的增强后的语音信号的频谱包括:

6.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述步骤1中,短时傅里叶变换stft包括:

7.根据权利要求1所述的基于逐级幅度补偿网络的单通道语音增强方法,其特征在于:所述步骤2中,理想比值掩码irm如下:

8.一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,其特征在于:所述处理器执行所述程序时实现权利要求1-7任意之一所述方法。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-7任意之一所述方法。


技术总结
本发明涉及一种基于逐级幅度补偿网络的单通道语音增强方法,采用一种基于编码器‑解码器的三分支结构,分别为幅度谱估计支路、复数谱细化支路和时域波形校正支路。利用幅度谱估计支路滤除主要的噪声成分,复数谱细化支路补绘缺失的细节,隐式估计相位信息的基础上,利用时域波形对两个支路进行校正。为了充分利用三个支路的信息,在本发明中,提出跨域信息融合模块,并嵌入到三个分支中,逐步提取和融合三个分支的特征,对幅度谱估计支路和复数谱细化支路的信息进行校正和幅度补偿。本发明能够有效地弥补幅度和相位之间的隐含补偿效果,提高语音信号的质量和可理解性,优于目前最先进的跨域语音增强方法和以往的先进系统。

技术研发人员:叶中付,陈雯卓
受保护的技术使用者:中国科学技术大学
技术研发日:
技术公布日:2024/1/15
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!