基于神经网络的语音增强方法、设备及存储介质与流程

文档序号：36268786发布日期：2023-12-06 17:56阅读：来源：国知局

技术特征：

1.一种基于神经网络的语音增强方法，其特征在于，包括步骤：

2.根据权利要求1所述的基于神经网络的语音增强方法，其特征在于，在所述根据预置神经网络，对所述频域幅度谱进行掩码估计运算，得到补全掩码之前，还包括：

3.根据权利要求2所述的基于神经网络的语音增强方法，其特征在于，所述隐藏层包括：第一全连接层、第一gru连接层、第二gru连接层、第二全连接层、第三全连接层，所述根据预置神经网络，对所述频域幅度谱进行掩码估计运算，得到补全掩码包括：

4.根据权利要求3所述的基于神经网络的语音增强方法，其特征在于，所述输入层对所述频域幅度谱采集幅度数据包括：

5.根据权利要求1所述的基于神经网络的语音增强方法，其特征在于，在所述根据预置神经网络，对所述频域幅度谱进行掩码估计运算，得到补全掩码之前，还包括:

6.根据权利要求5所述的基于神经网络的语音增强方法，其特征在于，所述根据预置维纳滤波器，对所述纯净语音数据和所述噪声数据进行最优掩码运算，得到最优掩码数据包括：

7.根据权利要求6所述的基于神经网络的语音增强方法，其特征在于，所述维纳滤波器包括：

8.根据权利要求1所述的基于神经网络的语音增强方法，其特征在于，所述接收时域噪声语音数据包括：

9.一种基于神经网络的语音增强设备，其特征在于，所述基于神经网络的语音增强设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的基于神经网络的语音增强方法。

技术总结
本发明涉及语音增强领域，公开了一种基于神经网络的语音增强方法、设备及存储介质。该方法包括：接收时域噪声语音数据；根据预置短时傅里叶变换算法，对所述时域噪声语音数据进行转换处理，得到频域噪声语音数据；对所述频域噪声语音数据进行复数绝对值运算，得到频域幅度谱；根据预置神经网络，对所述频域幅度谱进行掩码估计运算，得到补全掩码；将所述频域噪声语音数据与所述补全掩码进行点乘处理，得到频域增强语音数据；根据预置傅里叶逆变换算法，对所述频域增强语音数据进行逆转换处理，得到时域增强语音数据。在本发明实施例中，解决了神经网络的在小型单片机上运行时导致噪声过滤算法无法应对突发的噪声进行过滤抑制的技术问题。

技术研发人员：邓刚,赵宏亮,欧阳梓俊
受保护的技术使用者：深圳市长丰影像器材有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2