语音增强模型训练方法、语音处理方法、装置及设备与流程

文档序号：35793404发布日期：2023-10-21 21:42阅读：来源：国知局

技术特征：

1.一种语音增强模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对原语音训练数据进行纯净度估计，得到所述原语音训练数据的语音纯净度，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述语音纯净度对所述原语音训练数据进行加噪处理，得到处理后的语音训练数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述学习所述处理后的语音训练数据与估计的纯净语音数据之间的映射关系，得到训练后的语音增强模型，包括：

5.根据权利要求4所述的方法，其特征在于，所述监督性目标函数为最小化尺度不变的信噪比sisnr损失函数，所述非监督性目标函数为深度噪声抑制平均意见得分dnsmos损失函数。

6.一种语音处理方法，其特征在于，包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

8.一种语音增强模型训练装置，其特征在于，包括：

9.一种语音处理装置，其特征在于，包括：

10.一种语音增强模型训练设备，包括处理器和收发器，所述收发器在处理器的控制下接收和发送数据，其特征在于，所述处理器用于执行以下操作：

11.一种语音增强模型训练设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序；其特征在于，所述处理器执行所述程序时实现如权利要求1至5任一项所述的语音增强模型训练方法。

12.一种语音处理设备，包括处理器和收发器，所述收发器在处理器的控制下接收和发送数据，其特征在于，所述处理器用于执行以下操作：

13.一种语音处理设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序；其特征在于，所述处理器执行所述程序时实现如权利要求6至7任一项所述的语音处理方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至5任一项所述的语音增强模型训练方法中的步骤，或者实现如权利要求6至7任一项所述的语音处理方法中的步骤。

技术总结
本发明提供了一种语音增强模型训练方法、语音处理方法、装置及设备。该方法包括：对原语音训练数据进行纯净度估计，得到所述原语音训练数据的语音纯净度；基于所述语音纯净度对所述原语音训练数据进行加噪处理，得到处理后的语音训练数据；学习所述处理后的语音训练数据与估计的纯净语音数据之间的映射关系，得到训练后的语音增强模型。该方法通过采用包括纯净语音数据和含噪语音数据的原语音训练数据，能够扩展语音训练数据集的数量以及范围，降低数据获取成本，并且能使训练的语音增强的适用范围更广，而且通过语音纯净度估计，使数据无需预先标注即可进行网络训练，从而降低了标注产生的成本。

技术研发人员：崔子豪,张世磊,高莹莹,陈亚楠
受保护的技术使用者：中国移动通信有限公司研究院
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2