端到端语音变换系统及方法、存储介质、电子装置与流程

文档序号：37587509发布日期：2024-04-18 12:16阅读：来源：国知局

技术特征：

1.一种端到端语音变换系统，其特征在于，所述系统包括：

2.如权利要求1所述的端到端的语音变换系统，其特征在于，所述音频编码模块还配置为，通过以下步骤训练得到：

3.如权利要求1所述的端到端的语音变换系统，其特征在于，所述风格特征编码模块包括：

4.如权利要求3所述的端到端的语音变换系统，其特征在于，

5.如权利要求4所述的端到端的语音变换系统，其特征在于，

6.一种端到端语音变换方法，其特征在于，包括：

7.如权利要求6所述的端到端的语音变换方法，其特征在于，所述通过风格特征编码模块获取所述目标语音样本的第一风格特征，并根据所述第一风格特征确定所述目标语音样本的第二风格特征，包括：

8.一种计算机可读的存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行权利要求6或7中所述的方法。

9.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求中6或7所述的方法。

技术总结
本申请实施例提供了一种端到端语音变换系统及方法、存储介质、电子装置，所述系统包括音频特征编码模块，风格特征编码模块和音色转换模块，在训练过程中获取目标说话人的目标语音样本，并根据目标语音样本的风格类别，提取目标语音样本的目标音频特征；获取目标语音样本的第一风格特征，并根据第一风格特征确定目标语音样本的第二风格特征；其中，第一风格特征用于指示目标语音样本的静态声音特性，第二风格特征用于指示在预设时长内对第一风格特征的特征偏置量与增益量的预测值；根据第一损失函数、第二损失函数、第三损失函数得到训练后的音色转换模块，并通过训练后的音色转换模块将待处理语音转换为目标说话人对应的目标语音。

技术研发人员：司马华鹏,姚奥,汤毅平
受保护的技术使用者：南京硅基智能科技有限公司
技术研发日：
技术公布日：2024/4/17

完整全部详细技术资料下载

当前第2页1 2