一种音色转换方法、装置、设备及存储介质与流程

文档序号:33556840发布日期:2023-03-22 12:17阅读:来源:国知局

技术特征:
1.一种音色转换方法,其特征在于,包括:获取待转换语音信息;将所述待转换语音信息输入至设定的音色转换模型,由所述音色转换模型将所述待转换语音信息的内容特征以及语气特征进行结合得到内容语气特征,并基于设定的音色特征对所述内容语气特征进行音色转换处理,以得到目标语音信息;输出所述音色转换模型输出的所述目标语音信息。2.根据权利要求1所述的音色转换方法,其特征在于,所述音色转换模型在将所述待转换语音信息的内容特征以及语气特征进行结合得到内容语气特征,并基于设定的音色特征对所述内容语气特征进行音色转换处理时,包括:通过语气补充网络提取所述待转换语音信息的内容特征,以及提取所述待转换语音信息的语气特征,并将所述内容特征和所述语气特征相加得到语气补充特征;通过内容整合网络将所述内容特征和所述语气补充特征进行合并得到内容语气特征;通过音色转换网络,基于设定的音色特征对所述内容语气特征进行音色转换处理。3.根据权利要求2所述的音色转换方法,其特征在于,所述音色转换模型在通过语气补充网络提取所述待转换语音信息的语气特征时,包括:通过语气补充网络基于加入量化模块的语音预训练模型提取所述待转换语音信息的语气特征。4.根据权利要求2所述的音色转换方法,其特征在于,所述音色转换模型在将所述内容特征和所述语气特征相加得到语气补充特征时,包括:通过语气补充网络获取所述内容特征的第一权重以及所述语气特征的第二权重;通过语气补充网络,基于所述第一权重和所述第二权重,对所述内容特征和所述语气特征进行加权求和处理得到语气补充特征。5.根据权利要求4所述的音色转换方法,其特征在于,所述音色转换模型在获取所述内容特征的第一权重以及所述语气特征的第二权重时,包括:通过语气补充网络,基于动态权重调整策略获取所述内容特征的第一权重以及所述语气特征的第二权重。6.根据权利要求2所述的音色转换方法,其特征在于,所述音色转换模型在通过内容整合网络将所述内容特征和所述语气补充特征进行合并得到内容语气特征时,包括:通过内容整合网络,利用卷积模块将所述语气补充特征的维度转换到与所述内容特征的维度相同的维度;通过内容整合网络将所述内容特征和所述语气补充特征相加得到内容语气特征。7.根据权利要求2所述的音色转换方法,其特征在于,所述音色转换模型在基于设定的音色特征对所述内容语气特征进行音色转换处理时,包括:通过音色转换单元将设定的音色特征添加到所述内容语气特征中,以得到目标语音特征;通过声码输出单元对所述目标语音特征进行上采样处理,以得到目标语音信息,所述目标语音信息包含有所述音色特征对应的目标音色以及所述待转换语音信息对应的语气。8.一种音色转换装置,其特征在于,包括语音获取模块、音色转换模块和语音输出模块,其中:
所述语音获取模块,配置为获取待转换语音信息;所述音色转换模块,配置为将所述待转换语音信息输入至设定的音色转换模型,由所述音色转换模型将所述待转换语音信息的内容特征以及语气特征进行结合得到内容语气特征,并基于设定的音色特征对所述内容语气特征进行音色转换处理,以得到目标语音信息;所述语音输出模块,配置为输出所述音色转换模型输出的所述目标语音信息。9.一种音色转换设备,其特征在于,包括:存储器以及一个或多个处理器;所述存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一项所述的音色转换方法。10.一种存储计算机可执行指令的非易失性存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7任一项所述的音色转换方法。11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的音色转换方法。

技术总结
本申请实施例提供了一种音色转换方法、装置、设备及存储介质。本申请实施例提供的技术方案通过将待转换语音信息输入到音色转换模型中,由音色转换模型将待转换语音信息的内容特征以及语气特征进行结合得到内容语气特征,并基于设定的音色特征对内容语气特征进行音色转换处理,以得到目标语音信息,并输出音色转换模型输出的目标语音信息,在转换得到的目标语音信息中保留了原始的待转换语音信息的语气信息,有效提高音色转换效果。有效提高音色转换效果。有效提高音色转换效果。


技术研发人员:黄家鸿 马东鹏 项伟
受保护的技术使用者:广州市百果园信息技术有限公司
技术研发日:2022.09.14
技术公布日:2023/3/21
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1