一种语音合成模型训练平台的制作方法

文档序号:33946951发布日期:2023-04-26 08:38阅读:37来源:国知局
一种语音合成模型训练平台的制作方法

本申请涉及语音合成,尤其涉及一种语音合成模型训练平台。


背景技术:

1、使用传统方式进行语音模型训练时,通常需要标注人员进行填写训练任务的相关信息后交给算法团队进行训练。该过程不仅步骤较多,效率较低,而且需要确保每一步都没有失误才能保证最后的训练成功。若中间过程出现错误,则会导致训练失败的情况发生。

2、因此,有必要设计一种提高模型任务训练效率和准确率的方案。


技术实现思路

1、本申请实施例提供一种语音合成模型训练平台,可以提高语音合成模型的训练任务的训练效率以及准确率。

2、本申请实施例的技术方案是这样实现的:

3、第一方面,本申请实施例提供一种语音合成模型训练平台,包括:

4、前端模块,用于创建训练任务;

5、后端模块,用于获取前端模块创建的训练任务,若查询到存在gpu的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;

6、算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。

7、在上述方案中,所述前端模块,具体用于:

8、根据用户名和标注任务名称生成训练任务名称;

9、确定发音人名称、确定采样率、确定发音人风格、确定发音人性别、确定是否重读。在上述方案中,所述前端模块还用于显示以下至少一项训练任务的任务列表:

10、正在准备训练的任务列表、正在训练中的任务列表、训练成功完成的任务列表、训练完成失败的任务列表和已经取消训练的任务列表中至少一项。

11、在上述方案中,所述前端模块还用于:

12、对训练成功完成的训练任务输出试听语音。

13、在上述方案中,所述前端模块还用于:

14、对训练成功完成的训练任务,接收自定义文本的输入;

15、基于所述自定义文本和训练任务的训练结果所对应的发音人的声音,输出与自定义文本对应的语音。

16、在上述方案中,所述前端模块还用于:

17、取消正在准备训练的训练任务。

18、在上述方案中,所述后端模块还用于:

19、若未查询到图形处理器(graphic processing unit,gpu)的空闲核心,则等待第一时间后,再次查询所述图像处理器gpu是否存在空闲核心。

20、在上述方案中,所述后端模块还用于:

21、获取算法模块中的所述训练任务的训练结果;

22、对所述训练结果进行解析,得到解析结果;

23、将所述解析结果发送给前端模块。

24、在上述方案中,所述后端模块还用于:

25、在所述训练任务结束之后,释放所述空闲核心。

26、在上述方案中,所述后端模块还用于:

27、对正在训练中的训练任务进行超时判断,若所述训练任务的训练时间超过预设的时间阈值,则将所述训练任务标记为训练完成失败的训练任务。

28、本申请实施例提供的语音合成模型训练平台,前端模块,用于创建训练任务;后端模块,用于获取前端模块创建的训练任务,若查询到存在gpu的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。本申请提供的语音合成模型训练平台,用户可通过可视化的方式,在创建训练任务之后,将不用再进行任何操作,等待最后的训练结果即可。实现了一键完成训练任务,解决了语音模型训练流程复杂、错误率较高的问题,提高了训练准确率。



技术特征:

1.一种语音合成模型训练平台,其特征在于,所述平台包括:

2.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块,具体用于:

3.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块还用于显示以下至少一项训练任务的任务列表:

4.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块还用于:

5.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块还用于:

6.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块还用于:

7.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述后端模块还用于:

8.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述后端模块还用于:

9.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述后端模块还用于:

10.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述后台模块还用于:


技术总结
本申请提供了一种语音合成模型训练平台;所述平台包括:前端模块,用于创建训练任务;后端模块,用于获取前端模块创建的训练任务,若查询到存在图形处理器(GPU)的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。本申请提供的语音合成模型训练平台,在创建训练任务确定之后,用户将不用再进行任何操作,直接等待最后的训练结果即可,解决了语音模型训练流程复杂的问题,提高了训练准确率。

技术研发人员:王正,江明奇,杨喜鹏,殷昊,陈云琳
受保护的技术使用者:上海墨百意信息科技有限公司
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1