1.一种音频合成方法,其特征在于,包括:
2.根据权利要求1所述的一种音频合成方法,其特征在于,所述获取目标口音特征向量,包括:
3.根据权利要求1所述的一种音频合成方法,其特征在于,所述获取目标口音特征向量,包括:
4.根据权利要求1所述的一种音频合成方法,其特征在于,所述音频合成模型包括编码器、嵌入网络以及解码器;
5.根据权利要求1所述的一种音频合成方法,其特征在于,在所述获取预设文本的标准音标文本之前,所述方法还包括:
6.根据权利要求5所述的一种音频合成方法,其特征在于,所述初始音频合成模型包括初始第一口音特征提取网络、初始第二口音特征提取网络、初始嵌入网络、初始编码器以及初始解码器;
7.根据权利要求6所述的一种音频合成方法,其特征在于,所述基于所述训练第二口音特征向量、所述训练身份标识向量与所述训练输出向量,获取训练输出声音特征参数,包括:
8.一种音频合成装置,其特征在于,包括:
9.一种设备,其特征在于,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行如权利要求1~7任一项所述的一种音频合成方法中的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1~7任一项所述的一种音频合成方法中的步骤。