非平行文本条件下基于文本编码器的多对多语音转换方法与流程

文档序号：16848006发布日期：2019-02-12 22:29阅读：来源：国知局

技术特征：

技术总结
本发明公开了一种非平行文本条件下基于文本编码器的多对多语音转换方法，包括了训练部分和转换部分，使用了条件变分自编码器和生成对抗网络(VAWGAN)与文本编码器(Text‑Encoder)相结合来实现语音转换系统，在VAWGAN中加入代表语义的句子嵌入，能够较好地提升转换后语音的语音质量和个性相似度，实现高质量的语音转换。此外，本方法解除了对平行文本的依赖，实现了非平行文本条件下的语音转换，而且训练过程不需要任何对齐过程，提高了语音转换系统的通用性和实用性。此外，本方法可以将多个源‑目标说话人对的转换系统整合在一个转换模型中，即实现多说话人对多说话人转换。本方法在电影配音、语音翻译、语音合成等领域有较好的应用前景。

技术研发人员：李燕萍;石杨;张燕
受保护的技术使用者：南京邮电大学
技术研发日：2018.11.23
技术公布日：2019.02.12

完整全部详细技术资料下载

当前第2页1 2