虚拟语音的生成方法与流程

文档序号：35798177发布日期：2023-10-21 23:34阅读：45来源：国知局

本发明涉及语音处理，尤其涉及一种虚拟语音的生成方法。

背景技术：

1、语音技术在计算机领域中的关键技术有自动语音识别技术和语音合成技术。让计算机能听、能看、能说、能感觉，是未来人机交互的发展方向，其中语音成为未来最被看好的人机交互方式，语音比其他的交互方式有更多的优势。

2、最早的语音技术因“自动翻译电话”计划而起，包含了语音识别、自然语言理解和语音合成三项非常主要的技术。语音识别的研究工作可以追溯到20世纪50年代at&t贝尔实验室的audry系统，此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。现有技术提高了虚拟语音生成的灵活性以及可靠性，但未对生成的虚拟语音的质量进行分析导致生成的虚拟语音存在漏词等问题。

3、中国专利申请号：cn202211676955.x公开了一种虚拟语音的生成方法、装置、存储介质及电子装置，该发明公开了一种虚拟语音的生成方法、装置、存储介质及电子装置。其中，该虚拟语音的生成方法包括：通过获取多个不同的语音文本样本及语音属性信息，多个不同的语种语音文本样本中的每个语音文本样本对应一个语种，一个对象；将每个语音文本样本输入多流编码器中，得到每个语音文本样本对应的文本特征；通过文本特征以及语音特征训练基于生成式对抗网络建模的预设语音声学模型，得到生成虚拟语音的目标声学模型，即该发明可支持跨语种数据训练及跨语种发音人的生成，多流编码器能更好的捕捉不同语种中的文本特征，提升虚拟预设生成的灵活性以及可靠性，进而解决了现有技术中，生成虚拟语音的灵活性以及可靠性较低的技术问题；由此可见，所述虚拟语音的生成方法、装置、存储介质及电子装置存在以下问题：未对生成的虚拟语音的质量进行分析导致生成的虚拟语音存在漏词问题。

技术实现思路

1、为此，本发明提供一种虚拟语音的生成方法，用以克服现有技术中。的问题。

2、为实现上述目的，本发明提供一种虚拟语音的生成方法，包括：

3、步骤s1、采集模块采集测试语句的测试音频，语音生成模块根据采集的测试音频生成对应的虚拟语音，检测模块检测虚拟语音与测试音频的声波形状，中控模块根据测得的声波形状计算虚拟语音与测试音频的相似度；

4、步骤s2、所述中控模块根据所述相似度的计算结果对对应的所述测试语句进行评级，并统计各等级所述测试语句的数量以根据各等级测试语句的占比判定所述虚拟语音的生成是否合格；

5、步骤s3、所述中控模块在判定所述虚拟语音的生成不符合标准时统计所述检测模块测得的虚拟语音的缺失词语数并根据该缺失词语数判定是否更新测试语句，或，控制所述检测模块检测对应的虚拟语音的音节数量并根据该音节数量将降噪处理过程中反相位声波的频率和幅度调节至对应值；

6、步骤s4、所述中控模块在判定所述虚拟语音的生成符合标准时控制所述采集模块采集新的测试语句的测试音频以二次判定所述虚拟语音的生成是否合格，并在判定所述虚拟语音的生成不合格时控制所述采集模块采集新的测试音频，或，在判定所述虚拟语音的生成合格时向显示模块发送合格指令。

7、进一步地，所述中控模块根据计算的所述虚拟语音与所述测试音频的声波形状的相似度判定对所述测试语句评级的评级方式，其中：

8、第一评级方式为所述中控模块将所述测试语句记为一级语句；所述第一评级方式满足所述相似度大于等于第一预设相似度；

9、第二评级方式为所述中控模块将所述测试语句记为二级语句，并控制所述检测模块检测该二级语句对应的虚拟语音中缺失的词语；所述第二评级方式满足所述相似度小于所述第一预设相似度且大于等于第二预设相似度；

10、第三评级方式为所述中控模块将所述测试语句记为三级语句；所述第三评级方式满足所述相似度小于所述第二预设相似度。

11、进一步地，所述中控模块在完成对所述测试语句的评级时统计各等级测试语句的数量，并计算各等级测试语句的占比以判定所述虚拟语音的生成是否符合标准的判定方式，其中：

12、第一判定方式为所述中控模块判定所述虚拟语音的生成符合标准，并控制所述采集模块采集新的测试语句的测试音频以二次判定所述虚拟语音的生成是否合格；所述第一判定方式满足所述一级语句的占比大于等于第一预设一级占比；

13、第二判定方式为所述中控模块判定所述虚拟语音的生成不符合标准，并统计所述检测模块测得的虚拟语音的缺失词语数；所述第二判定方式满足所述二级语句的占比大于等于预设二级占比；

14、第三判定方式为所述中控模块判定所述虚拟语音的生成不符合标准，并控制所述检测模块检测所述二级语句对应的虚拟语音的音节数量；所述第三判定方式满足所述三级语句的占比大于等于预设三级占比。

15、进一步地，所述中控模块在所述第一判定方式下控制所述采集模块采集新的测试语句的测试音频，中控模块根据新的各级语句的占比二次判定所述虚拟语音的生成是否合格的二次判定方式，其中：

16、第一二次判定方式为所述中控模块判定所述虚拟语音的生成合格，并向所述显示模块发送合格指令；所述第一二次判定方式满足新的所述一级语句的占比大于等于第二预设一级占比；

17、第二二次判定方式为所述中控模块判定所述虚拟语音的生成不合格，并控制所述采集模块采集新的测试语句；所述第二二次判定方式满足所述一级语句的占比小于所述第二预设一级占比。

18、进一步地，所述中控模块在所述第二判定方式下根据统计的所述虚拟语音的缺失词语数判定该缺失词语数是否符合更新标准的更新判定方式，其中：

19、第一更新判定方式为所述中控模块判定所述虚拟语音的缺失词语数符合更新标准，并控制所述更新模块对缺失词语进行更新；所述第一更新判定方式满足所述缺失词语数大于等于预设缺失词语数；

20、第二更新判定方式为所述中控模块判定所述虚拟语音的缺失词语数不符合更新标准，并继续统计所述虚拟语音的缺失词语数；所述第二更新方式满足所述缺失词语数小于所述预设缺失词语数。

21、进一步地，所述中控模块在所述第一更新判定方式下控制所述更新模块将所述虚拟语音的缺失词语组合成新的测试语句，并控制所述采集模块对该测试语句进行采集以生成虚拟语音。

22、进一步地，所述中控模块在所述第三判定方式下控制所述检测模块检测所述组中二级语句的虚拟语音的音节数量，并控制所述降噪模块对该二级语句对应的测试音频进行降噪处理，中控模块根据测得的音节数确定降噪处理过程中调节反相位声波频率的频率调节方式，其中：

23、第一频率调节方式为所述中控模块选用第一频率调节系数α1将所述反相位声波频率q调节至对应值，设定调节后的反相位声波频率q’＝α1×q；所述第一频率调节方式满足所述音节数小于等于预设音节数；

24、第二频率调节方式为所述中控模块选用第二频率调节系数α2将所述反相位声波频率q调节至对应值，设定调节后的反相位声波频率q’＝α2×q；所述第二频率调节方式满足所述音节数大于所述预设音节数。

25、进一步地，所述中控模块在所述第二频率调节方式下根据所述音节数与所述预设音节数的差值判定对所述反相位声波幅度的幅度调节方式，其中：

26、第一幅度调节方式为所述中控模块选用第一幅度调节系数β1将所述反相位声波的幅度w调节至对应值，设定调节后的反相位声波幅度w’＝β1×w；所述第一幅度调节方式满足所述差值大于等于预设差值；

27、第二幅度调节方式为所述中控模块选用第二幅度调节系数β2将所述反相位声波的幅度w调节至对应值，设定调节后的反相位声波幅度w’＝β2×w；所述第二幅度调节方式满足所述差值小于所述预设差值。

28、进一步地，所述中控模块在所述第二二次判定方式下控制所述采集模块采集新的测试语句，并控制所述语音生成模块生成对应的虚拟语音，中控模块计算该虚拟语音与测试音频的相似度以对其评级并判定该虚拟语音的生成是否符合标准。

29、进一步地，所述中控模块提取预设数量测试语句中的相同词语与不同词语，将该相同词语与不同词语组合成无重复词汇的新的测试语句，中控模块用该新的测试语句替换原测试语句进行测试。

30、与现有技术相比，本发明的有益效果在于，本发明中中控模块根据采集的声波形状计算所述虚拟语音与测试音频的相似度，提高了对生成的虚拟语音的控制精度，并根据相似度对对应的测试语句进行评级，中控模块根据各级别测试语句的占比判定虚拟语句的生成是否符合预设标准并分析不符合预设标准的原因，中控模块根据分析的原因将对应的设备的参数调节至对应值，避免了生成的虚拟语音漏词的现象，提高了生成的虚拟语音的质量，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。

31、进一步地，本发明中中控模块根据所述虚拟语音与所述测试音频的声波形状的相似度对所述测试语句进行评级，并在将所述测试语句记为二级语句时控制检测模块检测该二级语句对应的虚拟语音中缺失的词语，提高了对虚拟语句的质量的控制精度，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。

32、进一步地，本发明中中控模块根据各等级语句的占比判定所述虚拟语音的生成是否符合标准，提高了对虚拟语句的生成过程的控制精度，进一步提高了所述虚拟语句的质量，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。

33、进一步地，本发明中中控模块控制所述采集模块采集新的测试语句的测试音频，并根据新的各级语句的占比二次判定所述虚拟语音的生成是否合格，中控模块在判定所述虚拟语音的生成不合格时控制所述采集模块采集新的测试语句，提高了对测试语句的控制精度，并在判定所述虚拟语音的生成合格时向所述显示模块发送合格指令，提高了所述虚拟语句的质量，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。

34、进一步地，本发明中中控模块根据所述虚拟语音的缺失词语数判定该缺失词语数是否符合更新标准，并在判定所述虚拟语音的缺失词语数不符合更新标准时继续统计所述虚拟语音的缺失词语数，或，在判定所述虚拟语音的缺失词语数符合更新标准时控制所述更新模块对缺失词语进行更新，提高了所述虚拟语句的质量，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。

35、进一步地，本发明中中控模块控制所述检测模块检测所述组中二级语句的虚拟语音的测得的音节数量，并根据改音节数选用对应的频率调节系数调节降噪处理过程中的反相位声波频率，提高了所述虚拟语句的质量，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。

36、进一步地，本发明中中控模块根据所述音节数与所述预设音节数的差值选用对应的幅度调节系数对所述反相位声波的幅度进行调节，在保证虚拟语音的质量的同时，提高了虚拟语音生成的效率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李昌绿詹楚伟朱正辉
技术所有人：广东保伦电子股份有限公司
我是此专利的发明人

上一篇：一种五轴卧式加工中心的制作方法
上一篇：一种用于非金属废料回收设备的制作方法