语音合成系统的评价方法、装置、设备、存储介质和产品与流程

文档序号：36266969发布日期：2023-12-06 12:53阅读：43来源：国知局

本说明书实施例涉及语音合成领域，特别地，涉及一种语音合成系统的评价方法、装置、设备、存储介质和产品。

背景技术：

1、语音合成作为计算机的“嘴巴”，在日常生活中已经得到了各种各样的应用，例如电商、物流的智能客服，地图导航语音播报等等。语音合成系统的实现涉及到自然语言处理，不同的语音合成系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现。

2、目前语音合成系统存在两种比较严重的错误：第一、前端错误：严重的前端错误会导致漏掉一些重要的文本、重要字，如原文本：股价下降-3.0％，正则化后文本是：股价下降百分之三点零，这样就产生巨大的误差。第二、后端错误：主流的端到端语音合成算法会随机产生一些语音漏读和多读的错误。对于这类的语音合成系统问题，当前的通用评价方法是聘请大量的专业评测人员进行测评。但是，通过人工测听需要花费大量的人力并且效率比较低，而且人力进行记录分析也容易犯错误。

3、因此现在亟需一种语音合成系统的评价方法，能够提高评测效率和准确度。

技术实现思路

1、本说明书实施例的目的在于提供一种语音合成系统的评价方法、装置、设备、存储介质和产品，以提高针对语音合成系统的评测效率和准确度。

2、为达到上述目的，一方面，本说明书实施例提供了一种语音合成系统的评价方法，包括：

3、获取原始文本通过语音合成系统生成的语音文件，以及语音文件生成过程中的日志文件；

4、将所述语音文件进行转化，得到语音文件对应的识别文本；

5、对比所述原始文本和所述识别文本，得到所述语音文件对应的后端错误，以及所述后端错误对应的后端错误类型，其中所述后端错误为语音合成错误；

6、将存在后端错误的语音文件对应的日志文件作为待筛查文件；

7、对所述待筛查文件进行多维度筛查，确定所述语音文件对应的前端错误，以及所述前端错误对应的前端错误类型和数目，其中所述前端错误为文本处理错误；

8、当全量语音文件对应的后端错误类型中不包含设定错误类型，且指定类型的前端错误数目小于设定数目时，评价通过。

9、优选的，所述将所述语音文件进行转化，得到语音文件对应的识别文本进一步包括：

10、根据构建得到的语言模型，得到识别文本中每个字词出现的概率；

11、根据构建得到的tlg解码器，得到识别文本中每个字词对应的上下文字词出现的概率；

12、综合所述每个字词出现的概率，以及每个字词对应的上下文字词出现的概率，根据语音识别系统解码器将所述语音文件进行转化，得到语音文件对应的识别文本。

13、优选的，所述对比所述原始文本和所述识别文本，得到所述语音文件对应的后端错误，以及所述后端错误对应的后端错误类型进一步包括：

14、将所述原始文本和所述识别文本进行逐字对比，得到所述语音文件对应的后端错误；

15、分析所述后端错误，得到所述后端错误对应的后端错误类型为替换错误、插入错误和删除错误中至少一者。

16、优选的，所述替换错误为所述原始文本和识别文本中存在字音相同但字形不同的错误。

17、优选的，所述插入错误为所述识别文本比原始文本多字的错误。

18、优选的，所述删除错误为所述识别文本比所述原始文本少字的错误。

19、优选的，所述语音文件生成过程进一步包括：

20、原始文本通过语音合成系统，经正则化处理、分词处理、多音字词处理和韵律处理，生成文本音素序列；

21、将所述文本音素序列转换为语音文件。

22、优选的，所述对所述待筛查文件进行多维度筛查，确定所述语音文件对应的前端错误，以及所述前端错误对应的前端错误类型和数目进一步包括：

23、对所述待筛查文件进行文本正则化筛查、分词筛查、非多音字词筛查、多音字词筛查和韵律筛查，确定所述语音文件对应的前端错误；

24、确定所述前端错误对应的前端错误类型为文本正则化错误、分词错误、非多音字词错误、多音字词错误和韵律错误中至少一者，以及相应前端错误类型对应的前端错误数目。

25、优选的，所述对所述待筛查文件进行文本正则化筛查，确定所述语音文件对应的前端错误进一步包括：

26、若待筛查文件中正则化处理后的文本为空或正则化处理后的文本大于原始文本，则确定所述语音文件对应的前端错误为文本正则化错误。

27、优选的，所述对所述待筛查文件进行分词筛查，确定所述语音文件对应的前端错误进一步包括：

28、若待筛查文件中分词处理后分词的词性未知或分词的出现次数在设定范围之外，则确定所述语音文件对应的前端错误为分词错误。

29、优选的，所述对所述待筛查文件进行非多音字词筛查，确定所述语音文件对应的前端错误进一步包括：

30、若待筛查文件中多音字词处理后，其中非多音字词的发音不符合非多音字词典的发音标准，则确定所述语音文件对应的前端错误为非多音字词错误。

31、优选的，所述对所述待筛查文件进行多音字词筛查，确定所述语音文件对应的前端错误进一步包括：

32、通过缩小分词词典，对所述待筛查文件中多音字词处理后的多音字词进行再分词处理，得到再分词处理后的再分词；

33、根据所述再分词中多音字的发音，以及所述多音字所属的分词，得到语音文件对应的发音集合；

34、将所述发音集合与标准发音集合进行对比，若所述发音集合与所述标准发音集合不对应，则确定所述语音文件对应的前端错误为多音字词错误，其中所述标准发音集合中包括所述再分词中多音字的标准发音。

35、优选的，所述对所述待筛查文件进行韵律筛查，确定所述语音文件对应的前端错误进一步包括：

36、获取待筛查文件中韵律处理后的字词；

37、统计其中相同的字词，确定相同的字词对应的韵律级别是否均一致，其中所述韵律级别表征字词的停顿时长；

38、若存在不一致则确定所述语音文件对应的前端错误为韵律错误。

39、优选的，所述当全量语音文件对应的后端错误类型中不包含设定错误类型，且前端错误数目小于设定数目时，评价通过进一步包括：

40、当全量语音文件对应的后端错误类型中不包含插入错误和删除错误，且指定类型的前端错误数目小于设定数目时，评价通过。

41、另一方面，本说明书实施例提供了一种语音合成系统的评价装置，所述装置包括：

42、获取模块，用于获取原始文本通过语音合成系统生成的语音文件，以及语音文件生成过程中的日志文件；

43、转化模块，用于将所述语音文件进行转化，得到语音文件对应的识别文本；

44、对比模块，用于对比所述原始文本和所述识别文本，得到所述语音文件对应的后端错误，以及所述后端错误对应的后端错误类型，其中所述后端错误为语音合成错误；

45、文件确定模块，用于将存在后端错误的语音文件对应的日志文件作为待筛查文件；

46、筛查模块，用于对所述待筛查文件进行多维度筛查，确定所述语音文件对应的前端错误，以及所述前端错误对应的前端错误类型和数目，其中所述前端错误为文本处理错误；

47、评价模块，用于当全量语音文件对应的后端错误类型中不包含设定错误类型，且指定类型的前端错误数目小于设定数目时，评价通过。

48、又一方面，本说明书实施例还提供了一种计算机设备，包括存储器、处理器、以及存储在所述存储器上的计算机程序，所述计算机程序被所述处理器运行时，执行上述方法的指令。

49、又一方面，本说明书实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被计算机设备的处理器运行时，执行根据上述方法的指令。

50、又一方面，本说明书实施例还提供了一种计算机程序产品，所述计算机程序产品被计算机设备的处理器运行时，执行上述方法的指令。

51、由以上本说明书实施例提供的技术方案可见，通过对语音文件进行转化得到识别文本，然后对比原始文本和识别文本得到语音文件对应的后端错误，以及后端错误类型，进一步对存在后端错误的语音文件对应的日志文件进行多维度筛查，得到语音文件对应的前端错误，以及前端错误类型和数目，以对语音合成系统进行评价。比起人力测听来说，本说明书实施例的评价方式效率更高，且准确度也更高。

52、为让本说明书的上述和其他目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附图式，作详细说明如下。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王丽萍杨辰雨石文玲
技术所有人：建信金融科技有限责任公司
我是此专利的发明人

上一篇：一种柱上断路器组装工装的制作方法
上一篇：一种分布式电源接入配电网的规划方法及系统与流程