本发明涉及智能交互,尤其涉及一种语音纠错方法、装置、设备及存储介质。
背景技术:
1、随着科学技术的发展和社会的进步,智能交互越来越普及,而在智能交互普及的过程中,与之关系密切的语音识别技术(asr)也逐渐走进人们的工作和生活中。在智能交互场景中往往会使用到语音识别技术,然而语音识别存在一定的错误识别几率。在中文应用场景下,最常见的语音识别错误为拼音错误,目前对中文拼音的纠错方式是直接识别语音信息的拼音组成,然后计算该拼音的纠错编辑距离,根据纠错编辑距离直接对该语音信息进行纠错,现有的拼音纠错方式的纠错编辑距离较长,导致纠错效率低以及纠错时间长的问题。
2、上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本发明的主要目的在于提供一种语音纠错方法、装置、设备及存储介质,旨在解决现有技术语音纠错效率低以及纠错时间长的技术问题。
2、为实现上述目的,本发明提供了一种语音纠错方法,所述方法包括以下步骤:
3、在检测到语音信息存在错误时,确定所述语音信息中的待纠错字符;
4、获取所述待纠错字符对应的待纠错音节;
5、根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素;
6、将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息。
7、可选地,所述根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素,包括:
8、根据预设替换策略对所述待纠错音节中的各音素进行音素匹配;
9、根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素。
10、可选地,所述根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素,包括:
11、在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素;
12、根据预设替换映射表确定所述待替换音素对应的目标音素。
13、可选地,所述在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素,包括:
14、在音素匹配成功时,根据匹配结果确定所述待纠错音节对应的音素组成类型;
15、根据所述音素组成类型确定所述待纠错音节中的待替换音素。
16、可选地,所述根据预设替换策略对所述待纠错音节中的各音素进行音素匹配之后,所述方法还包括:
17、在音素匹配失败时,确定所述待纠错音节对应的音素组成类型;
18、根据所述音素组成类型判断所述待纠错音节中是否存在需要删除的音素;
19、若存在,则删除所述需要删除的音素,获得修改后的音节。
20、可选地,所述若存在,则删除所述需要删除的音素,获得修改后的音节之后,所述方法包括:
21、根据所述音素组成类型确定所述修改后的音节中的待替换音素以及所述待替换音素对应的目标音素。
22、可选地,所述根据所述音素组成类型确定所述修改后的音节中的待替换音素以及所述待替换音素对应的目标音素,包括:
23、根据所述音素组成类型确定所述修改后的音节中的待替换音素;
24、根据预设替换映射表确定所述待替换音素对应的目标音素。
25、可选地,所述根据所述音素组成类型判断所述待纠错音节中是否存在需要删除的音素之后,所述方法还包括:
26、若不存在,则根据所述音素组成类型确定所待纠错音节中的待替换音素;
27、根据所述预设替换映射表确定所述待替换音素对应的目标音素。
28、可选地,所述将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息,包括:
29、将所述待替换音素替换为所述目标音素,获得目标音节;
30、根据预设纠错策略对所述目标音节进行纠错,并将纠错后的音节转换为对应的目标字符;
31、将待纠错字符替换为所述目标字符,获得纠错后的语音信息。
32、可选地,所述根据预设纠错策略对所述目标音节进行纠错,并将纠错后的音节转换为对应的目标字符,包括:
33、根据预设纠错策略确定所述目标音节的纠错编辑距离;
34、根据所述纠错编辑距离对所述目标音节进行纠错;
35、将纠错后的音节转换为对应的目标字符。
36、可选地,所述根据预设纠错策略确定所述目标音节的纠错编辑距离之后,所述方法包括:
37、获取标准纠错策略,根据所述标准纠错策略确定所述目标音节的标准编辑距离;
38、在所述纠错编辑距离未超过所述标准编辑距离时,执行所述根据所述纠错编辑距离对所述目标音节进行纠错的步骤。
39、可选地,所述获取标准纠错策略,根据所述标准纠错策略确定所述目标音节的标准编辑距离之后,所述方法还包括:
40、在所述纠错编辑距离超过所述标准编辑距离时,根据所述标准编辑距离对所述目标音节进行纠错;
41、执行所述将纠错后的音节转换为对应的目标字符的步骤。
42、此外,为实现上述目的,本发明还提出一种语音纠错装置,所述语音纠错装置包括:
43、音节获取模块,用于获取所述待纠错字符对应的待纠错音节;
44、替换策略模块,用于根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素;
45、替换纠错模块,用于将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息。
46、进一步地,所述替换纠错模块,还用于根据预设替换策略对所述待纠错音节中的各音素进行音素匹配,根据音素匹配结果确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素。
47、进一步地,所述替换纠错模块,还用于在音素匹配成功时,根据音素匹配结果确定所述待纠错音节中的待替换音素,根据预设替换映射表确定所述待替换音素对应的目标音素。
48、进一步地,所述替换纠错模块,还用于在音素匹配成功时,根据匹配结果确定所述待纠错音节对应的音素组成类型,根据所述音素组成类型确定所述待纠错音节中的待替换音素。
49、进一步地,所述替换纠错模块,还用于将所述待替换音素替换为所述目标音素,获得目标音节,根据预设纠错策略对所述目标音节进行纠错,并将纠错后的音节转换为对应的目标字符,将待纠错字符替换为所述目标字符,获得纠错后的语音信息。
50、进一步地,所述替换纠错模块,还用于根据预设纠错策略确定所述目标音节的纠错编辑距离,根据所述纠错编辑距离对所述目标音节进行纠错,将纠错后的音节转换为对应的目标字符。
51、此外,为实现上述目的,本发明还提出一种语音纠错设备,所述语音纠错设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音纠错程序,所述语音纠错程序配置为实现如上文所述的语音纠错方法的步骤。
52、此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有语音纠错程序,所述语音纠错程序被处理器执行时实现如上文所述的语音纠错方法的步骤。
53、本发明通过在检测到语音信息存在错误时,确定所述语音信息中的待纠错字符,获取所述待纠错字符对应的待纠错音节,根据预设替换策略确定所述待纠错音节中的待替换音素以及所述待替换音素对应的目标音素,将所述待替换音素替换为所述目标音素,获得目标音节,并根据所述目标音节对所述待纠错字符进行纠错,获得纠错后的语音信息。由于本发明通过确定语音信息中的待纠错音节,根据预设替换策略确定待纠错音节中的待替换音素以及待替换音素对应的目标音素,然后根据对待替换音素进行替换,实现了对语音信息中错误字符的待纠错音节进行纠错,从而使语音信息的错误得到快速修正,提升了语音纠错效率。