语音数据转换方法、装置、电子设备及可读存储介质与流程

文档序号:33746173发布日期:2023-04-06 11:43阅读:59来源:国知局
语音数据转换方法、装置、电子设备及可读存储介质与流程

本技术涉及智能机器人,尤其涉及一种语音数据转换方法、装置、电子设备及可读存储介质。


背景技术:

1、语音聊天机器人实现的基础是存储了大量问答对(即,问题和与问题对应的答案文本)的数据库。实际应用中,用户往往是通过语音形式向语音聊天机器人进行询问或者对话。当将要输入的文本中存在生僻字时,用户可能会跳过该生僻字,或者任意读取该生僻字。如此,机器人在接收到该语音数据之后,无法准确识别出该语音数据对应的文本,进而查询到的答案文本准确率也较低,从而导致语音交互准确率较低。


技术实现思路

1、本技术提供了一种语音数据转换方法、装置、电子设备及可读存储介质,以解决现有技术中语音交互准确率较低的问题。

2、第一方面,提供了一种语音数据转换方法,所述方法包括:

3、获取待转换为语音数据的目标文本数据,并基于预设字典确定所述目标文本数据中是否存在生僻字;

4、在确定所述目标文本数据中存在所述生僻字的情况下,对所述生僻字进行拆分,得到所述生僻字对应的至少一个基础部件;

5、基于所有的所述基础部件确定所述生僻字对应的生僻字读音;

6、基于所述生僻字读音将所述目标文本数据转换为语音数据。

7、在一个可能的实施方式中,所述对所述生僻字进行拆分,得到所述生僻字对应的至少一个基础部件,包括:

8、获取所述生僻字对应的字结构信息;

9、基于所述字结构信息对所述生僻字进行拆分,得到至少一个所述基础部件。

10、在一个可能的实施方式中,所述字结构信息包含至少两个子结构信息;

11、所述基于所述字结构信息对所述生僻字进行拆分,得到至少一个所述基础部件,包括:

12、获取每个所述子结构信息对应的优先级;

13、按照所述优先级由高到低的顺序,依次基于每个所述子结构信息对所述生僻字进行拆分,直至拆分得到的每个基础部件均符合预设条件;

14、其中,所述预设条件包括:所述基础部件为不可拆分结构,或者,所述基础部件为所述预设字典中对应的文字。

15、在一个可能的实施方式中,所述基于所有的所述基础部件确定所述生僻字对应的生僻字读音,包括:

16、确定每个所述基础部件的部件读音,并基于所有的所述基础部件的部件读音,生成第一语音查询指令;

17、将所述第一语音查询指令发送至预设的查询设备,以由所述查询设备按照所述第一语音查询指令的指示查询并返回所述生僻字对应的生僻字读音。

18、在一个可能的实施方式中,所述确定每个所述基础部件的部件读音,包括:

19、针对每个基础部件,确定所述预设字典中是否存在所述基础部件对应的文字;

20、在所述预设字典中存在所述基础部件对应的文字的情况下,将所述预设字典中记录的所述文字的读音,确定为所述基础部件对应的部件读音;

21、在所述预设字典中不存在所述基础部件对应的文字的情况下,确定所述基础部件对应的部件笔画序列,将所述部件笔画序列的读音确定为所述基础部件对应的部件读音。

22、在一个可能的实施方式中,所述方法还包括:

23、在确定所述目标文本数据中存在所述生僻字的情况下,确定所述生僻字对应的文字笔画序列;

24、基于所述文字笔画序列的读音,生成第二语音查询指令;

25、将所述第二语音查询指令发送至预设的查询设备,以由所述查询设备按照所述第二语音查询指令的指示查询并返回所述生僻字对应的生僻字读音。

26、在一个可能的实施方式中,所述预设字典包括基础字典和所述基础字典对应的字体转换关系字典,所述基于预设字典确定所述目标文本数据中是否存在生僻字,包括:

27、针对目标文本数据中的每个文字,在所述基础字典中查找所述文字;

28、若在所述基础字典中未查找到所述文字,在所述字体转换关系字典中查找所述文字;

29、若在所述字体转换关系字典中未查找到所述文字,确定所述文字为生僻字。

30、第二方面,提供了一种语音数据转换装置,所述装置包括:

31、获取模块,用于获取待转换为语音数据的目标文本数据,并基于预设字典确定所述目标文本数据中是否存在生僻字;

32、拆分模块,用于在确定所述目标文本数据中存在所述生僻字的情况下,对所述生僻字进行拆分,得到所述生僻字对应的至少一个基础部件;

33、读音确定模块,用于基于所有的所述基础部件确定所述生僻字对应的生僻字读音;

34、转换模块,用于基于所述生僻字读音将所述目标文本数据转换为语音数据。

35、在一个可能的实施方式中,所述拆分模块,具体用于:

36、获取所述生僻字对应的字结构信息;

37、基于所述字结构信息对所述生僻字进行拆分,得到至少一个所述基础部件。

38、在一个可能的实施方式中,所述字结构信息包含至少两个子结构信息;

39、所述拆分模块,还用于:

40、获取每个所述子结构信息对应的优先级;

41、按照所述优先级由高到低的顺序,依次基于每个所述子结构信息对所述生僻字进行拆分,直至拆分得到的每个基础部件均符合预设条件;

42、其中,所述预设条件包括:所述基础部件为不可拆分结构,或者,所述基础部件为所述预设字典中对应的文字。

43、在一个可能的实施方式中,所述读音确定模块,具体用于:

44、确定每个所述基础部件的部件读音,并基于所有的所述基础部件的部件读音,生成第一语音查询指令;

45、将所述第一语音查询指令发送至预设的查询设备,以由所述查询设备按照所述第一语音查询指令的指示查询并返回所述生僻字对应的生僻字读音。

46、在一个可能的实施方式中,所述读音确定模块,还用于:

47、针对每个基础部件,确定所述预设字典中是否存在所述基础部件对应的文字;

48、在所述预设字典中存在所述基础部件对应的文字的情况下,将所述预设字典中记录的所述文字的读音,确定为所述基础部件对应的部件读音;

49、在所述预设字典中不存在所述基础部件对应的文字的情况下,确定所述基础部件对应的部件笔画序列,将所述部件笔画序列的读音确定为所述基础部件对应的部件读音。

50、在一个可能的实施方式中,所述装置还包括:

51、序列确定模块,用于在确定所述目标文本数据中存在所述生僻字的情况下,确定所述生僻字对应的文字笔画序列;

52、生成模块,用于基于所述文字笔画序列的读音,生成第二语音查询指令;

53、发送模块,用于将所述第二语音查询指令发送至预设的查询设备,以由所述查询设备按照所述第二语音查询指令的指示查询并返回所述生僻字对应的生僻字读音。

54、在一个可能的实施方式中,所述获取模块,具体用于:

55、针对目标文本数据中的每个文字,在所述基础字典中查找所述文字;

56、若在所述基础字典中未查找到所述文字,在所述字体转换关系字典中查找所述文字;

57、若在所述字体转换关系字典中未查找到所述文字,确定所述文字为生僻字。

58、第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

59、存储器,用于存放计算机程序;

60、处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。

61、第四方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。

62、第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的语音数据转换方法。

63、本技术实施例有益效果:

64、本技术实施例提供了一种语音数据转换方法、装置、电子设备及可读存储介质,本技术实施例中,首先,获取待转换为语音数据的目标文本数据,并基于预设字典确定所述目标文本数据中是否存在生僻字,在确定所述目标文本数据中存在所述生僻字的情况下,对所述生僻字进行拆分,得到所述生僻字对应的至少一个基础部件,然后,基于所有的所述基础部件确定所述生僻字对应的生僻字读音,最后,基于所述生僻字读音将所述目标文本数据转换为语音数据。本技术在确定文本存在生僻字之后,将生僻字拆分成多个基础部件,再以拆分得到的基础部件生成该生僻字对应的读音,如此将该读音反馈至用户,使得用户能够通过以基础部件的读音的方式,使得将语音数据输入给机器人时,机器人能够自动解码该语音数据,转换成对应的语音文本,并查询到准确地答复文本,提高语音交互的准确率。

65、当然,实施本技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1