一种基于预训练深度神经网络模型的语音回复方法与流程

文档序号：35102091发布日期：2023-08-10 09:22阅读：43来源：国知局

本发明涉及智能硬件，尤其涉及一种基于预训练深度神经网络模型的语音回复方法和装置、电子设备。

背景技术：

1、由于语音的便捷性，智能语音交互已经成为连接人与智能设备的主要方式。人机对话技术旨在让机器通过与人类的对话交互，以更自然友好的方式帮助用户高效地完成任务，以及与用户进行情感沟通。智能设备能够“听懂”用户的语言，执行相应的指令或者进行合理的回复。

2、人机对话是智能语音交互的重要支撑技术，在对用户的输入进行语音识别和内容理解后，通过人机对话技术管理对话状态、生成合理回复，以实现连续语音智能交互。而如何在人机对话过程中针对用户输入输出精准地回复语句是本领域技术人员研究的重要课题。

技术实现思路

1、本发明实施例的目的是提供一种基于预训练深度神经网络模型的语音回复方法和装置、电子设备，能够解决现有人机对话方案中存在的回复语句不准确的问题。

2、为解决上述技术问题，本发明提供如下技术方案：

3、本发明实施例提供了一种基于预训练深度神经网络模型的语音回复方法，其中，该方法包括：

4、针对一轮与用户语音对话中的每次语音交互，采集用户输入的语音信号并生成语音输入；

5、通过语言处理系统对所述语音输入进行分析得到语音处理结果；

6、采用预先训练的概率神经网络，确定所述语音处理结果命中预设的各语言回复系统的概率；

7、基于各所述概率筛选出目标语言回复系统；

8、采用所述目标语言回复系统生成所述语音处理结果对应的回复语句，并反馈至用户。

9、可选地，所述预设的各语言回复系统包括以下至少之二：

10、基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。

11、可选地，所述概率神经网络通过如下方式训练生成：

12、采用x个参数组成初始概率神经网络；

13、依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对所述初始概率神经网络的组成参数进行调整，直至调整后的x个所述参数满足预设条件停止参数调整操作；

14、采用调整后的x个所述参数组成所述概率神经网络。

15、可选地，依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对所述初始概率神经网络的组成参数进行调整的步骤，包括：依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对所述x个参数中的y个参数进行调整，其中，x大于y。

16、可选地，依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对所述x个参数中的y个参数进行调整的步骤，包括：

17、对所述x个参数中的y个参数进行随机调整，并确定调整后的y个参数的参数变化趋势；

18、采用调整后的x个参数组成中间概率神经网络；

19、确定所述中间概率神经网络对应的第一总评价分；

20、确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势；

21、基于所述参数变化趋势和所述分数变化趋势，确定下一次参数调整时的参数调整趋势。

22、可选地，基于所述参数变化趋势和所述分数变化趋势，确定下一次参数调整时的参数调整趋势的步骤，包括：

23、若所述分数变化趋势为分数上升，则确定下一次参数调整时的参数调整趋势与所述参数变化趋势同向；

24、若所述分数变化趋势为分数下降，则确定下一次参数调整时的参数调整趋势与所述参数变化趋势反向。

25、可选地，所述预设条件包括：所述中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。

26、本发明实施例还提供了一种基于预训练深度神经网络模型的语音回复装置，其中，所述装置包括：

27、采集模块，用于针对一轮与用户语音对话中的每次语音交互，采集用户输入的语音信号并生成语音输入；

28、第一调用模块，用于通过语言处理系统对所述语音输入进行分析得到语音处理结果；

29、第二调用模块，用于采用预先训练的概率神经网络，确定所述语音处理结果命中预设的各语言回复系统的概率；

30、筛选模块，用于基于各所述概率筛选出目标语言回复系统；

31、第三调用模块，用于采用所述目标语言回复系统生成所述语音处理结果对应的回复语句，并反馈至用户。

32、可选地，所述预设的各语言回复系统包括以下至少之二：

33、基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。

34、可选地，所述装置还包括训练模块，用于训练生成概率神经网络，所述装置包括：

35、初始网络构建子模块，用于采用x个参数组成初始概率神经网络；

36、调整子模块，用于依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对所述初始概率神经网络的组成参数进行调整，直至调整后的x个所述参数满足预设条件停止参数调整操作；

37、目标网络生成子模块，用于采用调整后的x个所述参数组成所述概率神经网络。

38、可选地，所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对初始概率神经网络的组成参数进行调整时，具体用于：依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对所述x个参数中的y个参数进行调整，其中，x大于y。

39、可选地，所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势，循环对所述x个参数中的y个参数进行调整时，具体用于：

40、对所述x个参数中的y个参数进行随机调整，并确定调整后的y个参数的参数变化趋势；

41、采用调整后的x个参数组成中间概率神经网络；

42、确定所述中间概率神经网络对应的第一总评价分；

43、确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势；

44、基于所述参数变化趋势和所述分数变化趋势，确定下一次参数调整时的参数调整趋势。

45、可选地，所述调整子模块基于所述参数变化趋势和所述分数变化趋势，确定下一次参数调整时的参数调整趋势时，具体用于：

46、若所述分数变化趋势为分数上升，则确定下一次参数调整时的参数调整趋势与所述参数变化趋势同向；

47、若所述分数变化趋势为分数下降，则确定下一次参数调整时的参数调整趋势与所述参数变化趋势反向。

48、可选地，所述预设条件包括：所述中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。

49、本发明实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现上述任意一种基于预训练深度神经网络模型的语音回复方法的步骤。

50、本发明实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现上述任意一种基于预训练深度神经网络模型的语音回复方法的步骤。

51、本发明实施例提供的基于预训练深度神经网络模型的语音回复方案，针对一轮与用户语音对话中的每次语音交互，采集用户输入的语音信号并生成语音输入；通过语言处理系统对语音输入进行分析得到语音处理结果；采用预先训练的概率神经网络，确定语音处理结果命中预设的各语言回复系统的概率；基于各概率筛选出目标语言回复系统；采用目标语言回复系统生成语音处理结果对应的回复语句，并反馈至用户。通过该基于预训练深度神经网络模型的语音回复方案，采用预先训练的概率神经网络从多个语言回复系统筛选出最优的回复系统来生成回复语句，使得所生成的回复语句更加准确、合理。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴新开李永伟霍向
技术所有人：北京洛必德科技有限公司
我是此专利的发明人

上一篇：一种简易滚笼机与调直机相结合盘绕钢筋笼的方法与流程
上一篇：一种束紧-束紧力维持装置及其使用方法、应用