一种终端设备及多轮对话交互方法与流程

文档序号:43206622发布日期:2025-09-30 18:07阅读:32来源:国知局

本技术涉及自然语言处理,尤其涉及一种终端设备及多轮对话交互方法。


背景技术:

1、随着人工智能技术的不断进步,基于语音交互的多轮对话系统现已广泛应用于智能电视、手机及车载设备等多样化终端产品中。在多轮交互的情境中,用户与系统的对话常涉及指代或省略的情况,这就要求系统能结合上文或场景信息来准确理解当前对话。此时,多轮改写技术显得尤为重要,它通过指代消解和省略补全两大机制,有效消除了因指代和省略而引发的语义歧义。

2、在传统的处理架构中,常见的做法是先将用户输入的信息输入多轮改写模型中,输出完整表述,即改写文本,随后再基于改写文本进行意图分发和解析。但在实际交互过程中,尤其是开放域场景下,存在很多需要依赖上下文理解,但却无法改写的句子,即多轮改写模块难以对该类句子的说法进行有效替换,则会导致直接对无法改写的句子进行意图分发和解析,从而导致下游的意图分发和定位出现偏差,进而引发解析错误,最终影响用户的多轮交互体验。


技术实现思路

1、本技术一些实施例提供了一种终端设备及多轮对话交互方法,使用多轮理解模型同步处理多轮改写和意图分发,在结合历史对话信息进行多轮改写的同时,同步输出意图定位信息,尤其对于无法进行改写的句子,可有效提升多轮的意图定位准确率,为用户提供更加自然流畅的交互体验。

2、第一方面,本技术一些实施例中提供一种终端设备,包括:

3、显示器;被配置为显示用户界面;

4、控制器,与显示器耦接,且被配置为:

5、接收用户输入的输入信息;

6、在存在历史对话信息的情况下,将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据,语义数据用于表征与输入信息对应的用户意图;

7、在改写状态为无法改写的情况下,将输入信息和历史对话信息分发给语义数据对应的业务;

8、在改写状态为需要改写的情况下,将改写文本分发给语义数据对应的业务;

9、在改写状态为无需改写的情况下,将输入信息分发给语义数据对应的业务。

10、上述技术方案具有如下优点或有益效果:使用多轮理解模型同步处理多轮改写和意图分发,在结合历史对话信息进行多轮改写的同时,同步输出意图定位信息,尤其对于无法进行改写的句子,可有效提升多轮的意图定位准确率,为用户提供更加自然流畅的交互体验。

11、在一些实施例中,控制器执行将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据,被进一步配置为:

12、获取上轮对话对应的业务;

13、在上轮对话对应的业务不是目标业务的情况下,将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据,目标业务包括可以识别输入信息和历史对话信息是否属于自身业务能力范围的业务。

14、上述技术方案具有如下优点或有益效果:先判断上轮业务是否为目标业务,只有在上轮业务不是目标业务的情况下将输入信息和历史对话信息输入多轮理解模型中。通过判断上轮业务是否是目标业务的方式进行初步分流,减轻后续大模型负载压力。

15、在一些实施例中,控制器执行获取上轮对话对应的业务之后,还被配置为:

16、在上轮对话对应的业务是目标业务的情况下,将输入信息和历史对话信息发送至目标业务;

17、在接收到目标业务发送的失败消息的情况下,将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据,失败消息是目标业务在识别出输入信息和历史对话信息不属于自身业务能力范围发送的。

18、上述技术方案具有如下优点或有益效果:在上轮定位为目标业务后,本轮可优先分发至目标业务,可以将属于目标业务的输入信息快速分发给目标业务,避免该输入信息输入多轮理解大模型中。且在输入信息不属于目标业务的情况下,也可以继续进行多轮理解。通过判断上轮业务是否是目标业务的方式进行初步分流,减轻后续大模型负载压力。

19、在一些实施例中,控制器执行将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据,被进一步配置为:

20、将输入信息和历史对话信息输入到多轮判别模型中,得到多轮判别结果;

21、在多轮判别结果为需要多轮理解的情况下,将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据。

22、上述技术方案具有如下优点或有益效果:通过多轮判别模型对输入信息和历史对话信息是否需要多轮理解进行判断,可以利用小尺寸模型进行初步分流,简单无上下文影响的请求快出,减轻后续大模型负载压力。

23、在一些实施例中,控制器执行将输入信息和历史对话信息输入到多轮判别模型中,得到多轮判别结果,被进一步配置为:

24、获取标签白名单,标签白名单包括需要多轮理解的标签词;

25、如果输入信息和历史对话信息与标签白名单中的标签词不匹配,获取输入信息的文本长度;

26、如果文本长度小于预设长度,则获取标签黑名单,标签黑名单包括不需要多轮理解的标签词;

27、如果输入信息和历史对话信息与标签黑名单中的标签词不匹配,获取业务黑名单和业务白名单,业务黑名单包括不需要多轮理解的业务。业务白名单包括需要多轮理解的业务;

28、如果输入信息和历史对话信息与业务黑名单不匹配,且与业务白名单也不匹配,将输入信息和历史对话信息输入到多轮判别模型中,得到多轮判别结果。

29、上述技术方案具有如下优点或有益效果:通过标签黑白名单、文本长度以及业务黑白名单等规则对输入信息和历史对话信息是否需要多轮理解进行判断,可以利用规则判别进行初步分流,简单无上下文影响的请求快出,减轻后续大模型负载压力。

30、在一些实施例中,控制器执行获取标签白名单之前,还被配置为:

31、获取历史对话信息中的语义数据;

32、在历史对话信息中存在多个相同语义数据的情况下,只保留与语义数据对应最新一轮的对话信息。

33、上述技术方案具有如下优点或有益效果:通过去除多余相同意图对应的对话信息,可以有效缩短历史对话信息的长度,有助于快速对输入信息和历史对话信息进行理解,从而提升信息反馈速度。

34、在一些实施例中,控制器执行获取标签白名单之前,还被配置为:

35、获取输入信息对应的语义数据黑名单,语义数据黑名单包括互斥语义数据,互斥语义数据用于表征与输入信息对应的用户意图互斥的意图;

36、在历史对话信息中历史轮次信息对应的语义数据在语义数据黑名单中的情况下,删除历史轮次信息。

37、上述技术方案具有如下优点或有益效果:通过去除与输入信息互斥意图对应的历史轮次信息,可以去除无效信息并缩短历史对话信息的长度,有助于快速对输入信息和历史对话信息进行理解,从而提升信息反馈速度。

38、在一些实施例中,控制器执行获取需要多轮理解的白名单之前,还被配置为:

39、控制器执行获取标签白名单之前,还被配置为:

40、获取历史对话信息中的历史场景信息,历史场景信息包括至少一种类别信息;

41、在历史场景信息中存在多个相同类别信息的情况下,只保留与类别对应最新一轮的信息。

42、上述技术方案具有如下优点或有益效果:通过去除多余相同类别对应的信息,可以有效缩短历史对话信息的长度,有助于快速对输入信息和历史对话信息进行理解,从而提升信息反馈速度。

43、在一些实施例中,实体标识与实体文本对应,在改写状态为需要改写且改写文本包括实体标识的情况下,控制器还被配置为:

44、如果实体标识对应的实体文本不在改写文本中,则将改写文本中的实体文本替换为实体标识对应的实体文本;

45、如果实体标识对应的实体文本在改写文本中,则不将改写文本中的实体文本替换为实体标识对应的实体文本。

46、上述技术方案具有如下优点或有益效果:在输出改写文本时实体标识不会出现错误,而实体文本可能会发生错误,因此,可通过实体标识对应的实体文本对改写文本进行校验,从而提成改写文本的正确性。

47、第二方面,本技术一些实施例中提供一种多轮对话交互方法,包括:

48、接收用户输入的输入信息;

49、在存在历史对话信息的情况下,将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据,语义数据用于表征与输入信息对应的用户意图;

50、在改写状态为无法改写的情况下,将输入信息和历史对话信息分发给语义数据对应的业务;

51、在改写状态为需要改写的情况下,将改写文本分发给语义数据对应的业务;

52、在改写状态为无需改写的情况下,将输入信息分发给语义数据对应的业务。

53、上述技术方案具有如下优点或有益效果:使用多轮理解模型同步处理多轮改写和意图分发,在结合历史对话信息进行多轮改写的同时,同步输出意图定位信息,尤其对于无法进行改写的句子,可有效提升多轮的意图定位准确率,为用户提供更加自然流畅的交互体验。

54、本技术实施例提供的技术方案中,在接收用户输入的输入信息后,可将输入信息和历史对话信息输入多轮理解模型中,得到改写文本、改写状态和语义数据。在改写状态为无法改写的情况下,将输入信息和历史对话信息分发给语义数据对应的业务;在改写状态为需要改写的情况下,将改写文本分发给语义数据对应的业务;在改写状态为无需改写的情况下,将输入信息分发给语义数据对应的业务。本技术使用多轮理解模型同步处理多轮改写和意图分发,在结合历史对话信息进行多轮改写的同时,同步输出意图定位信息,尤其对于无法进行改写的句子,可有效提升多轮的意图定位准确率,为用户提供更加自然流畅的交互体验。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1