意图识别方法及装置、模型训练方法及装置与流程

文档序号:37295623发布日期:2024-03-13 20:43阅读:12来源:国知局
意图识别方法及装置、模型训练方法及装置与流程

本技术实施例涉及人工智能,尤其涉及一种意图识别方法及装置、模型训练方法及装置。


背景技术:

1、问答系统(question answering system,qa)在生活中被应用广泛,如,语音助手、搜索引擎或搜索系统等。问答系统通过自动处理输入的信息,识别该信息的意图,从而使设备作出相应的反映,满足人们快速、准确地获取信息,或者使设备执行相关命令的需求。然而,在问答系统中,如何进行准确的意图识别依然是目前技术的难点和痛点之一。

2、因此,如何提高意图识别的准确率,更加精确定位用户的意图,是目前亟待解决的技术问题。


技术实现思路

1、为了解决上述技术问题,本技术提供一种意图识别方法及装置。在该方法中,支持对文本中自定义算子的识别,以提高意图识别的准确率,以更加精准地识别用户的意图。

2、在一种可能的实施方式中,本技术提供一种意图识别方法。该方法包括:基于算子识别模型,识别待处理文本中的至少一个第一算子;其中,所述至少一个第一算子用于指示所述待处理文本中第一槽位与第一槽位值之间的逻辑关系,和/或,所述待处理文本中至少两个第二槽位之间的逻辑关系;其中,所述至少一个第一算子包括第一自定义算子;其中,所述算子识别模型为基于第一训练语料训练收敛后的模型,其中,所述第一训练语料的标注数据包括第二自定义算子的用户标注信息;其中,所述第二自定义算子包括所述第一自定义算子;基于至少一个所述第一算子,识别与所述待处理文本匹配的用户意图。

3、示例性的,第一槽位与第二槽位可以相同或不同,本技术对此不做限制。

4、示例性的,自定义算子可包括但不限于槽位与槽位之间的重名算子、槽位与槽值之间的范围算子等。

5、示例性的,自定义算子为用户自定义的算子,不伦是否为自定义的算子,本技术的算子,均可以以用于表示槽位与槽位值之间的逻辑关系,和/或,至少两个槽位之间的逻辑关系。

6、示例性的,在问答系统中,槽位和槽值之间的潜在逻辑具有种类繁多、自由度较高的特点,在不同的任务型对话场景下用户不仅需要常用的逻辑算子(例如大于算子、小于算子、等于算子等),在很多场景下还会使用特定的自定义算子,来进行任务型对话。本技术的方法可通过算子识别模型,来支持识别文本中的自定义算子,从而可利于识别到的自定义算子来提高意图识别的准确率,以更加精准地识别用户的意图。此外,算子识别模型支持识别的逻辑算子可经训练而确定,那么通过扩展训练语料对应的逻辑算子,从而可使本技术的方法支持对可识别的自定义算子的扩展,对于算子的识别更加灵活。

7、在一种可能的实施方式中,所述第二自定义算子的用户标注信息包括:第一标注信息和第二标注信息,以及第一标注信息与第二标注信息之间的第一逻辑关系;其中,所述第一标注信息为第三槽位且所述第二标注信息为第三槽位值,或者,所述第一标注信息为第四槽位且所述第二标注信息为第五槽位。

8、示例性的,该方法在对算子识别模型进行训练时,可基于用户输入来生成对训练语料的标注数据,该标注数据可包括槽位及槽位值,以及槽位与槽位值之间的逻辑关系,和/或,至少两个槽位以及该至少两个槽位之间的逻辑关系。

9、例如,在图2c中,语料的标注数据可包括:作为槽位的“菜系”,作为该槽位的槽位值的“日式”,以及“菜系”与“日式”之间的逻辑关系(这里为“不等于”)。

10、在本技术实施例中,可支持用户对训练语料标注自定义算子。

11、在一种可能的实施方式中,所述用户标注信息为基于所述第二自定义算子的第一配置信息,而标注的信息;所述第一配置信息包括所述第二自定义算子的第一标识信息和第一逻辑结构;其中,所述第一标识信息用于标识所述第二自定义算子所指示的逻辑关系;其中,所述第一逻辑结构包括相互对应的至少一个第一对象和至少一个第二对象;其中,所述第一对象为槽位对象且所述第二对象为槽位值对象;和/或,所述第一对象和所述第二对象均为槽位对象。

12、示例性的,如图2a所示,“范围”算子为第二自定义算子,其第一配置信息可包括算子的标识信息:“范围”,还可包括该算子的逻辑结构。例如该“范围”算子的逻辑结构包括作为槽位对象的“槽位1”以及作为相应槽位值对象的“槽值1”以及“槽值2”。当然在其他示例中,例如第二自定义算子包括“重名”算子,则其第一配置信息可包括算子的标识信息:“重名”,还可包括该算子的逻辑结构。例如该“重名”算子的逻辑结构包括两个槽位对象,分别为“槽位2”和“槽位3”。

13、示例性的,逻辑结构可用于表示槽位与槽位值之间的对应关系,或槽位与槽位之间的对应关系。

14、在本技术实施例中,该方法支持用户配置自定义算子的标识及逻辑结构,以实现支持用户来在配置自定义逻辑算子;以及通过自定义算子的标识和逻辑结构,可指导用户输入对训练语料标注的槽位和/或槽值,及其对应的逻辑关系,可实现对自定义算子的标注指导。

15、在一种可能的实施方式中,所述第一配置信息为在接收到所述用户标注信息之前接收到的用户输入信息。

16、在本技术实施例中,在用户对训练语料标注自定义算子时,可使用户按照该自定义算子的配置信息,来输入对训练语料需要标注的关于第二自定义算子的槽位和槽值,或,槽位和槽位之间的逻辑关系,其中,可标注槽位和/或槽值,能够通过自定义算子的配置信息,来指导用户输入标注数据。

17、在一种可能的实施方式中,所述识别待处理文本中的至少一个第一算子之后,所述方法还包括:输出所述至少一个第一算子中每个所述第一算子对应的第二标识信息和第二逻辑结构;其中,所述第二逻辑结构包括:相互对应的所述第一槽位与所述第一槽位值,或,相互对应的所述至少两个第二槽位。

18、示例性的,第二标识信息与第一标识信息的定义类似,这里不再赘述。

19、在本技术实施例中,可输出对算子的识别结果,以便于用户了解算子的识别是否准确。

20、在一种可能的实施方式中,所述输出所述至少一个第一算子中每个所述第一算子对应的第二标识信息和第二逻辑结构之后,所述方法还包括:接收用户输入的对所述至少一个第一算子中第二算子的目标更新信息;其中,所述目标更新信息包括与所述第二算子对应的第二标识信息的第一更新信息,和/或,与所述第二算子对应的第二逻辑结构内相应槽位和/或相应槽位值的第二更新信息;将所述待处理文本作为第二训练语料,输入至所述算子识别模型进行模型训练;其中,所述第二训练语料的标注数据包括:基于所述目标更新信息更新后的第二算子的信息(标识信息和逻辑结构)。

21、在本技术实施例中,在输出对算子的识别结果后,用户可在确定识别结果发生错误的情况下,对识别到的逻辑算子进行纠错,具体可纠错算子中的槽位和/或槽位值,也可以通过纠错算子的标识的方式来纠正算子(例如文本中的准确算子为大于算子,但是识别为小于算子,则用户对该小于算子纠正为大于算子)。并利用纠错后的算子的更新后的标识及逻辑结构作为自动标注数据,来将上述文本作为语料来优化算子识别模型,不仅可达到优化算子识别模型的效果,还支持交互式的修改算子的识别结果,使得对话效果和用户配置形成一个正向反馈,提升对话效果。

22、在一种可能的实施方式中,所述输出所述至少一个第一算子中每个所述第一算子对应的第二标识信息和第二逻辑结构之后,所述方法还包括:接收用户输入的与第三算子对应的用户标注信息;其中,所述第三算子与所述第一算子不同,其中,所述第三算子包括预设算子或自定义算子;将所述待处理文本作为第三训练语料,输入至所述算子识别模型进行模型训练;其中,所述第三训练语料的标注数据包括:与第三算子对应的用户标注信息。

23、示例性的,本实施方式的第三那算子对应的用户标注数据,与上述实施方式汇总的第二自定义算子的用户标注数据的实现原理类似,也是包括标注的槽位和槽位值以及它们之间的逻辑关系;或者,包括标注的多个槽位以及它们之间的逻辑关系,这里不再赘述。

24、在本技术实施例中,在用户浏览对算子的识别结果后,如果确定待处理文本中还包括未识别到的算子,则用户可对未识别到的算子(这里命名为第三算子)进行标注,以生成第三算子的用户标注数据,其中,第三算子可以是预设算子,也可以是自定义算子。用户对该第三算子的标注过程,与用户对上述第二自定义算子的标注过程类似,这里不再赘述。这样,可对待处理文本中未识别的算子进行标注,以优化算子识别模型,提升算子识别的准确率。

25、在一种可能的实施方式中,所述第一训练语料的标注数据包括预设算子的第三标注信息;其中,所述第三标注信息为基于所述算子识别模型,对所述第一训练语料识别到的所述预设算子而生成的标注信息。

26、在本技术实施例中,该方法可对训练语料自动标注预设算子(例如上文描述的常用的逻辑算子),从而提升对训练语料的算子的标注效率。

27、在一种可能的实施方式中,本技术提供一种模型训练方法。该方法包括:获取第一训练语料;获取与所述第一训练语料对应的至少一个第一算子的标注数据;其中,所述第一算子包括第一自定义算子,所述标注数据包括第一自定义算子的用户标注信息;其中,所述第一自定义算子用于指示至少一个第一对象和至少一个第二对象之间的逻辑关系;其中,所述第一对象为槽位对象且所述第二对象为槽位值对象;和/或,所述第一对象和所述第二对象均为槽位对象;根据所述第一训练语料以及所述至少一个第一算子的标注数据,对预设算子识别模型进行训练,训练后收敛的目标算子识别模型用于识别所述至少一个第一算子。

28、在本技术实施例中,可支持对自定义算子的算子识别模型的训练。本实施方式中与上述意图识别方法中的类似描述,可参考上述意图识别方法的相应实施方式的实现和效果,这里不再赘述。

29、在一种可能的实施方式中,所述第一自定义算子的用户标注信息包括:第一标注信息和第二标注信息,以及第一标注信息与第二标注信息之间的第一逻辑关系;其中,所述第一标注信息为第一槽位且所述第二标注信息为第一槽位值,或者,所述第一标注信息为第二槽位且所述第二标注信息为第三槽位。

30、在一种可能的实施方式中,所述方法还包括:获取所述第一自定义算子的第一配置信息;所述第一配置信息包括所述第一自定义算子的第一标识信息和第一逻辑结构;其中,所述第一标识信息用于标识所述第一自定义算子所指示的逻辑关系;其中,所述第一逻辑结构包括相互对应的所述至少一个第一对象和所述至少一个第二对象;输出所述第一配置信息;所述获取与所述第一训练语料对应的至少一个第一算子的标注数据,包括:接收用户输入的,与所述第一配置信息匹配的所述第一自定义算子的用户标注信息。

31、示例性的,所述用户标注信息为与所述第一配置信息匹配的标注信息。

32、在一种可能的实施方式中,所述获取所述第一自定义算子的第一配置信息,包括:接收用户输入的所述第一自定义算子的第一配置信息。

33、在一种可能的实施方式中,所述第一算子还包括预设算子,所述标注数据还包括所述预设算子的第三标注信息;所述获取与所述第一训练语料对应的至少一个第一算子的标注数据,包括:基于所述预设算子识别模型,识别所述第一训练语料中的预设算子;其中,所述预设算子具有标识信息和逻辑结构;基于所述预设算子,生成所述第三标注信息;其中,所述预设算子识别模型用于识别所述预设算子。

34、在一种可能的实施方式中,所述根据所述第一训练语料以及所述至少一个第一算子的标注数据,对预设算子识别模型进行训练之前,所述方法还包括:按照所述至少一个第一算子各自对应的标识信息和逻辑结构,输出每个所述第一算子的标注数据。

35、在一种可能的实施方式中,所述按照所述至少一个第一算子各自对应的标识信息和逻辑结构,输出每个所述第一算子的标注数据之后,所述根据所述第一训练语料以及所述至少一个第一算子的标注数据,对预设算子识别模型进行训练之前,所述方法还包括:接收用户输入的对所述至少一个第一算子中第二算子的目标更新信息;其中,所述目标更新信息包括与所述第二算子对应的标识信息的第一更新信息,和/或,与所述第二算子对应的逻辑结构内相应槽位和/或相应槽位值的第二更新信息;基于所述目标更新信息,更新所述第二算子的标注数据。

36、各个实施方式的模型训练方法的效果,与上述各实施方式的意图识别方法的效果类似,这里不再赘述。

37、在一种可能的实施方式中,本技术提供一种意图识别装置。该装置包括:第一识别模块,用于基于算子识别模型,识别待处理文本中的至少一个第一算子;其中,所述至少一个第一算子用于指示所述待处理文本中第一槽位与第一槽位值之间的逻辑关系,和/或,所述待处理文本中至少两个第二槽位之间的逻辑关系;其中,所述至少一个第一算子包括第一自定义算子;其中,所述算子识别模型为基于第一训练语料训练收敛后的模型,其中,所述第一训练语料的标注数据包括第二自定义算子的用户标注信息;其中,所述第二自定义算子包括所述第一自定义算子;第二识别模块,用于基于至少一个所述第一算子,识别与所述待处理文本匹配的用户意图。

38、在一种可能的实施方式中,所述第二自定义算子的用户标注信息包括:第一标注信息和第二标注信息,以及第一标注信息与第二标注信息之间的第一逻辑关系;其中,所述第一标注信息为第三槽位且所述第二标注信息为第三槽位值,或者,所述第一标注信息为第四槽位且所述第二标注信息为第五槽位。

39、在一种可能的实施方式中,所述用户标注信息为基于所述第二自定义算子的第一配置信息,而标注的信息;所述第一配置信息包括所述第二自定义算子的第一标识信息和第一逻辑结构;其中,所述第一标识信息用于标识所述第二自定义算子所指示的逻辑关系;其中,所述第一逻辑结构包括相互对应的至少一个第一对象和至少一个第二对象;其中,所述第一对象为槽位对象且所述第二对象为槽位值对象;和/或,所述第一对象和所述第二对象均为槽位对象。

40、在一种可能的实施方式中,所述第一配置信息为在接收到所述用户标注信息之前接收到的用户输入信息。

41、在一种可能的实施方式中,所述装置还包括:输出模块,用于输出所述至少一个第一算子中每个所述第一算子对应的第二标识信息和第二逻辑结构;其中,所述第二逻辑结构包括:相互对应的所述第一槽位与所述第一槽位值,或,相互对应的所述至少两个第二槽位。

42、在一种可能的实施方式中,所述装置还包括:第一接收模块,用于接收用户输入的对所述至少一个第一算子中第二算子的目标更新信息;其中,所述目标更新信息包括与所述第二算子对应的第二标识信息的第一更新信息,和/或,与所述第二算子对应的第二逻辑结构内相应槽位和/或相应槽位值的第二更新信息;第一输入模块,用于将所述待处理文本作为第二训练语料,输入至所述算子识别模型进行模型训练;其中,所述第二训练语料的标注数据包括:基于所述目标更新信息更新后的第二算子的信息。

43、在一种可能的实施方式中,所述装置还包括:第二接收模块,用于接收用户输入的与第三算子对应的用户标注信息;其中,所述第三算子与所述第一算子不同,其中,所述第三算子包括预设算子或自定义算子;第二输入模块,用于将所述待处理文本作为第三训练语料,输入至所述算子识别模型进行模型训练;其中,所述第三训练语料的标注数据包括:与第三算子对应的用户标注信息。

44、在一种可能的实施方式中,所述第一训练语料的标注数据包括预设算子的第三标注信息;其中,所述第三标注信息为基于所述算子识别模型,对所述第一训练语料识别到的所述预设算子而生成的标注信息。

45、上述各实施方式的意图识别装置的效果,与上述各实施方式的意图识别方法的效果类似,这里不再赘述。

46、在一种可能的实施方式中,本技术提供一种模型训练装置。该装置包括:第一获取模块,用于获取第一训练语料;第二获取模块,用于获取与所述第一训练语料对应的至少一个第一算子的标注数据;其中,所述第一算子包括第一自定义算子,所述标注数据包括第一自定义算子的用户标注信息;其中,所述第一自定义算子用于指示至少一个第一对象和至少一个第二对象之间的逻辑关系;其中,所述第一对象为槽位对象且所述第二对象为槽位值对象;和/或,所述第一对象和所述第二对象均为槽位对象;训练模块,用于根据所述第一训练语料以及所述至少一个第一算子的标注数据,对预设算子识别模型进行训练,训练后收敛的目标算子识别模型用于识别所述至少一个第一算子。

47、在一种可能的实施方式中,所述第一自定义算子的用户标注信息包括:第一标注信息和第二标注信息,以及第一标注信息与第二标注信息之间的第一逻辑关系;其中,所述第一标注信息为第一槽位且所述第二标注信息为第一槽位值,或者,所述第一标注信息为第二槽位且所述第二标注信息为第三槽位。

48、在一种可能的实施方式中,所述装置还包括:第三获取模块,用于获取所述第一自定义算子的第一配置信息;所述第一配置信息包括所述第一自定义算子的第一标识信息和第一逻辑结构;其中,所述第一标识信息用于标识所述第一自定义算子所指示的逻辑关系;其中,所述第一逻辑结构包括相互对应的所述至少一个第一对象和所述至少一个第二对象;第一输出模块,用于输出所述第一配置信息;所述第二获取模块,具体用于接收用户输入的,与所述第一配置信息匹配的所述第一自定义算子的用户标注信息。

49、在一种可能的实施方式中,所述第三获取模块具体用于,接收用户输入的所述第一自定义算子的第一配置信息。

50、在一种可能的实施方式中,所述第一算子还包括预设算子,所述标注数据还包括所述预设算子的第三标注信息;所述第二获取模块,具体用于基于所述预设算子识别模型,识别所述第一训练语料中的预设算子;其中,所述预设算子具有标识信息和逻辑结构;基于所述预设算子,生成所述第三标注信息;其中,所述预设算子识别模型用于识别所述预设算子。

51、在一种可能的实施方式中,所述装置还包括:第二输出模块,用于按照所述至少一个第一算子各自对应的标识信息和逻辑结构,输出每个所述第一算子的标注数据。

52、在一种可能的实施方式中,所述装置还包括:接收模块,用于接收用户输入的对所述至少一个第一算子中第二算子的目标更新信息;其中,所述目标更新信息包括与所述第二算子对应的标识信息的第一更新信息,和/或,与所述第二算子对应的逻辑结构内相应槽位和/或相应槽位值的第二更新信息;更新模块,用于基于所述目标更新信息,更新所述第二算子的标注数据。

53、在一种可能的实施方式中,本技术提供一种意图识别装置。意图识别装置包括一个或多个接口电路和一个或多个处理器;所述接口电路用于从存储器接收信号,并向所述处理器发送所述信号,所述信号包括存储器中存储的计算机指令;当所述处理器执行所述计算机指令时,所述处理器可实现上述任意一种实施方式中的意图识别方法。

54、本实施方式的意图识别装置的效果,与上述各实施方式的意图识别方法的效果类似,这里不再赘述。

55、在一种可能的实施方式中,本技术提供一种模型训练装置。模型训练装置包括一个或多个接口电路和一个或多个处理器;所述接口电路用于从存储器接收信号,并向所述处理器发送所述信号,所述信号包括存储器中存储的计算机指令;当所述处理器执行所述计算机指令时,所述处理器可实现上述任意一种实施方式中的模型训练方法。

56、本实施方式的模型训练装置的效果,与上述各实施方式的模型训练方法的效果类似,这里不再赘述。

57、在一种可能的实施方式中,本技术提供一种计算机可读存储介质。计算机可读存储介质存储有计算机程序,当计算机程序运行在计算机或处理器上时,使得计算机或处理器执行上述任意一种实施方式中的意图识别方法。

58、本实施方式的计算机可读存储介质的效果,与上述各实施方式的意图识别方法的效果类似,这里不再赘述。

59、在一种可能的实施方式中,本技术提供一种计算机可读存储介质。计算机可读存储介质存储有计算机程序,当计算机程序运行在计算机或处理器上时,使得计算机或处理器执行上述任意一种实施方式中的模型训练方法。

60、本实施方式的计算机可读存储介质的效果,与上述各实施方式的模型训练方法的效果类似,这里不再赘述。

61、在一种可能的实施方式中,本技术提供一种计算机程序产品。计算机程序产品包含软件程序,当软件程序被计算机或处理器执行时,使得上述任意一个实施方式中的意图识别方法被执行。

62、本实施方式的计算机程序产品的效果,与上述各实施方式的意图识别方法的效果类似,这里不再赘述。

63、在一种可能的实施方式中,本技术提供一种计算机程序产品。计算机程序产品包含软件程序,当软件程序被计算机或处理器执行时,使得上述任意一个实施方式中的模型训练方法被执行。

64、本实施方式的计算机程序产品的效果,与上述各实施方式的模型训练方法的效果类似,这里不再赘述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1