本技术涉及自然语言处理,尤其涉及一种多意图识别方法、装置、存储介质及设备。
背景技术:
1、随着人工智能技术的不断突破和各种智能终端设备的日益普及,人机交互在人们日常工作、生活中出现的频率越来越高,能够为人们带来极大的便利,其中,对于人机对话系统而言,机器能否准确地理解用户的言辞意图是非常关键的,通过提升意图识别准确率可以有助于提升用户的交互体验。
2、传统的意图识别主要是针对单一的意图进行分类和匹配,然而,在真实场景下,用户的一句话可能会包含多重意图,而传统的识别方法往往只能识别出其中的一个最优意图,不符合用户的多意图需求,因此如何从用户的语句中准确识别出多意图,以提升用户的交互体验显得尤为重要。目前,现有的多意图识别方法通常有两种:一种是规则匹配法,另一种是基于分类模型的方法。但这些识别方法在处理语义模糊或复杂的语句时往往效果不够理想,对于长篇幅、多层次、复杂意图的语句处理效果较差。又由于意图识别效果严重依赖于大量高质量的标注样本,而实际应用中往往难以获得大量的标注样本,并且目前也较难将领域知识整合到意图识别过程中,因此,现有的这些多意图识别方法往往会导致识别效果较差,降低了用户的交互体验。
技术实现思路
1、本技术实施例的主要目的在于提供一种多意图识别方法、装置、存储介质及设备,能够更为准确的从用户的语句中识别出多重意图,以提高对于用户的多意图识别效果,进而提高用户的交互体验。
2、本技术实施例提供了一种多意图识别方法,包括:
3、获取待识别的目标文本,并确定所述目标文本所属的目标领域;
4、对所述目标文本进行实体关键词提取,得到表征所述目标文本的关键信息的实体关键词,作为目标语义标签;
5、将所述目标语义标签与预先构建的目标领域知识图谱中存储的候选语义标签进行匹配,并根据匹配成功的候选语义标签,搜索出与所述目标语义标签相关联的候选知识点所对应的候选映射路径;
6、根据所述候选映射路径对应的候选语义标签与目标语义标签的对比结果,识别出所述目标文本中包含的目标用户提出的多个意图,得到所述目标用户对应的多意图识别结果。
7、一种可能的实现方式中,所述目标领域知识图谱的构建方式如下:
8、获取目标领域中与各个知识点相关的文本数据,并对所述文本数据进行实体识别,得到识别出的与各个知识点相关的实体,作为候选语义标签;所述实体包含业务实体、操作实体、属性实体;
9、以所述业务实体为中心,利用业务实体和操作实体之间的上下位关系、业务实体和属性实体之间的上下位关系、操作实体和属性实体之间的上下位关系,建立与各个知识点相关的候选语义标签三元组及其对应的映射路径,用以构成目标领域知识图谱;其中,所述映射路径表示其所对应的语义标签到相关知识点的映射关系。
10、一种可能的实现方式中,所述候选语义标签三元组中两个候选语义标签之间的关系为业务实体和操作实体之间的关系、操作实体和属性实体之间的关系、业务实体和属性实体之间的关系、不同属性实体之间的关系、映射路径、知识图谱节点名称中的至少一种。
11、一种可能的实现方式中,所述获取待识别的目标文本之后,所述方法还包括:
12、对所述目标文本进行预处理,得到预处理后的目标文本;
13、利用目标领域的业务词典,对所述预处理后的目标文本进行分词处理,得到分词后的目标文本;
14、对所述分词后的目标文本中的分词进行语义的归一化处理,得到所述目标文本包含的归一化后的分词。
15、一种可能的实现方式中,所述对所述目标文本进行实体关键词提取,得到表征所述目标文本的关键信息的实体关键词,作为目标语义标签,包括:
16、从所述目标文本包含的归一化后的分词中提取出表征所述目标文本的关键信息的实体关键词,作为目标语义标签。
17、一种可能的实现方式中,所述根据匹配成功的候选语义标签,搜索出与所述目标语义标签相关联的候选知识点及其对应的候选映射路径,包括:
18、当匹配成功的候选语义标签包含业务实体时,以所述业务实体为根节点,在所述目标领域知识图谱中搜索与所述业务实体相关联的候选知识点及其对应的候选映射路径;
19、或者,当匹配成功的候选语义标签不包含业务实体时,以所述匹配成功的候选语义标签包含的操作实体为根节点,在所述目标领域知识图谱中搜索与所述操作实体相关联的候选知识点及其对应的候选映射路径;
20、或者,当匹配成功的候选语义标签不包含业务实体和操作实体时,以所述匹配成功的候选语义标签包含的属性实体为根节点,在所述目标领域知识图谱中搜索与所述属性实体相关联的候选知识点及其对应的候选映射路径。
21、一种可能的实现方式中,所述根据所述候选映射路径对应的语义标签与目标语义标签的对比结果,识别出所述目标文本中包含的目标用户提出的多个意图,得到所述目标用户对应的多意图识别结果,包括:
22、根据所述候选映射路径对应的语义标签数量,对所述候选知识点及其对应的候选映射路径进行排序,并从得到的排序结果中筛选出满足预设条件的候选知识点所对应的候选映射路径;
23、将筛选出的候选映射路径对应的语义标签的并集,与目标语义标签进行对比,并在得到表明二者相同的对比结果时,将筛选出的候选映射路径所属的候选知识点的名称作为目标用户对应的多意图识别结果。
24、本技术实施例还提供了一种多意图识别装置,包括:
25、第一获取单元,用于获取待识别的目标文本,并确定所述目标文本所属的目标领域;
26、提取单元,用于对所述目标文本进行实体关键词提取,得到表征所述目标文本的关键信息的实体关键词,作为目标语义标签;
27、搜索单元,用于将所述目标语义标签与预先构建的目标领域知识图谱中存储的候选语义标签进行匹配,并根据匹配成功的候选语义标签,搜索出与所述目标语义标签相关联的候选知识点所对应的候选映射路径;
28、识别单元,用于根据所述候选映射路径对应的候选语义标签与目标语义标签的对比结果,识别出所述目标文本中包含的目标用户提出的多个意图,得到所述目标用户对应的多意图识别结果。
29、一种可能的实现方式中,所述装置还包括:
30、第二获取单元,用于获取目标领域中与各个知识点相关的文本数据,并对所述文本数据进行实体识别,得到识别出的与各个知识点相关的实体,作为候选语义标签;所述实体包含业务实体、操作实体、属性实体;
31、构成单元,用于以所述业务实体为中心,利用业务实体和操作实体之间的上下位关系、业务实体和属性实体之间的上下位关系、操作实体和属性实体之间的上下位关系,建立与各个知识点相关的候选语义标签三元组及其对应的映射路径,用以构成目标领域知识图谱;其中,所述映射路径表示其所对应的语义标签到相关知识点的映射关系。
32、一种可能的实现方式中,所述候选语义标签三元组中两个候选语义标签之间的关系为业务实体和操作实体之间的关系、操作实体和属性实体之间的关系、业务实体和属性实体之间的关系、不同属性实体之间的关系、映射路径、知识图谱节点名称中的至少一种。
33、一种可能的实现方式中,所述装置还包括:
34、预处理单元,用于对所述目标文本进行预处理,得到预处理后的目标文本;
35、分词单元,用于利用目标领域的业务词典,对所述预处理后的目标文本进行分词处理,得到分词后的目标文本;
36、归一化单元,用于对所述分词后的目标文本中的分词进行语义的归一化处理,得到所述目标文本包含的归一化后的分词。
37、一种可能的实现方式中,所述提取单元具体用于:
38、从所述目标文本包含的归一化后的分词中提取出表征所述目标文本的关键信息的实体关键词,作为目标语义标签。
39、一种可能的实现方式中,所述搜索单元具体用于:
40、当匹配成功的候选语义标签包含业务实体时,以所述业务实体为根节点,在所述目标领域知识图谱中搜索与所述业务实体相关联的候选知识点及其对应的候选映射路径;
41、或者,当匹配成功的候选语义标签不包含业务实体时,以所述匹配成功的候选语义标签包含的操作实体为根节点,在所述目标领域知识图谱中搜索与所述操作实体相关联的候选知识点及其对应的候选映射路径;
42、或者,当匹配成功的候选语义标签不包含业务实体和操作实体时,以所述匹配成功的候选语义标签包含的属性实体为根节点,在所述目标领域知识图谱中搜索与所述属性实体相关联的候选知识点及其对应的候选映射路径。
43、一种可能的实现方式中,所述识别单元包括:
44、排序子单元,用于根据所述候选映射路径对应的语义标签数量,对所述候选知识点及其对应的候选映射路径进行排序,并从得到的排序结果中筛选出满足预设条件的候选知识点所对应的候选映射路径;
45、识别子单元,用于将筛选出的候选映射路径对应的语义标签的并集,与目标语义标签进行对比,并在得到表明二者相同的对比结果时,将筛选出的候选映射路径所属的候选知识点的名称作为目标用户对应的多意图识别结果。
46、本技术实施例还提供了一种多意图识别设备,包括:处理器、存储器、系统总线;
47、所述处理器以及所述存储器通过所述系统总线相连;
48、所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述多意图识别方法中的任意一种实现方式。
49、本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述多意图识别方法中的任意一种实现方式。
50、本技术实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行上述多意图识别方法中的任意一种实现方式。
51、本技术实施例提供的一种多意图识别方法、装置、存储介质及设备,首先获取待识别的目标文本,并确定目标文本所属的目标领域,然后对目标文本进行实体关键词提取,得到表征目标文本的关键信息的实体关键词,作为目标语义标签;接着将目标语义标签与预先构建的目标领域知识图谱中存储的候选语义标签进行匹配,并根据匹配成功的候选语义标签,搜索出与目标语义标签相关联的候选知识点所对应的候选映射路径;进而可以根据候选映射路径对应的语义标签与目标语义标签的对比结果,识别出目标文本中包含的目标用户提出的多个意图,得到目标用户对应的多意图识别结果。
52、可见,由于本技术预先构建了目标文本所属目标领域的知识图谱,从而可以利用其存储的各个候选知识点所对应的候选映射路径和候选语义标签,更为准确的识别出目标文本中可能存在的多个意图,进而提高了对于目标用户的多意图识别效果,并提高了目标用户的交互体验。