本发明属于人工智能,尤其涉及一种垂域知识图谱的知识查询方法、装置、计算机设备和存储介质。
背景技术:
1、知识图谱是一种以图形结构表示知识的方式,它通过将实体、属性和关系组织成节点和边的形式,形成一个语义丰富的知识网络。垂域知识图谱则是指在垂直领域内构建的知识图谱。知识查询(知识检索)主要通过线上问答的方式,向用户提供无限制的实时知识情报信息查询的服务。目前知识查询主要采用端到端的向量召回检索方式实现。即,主要将收集的查询文本与知识库中的目标进行匹配构建文本对后训练相关的查询模型后,利用该查询模型对用户实时输入的查询文本进行向量编码,再通过向量召回的方式实现知识库的问答查询。
2、然而,通过向量召回的方式进行知识库问答虽然易于实现,但是对于医疗、娱乐、环保、教育、体育以及军事等垂直领域来说,由于其专业性和难以理解性,使得现有方式很难基于用户输入的查询文本(查询语句)理解出用户实质的查询意图,导致知识查询准确性降低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高知识查询准确性的垂域知识图谱的知识查询方法、装置、计算机设备和存储介质。
2、本发明提供一种垂域知识图谱的知识查询方法,包括:
3、将查询文本输入多任务联合模型,由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素;
4、对所述查询文本分词,确定各所述分词在所述查询文本中的词权重;
5、根据所述分词以及所述分词的词权重进行属性关系类别对齐,得到属性关系类别词;
6、对所述查询要素进行实体链接和条件表达转义,得到链接实体和转义词;
7、根据所述查询意图类型获取知识库查询语句模板,将所述查询要素、所述链接实体、所述转义词、所述属性关系类别词填入所述知识库查询语句模板,得到知识库查询语句并利用所述知识库查询语句进行知识查询。
8、在其中一个实施例中,所述由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素,包括:
9、利用文本特征编码层对所述查询文本进行编码,得到特征向量矩阵;其中,所述特征向量矩阵包括行特征向量和列特征向量,所述行特征向量与所述查询文本中的各字符一一对应,表示各所述字符的特征向量;
10、分别对所述列特征向量的特征值进行特征融合得到文本表示向量,使用第一多层感知机对所述文本表示向量进行分类得到概率向量,将所述概率向量中最大值维度对应的查询意图类型作为所述查询文本的查询意图类型;
11、使用第二多层感知机分别预测各所述行特征向量对应不同要素类型的评分,利用条件随机场模型基于所述评分输出最优要素类别序列,根据所述最优要素类别序列确定查询要素。
12、在其中一个实施例中,所述对所述查询文本分词,确定各所述分词在所述查询文本中的词权重,包括:
13、对所述查询文本进行初步分词和词性标注后,根据停用词表以及词性过滤停用词和无意义词,得到最终的分词;
14、分别计算各所述分词的浅层语义权重、句法权重以及深层语义权重,并对所述浅层语义权重、所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重;
15、将各所述分词的总体权重进行归一化,得到各所述分词在所述查询文本中的词权重。
16、在其中一个实施例中,所述分别计算各所述分词的浅层语义权重、句法权重以及深层语义权重,并对所述浅层语义权重、所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重,包括:
17、利用tf-idf计算所述分词的词权重作为所述分词的浅层语义权重;
18、使用句法依赖构建句法树,根据各所述分词到所述句法树根结点的最短路径进行权重递减,获取所述分词的句法权重;
19、计算所述查询文本完整语义向量与所述分词的语义向量的余弦相似度,将数值1与所述余弦相似度的值作为所述分词的深层语义权重;
20、将所述浅层语义权重、所述句法权重以及所述深层语义权重进行加权或平均值计算,得到所述分词的总体权重。
21、在其中一个实施例中,所述根据所述分词以及所述分词的词权重进行属性关系类别对齐,得到属性关系类别词,包括:
22、利用深度学习模型对所述分词以及知识库中各候选属性关系类别词进行特征向量表示,得到分词特征向量和候选属性关系类别词特征向量;
23、计算所述分词特征向量与所述候选属性关系类别词特征向量的相似度;
24、根据各所述分词对应的所述词权重将对应同一候选属性关系类别词的所述相似度进行加权求和,得到汇总相似度;
25、按照所述汇总相似度从高到低的顺序,从所述候选属性关系类别词中获取预设数量的属性关系类别词。
26、在其中一个实施例中,所述多任务联合模型的训练过程包括:
27、获取用户的搜索查询日志,在所述搜索查询日志中搜索共同点击搜索查询文本簇和连续搜索查询文本簇;
28、对所述共同点击搜索查询文本簇和所述连续搜索查询文本簇中的代表查询文本分别进行标签标注,并将标注的标签推广到簇内的非代表查询文本上;其中,所述标签标注包括查询意图类型标注和要素类型标注;
29、将标签标注后的所述共同点击搜索查询文本簇和所述连续搜索查询文本簇作为训练数据对所述多任务联合模型进行训练。
30、在其中一个实施例中,所述方法还包括:
31、在所述共同点击搜索查询文本簇和/或所述连续搜索查询文本簇中任意选择两个查询文本构建文本对,形成相似文本语料;
32、基于所述相似文本语料训练得到相似语义编码器;
33、利用所述相似语义编码器对所述共同点击搜索查询文本簇和/或所述连续搜索查询文本簇中的代表查询文本和簇外的查询文本进行语义相似度匹配;
34、根据所述语义相似度将所述簇外的查询文本作为补充数据加入到簇中。
35、一种垂域知识图谱的知识查询装置,包括:
36、多任务识别模块,用于将查询文本输入多任务联合模型,由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素;
37、分词模块,用于对所述查询文本分词,确定各所述分词在所述查询文本中的词权重;
38、属性关系类别词对齐模块,用于根据所述分词以及所述分词的词权重进行属性关系类别对齐,得到属性关系类别词;
39、查询要素处理模块,用于对所述查询要素进行实体链接和条件表达转义,得到链接实体和转义词;
40、知识查询模块,用于根据所述查询意图类型获取知识库查询语句模板,将所述查询要素、所述链接实体、所述转义词、所述属性关系类别词填入所述知识库查询语句模板,得到知识库查询语句并利用所述知识库查询语句进行知识查询。
41、本发明还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储由计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述垂域知识图谱的知识查询方法的步骤。
42、本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述垂域知识图谱的知识查询方法的步骤。
43、上述知识查询方法、装置、计算机设备和存储介质,通过多任务联合的查询识别模型,基于意图识别任务和要素识别的关联性,提升了意图分类与要素解析的效果。同时,通过词权重策略进一步有效获取用户的搜索目标要素相关的属性关系类别词,以及通过条件表达转义有效获取用户查询文本中的约束条件,提升用户搜索意图理解的效果。进而基于该些信息生成知识库查询语句进行知识查询,能够确保查询的准确性。