知识图谱的处理方法、装置、设备和介质与流程

文档序号:18739690发布日期:2019-09-21 01:38阅读:来源:国知局

技术特征:

1.一种知识图谱的处理方法,其特征在于,所述方法包括:

根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元;

确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度;

根据所述匹配度,从所述至少两个候选实体证据单元中选择所述待检验知识图谱的目标实体证据单元,供基于所述目标实体证据单元对所述待验证知识图谱进行验证。

2.根据权利要求1所述的方法,其特征在于,根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元之前,还包括:

从目标领域事实中提取属性信息和属性信息所属的章节标题信息;

将所述章节标题信息作为目标领域中实体证据单元的标题;

将所述属性信息中的属性名称作为目标领域中实体证据单元的属性关键字;

将所述属性信息中的属性内容作为目标领域中实体证据单元的属性键值。

3.根据权利要求1所述的方法,其特征在于,根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元,包括:

将待验证知识图谱中的实体名作为搜索词,在目标领域的实体证据单元的章节标题信息、属性关键字和属性键值中进行搜索,得到第一实体证据单元;

将待验证知识图谱中的属性值作为搜索词,在目标领域的实体证据单元的属性键值中进行搜索,得到第二实体证据单元;

从所述第一实体证据单元和所述第二实体证据单元中选择至少两个候选实体证据单元。

4.根据权利要求3所述的方法,其特征在于,从所述第一实体证据单元和所述第二实体证据单元中选择至少两个候选实体证据单元之后,还包括:

根据知识图谱中属性名与实体证据单元中属性关键字之间的映射关系,以及待验证知识图谱,从所述至少两个候选实体证据单元中选择与所述待验证知识图谱匹配的候选实体证据单元,且滤除其他候选实体证据单元。

5.根据权利要求1所述的方法,其特征在于,确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度,包括:

确定待检验知识图谱中的实体名,与候选实体证据单元中的标题之间的标题相似度;

确定待检验知识图谱中的属性值,与候选实体证据单元中的属性键值之间的键值相似度;

根据所述候选实体证据单元的标题相似度和键值相似度,确定候选实体证据单元的匹配度。

6.根据权利要求5所述的方法,其特征在于,确定待检验知识图谱中的实体名,与候选实体证据单元中的标题之间的标题相似度,包括:

将所述待检验知识图谱中的实体名与候选实体证据单元中的标题,作为预测模型的输入,得到第一标题相似度;

根据所述待检验知识图谱的实体名与候选实体证据单元的标题之间的文本重合关系,确定第二标题相似度。

7.根据权利要求5所述的方法,其特征在于,确定待检验知识图谱中的属性值,与候选实体证据单元中的属性键值之间的键值相似度,包括:

将所述待检验知识图谱中的属性值与候选实体证据单元中的属性键值,作为预测模型的输入,得到第一键值相似度;

根据所述待检验知识图谱的属性值与候选实体证据单元的属性键值之间的文本重合关系,确定第二键值相似度。

8.根据权利要求5所述的方法,其特征在于,根据所述候选实体证据单元的标题相似度和键值相似度,确定候选实体证据单元的匹配度之前,还包括:

若任一候选实体证据单元的标题相似度小于第一标题相似度阈值,或者该候选实体证据单元的键值相似度小于第一键值相似度阈值,则滤除该候选实体证据单元。

9.根据权利要求5所述的方法,其特征在于,从所述至少两个候选实体证据单元中选择所述待检验知识图谱的目标实体证据单元,包括:

若所述候选实体证据单元的标题相似度大于第二标题相似度阈值,且键值相似度大于第二键值相似度阈值,则为所述候选实体证据单元添加第一标志位;否则,为所述候选实体证据单元添加第二标志位;

根据所述候选实体证据单元的匹配度和标志位信息,对至少两个候选实体证据单元进行排序;

根据排序结果,确定所述待检验知识图谱的目标实体证据单元。

10.一种知识图谱的处理装置,其特征在于,所述装置包括:

候选实体证据单元选择模块,用于根据待验证知识图谱,从待验证知识图谱所属目标领域的实体证据单元中选择至少两个候选实体证据单元;

匹配度确定模块,用于确定所述待检验知识图谱与所述至少两个候选实体证据单元的匹配度;

目标实体证据单元选择模块,用于根据所述匹配度,从所述至少两个候选实体证据单元中选择所述待检验知识图谱的目标实体证据单元,供基于所述目标实体证据单元对所述待验证知识图谱进行验证。

11.根据权利要求10所述的装置,其特征在于,所述装置还包括实体证据单元获取模块,具体用于:

从目标领域事实中提取属性信息和属性信息所属的章节标题信息;

将所述章节标题信息作为目标领域中实体证据单元的标题;

将所述属性信息中的属性名称作为目标领域中实体证据单元的属性关键字;

将所述属性信息中的属性内容作为目标领域中实体证据单元的属性键值。

12.根据权利要求10所述的装置,其特征在于,所述候选实体证据单元选择模块,具体用于:

将待验证知识图谱中的实体名作为搜索词,在目标领域的实体证据单元的章节标题信息、属性关键字和属性键值中进行搜索,得到第一实体证据单元;

将待验证知识图谱中的属性值作为搜索词,在目标领域的实体证据单元的属性键值中进行搜索,得到第二实体证据单元;

从所述第一实体证据单元和所述第二实体证据单元中选择至少两个候选实体证据单元。

13.根据权利要求12所述的装置,其特征在于,所述候选实体证据单元选择模块,具体还用于:

根据知识图谱中属性名与实体证据单元中属性关键字之间的映射关系,以及待验证知识图谱,从所述至少两个候选实体证据单元中选择与所述待验证知识图谱匹配的候选实体证据单元,且滤除其他候选实体证据单元。

14.一种设备,其特征在于,所述设备还包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的一种知识图谱的处理方法。

15.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的一种知识图谱的处理方法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1