本发明涉及知识图谱,具体而言,涉及一种基于指定关系类型的知识图谱实体融合方法、装置、设备和计算机可读存储介质。
背景技术:
1、本发明对于背景技术的描述属于与本发明相关的相关技术,仅仅是用于说明和便于理解本发明的
技术实现要素:
,不应理解为申请人明确认为或推定申请人认为是本发明在首次提出申请的申请日的现有技术。
2、在知识图谱技术领域,如果同实体类型的不同实体间存在某种指定关系类型的关系,比如:两个人(同实体类型的不同实体)存在着同一居住地址的关联(某种指定关系类型的关系),可以判断这两个实体疑似为同一个人。但是由于实体的重复会影响知识图谱的准确性,当两个或多个实体疑似为同一实体时,在图谱中可以融合成一个实体进行展示。但是在这种判断和融合过程中,如何进行准确的判断以及高效的融合成为困扰技术人员的难题。
3、为了解决上述技术问题,本发明提出了一种基于指定关系类型的知识图谱实体融合方法、装置、设备和计算机可读存储介质,为知识图谱在构建图谱前进行实体融合提供一种可行的方法,有效提高图谱的准确性,适合特定的应用场景需求。
技术实现思路
1、本发明提供了一种基于指定关系类型的知识图谱实体融合方法、装置、设备和计算机可读存储介质,为知识图谱在构建图谱前进行实体融合提供一种可行的方法,有效提高图谱的准确性,适合特定的应用场景需求。
2、本发明第一方面的实施例提供了一种基于指定关系类型的知识图谱实体融合方法,包括如下步骤:配置实体融合方式,指定关系类型;获取原始图谱数据集;在原始图谱数据集的关系数据集中,识别出所有指定关系类型的融合关系;从识别到的融合关系中,匹配融合关系的所有起点实体和终点实体,并标记融合实体;进行融合实体的实体合并操作;进行融合实体的关系合并操作;生成融合后的图谱结果数据集。
3、优选地,配置实体融合方式,指定关系类型步骤中,指定的关系类型在图模型中为自指向的边,自指向的边为边的起点和终点为同一顶点。
4、优选地,获取原始图谱数据集步骤中,查询图数据库获取原始图谱数据集。
5、优选地,在原始图谱数据集的关系数据集中,识别出所有指定关系类型的融合关系的步骤中,根据指定的关系类型识别出所有指定关系类型的融合关系。
6、优选地,进行融合实体的实体合并操作步骤包括如下子步骤:将需要进行融合的融合实体看作一个整体;选取一个关联关系最多的融合实体作为主融合实体;遍历被标记为融合实体的所有实体数据集,向主融合实体进行合并,并更新属性和关联的关系信息。
7、优选地,进行融合实体的关系合并操作步骤包括如下子步骤:将需要进行合并的关系看作一个整体;遍历指定关系类型的关系数据集,合并成一条关系;将合并得到的关系与对应的融合实体关联起来,并更新其属性信息。
8、优选地,生成融合后的图谱结果数据集步骤中,根据实体合并操作和关系合并操作生成融合后的图谱结果数据集。
9、本发明第二方面的实施例还提供了一种基于指定关系类型的知识图谱实体融合装置,包括:指定关系模块,指定关系模块用于配置实体融合方式,指定关系类型;数据获取模块,数据获取模块用于获取原始图谱数据集;关系识别模块,关系识别模块用于在原始图谱数据集的关系数据集中,识别出所有指定关系类型的融合关系;实体匹配模块,实体匹配模块用于从识别到的融合关系中,匹配融合关系的所有起点实体和终点实体,并标记融合实体;实体合并模块,实体合并模块用于进行融合实体的实体合并操作;关系合并模块,关系合并模块用于进行融合实体的关系合并操作;结果生成模块,结果生成模块用于生成融合后的图谱结果数据集。
10、本发明第三方面的实施例还提供了一种基于指定关系类型的知识图谱实体融合设备,其包括存储器和处理器;其中,存储器用于存储可执行程序代码;处理器用于读取存储器中存储的可执行程序代码以执行基于指定关系类型的知识图谱实体融合方法。
11、本发明第四方面的实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现基于指定关系类型的知识图谱实体融合方法。
12、本发明提供的基于指定关系类型的知识图谱实体融合方法、装置、设备和计算机可读存储介质,为知识图谱在构建图谱前进行实体融合提供一种可行的方法,有效提高图谱的准确性,适合特定的应用场景需求。
13、本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
1.一种基于指定关系类型的知识图谱实体融合方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于指定关系类型的知识图谱实体融合方法,其特征在于,所述配置实体融合方式,指定关系类型步骤中,指定的关系类型在图模型中为自指向的边,所述自指向的边为边的起点和终点为同一顶点。
3.根据权利要求1所述的基于指定关系类型的知识图谱实体融合方法,其特征在于,所述获取原始图谱数据集步骤中,查询图数据库获取原始图谱数据集。
4.根据权利要求1所述的基于指定关系类型的知识图谱实体融合方法,其特征在于,所述在所述原始图谱数据集的关系数据集中,识别出所有指定关系类型的融合关系的步骤中,根据指定的关系类型识别出所有指定关系类型的融合关系。
5.根据权利要求1所述的基于指定关系类型的知识图谱实体融合方法,其特征在于,所述进行融合实体的实体合并操作步骤包括如下子步骤:
6.根据权利要求5所述的基于指定关系类型的知识图谱实体融合方法,其特征在于,所述进行融合实体的关系合并操作步骤包括如下子步骤:
7.根据权利要求1-6中任意一项所述的基于指定关系类型的知识图谱实体融合方法,其特征在于,所述生成融合后的图谱结果数据集步骤中,根据实体合并操作和关系合并操作生成融合后的图谱结果数据集。
8.一种基于指定关系类型的知识图谱实体融合装置,其特征在于,包括:
9.一种基于指定关系类型的知识图谱实体融合设备,其包括存储器和处理器;其中,所述存储器用于存储可执行程序代码;所述处理器用于读取所述存储器中存储的可执行程序代码以执行根据权利要求1-7任意一项所述的基于指定关系类型的知识图谱实体融合方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述的基于指定关系类型的知识图谱实体融合方法。