本说明书一个或多个实施例涉及计算机,尤其涉及融合知识图谱数据的方法及装置。
背景技术:
1、知识图谱(knowledge graph)是以图模式描述真实世界中的各种实体及其关系的一种语义网络。通过知识图谱结合专家经验及先验数据,可以解释图谱中关系、规则的正确性,以及推理图中未出现的关系、规则。在互联网数据日益庞大的情况下,平台用户的交互场景、交互关系错综复杂。例如,通讯录上的存和被存关系、终端应用关联信息、网络链路重叠信息,等等,造成了数据多源的特性。对于各种来源的网络数据,可以各自建立一个相应的知识图谱。然而,随着网络的发展,各方业务的深入交互,对于一些业务而言,使用综合性的知识图谱可以更好地进行业务处理。如此,知识图谱之间的数据融合成为图数据处理的一个重要技术问题。
技术实现思路
1、本说明书一个或多个实施例描述了一种融合知识图谱数据的方法及装置,用以解决背景技术提到的一个或多个问题。
2、根据第一方面,提供一种融合知识图谱数据的方法,用用于将多源异构的多个知识图谱逐个向目标知识图谱融合过程中,针对待融合的当前知识图谱向目标知识图谱进行融合,所述目标知识图谱对应有预设的实体属性和融合策略,所述融合策略描述实体属性的融合规则,以及节点间连接关系的选择规则;所述方法包括:从待融合的当前知识图谱中读取第一节点的节点数据;检测目标知识图谱中是否存在与所述第一节点对应相同实体的其他节点;基于检测结果以及所述融合策略更新目标知识图谱。
3、在一个实施例中,所述待融合的当前知识图谱为非首个融合到目标知识图谱的待融合知识图谱。
4、在一个实施例中,所述目标知识图谱中至少融合有首个待融合知识图谱的相应数据,在首个融合到目标知识图谱的待融合知识图谱已通过实体链指消歧的情况下,该首个待融合知识图谱通过以下方式融合到目标知识图谱:根据所述融合策略向目标知识图谱填充该首个融合到目标知识图谱的待融合知识图谱。
5、在一个实施例中,所述目标知识图谱中的各个节点还对应有节点索引;所述基于检测结果以及所述融合策略更新目标知识图谱还包括:更新目标知识图谱中与所述第一节点对应的第一节点索引。
6、在一个实施例中,所述基于检测结果以及所述融合策略更新目标知识图谱包括:在存在与第一节点对应的实体相一致的第二节点的情况下,利用所述融合策略更新所述第二节点;在不存在与第一节点对应的实体相一致的其他节点的情况下,利用所述融合策略将所述第一节点加入目标知识图谱。
7、在一个实施例中,所述融合规则包括以下至少一项:目标知识图谱中的预定属性来源于预定知识图谱;目标知识图谱中的预定属性为空时取当前导入知识图谱的实体属性,不为空时则保持目标知识图谱中的实体属性;在检测到当前导入知识图谱的实体属性的数据来源满足预定条件的情况下,导入相应实体属性。
8、在一个实施例中,所述选择规则包括以下至少一项:将当前节点在待融合的知识图谱中的预定阶数内的连接关系导入目标知识图谱;将当前节点在待融合的知识图谱中的预定连接关系类型导入目标知识图谱。
9、在一个实施例中,待融合的各个知识图谱中的节点对应的业务实体为地理兴趣点,所述实体属性包括地理兴趣点的以下中的至少一项属性:标识、名称、地址、定位精度、经度、mcc类目编码、纬度、地图列表、空间所属列表。
10、根据第二方面,提供一种融合知识图谱数据的装置,用于将多源异构的多个知识图谱逐个向目标知识图谱融合过程中,针对待融合的当前知识图谱向目标知识图谱进行融合,所述目标知识图谱对应有预设的实体属性和融合策略,所述融合策略描述实体属性的融合规则,以及节点间连接关系的选择规则;所述装置包括:
11、读取单元,配置为从待融合的当前知识图谱中读取第一节点的节点数据;
12、检测单元,配置为检测目标知识图谱中是否存在与所述第一节点对应相同实体的其他节点;
13、更新单元,配置为基于检测结果以及所述融合策略更新目标知识图谱。
14、根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
15、根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
16、通过本说明书实施例提供的方法和装置,用于将多源异构的多个知识图谱进行融合过程中,针对待融合的当前知识图谱向目标知识图谱进行融合。其中,为了完成多个知识图谱之间的节点大规模融合,本说明书采用将待融合的各个知识图谱逐个向目标知识图谱融合的技术构思。目标知识图谱对应有预设的实体属性和融合策略,融合策略可以描述实体属性的融合规则,以及节点间连接关系的选择规则。针对待融合的当前知识图谱,可以逐个节点向目标知识图谱融合,并在融合过程中经由实体链指进行节点消歧。具体而言,从待融合的当前知识图谱中读取单个节点的节点数据,然后检测目标知识图谱中是否存在与该单个节点对应相同实体的其他节点,并基于检测结果以及融合策略更新目标知识图谱。这种实施方式可以解决多类型实体在异构知识图谱下的多到一的数据融合处理问题,并支持知识图谱的持续叠加融合,提高知识图谱数据处理的有效性。
1.一种融合知识图谱数据的方法,用于将多源异构的多个知识图谱逐个向目标知识图谱融合过程中,针对待融合的当前知识图谱向目标知识图谱进行融合,所述目标知识图谱对应有预设的实体属性和融合策略,所述融合策略描述实体属性的融合规则,以及节点间连接关系的选择规则;所述方法包括:
2.如权利要求1所述的方法,其中,所述待融合的当前知识图谱为非首个融合到目标知识图谱的待融合知识图谱。
3.如权利要求1所述的方法,其中,所述目标知识图谱中至少融合有首个待融合知识图谱的相应数据,在首个融合到目标知识图谱的待融合知识图谱已通过实体链指消歧的情况下,该首个待融合知识图谱通过以下方式融合到目标知识图谱:
4.如权利要求1-3任一所述的方法,其中,所述目标知识图谱中的各个节点还对应有节点索引;
5.如权利要求1所述的方法,其中,所述基于检测结果以及所述融合策略更新目标知识图谱包括:
6.如权利要求1所述的方法,其中,所述融合规则包括以下至少一项:
7.如权利要求1所述的方法,其中,所述选择规则包括以下至少一项:
8.如权利要求1所述的方法,其中,待融合的各个知识图谱中的节点对应的业务实体为地理兴趣点,所述实体属性包括地理兴趣点的以下中的至少一项属性:标识、名称、地址、定位精度、经度、mcc类目编码、纬度、地图列表、空间所属列表。
9.一种融合知识图谱数据的装置,用于将多源异构的多个知识图谱逐个向目标知识图谱融合过程中,针对待融合的当前知识图谱向目标知识图谱进行融合,所述目标知识图谱对应有预设的实体属性和融合策略,所述融合策略描述实体属性的融合规则,以及节点间连接关系的选择规则;所述装置包括:
10.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8中任一项的所述的方法。
11.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-8中任一项所述的方法。