本申请涉及互联网,具体而言,涉及知识图谱映射方法、装置、电子设备和存储介质。
背景技术:
1、随着科技的不断发展,知识图谱(knowledge graph)在工商业、农业、教育等各个领域中均得到了应用。对于某个领域而言,通常可以采集该领域中的行业数据,然后通过对该行业数据进行分析、提炼,从而生成该领域的知识图谱。但是,由于不同领域的知识图谱分别是通过本领域的行业数据所生成,往往导致不同领域的知识图谱之间形成了知识隔离,使得知识图谱难以进行跨领域的应用。
技术实现思路
1、本申请实施例的目的在于提供知识图谱映射方法、装置、电子设备和存储介质,用于解决现有技术中的问题。
2、本申请实施例第一方面提供了一种知识图谱映射方法,包括:
3、获取第一知识图谱中各个第一节点的节点描述信息,以及第二知识图谱中各个第二节点的节点描述信息;
4、分别针对所述第一知识图谱中的各个第一节点,根据所述第一节点的节点描述信息与所述第二知识图谱中各个第二节点的节点描述信息之间的语义相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点;
5、分别针对所述第一知识图谱中的各个第一节点,将所述第一节点与所对应的相似节点进行互联。
6、于一实施例中,分别针对所述第一知识图谱中的各个第一节点,根据所述第一节点的节点描述信息与所述第二知识图谱中各个第二节点的节点描述信息之间的语义相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点,具体包括:
7、分别针对所述第一知识图谱中的各个第一节点,获取所述第一节点的节点描述信息的第一语义向量,以及各个第二节点的节点描述信息的第二语义向量,并根据所述第一语义向量分别与各个第二语义向量之间的向量相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点,其中,所述相似节点具体为向量相似度最大的第二节点或相似度大于预设阈值的第二节点。
8、于一实施例中,分别针对所述第一知识图谱中的各个第一节点,根据所述第一节点的节点描述信息与所述第二知识图谱中各个第二节点的节点描述信息之间的语义相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点,具体包括:
9、分别将第二知识图谱中各个第二节点作为当前第二节点,并获取所述第一节点的节点描述信息与所述当前第二节点的节点描述信息之间的交集和并集,计算所述交集中的字符数量与所述并集中的字符数量的比值,并根据所述比值,从所述第二知识图谱的各个第二节点中筛选出相似节点,其中,所述比值的大小反映所述第一节点的节点描述信息,与所述当前第二节点的节点描述信息之间的语义相似度。
10、于一实施例中,在分别针对所述第一知识图谱中的各个第一节点,将所述第一节点与所对应的相似节点进行互联之后,所述方法还包括:
11、对所述第一知识图谱和所述第二知识图谱之间的映射效果进行评估。
12、于一实施例中,对所述第一知识图谱和所述第二知识图谱之间的映射效果进行评估,具体包括:
13、根据各个第一节点分别对应的相似节点的总数与所述第一知识图谱中第一节点的数量之比,以及所述总数与所述第二知识图谱中第二节点的数量之比,对所述第一知识图谱和所述第二知识图谱之间的映射效果进行评估。
14、于一实施例中,根据各个第一节点分别对应的相似节点的总数与所述第一知识图谱中第一节点的数量之比,以及所述总数与所述第二知识图谱中第二节点的数量之比,对所述第一知识图谱和所述第二知识图谱之间的映射效果进行评估,具体包括:
15、获取所述总数与所述第一知识图谱中第一节点的数量的第一比值;
16、获取所述总数与所述第二知识图谱中第二节点的数量的第二比值;
17、根据所述第一比值与所述第二比值的几何平均值的大小,对所述第一知识图谱和所述第二知识图谱之间的映射效果进行评估。
18、本申请实施例第二方面提供了一种知识图谱映射装置,包括:
19、节点描述信息获取单元,用于获取第一知识图谱中各个第一节点的节点描述信息,以及第二知识图谱中各个第二节点的节点描述信息;
20、相似节点筛选单元,用于分别针对所述第一知识图谱中的各个第一节点,根据所述第一节点的节点描述信息与所述第二知识图谱中各个第二节点的节点描述信息之间的语义相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点;
21、互联单元,用于分别针对所述第一知识图谱中的各个第一节点,将所述第一节点与所对应的相似节点进行互联
22、于一实施例中,所述相似节点筛选单元具体包括相似节点第一筛选子单元,用于分别针对所述第一知识图谱中的各个第一节点,获取所述第一节点的节点描述信息的第一语义向量,以及各个第二节点的节点描述信息的第二语义向量,并根据所述第一语义向量分别与各个第二语义向量之间的向量相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点,其中,所述相似节点具体为向量相似度最大的第二节点或相似度大于预设阈值的第二节点。
23、本申请实施例第三方面提供了一种电子设备,包括:
24、存储器,用以存储计算机程序;
25、处理器,用以执行本申请方法实施例中任一项所述的方法。
26、本申请实施例第四方面提供了一种存储介质,包括:程序,当其在电子设备上运行时,使得电子设备可执行本申请方法实施例中任一项所述的方法。
27、采用本申请实施例所提供的知识图谱映射方法,包括获取第一知识图谱中各个第一节点的节点描述信息,以及第二知识图谱中各个第二节点的节点描述信息,然后分别针对第一知识图谱中的各个第一节点,根据该第一节点的节点描述信息与第二知识图谱中各个第二节点的节点描述信息之间的语义相似度,从第二知识图谱的各个第二节点中筛选出相似节点,然后分别针对第一知识图谱中的各个第一节点,将该第一节点与所对应的相似节点进行互联。因此通过该方法能够将第一知识图谱中的各个节点与第二知识图谱中的各个节点进行互联,从而实现第一知识图谱与第二知识图谱之间的映射,进而使第一知识图谱和第二知识图谱形成了一个新的知识图谱,该新的知识图谱相对于该第一知识图谱和第二知识图谱而言,显然能够应用于更多的领域。
1.一种知识图谱映射方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,分别针对所述第一知识图谱中的各个第一节点,根据所述第一节点的节点描述信息与所述第二知识图谱中各个第二节点的节点描述信息之间的语义相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点,具体包括:
3.根据权利要求1所述的方法,其特征在于,分别针对所述第一知识图谱中的各个第一节点,根据所述第一节点的节点描述信息与所述第二知识图谱中各个第二节点的节点描述信息之间的语义相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点,具体包括:
4.根据权利要求1所述的方法,其特征在于,在分别针对所述第一知识图谱中的各个第一节点,将所述第一节点与所对应的相似节点进行互联之后,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,对所述第一知识图谱和所述第二知识图谱之间的映射效果进行评估,具体包括:
6.根据权利要求5所述的方法,其特征在于,根据各个第一节点分别对应的相似节点的总数与所述第一知识图谱中第一节点的数量之比,以及所述总数与所述第二知识图谱中第二节点的数量之比,对所述第一知识图谱和所述第二知识图谱之间的映射效果进行评估,具体包括:
7.一种知识图谱映射装置,其特征在于,包括:
8.根据权利要求7所述的装置,其特征在于,所述相似节点筛选单元具体包括相似节点第一筛选子单元,用于分别针对所述第一知识图谱中的各个第一节点,获取所述第一节点的节点描述信息的第一语义向量,以及各个第二节点的节点描述信息的第二语义向量,并根据所述第一语义向量分别与各个第二语义向量之间的向量相似度,从所述第二知识图谱的各个第二节点中筛选出相似节点,其中,所述相似节点具体为向量相似度最大的第二节点或相似度大于预设阈值的第二节点。
9.一种电子设备,其特征在于,包括:
10.一种存储介质,其特征在于,包括:程序,当其在电子设备上运行时,使得电子设备可执行如权利要求1至6中任一项所述的方法。