一种知识图谱的存储系统及方法与流程

文档序号:19943402发布日期:2020-02-14 23:30阅读:276来源:国知局
一种知识图谱的存储系统及方法与流程

本申请涉及存储技术领域,尤其涉及一种知识图谱的存储系统及方法。



背景技术:

知识图谱,是一种用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱可以将大规模数据中的隐藏的知识抽取出来,构建一个基于图的数据模型。近些年的数据挖掘、大数据、人工智能、机器学习等等和信息处理关联的热门技术,可以用知识图谱来辅助,这些技术的最终目的,实质是把数据收集整理成结构化的、可复用、可推理的存储,进而用于更多的使用场景,而知识图谱这种存储格式,可以近乎完美的匹配这些需求。

目前,知识图谱的存储结构设计没有统一的标准,对于数据量不是很大且结构固定的图谱,通常使用传统数据库和关系表进行存储。但是,在数据量大的情况下,一个实体通常会包含众多属性,如果同时计算这些属性并存储到传统数据库,比如图形数据库(neo4j),会大大降低数据计算、存储、检索的效率。



技术实现要素:

有鉴于此,本申请实施例的目的在于提供一种知识图谱的存储系统及方法,实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

本申请主要包括以下几个方面:

第一方面,本申请实施例提供一种知识图谱的存储系统,存储系统包括计算引擎和分布式文件存储数据库;

其中,所述计算引擎,用于获取与目标业务对应的多个实体的实体数据,并根据所述实体数据生成所述目标业务对应的知识图谱;所述实体数据包括所述多个实体中每个实体的属性数据和关系数据;

所述分布式文件存储数据库,用于获取所述知识图谱,并将所述知识图谱进行存储。

在一种可能的实施方式中,所述存储系统还包括管理关系数据库;

所述管理关系数据库,用于存储关系型数据,所述关系型数据包括所述实体数据。

在一种可能的实施方式中,所述计算引擎,具体用于根据以下步骤生成所述知识图谱:

根据所述多个实体中每个实体的属性数据,建立每个实体对应的节点在所述知识图谱中的节点数据;

根据所述多个实体中每个实体的关系数据,建立每个实体与其他实体之间在所述知识图谱中的边数据;所述其他实体为所述多个实体中除该实体之外的实体;所述边数据包括属性类型和属性值;

根据所述多个实体中每个实体的节点数据,以及每个实体与其他实体之间在所述知识图谱中的边数据,生成所述知识图谱。

在一种可能的实施方式中,所述存储系统还包括连接器;

所述连接器,用于将所述计算引擎生成的所述知识图谱进行序列化,并将所述序列化后的知识图谱发送至所述分布式文件存储数据库。

在一种可能的实施方式中,所述分布式文件存储数据库,具体用于根据以下步骤将所述知识图谱进行存储:

将所述知识图谱中的每个实体对应的属性数据和关系数据分别进行存储;所述关系数据以三元组的形式进行存储;

其中,所述三元组包括第一实体-关系-第二实体,所述关系包括属性类型和属性值,所述第一实体和所述第二实体为所述多个实体中的两个不同实体。

在一种可能的实施方式中,所述分布式文件存储数据库还用于:

根据所述多个实体中每个实体的身份标识建立索引,以供用户通过所述身份标识检索对应实体的实体数据;

其中,所述属性数据包括所述身份标识。

在一种可能的实施方式中,所述存储系统还包括数据调用模块和展示模块;

所述数据调用模块,用于从所述分布式文件存储数据库读取所述知识图谱,并根据目标属性类型,从所述知识图谱中筛选出与所述目标属性类型对应的点数据和边数据;

所述展示模块,用于展示所述数据调用模块筛选出的与所述目标属性类型对应的点数据和边数据。

第二方面,本申请实施例还提供一种知识图谱的存储方法,存储方法包括:

获取与目标业务对应的多个实体的实体数据,并根据所述实体数据生成所述目标业务对应的知识图谱;所述实体数据包括所述多个实体中每个实体的属性数据和关系数据;

将所述知识图谱进行存储。

在一种可能的实施方式中,所述存储方法还包括:

存储关系型数据,所述关系型数据包括所述实体数据。

在一种可能的实施方式中,所述根据所述实体数据生成所述目标业务对应的知识图谱,包括:

根据所述多个实体中每个实体的属性数据,建立每个实体对应的节点在所述知识图谱中的节点数据;

根据所述多个实体中每个实体的关系数据,建立每个实体与其他实体之间在所述知识图谱中的边数据;所述其他实体为所述多个实体中除该实体之外的实体;所述边数据包括属性类型和属性值;

根据所述多个实体中每个实体的节点数据,以及每个实体与其他实体之间在所述知识图谱中的边数据,生成所述知识图谱。

在一种可能的实施方式中,所述将所述知识图谱进行存储包括:

将所述知识图谱进行序列化,并将所述序列化后的知识图谱进行存储。

在一种可能的实施方式中,所述将所述知识图谱进行存储,包括:

将所述知识图谱中的每个实体对应的属性数据和关系数据分别进行存储;所述关系数据以三元组的形式进行存储;

其中,所述三元组包括第一实体-关系-第二实体,所述关系包括属性类型和属性值,所述第一实体和所述第二实体为所述多个实体中的两个不同实体。

在一种可能的实施方式中,所述存储方法还包括:

根据所述多个实体中每个实体的身份标识建立索引,以供用户通过所述身份标识检索对应实体的实体数据;

其中,所述属性数据包括所述身份标识。

在一种可能的实施方式中,所述存储方法还包括:

根据目标属性类型,从所述知识图谱中筛选出与所述目标属性类型对应的点数据和边数据;

展示筛选出的与所述目标属性类型对应的点数据和边数据。

第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行上述第二方面或第二方面中任一种可能的实施方式中所述的知识图谱的存储方法的步骤。

第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第二方面或第二方面中任一种可能的实施方式中所述的知识图谱的存储方法的步骤。

本申请实施例中,知识图谱的存储系统包括计算引擎和分布式文件存储数据库,通过计算引擎对获取的与目标业务对应的多个实体的实体数据进行计算,可以生成目标业务对应的知识图谱,其中,实体数据包括多个实体中每个实体的属性数据和关系数据,并通过分布式文件存储数据库将知识图谱进行存储。采用上述方式,本申请通过计算引擎进行知识图谱的计算,通过分布式文件存储数据库对知识图谱进行存储,实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种知识图谱的存储系统的结构示意图之一;

图2示出了本申请实施例所提供的一种知识图谱的存储系统的结构示意图之二;

图3示出了本申请实施例所提供的一种知识图谱的存储方法的流程图;

图4示出了本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。

另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“知识图谱的计算和存储”,给出以下实施方式,对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。

本申请实施例下述方法、装置、电子设备或计算机可读存储介质可以应用于任何需要进行知识图谱计算和存储的场景,本申请实施例并不对具体的应用场景作限制,任何使用本申请实施例提供的知识图谱的存储系统及方法的方案均在本申请保护范围内。

值得注意的是,在本申请提出之前,现有方案中,知识图谱的存储结构设计没有统一的标准,对于数据量不是很大且结构固定的图谱,通常使用传统数据库和关系表进行存储。但是,在数据量大的情况下,一个实体通常会包含众多属性,如果同时计算这些属性并存储到传统数据库,比如图形数据库,会大大降低数据计算、存储、检索的效率。

针对上述问题,本申请实施例中,知识图谱的存储系统包括计算引擎和分布式文件存储数据库,通过计算引擎对获取的与目标业务对应的多个实体的实体数据进行计算,可以生成目标业务对应的知识图谱,其中,实体数据包括多个实体中每个实体的属性数据和关系数据,并通过分布式文件存储数据库将知识图谱进行存储。采用上述方式,本申请通过计算引擎进行知识图谱的计算,通过分布式文件存储数据库对知识图谱进行存储,实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。

如图1、图2所示,图1为本申请实施例所提供的一种知识图谱的存储系统100的结构示意图之一;图2为本申请实施例所提供的一种知识图谱的存储系统100的结构示意图之二。如图1和图2所示,本申请实施例提供的知识图谱的存储系统100包括计算引擎110和分布式文件存储数据库120。

所述计算引擎110,用于获取与目标业务对应的多个实体的实体数据,并根据所述实体数据生成所述目标业务对应的知识图谱;所述实体数据包括所述多个实体中每个实体的属性数据和关系数据。

在具体实施中,计算引擎110在确定出要进行的目标业务后,获取与目标业务对应的多个实体的实体数据,并利用实体数据建立目标业务对应的知识图谱。

这里,实体数据包括多个实体中每个实体的属性数据和关系数据,若实体为人员,则属性数据可以为人员的名字、性别、年龄、身高、居住地等,关系数据可以理解为人员与人员之间的通联数据,比如通话数据、短信数据、物流数据、快递数据、即时通信录好友等。目标业务可以为各个类型的业务,比如,犯罪份子的追踪业务、涉毒终点人挖掘业务等。

需要说明的是,计算引擎110可以为spark,计算引擎110是专为大规模数据处理而设计的快速通用的计算引擎。利用计算引擎110提供的图计算软件(sparkgraphx)可以根据实体数据生成知识图谱。利用知识图谱,可以很好的组织和保存数据以及数据之间的关联,这种结构化的数据存储格式,能减轻甚至避免数据挖掘和计算的难度,从数据中发掘出更多有效的信息,开发出更多的应用场景。

所述分布式文件存储数据库120,用于获取所述知识图谱,并将所述知识图谱进行存储。

在具体实施中,分布式文件存储数据库120从计算引擎110中获取目标业务对应的知识图谱,并将知识图谱进行存储。

这里,分布式文件存储数据库120可以为mongodb,分布式文件存储数据库120是一个面向文档的数据库,它并不是关系型数据库,支持的数据结构非常松散,可以直接存取二进制序列化文档格式(binaryserializeddocumentformat,bson),是类似对象简谱(javascriptobjectnotation,json)格式,因此可以存储比较复杂的数据类型,这意味着分布式文件存储数据库120更加灵活,可以在文档中直接插入数组之类的复杂数据类型。分布式文件存储数据库120最大的特点是支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

这里,选用分布式文件存储数据库120,而不使用分布式文件系统(hadoopdistributedfilesystem,hdfs),一方面,是在存储方式上,hdfs以文件为单位,每个文件64mb~128mb不等,而分布式文件存储数据库120作为文档数据库则表现得更加细颗粒化;另一方面,分布式文件存储数据库120支持hdfs所没有的索引的概念,所以在读取上更加快分布式文件存储数据库120支持的增、删、改功能比hdfs更加易于修改写入后的数据;又一方面,hdfs的响应级别为分钟,而分布式文件存储数据库120通常是毫秒级别。

需要说明的是,现有技术中,在数据量大的情况下,一个实体通常会包含众多属性,同时计算这些属性并存储到传统数据库,比如图形数据库,这样,会导致大大降低数据计算、存储、检索的效率的情况发生。这里,本申请中提供的知识图谱的存储系统100包括计算引擎110和分布式文件存储数据库120,通过计算引擎110进行知识图谱的计算,通过分布式文件存储数据库120对知识图谱进行存储,实现了知识图谱的计算和存储的分离,可以适用于各种大数据知识图谱的存储,可以提升数据计算、存储、检索的效率。

在一种可能的实施方式中,如图2所示,所述知识图谱的存储系统100还包括管理关系数据库130;

所述管理关系数据库130,用于存储关系型数据,所述关系型数据包括所述实体数据。

在具体实施中,管理关系数据库130中存储有实体数据,实体数据中的属性数据以实体表的形式进行存储,实体数据中的关系数据以关系表的形式进行存储。

这里,管理关系数据库130(relationaldatabasemanagementsystem:rdbms),是指包括相互联系的逻辑组织和存取这些数据的一套程序,用于存储关系型数据,常用的管理关系数据库包括oracle数据库、db2数据库和sqlserver数据库。

在一种可能的实施方式中,如图1和2所示,所述计算引擎110,具体用于根据以下步骤生成所述知识图谱:

步骤(1):根据所述多个实体中每个实体的属性数据,建立每个实体对应的节点在所述知识图谱中的节点数据。

在具体实施中,计算引擎110可以从管理关系数据库130中的实体表和关系表中获取到多个实体的实体数据,进而根据多个实体的实体数据构建出知识图谱的节点数据和边数据,以根据节点数据和边数据生成知识图谱。具体地,计算引擎110根据多个实体中每个实体的属性数据,建立每个实体对应的节点在所述知识图谱中的节点数据。

一示例中,目标业务为涉毒重点人挖掘业务,实体可以为人员,人员的属性数据可以为身份证号、性别、年龄、身高、居住地,每个节点的节点数据可以包括该节点对应人员的属性数据。

步骤(2):根据所述多个实体中每个实体的关系数据,建立每个实体与其他实体之间在所述知识图谱中的边数据;所述其他实体为所述多个实体中除该实体之外的实体;所述边数据包括属性类型和属性值。

在具体实施中,计算引擎110根据多个实体中每个实体的关系数据,建立每个实体与其他实体之间在所述知识图谱中的边数据,这里,边数据包括属性类型和属性值。

这里,一个实体与另一个实体之间的每种属性类型对应的属性值,可以为该属性类型对应的通联次数,比如,属性类型为通话数据,属性值可以为人员a与人员b之间的通话次数、通话时长等。

一示例中,属性类型包括物流、短信、通话等表数据,读取物流记录,查找快递的发件方和接收方的电话号码分别对应的实体,用一条物流数据构建一条边,边数据包括发件时间、快递内容;读取短信记录,查找短信发送方和接收方的电话号码分别对应的实体,用一条短消息构建一条边,边数据包括发信时间、短信内容;读取通话记录,查找通话记录主叫方和被叫方的电话号码分别对应的实体,用一条通话记录构建一条边,边数据包括通话时间和时长信息。

步骤(3):根据所述多个实体中每个实体的节点数据,以及每个实体与其他实体之间在所述知识图谱中的边数据,生成所述知识图谱。

在具体实施中,计算引擎110根据多个实体中每个实体的节点数据,以及每个实体与其他实体之间在知识图谱中的边数据,生成目标业务的知识图谱。这里,知识图谱可以展示出多个实体对应的节点数据,以及多个实体中任意两个实体之间关系的边数据,即将大规模数据中的隐藏的知识抽取出来,构建出一个基于图的数据模型。

需要说明的是,本申请采用计算引擎110提供的图计算软件构建目标业务对应的知识图谱,图数据不仅关注事物,还关注事物之间的联系。图是由节点集合及节点间的关系集合(边集合)组成的一种数据结构,一般知识图谱图中,实体为节点,关系为边,在有向图中,一条边连接的两个节点为两个不同的实体,在一个无向图中,边没有方向,即关系都是对等的,比如即时通信录中的好友,如果边都有方向,那么图就是有向图。

在一种可能的实施方式中,如图2所示,所述知识图谱的存储系统100还包括连接器140;

所述连接器140,用于将所述计算引擎110生成的所述知识图谱进行序列化,并将所述序列化后的知识图谱发送至所述分布式文件存储数据库120。

在具体实施中,为了便于传输和缩小知识图谱所占用的空间,连接器140将计算引擎110生成的知识图谱进行序列化,即将知识图谱的图对象的转换为可以存储或传输的形式的过程,可以为json结构,方便保存。在序列化期间,将图对象写入到临时或持久性存储区,通常,对象实例的所有字段都会被序列化,这意味着数据会被表示为实例的序列化数据,即将知识图谱中的图对象换成二进制串的过程,简单来说,序列化就是将我们生成的对象进行存储起来(比如磁盘上),以将序列化后的知识图谱传输给分布式文件存储数据库120。

这里,分布式文件存储数据库120最大的字段大小为16m=1024*1024b=1048576b,假设我们每条边的平均占用100b,那么保守估计至少可以存储10000条边,这个数字远远超过了前端的渲染速度和显示器的显示密度,而且还可以保证检索效率,远远超过传统图数据库检索的效率。

需要说明的是,连接器140为计算引擎110和分布式文件存储数据库120之间连接的中间件,这里,连接器140为spark-mongodb连接器,通过连接器140可以将计算引擎110与分布式文件存储数据库120连接起来。

在一种可能的实施方式中,如图1和2所示,所述分布式文件存储数据库120,具体用于根据以下步骤将所述知识图谱进行存储:

将所述知识图谱中的每个实体对应的属性数据和关系数据分别进行存储;所述关系数据以三元组的形式进行存储;其中,所述三元组包括第一实体-关系-第二实体,所述关系包括属性类型和属性值,所述第一实体和所述第二实体为所述多个实体中的两个不同实体。

在具体实施中,分布式文件存储数据库120将知识图谱中的每个实体对应的属性数据和关系数据分别进行存储,即将节点数据与边数据分开进行存储,这里,关系数据以三元组的形式进行存储。

一示例中,知识图谱中包含3个节点1、节点2、节点3,其中,节点1和节点3之间有通话10次,节点1和节点3之间有物流8次,节点2和节点3之间有物流2次,节点2和节点3之间有短信3次,则节点1和节点3之间的关系数据对应的三元组形式为<节点1-通话10次-节点3>和<节点1-物流8次-节点3>,节点2和节点3之间的关系数据对应的三元组形式为<节点2-物流2次-节点3>和<节点2-短信3次-节点3>。

在一种可能的实施方式中,如图1和2所示,所述分布式文件存储数据库120还用于:

根据所述多个实体中每个实体的身份标识建立索引,以供用户通过所述身份标识检索对应实体的实体数据;其中,所述属性数据包括所述身份标识。

在具体实施中,分布式文件存储数据库120在获取到知识图谱后,从知识图谱中提取出多个实体中每个实体的身份标识,身份标识为可以唯一表征实体的标识,若实体为人员,守则身份标识可以为身份证号码,并根据身份标识来建立索引,这样,用户可以通过身份标识检索出与该身份标识对应实体的实体数据,而采用传统数据库不支持这种检索的建立方式,这里,实体数据包括该实体的属性数据和该实体与其他实体之间的关联数据。

在一种可能的实施方式中,如图2所示,所述知识图谱的存储系统100还包括数据调用模块150和展示模块160;其中,所述数据调用模块150,用于从所述分布式文件存储数据库120读取所述知识图谱,并根据目标属性类型,从所述知识图谱中筛选出与所述目标属性类型对应的点数据和边数据;所述展示模块160,用于展示所述数据调用模块150筛选出的与所述目标属性类型对应的点数据和边数据。

在具体实施中,知识图谱的存储系统100还包括数据调用模块150和展示模块160,通过数据调用模块150可以从分布式文件存储数据库120读取知识图谱,并从知识图谱中筛选出与目标属性类型对应的点数据和边数据,以实现对特定属性的实体进行筛选,进一步地,通过展示模块160展示数据调用模块150筛选出的与目标属性类型对应的点数据和边数据,在展示时,根据人员的特定属性进行分类,页面可以以不同的颜色来标识不同类型的实体,不同类型的关系也可以用不同颜色来标识。

在本申请实施例中,知识图谱的存储系统100包括计算引擎110和分布式文件存储数据库120,通过计算引擎110对获取的与目标业务对应的多个实体的实体数据进行计算,可以生成目标业务对应的知识图谱,其中,实体数据包括多个实体中每个实体的属性数据和关系数据,并通过分布式文件存储数据库120将知识图谱进行存储。采用上述方式,本申请通过计算引擎110进行知识图谱的计算,通过分布式文件存储数据库120对知识图谱进行存储,实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

基于同一申请构思,本申请实施例中还提供了与知识图谱的存储系统对应的知识图谱的存储方法,由于本申请实施例中的方法解决问题的原理与本申请上述实施例的知识图谱的存储系统相似,因此方法的实施可以参见系统的实施,重复之处不再赘述。

如图3所示,为本申请实施例提供的知识图谱的存储方法的流程图。如图3所示,知识图谱的存储方法包括以下步骤:

s301:获取与目标业务对应的多个实体的实体数据,并根据所述实体数据生成所述目标业务对应的知识图谱;所述实体数据包括所述多个实体中每个实体的属性数据和关系数据。

s302:将所述知识图谱进行存储。

在本申请实施例中,通过对获取的与目标业务对应的多个实体的实体数据进行计算,可以生成目标业务对应的知识图谱,其中,实体数据包括多个实体中每个实体的属性数据和关系数据,并通过将知识图谱进行存储。采用上述方式,本申请通过实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

在一种可能的实施方式中,所述存储方法还包括:

存储关系型数据,所述关系型数据包括所述实体数据。

在一种可能的实施方式中,所述根据所述实体数据生成所述目标业务对应的知识图谱,包括:

根据所述多个实体中每个实体的属性数据,建立每个实体对应的节点在所述知识图谱中的节点数据;

根据所述多个实体中每个实体的关系数据,建立每个实体与其他实体之间在所述知识图谱中的边数据;所述其他实体为所述多个实体中除该实体之外的实体;所述边数据包括属性类型和属性值;

根据所述多个实体中每个实体的节点数据,以及每个实体与其他实体之间在所述知识图谱中的边数据,生成所述知识图谱。

在一种可能的实施方式中,所述将所述知识图谱进行存储包括:

将所述知识图谱进行序列化,并将所述序列化后的知识图谱进行存储。

在一种可能的实施方式中,所述将所述知识图谱进行存储,包括:

将所述知识图谱中的每个实体对应的属性数据和关系数据分别进行存储;所述关系数据以三元组的形式进行存储;

其中,所述三元组包括第一实体-关系-第二实体,所述关系包括属性类型和属性值,所述第一实体和所述第二实体为所述多个实体中的两个不同实体。

在一种可能的实施方式中,所述存储方法还包括:

根据所述多个实体中每个实体的身份标识建立索引,以供用户通过所述身份标识检索对应实体的实体数据;

其中,所述属性数据包括所述身份标识。

在一种可能的实施方式中,所述存储方法还包括:

根据目标属性类型,从所述知识图谱中筛选出与所述目标属性类型对应的点数据和边数据;

展示筛选出的与所述目标属性类型对应的点数据和边数据。

在本申请实施例中,通过获取的与目标业务对应的多个实体的实体数据进行计算,可以生成目标业务对应的知识图谱,其中,实体数据包括多个实体中每个实体的属性数据和关系数据,并通过将知识图谱进行存储。采用上述方式,本申请实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

基于同一申请构思,参见图4所示,为本申请实施例提供的一种电子设备400的结构示意图,包括:处理器410、存储器420和总线430,所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过所述总线430进行通信,所述机器可读指令被所述处理器410运行时执行上述的知识图谱的存储方法的步骤。

具体地,所述机器可读指令被所述处理器410执行时可以执行如下处理:

获取与目标业务对应的多个实体的实体数据,并根据所述实体数据生成所述目标业务对应的知识图谱;所述实体数据包括所述多个实体中每个实体的属性数据和关系数据;

将所述知识图谱进行存储。

在本申请实施例中,通过获取的与目标业务对应的多个实体的实体数据进行计算,可以生成目标业务对应的知识图谱,其中,实体数据包括多个实体中每个实体的属性数据和关系数据,并通过将知识图谱进行存储。采用上述方式,本申请实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例提供的知识图谱的存储方法的步骤。

具体地,所述存储介质能够为通用的存储介质,如移动磁盘、硬盘等,所述存储介质上的计算机程序被运行时,能够执行上述知识图谱的存储方法,通过将知识图谱的计算和存储进行分离,实现了知识图谱的计算和存储的分离,可以提升数据计算、存储、检索的效率。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1