一种图数据库管理方法与流程

文档序号:21724658发布日期:2020-08-05 01:15阅读:213来源:国知局
一种图数据库管理方法与流程

本发明涉及电子信息技术领域,特别涉及一种图数据库管理方法。



背景技术:

进入信息化时代后,数据呈现爆炸式的增长。原有的关系型数据库存储方式对关联数据处理上显得略显吃力。而作为天然的处理关联关系上,图数据库管理支持对图数据模型的增、删、改、查(crud)方法。与关系型数据库和nosql存储处理关联数据相比,图数据库管理会有绝对的性能提升。随着数据集的不断增大,关系型数据库处理密集join查询的性能也会随之变差。而图数据库则不然。在数据集增大时,它的性能趋于保持不变,这是因为查询只是与图的一部分相关。图数据库一般用于事务(oltp)系统中。相应地,它们也对事务性能进行了优化,在设计时通常考虑了事务完整性和操作可用性。

针对现有的图数据库管理大都只能基于图数据库上进行增删改查操作,且无法自定义数据类型,只能根据图数据库中的数据类型去创建类型,所受限制较多。数据源导入也只能进行文本导入,无法有效的将其他数据源的数据进行导入和整合多图数据库。



技术实现要素:

本发明的目的旨在至少解决所述技术缺陷之一。

为此,本发明的目的在于提出一种图数据库管理方法。

为了实现上述目的,本发明的实施例提供一种图数据库管理方法,包括如下步骤:

步骤s1,新建知识本体模型,在图数据库中添加实体和关系类型,然后保存模型、实体和关系的结构,并将实体和关系的结构在es中建立索引;

步骤s2,新建模型后,新增实体和关系以添加,实体和关系数据在图数据库以及关系型数据库中存放数据,同时在es中建立索引,启动导入任务,将数据通过接口导入至图数据库中,导入完实体数据后再将关系映射的数据导入,在图数据库中保持数据;

步骤s3,在图数据库中保存数据后,执行子图展示,包括:设置路径条件进行筛选,设置完路径后获取所述路径条件的全路径,然后通过与图数据库中数据进行匹配,将匹配结果展示图谱页中;

步骤s4,通过图数据库管理平台,对图数据进行分类展示,在图数据将实体和关系的数据展现在页面中。

进一步,在所述步骤s1中,采用以下方式之一创建知识本体模型:

(1)通过上传.owl格式的模型文件解析模型信息入库创建本体模型;

(2)通过集成在平台工具内的即时创建本体模型。

进一步,在所述步骤s1中,所述关系类型包括:string文本类型、int数值型、double数值型、enum枚举、file多媒体文件、date以及自定义类型。

进一步,在所述步骤s2中,所述启动导入任务,包括如下步骤:

获取任务状态,判断任务是否为启动状态,如果是则根据任务id从import_record获取所有类型为节点的记录;

判断任务的所有节点的表是否都读取完成,如果是则根据任务id从import_record获取所有类型为关系的记录;然后判断任务的所有关系的表是否都读取完成;

如果判断任务的所有节点的表没有都读取完成,则第一次加载表则先获取表的总数量,然后分页读取第一个表的前n条数据,调用onet接口,写入接口;然后更新import_record,完成数据量,返回继续获取任务状态。

进一步,在所述步骤s3中,在图数据库中保存数据后,进一步执行预测推理,包括:设置路径条件,将路径上设置推理边的首尾节点做全路径匹配,得到匹配结果后在图谱中新增一条推理边。

进一步,在所述步骤s3中,在图数据库中保存数据后,进一步执行数据产品,包括:通过在图数据中直接映射,求总数并求和,通过平均值的方式将图数据库中的产生的中间结果作为一个实体保存到图库中。

进一步,在所述步骤s4中,进一步支持采用不同的布局方式拖动数据。

进一步,在所述步骤s2中,提供知识查询功能,包括:将图数据的元信息、实体关系的结构以及数据在es搜索引擎中建立部分索引,利用索引搜索到对应的数据结果,通过输入关键字以及选择搜索范围得到按照更新时间排序的结果。

本发明提供的图数据管理方法,搭建从创建知识本体模型到知识应用的全流程图数据管理工具,在通过rdf文件导入或即时本地创建本体模型后,能将关系库中的数据整合到图数据库中,支持多图数据库统一管理,通过知识查询将多图数据库中的实体类型,关系类型、实体数据、关系数据都统一展示。在图数据库中设置路径筛选、规则子图、数据推理增加推理边、在图数据中新增关联关系、属性映射与计算生成数据产品等,提供一套完整的、全流程式的新型图数据库管理方法。

根据本发明实施例的图数据库管理方法,提供完整的、全流程式的图数据库管理平台工具,通过模型管理新建实体与关系类型并设置具体属性完成本体创建,之后将关系型数据库导入到图数据库中,通过图谱展示的方式将图数据可视化。通过知识查询将所有的实体类型、关系类型、实体数据、关系数据以及各类规则都检索出来。通过路径探寻,快速定位两节点或多节点间的关系、子图规则组合筛选图数据库中符合条件的子图。预测推理通过设计条件路径预测出相关联的实体,增加推理边。数据产品通过属性映射与计算新增一个全新的实体。这些图数据管理方法和应用都能够使得本发明从图数据库中挖掘出深层次的、有意义的关联数据,为决策提供坚实的数据支持。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本发明实施例的图数据库管理方法的流程图;

图2为根据本发明实施例的图数据库管理方法的示意图;

图3为根据本发明实施例的启动导入任务的流程图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

本发明提出一种图数据库管理方法,该方法可以对图数据库进行管理,从创建本体模型、之后在图数据库基础上完成属性自定义、多图数据库管理、关系库数据导入到图数据库中、知识查询、预测推理、数据产品,涉及到大数据领域。

如图1和图2所示,本发明实施例的图数据库管理方法,包括:

步骤s1,新建知识本体模型,在图数据库中添加实体和关系类型,然后保存模型、实体和关系的结构,并将实体和关系的结构在es中建立索引。

在本步骤中,采用以下方式之一创建知识本体模型:

(1)通过上传.owl格式的模型文件解析模型信息入库创建本体模型;

(2)通过集成在平台工具内的即时创建本体模型。

综上,本发明除支持通过上传.owl格式的模型文件解析模型信息入库创建本体模型外,还提供即时本地创建本体功能,可通过集成在平台工具内的即时创建本体模型功能,完成知识本体模型创建,本体模型创建后支持灵活的本体模型修改功能。

在本发明的实施例中,关系类型包括:string文本类型、int数值型、double数值型、enum枚举、file多媒体文件、date以及自定义类型。需要说明的是,关系类型不包括上述举例,还可以根据用户需要进行添加设置。

在建立实体和关系结构后,会在数据库中保存模型、实体和关系的结构,并将实体和关系的结构在es中建立索引。

步骤s2,新建模型后,新增实体和关系以添加,实体和关系数据在图数据库以及关系型数据库中存放数据,同时在es中建立索引,启动导入任务,将数据通过接口导入至图数据库中,导入完实体数据后再将关系映射的数据导入,在图数据库中保持数据。

具体的,新建完模型后,可以通过新增实体以及关系来添加数据,实体和关系数据会在图数据库以及关系型数据库中存放数据,同时会在es中建立索引。在es中建立数据结构和数据的索引后,会按照不同的type分类建立索引,查询时候,将关键字与选择的type到es中匹配,并将匹配的结果分类展示。更新数据时会在关系库中将更新前的数据保存一份历史数据。本发明也可以使用从其他关系库中的数据导入到图数据库中,通过实体关系与数据库中字段一一映射,添加导入任务,添加导入任务后可以启动任务开始导入数据。

如图3启动导入任务流程所示,获取任务的状态,如果是启动状态,则先将实体映射的数据通过接口导入到图数据库中,导入完实体数据后再将关系映射的数据导入,导入结束后更新任务状态,标记导入结束。

参考图3,启动导入任务,包括如下步骤:

获取任务状态,判断任务是否为启动状态,如果是则根据任务id从import_record获取所有类型为节点的记录;

判断任务的所有节点的表是否都读取完成,如果是则根据任务id从import_record获取所有类型为关系的记录;然后判断任务的所有关系的表是否都读取完成;

如果判断任务的所有节点的表没有都读取完成,则第一次加载表则先获取表的总数量,然后分页读取第一个表的前n条数据,调用onet接口,写入接口;然后更新import_record,完成数据量,返回继续获取任务状态。

在本发明的实施例中,从关系库中映射导入到图库中,包括如下:

1)获取关系库中关系表和字段元数据:

从可视化界面上输入关系型数据库的ip地址、端口、用户名、密码等连接信息,获取到关系库的连接信息后尝试去连接关系型数据库,如果连接关系型数据库失败可视化界面会将报错返回数据库链接失败,反之链接成功会通过链接信息去找到关系库中的所有关系表以及每个关系表中的字段并且将表和字段显示在界面中。

2)关系表字段和图数据库字段做映射:

获取到关系库中的元数据后,本发明选择对应的本体库图数据库中之后会得到所有实体和关系的属性。选择需要映射的数据表以及本体库中实体和关系类型。

3)关系表字段和图数据库字段做映射:

实体映射是通过展开选择的实体中的所有属性后,点击关系型数据库中的字段后选择与实体属性一一对应关联。通过数据库的字段和实体属性的关联会将数据表中的数据映射到图数据库中。关系映射,先将关系型数据库中的字段与关系属性对应后,进入三元组映射,选择三元组的起点类型和终点类型。并且将关系的起始唯一标识id和终点唯一标识id与与关系型数据库中的字段对应。

本发明是基于图数据库做多模型的管理,通过图谱页的展示生动展示了实体与实体之间的关联。与关系库建立链接将关系型数据库中的数据映射导入到图库中,将数据类型和数据建立索引可以快速的查询结果,还能通过条件设置筛选出符合条件的子图进行展示并能导出数据,在路径上新增推理边能在对应图库条件匹配的数据中增加推理并区别展示,数据映射可以把不同实体上的数据映射计算成一个新的实体。这些知识应用使得数据能更有效的管理并运用。

进一步,本发明还可以提供知识查询功能,包括:将图数据的元信息、实体关系的结构以及数据在es搜索引擎中建立部分索引,利用索引搜索到对应的数据结果,通过输入关键字以及选择搜索范围得到按照更新时间排序的结果。其中,搜索范围例如为:模型、子图、子图规则、推理规则、实体类型、关系类型、实体、关系等。

步骤s3,在图数据库中保存数据后,执行子图展示,包括:设置路径条件进行筛选,设置完路径后获取路径条件的全路径,然后通过与图数据库中数据进行匹配,将匹配结果展示图谱页中。

具体来说,图管理是通过路径筛选出子图。首先需要选择子图中会出现的实体和关系,将这些实体和关系组成一条路径,然后在实体和关系上设置条件筛选,得到一个带有筛选条件的路径后。将路径中使用到的实体关系及其筛选条件到图数据库中去匹配,将图数据库中符合条件的实体和关系的唯一id保存到图数据库中,子图展示会通过这些结果的id到图数据库中获取到完整的数据并展示在图谱中。

在图数据中保存数据后,可以同时执行如下功能:子图展示、预测推理和数据产品。其中,预测推理和数据产品属于知识应用。

(1)子图展示

在图数据库中保存数据后,通过设置路径条件筛选,设置完路径后可以用dfs算法获取路径条件的全路径。获取到全路径后可以通过与图数据库中数据进行匹配,得到匹配结果后,将匹配结果展示图谱页中。

(2)预测推理

具体的,在图数据库中保存数据后,进一步执行预测推理,包括:设置路径条件,将路径上设置推理边的首尾节点做全路径匹配,得到匹配结果后在图谱中新增一条推理边。预测推理是将已存在或者新建的普通关系转化为推理边。首先选择对应的模型以及参与创建的实体和关系,通过选择的点与边建立路径后,在路径上增加一条关系并转换为推理边。通过推理边将有多度特殊关联的实体直接关联起来。在图数据库中按照推理边类型存储新增的关联关系。

(3)数据产品

在图数据库中保存数据后,进一步执行数据产品,包括:通过在图数据中直接映射,count求总数,sum并求和,通过avg平均值的方式将图数据库中的产生的中间结果作为一个实体保存到图库中。

数据产品是将符合筛选条件中的实体属性都映射到同一个实体上并在图数据库中创建实体数据。首先选择对应的模型以及参与创建的实体和关系,并且添加数据产品需要映射的属性,数据产品属性取值方式包括直接映射、求和、求总数、求平均值。之后通过实体和关系的筛选,将新增的数据产品与实体一一关联,关联包括直接映射实体的属性,对实体求总数以及对实体的数值型属性求和或者求平均值。关联后会在图数据中新增实体并作为数据产品。

步骤s4,通过图数据库管理平台,对图数据进行分类展示,在图数据将实体和关系的数据展现在页面中。

在本发明的实施例中,支持采用不同的布局方式拖动数据。例如,环形,树形、力学等七种方式。

需要说明的是,布局的方式不限于上述举例,还可以包括其他方式,在此不再赘述。

本发明提供的图数据管理方法,搭建从创建知识本体模型到知识应用的全流程图数据管理工具,在通过rdf文件导入或即时本地创建本体模型后,能将关系库中的数据整合到图数据库中,支持多图数据库统一管理,通过知识查询将多图数据库中的实体类型,关系类型、实体数据、关系数据都统一展示。在图数据库中设置路径筛选、规则子图、数据推理增加推理边、在图数据中新增关联关系、属性映射与计算生成数据产品等,提供一套完整的、全流程式的新型图数据库管理方法。

根据本发明实施例的图数据库管理方法,提供完整的、全流程式的图数据库管理平台工具,通过模型管理新建实体与关系类型并设置具体属性完成本体创建,之后将关系型数据库导入到图数据库中,通过图谱展示的方式将图数据可视化。通过知识查询将所有的实体类型、关系类型、实体数据、关系数据以及各类规则都检索出来。通过路径探寻,快速定位两节点或多节点间的关系、子图规则组合筛选图数据库中符合条件的子图。预测推理通过设计条件路径预测出相关联的实体,增加推理边。数据产品通过属性映射与计算新增一个全新的实体。这些图数据管理方法和应用都能够使得本发明从图数据库中挖掘出深层次的、有意义的关联数据,为决策提供坚实的数据支持。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1