基于知识图谱获取地理产品数据的方法和装置与流程

文档序号:17990385发布日期:2019-06-22 00:44阅读:191来源:国知局
基于知识图谱获取地理产品数据的方法和装置与流程

本发明实施例涉及遥感技术领域,尤其涉及一种基于知识图谱获取地理产品数据的方法和装置。



背景技术:

遥感和gis(geographicinformationsystem,地理信息系统)技术发展至今,积累了大量的星地多源数据。从农业到环保到气象,地信遥感数据的应用领域不断纵深。但这些数据由于数据类型不同、结构不统一、数据源多样化、还有多提供方的原因导致如今已有的数据信息分散,关联体系模糊。如何将海量的、分散的数据进行结构化存储,建立起清晰的关联体系,并加以管理、共享及应用,是推进地信遥感领域发展的关键问题。

目前已有的遥感数据组织方法绝大部分是面向数据存储的组织管理方法,多采用数据库与文件系统相结合的方式进行存储组织,元数据存储在静态结构的数据库表中,数据实体存储在文件系统中,通过检索接口与数据存取访问接口对遥感数据进行检索与读写访问。各个数据提供方独立完成了对数据文件的存储,对外提供了检索与获取的接口。

各个独立的资源提供方对星地多源数据的存储及对外共享虽然已经实现,但由于遥感数据多语义性、多时空性、获取手段及存储格式的多样性等特点,海量的数据没有明确的关联体系和统一的存储结构,获取针对某一个需求的数据需要花费大量的时间和人力,效率低且精准度不高。



技术实现要素:

本发明实施例提供一种基于知识图谱获取地理产品数据的方法和装置,用以解决现有技术中获取数据效率低和精准度不高的问题。

本发明实施例提供一种基于知识图谱获取地理产品数据的方法,包括:

根据需求描述获取需要查询的产品的时间属性、空间属性和事件属性;

根据所述时间属性、空间属性和事件属性查询星地多源数据知识库,获取符合需求的产品数据;

其中,所述星地多源数据知识库中的数据以知识图谱形式存储,所述知识图谱由各节点和节点之间的关联关系组成,所述节点包括领域、场景、事件和产品资源,所述事件与场景关联、所述场景与领域关联且所述场景与产品资源关联。

本发明实施例提供一种基于知识图谱获取地理产品数据的装置,包括:

第一获取单元,用于根据需求描述获取需要查询的产品的时间属性、空间属性和事件属性;

第二获取单元,用于根据所述时间属性、空间属性和事件属性查询星地多源数据知识库,获取符合需求的产品数据;

其中,所述星地多源数据知识库中的数据以知识图谱形式存储,所述知识图谱由各节点和节点之间的关联关系组成,所述节点包括领域、场景、事件和产品资源,所述事件与场景关联、所述场景与领域关联且所述场景与产品资源关联。

本发明实施例还提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于知识图谱获取地理产品数据的方法。

本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于知识图谱获取地理产品数据的方法。

本发明实施例提供的基于知识图谱获取地理产品数据的方法和装置,根据需要查询的产品的时间、空间和事件属性查询星地多源数据知识库中的知识图谱,能够高效、精准的获取到需求所对应的产品数据。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的基于知识图谱获取地理产品数据的方法的流程示意图;

图2为本发明一实施例提供的知识图谱的结构示意图;

图3为本发明一实施例提供的产品资源的统一规范化存储格式示意图;

图4为本发明一实施例提供的知识图谱的建立和存储的方法的流程示意图;

图5为本发明一实施例提供的基于知识图谱的节点及节点关系在图数据库中的表达示意图;

图6为本发明一实施例提供的基于知识图谱获取地理产品数据的系统架构图;

图7为本发明一实施例提供的基于知识图谱获取地理产品数据的装置的结构示意图;

图8为本发明又一实施例提供的基于知识图谱获取地理产品数据的装置的结构示意图;

图9为本发明一实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1示出了本发明实施例提供的一种基于知识图谱获取地理产品数据的方法的流程示意图。

如图1所示,本发明实施例提供的基于知识图谱获取地理产品数据的方法具体包括以下步骤:

s11、根据需求描述获取需要查询的产品的时间属性、空间属性和事件属性;

具体地,根据需求描述分析出需求的时间、空间和事件等属性信息。

s12、根据所述时间属性、空间属性和事件属性查询星地多源数据知识库,获取符合需求的产品数据;

其中,所述星地多源数据知识库中的数据以知识图谱形式存储,所述知识图谱由各节点和节点之间的关联关系组成,所述节点包括领域、场景、事件和产品资源,所述事件与场景关联、所述场景与领域关联且所述场景与产品资源关联。

具体地,知识图谱已经普遍利用在互联网及其它领域,知识图谱的建立就是把非结构化、半结构化的数据从获取到关联融合到最后的存储及应用。

本发明实施例提供的知识图谱的节点包括:领域、场景、事件和产品资源,各节点之间相互关联。

图2示出了本发明实施例提供的知识图谱的结构示意图。

如图2所示,星地多源数据所属的领域包括自然灾害领域,领域包括多种场景,如洪涝、干旱、火灾等;各场景下覆盖多个事件,如火灾场景覆盖大兴火灾事件,干旱场景覆盖阿拉善干旱事件;产品资源包括火灾遥感图像、火灾视频等。从而知识图谱能够提供一个从关联关系的角度分析需求的能力,获取需求所对应的产品资源数据。

本发明实施例提供的基于知识图谱获取地理产品数据的方法,根据需要查询的产品的时间、空间和事件查询星地多源数据知识库中的知识图谱,能够高效、精准的获取到需求所对应的产品数据。

在上述实施例的基础上,所述产品资源包括多个子节点,所述子节点包括描述信息、时间、空间、图片、音频、视频和服务。

具体地,产品资源为将星地多源数据结构化的、具有统一的规范化存储格式的产品数据。

图3示出了产品资源的统一规范化存储格式示意图。

如图3所示,产品资源构造成一个由多个子节点组成的树状结构,各子节点为产品资源的属性信息,包括:产品名、描述信息、时间、空间、图片、音频、视频、服务等,各子节点又包括下一级的属性信息,如图片又包含了图片名称和地址等属性信息,视频又包含了图片名称和地址等属性信息,服务又包含了服务名称和url(uniformresourcelocator,统一资源定位符)等属性信息。

其中,产品资源的子节点与知识图谱中的场景节点关联,如产品资源的子节点“火灾视频”、“火灾遥感图像”,与场景“火灾”关联,产品资源的时间、空间属性与具体的某时间某地点发生的事件相匹配,从而从“关系”的角度获取到需求所对应的产品资源数据。

在上述实施例的基础上,s12具体包括:

根据需要查询的产品的事件属性查询知识图谱,获取与事件关联的场景;

根据获取的场景查询知识图谱,获取与场景关联的产品资源;

根据需要查询的产品的时间和空间属性查询所述产品资源,获取符合需求的产品数据。

具体地,根据需求描述分析出需求的时间、空间和事件属性,用事件查找出事件的上一级场景所对应的所有产品数据,再用事件的地理位置属性、时间属性从查出的数据中筛选出符合条件的产品。

在上述实施例的基础上,所述方法还包括知识图谱的建立和存储的步骤。

图4示出了本发明实施例提供的知识图谱的建立和存储的流程示意图。

具体地,知识图谱的建立和存储同步进行,如图4所示,具体步骤如下:

s21、获取星地多源数据所属的领域、场景和事件,创建为知识图谱的各节点,建立各节点的关联关系,并将各节点及节点间的关联关系保存到图数据库中;

在上述实施例的基础上,s21具体包括:

从地信遥感类的原始文本数据中提取出星地多源数据所属的领域类型、场景类型和事件类型,并创建成知识图谱的领域节点、场景节点和事件节点;

根据各领域包含的场景以及各场景覆盖的事件建立领域节点、场景节点和事件节点的关联关系。

具体地,通过网络知识爬取或本地抽取关于地信遥感类的文章、文献,得到星地多源数据所属的领域类型、场景类型、事件类型,将领域、场景和事件都创建成知识图谱中的一个节点,并以某个领域包含了哪些场景,每一个场景涵盖了哪些事件的关系将这些节点相互关联起来。

具体地,图数据库存储(neo4j)以解决关系型数据库在存储时空数据时存在的数据关系结构转换复杂、多表关联查询语句复杂和效率低、扩展性差等问题。在构建知识图谱的步骤中,都产生了一些基于知识图谱的节点及其关系,图数据库是储存这些节点及其关系最好的选择。

s22、获取星地多源数据并结构化处理为多个规范化格式的产品资源,将产品资源创建为知识图谱的节点,并保存到图数据库中;

在上述实施例的基础上,s22具体包括:

将星地多源数据进行描述信息编辑、矢量数据整饰、轨迹数据转换以及影像数据瓦片生产,生成离散的产品资源;

根据数据原有的信息和属性将每个离散的产品资源进行统一的结构化处理形成固定格式,所述固定格式为包括多个子节点的树状结构;

其中,所述子节点包括产品名、描述信息、时间、空间、图片、音频、视频和服务。

具体地,产品资源的获取可以从本地已有的星地多源数据进行信息编辑、矢量数据整饰、轨迹数据转换、影像数据瓦片生产,根据数据原有的信息和属性进行统一的结构化处理形成固定的格式(如图2所示),将产品资源构造成一个由节点组成的树状结构。或者从各资源提供方共享的已结构化的数据直接共享。

同理,采用图数据库存储产品资源节点。

s23、建立产品资源节点与场景节点的关联关系。

在上述实施例的基础上,s23具体包括:

根据产品资源的子节点建立产品资源节点与场景节点的关联关系。

具体地,图数据库保存基于知识图谱的节点及其关系,在图数据库中创建场景及其对应的产品资源的关系,操作如下:

match(s:scene)wheres.name=′火灾′create(b:product{name:′产品资源数据集′})-[r:linkto]->(a)returna,b,r。

图5示出了本发明实施例提供的基于知识图谱的节点及节点关系在图数据库中的表达示意图。

如图5所示,产品资源包含多个表示属性信息的子节点,产品资源与场景节点关联。

具体地,获取需求描述的产品时,采用neo4j本身提供cypher查询语句的方式查询图数据库,获取符合需求的产品数据。例如,用时间查找出事件的上一级场景所对应的产品资源的查询语句如下:

match(p:product)-[r]->(s:scene)wheres.name=′火灾′returnp。

图6示出了本发明实施例提供的基于知识图谱获取地理产品数据的系统架构图。

如图6所示,所述系统包括为资源提供方搭建的资源生产存储、管理及共享服务以及面向整个领域的资源聚合管理服务,其中:

资源生产存储、管理及共享服务中各资源提供方通过本地配置搭建的资源生产存储、管理及共享系统,具备对本地地理空间数据进行描述信息编辑、矢量数据整饰、轨迹数据转换、影像数据瓦片生产等分析处理能力,进而以统一标准规范化存储至本地服务器中,并能根据成果数据生成产品服务,最后共享至中心节点的资源聚合服务器,实现本系统与资源聚合管理系统同步信息资源,并提供各个节点服务器在内部对资源数据的搜索或获取能力;

资源聚合管理服务整合所有提供方系统节点共享的资源,并建立一套统一规范化存储形式,存储所有的数据资源。

本发明实施例提供的基于知识图谱获取地理产品数据的系统,通过搭建一套完整的数据资源共享与聚合服务,规范化数据存储结构及存储方式,构建出海量星地多源数据的关联关系,使得多个提供方提供的产品资源有组织的、关联性的形成一个全局共享型数据的关联关系体系,实现协同共享理念。

图7示出了本发明实施例提供的一种基于知识图谱获取地理产品数据的装置的结构示意图。

如图7所示,本发明实施例提供的基于知识图谱获取地理产品数据的装置包括:第一获取单元11和第二获取单元12,其中:

所述第一获取单元11,用于根据需求描述获取需要查询的产品的时间属性、空间属性和事件属性;

具体地,根据需求描述分析出需求的时间、空间和事件等属性信息。

所述第二获取单元12,用于根据所述时间属性、空间属性和事件属性查询星地多源数据知识库,获取符合需求的产品数据;

其中,所述星地多源数据知识库中的数据以知识图谱形式存储,所述知识图谱由各节点和节点之间的关联关系组成,所述节点包括领域、场景、事件和产品资源,所述事件与场景关联、所述场景与领域关联且所述场景与产品资源关联。

具体地,知识图谱已经普遍利用在互联网及其它领域,知识图谱的建立就是把非结构化、半结构化的数据从获取到关联融合到最后的存储及应用。

本发明实施例提供的知识图谱的节点包括:领域、场景、事件和产品资源,各节点之间相互关联。如图2所示,星地多源数据所属的领域包括自然灾害领域,领域包括多种场景,如洪涝、干旱、火灾等;各场景下覆盖多个事件,如火灾场景覆盖大兴火灾事件,干旱场景覆盖阿拉善干旱事件;产品资源包括火灾遥感图像、火灾视频等。从而知识图谱能够提供一个从关联关系的角度分析需求的能力,获取需求所对应的产品资源数据。

本发明实施例提供的基于知识图谱获取地理产品数据的装置,根据需要查询的产品的时间、空间和事件查询星地多源数据知识库中的知识图谱,能够高效、精准的获取到需求所对应的产品数据。

在上述实施例的基础上,所述产品资源包括多个子节点,所述子节点包括产品名、描述信息、时间、空间、图片、音频、视频和服务。

具体地,产品资源为统一的规范化存储格式,如图3所示,产品资源构造成一个由多个子节点组成的树状结构,各子节点为产品资源的属性信息,包括:产品名、描述信息、时间、空间、图片、音频、视频、服务等,各子节点又包括下一级的属性信息,如图片又包含了图片名称和地址等属性信息,视频又包含了图片名称和地址等属性信息,服务又包含了服务名称和url(uniformresourcelocator,统一资源定位符)等属性信息。

其中,产品资源的子节点与知识图谱中的场景节点关联,如产品资源的子节点“火灾视频”、“火灾遥感图像”与场景“火灾”关联,产品资源的时间、空间属性与具体的某时间某地点发生的事件相匹配,从而从“关系”的角度获取到需求所对应的产品资源数据。

在上述实施例的基础上,所述第二获取单元12包括:

第一查询模块,用于根据需要查询的产品的事件属性查询知识图谱,获取与事件关联的场景;

第二查询模块,用于根据获取的场景查询知识图谱,获取与场景关联的产品资源;

第三查询模块,用于根据需要查询的产品的时间和空间属性查询所述产品资源,获取符合需求的产品数据。

具体地,根据需求描述分析出需求的时间、空间和事件属性,用事件查找出事件的上一级场景所对应的所有产品数据,再用事件的地理位置属性、时间属性从查出的数据中筛选出符合条件的产品。

图8示出了本发明又一实施例提供的基于知识图谱获取地理产品数据的装置的结构示意图。

如图8所示,本发明实施例提供的基于知识图谱获取地理产品数据的装置包括:第一保存单元21、第二保存单元22和建立单元23,其中:

所述第一保存单元21,用于获取星地多源数据所属的领域、场景和事件,创建为知识图谱的各节点,建立各节点的关联关系,并将各节点及节点间的关联关系保存到图数据库中;

在上述实施例的基础上,所述第一保存单元21包括:

第一创建模块,用于从地信遥感类的原始文本数据中提取出星地多源数据所属的领域类型、场景类型和事件类型,并创建成知识图谱的领域节点、场景节点和事件节点;

关联模块,用于根据各领域包含的场景以及各场景覆盖的事件建立领域节点、场景节点和事件节点的关联关系。

具体地,通过网络知识爬取或本地抽取关于地信遥感类的文章、文献,得到星地多源数据所属的领域类型、场景类型、事件类型,将领域、场景和事件都创建成知识图谱中的一个节点,并以某个领域包含了哪些场景,每一个场景涵盖了哪些事件的关系将这些节点相互关联起来。

具体地,图数据库存储(neo4j)以解决关系型数据库在存储时空数据时存在的数据关系结构转换复杂、多表关联查询语句复杂和效率低、扩展性差等问题。在构建知识图谱的步骤中,都产生了一些基于知识图谱的节点及其关系,图数据库是储存这些节点及其关系最好的选择。

所述第二保存单元22,用于获取星地多源数据并结构化处理为多个规范化格式的产品资源,将产品资源创建为知识图谱的节点,并保存到图数据库中;

在上述实施例的基础上,所述第二保存单元22包括:

生成模块,用于将星地多源数据进行描述信息编辑、矢量数据整饰、轨迹数据转换以及影像数据瓦片生产,生成离散的产品资源;

处理模块,用于根据数据原有的信息和属性将每个离散的产品资源进行统一的结构化处理形成固定格式,所述固定格式为包括多个子节点的树状结构;

其中,所述子节点包括产品名、描述信息、时间、空间、图片、音频、视频和服务。

具体地,产品资源的获取可以从本地已有的星地多源数据进行信息编辑、矢量数据整饰、轨迹数据转换、影像数据瓦片生产,根据数据原有的信息和属性进行统一的结构化处理形成固定的格式(如图3所示),将产品资源构造成一个由节点组成的树状结构存储。或者从各资源提供方共享的已结构化的数据直接共享。

同理,采用图数据库存储产品资源节点。

所述建立单元23,用于建立产品资源节点与场景节点的关联关系。

在上述实施例的基础上,所述建立单元23,用于根据产品资源的子节点建立产品资源节点与场景节点的关联关系。

具体地,图数据库保存基于知识图谱的节点及其关系,在图数据库中创建场景及其对应的产品资源的关系,操作如下:

match(s:scene)wheres.name=′火灾′create(b:product{name:′产品资源数据集′})-[r:linkto]->(a)returna,b,r。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

举个例子如下:

图9示例了一种服务器的实体结构示意图,如图9所示,该服务器可以包括:处理器(processor)31、通信接口(communicationsinterface)32、存储器(memory)33和通信总线34,其中,处理器31,通信接口32,存储器33通过通信总线34完成相互间的通信。处理器31可以调用存储器33中的逻辑指令,以执行如下方法:根据需求描述获取需要查询的产品的时间属性、空间属性和事件属性;根据所述时间属性、空间属性和事件属性查询星地多源数据知识库,获取符合需求的产品数据;其中,所述星地多源数据知识库中的数据以知识图谱形式存储,所述知识图谱由各节点和节点之间的关联关系组成,所述节点包括领域、场景、事件和产品资源,所述事件与场景关联、所述场景与领域关联且所述场景与产品资源关联。

此外,上述的存储器33中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1