一种基于数据关联识别的自然资源数据体系建设方法与流程

文档序号:36651214发布日期:2024-01-06 23:36阅读:27来源:国知局
一种基于数据关联识别的自然资源数据体系建设方法与流程

本发明涉及自然资源数据,具体涉及一种基于数据关联识别的自然资源数据体系建设方法。


背景技术:

1、现有的自然资源数据中心的建设思路是在现有的数据基础上,梳理数据资源,分析各类数据间的层次、类别和关系,对数据资源进行统一规划,制定统一的数据资源编码与分类体系、建立自然资源“一张图”数据资源目录,按照自然资源管理的业务需求和数据库的建设进度,成熟一个,整合集成一个,持续集成整合自然资源数据。但是在这种建设模式下,各类数据的关联关系上主要依托空间关系,并没有深入挖掘自然资源数据之间的关联体系。而且,这种建设模式下,仅仅从数据层面进行数据层面的关联关系的梳理,在数据层面上虽然实现统一管理,但在使用时还需要对各结构数据进行人为梳理后才可以进行应用,同时数据层面管理结构也比较复杂,导致应用层面操作管理冗杂,统一性差,用户体验感差。


技术实现思路

1、本发明的目的在于提供一种基于数据关联识别的自然资源数据体系建设方法,以解决现有技术中在使用时还需要对各结构数据进行人为梳理后才可以进行应用,同时数据层面管理结构也比较复杂,导致应用层面操作管理冗杂,统一性差,用户体验感差的技术问题。

2、为解决上述技术问题,本发明具体提供下述技术方案:

3、一种基于数据关联识别的自然资源数据体系建设方法,包括以下步骤:

4、步骤s1、对自然资源的多源数据进行关联性识别,获取多源数据间的关联关系网络;

5、步骤s2、利用相关性优化目标和冗余性优化目标构建数据分析意图模型,利用数据分析意图模型对自然资源的多源数据进行意图分类得到意图分类网络;

6、步骤s3、将意图分类网络与关联关系网络进行融合得到意图关联网络,对意图关联网络进行网络分析确定出中心意图,利用非中心意图、中心意图以及获取中心意图所需的多源数据为体系结构构建出自然资源数据最简应用体系。

7、作为本发明的一种优选方案,所述对自然资源的多源数据进行关联性识别,包括:

8、将自然资源的任意两个多源数据进行时序性相似度量化,并将时序性相似度量化结果作为任意两个多源数据间的关联性;

9、所述时序性相似度量化利用相关系数、欧氏距离或余弦公式中的至少一种进行计算。

10、作为本发明的一种优选方案,所述获取多源数据间的关联关系网络,包括:

11、利用复杂网络技术将各个多源数据抽象为各个网络节点,将任意两个网络节点之间均设置连接边;

12、将任意两个多源数据间的关联性抽象为对应两个网络节点间的连接边权重,得到所述关联关系网络。

13、作为本发明的一种优选方案,所述利用相关性优化目标和冗余性优化目标构建数据分析意图模型,包括:

14、利用秩相关系数构建相关性优化目标,所述相关性优化目标用于使得多源数据与意图的相关性最大,所述相关性优化目标函数表达式为:

15、

16、式中,max为最大化运算符,sp为相关性优化目标值,xi为多源数据中的第i个分量值,ym为第m个意图,n为多源数据中的分量值总数量,i,m为计数变量;

17、利用协方差构建冗余性优化目标,所述冗余性优化目标用于使得归属同一意图的多源数据间冗余性最小,所述冗余性优化目标函数表达式为:

18、

19、式中,min为最小化运算符,mc为冗余性优化目标值,lk为第k个多源数据,sj为归属同一意图的第j个多源数据,cov为协方差运算符,d为归属同一意图的多源数据的总数量,k,j为计数变量;

20、将相关性优化目标和冗余性优化目标进行权重组合作为快速关联的过滤算法的目标函数,以构建出确定每个意图所需的多源数据的数据分析意图模型,实现意图与多源数据间的特征选择具有最大相关性和最小冗余性。

21、作为本发明的一种优选方案,所述将相关性优化目标和冗余性优化目标进行权重组合,包括:

22、计量自然资源的多源数据在每次更新后的信息量,以信息量构建出相关性优化目标和冗余性优化目标的组合权重,其中,所述相关性优化目标的组合权重为:

23、

24、式中,vh为自然资源的多源数据的第h次更新后相关性优化目标的组合权重,lh为自然资源的多源数据的第h次更新后多源数据的信息量,h为更新次数的计数变量,k为自然资源的多源数据的第h次更新后归属于同一意图的多源数据的信息量;

25、所述冗余性优化目标的组合权重为:

26、

27、式中,wh为自然资源的多源数据的第h次更新后冗余性优化目标的组合权重,lenrh为自然资源的多源数据的第h次更新后的归属于同一意图的多源数据的信息量,lenrh为自然资源的多源数据的第h次更新后的未归属于同一意图的多源数据的信息量;

28、利用相关性优化目标和冗余性优化目标的组合权重对相关性优化目标和冗余性优化目标进行权重组合,所述相关性优化目标和冗余性优化目标的权重组合公式为:

29、fh=wh*maxsp+vh*minmc;

30、式中,fh为自然资源的多源数据的第h次更新后快速关联的过滤算法的目标函数,sp为相关性优化目标,mc为冗余性优化目标,wh为自然资源的多源数据的第h次更新后冗余性优化目标的组合权重,vh为自然资源的多源数据的第h次更新后相关性优化目标的组合权重。

31、作为本发明的一种优选方案,所述利用数据分析意图模型对自然资源的多源数据进行意图分类得到意图分类网络,包括:

32、将数据分析意图模型利用快速关联的过滤算法进行求解,以实现对自然资源的多源数据进行意图分类得到确定每个意图所需的所有多源数据;

33、利用复杂网络技术将意图抽象为网络根节点,将意图所需的所有多源数据抽象为网络支节点,在网络根节点和网络支节点之间设置有连接边对网络跟节点和网络支节点进行连接得到所述意图分类网络。

34、作为本发明的一种优选方案,所述将意图分类网络与关联关系网络进行融合得到意图关联网络,包括:

35、将关联关系网络中的网络节点利用在意图关联网络中与网络节点一致的网络支节点归属的网络根节点进行替换,将替换后的关联关系网络更新为意图关联网络。

36、作为本发明的一种优选方案,所述对意图关联网络进行网络分析确定出中心意图,包括:

37、利用节点中心度在意图关联网络中计算出中心网络节点,将中心网络节点对应的意图作为中心意图。

38、作为本发明的一种优选方案,所述利用非中心意图、中心意图以及获取中心意图所需的多源数据为体系结构构建出自然资源数据最简应用体系,包括:

39、将非中心意图作为数据顶层结构,中心意图作为数据中间层结构,以及获取中心意图所需的多源数据为数据底层结构;

40、依次将数据顶层结构、数据中间层结构和数据底层结构依次排列构建出数据层次体系作为自然资源数据最简应用体系。

41、作为本发明的一种优选方案,将所述自然资源的各个多源数据进行归一化处理。

42、本发明与现有技术相比较具有如下有益效果:

43、本发明将意图分类网络与关联关系网络进行融合得到意图关联网络,对意图关联网络进行网络分析确定出中心意图,利用非中心意图、中心意图以及获取中心意图所需的多源数据为体系结构构建出自然资源数据最简应用体系,自然资源数据最简应用体系能够直接实现自然资源的数据化应用,将数据层面结构建立为应用层面的最简体系结构,在使用时无需对各结构数据进行人为梳理后才可以进行应用,结果简单直接,应用层面操作管理直观,统一性强,用户体验感好。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1