一种矿产勘查数据优化存储方法与流程

文档序号:37753346发布日期:2024-04-25 10:40阅读:9来源:国知局
一种矿产勘查数据优化存储方法与流程

本技术涉及数字数据处理,具体涉及一种矿产勘查数据优化存储方法。


背景技术:

1、矿产勘察是地球科学的重要分支,涉及到对矿产资源分布和矿产资源潜力的研究和评估,对矿产资源的开发具有重大的作用。前期矿产勘察过程中的数据往往需要进行存储,目的是为后期的矿产资源的开发提供决策支持。但是,由于矿产勘察中的数据涉及时间、空间和属性特征上的数据,矿产勘察过程中的数据复杂性较高,其中包含冗余数据、无效信息数据的内容,这些冗余数据、无效信息数据不仅会对后期的调用产生困难,而且会极大地消耗存储资源,产生较大的存储负担。

2、为了给后期矿产资源的开发提供准确性、可靠性的矿产勘察数据,同时降低矿产勘察数据的存储负担,往往需要对矿产勘察数据进行优化存储。针对矿产勘察数据中冗余数据以及无效信息数据产生的影响,采用数据降维的方式剔除冗余数据以及无效信息数据,并进行存储,以求优化矿产勘察数据的存储信息以及存储空间。

3、pca主成分分析是一种传统的数据降维技术,作为一种经典的线性降维算法,能够有效地去除冗余数据以及无效信息数据,但是对数据线性特征的要求较高。而矿产勘察数据的复杂性,极易出现线性特征较差的数据,会导致数据降维的准确性较差,无法有效地优化矿产勘察数据,进而导致优化存储的效果较差。


技术实现思路

1、为了解决上述技术问题,本发明提供一种矿产勘查数据优化存储方法,以解决现有的问题。

2、本发明的一种矿产勘查数据优化存储方法采用如下技术方案:

3、本发明一个实施例提供了一种矿产勘查数据优化存储方法,该方法包括以下步骤:

4、采集各矿床的矿产资源勘察信息数据,包括矿床中矿石类型及各类型矿石的勘测时间、矿石量数据,以及各矿床中金属类型及各类型金属的勘测时间、金属量数据;

5、根据各类型矿石的勘测时间、矿石量和金属的勘测时间、金属量得到各矿床的矿石量组成序列和金属量组成序列;根据各矿床的矿石量组成序列中突变数据的数值变化得到各矿床的矿石量差异指数;获取各矿床的金属量差异指数;根据各矿床的矿石量、金属量差异指数得到各矿床的矿产资源奇异指数;根据各矿床的矿石量组成序列中数据变化得到各矿床的矿石量趋势性变化序列;获取各矿床的金属量趋势性变化序列;根据各矿床的矿石量、金属量趋势性变化序列之间的差异得到各矿床的相似性异变指数;根据各矿床的矿石量、金属量组成序列之间的相关性及相似性异变指数得到各矿床的资源相关性指数;根据各矿床的资源相关性指数及矿产资源奇异指数得到各矿床的资源一致性变化系数;

6、根据各矿床的资源一致性变化系数之间的差异得到各待降维矿床信息集合及各待存储矿床信息集合;根据各待降维矿床信息集合及各待存储矿床信息集合结合主成分分析算法及分布式数据存储算法进行数据存储。

7、优选的,所述根据各类型矿石的勘测时间、矿石量和金属的勘测时间、金属量得到各矿床的矿石量组成序列和金属量组成序列,具体为:对于各矿床,将矿床中所有类型矿石的矿石量按勘测时间升序排列组成的序列作为矿床的矿石量组成序列;获取矿床的金属量组成序列。

8、优选的,所述根据各矿床的矿石量组成序列中突变数据的数值变化得到各矿床的矿石量差异指数,具体包括:

9、通过bg分割算法获取每个矿石量组成序列中各突变数据点,将各矿石量组成序列中所有突变数据点组成的集合作为各矿石量突变集合;

10、计算各矿床的矿石量突变集合中所有数据的变异系数及均值;计算各个矿床与第x个矿床的矿石量突变集合的所述变异系数之间的差值绝对值,记为第一差值绝对值;计算各个矿床的矿石量突变集合中每个数据与第x个矿床的所述均值之间的差值绝对值,记为第二差值绝对值;计算各个矿床的所有第二差值绝对值的平均值;计算第一差值绝对值与所述平均值的和值;将所有矿床的所述和值的平均值作为第x个矿床的矿石量差异指数。

11、优选的,所述根据各矿床的矿石量、金属量差异指数得到各矿床的矿产资源奇异指数,具体包括:

12、计算以自然常数为底数、以各矿床的金属量差异指数的相反数为指数的指数函数的计算结果;计算1与各矿床的矿石量差异指数的和值;计算所述计算结果与所述和值的比值;将1与所述比值的差值作为各矿床的矿产资源奇异指数。

13、优选的,所述根据各矿床的矿石量组成序列中数据变化得到各矿床的矿石量趋势性变化序列,具体包括:

14、对于各矿床,将矿床的矿石量组成序列中所有数据拟合成的曲线作为矿床的矿石量变化曲线;将矿石量组成序列中所有数据在矿石量变化曲线上对应的斜率组成的序列作为矿床的矿石量趋势性变化序列。

15、优选的,所述根据各矿床的矿石量、金属量趋势性变化序列之间的差异得到各矿床的相似性异变指数,具体包括:

16、通过时间序列规整算法计算各矿床与第x个矿床的矿石量趋势性变化序列之间的dtw距离,记为第一距离;获取各矿床与第x个矿床的金属量趋势性变化序列之间的dtw距离,记为第二距离;将第一、第二距离的和值与预设比例常数的比值作为距离比例值;将所有矿床的距离比例值的均值作为第x个矿床的相似性异变指数。

17、优选的,所述根据各矿床的矿石量、金属量组成序列之间的相关性及相似性异变指数得到各矿床的资源相关性指数,具体包括:

18、计算各矿床与第x个矿床的矿石量组成序列之间的皮尔逊相关系数的绝对值,记为第一绝对值;计算各矿床与第x个矿床的金属量组成序列之间的皮尔逊相关系数的绝对值,记为第二绝对值;将第一、第二绝对值的和值与预设比例常数的比值作为相关系数比例值;计算所有矿床的相关系数比例值的平均值;计算以自然常数为底数、以各矿床的相似性异变指数的相反数为指数的指数函数的计算结果;将所述计算结果与各矿床的所述平均值的乘积作为各矿床的资源相关性指数。

19、优选的,所述根据各矿床的资源相关性指数及矿产资源奇异指数得到各矿床的资源一致性变化系数,具体包括:

20、计算以自然常数为底数、以各矿床的矿产资源奇异指数的相反数为指数的指数函数的计算结果;将所述计算结果与各矿床的资源相关性指数的乘积作为各矿床的资源一致性变化系数。

21、优选的,所述根据各矿床的资源一致性变化系数之间的差异得到各待降维矿床信息集合及各待存储矿床信息集合,具体为:

22、通过dpc密度峰值聚类算法对所有矿床的资源一致性变化系数进行聚类得到各聚类簇;

23、通过最大类间方差算法获取所有矿床的资源一致性变化系数的分割阈值;

24、计算所有元素均值大于等于分割阈值的聚类簇作为待降维矿床信息集合;将所有元素均值小于分割阈值的聚类簇作为待存储矿床信息集合。

25、优选的,所述根据各待降维矿床信息集合及各待存储矿床信息集合结合主成分分析算法及分布式数据存储算法进行数据存储,具体为:

26、通过pca主成分分析算法获取各待降维矿床信息集合中元素对应矿床的矿产资源勘察信息数据的降维数据;将各待降维矿床信息集合中所有元素的所述降维数据通过分布式数据存储算法存储到服务器,将各待存储矿床信息集合中所有元素对应的矿床的矿产资源勘察信息数据存储到服务器。

27、本发明至少具有如下有益效果:

28、本发明通过对矿产资源奇异程度的分析,构建资源一致性变化系数,基于资源一致性变化系数确定进行降维的数据并进行数据存储,避免出现线性特征较差的数据而导致数据降维的准确性较差的问题,提高了数据降维的准确性,提高了降维优化存储的效果;

29、本发明根据矿产资源勘察信息数据获取矿石量组成序列及金属量组成序列,根据矿石量组成序列及金属量组成序列获取矿石量突变集合及金属量突变集合,根据矿石量突变集合及金属量突变集合获取矿石量差异指数及金属量差异指数,根据矿石量差异指数及金属量差异指数获取矿产资源奇异指数,初步反映了矿床的矿石信息之间的相关性以及金属信息之间的相关性;根据矿石量、金属量组成序列获取各矿床的相似性异变指数,根据相似性异变指数获取各矿床的资源相关性指数,根据资源相关性指数及矿产资源奇异指数获取资源一致性变化系数,进一步度量各矿床的信息之间的线性相关性;根据所有矿床的资源一致性变化系数获取待降维矿床信息集合及待存储矿床信息集合,利用pca主成分分析算法基于待降维矿床信息集合获取降维后的数据,利用分布式存储算法基于降维后的数据及待存储矿床信息集合完成数据的优化存储,降低了直接采用pca主成分分析算法导致较多有用信息丢失的影响,提高降维优化存储的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1