一种基于深度森林的矿产预测方法、装置、设备及介质

文档序号:37183261发布日期:2024-03-01 12:43阅读:25来源:国知局
一种基于深度森林的矿产预测方法、装置、设备及介质

本发明涉及矿产资源预测,具体涉及一种基于深度森林的矿产预测方法、装置、设备及介质。


背景技术:

1、矿产资源勘探中,易于寻找的地表矿已逐渐减少,找矿工作重点已逐步转向难度更大的深部、矿体周边找矿产预测发展,找矿难度增大且成本提高;而深部、矿体周边找矿区具有弱信息、混杂信息等特征,传统找矿方法成效不佳,为满足人类日益增长的矿产资源需求,降低找矿成本,需要新的技术应用于矿产勘查。

2、随着计算机与大数据科学的引入,机器学习和深度学习的相关算法研究极大的丰富了对地学数据处理分析的手段:以随机森林、支持向量机为代表的机器学习方法,通过地质、地球物理、地球化学和遥感等手段获取的多源勘查数据提取其中与矿产资源形成相关的特征信息,进而挖掘多源找矿信息与矿床之间的关系建立参数化模型;深度神经网络作为一种具有多级非线性变换的层级算法,也可有效地挖掘复杂的、非线性的地学空间数据,并提取地质过程的未知模式建立模型,从而实现对预测区较好的分类评价与预测精度,继而开展矿产预测,结果以成矿有利度、相似性、概率等形式体现。

3、综上,利用机器学习、深度学习方法对地质数据进行深层次的挖掘和提取,开发智能找矿模型预测方法得到成功实践,正在成为矿产预测领域的重要工具。

4、其中深度神经网络虽然具有充足的表达能力,但是模型复杂,计算效率低,易受超参数的影响,构建依赖大量数据训练学习,而矿产预测往往面临训练数据较少以及样本非平衡问题,且深度神经网络针对不同数据集的可用性较低,也难以成矿机制开展预测,导致其决策结果与领域认知不能完全保持一致,对决策机理也难以验证与理解,导致不能对矿产进行准确的预测。


技术实现思路

1、有鉴于此,本发明实施例提供了一种基于深度森林的矿产预测方法、装置、设备及介质,以克服现有技术矿产预测不准确的问题,可以提高矿产预测的准确度和普适性。

2、第一方面,发明实施例提供了一种基于深度森林的矿产预测方法,包括:

3、获取预测区域的地球化学数据、地球物理数据和地质数据,并进行预处理后生成用于矿产预测的多源数据集;

4、将所述多源数据集分为训练数据集和测试数据集;

5、基于深度森林算法构建深度森林模型,并利用训练数据集对深度森林模型进行训练,将训练好的模型作为矿产预测模型;

6、将所述测试数据集输入所述矿产预测模型中得到预测结果,对所述矿产预测模型的预测能力进行验证。

7、本发明实施例提供的基于深度森林的矿产预测方法,所述获取预测区域的地球化学数据、地球物理数据和地质数据,并进行预处理后生成用于矿产预测的多源数据集,包括:

8、获取地球化学数据,通过统计分析剔除其中的异常数据,并通过插值分析对地球化学数据缺失的区域进行补全,得到预测区域的地球化学数据证据图层作为地球化学数据集;

9、获取地质数据,对其进行空间分析得到预测区域的地质数据证据图层作为地质数据集;

10、获取布格重力异常数据,得到预测区域的地球物理数据证据图层作为地球物理数据集;

11、将所述地球化学数据集、地质数据集和地球物理数据集组成所述多源数据集。

12、本发明实施例通过获取地质、地球物理、地球化学多源勘查数据,通过预处理提取其中与矿产资源形成相关的特征信息,用于后续挖掘多源找矿信息与矿床之间的关系,有助于更加精准的矿产资源预测。

13、在一种可选的实施方式中,所述将所述多源数据集分为训练数据集和测试数据集,包括:

14、将所述多源数据集对应的像素样本集与已知的矿产点位区进行投图映射,与矿点重合的像素样本集为正样本集,未与矿点重合且远离地质数据影响辐射范围区的区域像素样本集为负样本集;

15、以正样本集为依据从负样本集中随机抽取与正样本数目相同的样本,组成预测使用的样本集使正负样本数比1:1;

16、将预测使用的样本集按照预设比例对训练集与测试集进行划分,生成用于输入预测模型的训练数据集与后续检测预期效果的测试数据集。

17、在一种可选的实施方式中,所述利用训练数据集对深度森林模型进行训练,将训练好的模型作为矿产预测模型,包括:

18、将训练数据集输入所述深度森林模型的多粒度扫描模块,利用不同的滑动窗口对输入样本进行多粒度扫描采样得到不同维度的子数据集对应的特征向量;

19、将所述不同维度的子数据集对应的特征向量输入到级联森林层进行训练,所述级联森林每一层都由若干个随机森林和完全随机林学习器组成,输入的不同维度的子数据集经过每层的学习器生成一个类向量,所述每层生成的类向量与对应的多粒度扫描生成的特征向量组成新向量作为该层的结果向量并输入下一层;层层传递后直到最后一层得到模型最终输出结果;

20、通过自适应调节级联森林的层数确定最终级联结构,如果在当前层的测试数据集准确率与前一层相比没有提升则停止构造下一层,通过每层学习器的数量及每个学习器中的相应参数,得到最优模型作为矿产预测模型。

21、本发明实施例中采用深度森林通过多粒度扫描更多注意到了原始数据中各个特征之间的关联,在不影响数据原始特征的情况下引入模型,通过再在各级联层中加入多粒度扫描结果,避免某单一层中学习过程中忽略多粒度扫描结果少数样本数据特征;且因多层多分类器具有更强的鲁棒性和容错能。

22、在一种可选的实施方式中,所述将所述测试数据集输入所述矿产预测模型中得到预测结果,对所述矿产预测模型的预测能力进行验证,包括:

23、基于测试数据集输入所述矿产预测模型中得到预测结果来生成roc曲线,基于roc曲线下的面积大小得到的准确度来定量评估矿产预测模型的预测效果。

24、在一种可选的实施方式中,所述方法,还包括:

25、将预测区域的多源数据集输入所述矿产预测模型中,得到预测区域的成矿有利度图。

26、本发明实施例通过生成预测区域的成矿有利度图充分的可视化展示预测结果及其变化趋势。

27、在一种可选的实施方式中,所述方法,还包括:将所述预测区域的成矿有利度图与实际预测区域勘查报告结论进行对比,为实际找矿工作提供支持验证。

28、本发明实施例不仅通过测试数据集对矿产预测模型对其预测能力进行验证,还利用成矿有利度图与实际预测区域勘查报告进行对比为实际工作提供支持,从而保证了矿产预测的准确性。

29、第二方面,本发明实施例提供了一种基于深度森林的矿产预测装置,包括:

30、多源数据集获取模块,用于获取预测区域的地球化学数据、地球物理数据和地质数据,并进行预处理后生成用于矿产预测的多源数据集;

31、多源数据集划分模块,用于将所述多源数据集分为训练数据集和测试数据集;

32、矿产预测模型构建模块,用于基于深度森林算法构建深度森林模型,并利用训练数据集对深度森林模型进行训练,将训练好的模型作为矿产预测模型;

33、预测结果验证模块,用于将所述测试数据集输入所述矿产预测模型中得到预测结果,对所述矿产预测模型的预测能力进行验证。

34、第三方面,本发明实施例提供了一种计算机设备,包括:

35、存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行本发明实施例提供的基于深度森林的矿产预测方法。

36、第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行本发明实施例提供的基于深度森林的矿产预测方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1