一种基于XGBoost的矿床类型鉴别方法及系统

文档序号:31720371发布日期:2022-10-04 23:06阅读:204来源:国知局
一种基于XGBoost的矿床类型鉴别方法及系统
一种基于xgboost的矿床类型鉴别方法及系统
技术领域
1.本发明涉及机器学习技术领域,具体涉及一种基于xgboost的矿床类型鉴别方法及系统。


背景技术:

2.磷灰石是一种常见的副矿物,广泛存在于岩浆岩、变质岩和沉积岩中。微量元素通常以类质同象的形式进入磷灰石晶格,在不同环境下其微量元素特征存在显著的差异。因此磷灰石微量元素特征可作为追踪物质来源,反演岩石成因和判别矿床类型的有力工具。
3.传统方法以磷灰石的微量元素或多种微量元素的计算结果为端元,建立二元或三元图解,以图解中的不同区域来判别不同的岩石或矿床类型。然而,随着磷灰石地球化学数据的大量积累,传统分析方法已逐渐无法有效利用这些数据所携带的信息,进而二元或三元的图解无法准确判别岩石或矿床类型。
4.近年来,智能数据处理方法为数据的超常增长提供了有效的解决方法。机器学习被认为是人工智能的核心。通过机器学习方法,智能处理磷灰石微量元素数据能够寻找更准确,更高效的矿床判别方法。


技术实现要素:

5.为此,本发明提供一种基于xgboost的矿床类型鉴别方法及系统,以解决现有技术无法准确高效的判别矿床类型的问题。
6.为了实现上述目的,本发明提供如下技术方案:
7.根据本发明实施例的第一方面,提出了一种基于xgboost的矿床类型鉴别方法,所述方法包括:
8.收集磷灰石微量元素数据,并构建训练集和测试集;
9.基于xgboost算法构建机器学习模型,使用所述训练集对机器学习模型进行训练,并使用所述测试集对训练的模型进行评估;
10.将待鉴别的磷灰石微量元素数据输入至得到的机器学习模型,得到矿床成因类型预测结果。
11.进一步地,收集磷灰石微量元素数据,具体包括:
12.获取不同矿床类型以及未矿化的磷灰石微量元素数据,所述不同矿床类型包括斑岩型矿床、矽卡岩型矿床、基律纳型矿床、iocg矿床和造山型矿床。
13.进一步地,所述方法还包括数据预处理,具体包括:
14.筛选14种常见且数据交集最多的元素构建典型磷灰石微量元素数据集,14种磷灰石微量元素为la,ce,pr,nd,sm,eu,gd,dy,yb,lu,sr,y,th和u;
15.进行数据清洗;对微量元素数据进行对数处理,使其符合正态分布;对数据进行标准化;在保证每个类别比例不变的前提下,将数据随机划分为训练集和测试集。
16.进一步地,所述数据预处理,还包括:
17.使用人工少数类过采样法,过采样数据量较少的类别,以解决类间不平衡问题。
18.进一步地,基于xgboost算法构建机器学习模型,使用所述训练集对机器学习模型进行训练,具体包括:
19.利用网格搜索与交叉验证进行模型超参数调优。
20.进一步地,使用所述测试集对训练的模型进行测试,具体包括:
21.选取精确率、召回率、f1分数和准确率作为模型评估指标。
22.根据本发明实施例的第二方面,提出了一种基于xgboost的矿床类型鉴别系统,所述系统包括:
23.数据集构建模块,用于收集磷灰石微量元素数据,并构建训练集和测试集;
24.模型训练及评估模块,用于基于xgboost算法构建机器学习模型,使用所述训练集对机器学习模型进行训练,并使用所述测试集对训练的模型进行评估;
25.矿床类型预测模块,用于将待鉴别的磷灰石微量元素数据输入至得到的机器学习模型,得到矿床成因类型预测结果。
26.进一步地,所述数据集构建模块,具体还用于:
27.获取不同矿床类型以及未矿化的磷灰石微量元素数据,所述不同矿床类型包括斑岩型矿床、矽卡岩型矿床、基律纳型矿床、iocg矿床和造山型矿床。
28.根据本发明实施例的第三方面,提出了一种计算机存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被一种基于xgboost的矿床类型鉴别系统执行如上任一项所述的方法。
29.本发明具有如下优点:
30.本发明提出的一种基于xgboost的矿床类型鉴别方法及系统,收集磷灰石微量元素数据,并构建训练集和测试集;基于xgboost算法构建机器学习模型,使用所述训练集对机器学习模型进行训练,并使用所述测试集对训练的模型进行评估;将待鉴别的磷灰石微量元素数据输入至得到的机器学习模型,得到矿床成因类型预测结果。相比于传统方法,机器学习模型具有更高的准确率和可信度;可通过磷灰石微量元素鉴别矿床成因类型,和预测未知岩体的成矿潜力;该方法适用性更广,更加便捷。
附图说明
31.为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
32.图1为本发明实施例1提供的一种基于xgboost的矿床类型鉴别方法的流程示意图;
33.图2为本发明实施例1提供的一种基于xgboost的矿床类型鉴别方法的具体实施流程示意图。
具体实施方式
34.以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明
书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
35.实施例1
36.如图1所示,本实施例提出了一种基于xgboost的矿床类型鉴别方法,所述方法包括:
37.s100、收集磷灰石微量元素数据,并构建训练集和测试集;
38.s200、基于xgboost算法构建机器学习模型,使用所述训练集对机器学习模型进行训练,并使用所述测试集对训练的模型进行评估;
39.s300、将待鉴别的磷灰石微量元素数据输入至得到的机器学习模型,得到矿床成因类型预测结果。
40.如图2所示,具体实施过程如下:
41.数据收集:
42.从近50年已发表的245篇经典文献以及代表性地球化学数据库georoc中,收集来自全球47个国家,共8396个磷灰石微量元素数据(包括斑岩型矿床、矽卡岩型矿床、基律纳型矿床、iocg矿床和造山型矿床共五种不同矿床类型中的磷灰石,以及未矿化的磷灰石)。
43.数据预处理:
44.1、筛选14种常见且数据交集最多的元素(la,ce,pr,nd,sm,eu,gd,dy,yb,lu,sr,y,th和u)构建典型磷灰石微量元素数据集。
45.2、进行数据清洗,以1/2检测限的值填充由于低于检测限而导致的空缺值,删除包含随机缺失导致空缺值的数据
46.3、对微量元素数据进行对数处理,使其符合正态分布;使用“standardscaler”对数据进行标准化,使数据均值为0,方差为1,符合标准正态分布
47.4、在保证每个类别比例不变的前提下,将数据随机划分为训练集(80%)和测试集(20%)
48.5、使用人工少数类过采样法(synthetic minority over-sampling technique,smote),过采样数据量较少的类别,以解决类间不平衡问题。
49.模型训练及评估:
50.1、基于xgboost算法,使用训练集数据训练机器学习模型
51.2、利用网格搜索(grid search)与交叉验证(cross-validation)进行超参数调优。选取n_estimator,gamma和max_depth作为模型超参数。网格搜索遍历所有超参数取值组合,进行训练与验证。使用10折交叉验证,将数据随机划分为10份,其中九份作为训练集进行,一份作为验证集进行验证。训练与验证共进行10次,保证每组数据均作为验证集进行验证,最终得到交叉验证分数最高的超参数取值组合为最优超参数。最优超参数为:n_estimator=148,gamma=0,max_depth=7。
52.3、使用测试集对机器学习模型进行评估。选取精确率、召回率、f1分数和准确率作为模型评估指标。由于模型具有一定随机性,对模型进行50次训练测试,以得到更加准确的模型表现。模型最终分数为:精确率=0.89
±
0.02,召回率=0.89
±
0.02,f1分数=0.89
±
0.02,准确率=0.94
±
0.01。
53.该模型可用于(1)区分矿化与未矿化磷灰石;(2)判别斑岩型、矽卡岩型、造山型、基律纳型和iocg共五种常见矿床类型。
54.为了验证本实施例算法模型的优势,训练并对比了四种常见的机器学习算法,即k近邻(knn)、随机森林(rf)、支持向量机(svm)以及xgboost,分别得到四个分类器。使用测试集分别进行评估,结果为knn的f1分数为0.901,rf的f1分数为0.891,svm的f1分数为0.896,xgboost的f1分数为0.907。结果表明,本实施例选择的xgboost算法是评估分数最高且更加平衡的最优算法。
55.实施例2
56.与上述实施例1相对应的,本实施例提出了一种基于xgboost的矿床类型鉴别系统,所述系统包括:
57.数据集构建模块,用于收集磷灰石微量元素数据,并构建训练集和测试集;
58.模型训练及评估模块,用于基于xgboost算法构建机器学习模型,使用所述训练集对机器学习模型进行训练,并使用所述测试集对训练的模型进行评估;
59.矿床类型预测模块,用于将待鉴别的磷灰石微量元素数据输入至得到的机器学习模型,得到矿床成因类型预测结果。
60.进一步地,所述数据集构建模块,具体还用于:
61.获取不同矿床类型以及未矿化的磷灰石微量元素数据,所述不同矿床类型包括斑岩型矿床、矽卡岩型矿床、基律纳型矿床、iocg矿床和造山型矿床。
62.本发明实施例提供的一种基于xgboost的矿床类型鉴别系统中各部件所执行的功能均已在上述实施例1中做了详细介绍,因此这里不做过多赘述。
63.实施例3
64.与上述实施例相对应的,本实施例提出了一种计算机存储介质,计算机存储介质中包含一个或多个程序指令,一个或多个程序指令用于被一种基于xgboost的矿床类型鉴别系统执行如实施例1的方法。
65.虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1