一、技术领域
石油天然气作为事关国计民生的基础能源领域,油气资源通常保存在储集层中,储集层是具有连通孔隙、允许油气在其中储存和渗滤的岩层。碎屑岩是重要的储集层之一,通常由石英、长石、云母以及胶结成分等矿物组成。
二、
背景技术:
组成碎屑岩的矿物成分的比例不同,储层表现的性质也不同,不同的储层性质决定了油气资源的储量开发速度及采收率。
石油探区为了研究储层的物理性质,通常在储层进行钻井取心,通过分析岩心的矿物成分研究储层的物理性质,从而研究与采油相关的参数。
由于钻井取心价格极高同时会延长钻井周期,因此只在关键井的关键层位取心。地球物理测井是应用地球物理学的一个分支,简称测井,是利用岩层的电化学特性、导电特性、声学特性、放射性等地球物理特性,测量地球物理参数的方法,这些测井信号包含了碎屑岩的矿物成分信息和流体信息。
机器学习技术表现为分类和回归两类技术,疾病诊断、人脸识别、物品类别判断等确定性结论的称为分类方法,回归方法则是通过机器学习对数值型连续变量进行预测如碎屑岩矿物组分等。
三、
技术实现要素:
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。利用机器学习算法,训练取心井各类测井资料与岩石矿物成分之间的映射关系,利用测井资料直接预测未取心井目的层的岩石矿物组成比例。
组成碎屑岩的矿物成分的比例与岩石的地质时代有关,并受沉积相的控制,因此在机器学习训练数据类型的组成上要考虑时间空间因素。在一个特定地区地质时代与埋深有关,样品的沉积相与地理位置相关,因此机器学习训练数据要包含地层时代、埋深、大地坐标等信息。
具体到岩心样品,真正包含一块岩心样品矿物组成成分的信息是伽马曲线,声波曲线、密度曲线、电阻率曲线等测井曲线。
岩心样本数据库构建是完成机器学习的基础,按取心段顶底深度与提取对应深度的测井曲线,测井曲线的每一个深度样本点作为一个样本。
收集取心岩石样本的井名、地层名、埋深、大地坐标、伽马曲线、声波曲线、密度曲线、电阻率曲线、孔隙度曲线,以及岩心分析的石英成分、长石成分、云母成分、胶结物成分构成机器学习数据库。
选取【0009】库中井名、地层名、埋深、大地坐标、伽马曲线、声波曲线、密度曲线、电阻率曲线、孔隙度曲线作为训练数据的x;选取取心岩石样本石英成分、长石成分、云母成分、胶结物比例作为y。为了得到较好的学习效果,避免训练中出现过拟合现象,选取部分x作为训练数据成为x_train,与x_train对应的y作为y_train,剩余部分作为测试数据命名为x_test和y_test。
选取未取心井井名、地层名、埋深、大地坐标、伽马曲线、声波曲线、密度曲线、电阻率曲线、孔隙度曲线作为计算数据的x。利用训练好的模型直接计算未取心井目的层段岩石矿物的成分比例。
建议选取极端梯度提升树算法xgboost可以用于回归和分类,每一棵决策树每一步会产生一个弱回归器,然后通过加权累加变成一个强回归器:
比如每一步都会产生一个回归树fi(x),f(x)=∑fi(x)其实就是一堆回归器通过加权集成为一个强回归器,过程可以用下式表达:
目标函数就是:
意思就是找到第t个比较好的弱回归器,使得误差变小,ω(ft)是正则项,防止过拟合。
y是计算得到目的层段的岩石矿物组成的比例,包含四个特征,石英成分、长石成分、云母成分、胶结物成分。
四、说明书附图
图1工区取心井井位图,展示取心井段岩心分析岩石矿物组分。
图2是取心井段岩心分析矿物组分及测井曲线资料图。
图3机器学习计算碎屑岩矿物组分样本数据库特征表。
五、具体实施方式
1、收集取心井岩心分析化验资料和测井资料,收集机器学习方法计算碎屑岩矿物组分的样本。
2、按照取心深度段选择测井曲线资料,按照测井曲线采样间隔对测井曲线和岩心分析的岩石矿物组分百分比进行取值得到机器学习的样本。
3、提取每个样本的井名、地层名、埋深、大地坐标、伽马曲线、声波曲线、密度曲线、电阻率曲线、孔隙度曲线作为训练数据的x;选取样本的石英成分、长石成分、云母成分、胶结物成分比例作为y。上述作为样本特征的测井曲线允许有缺失,曲线的多少只影响最终精度。
4、把【0019】得到的样本按照一定比例分成训练数据x_train,y_train和测试数据x_test,y_test。
5、调用机器学习回归算法中的模型训练函数训练模型。
6、按照【0019】中相同的特征名收集未取心井的资料得到x。
使用【0021】训练得到模型,调用模型预测函数计算未取心井目的层段的碎屑岩矿物组分。
1.一种使用机器学习算法预测碎屑岩矿物组分的方法,其特征在于,包括如下步骤:
步骤1、收集工区内取心井岩心分析化验资料和测井资料;
步骤2、按照取心深度段选择测井曲线资料,按照测井曲线采样间隔对测井曲线和岩心分析的岩石矿物组分百分比进行取值得到机器学习的样本;
步骤3、提取步骤2每个样本的井名、地层名、埋深、大地坐标、伽马曲线、声波曲线、密度曲线、电阻率曲线、孔隙度曲线特征作为样本数据的x;选取样本特征中的石英成分、长石成分、云母成分、胶结物作为样本数据的y;
步骤4、把步骤3得到的样本按照一定比例分成训练数据x_train,y_train和测试数据x_test,y_test;
步骤5、调用机器学习回归算法中的模型训练函数训练模型;
步骤6、按照步骤3相同的方法,收集未取心井的资料得到预测数据的x;
步骤7、使用步骤5训练得到的模型,调用模型预测函数计算未取心井目的层段的岩石矿物组分,得到未取心井目的层的岩石矿物组分。