一种基于机器学习的地层孔隙压力预测方法

文档序号:27097888发布日期:2021-10-27 17:18阅读:320来源:国知局
一种基于机器学习的地层孔隙压力预测方法

1.本发明涉及测井工程技术领域,具体涉及一种基于机器学习的地层孔隙压力预测方法。


背景技术:

2.在地球物理测井领域,地层孔隙压力是指地层孔隙中气体、液体等所共同承担的力,也称为孔隙压力或地层压力。地层压力为油气的分布、运移、聚集提供重要信息,是石油勘探开发工作中的基础数据之一。在钻井工程中,地层压力不仅是确定钻井液密度、井身结构的依据,而且关系到能否安全、快速、经济的开展钻井工作。油气勘探实践表明异常压力与油气的生成、运移和聚集有密切的关系,超压发育带往往是深层油气勘探的有利目标,若能在钻探过程中获得准确的地层压力将有助于后续测井解释和储层评价工作的展开,指导合理地选择钻井泥浆密度,防止井喷井漏等事故发生。因此详细研究油气储层地层压力有着重要的实际意义。
3.目前,传统的地球物理测井预测孔隙压力的方法主要有等效深度法、伊顿法、bowers 法等,这些方法需要建立正常压实趋势线。连续地层中,正常压实曲线的建立并无固定方法,主要依赖研究者自身经验以及对研究区的了解程度。导致预测结果的随意性、主观性较大。在不连续沉积地层中,需要建立多条趋势线,由于某些层段不完整,致使正常压实曲线难以建立。传统的地层压力预测方法适用岩性单一,且只适用于泥质沉积物不平衡压实造成地层欠压实并产生异常高压的情况,增加了地层孔隙压力准确预测的难度。随着机器学习与人工智能等方法理论的快速发展,也有相关方法被用于地层孔隙压力的预测。有研究者用少数实测孔隙压力数据,采用支持向量回归算法用于地层孔隙压力的预测,但由于实测点太少,结果准确率较低,效果并不理想。


技术实现要素:

4.本发明的目的在于提供一种基于机器学习的地层孔隙压力预测方法,解决现有的预测方法的预测结果准确率较低,效果并不理想的问题。
5.为实现上述发明目的,本发明所采用的技术方案是:一种基于机器学习的地层孔隙压力预测方法,包括以下预测步骤:a、数据处理与准备:采集相关测井数据以及相关的岩石物性参数;b、确定敏感曲线:准备灰色关联度法所需的参考序列和比较序列,并确定敏感测井曲线;c、模型的训练与测试:将原始数据集划分为训练集和测试集,将训练集输入梯度提升回归树模型中,获取最优模型;d、预测地层孔隙压力:并且将确定的敏感测井曲线作为最优模型的输入特征向量,对储层地层压力的预测。
6.优选地,所述测井数据包括密度、自然电位、自然伽马、声波时差、井径、深侧向电
阻率、浅侧向电阻率、孔隙度中的至少一种类型。
7.优选地,所述比较序列的构建具体为:将剔除测井数据中与实际情况不符的所有无效值以及井段缺失值后的测井曲线数据作为灰色关联度的比较序列。
8.优选地,所述参考序列的构建包括以下子步骤:b01、计算出地层孔隙压力值:;式中为上覆岩层压力,;为静水压力,;为地层实测声波时差,;为正常压实声波时差,;为eaton系数,无量纲;b02、再利用实测地层孔隙压力数据梯度对计算孔隙压力进行约束,得数据集a;b03、将实测地层孔隙压力梯度的平均值根据实际地质情况换算成实际的地层孔隙压力值,即数据集b;b04、将数据集a与数据集b按各自0.5的权重进行融合,得到数据集c,数据集c为灰色关联度法的参考序列。
9.优选地,在步骤b01中上覆岩层压力的计算方式如下:;式中:为目的层起始深度,;为重力加速度;为上覆岩层的平均密度,;为目的层深度,。
10.优选地,所述灰色关联度法的具体步骤为:b1、确定参考序列和比较序列,并初始化无量纲;b2、求参考序列和比较序列的差值和最值:其中差值为:,式中为参考序列,第个时刻的值为;为比较序列,常记为;最值包括两级最大差值和两级最小差值;两级最大差值为:;两级最小差值为:;b3、计算关联系数:;其中:;式中:为时刻与差的绝对值,k为不同时刻,取值为1,2,3

n;为分辨系数,;b4、得出关联度并排序,再根据关联度确定敏感测井曲线。
11.优选地,所述训练集和测试集的划分具体为:通过设定比值将原始数据集按比例进行划分,所述训练集包括原始数据集的5%、10%、15%、20%、25%和30%的比例数据集,测试集为原始数据集除去所有比例数据集后组成的数据集合。
12.优选地,所述最优模型的训练包括以下子步骤:所述最优模型训练包括以下子步骤:d1、模型初始化:初始化估计函数和损失函数,将迭代次数设定为n,
训练一次,为训练集的真实标签;d2、残差的计算:,为梯度公式,可用于计算损失函数的负梯度,即残差减小的方向,为样本t的真实标签;d3、残差的拟合:利用步骤d2中得到的负梯度值对决策树进行更新,为第 n次迭代的决策树参数;d4、估计函数的更新:令,其中a为常数项;d5、令,循环第d2到第d4步,直到达到迭代次数上限;d6、最终得到回归树。
13.本发明的有益效果集中体现在:1、本发明利用测井资料纵向分辨率好、可靠性高等优势,选择灰色关联度法找出与地层孔隙压力密切联系的七条测井曲线,利用gbrt回归模型对地层孔隙压力进行预测;孔隙压力预测结果与工区实测值的误差控制在5%以内,符合工程要求,具有较好的预测精度。
14.2、本发明的预测方法不仅适用于欠压实成因形成的异常高压,对砂泥岩及非欠压实成因产生的异常地层压力的预测同样有效, 具有更广泛的应用前景。不用建立正常压实曲线,可减少人为因素对预测结果的影响;连续的孔隙压力曲线的获得,可满足连续、非连续地层孔隙压力预测的需要。
15.3、本发明通过机器“学习”的方式充分挖掘测井资料与地层孔隙压力之间的内在关系,极大的提高了模型预测精度,对钻井工艺水平的提高,工程事故的发生率的降低,环境污染的减少,钻井成本的节约都有重要的意义。
附图说明
16.图1是本发明预测流程图;图2是本发明灰色关联度法流程图;图3是本发明最优模型训练流程图;图4是本发明的数据采集图;图5是本发明十种测井曲线关联度图;图6是本发明七条敏感测井曲线图;图7是本发明不同比例训练集gbrt模型的正确率图;图8本发明gbrt模型训练误差图;图9是本发明地层孔隙压力预测结果图。
具体实施方式
17.为了使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作进一步的详细说明。
18.如图1所示,一种基于机器学习的地层孔隙压力预测方法,包括以下预测步骤:a、数据处理与准备:采集相关测井数据以及相关的岩石物性参数;需要对数据进行清洗,筛选出有效数据;也就是测井资料中与地层孔隙压力密切相关的十种测井曲线数
据,例如密度(den)、自然电位(sp)、自然伽马(gr)、声波时差(ac)、井径(cal)、深侧向电阻率(lld)、浅侧向电阻率(lls)、孔隙度(por)等,在本实施例中以上述十种测井数据为例;b、确定敏感曲线:准备灰色关联度法所需的参考序列和比较序列,并确定敏感测井曲线;在本实施例中所述比较序列的构建具体为:将剔除测井数据(上述十种原始数据)中与实际情况不符的所有无效值以及井段缺失值后的测井曲线数据作为灰色关联度的比较序列。
19.所述参考序列的构建主要利用伊顿法,具体包括以下子步骤:b01、计算出地层孔隙压力值:;式中为上覆岩层压力,;为静水压力,;为地层实测声波时差,;为正常压实声波时差,;为eaton系数,无量纲;b02、再利用实测地层孔隙压力数据梯度对计算孔隙压力进行约束,得数据集a;b03、将实测地层孔隙压力梯度的平均值根据实际地质情况换算成实际的地层孔隙压力值,即数据集b;b04、将数据集a与数据集b按各自0.5的权重进行融合,得到数据集c,数据集c为灰色关联度法的参考序列。
20.在计算上覆岩层压力时,可将已知段密度的均值作为密度未知段值,密度已知段可通过密度积分获得相应的上覆应力;计算公式如下:;式中:为目的层起始深度,;为重力加速度;为上覆岩层的平均密度,;为目的层深度,。
21.所述灰色关联度法是基于灰色系统理论建立的分析方法,作为一种多因素统计分析方法,该方法用“灰色关联度”来表征因素之间的内在联系及发展趋势的紧密程度,并以此衡量因素之间的关联性。该方法可用于储层物性、电性参数与地层孔隙压力之间的关联,以及该关联的强弱、大小;如图2所示,在本实施例中所述灰色关联度法的具体步骤为:b1、确定参考序列和比较序列,并初始化无量纲;b2、求参考序列和比较序列的差值和最值:其中差值为:,式中为参考序列,第个时刻的值为;为比较序列,常记为;最值包括两级最大差值和两级最小差值;两级最大差值为:;两级最小差值为:;b3、计算关联系数:;其中:;式中:为时刻与差的绝对值,k为不同时刻,取值为1,2,3

n;
为分辨系数,;b4、得出关联度并排序,再根据关联度确定敏感测井曲线;关联计算结果如图5所示,在图中当规定关联度大于0.6,则参考序列与比较序列之间关系密切;即将密度(den)、自然电位(sp)、声波时差(ac)、井径(cal)、深侧向电阻率(lld)、浅侧向电阻率(lls)、孔隙度(por)7条测井曲线作为模型训练的输入特征向量。
22.c、模型的训练与测试:为保证数据尽量覆盖所有深度,选择留出法进行数据集划分,即通过设定比值将总数据集按比例进行划分;也就是将原始数据集划分为训练集和测试集,所述训练集和测试集的划分具体为:通过设定比值将原始数据集按比例进行划分,所述训练集包括原始数据集的5%、10%、15%、20%、25%和30%的比例数据集,测试集为原始数据集除去所有比例数据集后组成的数据集合;例如原始数据集大小为1207,测试集为原始数据集除去所有比例训练集后组成的数据集合,数据量为413。测试集与所有训练集均无交集,保证了模型实验的客观性;在对原始数据集进行采样时,如图4所示,以33.3%训练集比例为例,采样间隔为3),空心五角星为采样点,实心五角星为采样点间的间隔点(间隔点数=采样间隔

1);不同比列的训练集大小的正确率(模型预测值

真实孔隙压力<0.2),如图7所示;划分好训练集和测试集后,再将训练集输入梯度提升回归树模型中,获取最优模型;获取最优模型也就是建立机器学习,首先利用训练集样本进行初始训练,建立弱学习器,然后计算弱分类器的拟合残差,通过学习残差来建立新的弱学习器,再次通过计算残差、学习残差来继续建立弱学习器,以此循环,最终将多个弱分类器组合为强学习器;如图3所示,具体步骤如下:d1、模型初始化:初始化估计函数和损失函数,将迭代次数设定为n,训练一次,为训练集的真实标签;d2、残差的计算:,为梯度公式,可用于计算损失函数的负梯度,即残差减小的方向,为样本t的真实标签;d3、残差的拟合:利用步骤d2中得到的负梯度值对决策树进行更新,为第 n次迭代的决策树参数;d4、估计函数的更新:令,其中a为常数项;d5、令,循环第d2到第d4步,直到达到迭代次数上限;d6、最终得到回归树。
23.d、预测地层孔隙压力:并且将确定的敏感测井曲线作为最优模型的输入特征向量,也就是将数据输入到最终模型中,可进行回归分析研究,对储层地层压力的预测。
24.在预测的实施过程中,不同训练集比列对最终地层孔隙压力预测准确率发现,在六个比例的训练集中,30%比列的训练集比列最佳,学习率(learning_rate)为0.06,弱学习器(n_estimators)个数为1000,决策树最大深度(max_depth)为4,采用均方误差(mse)作为损失函数来评估预测值和真实值之间的误差如图8所示。
25.如图6所示,将测井资料中的密度(den)、自然电位(sp)、声波时差(ac)、井径(cal)、深侧向电阻率(lld)、浅侧向电阻率(lls)、孔隙度(por)7测井曲线输入到训练好的gbrt模型中进行孔隙压力的预测,预测地层孔隙压力的结果,预测结果如图9所示。
26.本发明在传统地层孔隙压力预测方法的基础上,提出了一种基于gbrt模型的地层
孔隙压力预测新方法。利用测井资料纵向分辨率好、可靠性高等优势,选择灰色关联度法找出与地层孔隙压力密切联系的七条测井曲线,利用gbrt回归模型对地层孔隙压力进行预测。
27.(1)通过研究不同数据集下gbrt模型的预测结果发现,训练集比例越大越大当训练集比例为总数据集的10%时,模型的正确率超过90%;训练集为25%时,gbrt模型预测值与真实值的误差控制在5%以内。实际应用孔隙压力预测结果与工区实测值的误差控制在5%以内,符合工程要求,具有较好的预测精度。gbrt模型可以灵活处理各种类型的数据,包括连续值和离散值。在相对少的调参时间情况下,预测的准确率也可以比较高。
28.(2)与传统方法相比,该方法不仅适用于欠压实成因形成的异常高压,对砂泥岩及非欠压实成因产生的异常地层压力的预测同样有效, 具有更广泛的应用前景。不用建立正常压实曲线,可减少人为因素对预测结果的影响。连续的孔隙压力曲线的获得,可满足连续、非连续地层孔隙压力预测的需要。
29.(3)通过机器“学习”的方式充分挖掘测井资料与地层孔隙压力之间的内在关系,极大的提高了模型预测精度,对钻井工艺水平的提高,工程事故的发生率的降低,环境污染的减少,钻井成本的节约都有重要的意义。
30.需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本技术所必须的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1