一种基于机器学习的页岩含气量人工智能预测方法

文档序号:29041605发布日期:2022-02-25 20:53阅读:134来源:国知局
一种基于机器学习的页岩含气量人工智能预测方法

1.本发明属于地球科学技术领域,适用于岩心、测井和地震数据计算页岩含气量,可为页岩气勘探开发提供支撑,特别涉及一种基于机器学习的页岩含气量人工智能预测方法。


背景技术:

2.页岩气分布面积大且分布连续,资源规模较大,但单井开采量较低,生产周期长,采收效率不能保证。准确预测页岩储层地质信息参数的空间变化,可为天然气开采提供可靠依据,提升页岩储层天然气开采率。
3.目前,基于测井和地震数据计算含气量的精度不足,不利于储层评价和页岩气勘探开发。利用测井或地震数据计算页岩含气量的基础依据,主要来自岩心测试参数的统计分析、回归拟合或经验公式。简言之,含气量反演或其它直接、间接计算方法,也是以岩心测试数据为指导的。因此,提高测井或地震数据计算含气量关键,是岩心含气量的准确测试和精确分析。


技术实现要素:

4.本发明的目的在于克服现有技术的不足,提供一种将机器学习应用于预测页岩储层参数可提高预测精度,减少预测时间的基于机器学习的页岩含气量人工智能预测方法。
5.本发明的目的是通过以下技术方案来实现的:一种基于机器学习的页岩含气量人工智能预测方法,包括以下步骤:
6.步骤1、剔除岩心含气量实测值的异常值,并对纵横波速度、密度、自然伽马和含气实测值分别进行归一化处理;
7.步骤2、引入松弛变量、利用数据映射搭建支持向量回归预测模型;
8.步骤3、将纵横波速度、密度作为输入,页岩岩心含气量作为输出,利用支持向量回归预测模型,根据留一交叉验证得到含气量预测值;
9.或者将自然伽马、纵波速度、密度作为输入,页岩岩心含气量作为输出,利用支持向量回归预测模型,根据留一交叉验证得到含气量预测值。
10.进一步地,所述步骤2详细过程如下:定义含气量预测值和真实值的损失函数,在松弛变量范围内不计算损失,只在误差大于松弛变量时计算损失;利用支持向量回归的核函数,将本不线性可分的数据映射到高维空间,搭建支持向量回归预测模型。
11.进一步地,所述步骤3具体实现方法为:设本次所有数据集为d={(x1,y1),(x2,y2),

,(xm,ym)},其中xi为归一化后的纵波速度、横波速度和密度构成的向量,或者由归一化后的自然伽马、纵波速度、密度构成的向量;yi为岩心含气量,m为总样本个数;
12.在支持向量回归中,利用非线性映射函数φ(x),将原始样本映射到一个更高维的特征空间中,从而达到线性可分的目的;在此特征空间中划分超平面所对应的模型表示为:
13.f(x)=w
t
φ(x)+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
14.式中,f(x)为预测含气量;w、b为模型参数,前者为权重,后者为截距;
15.引入硬间隔ε,依据最小化结构风险原则,f(x)求解过程等价于求解:
[0016][0017]
式中,前半部分为正则化项,后半部分为损失函数;c为惩罚因子,用于控制样本拟合精度,其值越大,则越重视离群点;l
ε
为关于硬间隔ε的不敏感损失函数,具体表达式如下:
[0018][0019]
引入松弛变量ξi和将(2)改成写成:
[0020][0021]
上式须在以下条件约束下求解:
[0022][0023]
引入拉格朗日乘子μi、αi、依据拉格朗日乘子法得拉格朗日函数:
[0024][0025]
依据拉格朗日算法得支持向量回归目标函数原始形式:
[0026][0027]
依据拉格朗日对偶算法,将问题转化为等价的对偶问题:
[0028][0029]
求w、b、ξi、条件下优化函数极小值,再求拉格朗日乘子μi、αi、下的极大值;即拉格朗日函数分别对w、b、ξi、求偏导,并令其为0得:
[0030]
[0031]
将上式代入(8)中,并根据下列kkt条件:
[0032][0033]
得非线性映射svr表达式为:
[0034][0035]
式中,k(xi,x)=φ(xi)
t
φ(x)为核函数,选取径向基函数,即rbf核函数,如下式所示:
[0036]
k(xi,x)=exp(-||x
i-x||2/2σ2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)。
[0037]
本发明的有益效果是:由于获取岩心成本较高,所得岩心数据较少,且测井所得参数和岩心含气量没有明确关系,导致目前基于经验公式法预测岩心含气量精度较低。目前,机器学习算法日渐成熟,将机器学习应用于预测页岩储层参数可提高预测精度,减少预测时间。本发明针对岩心、测井和地震数据计算页岩含气量精度较高,具有较高的泛化能力和可靠性,可为页岩气探区选点选层、钻井部署、水平压裂段优化、储量与产量建设等提供方法理论及技术支撑。
附图说明
[0038]
图1为本发明的预测方法的流程图;
[0039]
图2是纵横波速度、密度和岩心含气量交会图。
[0040]
图3是自然伽马、纵波速度、密度和含气量交会图。
[0041]
图4是基于纵横波速度、密度的各算法预测含气量曲线。
[0042]
图5是基于纵横波速度、密度的各算法决定系数和均方误差柱形图。
[0043]
图6是基于自然伽马、纵波速度、密度的各算法决定系数和均方误差柱形图。
具体实施方式
[0044]
下面结合附图进一步说明本发明的技术方案。
[0045]
如图1所示,本发明的一种基于机器学习的页岩含气量人工智能预测方法,包括以下步骤:
[0046]
步骤1、数据预处理:在岩心含气量获取中,可能出现因操作不当等问题,导致岩心含气量实测值出现异常,画出纵横波速度、密度和岩心含气量交会图,如图2所示;自然伽马、纵波速度、密度和岩心含气量交会图,如图3所示。因密度与含气量之间隐藏着较强的线性关系,所以为减小异常值对本次预测结果的影响,可利用密度与含气量较强的线性关系,约束含气量实测值,剔除异常值,以防引入较大误差,减小异常值带来的影响。在剔除误差较大的异常值的同时,需要保留绝大多数岩心数据(90%),本实施例中设定岩心含气量实测值偏离预测值
±
1.6误差的实测值为异常值,剔除岩心含气量实测值的异常值;之后为减小量纲去预测效果的影响,加快模型收敛速度、提升模型训练效率、解决神经网络存在激活
函数值域限制等问题,对纵横波速度、密度、自然伽马和含气实测值分别进行归一化处理:
[0047][0048]
x'、x分别为归一化后和归一化前的输入数据(纵横波速度、密度、自然伽马和含气实测值),max(x)、min(x)分别为输入数据的最大值和最小值。
[0049]
步骤2、引入松弛变量、利用数据映射搭建支持向量回归预测模型;详细过程如下:定义预测值和真实值在松弛变量范围内不计算损失的损失函数,将本不线性可分的数据映射到高维空间,搭建支持向量回归预测模型;
[0050]
步骤3、将纵横波速度、密度作为输入,页岩岩心含气量作为输出,利用支持向量回归预测模型,根据留一交叉验证得到含气量预测值;
[0051]
或者将自然伽马、纵波速度、密度作为输入,页岩岩心含气量作为输出,利用支持向量回归预测模型,根据留一交叉验证得到含气量预测值。
[0052]
具体实现方法为:将筛选并归一化后的纵横波速度v
p
,vs、密度rhob作为支持向量回归输入,或者将归一化后的自然伽马、纵波速度v
p
、密度rhob作为输入,岩心含气量作为输出,引入拉格朗日乘子,对拉格朗日函数的四个参数遍历求导,化为对偶问题求kkt点得到预测值;详细推导过程如下所示:
[0053]
设本次所有数据集为d={(x1,y1),(x2,y2),

,(xm,ym)},其中xi为归一化后的纵波速度、横波速度和密度构成的向量,或者由归一化后的自然伽马、纵波速度、密度构成的向量;yi为岩心含气量,m为总样本个数;
[0054]
在支持向量回归中,利用非线性映射函数φ(x),将原始样本映射到一个更高维的特征空间中,从而达到线性可分的目的;在此特征空间中划分超平面所对应的模型表示为:
[0055]
f(x)=w
t
φ(x)+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0056]
式中,f(x)为预测含气量;w、b为模型参数,前者为权重,后者为截距;
[0057]
引入硬间隔ε,依据最小化结构风险原则,f(x)求解过程等价于求解:
[0058][0059]
式中,前半部分为正则化项,后半部分为损失函数;c为惩罚因子,用于控制样本拟合精度,其值越大,则越重视离群点;l
ε
为关于硬间隔ε的不敏感损失函数,具体表达式如下:
[0060][0061]
引入松弛变量ξi和将(2)改成写成:
[0062][0063]
上式须在以下条件约束下求解:
[0064][0065]
引入拉格朗日乘子μi、αi、依据拉格朗日乘子法得拉格朗日函数:
[0066][0067]
依据拉格朗日算法得支持向量回归目标函数原始形式:
[0068][0069]
依据拉格朗日对偶算法,将问题转化为等价的对偶问题:
[0070][0071]
求w、b、ξi、条件下优化函数极小值,再求拉格朗日乘子μi、αi、下的极大值;即拉格朗日函数分别对w、b、ξi、求偏导,并令其为0得:
[0072][0073]
将上式代入(8)中,并根据下列kkt条件:
[0074][0075]
得非线性映射svr表达式为:
[0076][0077]
式中,k(xi,x)=φ(xi)
t
φ(x)为核函数,选取径向基函数,即rbf核函数,如下式所示:
[0078]
k(xi,x)=exp(-||x
i-x||2/2σ2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)。
[0079]
下面通过实验进一步验证本发明的含气量预测方法的技术效果。
[0080]
将支持向量回归预测模型分别与回归树(rt)、随机森林(rf)、bp神经网络、卷积神经网络(cnn)和线性回归等方法进行对比。实验过程如下:
[0081]
1、分别按照如下方法建立实验模型:
[0082]
(1)根据本发明的方法建立支持向量回归预测模型。
[0083]
(2)依据树形算法,引入内部结点、叶节点分别代表划分属性、预测值,利用最小二乘法进行划分,利用有向边连接层与层之间不同划分单元,搭建决策回归树。
[0084]
(3)通过训练多个决策树弱模型组成强模型,形成决策树的集成算法,即从筛选后的数据训练集中利用boostrasp随机抽取生成新训练集,作为多个决策树输入,最后形成随机森林回归模型。
[0085]
(4)依靠信号前向传播,利用梯度更新实现反向传播,设置隐藏层层数、神经元个数搭建bp神经网络模型。
[0086]
(5)依赖tensorflow内置函数,利用卷积层、池化层、展平层和全连接层搭建卷积神经网络模型。
[0087]
2、将纵横波速度、密度作为输入,页岩岩心含气量作为输出,利用支持向量回归(svr)、回归树(rt)、随机森林(rf)、bp神经网络、卷积神经网络(cnn)和线性回归等方法,根据留一交叉验证得到不同算法预测值;具体实现方法为:
[0088]
(1)根据本发明步骤s41的方法得到支持向量回归(svr)算法的含气量预测值。
[0089]
(2)将筛选并归一化后的纵横波速度、密度作为决策回归树输入,岩心含气量作为输出,依据下式,在纵横波速度、密度的切分点不断利用最小二乘法,将特征空间划分为不同单元,形成决策回归树,并输入验证数据得到预测值含气量:
[0090][0091]
式中,x
(j)
为第j个特征变量;s为使两个划分区域平方误差和最小的x
(j)
的值;r1和r2分别是使上式最小的划分区域,c1和c2分别为两个区域预测参数平均值;yi为预测参数值。r1、r2、c1和c2的关系如下:
[0092][0093]
(3)将筛选并归一化后的纵横波速度、密度作为随机森林输入,岩心含气量作为输出,经多次试验后,寻找效果最好的max_depth,min_samples_leaf,n_estimators大小,得到基于随机森林的含气量预测值。
[0094]
(4)将筛选并归一化后的纵横波速度、密度作为bp神经网络输入,岩心含气量作为输出,依照adam算法和mse不断修正神经元连接权重和偏置,得到含气量预测值。
[0095]
(5)将筛选并归一化后的纵横波速度、密度作为卷积神经网络输入,岩心含气量作为输出,将大小为1
×
3的多个训练样本传递给卷积层,卷积层采用same的补丁方式,用128个大小为1
×
2的卷积核与训练样本卷积,得到128个1
×
3的特征图,输入到128个大小为128
×1×
2的卷积层,同样采取same的补丁方式,得到128个1
×
3的特征图,输入到大小为1
×
2的池化层,得到128个1
×
2的特征图,接着输入到含256个卷积核的两个卷积层和一个池化层中,得到并将输出传递给下flatten层展平后交给全连接层得到输出,将预测值和真实值
按照最小均方误差计算损失,反馈给隐藏层神经元,修正参数,得到基于卷积神经网络的含气量预测值。
[0096]
通过(9)(10),计算输入纵横波速度、密度预测含气量各模型的均方误差(mse)和决定系数(r2),如柱形图5。
[0097][0098][0099]
式(9)(10)中:m为总样本数,为含气量预测值;yi为含气量岩心测试值,也即真实值;为含气量真实值的均值。
[0100]
利用上述几种方法对地震数据进行预测,得到的含气量真实值和预测值如图4所示。
[0101]
本实施例利用以上几种方法得到的均方误差(mse)和决定系数(r2)如图5所示。
[0102]
3、将自然伽马、纵波速度、密度作为输入,页岩岩心含气量作为输出,然后同样按照2中的方法得到含气量预测值。各模型的均方误差(mse)和决定系数(r2)如图6所示。
[0103]
从图5和图6中可以看出,本发明的均方误差(mse)均小于其余几种方法,决定系数(r2)均大于其余几种方法,证明本发明的模型具有更高的预测精度。
[0104]
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1