基于决策树的页岩气开发主控因素分析方法与流程

文档序号:25991782发布日期:2021-07-23 21:03阅读:300来源:国知局
基于决策树的页岩气开发主控因素分析方法与流程

本发明涉及非常规油气藏开采技术领域,更为具体的,涉及基于决策树的页岩气开发主控因素分析方法。



背景技术:

由于极低的渗透率,页岩气的开发一般需要借助水平钻井和多段压裂技术。而水平井的开发效果一般取决于地质静态参数(如孔隙度、toc、脆性矿物含量、和含气量等)和压裂施工情况(压裂水平段长、改造段数、总簇数、用液量、加砂量、排量和停泵压力等)的综合影响。在实际开发中可能经常遇到不同平台的水平井产量差异巨大的情况,有时同一平台的水平井也可能有着截然不同的生产特征。为了解释这些现象,我们需要研究哪些参数对页岩气水平井生产起主导作用,即开展水平井产能主控因素分析。

传统的油气藏生产主控因素分析一般借助数值模拟开展,例如,传统的技术中,公开号为cn104698152a的中国专利申请公开了一种研究泥页岩吸附天然气主控因素的方法,该方法利用平行实验和数值模拟,通过分别控制单一因素:有机质丰度、粘土矿物含量、有机质成熟度、天然气组成、温压和湿度的变化,来揭示有机质丰度、粘土矿物含量、有机质成熟度、天然气组成、温压和湿度对泥页岩吸附能力的影响,为页岩气勘探有利区预测奠定基础。

但对于复杂的问题,数值模拟模型可能不能考虑到所有物理过程而引入模型误差,进而会影响主控因素分析结果的准确性。随着国内页岩气开发的不断推进,目前已经积累了一定数量的水平井开发数据,这些数据为基于数据挖掘的页岩气产能主控因素分析提供了基础。基于实际的开发数据进行分析,能够消除模型误差的影响,提高结果的准确性。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供基于决策树的页岩气开发主控因素分析方法,可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性等。

本发明的目的是通过以下方案实现的:

基于决策树的页岩气开发主控因素分析方法,包括步骤:

s1,获取页岩气开发数据集;

s2,基于获取的页岩气开发数据集,建立决策树模型;

s3,训练决策树模型;

s4,基于训练后的决策树模型,计算特征重要性;

s5,根据特征重要性分析判断主控因素。

进一步地,在步骤s1中,包括标记步骤:将获取的页岩气开发数据集标记为数据集d,且数据集d中每一个样本为一口页岩气井的数据,包括地质参数、工程参数和生产指标,并将每一个地质参数和工程参数称为一个特征,标记为a。

进一步地,在步骤s2中,所述决策树模型采用cart回归树,在选定的某一决策树节点,对于任意划分的特征a,对应的任意划分点s,数据集d划分成数据集d1和d2,作如下和方差计算处理:

其中,xi为样本输入,yi为样本输出,c1为d1数据集的样本输出均值,c2为d2数据集的样本输出均值;然后,设定节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度作为cart回归树终止标准;

进一步地,在步骤s3中,训练决策树模型时,输入为训练集d,节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度;从根节点开始,用训练集递归地建立cart回归树。

进一步地,用训练集递归地建立cart回归树,包括如下步骤:

s31,对于当前节点,如果树的最大深度达到设定值,当前节点停止递归;

s32,对于当前节点的数据集为d,如果样本个数小于节点最小样本个数阈值或者没有特征,当前节点停止递归;

s33,计算样本集d的和方差,如果和方差小于节点划分最小和方差阈值,当前节点停止递归;

s34,计算当前节点现有的各个特征的各个划分点对数据集d的和方差,选择和方差最小的特征a和对应的划分点s;根据这个最优特征和划分点,把数据集划分成两部分d1和d2,同时建立当前节点的左右子节点,左子节点的数据集为d1,右子节点的数据集为d2;

s35,重复步骤s31~s34,依此递归下去,直到达到终止标准。

进一步地,在步骤s4中,包括步骤:

s41,计算节点j的重用性nj,计算公式如下:

其中,cj代表节点j的和方差,wj代表到达节点j的加权样本数量,通过达到节点j的样本数除以样本总数来计算,分别代表左子节点和右子节点的和方差,分别代表左子节点和右子节点的加权样本数量;

s42,计算特征i的重要性fii,计算公式如下:

其中,

进一步地,在步骤s5中,包括步骤:基于计算所得的各特征的特征重要性进行排序,得到任一数量内的页岩气开发主控因素。

本发明的有益效果包括:

(1)本发明采用数据驱动的方法,可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性。

(2)本发明以川南地区页岩气水平井体积压裂效果为工程背景,以提高压裂后单井产能为目标,充分考虑了页岩储层静态参数,深入研究了toc、孔隙度等地质参数与工程参数对产能的影响规律,基于决策树计算的数学模型,准确找到了影响产能的主控因素及其权重,为川南地区页岩气井的产能预测提供了一种新思路和新方法,提高了主控因素分析方法的准确度,并有效地指导现场施工。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的方法步骤流程图;

图2为本发明实施例的主控因素分析效果示意图。

具体实施方式

本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。

如图1,2所示,基于决策树的页岩气开发主控因素分析方法,包括步骤:

s1,获取页岩气开发数据集;

s2,基于获取的页岩气开发数据集,建立决策树模型;

s3,训练决策树模型;

s4,基于训练后的决策树模型,计算特征重要性;

s5,根据特征重要性分析判断主控因素。

该实施例中,数据集d包含146口井的数据,其中地质和工程参数包括:五峰组长度、1小层长度、2小层长度、靶体中部距优质页岩底部距离、i类储层钻遇长度、i类储层钻遇长度、垂深、实际压裂段长、平均分段段长、实际段数、总簇数、单段射孔簇数、簇间距、排量、泵压、总液量、平均单段液量、用液强度、总滑溜水量、总线性胶量、总砂量、平均单段砂量、加砂强度、100目粉砂总量、40/70目陶粒总量、平均停泵压力、平均单段100目粉砂、平均单段40/70目陶粒、水平最大主应力、水平最小主应力、垂向应力、toc、含气量、孔隙度、矿物脆性和闷井天数,生产指标为90天累计产量。这样,数据集d共含36个输入特征,1个输出指标。

决策数模型的类别选取为cart回归树。cart回归树的特征选择标准选取为和方差。节点最小样本个数阈值设置为1,节点划分最小和方差阈值设置为0,树的最大深度设置为8。

训练决策树模型后,计算各特征的重要性,最终进行排序,如图2所示。决策树选取的90天累计产量前10个主控因素为:平均单段液量、泵压、平均停泵压力、100目粉砂总量、平均单段砂量、排量、总液量、用液强度、靶体中部距优质页岩底部距离和2小层长度。

本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。

除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,在一台计算机设备(可以是个人计算机,服务器,或者网络设备等)以及相应的软件中执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、或者光盘等各种可以存储程序代码的介质,进行测试或者实际的数据在程序实现中存在于只读存储器(randomaccessmemory,ram)、随机存取存储器(randomaccessmemory,ram)等。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1