一种油气甜点预测方法及存储介质与流程

文档序号:15115780发布日期:2018-08-07 20:05阅读:424来源:国知局

本发明涉及油气勘探领域,尤其涉及一种油气甜点预测方法及存储介质。



背景技术:

油气资源评价与勘探开发过程中,为了准确定位油气聚集区、描述油气储层品质和评价油气资源储量,需要开展精确的储层评价与油藏描述,确定油气甜点的位置等。

目前,现有的油气甜点预测评价方法在对油气甜点进行评价时,通常会采用定性或半定量分析的方式,需要人工参与预测,容易受到解释人员技术经验、专业能力等人为因素的不确定性影响,普遍具有分辨率低、精度低等问题。



技术实现要素:

本发明所要解决的技术问题是针对现有技术的不足,提供一种油气甜点预测方法及存储介质。

本发明解决上述技术问题的技术方案如下:

一种油气甜点预测方法,包括:

获取油气甜点区域的测井数据和多种地震属性;

根据所述测井数据得到所述油气甜点区域的指示曲线,将所述指示曲线和各种所述地震属性作为机器学习的学习样本;

对所述学习样本进行特征优选;

根据优选后的所述学习样本进行机器学习,得到预测模型;

根据所述预测模型对任意目标区域的油气甜点进行预测。

本发明的有益效果是:本发明提供的一种油气甜点预测方法,通过获取油气甜点区域的测井数据和多种地震属性,并据此进行机器学习,建立预测模型,通过测井数据和地震属性结合的方式建立的预测模型,能够提高使用该模型进行预测时的准确性,并对得到的学习样本进行特征优选,能够排除学习样本中的干扰,提高预测的分辨率,并在建立预测模型后,就可以根据该预测模型对任意区域的油气甜点进行预测,实现了对油气甜点的定量预测,可以避免人为因素的影响,并且可以简化运算过程,不需要进行复杂冗余的计算,就可以得到高分辨率、高精度的预测结果。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步地,所述根据所述预测模型对任意目标区域的油气甜点进行预测之后,还包括:

对预测结果进行概率密度约束。

采用上述进一步方案的有益效果是:为了避免预测模型的平均效应,通过对预测结果进行概率密度约束,引入一定的随机性,能够进一步提高预测结果的分辨率。

进一步地,所述对预测结果进行概率密度约束,具体包括:

根据所述预测结果建立高斯分布概率密度函数;

根据所述高斯分布概率密度函数计算累积分布函数;

在预设的置信空间内,采用随机采样规则随机获取一个变量值,所述变量值由所述累积分布函数确定,且满足预设累积概率;

将所述变量值作为进行概率密度约束后的预测结果。

进一步地,所述对所述学习样本进行特征优选,具体包括:

依次根据各种所述地震属性在不同井位与所述指示曲线的一致性、每种所述地震属性的贡献度以及各种所述地震属性之间的正交性,对所述学习样本进行特征优选。

采用上述进一步方案的有益效果是:通过分别从一致性、贡献度和正交性的角度对学习样本进行特征优选,能够排除不相关、不一致和贡献度低的学习样本,能够进一步提高预测结果的精确度,提前排除不相关的学习样本,能够减少对这些不相关学习样本的处理过程,提高预测效率和速度。

进一步地,所述依次根据各种所述地震属性在不同井位与所述指示曲线的一致性、每种所述地震属性的贡献度以及各种所述地震属性之间的正交性,对所述学习样本进行特征优选,具体包括:

计算各种所述地震属性在不同井位与所述指示曲线的相关系数;

根据所述相关系数对每种所述地震属性在不同井位与所述指示曲线的相关性进行分析,并剔除相关性不一致的井位,得到第一优选样本;

根据模糊逻辑方法,计算所述第一优选样本中各种所述地震属性的贡献度;

剔除所述第一优选样本中所述贡献度小于预设贡献度的地震属性,得到第二优选样本;

根据相关分析方法,计算所述第二优选样本中各种所述地震属性两两之间的正交系数;

剔除所述第二优选样本中所述正交系数小于预设正交系数的地震属性,得到优选后的所述学习样本。

进一步地,所述根据优选后的所述学习样本进行机器学习,得到预测模型,具体包括:

将优选后的所述学习样本随机分类为训练样本、交叉验证样本和测试样本;

根据所述交叉验证样本和网络搜索方法对预设的全部超参数的取值进行交叉验证,选取交叉验证误差最小的取值作为最优超参数;

根据所述测试样本的预测值和真实值,对预设的机器学习算法和所述最优超参数进行质量检测,并当不符合预设检测结果时,调整所述机器学习算法和所述最优超参数;

根据所述训练样本、所述最优超参数和所述机器学习算法建立非线性多元函数,作为预测模型。

采用上述进一步方案的有益效果是:通过将学习样本随机分类为训练样本、交叉验证样本和测试样本,并据此选择调整超参数,据此建立预测模型,能够提高预测模型的预测精度和泛化能力,减小预测误差。

进一步地,所述根据所述预测模型对任意目标区域的油气甜点进行预测,具体包括:

获取任意目标区域的地震属性;

将所述地震属性以地震数据体的形式输入到所述预测模型中,对所述目标区域的油气甜点进行预测,得到所述目标区域油气甜点的空间位置分布。

进一步地,所述根据所述测井数据得到所述油气甜点区域的指示曲线,将所述指示曲线和各种所述地震属性作为机器学习的学习样本,具体包括:

根据所述测井数据得到所述油气甜点区域的指示曲线;

获取所述油气甜点区域的岩心信息,根据所述岩心信息对所述指示曲线进行校验;

将检验后的所述指示曲线和各种所述地震属性作为机器学习的学习样本。

进一步地,还包括:

获取所述油气甜点区域的现有地质信息;

根据所述现有地质信息和所述岩心信息,对预测结果进行评价。

采用上述进一步方案的有益效果是:通过现有地质信息和岩心信息对预测结果进行评价,能够确保其对油气甜点预测的有效性。

本发明解决上述技术问题的另一种技术方案如下:

一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述技术方案中任一项所述的方法。

本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。

附图说明

图1为本发明一种油气甜点预测方法的一个实施例提供的流程示意图;

图2为本发明一种油气甜点预测方法的另一实施例提供的流程示意图;

图3为本发明一种油气甜点预测方法的另一实施例提供的流程示意图;

图4为本发明一种油气甜点预测方法的另一实施例提供的流程示意图;

图5为本发明一种油气甜点预测方法的另一实施例提供的流程示意图;

图6为本发明一种油气甜点预测方法的另一实施例提供的流程示意图;

图7为本发明一种油气甜点预测方法的另一实施例提供的流程示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实施例只用于解释本发明,并非用于限定本发明的范围。

如图1所示,为本发明一种油气甜点预测方法的一个实施例提供的流程示意图,该方法可以对油气甜点分布进行精确高分辨率的预测,该方法可以包括:

s1,获取油气甜点区域的测井数据和多种地震属性。

需要说明的是,为提高预测准确度,可以进行多个井位的测井。测井数据指的是测井测量得到的测井曲线以及岩性、含油气性等测井结果。地震属性包括由采集的地震振幅数据计算得到的各种地震属性与反演结果。

测井数据与地震属性分别分布于深度域与时间域,需要提前完成井震标定、深时转换等工作。

s2,根据测井数据得到油气甜点区域的指示曲线,将指示曲线和各种地震属性作为机器学习的学习样本。

s3,对学习样本进行特征优选。

需要说明的是,可以根据实际需求设置优选规则,对学习样本进行特征优选。

例如,可以根据各种地震属性在不同井位与只是曲线的一致性进行特征优选。

又例如,还可以根据某种地震属性对油气甜点预测区域的贡献度高低进行特征优选。

又例如,还可以根据各种地震属性之间的相互干扰的正交性强弱,进行特征优选。

s4,根据优选后的学习样本进行机器学习,得到预测模型。

需要说明的是,机器学习的目的是为了得到一个关于x和y的关系表达式,其中,x为需要预测的输入,y为得到的预测结果的输出。

例如,可以通过以下非线性多元函数来描述,具体表示为:

y=f(x|w,b);

其中,f表示非线性多元函数,w为向量形式的权系数,b为偏差值。

也就是说,机器学习训练的关键是获取能够合理表达y与x之间关系的非线性多元函数,也就是确定模型参数:权系数w与偏差值b。模型参数的确定可以看成是一个最优化求解问题,按照误差最小二乘法的思想,在一定约束条件下,目标函数可以表示为:

具体地,机器学习的训练方法有很多,可以根据实际需求设置。

例如,机器学习的方法可以选用神经网络。

又例如,机器学习的方法还可以选用支持向量机。

对于不同机器学习算法,非线性多元函数f的具体表现形式有所不同,w与b的维度也有所不同,且可能会包含其他的超参数。

例如,对于支持向量机回归算法,最优化求解问题可以通过以下公式表达:

其中,c为正则化惩罚参数,ξi与ξi*为松弛变量,ε表示管道宽度。

s5,根据预测模型对任意目标区域的油气甜点进行预测。

例如,当得到目标区域的地震属性后,输入到预测模型中,就可以得到油气甜点的空间位置分布结果,能够很好地用于油气藏定量评价。

本实施例提供的一种油气甜点预测方法,通过获取油气甜点区域的测井数据和多种地震属性,并据此进行机器学习,建立预测模型,通过测井数据和地震属性结合的方式建立的预测模型,能够提高使用该模型进行预测时的准确性,并对得到的学习样本进行特征优选,能够排除学习样本中的干扰,提高预测的分辨率,并在建立预测模型后,就可以根据该预测模型对任意区域的油气甜点进行预测,实现了对油气甜点的定量预测,可以避免人为因素的影响,并且可以简化运算过程,不需要进行复杂冗余的计算,就可以得到高分辨率、高精度的预测结果。

如图2所示,为本发明一种油气甜点预测方法的另一实施例提供的流程示意图,该方法可以对油气甜点分布进行精确高分辨率的预测,该方法可以包括:

s1,获取油气甜点区域的测井数据和多种地震属性。

需要说明的是,本实施例中与上述实施例相同的步骤的说明,可以参考上述实施例中的对应说明,在此不再赘述。

s2,根据测井数据得到油气甜点区域的指示曲线,将指示曲线和各种地震属性作为机器学习的学习样本。

优选地,如图3所示,步骤s2中,具体可以包括:

s21,根据测井数据得到油气甜点区域的指示曲线。

s22,获取油气甜点区域的岩心信息,根据岩心信息对指示曲线进行校验。

需要说明的是,岩心信息指的是对钻井过程中,岩心采样与测量评价。

本实施例中将测井数据通过岩心信息进行校验,共同提供油气甜点的指示曲线,分布于多口井,指示曲线的类型与待预测的油气甜点的类型相同。

s23,将检验后的指示曲线和各种地震属性作为机器学习的学习样本。

需要说明的是,为保证地震属性与指示曲线的对应性,地震属性以沿各井轨迹分布的曲线(井旁道)格式提供。指示曲线与地震属性共同构成机器学习油气甜点智能预测的学习样本。

s3,对学习样本进行特征优选。

优选地,步骤s3中,具体可以包括:

依次根据各种地震属性在不同井位与指示曲线的一致性、每种地震属性的贡献度以及各种地震属性之间的正交性,对学习样本进行特征优选。

需要说明的是,以上仅是给出了特征优选的一种最优实施顺序,实际还可以根据实际需求对一致性、贡献度和正交性的优选顺序进行调整和设置。

例如,还可以依次根据各种地震属性在不同井位与指示曲线的一致性、各种地震属性之间的正交性以及每种地震属性的贡献度,对学习样本进行特征优选。

优选地,如图4所示,步骤s3中,具体可以包括:

s31,计算各种地震属性在不同井位与指示曲线的相关系数。

s32,根据相关系数对每种地震属性在不同井位与指示曲线的相关性进行分析,并剔除相关性不一致的井位,得到第一优选样本。

需要说明的是,由于同一种地震属性在不同井点处可能表现出相反的相关性特征,如果所有井点同时参与目标预测的话,会因为规律相互矛盾导致预测结果精度降低甚至错误,因此,通过一致性对学习样本进行特征优选,能够避免预测结果精度降低。

例如,可以通过相关系数的正负来进行相关性的筛选,当相关系数为正时,可以认为相关性一致,当相关系数为负时,可以认为相关性不一致。

s33,根据模糊逻辑方法,计算第一优选样本中各种地震属性的贡献度。

例如,各种地震属性的贡献度可以用介于0到1之间的小数来表示,贡献度的数值越大,可以认为贡献度越大。

具体地,可以应用相关分析技术计算不同地震属性与油气甜点目标指示曲线在研究目的层段的相关系数,只考虑相关系数的大小,将相关系数的绝对值表示为c,作为地震属性贡献度评价的依据。然后利用模糊逻辑中的隶属度函数评价不同地震属性对预测目标甜点的贡献度,可以表示为d(c):

其中,cmin与cmax表示贡献度评价的有效范围,介于0到1之间,且cmin<cmax,可分别取各种地震属性与指示曲线相关系数的绝对值的最小值与最大值,也可以根据需要设定。

s34,剔除第一优选样本中贡献度小于预设贡献度的地震属性,得到第二优选样本。

s35,根据相关分析方法,计算第二优选样本中各种地震属性两两之间的正交系数。

需要说明的是,由于多种地震属性相互之间存在相关性,不加筛选的使用会造成机器学习的冗余与干扰。通过相关分析方法,计算各种地震属性两两之间的相关系数并进行分析评价,如果任意两个地震属性之间具有高相关性,则需保留其中具有高贡献度的属性,并剔除其余低贡献度属性。

为便于计算,可以选择各种两两地震属性之间的相关系数作为正交系数,例如,可以设置为当相关系数c大于clmt时,两个地震属性之间具有高相关性,clmt可以根据实际需求设置,具体地,可以通过以下公式表示:

其中,xi与xj表示第i个与第j个属性,cij表示两种属性之间相关系数的绝对值,clmt表示正交性判断的标准,介于0到1之间,一般取0.5,也可以根据属性相互之间相关系数的分布情况进行选择。x表示优选出来的地震属性组合。

s36,剔除第二优选样本中正交系数小于预设正交系数的地震属性,得到优选后的学习样本。

例如,可以通过以下公式表示:

{(x1,y1),(x2,y2),...,(xi,yi)};xi∈rm,yi∈r;

其中,xi为以向量形式表示的地震属性自变量,即优选出来的地震属性组合,共有m个属性;yi为应变量,即目标油气甜点;i表示样本的采样索引,总样本个数为n;r表示实数集。

s4,根据优选后的学习样本进行机器学习,得到预测模型。

优选地,如图5所示,步骤s4中,具体可以包括:

s41,将优选后的学习样本随机分类为训练样本、交叉验证样本和测试样本。

其中,训练样本作为机器学习的数据输入。例如,可以通过求解最优化问题建立相应的非线性多元函数,即训练生成对训练样本具有低预测误差的机器学习模型。

交叉验证样本用于对超参数的选值进行交叉验证。例如,可以应用网格搜索的方式对不同超参数选值进行交叉验证,以颜色网格图的方式形象地展示不同超参数情况下机器学习的交叉验证误差,以选择最优的超参数。

测试样本用于对优选的机器学习算法及超参数进行质控。例如,可以通过基于测试样本的预测值与真实值的对角交汇图分析所训练模型的泛化能力,如果交汇数据点位于对角线上或周围,可以认为训练模型具有很好的泛化能力;否则,需要进一步调整学习样本、机器学习算法或超参数。

s42,根据交叉验证样本和网络搜索方法对预设的全部超参数的取值进行交叉验证,选取交叉验证误差最小的取值作为最优超参数。

s43,根据测试样本的预测值和真实值,对预设的机器学习算法和最优超参数进行质量检测,并当不符合预设检测结果时,调整机器学习算法和最优超参数。

需要说明的是,具体选择的机器学习算法和调整的最优超参数可以根据实际需求设置。

s44,根据训练样本、最优超参数和机器学习算法建立非线性多元函数,作为预测模型。

s5,根据预测模型对任意目标区域的油气甜点进行预测。

优选地,如图6所示,步骤s5中,具体可以包括:

s51,获取任意目标区域的地震属性。

需要说明的是,为便于预测计算,可以将特征优选后的地震属性作为预测模型的输入,进行预测,也就是说,获取的地震属性是经过特征优选后的地震属性。

s52,将地震属性以地震数据体的形式输入到预测模型中,对目标区域的油气甜点进行预测,得到目标区域油气甜点的空间位置分布。

优选地,步骤s5之后,还可以包括:

s6,对预测结果进行概率密度约束。

优选地,如图7所示,步骤s6中,具体可以包括:

s61,根据预测结果建立高斯分布概率密度函数。

例如,假设预测结果符合高斯分布:

其中,μ为均值,由机器学习非线性多元回归预测得到,σ2为方差,由油气甜点指示曲线提供。

s62,根据高斯分布概率密度函数计算累积分布函数。

需要说明的是,累积分布函数是与该高斯分布概率密度函数对应的。

s63,在预设的置信空间内,采用随机采样规则随机获取一个变量值,变量值由累积分布函数确定,且满足预设累积概率。

需要说明的是,置信空间可以为均值μ附近1到3个标准差范围内。

s64,将变量值作为进行概率密度约束后的预测结果。

优选地,还可以包括:

s7,获取油气甜点区域的现有地质信息。

s8,根据现有地质信息和岩心信息,对预测结果进行评价。

本实施例提供的一种油气甜点预测方法,通过获取油气甜点区域的测井数据和多种地震属性,并据此进行机器学习,建立预测模型,通过测井数据和地震属性结合的方式建立的预测模型,能够提高使用该模型进行预测时的准确性,并对得到的学习样本进行特征优选,能够排除学习样本中的干扰,提高预测的分辨率,并在建立预测模型后,就可以根据该预测模型对任意区域的油气甜点进行预测,实现了对油气甜点的定量预测,可以避免人为因素的影响,并且可以简化运算过程,不需要进行复杂冗余的计算,就可以得到高分辨率、高精度的预测结果。

并且为了避免预测模型的平均效应,通过对预测结果进行概率密度约束,引入一定的随机性,能够优选提高预测结果的分辨率。

并通过分别从一致性、贡献度和正交性的角度对学习样本进行特征优选,能够排除不相关、不一致和贡献度低的学习样本,能够优选提高预测结果的精确度,提前排除不相关的学习样本,能够减少对这些不相关学习样本的处理过程,提高预测效率和速度。

并通过将学习样本随机分类为训练样本、交叉验证样本和测试样本,并据此选择调整超参数,据此建立预测模型,能够提高预测模型的预测精度和泛化能力,减小预测误差。

并通过现有地质信息和岩心信息对预测结果进行评价,能够确保其对油气甜点预测的有效性。

在另一实施例中,本发明还提供一种存储介质,存储介质中存储有指令,当计算机读取指令时,使计算机执行如上述各实施例中任一项的方法。

读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1