基于测井曲线的岩性识别方法及装置与流程

文档序号:16468980发布日期:2019-01-02 22:57阅读:508来源:国知局
基于测井曲线的岩性识别方法及装置与流程

本申请涉及测井资料岩性解释技术领域,尤其是涉及一种基于测井曲线的岩性识别方法及装置。



背景技术:

测井岩性解释成果是储层参数计算和油气评价的基础,其为沉积相识别等地质研究提供了依据。目前,岩性的识别通常有两种方法,一种是参考岩心岩屑录井资料,二是用自然伽马、自然电位或声波时差等反映岩性变化的测井曲线特征识别岩性。

考虑到取芯成本较高,并不是每口井都有取心资料(一般是重点探井才有),而石油钻井时,在钻到设计井深深度后都必须进行测井。因此对于取心资料较全的地区,对无取心井和无取心井段,可以通过建立岩石类型-测井参数的测井解释模型来确定岩性。而对于取心资料较少或者没有取心资料的地区,目前是人工手动利用自然电位、伽马、测向测井、声波时差等测井曲线特征解释识别砂岩、泥岩、钙质砂岩等不同的岩性。然而,人工解释识别的效率比较低,且对于测井曲线特征不明显的井识别率低。



技术实现要素:

本申请实施例的目的在于提供一种基于测井曲线的岩性识别方法及装置,以提高岩性识别的效率和精度。

为达到上述目的,一方面,本申请实施例提供了一种基于测井曲线的岩性识别方法,包括:

获取目标井的多条测井曲线;

标准化所述测井曲线;

对标准化后的测井曲线进行主成分分析,以获取主成分测井数据;

基于预设的聚类算法对所述主成分测井数据进行聚类,获得所述目标井的岩性识别结果。

本申请实施例的基于测井曲线的岩性识别方法中,所述标准化所述测井曲线,包括:

对所述多条测井曲线进行标准差标准化处理。

本申请实施例的基于测井曲线的岩性识别方法中,所述对标准化后的测井曲线进行主成分分析,包括:

获取初始测井数据的协方差矩阵;所述初始测井数据为标准化后的测井曲线的测井数据;

确定所述协方差矩阵的特征值及特征向量;

对所述特征值进行从大到小排序,并根据公式确定大于预设阈值时的主成分测井曲线个数;其中,λi为第i个特征值,m为测井曲线个数,l为大于预设阈值时的主成分测井曲线个数;

根据公式xnl=ynm*uml确定主成分测井数据;其中,xnl为主成分测井数据,ynm为初始测井数据,uml为对初始测井数据的协方差矩阵求取的特征向量。

本申请实施例的基于测井曲线的岩性识别方法中,所述预设的聚类算法包括核k-均值聚类算法。

本申请实施例的基于测井曲线的岩性识别方法中,对于所述目标井中的每口井,所述基于预设的聚类算法对所述主成分测井数据进行聚类,包括:

a、按照n/k的间隔取k个数据点作为初始聚类中心点,并根据所述初始聚类中心点对所述主成分测井数据进行初始分类;其中,n为主成分测井数据个数,k为初始分类数;

b、根据公式将主成分测井数据从输入空间映射到高维特征空间,求取核函数矩阵;其中,kmi,j为核函数矩阵第i行第j列元素,xi为第i个主成分测井数据,xj为第j个主成分测井数据,κ(xi,xj)为第i个主成分测井数据与第j个主成分测井数据的核函数,φ(xi)为第i个主成分测井数据到高维特征空间的映射,φ(xj)为第j个主成分测井数据在高维特征空间的映射,<φ(xi),φ(xj)>为第i个主成分测井数据到高维空间的映射与第j个主成分测井数据到高维空间的映射的內积,σ为核参数,l为主成分测井曲线个数,xil为第i个主成分测井数据的第l个分量,xjl为第j个主成分测井数据的第l个分量;

c、统计每类的数据样本个数counti;

d、根据公式pi=counti/n确定每类所占的概率;其中pi为第i类在n中所占的比例;

e、根据公式确定高维特征空间中每个主成分测井数据xn与各类ci的频率差异测度;其中,disti为高维特征空间中每个主成分测井数据φ(xn)与φ(ci)类中心的频率差异测度,φ(xn)为第n个主成分测井数据到高维特征空间的映射,ci为第i类,φ(ci)为ci类中心到高维空间的映射,λ为惩罚因子;

f、确定每个主成分测井数据的最小disti,并将每个主成分测井数据归类至与其最小disti所对应的类别中;

g、更新聚类中心点,并重复c~f,直至满足预设的迭代终止条件;

h、输出每个主成分测井数据所属类别,并根据测井曲线特征,给各类别赋予岩性。

另一方面,本申请实施例还提供了一种基于测井曲线的岩性识别装置,包括:

测井曲线获取模块,用于获取目标井的多条测井曲线;

测井曲线标准化模块,用于标准化所述测井曲线;

主成分分析模块,用于对标准化后的测井曲线进行主成分分析,以获取主成分测井数据;

测井数据聚类模块,基于预设的聚类算法对所述主成分测井数据进行聚类,获得所述目标井的岩性识别结果。

本申请实施例的基于测井曲线的岩性识别装置中,所述标准化所述测井曲线,包括:

对所述多条测井曲线进行标准差标准化处理。

本申请实施例的基于测井曲线的岩性识别装置中,所述对标准化后的测井曲线进行主成分分析,包括:

获取初始测井数据的协方差矩阵;所述初始测井数据为标准化后的测井曲线的测井数据;

确定所述协方差矩阵的特征值及特征向量;

对所述特征值进行从大到小排序,并根据公式确定大于预设阈值时的主成分测井曲线个数;其中,λi为第i个特征值,m为测井曲线个数,l为大于预设阈值时的主成分测井曲线个数;

根据公式xnl=ynm*uml确定主成分测井数据;其中,xnl为主成分测井数据,ynm为初始测井数据,uml为对初始测井数据的协方差矩阵求取的特征向量。

本申请实施例的基于测井曲线的岩性识别装置中,所述预设的聚类算法包括核k-均值聚类算法。

本申请实施例的基于测井曲线的岩性识别装置中,对于所述目标井中的每口井,所述基于预设的聚类算法对所述主成分测井数据进行聚类,包括:

a、按照n/k的间隔取k个数据点作为初始聚类中心点,并根据所述初始聚类中心点对所述主成分测井数据进行初始分类;其中,n为主成分测井数据个数,k为初始分类数;

b、根据公式将主成分测井数据从输入空间映射到高维特征空间,求取核函数矩阵;其中,kmi,j为核函数矩阵第i行第j列元素,xi为第i个主成分测井数据,xj为第j个主成分测井数据,κ(xi,xj)为第i个主成分测井数据与第j个主成分测井数据的核函数,φ(xi)为第i个主成分测井数据到高维特征空间的映射,φ(xj)为第j个主成分测井数据在高维特征空间的映射,<φ(xi),φ(xj)>为第i个主成分测井数据到高维空间的映射与第j个主成分测井数据到高维空间的映射的內积,σ为核参数,l为主成分测井曲线个数,xil为第i个主成分测井数据的第l个分量,xjl为第j个主成分测井数据的第l个分量;

c、统计每类的数据样本个数counti;

d、根据公式pi=counti/n确定每类所占的概率;其中pi为第i类在n中所占的比例;

e、根据公式确定高维特征空间中每个主成分测井数据xn与各类ci的频率差异测度;其中,disti为高维特征空间中每个主成分测井数据φ(xn)与φ(ci)类中心的频率差异测度,φ(xn)为第n个主成分测井数据到高维特征空间的映射,ci为第i类,φ(ci)为ci类中心到高维空间的映射,λ为惩罚因子;

f、确定每个主成分测井数据的最小disti,并将每个主成分测井数据归类至与其最小disti所对应的类别中;

g、更新聚类中心点,并重复c~f,直至满足预设的迭代终止条件;

h、输出每个主成分测井数据所属类别,并根据测井曲线特征,给各类别赋予岩性。

由以上本申请实施例提供的技术方案可见,本申请实施例在标准化目标井的测井曲线后,通过进行主成分分析可获取主成分测井数据,然后基于预设的聚类算法可对主成分测井数据进行聚类,从而获得目标井的岩性识别结果。由此本申请实施例通过聚类算法和测井曲线特征的结合实现了岩性的自动识别,从而提高测井岩性识别的效率,并且本申请实施例通过聚类算法和主成分分析可以测井岩性识别的精度。本申请实施例在取心资料较少及无取心资料情况下尤其适用。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本申请一实施例中基于测井曲线的岩性识别方法的流程图;

图2为为本申请一实施例中基于测井曲线的岩性识别方法的岩性划分结果示意图;

图3为本申请一实施例中基于测井曲线的岩性识别装置的结构框图;

图4为本申请另一实施例中基于测井曲线的岩性识别装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。例如在下面描述中,在第一部件上方形成第二部件,可以包括第一部件和第二部件以直接接触方式形成的实施例,还可以包括第一部件和第二部件以非直接接触方式(即第一部件和第二部件之间还可以包括额外的部件)形成的实施例等。

而且,为了便于描述,本申请一些实施例可以使用诸如“在…上方”、“在…之下”、“顶部”、“下方”等空间相对术语,以描述如实施例各附图所示的一个元件或部件与另一个(或另一些)元件或部件之间的关系。应当理解的是,除了附图中描述的方位之外,空间相对术语还旨在包括装置在使用或操作中的不同方位。例如若附图中的装置被翻转,则被描述为“在”其他元件或部件“下方”或“之下”的元件或部件,随后将被定位为“在”其他元件或部件“上方”或“之上”。

参考图1所示,本申请实施例的基于测井曲线的岩性识别方法可以包括以下步骤:

s101、获取目标井的多条测井曲线。

在本申请一实施例中,所述目标井可以是指目标区域内的多口井的多条测井曲线。在一示例性实施例中,所述测井曲线例如可以为自然电位测井曲线、自然伽马测井曲线、声波时差测井曲线、侧向测井测井曲线、补偿中子测井曲线、岩石体积测井曲线、密度测井曲线等中的任意一种或多种。

s102、标准化所述测井曲线。

在本申请一实施例中,通过将测井曲线标准化可以消除量纲的影响,从而有利于进一步提高岩性识别分类的精度。在一示例性实施例中,所述标准化例如可以包括但不限于标准差标准化等。

s103、对标准化后的测井曲线进行主成分分析,以获取主成分测井数据。

在本申请一实施例中,通过对标准化后的测井曲线进行主成分分析,可以去除噪声等,从而获取主成分测井数据,后续将去除噪声等影响的主成分测井数据用于岩性识别分类,从而也有利于进一步提高岩性识别的精度。需要说的是,本申请另一实施例中,在一些情况下,如果仅选择一条测井曲线,则在标准化处理后也可以不进行主成分分析。

在本申请一实施例中,所述对标准化后的测井曲线进行主成分分析可以包括如下步骤:

1)、获取初始测井数据的协方差矩阵;所述初始测井数据为标准化后的测井曲线的测井数据;在一示例性实施例中,初始测井数据x例如可以表示为x[n][m],即初始测井数据x可以为n行m列数据。其中,n可以为初始测井数据的数据点个数,m可以为测井曲线个数(一般m≥2)。相应的,可以求得该初始测井数据的协方差矩阵。

2)、确定所述协方差矩阵的特征值及特征向量。

3)、可对所述特征值进行按序排列(例如从大到小排序),并可根据公式确定大于预设阈值时的主成分测井数据个数;其中,λi为第i个特征值,q为测井曲线个数,l为大于预设阈值时的主成分测井数据个数。其中,所述预设阈值可根据需要设置,例如在一示例性实施例中,所述预设阈值可以设置为85%。需要说明的是,在本申请实施例中,所述主成分测井数据个数是指主成分测井数据的数据点个数。此外,在本申请一实施例中,上述对所述特征值进行按序排列可以方便主成分测井数据的筛选。

3)、可根据公式xnl=ynm*uml确定主成分测井数据;其中,xnl为主成分测井数据,ynm为初始测井数据,uml为对初始测井数据的协方差矩阵求取的特征向量。

s104、基于预设的聚类算法对所述主成分测井数据进行聚类,获得所述目标井的岩性识别结果。

在本申请一实施例中,所述预设的聚类算法可以是任何合适的聚类算法,例如可以是k-均值聚类算法、核k-均值聚类算法等。

其中,k-均值算法是一种广泛应用的简单有效的聚类算法。k-均值聚类算法从k个初始选取的中心开始,根据最小距离动态调整数据类别和每类中心,以最小化样本点与它最近的类中心的欧式距离的平方和。k-均值算法需要数据的真实聚类个数已知,仅当我们能够确定出数据中的类别数,进一步的聚类或分类才有意义。但在大多数情况下,我们难于准确地知道数据中的类别数。

而在实际应用中,虽然我们可能不知道数据中的真实类别数,但总可以将其估计的大一些并依此作为初始聚类个数k。k-均值聚类算法将频率敏感差异测度引入竞争学习,假定初始的聚类中心个数k大于数据集中真实的聚类个数k’,惩罚包含样本点较少的聚类,进而在迭代过程中变成空集,最终迭代生成正确聚类。

核k-均值聚类算法是核化的k-均值聚类算法。该方法通过一个非线性映射将原数据空间投影到高维空间,增加数据的可分性,用以解决非线性聚类问题。

在一示例性实施例中,以核k-均值聚类算法为例,对于所述目标井中的每口井,所述基于预设的聚类算法对所述主成分测井数据进行聚类可以包括如下步骤:

a、可按照n/k的间隔取k个数据点作为初始聚类中心点,并根据所述初始聚类中心点对所述主成分测井数据进行初始分类;其中,n可以为主成分测井数据个数,k为可以初始分类数;在一示例性实施例中,k的值可以为岩性类别的2或3倍。

b、根据公式将主成分测井数据从输入空间映射到高维特征空间,求取核函数矩阵;其中,km为核函数矩阵,为一个n*n的矩阵,kmi,j为核函数矩阵第i行第j列元素,i=1,…,n,j=1,…,n,xi为第i个主成分测井数据,xj为第j个主成分测井数据,κ为核函数,κ(xi,xj)为第i个主成分测井数据与第j个主成分测井数据的核函数,φ为从输入空间到高维特征空间的一个映射,φ(xi)为第i个主成分测井数据到高维特征空间的映射,φ(xj)为第j个主成分测井数据在高维特征空间的映射,<φ(xi),φ(xj)>为第i个主成分测井数据到高维空间的映射与第j个主成分测井数据到高维空间的映射的內积,σ为核参数,l为主成分测井曲线个数,xil为第i个主成分测井数据的第l个分量,xjl为第j个主成分测井数据的第l个分量。

c、统计每类的数据样本个数counti,i=1,…,k,k为初始分类数;

d、根据公式pi=counti/n确定每类所占的概率;其中pi为第i类在n中所占的比例;

e、根据公式确定高维特征空间中每个主成分测井数据xn与各类ci的频率差异测度;其中,disti为高维特征空间中每个主成分测井数据φ(xn)与φ(ci)类中心的频率差异测度,n=1,…,n,φ为从输入空间到高维特征空间的一个映射,φ(xn)为第n个主成分测井数据到高维特征空间的映射,ci为第i类,φ(ci)为ci类中心到高维空间的映射,λ为惩罚因子;

式中,xj∈ci表示第j个主成分测井数据属于第i类。

由于κ(xi,xj)=<φ(xi),φ(xj)>,高维特征空间中两点φ(xi)与φ(xj)的距离可表示为:

‖φ(xi)-φ(xj)‖2=κ(xi,xi)-2κ(xi,xj)+κ(xj,xj)

则高维特征空间φ(xn)与类中心φ(cj)的距离为:

则最终:

其中xj∈ci表示第j个主成分测井数据属于第i类,xk∈ci表示第k个主成分测井数据属于第i类;

f、确定每个主成分测井数据的最小disti,并可将每个主成分测井数据归类至与其最小disti所对应的类别中;

g、更新聚类中心点,并重复步骤c~f,直至满足预设的迭代终止条件;

h、输出每个主成分测井数据所属类别,并根据测井曲线特征,给各类别赋予岩性。

在本申请一实施例中,上述的迭代终止条件可以是预设的迭代次数,在本申请另一实施例中,上述的迭代终止条件还可以是相邻两次迭代前后,数据点的归类情况未发生变化等,等等。

在本申请一实施例中,对于第i类,若pi=0,则λ/pi视为正无穷,则该类将变为空集,因此可以将该类从竞争学习中退出,以去除无意义的计算,从而可以提高计算效率。

下面介绍本申请一示例性实施场景,收集某工区3口井的能反映岩性的2条测井曲线(本示例性实施场景的测井曲线包括自然电位和自然伽马两种测井曲线)。在对每条测井曲线采用标准差标准化方法进行归一化处理后,对每口井井的两条测井曲线进行主成分分析处理,留下贡献率大于85%的主成分。以k2dul井为例,经过主成分分析处理后,k2dul井在目标地层段共有6401个数据点。在基于预设的聚类算法对所述主成分测井数据进行聚类中,可按照n/k的间隔取k个数据点作为聚类中心点的初始值,在本示例性实施场景,可取序号为1、1280、2560、3840、5120和6400的数据点为作为初始聚类中心点。通过计算,最终的分类数为2,根据测井曲线特征,给各个类别赋予岩性:高gr(自然伽马测井曲线)、低sp(自然电位测井曲线)为砂岩,低gr,高sp为泥岩。基于类似的步骤最终可以得如图2所示的三口井的岩性识别结果。在图2中,k2dul、w3和f1为三口井的井号标识。sp为自然电位测井曲线,gr为自然伽马测井曲线。

参考图3所示,本申请实施例的一种基于测井曲线的岩性识别装置可以包括:

测井曲线获取模块31,可以用于获取目标井的多条测井曲线;

测井曲线标准化模块32,可以用于标准化所述测井曲线;

主成分分析模块33,可以用于对标准化后的测井曲线进行主成分分析,以获取主成分测井数据;

测井数据聚类模块34,可以基于预设的聚类算法对所述主成分测井数据进行聚类,获得所述目标井的岩性识别结果。

参考图4所示,本申请实施例的另一种基于测井曲线的岩性识别装置可以包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时执行如下步骤:

获取目标井的多条测井曲线;

标准化所述测井曲线;

对标准化后的测井曲线进行主成分分析,以获取主成分测井数据;

基于预设的聚类算法对所述主成分测井数据进行聚类,获得所述目标井的岩性识别结果。

虽然上文描述的过程流程包括以特定顺序出现的多个操作,但是,应当清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1