井漏识别方法、装置及计算机设备与流程

文档序号:17131892发布日期:2019-03-16 01:22阅读:264来源:国知局
井漏识别方法、装置及计算机设备与流程

本发明涉及钻井技术领域,特别涉及一种井漏识别方法、装置及计算机设备。



背景技术:

在地下钻井工程中,井下可能会发生多种复杂情况,这些复杂情况轻者延误钻进,重者引发严重安全事故。在常见的井下复杂情况中,井漏是发生率最高且造成经济损失最大的复杂情况,因此,有必要寻求方法根据钻井数据对井漏情况进行识别。

目前常用的方法是:根据钻进过程中泥浆池总体积和出入流量差的变化来对井漏情况进行识别,当泥浆池总体积变小或者出入流量差变大时,确定井漏情况已经发生。

因泥浆池面积过大或者出入流量差统计不准,该方法只有当井漏发生到一定程度时才能识别,故该方法识别的准确度和时效性较低;并且该方法对现场工程师的操作水平要求较高。



技术实现要素:

本发明实施例提供了一种井漏识别方法、装置及计算机设备,能够解决目前常用的井漏识别方法识别的准确度和时效性较低,并且该方法现场工程师的操作水平要求较高的问题。所述技术方案如下:

第一方面,提供了一种井漏识别方法,该方法包括:

获取按照时序排列的初始数据,该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况;

对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据;

对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征;

对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征;

获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小;

按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据;

基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,该多个初始第一分类模型为采用不同分类算法的模型;

基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,该第二分类模型包括该多个第一分类模型;

获取实时钻井数据;

将该实时钻井数据输入该第二分类模型,获取第二分类结果;

对该第二分类结果进行处理,得到井漏识别结果。

在一种可能实现方式中,对该初始数据进行数据清洗包括:

对该初始数据进行异常值处理;

对该异常值处理后的数据进行移动平均;

对该移动平均处理后的数据进行标准化处理,得到该样本数据。

在一种可能实现方式中,该样本数据的统计特征包括:该样本数据的方差、极差、中位数、偏度、峰度和变异系数。

在一种可能实现方式中,对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征包括:

对该正样本数据,基于第一步长的第一滑动窗口,获取该正样本数据的统计特征;

对该负样本数据,基于第二步长的第一滑动窗口,获取该负样本数据的统计特征;

其中,该第一步长小于该第二步长。

在一种可能实现方式中,对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征包括:

对该正样本数据,基于第一步长的该第一滑动窗口,对该正样本数据进行离散小波变换,得到该正样本数据的小波特征;

对该负样本数据,基于第二步长的该第一滑动窗口,对该负样本数据进行离散小波变换,得到该负样本数据的小波特征;

其中,该第一步长小于该第二步长。

在一种可能实现方式中,该多个初始第一分类模型包括:决策树分类模型、随机森林模型和支持向量机模型。

在一种可能实现方式中,该初始第二分类模型为逻辑回归模型。

在一种可能实现方式中,该初始数据包括:总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。

第二方面,提供了一种井漏识别装置,该装置包括:

数据获取模块,用于获取按照时序排列的初始数据,该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况;

数据清洗模块,用于对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据;

统计特征获取模块,用于对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征;

小波特征获取模块,用于对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征;

贡献值获取模块,用于获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小;

特征数据提取模块,用于按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据;

第一分类模型训练模块,用于基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,该多个初始第一分类模型为采用不同分类算法的模型;

第二分类模型训练模块,用于基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,该第二分类模型包括该多个第一分类模型;

数据获取模块,还用于获取实时钻井数据;

分类结果获取模块,用于将该实时钻井数据输入该第二分类模型,获取第二分类结果;

井漏识别结果获取模块,用于对该第二分类结果进行处理,得到井漏识别结果。

第三方面,提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令,该指令由该处理器加载并执行以实现如第一方面井漏识别方法中任一可能实现方式所执行的操作。

本发明实施例提供的技术方案带来的有益效果是:

通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种井漏识别方法流程图;

图2是本发明实施例提供的一种井漏识别方法流程图;

图3是本发明实施例提供的一种井漏识别装置的结构示意图;

图4是本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的一种井漏识别方法流程图,该井漏识别方法可以应用于计算机设备。参见图1,该实施例包括:

101、获取按照时序排列的初始数据。

该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况。

102、对该初始数据进行数据清洗,得到样本数据。

该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据。

103、对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征。

104、对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征。

105、获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值。

该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小。

106、按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据。

107、基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型。

该多个初始第一分类模型为采用不同分类算法的模型。

108、基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型。

该第二分类模型包括该多个第一分类模型。

109、获取实时钻井数据。

110、将该实时钻井数据输入该第二分类模型,获取第二分类结果。

111、对该第二分类结果进行处理,得到井漏识别结果。

本发明实施例提供的方法,通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。

在一种可能实现方式中,对该初始数据进行数据清洗包括:对该初始数据进行异常值处理;对该异常值处理后的数据进行移动平均;对该移动平均处理后的数据进行标准化处理,得到该样本数据。

在一种可能实现方式中,该样本数据的统计特征包括:该样本数据的方差、极差、中位数、偏度、峰度和变异系数。

在一种可能实现方式中,对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征包括:对该正样本数据,基于第一步长的第一滑动窗口,获取该正样本数据的统计特征;对该负样本数据,基于第二步长的第一滑动窗口,获取该负样本数据的统计特征;其中,该第一步长小于该第二步长。

在一种可能实现方式中,对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征包括:对该正样本数据,基于第一步长的该第一滑动窗口,对该正样本数据进行离散小波变换,得到该正样本数据的小波特征;对该负样本数据,基于第二步长的该第一滑动窗口,对该负样本数据进行离散小波变换,得到该负样本数据的小波特征;其中,该第一步长小于该第二步长。

在一种可能实现方式中,该多个初始第一分类模型包括:决策树分类模型、随机森林模型和支持向量机模型。

在一种可能实现方式中,该初始第二分类模型为逻辑回归模型。

在一种可能实现方式中,该初始数据包括:总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。

上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。

图2是本发明实施例提供的一种井漏识别方法流程图,该井漏识别方法可以应用于计算机设备。参见图2,该实施例包括:

201、获取按照时序排列的初始数据。

该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况,例如,可以在一段时间内选取多个取样时间点,获取该多个取样时间点对应的初始数据,并将该初始数据按照该取样时间点的时序排列。任一个取样时间点对应一组历史钻井数据,该一组历史钻井数据也对应该取样时间点的井漏情况,该初始数据将在经过清洗处理后用于训练初始第一分类模型。

在一种可能实现方式中,该初始数据包括:总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。

其中,总池体积是指用于储存钻井过程中循环使用的工作液的泥浆池的总体积;总池入口流量是指泥浆池入口处的流量;总池出口流量是指泥浆池出口处的流量;立管压力是指井口钻具在钻进过程中所承受的压力;大钩负荷是指钻井过程中钻具悬重与钻井液浮力之差;大钩高度是指钻井过程中大钩与地面之间的距离;钻速是指钻进速度;相对流量是指总池出口流量与总池入口流量之差;钻井液压力是指井下钻井液对油层的压力。上述初始数据能够从不同侧面反映井漏情况。

202、对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据。

对初始数据进行数据清洗,能够使输入初始第一分类模型的数据更符合模型的输入要求,进而提高第二分类模型输出的分类结果的准确度,以便提高该井漏识别方法的准确度。

其中,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据,按照对应的井漏情况将该样本数据分为正样本数据和负样本数据,通过对数据格式进行调整,为后续初始第一分类模型的训练过程提供更符合输入要求的数据。

在一种可能实现方式中,对该初始数据进行数据清洗包括下述过程:

(一)、对该初始数据进行异常值处理。

该异常值是指初始数据中的负值、缺失值或与该初始数据的平均值有较大差距的值,通常对异常值的处理方式是将其替换为0或初始数据的平均值,以防止异常值对分类模型训练过程造成影响并降低第二分类模型的准确度。对于与该初始数据的平均值有较大差距的异常值的识别,可以采用拉依达准则法、肖维勒准则法等异常值识别方法,本实施例对此不做限定。

(二)、对该异常值处理后的数据进行移动平均。

对于经过异常值处理后的数据,为了去除数据序列中不光滑的毛刺,使得数据在时序上的变化更加平稳,需要对该数据进行移动平均。对数据进行移动平均的方法可以是:基于第二滑动窗口,计算第二滑动窗口内的数据的平均值,用该平均值替换第二滑动窗口内中间位置的一个或两个数据,以此类推。上述每个第二滑动窗口内包括时间上连续的一定数量的数据。

(三)、对该移动平均处理后的数据进行标准化处理,得到该样本数据。

该步骤用于消除数据之间由于物理量纲不同造成的数值上的差异,使输入初始第一分类模型的数据更符合模型的输入要求。例如,可以采用标准差标准化方法对数据进行处理,使处理后的数据符合标准正态分布,即均值为0,标准差为1。

203、对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征。

该第一滑动窗口用于从按照时序排列的样本数据中提取一定数量的数据,以供后续使用。样本数据的统计特征能够从整体上反映样本数据的特征,用于后续初始第一分类模型的训练过程。

在一种可能实现方式中,该样本数据的统计特征包括:该样本数据的方差、极差、中位数、偏度、峰度和变异系数。

其中,方差是指一组数据中各个数据与其平均数之差的平方值的平均数,能够用来度量数据与其平均数之间的偏离程度;极差是数据变动的最大范围;中位数是把一组数据按照高低排序后,中间位置的一个数据;偏度能够反映统计数据分布偏斜的方向和程度;峰度是表征概率密度分布曲线在平均值处峰值高低的特征数;变异系数是数据标准差与数据平均数之比。

在一种可能实现方式中,对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征包括:对该正样本数据,基于第一步长的第一滑动窗口,获取该正样本数据的统计特征;对该负样本数据,基于第二步长的第一滑动窗口,获取该负样本数据的统计特征;其中,该第一步长小于该第二步长。

由于井漏期间的历史钻井数据的数量相对于非井漏期间的少,造成正样本数量也较少,为了平衡正负样本,对于正样本数据,采用基于第一步长,即较小步长的第一滑动窗口,来获取正样本数据的统计特征;对于负样本数据,采用基于第二步长,即较大步长的第一滑动窗口,来获取负样本数据的统计特征。通过平衡正负样本,可以提高第一分类模型和第二分类模型的准确度。

204、对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征。

与短时傅里叶变换等传统谱分析方法相比,小波变换尤其适合分析有突变和尖峰等不连续特性的信号。井漏事故由于发生迅速,其数据也具有突变性。离散小波变换是指将时序内的样本数据作为数字信号,将数字信号在时间域和频率域内分解为多个分辨率的分量,从而同时表达信号的趋势性特征和局部特征,时间序列经小波变换后,得到一系列小波特征,这些小波特征能够表示该信号在时间-频率域的能量分布。

在一种可能实现方式中,对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征包括:对该正样本数据,基于第一步长的该第一滑动窗口,对该正样本数据进行离散小波变换,得到该正样本数据的小波特征;对该负样本数据,基于第二步长的该第一滑动窗口,对该负样本数据进行离散小波变换,得到该负样本数据的小波特征;其中,该第一步长小于该第二步长。

由于井漏期间的历史钻井数据的数量相对于非井漏期间的比较少,造成正样本数量也较少,为了平衡正负样本,对于正样本数据,采用基于第一步长,即较小步长的第一滑动窗口,来获取正样本数据的小波特征;对于负样本数据,采用基于第二步长,即较大步长的第一滑动窗口,来获取负样本数据的小波特征。通过平衡正负样本,可以提高第一分类模型和第二分类模型的准确度。

205、获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值。

其中,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小,获取该贡献值有利于选取样本数据的统计特征和小波特征中对该分类结果影响较大的特征。例如,任一特征x对该分类结果的贡献值可以通过下述公式获取:

其中,f(x)表示特征x对分类结果的的贡献值;n-表示负样本数;μ-表示负样本均值;μ表示正样本和负样本的均值;n+表示正样本数;μ+表示正样本均值;xi表示特征x的第i个负样本数据;xj表示特征x的第j个正样本数据。

206、按照该贡献值从大到小,获取预设数量的特征。

选取样本数据的统计特征和小波特征中对该分类结果影响较大的预设数量的特征,能够剔除特征中对该分类结果影响较小或者没有影响的特征,以便减少输入初始第一分类模型中的数据量,进而减少初始第一分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高第二分类模型的分类速度。

例如,可以按照特征的贡献值大小,获取90个特征,以供后续使用。

207、从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据。

该预设数量的特征对应的正样本数据和负样本数据用于输入初始第一分类模型。

208、基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型。

该预设数量的特征对应的正样本数据和负样本数据即为初始第一分类模型的输入样本。

例如,该多个初始第一分类模型的训练过程可以包括下述步骤:

(一)、将该输入样本划分为第一样本和第二样本,例如,可以将输入样本的80%划分为第一样本,将输入样本的20%划分为第二样本,第一样本用于训练初始第一分类模型,第二样本用于训练初始第二分类模型。

(二)、确定初始第一分类模型,该初始第一分类模型包括一些参数。

(三)、将第一样本中的部分数据输入初始第一分类模型,得到初始第一分类结果。

(四)、对于每一个初始第一分类结果,基于第一样本作为正样本数据或者负样本数据所带的井漏与否的标签,得到该初始第一分类结果的准确度。

(五)、基于该初始第一分类结果的准确度,判断该准确度是否符合第一分类模型的预设准确度要求,如果符合,输出中间第一分类模型;如果不符合,对该初始第一分类模型中的参数进行调整,直至该准确度符合第一分类模型的预设准确度要求,输出中间第一分类模型。

(六)、将第一样本中的其他数据输入该中间第一分类模型,得到该中间第一分类结果的准确度,重复步骤(五),直至得到符合预设准确度要求的第一分类模型。

该多个初始第一分类模型为采用不同分类算法的模型。在一种可能实现方式中,该多个初始第一分类模型包括:决策树分类模型、随机森林模型和支持向量机模型。

其中,决策树分类模型简单直观,可以处理多维度输出的分类问题;随机森林模型对于多维特征的数据集分类有很高的效率,准确率较高,实现起来也比较简单;支持向量机模型避开了从归纳到演绎的传统过程,效率较高。

209、基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型。

其中,该初始第二分类模型可以是该多个第一分类模型的结合,该多个第一分类结果分别在该初始第二分类模型输出的结果中占有一定的权重,该第二分类模型输出的第二分类结果为该多个第一分类结果加权平均后的结果。

将步骤208中所述的第二样本输入该初始第二分类模型,获取该初始第二分类模型的准确度,调整该多个第一分类结果在该初始第二分类模型输出的结果中所占的权重,直到符合该第二分类模型的预设准确度要求,输出该第二分类模型。

在一种可能实现方式中,该初始第二分类模型为逻辑回归模型。

采用逻辑回归模型作为初始第二分类模型得到第二分类模型,该第二分类模型输出的第二分类结果为该多个第一分类结果加权平均后的结果,且各第一分类结果所占的权重根据输入数据的不同有所不同,该第二分类结果包括每一个第一分类结果对应的权重以及该权重对应的阈值。采用逻辑回归模型得到的分类结果准确度更高,且易于理解和实现。

210、获取实时钻井数据。

获取实时钻井过程中的总池体积、总池入口流量、总池出口流量、立管压力、大钩负荷、大钩高度、钻速、相对流量以及钻井液压力。对上述数据进行清洗,并获取该数据的统计特征和小波特征,根据步骤206中获取的预设数量的特征,提取该数据中的该预设数量的特征对应的实时钻井数据,以供下述步骤使用。

211、将该实时钻井数据输入该第二分类模型,获取第二分类结果。

该第二分类结果能够反映每一个时间点对应的基于第二分类模型的分类结果。

212、对该第二分类结果进行处理,得到井漏识别结果。

对该第二分类结果进行处理,得到实时井漏识别结果,以便在井漏情况发生时,可以根据该井漏识别结果及时采取措施。

上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。

本发明实施例提供的方法,通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。进一步地,采用小步长的第一滑动窗口来获取正样本数据的统计特征和小波特征,采用大步长的第一滑动窗口来获取负样本数据的统计特征和小波特征,可以平衡正负样本,提高第一分类模型和第二分类模型的准确度。

图3是本发明实施例提供的一种井漏识别装置的结构示意图,参见图3,该装置包括:

数据获取模块301,用于获取按照时序排列的初始数据,该初始数据包括历史钻井数据和该历史钻井数据对应的井漏情况。

数据清洗模块302,用于对该初始数据进行数据清洗,得到样本数据,该样本数据包括正样本数据和负样本数据,该正样本数据为井漏期间的历史钻井数据,该负样本数据为非井漏期间的历史钻井数据。

统计特征获取模块303,用于对该样本数据,基于第一滑动窗口,获取该样本数据的统计特征。

小波特征获取模块304,用于对该样本数据,基于该第一滑动窗口,对该样本数据进行离散小波变换,得到该样本数据的小波特征。

贡献值获取模块305,用于获取该样本数据的统计特征和该样本数据的小波特征对分类结果的贡献值,该分类结果为对该样本数据进行分类得到的用于井漏识别的结果,该贡献值表示特征对该分类结果的影响大小。

特征数据提取模块306,用于按照该贡献值从大到小,获取预设数量的特征,从该正样本数据和负样本数据中提取该预设数量的特征对应的正样本数据和负样本数据。

第一分类模型训练模块307,用于基于该预设数量的特征对应的正样本数据和负样本数据,对多个初始第一分类模型进行训练,得到多个第一分类模型,该多个初始第一分类模型为采用不同分类算法的模型。

第二分类模型训练模块308,用于基于该预设数量的特征对应的正样本数据和负样本数据以及该多个第一分类模型,对初始第二分类模型进行训练,得到第二分类模型,该第二分类模型包括该多个第一分类模型。

数据获取模块301,还用于获取实时钻井数据。

分类结果获取模块309,用于将该实时钻井数据输入该第二分类模型,获取第二分类结果。

井漏识别结果获取模块310,用于对该第二分类结果进行处理,得到井漏识别结果。

本发明实施例提供的装置,通过将历史钻井数据和该历史钻井数据对应的井漏情况作为初始数据,并对该初始数据进行清洗,得到更符合分类模型输入要求的样本数据,可以提高分类模型输出的分类结果的准确度;在该样本数据中,按照贡献值从大到小,获取预设数量的特征,以便减少输入分类模型中的数据量,进而减少分类模型训练时的运算量,提高模型训练速度和准确度,并且在对实时钻井数据进行分类时,提高分类速度;然后,提取预设数量的特征对应的样本数据,进而根据该预设数量的特征对应的样本数据,以及该样本数据对应的井漏情况,获取多个第一分类模型,进而获取符合预设准确度要求的第二分类模型。在需要实时识别钻井时的井漏情况时,获取实时钻井数据,并将该实时钻井数据输入第二分类模型中,进而得到井漏识别结果。上述井漏识别方法无需要求现场工程师具备较高操作水平,即可得到准确度和时效性较高的井漏识别结果。

需要说明的是:上述实施例提供的井漏识别装置在进行井漏识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的井漏识别装置与井漏识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图4是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器(centralprocessingunits,cpu)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条指令,所述至少一条指令由所述处理器401加载并执行以实现上述各个方法实施例提供的方法。当然,该计算机设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该计算机设备还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由计算机设备中的处理器执行以完成上述实施例中的井漏识别方法。例如,所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1