一种抽油机井示功图多尺度归一化方法及系统

文档序号:25991722发布日期:2021-07-23 21:03阅读:192来源:国知局
一种抽油机井示功图多尺度归一化方法及系统

本发明涉及抽油机井示功图计算技术领域,特别涉及一种抽油机井示功图多尺度归一化方法及系统。



背景技术:

游梁式抽油机仍是油井主要的人工举升方式,由于其杆、管、泵在地下深处较为恶劣的环境中工作,加之生产过程中油藏环境的动态变化,导致机采工况复杂多变,抽油机井故障频发。及时准确地判断井下工作状况,确定非正常工况油井的产量变化原因有助于生产人员做出油井管理决策,避免油井工况进一步恶化,提高生产效率。

示功图是由载荷随位移的变化关系曲线所构成的封闭曲线图,表示悬点载荷与位移关系的示功图称为地面示功图或光杆示功图,在实际生产中是以实测地面示功图作为分析深井泵工作状况的主要依据。随着人工智能技术的不断发展和石油工业对自动化、智能化的重视,应用示功图,基于机器学习、深度学习的抽油机井故障自动诊断、结蜡预测等技术得到应用和发展。现有技术中,例如朱春梅、李春生等人通过对示功图进行特征提取,基于支持向量机(supportvectormachines,svm)构建多分类模型实现了示功图的自动识别。

abdalla等使用傅里叶描述模型提取示功图特征,以神经网络作为分类模型,使用了遗传算法搜索并优化了网络参数;

刘宝军、唐之刚等将浅层卷积神经网络应用于示功图识别,该方法避免了手动提取示功图特征,同时也略微提高了示功图的识别准确率及工况种类数。

段友祥等提出了一种改进的alexnet(一种卷积神经网络模型)模型应用在油井示功图分类中。

仲志丹等利用cnn的卷积层提取示功图特征,使用svm对示功图进行分类,该方法结合了卷积网络和svm的优势。上述的这些方法大多数都是对典型示功图进行识别来区分常见的井下工况,所谓的典型示功图代表的工况一般定义为固定阀漏失,游动阀漏失,气影响,供液不足,气锁等;然而,油田现场实际上存在多种工况,具有复杂性和多样性,实测的示功图类型可达20余种,存在大量典型示功图之外的复杂示功图,这些复杂示功图的自动识别具有难度,代表了井下复杂的单一工况或复合工况,例如单一工况有上碰泵、下碰泵、连抽带喷以及固定阀严重漏失等,复合工况有油井出砂+供液不足以及振动+供液不足等。

在现场的实际生产过程中,复杂工况发生于少量油井,但其严重影响了油井正常生产,将某些少量存在的复杂工况井误判为正常生产井不会显著影响诊断模型整体的准确率,只降低对应工况的召回率。因此,衡量工况诊断模型性能除了整体的准确率以外,复杂工况的召回率也是一个重要指标。召回率反映了对已发生的复杂工况查全的能力,其值越大,则越能准确判断出所有发生复杂工况的油井,及时采取维护措施,对于保障生产具有重要意义。

针对现有技术中,基于示功图识别的常用抽油机井工况诊断模型,在现场多种工况诊断应用中的准确率及复杂工况召回率均较低,诊断结果不确定性突出的问题,为提高抽油机井多工况诊断的精确度和召回率,针对传统的示功图归一化方法造成的数据属性不可分的问题,特提出本发明。



技术实现要素:

针对传统的示功图归一化方法造成的数据属性不可分的问题,本发明的目的在于提供一种抽油机井示功图多尺度归一化方法,以提高现场工况诊断的准确率,以及杆断脱、泵阀严重漏失、上碰泵等严重工况的召回率,满足抽油机井工况智能诊断的现场实际需求。

为了实现上述目的,本发明采用以下技术方案予以实现:

一种抽油机井示功图多尺度归一化方法,所述的方法包括:

使用当前示功图实际载荷最值进行归一化;

以及,对于当前的示功图数据集,使用聚类算法获得k个归一化尺度,算法流程如下:输入:样本数据集d,聚类簇数k;

(1)从样本中随机选取k个样本点作为初始的均值向量(u1,u2,......,ui,uk);

(2)循环以下几步直到达到停止条件,此时每个簇的均值向量不再变化;

(2.1)令

(2.2)计算所有样本点到k个均值向量之间的距离,取其中距离最短的对应均值向量的标记作为该点的簇标记,然后将该点加入相应的簇ci;

(2.3)计算每一个簇的均值向量x∈ci,更新簇的均值向量;

所述的停止条件为:|ui-ui-1|<σ,其中σ的取值为0.05-0.1;

输出:每个簇的均值向量,即归一化尺度(ymax,ymin)。

其中,样本数据集d是每个示功图数据载荷的最值(ymax,ymin)向量的集合,k是自定义的超参数。

优选地,选择成本函数肘部的值作为k的值,其中,所述的成本函数是各个类畸变程度之和,每个类的畸变程度等于该类质心与其内部成员距离的平方和,成本函数的计算公式为:

其中,ui是第k个簇中的成员向量,uk是该簇的质心。

本发明还提供了一种抽油机井示功图多尺度归一化系统,用以实现上述的方法,所述的系统包括:

示功图预处理模块,对抽油机井示功图进行预处理,提取示功图信息;

归一化处理模块,根据提取到的示功图信息对其进行归一化处理。

与现有技术相比,本发明具有以下技术效果:

本发明提供的抽油机井示功图多尺度归一化方法,通过引入多个具有显著形状差异的归一化示功图,极大的丰富了数据特征,不同工况能通过观察其归一化示功图组合有效的进行区分。因此,组合多尺度归一化方法得到的多个示功图作为一个输入数据样本,可以极大的提高原始数据的可分性,从而提高工况诊断的整体准确率和复杂工况的召回率,提高所构建的模型的鲁棒性,后续实验和现场应用也证明了此方法的有效性。

本发明的其他特征和优点将在随后的具体实施方式中予以详细说明。

附图说明

图1示出为两口发生上碰泵工况油井的示功图数据归一化前后的图形;

图2示出为杆断脱、连抽带喷和泵阀严重漏失示功图归一化示意图;

图3示出为抽油机井理论载荷归一化结果示意图;

图4示出为基于本发明提供的数据集的不同k值的成本函数值;

图5示出为基于本发明提供的数据集的部分k值聚类的簇分布示意图;

图6示出为基于本发明提供的数据集的k=10时,杆断脱、固定阀严重漏失以及连抽带喷三种实测示功图呈扁平化的工况的所有归一化示功图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施例,进一步阐明本发明。

油田生产现场采集的示功图数据是一个冲程内悬点载荷y(kn)和位移x(m)的序列,有120或240个数据点,根据其绘制的示功图判断井下工况。不同油井的泵深、冲程存在差异,绘制的示功图在图像坐标中的位置、尺寸大小具有差异性,建立智能诊断算法模型时都会对示功图数据进行预处理,将示功图数据归一化到[0,1],获得固定大小的归一化示功图,以消除位移和载荷不同对示功图形状特征的影响,使得同一工况的示功图具有相同的形状特征,便于算法模型学习到其中的类别特征。特征提取和svm,以及cnn都是优秀的分类模型,在众多图像分类场景中取得了良好的效果,却在本发明数据集的示功图分类任务上表现较差,尤其针对某些复杂工况井的示功图,主要是不恰当的数据预处理方法造成的。

传统归一化方法是基于当前抽油机井示功图的实际位移、载荷最值,具体的,如式(1)、(2)所示:

对于示功图数据序列中的每个点,为归一化后的位移、载荷值。x、y为当前示功图数据的实际位移、载荷值。xmin、xmax和ymax、ymin为位移(m)、载荷(kn)的最值,即归一化尺度。如图1中示出了两口发生上碰泵工况油井的示功图数据归一化前后的图形,其中a为原始数据的示功图,b为归一化后的示功图。对比a和b可以发现,相同工况(上碰泵)井的归一化示功图在形状特征上表现出一致性,利于算法模型更好的学习到同类示功图的共同特征,消除数据中的噪声。

当抽油机井发生杆断脱、固定阀严重漏失以及连抽带喷等工况时主要是悬点载荷发生变化,其示功图都呈扁平化,具体如图2中a所示,但相对于正常示功图的位置不同。观察这几种工况的归一化示功图,具体如图2中b所示,直观上都与正常示功图呈现出相同的图形特征,不同工况的归一化示功图混淆,不具有良好的可分性,即此归一化方式造成了数据本身的不可分性,因此,不论采用何种模型,杆断脱、连抽带喷以及泵阀严重漏失等示功图呈扁平化的工况的召回率均极低。

另外,对于每一口抽油机井都存在正常工况的理论最大载荷值、最小载荷值、最大位移值,即抽油机井处于正常工况时的理想示功图,当采用理论的上、下载荷作为归一化尺度(ymax、ymin)时得到的归一化示功图如图3所示。此方式保留了当前示功图相对于正常示功图位置、形状大小的信息,连抽带喷、固定阀严重漏失两种工况的归一化示功图明显具有可分性。但杆断脱工况的示功图由于其载荷低于理论载荷,归一化后在[0,1]区间内不再有几何图形,造成了图像信息丢失,而传感器故障、停井作业等问题也会造成图像信息丢失,所以单独使用实际载荷或理论载荷的最值作为归一化尺度,仍无法获得所有工况的具有良好可分性的归一化示功图。

针对传统归一化方法所存在的缺陷,本发明提出了一种抽油机井示功图多尺度归一化方法,所述的方法包括:

使用当前示功图实际载荷最值进行归一化;

以及,对于当前的示功图数据集,使用聚类算法获得k个归一化尺度,算法流程如下:输入:样本数据集d,聚类簇数k;

(1)从样本中随机选取k个样本点作为初始的均值向量(u1,u2,......,ui,uk);

(2)循环以下几步直到达到停止条件,此时每个簇的均值向量不再变化;

(2.1)令

(2.2)计算所有样本点到k个均值向量之间的距离,取其中距离最短的对应均值向量的标记作为该点的簇标记,然后将该点加入相应的簇ci;

(2.3)计算每一个簇的均值向量x∈ci,更新簇的均值向量;

所述的停止条件为:|ui-ui-1|<σ,其中σ的取值为0.05-0.1;

输出:每个簇的均值向量,即归一化尺度(ymax,ymin)。

其中,样本数据集d是每个示功图数据载荷的最值(ymax,ymin)向量的集合,k是自定义的超参数。

进而,得到k+1个归一化尺度。

本申请的发明人发现,同时使用实际的载荷最值和理想载荷最值得到两个归一化示功图作为判断标准,通过两个归一化示功图特征信息之间的互补性,像杆断脱、连抽带喷、固定阀严重漏失扁平化的示功图都能得到有效区分(以杆断脱为例,实际载荷最值归一化获得正常示功图,而理论载荷最值归一化获得空白图即可判断发生了杆断脱),将得到的两个归一化示功图组合作为一个数据,数据具有类别可分性,采用机器学习或深度学习的算法构建的示功图分类模型都能获得有效的分类信息进而识别出不同工况的示功图。但是,理论载荷在实际生产中往往难以获取,具体的,理论载荷可以通过两种方式获取,一种是通过理论模型计算悬点载荷,由于井下情况的复杂性及故障工况,计算的理论载荷通常与油井实际理论载荷相差较大,不具有稳定性;另一种是使用示功仪实测油井在正常工况下的载荷作为理论载荷,但是油井可能一开始处于非正常工况,为此,本发明除了使用当前示功图实际载荷最值进行归一化外,还使用了k个不同的归一化尺度对当前示功图数据进行归一化处理,形成多尺度的归一化处理方法。

根据本发明提供的方法,选择成本函数肘部的值作为k的值,其中,所述的成本函数是各个类畸变程度之和,每个类的畸变程度等于该类质心与其内部成员距离的平方和,成本函数的计算公式为:

其中,ui是第k个簇中的成员向量,uk是该簇的质心。

k值越大,获得的簇越多,即归一化尺度(ymax,ymin)越多,但获得过多的归一化示功图会增加模型训练、预测的计算量,对于数据的可分性的增强却有限,为了确定合理的k值,需要同时考虑聚类的簇分布情况和成本函数的变化趋势。本发明提供的方法中,根据肘部法则,选择成本函数肘部的值(成本函数初始下降很快,在肘部开始下降趋于平缓)作为合理的k值。

为了进一步对本发明提供的多尺度归一化方法进行说明,以下结合具体实例予以说明。以长庆油田某作业区1226口井实测的13875张带标签示功图样本作为本发明的数据集进行实验,复现了几种主流模型(傅里叶描述子/不变矩+svm,alexnet、cnn、cnn-svm),测试了其性能(70%数据训练,30%数据训练),部分实验结果如表1所示。

表1各主流模型性能测试结果

分析表1数据可以发现,在现场多种工况的诊断应用中,基于特征提取结合svm模型的准确率和召回率均较低,基于深度学习cnn及其组合模型各项指标略有所提高,两种类型的模型对杆断脱、连抽带喷以及固定阀严重漏失等复杂工况的召回率均较低,不能满足现场实际需求。

基于本发明提供的多尺度归一化方法,针对上述的数据集,选择k∈[2,30]进行聚类,图4为不同k值聚类的成本函数;图5给出了部分k值聚类的簇分布,每个颜色代表一个簇,簇中黑色点代表每个簇的均值向量(质心),即第k个归一化尺度uk=(ymax,ymin)。

从图5中观察到肘部值为k=5,观察图4发现k=5~10得到的簇逐渐趋于紧凑,k=10时得到簇分布质量已较好,各簇成员紧凑而簇之间的差异也比较明显,针对本发明提供的数据集,选择k∈[5,10]较为合理,即能够获得多个有效的归一化尺度,又不会过度增加计算成本。

此外,在后续实验中验证了该k值选择范围是合理的,同时探索了选择k=15,20,30等较大值进行归一化时诊断模型的性能表现。

图6(因附图较大,分为(a)、(b)两部分示出)给出了k=10时,杆断脱、固定阀严重漏失以及连抽带喷三种实测示功图呈扁平化的工况的所有归一化示功图,每种工况获得一组归一化示功图,每组11个。如图6所示的,k0代表实际载荷最值归一化得到的归一化示功图,k1~k10代表使用聚类得到的u1~u10归一化得到的其他10个归一化示功图。由图6可以观察到,使用多尺度的示功图归一化方法,引入多个具有显著形状差异的归一化示功图极大的丰富了数据特征,不同工况能通过观察其归一化示功图组合有效的进行区分。因此,组合多尺度归一化方法得到的多个示功图作为一个输入数据样本,可以极大的提高原始数据的可分性,从而提高工况诊断的整体准确率和复杂工况的召回率,提高所构建的模型的鲁棒性,后续实验和现场应用也证明了此方法的有效性。

以上显示和描述了本发明的基本原理、主要特征和本发明的特点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1