一种油井工况诊断数据集的快速制备方法及系统

文档序号:37279827发布日期:2024-03-12 21:17阅读:18来源:国知局
一种油井工况诊断数据集的快速制备方法及系统

本发明涉及石油开采,具体为一种油井工况诊断数据集的快速制备方法及系统。


背景技术:

1、抽油机是石油开采的重要设备之一,由于油井数量多、分布广,抽油杆、抽油泵等设备常常下达到数千米深的油井内,其故障类型难以直观判断,故障难以及时准确发现,导致经济损失严重。随着油田智能化建设的不断深入,大量传感器装配在油井生产系统中,实时采集油井各类生产数据。

2、现有油井生产监测技术存在以下不足:有限的数据精度:传感器和监测设备的精度限制了采集的数据精度。对于一些细微的变化或异常情况,现有的监测系统可能无法准确检测和捕捉。数据采集和传输的延迟:监测数据在采集、传输和处理过程中可能会存在延迟。这意味着监测系统可能无法实时获取和反馈关键数据,从而影响对油井生产状况的及时了解和决策。对多参数的整合不足:油井生产涉及多个参数的监测,包括压力、温度、流量、液位等。现有的监测系统在整合多个参数方面可能存在不足,无法全面评估和综合分析油井的生产状况。成本和复杂性:一些先进的监测技术可能需要昂贵的设备和复杂的安装过程,这增加了监测的成本和实施的难度。对于一些小型生产单位或边远地区的油井,采用这些高级监测技术可能不现实。难以应对复杂的地质和工艺环境:不同油井的地质和工艺环境各不相同,有些环境可能很复杂。现有的监测技术可能面临难以适应复杂环境和变化的挑战,从而导致监测结果的不准确性或不全面性。数据分析和解读的挑战:监测系统通常会生成大量的数据,需要进行有效的数据分析和解读才能提取有用的信息。然而,现有的数据分析工具和方法可能无法充分利用这些数据,或者需要专业技术人员进行解读和分析。

3、示功图是油井生产故障诊断的关键依据,随着机器学习的快速发展,各种方法如支持向量机、bp神经网络、卷积神经网络等都被尝试用于油井故障诊断。但这些方法都依赖于高质量的示功图数据集,而这需要投入大量的人力与时间将示功图根据故障类型一一归类。


技术实现思路

1、鉴于上述存在的问题,提出了本发明。

2、因此,本发明解决的技术问题是:现有的故障诊断方法存在数据集质量低,耗时长,人工成本较高的优化问题。

3、为解决上述技术问题,本发明提供如下技术方案:一种油井工况诊断数据集的快速制备方法,包括:采集油田数据中心的数据;基于对原始数据预处理,绘制成示功图;通过特征转化示功图,输出示功图的数值向量;对特征向量进行聚类分析,输出聚类结果并校验。

4、作为本发明所述的一种油井工况诊断数据集的快速制备方法的一种优选方案,其中:所述采集油田数据中心的数据包括从油田数据中心,采集工况诊断的大数据体系,作为油井工况诊断数据集快速制备方法的原始数据;

5、其中,工况诊断的大数据体系包括位移和载荷。

6、作为本发明所述的一种油井工况诊断数据集的快速制备方法的一种优选方案,其中:所述基于对原始数据预处理,绘制成示功图包括:对原始数据进行预处理操作使数据长度相同,绘制成示功图;

7、对每条数据,检查位移和载荷数据是否符合要求;

8、若位移和载荷数量不一致,则舍弃条数据;

9、若位移和载荷存在空值,则舍弃条数据;

10、当位移和载荷数量一致但不存在空值时,则绘制成示功图;

11、提供交互界面,显示异常数据的详细信息,并允许用户查看数据内容和进行选择操作;

12、其中,预处理后的位移和载荷各包含n个样本点,以位移为横坐标,载荷为纵坐标绘制示功图。

13、作为本发明所述的一种油井工况诊断数据集的快速制备方法的一种优选方案,其中:所述通过特征转化示功图,输出示功图的数值向量包括通过python读取示功图,将示功图转化为矩阵形式,基于reshape方法将特征矩阵采转化为特征向量表示为:

14、g=read_image(filepath)

15、m(g)=matrixtransform(g)

16、φ=randomprojection(m(g))

17、c(g)=m(g)+i×φ

18、

19、ω=svd(ψ)

20、

21、其中,g为示功图,m(g)为示功图g对应的矩阵形式,φ为示功图矩阵的随机投影,c(g)为示功图的复数域表示,ψ为处理高维数据的非线性函数,为奇异值分解后的矩阵,i是复数单位,ρ和τ是非线性函数或矩阵,ψ*是的ψ复共轭。

22、作为本发明所述的一种油井工况诊断数据集的快速制备方法的一种优选方案,其中:所述对特征向量进行聚类分析包括基于agglomerativeclustering算法,对[m,n]内的分类数进行聚类,输出[m,n]内每一个k下对应聚类误差平方和sse,表示为:

23、

24、其中,k是簇的数目,ci是第i个簇,x是ci中的点,ci是第i个簇的质心,k为设定数据集待聚类k,m为设定数据集待聚类下限,n为设定数据集待聚类上限。

25、作为本发明所述的一种油井工况诊断数据集的快速制备方法的一种优选方案,其中:所述输出聚类结果并校验包括将分类数与误差平方和绘制成折线图,观察折线图的拐点;

26、基于agglomerativeclustering算法将样本转化为一个簇,初始状态下簇的数目与样本的数目相同,将簇间距离最小的相似簇合并成新的簇,直到满足算法的终止条件;

27、输出最小sse,在给定k值步长为1的情况下输出sse下降速度最快的坡度;

28、所有簇的sse之和表示为:

29、

30、其中,k是簇的数量;

31、sse下降速度函数表示为:

32、

33、其中,sse(tk-1)和sse(tk)为k-1和k簇时的sse,r为步长;

34、引入惩罚项,输出优化目标表示为:

35、maxk∈[m,n](v(k)-λ·k)

36、其中,λ是一个正则化参数;

37、基于肘部法则,输出sse下降的加速度,表示为:

38、a(k)=v(k+1)-v(k)

39、当a(k)变为正值或接近零时,[m,n]内出现拐点;

40、若[m,n]内的分类数使肘部法示意图具有明显拐点,则对应的分类数为最优分类数,并将k设置为肘部法确认的最佳分类数目,保存聚类结果;

41、若[m,n]内的分类数并不能使肘部法示意图具有明显拐点,则将分类数的上限n调高,继续聚类并绘制折线图观察,直至出现明显拐点。

42、作为本发明所述的一种油井工况诊断数据集的快速制备方法的一种优选方案,其中:所述输出聚类结果并校验包括聚类结束以后,快速检查数据集的划分情况;

43、显示聚类结果,包括不同的示功图类别和图片分布情况;

44、对每个示功图类别的子集进行快速检查,寻找与其他类别不一致的图片;

45、如果子集中出现了与其他示功图类别不一致的图片,就需要将子集从当前类别中剔除,最终确定数据集。

46、本发明的另外一个目的是提供一种油井工况诊断数据集的快速制备系统,其能基于示功图的图像特征转化为向量的数值特征,然后结合机器学习方法对故障诊断的示功图数据进行快速自动划分,有效提高了用于故障诊断的数据集质量且极大降低了时间与人力成本。

47、作为本发明所述的一种油井工况诊断数据集的快速制备的一种优选方案,其中:包括数据采集模块,示功图绘制模块,示功图特征转化模块,特征向量聚类分析检验模块;所述数据采集模块用于在油田数据中心采集工况诊断的大数据体系;所述示功图绘制模块用于基于对采集的工况诊断数据预处理,通过判断位移和载荷数据是否符合要求,绘制示功图;所述示功图特征转化模块用于通过python读取示功图,将示功图转化为矩阵形式,基于reshape方法将特征矩阵采转化为特征向量;所述特征向量聚类分析检验模块用于对特征向量进行聚类分析并对聚类结果进行校验。

48、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序是实现一种油井工况诊断数据集的快速制备方法的步骤。

49、一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现一种油井工况诊断数据集的快速制备方法的步骤。

50、本发明的有益效果:本发明提供的一种油井工况诊断数据集的快速制备方法使用agglomerativeclustering算法对示功图的特征向量进行聚类分析,确保示功图的微小特征不被忽略,提高数据分析的精确性,对位移荷载进行检查,确保数据没有遗漏或错误,提高数据质量,本发明还通过观察sse的折线图,可以更加快速进行评估,同时应用肘部法则,使本发明可以适应不同的数据集和场景,提高发明的适应性和灵活性。本发明在执行成本、数据集质量和完成时间方面都取得更加良好的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1