基于曲波变换和核稀疏的抽油井半监督故障诊断方法与流程

文档序号:11247533阅读:509来源:国知局
基于曲波变换和核稀疏的抽油井半监督故障诊断方法与流程

本发明涉及一种抽油井故障诊断技术,具体地说是一种基于曲波变换和核稀疏的抽油井半监督故障诊断方法。



背景技术:

在实际的石油开采过程中,常用的有杆泵抽油井系统所处的生产环境较为恶劣,故障发生率高,经常无法正常工作。各种故障会导致诸如产油量减少,油井停产甚至设备损坏等严重后果。在传统的石油生产中,一般依靠有经验的技术人员人为的对采集到的井上示功图或者经转化而得到的井下泵功图进行分析,来判断系统当前是否正常工作。这种方法效率低,且受主观影响大,无法满足企业的生产需求。因此,利用计算机自动实现有杆泵抽油井系统的故障诊断是一种非常有意义的技术。

有杆泵抽油井系统的故障诊断可以看成是一个模式识别问题,通常分为两个步骤:特征提取和分类。常用的针对井上示功图或者井下泵功图的特征提取方法主要有网格法,链码法,傅里叶级数法等;分类一般采用经典的支持向量机和bp神经网络。这些经典方法往往并不能很好的结合实际生产情况。

当前的有杆泵抽油井系统的故障诊断方法大都为有监督方法,即所有的训练数据都人为的标记出故障类型。在实际生产中,有标签的数据是非常昂贵的,很难获得大量的标记数据,相对的,存在大量的未被利用的无标记的数据。如何利用好这些无标记数据的信息,是一个亟待解决的问题。



技术实现要素:

针对现有技术中有杆泵抽油井系统故障诊断方法中存在大量的未被利用的无标记的数据、不能很好的结合实际生产情况等不足,本发明要解决的问题是提供一种可有效利用未标记数据信息的基于曲波变换和核稀疏的抽油井半监督故障诊断方法。

为解决上述技术问题,本发明采用的技术方案是:

本发明一种基于曲波变换和核稀疏的抽油井半监督故障诊断方法,包括以下步骤:

1)通过现场示功仪获取n(n=l+u)个示功图数据作为训练样本,其中l个示功图为已知标签数据,u个示功图为无标签数据;

2)根据波动方程,利用有限差分法将n个示功图转化为井下泵功图,再将每个泵功图转化大小为m×m像素的灰度图像;

3)对每个泵功图xi进行曲波变换,得到第i个泵功图的s个尺度的系数矩阵ci:

ci={cij},i=1,…,n,j=1,…,s,其中n为泵功图总数量,s=log2m-3;

4)根据第一个尺度的系数矩阵ci1计算单幅泵功图的特征向量vi;

5)将全部有标签的泵功图的特征向量作为字典d,d={vi},i=1,…,l;对每个未标记泵功图特征向量vj,j=l,…,l+u,求稀疏系数

6)利用稀疏系数,计算每个无标签泵功图的虚拟标签j=l,…,l+u;

7)将训练样本中所有泵功图的特征向量作为字典d',d'={vi},i=1,…,l+u;对每一个待诊断的测试样本,计算其特征向量vtest,并求得其对应的稀疏系数

8)利用稀疏系数计算待诊断样本的虚拟标签ytest,并据此判断故障类型。

步骤4)中,根据第一个尺度的系数矩阵ci1计算单幅泵功图的特征向量vi为:对由曲波变换得到的尺度系数矩阵中的第一个尺度的系数矩阵ci1,采用非重叠的方式按照2×2的大小进行二进剖分,分别计算每个剖分子块的灰度均值,得到一个特征矩阵c′i1,将矩阵c′i1按照如下公式进行归一化:

将归一化后的矩阵c′i1的每一列级联成一个向量,即得到单幅泵功图的特征向量vi。

步骤6)利用稀疏系数计算每个无标签泵功图的虚拟标签j=l,…,l+u为:

利用稀疏系数和全部有标签的泵功图的标签集合yd={yi},i=1,...,l直接计算每个无标签泵功图的虚拟标签j=l,…,l+u。

步骤8)利用稀疏系数计算待诊断样本的标签ytest为:

利用稀疏系数全部有标签泵功图的标签集合yd={yi},i=1,...,l,以及全部无标签泵功图的虚拟标签集合i=l,...,l+u直接计算待诊断样本的虚拟标签

标签ytest中数值最大的元素所对应的序号i,即代表当前发生第i类故障。

本发明具有以下有益效果及优点:

1.本发明通过对井下泵功图进行曲波变换后得到的特征向量能更精确的描述出泵功图的特征,基于核方法的半监督稀疏表达分类器不仅可以有效的利用未标记数据的信息,而且对有标记的样本数量要求不高,可以节省大量用来标记样本的人力成本。

2.本发明通过有限差分法将井上示功图转化为井下泵功图,并对得到的井下泵功图进行曲波变换并提取特征,所得到的特征向量能更精确的描述出泵功图的特征,以便于后续诊断。

3.基于核方法的半监督稀疏表达分类器只需要计算训练样本间的稀疏关系,不需要预先测试超参数,具有很强的泛化能力,可以更好的结合实际生产情况。

附图说明

图1为本发明出基于曲波变换和核稀疏的抽油井半监督故障诊断方法流程图;

图2为本发明方法中有限差分法求解泵功图中补格法示意图;

图3为本发明方法中利用有限差分法求得的泵功图;

图4为本发明方法对泵功图进行曲波变换得到的系数矩阵可视化的结果示意图。

具体实施方式

下面结合说明书附图对本发明作进一步阐述。

如图1所示,本发明一种基于曲波变换和核稀疏的抽油井半监督故障诊断方法包括以下步骤:

1)通过现场示功仪获取n(n=l+u)个示功图数据作为训练样本,其中l个示功图为已知标签数据,u个示功图为无标签数据;

2)根据经典波动方程,利用有限差分法将n个示功图转化为井下泵功图,再将每个泵功图转化大小为256×256像素的灰度图像;

3)对每个泵功图xi进行曲波变换,得到第i个泵功图的s个尺度的系数矩阵ci:

ci={cij},i=1,…,n,j=1,…,s,其中n为泵功图总数量,s=log2256-3=5;

4)据第一个尺度的系数矩阵ci1计算单幅泵功图的特征向量vi;

5)将全部有标签的泵功图的特征向量作为字典d,d={vi},i=1,…,l;对每个未标记泵功图特征向量vj,j=l,…,l+u,求稀疏系数

6)利用稀疏系数,计算每个无标签泵功图的虚拟标签j=l,…,l+u。

7)将训练样本中所有泵功图的特征向量作为字典d',d'={vi},i=1,…,l+u;对每一个待诊断的测试样本,其特征向量vtest,求得其稀疏系数

8)利用稀疏系数计算待诊断样本的标签ytest。

步骤2)中,以某油田为例,三级组合杆柱每根杆长为523.61m,664.32m和618.35m,杆柱的直径为0.025m,0.022m和0.019m。抽油杆密度为8456kg/m3,石油密度为843kg/m3,弹性模量e=2.1×1011pa,粘滞阻尼系数c=0.4654,应力传播速度a=4970m/s。

根据如下波动方程:

利用有限差分法将所有井上示功图转化为井下泵功图,设驴头的下始点为坐标原点,将每根抽油杆分为k段,选取每段的步长为δx,同理,选取δt为时间t的步长,下角标i表示位置,j表示时间,则有:

将以上三式带入波动方程可以得到:

根据井上示功图可知地面光杆位移为u1,u2,…,uk,光杆动载荷为f1,f2,...,fk,根据胡克定律则波动方程的边界条件为:

(1)u1,1=-u1;u1,2=-u2;…;u1,k=-uk

其中a为抽油杆截面积。

由于示功图是一个周期函数,如图2所示,采用补格法可得到边界条件:

(3)ui,k=ui,0

(4)ui+1,1=ui,k+1

步长δx和δt的选取,应满足如下的稳定性条件:

在杆柱末端(泵)处,位移为:

up=-ui+1

杆柱末端(泵)处,载荷为:

根据所求得的泵位移和泵载荷,即可绘制出井下泵功图。所求得的泵功图如图3所示。之后将每个泵功图转化大小为256×256像素的灰度图像。步骤3)中,利用第二代curvelet工具包对每个泵功图xi进行曲波变换,得到5个尺度的系数矩阵ci,ci={cij},i=1,…,n,j=1,2,3,4,5。泵功图及其对应的系数矩阵可视化结果如图4所示。

步骤4)中,将第一个尺度的系数矩阵ci1,采用非重叠的方式按照2×2的大小进行二进剖分,分别计算每个剖分子块的灰度均值,得到一个10×10的矩阵c′i1,将矩阵c′i1按照如下公式进行归一化:

将归一化后的矩阵c′i1的每一列级联成一个100×1的向量,得到单幅泵功图的特征向量vi。

步骤5)中,关于稀疏系数的优化求解,本发明方法选取的核函数为如下形式的高斯函数:

k(x,xc)=exp(-||x-xc||/σ)

其中,xc为核函数中心和σ为核函数的宽度参数,控制了核函数的径向控制范围。取σ=8d,d为特征向量的维度。

将全部有标签的泵功图的特征向量作为字典d,d={vi},i=1,…,l。对每个未标记的泵功图特征向量vj,j=l,…,l+u,其相应的稀疏系数可通过求解如下优化问题得到:

其中,φ(·)代表非线性映射函数,并满足φ(x1)φ(x2)=k(x1,x2),核函数向量kj=[k(vj,v1),...,k(vj,vl)],k为如下形式的核函数矩阵:

步骤6)中,利用稀疏系数和全部有标签的泵功图的标签集合yd={yi},i=1,...,l直接计算每个无标签泵功图的虚拟标签j=l,…,l+u。

其中,yd为全部有标签的泵功图的标签向量集合,yd={yi},i=1,...,l。

步骤7)中,将训练样本中所有泵功图的特征向量作为字典d',d'={vi},i=1,…,l+u。对每一个待诊断的测试样本,计算其特征向量vtest,其相应的稀疏系数可通过求解如下优化问题得到:

其中,核向量ktest=[k(vtest,v1),...,k(vtest,vl)],k为如下形式的核函数矩阵:为

式中,αtest为待诊断样本所对应的稀疏系数,vtest为待诊断样本的特征向量,λ为权衡因子,αij为αj中的第i个元素,vi,为单幅泵功图的特征向量;分别为αtest中的第i1,i2,个元素。

步骤8)中,根据稀疏系数计算待诊断样本的虚拟标签ytest。

其中,yd为全部有标签的泵功图的标签向量集合,yd={yi},i=1,...,l;为全部无标签泵功图的虚拟标签向量集合,i=l,...,l+u。

虚拟标签ytest中数值最大的元素所对应的序号i,即代表当前发生第i类故障。

本发明通过有限差分法将所有训练数据即井上示功图转化为井下泵功图并转为灰度图像,利用曲波变换对泵功图进行特征提取后,将其中所有的有标签的泵功图的特征向量作为字典,对每一个无标签泵功图特征向量求其相对应的稀疏表达系数,根据稀疏表达系数计算虚拟标签以补所有全训练数据的标签,最后将训练样本中所有泵功图的特征向量作为字典,对每一个待诊断的测试样本,求其特征向量所对应的稀疏系数,并计算诊断样本的标签,完成诊断。本发明所采用的曲波变换,能更精确的描述出泵功图的特征;基于核方法的稀疏表达分类器不仅可以有效的利用未标记数据以便提高故障诊断的正确率,而且对有标记的样本数量要求不高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1