基于粗糙集与BP神经网络的泵的故障诊断方法与流程

文档序号:12126351阅读:639来源:国知局
基于粗糙集与BP神经网络的泵的故障诊断方法与流程

本发明涉及石油化工以及无线传感器领域,具体地说是一种基于粗糙集与BP神经网络的泵的故障诊断方法。



背景技术:

石油作为一种不可再生资源,对于国家的政治、经济、军事有着不可替代的战略意义。随着我国经济持续、稳定、快速的发展,石油消费也持续增长,原油需求持续上升,石油供需缺口有增大的趋势,并逐渐成为制约我国经济发展的重要因素之一。截止2009年底,中国石油探明剩余可采储量为27.9亿吨,剩余可采储量储采比为14.8,然而在这些剩余可采储量中,石油资源储备质量较差,低渗、特低渗或超低渗油、稠油和埋深大于3500m的石油资源超过50%,不仅开发勘探难度在逐渐加大,开发成本增加而且老油区综合含水高,普遍进入产量递减阶段。面对这样的严峻形势,各油田企业都意识到了提高原油生产效率的重要性,并在降低投资、节约成本、提高油田数字化管理水平等方面做了大量的努力。其中,将WIA技术应用于油田生产数字化管理是一个重要体现。

泵的工作状态能反应泵在地下深处的工作状态,泵功图的诊断对分析泵的工作状态至关重要,当井下设备出现故障时,泵功图会显示出某一特殊的形状。因此,泵功图的集合特征是进行故障识别的主要依据,通过计算、分析,就能确定井下设备的故障。

神经网络在故障诊断中的应用越来越广泛,已经成为智能故障诊断领域的研究热点,但是基于人工神经网络的诊断方法也存在的局限性,如:需要较多不同类别的训练例子用于神经网络学习才可能使得网络手链,从而得出相对稳定的结果;对于复杂的被诊断系统,网络各层节点数多会使训练所需的计算量和时间较多,无法对诊断结果做出解释;人工神经网络结构、参数设置、训练样本的大小、样本质量等多因素对人工神经网络的精度和泛化能力有直接影响。

粗糙集理论是一种用于处理不完成不精确知识的数学方法,该理论不需要关于数据的任何初始或附加信息,直接对不完整不精确数据进行分析处理,在故障诊断系统中,粗糙集理论通过简单的决策表简化得到的条件属性和决策属性间的依赖关系,而且通过去掉冗余属性,可以大大简化知识表达空间维数。因而将神经网络与粗糙集理论结合是很有意义的,而现在并没有一种方法将二者有效的结合在一起。



技术实现要素:

针对现有技术的不足,本发明提供一种基于WIA-PA无线示功仪采集的地面示功图,利用BP神经网络与粗糙集算法结合,利用粗糙集理论对数据进行预处理,提取关键要素作为网络的输入,从而简化BP神经网络结构,提高分类精度的一种故障诊断方法。

本发明为实现上述目的所采用的技术方案是:

一种基于粗糙集与BP神经网络的泵的故障诊断方法,包括以下步骤:搜集基准的训练样本特征数据,得到对应约简后的决策表,建立BP神经网络模型;将待诊断的训练样本特征数据,得到对应约简后的决策表,输入到所述BP神经网络模型,进行故障诊断。

所述得到对应约简后的决策表包括以下步骤:

步骤1:搜集基准的训练样本泵功图并对其进行二值化处理,得到训练样本泵功图曲线;

步骤2:根据训练样本泵功图曲线形成对应的网格特征向量;

步骤3:通过对不同训练样本泵功图的网格特征向量进行比较,得出不同工况条件的条件属性和决策属性,建立决策表;

步骤4:对决策表进行约简,得到约简后的决策表。

所述形成对应的网格特征向量的过程为:将训练样本泵功图曲线分成m×n个网格,其中m=2n,将训练样本泵功图曲线边界穿越的网格赋值为“1”,未穿过的网格赋值为“0”,并将边界内部所有网眼都赋值为“1”,得到 了网格特征向量。

所述对决策表进行约简包括以下过程:

步骤1:计算D的C正域POSC(D)中包含训练样本的个数,其中C为条件属性,D为决策属性;

步骤2:令R=φ,φ为空集,对C\R中的每个属性P,分别计算POSC∪{p}(D)中包含的训练样本个数;

步骤3:选择使POSR∪{p}(D)中包含训练样本个数最多的属性,记P',R=R∪{P'};

步骤4:若POSR∪{p}(D)中包含的训练样本个数等于POSC(D)中包含的训练样本个数,则输出最小故障诊断特征子集,即为约简后的决策表,否则返回步骤1;

所述建立BP神经网络模型包括以下过程:

步骤1:权值和阀值的初始化,将BP神经网络各层之间的初始权值和阀值随机的赋以[0,1]区间的值;

步骤2:将基准的训练样本的约简决策表,作为BP神经网络的输入向量;

步骤3:根据经验公式确定BP神经网络结构:

其中,P为隐藏节点数,r为输入层节点数,s为输出层节点数;

步骤4:通过Sigmoid函数计算隐含节点间的权重矩阵以及BP神经网络的输出,完成BP神经网络模型建立。

所述训练样本包括如下工况:正常工作、气体影响、供液不足、抽油杆断脱、油稠、游动凡尔漏失、泵上碰、泵下碰、固定凡尔漏失、柱塞脱出工作筒、气锁、双凡尔漏失、卡泵、油井出砂、结蜡。

本发明具有以下有益效果及优点:

本发明通过将BP神经网络与粗糙集算法结合,先利用粗糙集理论有效的降低泵功图样本特征的维数,再利用约简后样本特征构造BP神经网络识别器,简化BP神经网络结构,减少BP神经网络识别器学习和运行的时间,提高分类精度。

附图说明

图1是本发明的方法流程图;

图2是本发明的供液不足的地面功图和泵功图;

具体实施方式

下面结合附图及实施例对本发明做进一步的详细说明。

如图1所示为本发明的方法流程图。

基于粗糙集与神经网络的抽油井故障诊断方法,采集地面示功图,在得到其泵功图后,利用粗糙集与BP神经网络对泵功图进行故障诊断。

步骤1:搜集15种训练样本,包括:正常工作,气体影响,供液不足,抽油杆断脱,油稠,游动凡尔漏失,泵上碰,泵下碰,固定凡尔漏失,“柱塞脱出工作筒,气锁,双凡尔漏失,卡泵,油井出砂,结蜡。

步骤2:对泵功图进行二值化处理,处理后的图像数值矩阵由0和1组成。

步骤3:截取数字图像像素为0的最大矩阵区域,将此区域中的图像经过集合变换,使之变成32*32的二值图像,然后将二值图像进行反色处理,以这样得到的图像各像素的数字0、1构成的向量。

步骤4:在曲线上沿曲线的形成方向顺序采集多个特征点,这样就得到了曲线上特征点的坐标向量X、Y,然后再一个横坐标上插值,就可以得出足够多的点坐标,连接这些点就绘制出了泵功图曲线。

步骤5:给定的样本均经过载荷和唯一的归一化处理的二值化图像,把泵功 图分成m×n(其中,m=2n)个网格,将泵功图曲线边界穿越的网格赋“1”,未穿过的网格赋“0”,并将边界内部所有网眼都赋值为“1”,因此将所有网格特征值组合在一起形成一个m×n维的网格特征向量,网格特征能反应泵功图的整体形状分布。

表1泵功图的二值化赋值矩阵

步骤6:建立决策表及属性离散化:

表2样本集的决策表

步骤7:决策表属性约简:

(1)决策表T中,条件属性为C,决策属性为D,计算D的C正域POSC(D)中包含样本的个数。

(2)令R=φ,对条件属性C\R重复:对C\R中的每个属性P,计算POSC∪{p}(D)中包含的样本个数;选择使POSR∪{p}(D)中包含样本个数最多的属性,记P',R=R∪{p};将新的R值赋给以前的R,也可将新的R值表示为R’;若POSR∪{p}(D)中包含的样本个数等于POSC(D)中包含的样本个数,则输出最小故障诊断特征子集;否则回到步骤7的(1)重新计算。

步骤8:BP神经网络模型的设计:用约简得到的最小条件属性集对应的训练样本对BP神经网络进行学习和训练,通过网络并行的粗糙集和BP神经网络学习实现最小决策规则,决策方案的修正通过BP神经网络和粗糙集学习间的交换改进,直到粗糙集学习选出最少属性构成的决策规则能全部正确划分所有的测试集样本为止。

(1)权值和阀值的初始化,将BP网络各层之间的初始权值和阀值随机的赋以[0,1]区间的值。

(2)输入学习样本,将粗糙集筛选的样本作为BP神经网络的输入向量。

(3)确定BP神经网络结构:根据经验公式

P为隐藏节点数,r和s分别为输入层、输出层节点数。

(4)选择BP神经网络函数,通过选用的Sigmoid函数计算隐含节点间的权重矩阵以及BP神经网络的输出。

步骤9:故障诊断,对输入的新数据,作同样的预处理,即只取最小条件属性集的属性,作相同的归一化。输入被训练样本到训练好的BP神经网络,输出识别分类结果。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1