一种基于熵值的离心泵故障诊断方法与流程

文档序号:16249679发布日期:2018-12-11 23:54阅读:242来源:国知局
一种基于熵值的离心泵故障诊断方法与流程

本发明涉及数字信号处理领域,特别涉及一种基于熵值的离心泵故障诊断方法。

背景技术

离心泵作为重要的能量转化和流体输送设备,具有体积小,重量轻,效率高,结构简单等优势,因此被广泛应用于石化,电力、供水,排水,航空等各个领域中。离心泵通常在恶劣的工况中运行,易发生各种形式的损伤。如果故障发现不及时,可能导致离心泵运行效率下降,生产中断,造成重大的经济损失或灾难性事故。因此,离心泵的故障诊断对保障其安全运行至关重要。

离心泵故障诊断的关键是如何从测得的振动信号中准确提取故障特征。目前在离心泵健康监测中传统的特征提取方法包括:有效值、峭度值、均方根值和快速傅里叶变换(fft)等。然而,当离心泵发生故障时,测得的振动信号往往呈现出非平稳非线性的特征,上述传统的特征提取方法难以有效提取离心泵隐藏的故障特征,导致最终故障识别率较低。因此,需要寻求一种新的离心泵特征提取方法。

熵在检测时间序列的动态变化方面给予了研究者新的视角,目前已广泛应用于旋转机械的故障诊断。熵值是用来衡量一个时间序列混乱程度的度量,系统越混乱,有序度就越低,因此熵就越大,反之熵就越小。从正常离心泵收集的振动信号由于其高度不规则性而通常具有较大的熵值,而从故障的离心泵收集的振动信号由于较低的不规则性而具有较小的熵值。因此,可以利用熵值作为故障特征来对离心泵的故障类型进行识别。目前,样本熵(se)和排列熵(pe)是测量给定时间序列的复杂度的最广泛使用的方法。然而,样本熵在分析长信号的效率并不高,排列熵尽管比样本熵快,但其仅考虑时间序列的幅度值的排序,因此易受干扰噪声的影响。因此,研究者提出符号动力学熵(sde)解决这些问题。与样本熵和排列熵相比,符号动力学熵具有明显的优势,如计算效率高和抗噪性强。同时,符号动力学熵被扩展到多尺度符号动力学熵(msde),成功用于行星齿轮箱的故障诊断。但是,由于msde仅考虑从单通道传感器捕获的故障信息,而单个传感器很难全面反应某些大型设备的故障信息,所以msde方法在提取离心泵的故障特征时仍存在缺陷。目前,如何充分和有效的利用机器中所有的传感器成为了研究的热点及难点。

离心泵的主要故障模式为轴承故障和叶轮故障。然而,轴承和叶轮之间存在较长的传输路径,因而测得的振动信号较弱,大量的有效信息被噪声淹没,从而导致故障识别的正确率较低。如果用两个传感器收集振动信号,一个安装在轴承末端,另一个安装在叶轮末端,从双通道振动信号中提取的故障特征无疑会提供更多的故障信息,因此能够更全面的反应离心泵的运行状态,从而有效地提高故障识别的正确率。



技术实现要素:

本发明解决的技术问题是:本发明为了解决多尺度符号动力学熵在离心泵故障诊断中不能进行多通道信号分析这一缺点,我们提出了一种新的故障特征提取方法,称为复合多维多尺度符号动力学熵(cmvmsde)。

本发明的技术方案是:一种基于熵值的离心泵故障诊断方法,包括以下步骤:

步骤1:利用p个通道的震动传感器采集到p个通道的震动信号(每一个通道即为一维变量),构建多维时间序列矩阵xi,j,形式如下:

式中,i代表了通道的数目,取值范围为i=1,2,…,p,即矩阵中每一行表示了一个通道;j代表了数据的长度,取值范围为j=1,2,…,n。

步骤2:对于多维时间序列矩阵xi,j中的每一个通道,按照下式将原始时间序列xi,j进行粗粒化分割,得到在时间尺度τ下的τ个粗粒时间子序列其中的每一个粗粒时间子序列可表示为子序列中的每一个元素,可由下式确定:

式中,k代表了通道,取值范围为k=1,2,…,p;j代表了数据的长度,取值范围为j=1,2,…,n;a代表子序列编号,取值范围为1≤a≤τ;b代表了子序列数据的长度,取值范围为τ代表时间尺度。

步骤3:重复步骤2,能够得到中得到尺度τ下的所有通道的粗粒时间子序列,利用这些粗粒时间子序列构建多维多通道矩阵形式如下:

式中,k代表了通道,取值范围为k=1,2,…,p;τ代表时间尺度;a代表子序列编号,取值范围为1≤a≤τ。

步骤4:利用步骤3中得到的多维多通道矩阵计算其多维动力学熵mvsde,其计算过程可以由以下子步骤获得:

子步骤1:利用步骤3得到的矩阵分别用ε个符号σi(i=1,2,…,ε)将每一个通道转换为符号时间序列,该过程也被称为符号化。在符号化之后,矩阵可以被符号化为新的矩阵z{z1(k),z2(k),…,zi(k)}t,其中,k=1,2,…,n代表数据的长度,i=1,2,…,p代表了通道的数目。

子步骤2:利用子步骤1得到的符号矩阵z{z1(k),z2(k),…,zi(k)}t,通过嵌入维度m和时间延迟λ构造矩阵如下所示:

式中,i代表了通道,取值范围为i=1,2,...,p;j代表了数据的长度,取值范围为j=1,2,...,n-(m-1)λ。

子步骤3:统计子步骤2中嵌入向量的可能出现的状态模式由于每个通道的嵌入维度为m,即嵌入了m个元素,每个元素可能具有ε个符号,因此存在εm个潜在的状态模式。并通过下式计算状态模式的概率

式中,type(.)表示从符号空间到状态模式空间的映射,||·||表示集合的个数。p代表了通道总数目,m表示嵌入维度,n代表数据总长度,j代表了数据的长度,取值范围为j=1,2,...,n-(m-1)λ。

子步骤4:通过子步骤3得到的构建1×εm的状态模式矩阵如下:

子步骤5:统计在子步骤3中每种模式出现时,下一个符号σb(b=1,2,...,ε)出现的条件概率状态转移概率其计算公式如下:

式中,ε是符号的数目,εm是状态的数目,a=1,2,...,εm并且b=1,2,...,ε。对于每一个通道总共有εm+1个状态转移。p代表了通道总数目,m表示嵌入维度,n代表数据总长度,j代表了数据的长度,取值范围为j=1,2,...,n-mλ

子步骤6:通过子步骤5得到的构建ε×εm的条件概率状态转移矩阵如下:

子步骤7:利用子步骤4得到的状态模式矩阵和步骤6得到的条件概率状态转移矩阵,计算多维号动力学熵mvsde,如下所示:

式中,m是嵌入维度,λ是时间延迟,ε是符号的数目。

子步骤8:利用下式,正规化步骤7得到的多维号动力学熵mvsde:

mvsdenorm=mvsde/ln(εm+1)

通过正规化,mvsde的范围是0<mvsdenorm<1,时间序列越随机、越随机,mvsde值越大。

步骤5:重复步骤2-步骤4及其子步骤,得到时间尺度τ下的τ个粗粒时间子序列对应的mvsde值,然后,尺度τ的cmvmsde通过计算平均mvsde值获得,其形式如下所示:

式中,τ代表时间尺度。

步骤6:重复步骤5,得到所有时间尺度下的cmvmsde值。

发明效果

本发明的技术效果在于:为了克服msde在离心泵故障诊断中不能进行多通道信号分析的这一缺点,本专利提出了一种新的故障特征提取方法,称为复合多维多尺度符号动力学熵(cmvmsde)。首先,利用粗粒化过程对每一个通道的时间序列进行多尺度分割。为克服传统粗粒化过程因为尺度增加而产生不准确的熵估计和较差的统计可靠性的缺点,本文提出了复合多尺度粗粒化过程,利用滑动窗口进行多尺度分割。然后,基于多变量相空间重构技术,将已分割的时间序列在相空间中重构,求出熵值。结合逻辑回归分类器,本发明中的一种新型故障诊断方法,能够有效的识别离心泵不同的故障类型,识别率为100%。

附图说明

图1为本发明的方法流程图

图2为离心泵在不同健康条件下的时域波形:其中(a)通道1在7种工况下的时域波形,(b)为通道2在7种工况下的时域波形

图3为离心泵在7种工况下20个尺度的cmvmsde值

图4为由拉普拉斯分值重新排序后的cmvmsde值

图5为基于复合多维多尺度符号动力学熵的分类结果

具体实施方式

参见图1,本方法包括以下步骤:

步骤1:利用p个通道的震动传感器采集到p个通道的震动信号(每一个通道即为一维变量),构建多维时间序列矩阵xi,j,形式如下:

式中,i代表了通道的数目,取值范围为i=1,2,…,p,即矩阵中每一行表示了一个通道;j代表了数据的长度,取值范围为j=1,2,…,n。

步骤2:对于多维时间序列矩阵xi,j中的每一个通道,按照下式将原始时间序列进行粗粒化分割,得到在时间尺度τ下的τ个粗粒时间子序列其中的每一个粗粒时间子序列可表示为子序列中的每一个元素,可由下式确定:

式中,k代表了通道,取值范围为k=1,2,…,p;j代表了数据的长度,取值范围为j=1,2,…,n;a代表子序列编号,取值范围为1≤a≤τ;b代表了子序列数据的长度,取值范围为τ代表时间尺度。

步骤3:重复步骤2,可以得到中得到尺度τ下的p个通道的粗粒时间子序列,利用这些粗粒时间子序列构建多维多通道矩阵形式如下:

式中,k代表了通道,取值范围为k=1,2,…,p;τ代表时间尺度;a代表子序列编号,取值范围为1≤a≤τ。

步骤4:

利用步骤3中得到的多维多通道矩阵计算其多维动力学熵mvsde,其计算过程可以由以下子步骤获得:

子步骤1:利用步骤3得到的矩阵分别用ε个符号σi(i=1,2,…,ε)将每一个通道转换为符号时间序列,该过程也被称为符号化。在符号化之后,矩阵可以被符号化为新的矩阵z{z1(k),z2(k),…,zi(k)}t,其中,k=1,2,…,n代表数据的长度,i=1,2,…,p代表了通道的数目。

子步骤2:利用子步骤1得到的符号矩阵z{z1(k),z2(k),…,zi(k)}t,通过嵌入维度m和时间延迟λ构造矩阵如下所示:

式中,i代表了通道,取值范围为i=1,2,...,p;j代表了数据的长度,取值范围为j=1,2,...,n-(m-1)λ。

子步骤3:统计子步骤2中嵌入向量的可能出现的状态模式由于每个通道的嵌入维度为m,即嵌入了m个元素,每个元素可能具有ε个符号,因此存在εm个潜在的状态模式。并通过下式计算状态模式的概率

式中,type(.)表示从符号空间到状态模式空间的映射,||.||表示集合的个数。p代表了通道总数目,m表示嵌入维度,n代表数据总长度,j代表了数据的长度,取值范围为j=1,2,...,n-(m-1)λ。

子步骤4:通过子步骤3得到的构建1×εm的状态模式矩阵如下:

子步骤5:统计在子步骤3中每种模式出现时,下一个符号σb(b=1,2,...,ε)出现的条件概率状态转移概率其计算公式如下:

式中,ε是符号的数目,εm是状态的数目,a=1,2,...,εm并且b=1,2,...,ε。对于每一个通道总共有εm+1个状态转移。p代表了通道总数目,m表示嵌入维度,n代表数据总长度,j代表了数据的长度,取值范围为j=1,2,...,n-mλ

子步骤6:通过子步骤5得到的构建ε×εm的条件概率状态转移矩阵如下:

子步骤7:利用子步骤4得到的状态模式矩阵和步骤6得到的条件概率状态转移矩阵,计算多维号动力学熵mvsde,如下所示:

式中,m是嵌入维度,λ是时间延迟,ε是符号的数目。

子步骤8:利用下式,正规化步骤7得到的多维号动力学熵mvsde:

mvsdenorm=mvsde/ln(εm+1)

通过正规化,mvsde的范围是0<mvsdenorm<1,时间序列越随机、越随机,mvsde值越大。

步骤5:重复步骤2-步骤4及其子步骤,得到时间尺度τ下的τ个粗粒时间子序列对应的mvsde值,然后,尺度τ的cmvmsde通过计算平均mvsde值获得,其形式如下所示:

式中,τ代表时间尺度。

步骤6:重复步骤5,得到所有时间尺度下的cmvmsde值。

2.总体步骤及实现措施

基于复合多维多尺度符号动力学熵(cmvmsde),拉普拉斯分值(ls)和逻辑回归(lr)的优势,本文提出了一种新的离心泵故障诊断方法。本文所提出的方法主要有四个步骤:

(1)采用cmvmsde提取离心泵的振动信号的20个尺度下的故障特征;

(2)将所得的故障特征数据分为训练集和测试集;

(3)利用ls优选故障特征,并将优选后特征作为新的输入特征;

(4)利用新的特征对逻辑回归分类器进行训练和测试,进行故障类型识别。

本文所提方法流程图见附图1。

本专利效果可以通过以下实验进一步说明:

实验条件:本文设计了七种故障类型的试验,包括正常轴承,轴承内圈裂纹故障(cfir),轴承外圈裂纹故障(cfor),轴承内圈磨损故障(wfir),轴承外圈磨损故障(wfor),叶轮盖板缺陷(cpdi)和叶轮叶片缺陷(bdi)。cfor,wfor,cfir和wfir的故障直径分别为0.5mm,2*3mm2,0.5mm和2*3mm2

本次故障模拟实验的数据集的详细描述如表1所示。从通道1和通道2采集的不同工况下的离心泵的振动信号时域波形如图2所示。通过图2可以发现,由于离心泵振动信号呈现出非平稳和非线性特性,难以通过时域信号区分其故障类型。

表1.实验数据集的数量的详细描述

首先,利用cmvmsde提取从图2的振动信号中提取故障特征,所提取的故障特征如图3所示。从图3中可以看出,正常工况下的离心泵具有较大的符号动力学熵值。这种现象表明从正常离心泵的振动信号具有很大的随机性和不确定性,复杂度较高。通过图3可见,离心泵的7种工况下cmvmsde值差异较大,从而说明了基于cmvmsde方法可以有效区分离心泵的不同故障。然后,应用拉普拉斯分值对所得的特征进行优选。经过拉普拉斯分值排序后特征如图4所示。我们选择前四个区分性最好的特征(τ=1,2,12,3)作为新的特征向量,并将它们输入到逻辑回归分类器进行故障模式识别。

本专利所提出的基于复合多维多尺度符号动力学熵方法的识别结果如图5所示。从图5可以发现,所有测试样本均分类正确,没有被错分的样本,分类准确率为100.00%,从而验证了所提方法的有效性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1