一种基于增强型LPP算法和极限学习机快速轴承故障识别方法与流程

文档序号:15757786发布日期:2018-10-26 18:54阅读:293来源:国知局
一种基于增强型LPP算法和极限学习机快速轴承故障识别方法与流程

本发明申请涉及一种轴承设备故障检测领域,尤其涉及一种基于增强型lpp算法和极限学习机快速轴承故障识别方法。



背景技术:

在工业领域中,为了增加设备性能的可靠性,降低由于机器故障原因导致产量下降的几率,机器运行状态的监控越来越受到人们的重视。旋转机械是工业部门中应用最为广泛的一类机械设备,汽轮机、压缩机、风机和轧机等诸多机械都属于这一类。然而,其核心部件轴承常常由于各种不同形式的故障影响其正常工作,有时甚至会由于某故障引发严重的机毁人亡事故,并造成重大的经济损失,因此开展故障检测的研究具有十分重要的现实意义。

机械设备故障检测就是对测取的含有故障信息的信号利用信号处理和分析技术,找出和故障有关的特征参数并利用这些特征参数对设备的实时技术状态进行判别。这里涉及到两个方面的问题,一是利用信号处理技术进行特征提取;二是利用模式识别技术进行故障检测。在信号特征提取方面,主要分为:信号的时域特征如信号的均值、均方值、峰值、峭度和歪度等;信号的频域特征如能量谱、ar功率谱等;以及信号的时频特征如小波分析,hilbert变换和短时傅里叶变换等。为了能充分地表征不同类别的故障进而提高识别率,就需要多种不同特征进行融合,这也使得特征向量的维度大大增加,导致计算复杂度提高同时也延长了故障检测的时间。因此如何能实现合理的数据降维就显得尤为重要。主成分分析(principalcomponentsanalysis,pca)作为数据降维的经典算法,因能有效去除特征间线性相关同时保持原始特征的主要信息而被广泛应用在故障检测领域。然而,现实当中各种不同类别的特征间可能存在非线性关系,此时传统的主成分分析无法得到满意的结果。另外主成分分析只考虑到全局分布特征,即只考虑到投影后的系数方差最大化,对局部信息的保持没能做充分考虑,因此通过pca降维后得到的变量虽然能反映原有变量的绝大部分全局信息,但会打乱原有数据的局部邻域结构,导致不同类别间区分能力的丧失进而降低故障识别率。局部保持投影(localitypreservingprojections,lpp)是非线性方法laplacianeigenmap的线性近似,作为一种新的子空间分析方法,它既解决了主成分分析方法难以保持原始数据非线性流形局部结构的问题,又解决了其无法去除指标间非线性相关性的问题。现今lpp在人脸识别、图像检索等领域得到广泛应用。然而lpp需事先指定k紧邻个数以及热核函数的参数来确定相似度矩阵,而在现实应用中,由于事先对原始数据的空间分布未知,参数设置变得十分困难。受不当参数设置的影响,传统lpp算法的性能严重下降。为此,本发明通过采用熵规范化将相似度矩阵结合到优化函数中,与投影向量一并求解,进而解决了传统lpp算法需事先指定参数的不足,提升了算法的局部空间保持能力。

在模式识别方法方面,神经网络和支持向量机算法(svm)因其良好的非线性区分能力,已被广泛应用到故障检测领域。但是上述方法需要训练的参数较多,导致时间较长且很容易陷入局部最优解。极限学习机(extremelearningmachine)elm作为一种简单易用、有效的单隐层前馈神经网络学习算法,不需要在算法执行过程中调整网络的输入权值以及隐元的偏置,并且能产生唯一的最优解,因此具有学习速度快且泛化性能好的优点,非常适合于大数据时代下的分类问题,尤其是实时性要求很高的故障检测领域。为此,本发明拟将增强型局部保持投影分析和极限学习机相结合以实现轴承设备故障的快速检测,从信号处理角度能在保持不同类别间区分能力的同时实现数据降维,提高检测时效;从模式识别角度又能通过极限学习机实现故障类别的快速检测,降低运行时间。



技术实现要素:

1、一种基于增强型lpp算法和极限学习机快速轴承故障识别方法。其特征在于:该方法包括以下步骤:

(1)利用安装在轴承上的振动传感器收集该轴承在不同工状下的振动信号,设共有四种工状:正常状态、内圈故障状态、外圈故障状态和滚动体故障状态,然后分别对各种工况下的信号进行长度为1024分段处理得到训练样本集合xnormal,xinner,xouter,xball∈rn×1024,其中n表示单个工况下训练样本集合的个数;

(2)对步骤(1)获取的训练样本信息进行特征提取,得到能有效反应各种工况下振动信号特征的集合,设共有m个特征,则xnormal*,xinner*,xouter*,xball*∈rn×m

(3)对步骤(2)获取的特征训练样本集合进行标准化处理,使每个特征指标的数值范围确定在均值为0,方差为1的标准正态分布区间内;

(4)将步骤(3)得到的标准化处理后的训练样本特征矩阵x*∈r(4n)×m进行增强型局部保持投影分析,其中局部保持投影的投影向量个数为p,最终确定wenlpp投影向量,wenlpp∈rm×p

(5)利用步骤(5)中得到的局部保持投影向量wenlpp求解降维后的投影系数向量,x′enlpp=x*×wenlpp,x′enlpp∈r(4n)×p

(6)利用步骤(6)中求得的降维后的投影系数向量x′enlpp训练极限学习机模型melm;

(7)通过安装在轴承上的振动传感器收集该轴承的振动信号,经长度为1024分段处理及标准化处理后,计算特征向量x*new∈r1×m,利用wenlpp计算投影系数向量x′new=x*new×wenlpp然后输入到训练好的模型melm中确定当前轴承最终的工作状态。

2、根据权利要求1所述的基于增强型lpp算法和极限学习机快速轴承故障识别方法,其特征在于,对步骤(2)中的特征提取所采用的方法是提取振动信号片段在不同层下的小波域广义高斯分布特征及能量熵特征,其具体步骤如下:设xi∈rn×1024,i=1,2,…,n为来自任何一个工况下的样本集合,对其进行小波分解,设这里采用的小波为db1,分解层数为l,然后对每一层小波利用广义高斯分布拟合它系数的分布特征,通过最大似然估计法得到对应模型的形状参数和尺度参数,广义高斯分布模型如下:

其中α控制着广义高斯分布模型的宽度,称作尺度参数;β控制着广义高斯分布模型的衰减程度,称作形状参数,同时分别计算每层系数的熵值,每层系数的熵值计算公式为:

其中dij为第i层小波系数的第j个小波系数值,令m=15则形成最终的特征集合{α1,β1,α2,β2,α3,β3,α4,β4,α5,β5,e1,e2,e3,e4,e5},其中αi,βj分别是第i层小波系数的ggd模型特征的尺度参数和形状参数。。

3、根据权利要求1所述的基于增强型lpp算法和极限学习机快速轴承故障识别方法,其特征在于,步骤(3)中对每个指标值进行标准化处理所采用的方法是z-score法,其具体步骤如下:设对任意指标进行标准化处理所采用的方法如下:

同时记录μj,σj以备新样本的标准化处理。

4、根据权利要求1所述的基于增强型lpp算法和极限学习机快速轴承故障识别方法,其特征在于,步骤(4)中wenlpp计算方法如下所述:

根据标准化后的训练样本特征矩阵x*构造邻接矩阵u(1)∈r(4n)×(4n)和度量矩阵d(1)∈r(4n)×(4n),其中uij(1)∈u(1)的表达式如下:

i,j=1,2,…,4n,因本发明中的方法对热核参数σ和最近邻个数k的选取不敏感,因此建议σ=1或0.5,设置k=5;

构造度量矩阵d(1),dij(1)=0,i≠j,i,j=1,2...,4n,并求得拉普拉斯矩阵l(1),其中l(1)=d(1)-u(1)

构造a=x*l(1)x*t,b=x*d(1)x*t并求解av=λbv广义特征值特征向量,其中前p个最小特征值λi,i=1,…,p所对应的特征向量vi,i=1,…,p即为

设置最大循环次数maxlter=300,以及当前迭代次数iter=2,当iter≤maxiter时

重新构造u(iter),根据u(iter)构造度量矩阵d(iter),dij(iter)=0,i≠j,,i,j=1,2...,4n以及l(iter)=d(iter)-u(iter),构造a=x*l(iter)x*t,b=x*d(iter)x*t并求解av=λbv广义特征值特征向量,其中前p个最小特征值λi,i=1,…,p所对应的特征向量vi,i=1,…,p即为iter=iter+1,重复直到满足停止条件;wenlpp就等于最后得到的

6、根据权利要求1所述的基于增强型lpp算法和极限学习机快速轴承故障识别方法,其特征在于,步骤(6)中melm模型通过下列方法进行训练:首先确定隐层个数l,输出层的个数即为分类个数c,这里设置为4,即为4种工况,随机初始化输入权重和偏置矩阵,设为winput∈rl×p,binput∈rl×1,扩展binput为b∈rl×(4n),计算隐层输出矩阵h∈rl×(4n)

构造数据类别结果矩阵t∈r(4n)×c,tij=1,当xij∈j类时,其他为-1,求得woutput∈rl×c,woutput=h+t,h+为h的moore-penrose广义逆矩阵,最终得到训练后的极限学习机模型:

melm={winput,binput,woutput}。

7、根据权利要求1所述的基于增强型lpp算法和极限学习机快速轴承故障识别方法,其特征在于,步骤(7)中的标准化处理方法利用的是步骤(3)存储的μj,σj,j=1,2,…m进行z-score标准化,特征向量的确定采用的是步骤(2)中的特征提取方法,利用步骤(4)得到的wenlpp计算降维后的系数向量最终状态的确定由melm模型确定,

ttest=htestt*woutput

取max(htest)所对应的下标即为当前轴承设备工况的输出。

本发明的有益效果:

1.本发明的轴承故障识别方法,其特征提取采用的是能有效反应小波不同层系数分布特征的广义高斯分布,而不是传统的高斯分布,因此更能体现出小波系数分布的拖尾效应。使得获取的特征更具有代表性和区分性。

2.本发明的轴承故障检测方法,应用增强型局部保持投影而非传统主成分分析方法实现降维投影系数变换。传统的主成分分析方法虽能最大程度地保持原始数据的全局结构信息,但无法处理特征间的非线性相关问题和保持局部结构信息,而增强型局部保持投影分析方法不受指标间非线性相关关系的限制,且具有局部结构保持能力。另外,本发明还利用训练速度极快的极限学习机作为模式识别的方法,大大提高了故障检测的时效性。因此本发明将两种算法相结合,从信号处理角度能提高检测效率,从模式识别角度又能减少运行时间。

3.本发明的轴承故障检测方法,采用的一种增强型局部保持投影方法,即基于熵规范化的局部保持投影分析方法,通过利用最大熵规范化项将相似度矩阵和投影向量共同优化,解决了传统lpp算法需事先指定参数的不足,大大提升了算法局部保持能力且具有较高的稳定性。

附图说明:

附图1是本发明实施例3中10维数据特征经enlpp算法迭代300次后投影到二维空间后的结果。

附图2是本发明实施例3中10维数据特征经enlpp算法迭代300次后目标函数值的变化情况。

附图3是本发明实施例3中15维数据特征经enlpp算法迭代300次后投影到二维空间后的结果。

附图4是本发明实施例3中15维数据特征经enlpp算法迭代300次后目标函数值的变化情况。

附图5是本发明实施例3中10维数据特征经enlpp算法迭代300次后与传统lpp算法的投影结果的区分能力指标随样本数的变化情况。

附图6是本发明实施例3中15维数据特征经enlpp算法迭代300次后与传统lpp算法的投影结果的区分能力指标随样本数的变化情况。

附图7是本发明实施例4中10维数据特征经enlpp算法降维2维后分类精度随隐层神经元个数变化情况。

附图8是本发明实施例4中15维数据特征经enlpp算法降维2维后分类精度随隐层神经元个数变化情况。

附图9是本发明实施例4中10维数据特征经enlpp算法和lpp算法降维2维后分类精度随训练样本个数变化情况(隐层=30)。

附图10是本发明实施例4中15维数据特征经enlpp算法和lpp算法降维2维后分类精度随训练样本个数变化情况(隐层=30)。

附图11是本发明实施例4中15维数据特征经lpp算法和enlpp算法降维后分类精度随降维数变化情况(隐层=30)。

附图12是本发明实施例4中不同算法的训练时间和测试精度对比结果。

具体实施方式:

实施例1:

一种增强型lpp算法和极限学习机快速轴承故障识别方法,所述的增强型lpp算法包括如下具体步骤:

已知数据集x1*,x2*,…x4n*,其中xi*∈rm,i=1,2,…,4n。4n为样本总数,m为特征总数。设yi,yj是新基向量下的降维投影坐标,在总体样本中考虑,原来相近的样本在新的基坐标空间中也同样相近。令相似度矩阵为:u∈r4n×4n。其中uij∈u表示原有样本空间的样本的相近程度,i,j=1,2,3...,4n,度量矩阵:d∈r4n×4n,其中dii=∑juij,利用最大熵规范化构造求解u和投影向量wenlpp的目标函数为:

其中α表示调节损失项和最大熵正则项的控制权重,这里令α=1。

因此利用拉格朗日数乘法构造拉格朗日函数,其式如下:

分别对β,uij求导得:

由上式求得uij的表达式,

将求得的uij的表达式带入到中得

将公式代入到uij表达式中,得到uij的迭代公式

为了便于对wenlpp投影向量求导,我们将上述的目标函数中的损失函数换成矩阵的表达形式:

wenlpptx*dx*twenlpp-wenlpptx*ux*twenlpp=wenlpptx*(d-u)x*twenlpp=wenlpptx*lx*twenlpp

l=(d-u)是著名的拉普拉斯矩阵。为了防止0值解,加上约束条件:写成矩阵形式即:

wenlpptx*dx*twenlpp=1

通过拉格朗日求解wenlpp,得到的投影向量迭代公式表示为

2x*lx*twenlpp-2λx*xx*twenlpp=0

x*lx*twenlpp=λx*x*twenlpp

求解上式的广义特征值和特征向量,即得wenlpp。

具体的迭代流程如下:

(1)构造带权重的邻接矩阵u(1)∈r(4n)×(4n)和度量矩阵d(1)∈r(4n)×(4n),其中uij(1)∈u(1)的表达式如下:

i,j=1,2,…,4n,因本发明中的方法对热核参数σ和最近邻个数k的选取不敏感,因此建议σ=1或0.5,设置k=5;

构造度量矩阵d(1),dii(1)∈d(1),dij(1)=0,i≠ji,j=1,2...,4n。并求得拉普拉斯矩阵l(1),其中l(1)=d(1)-u(1)。构造a=x*l(1)x*t,b=x*d(1)x*t并求解av=λbv广义特征值特征向量,其中前p个最小特征值λi,i=1,…,p所对应的特征向量vi,i=1,…,p即为wenlpp(1)

(2)设置最大循环次数maxiter=300,以及当前迭代次数iter=2。

(3)当iter≤maxiter时

重新构造u(iter),根据u(iter)构造度量矩阵d(iter),dij(iter)=0,i≠j,i,j=1,2...,m以及l(iter)=d(iter)-u(iter),构造a=x*l(iter)x*t,b=x*d(iter)x*t并求解av=λbv广义特征值特征向量,其中前最小的特征值λ所对应的特征向量v即为

(4)iter=iter+1,返回步骤(3)直到满足停止条件。

(5)welpp就等于最后得到的

实施例2:

一种增强型lpp算法和极限学习机快速轴承故障识别方法,所述的极限学习机包括如下具体步骤:

对于一个单隐层神经网络,假设有4n个任意的样本(x′j,tj),其中x′j=[x′j1,x′j2,…x′jp]t∈rp,tj=[tj1,tj2,…tjc]t∈rc。本发明输出层个数c=4,对于一个具有l个隐层节点的单隐层神经网络某一个输出层输出可以表示为:

其中,g(x)为激活函数,winputi=[wi,1,wi,2,…,wi,p]t为输入权重,βic为第i个隐层单元对应第c个输出单元的输出权重,bi是第i个隐层单元的偏置。winputi·x′j表示winputi和x′j的内积。单隐层神经网络学习的目标是使得输出的误差最小,可以表示为即存在βi,winputi和bi,使得:

可以矩阵表示为hβ=t。其中,h是隐层节点的输出,β为输出权重,t为期望输出。

为了能够训练单隐层神经网络,我们希望得到使得

其中,i=1,…,l,这等价于最小化损失函数:

传统的基于梯度下降法的算法,可以用来求解上述问题,但是基于梯度的学习算法需要在迭代的过程中调整所有参数,训练时间较长。而在elm算法中,一旦输入权重wi和隐层的偏置bi被随机确定,隐层的输出矩阵h就被唯一确定。训练单隐层神经网络可以转化为求解一个线性系统hβ=t。并且输出权重β可以被确定:其中,h+是矩阵h的moore-penrose广义逆。且可证明求得的解的范数是最小的并且唯一。

实施例3:

为了验证基于增强型lpp算法和极限学习机快速轴承故障识别方法的检测性能,本文进行了下列实验。其中实验数据均来源于美国casewesternreserveuniversity的电气工程实验室,利用安装在感应电动机输出轴的支撑轴承上端机壳上的振动加速传感器来收集振动信号,采样频率为12khz。实验模拟了滚动轴承的四种运行状态:1正常状态;2内圈故障;3外圈故障;4滚动体故障。每个振动信号片段的样本点个数为1024。实验环境:windows7操作系统,cpu:inteli7,3.4g处理器,仿真软件为matlab2010b。另外,本文分别采用1000个正常样本,内圈故障样本、外圈故障样本和滚动体故障样本进行统计分析,利用db1小波对振动信号进行五层小波分解,得到第一层至第五层小波系数的广义高斯分布参数特征以及各层的熵值作为样本振动信号的特征。

为了验证增强型局部保持投影分析的性能,实验中取正常样本,内圈故障样本、外圈故障样本和滚动体故障样本各60个样本构成整体数据集合进行降维,其中,增强型局部保持投影算法的迭代次数为300次,降维维度为2,特征集分不含各层的熵值和含各层的熵值两种情况,降维后的数据分布情况以及迭代过程分别如图1,2,和3,4所示。其中迭代过程的目标函数值为:

不难看出增强型局部保持投影分析得到的降维后的数据具有明显的区分性,同一类样本聚集在一起,不同类别的样本间实现了有效分离。为了能量化地比较传统lpp算法和本发明的增强型局部保持投影分析算法的性能,我们采取基于sc的区分指标:

m是全体样本的均值,mj,nj是属于第j类簇cj所有样本的均值和个数。

tr为求解矩阵的迹函数,为了防止dc矩阵是奇异的,这里通常采用sc=tr(db)/tr(dc),sc值越大聚类效果越好。其中lpp算法的最近邻个数为1,热核参数为1。sc指标值随样本数的变化对比结果如图5,6所示。从实验结果可以看出本发明的增强型局部保持投影分析算法在不同样本数的情况下都优于传统的lpp算法,这表明增强型局部保持投影分析算法的局部近邻保持结构明显优于传统lpp算法且投影后的系数向量具有更好的区分能力。

实施例4:

为了验证基于增强型lpp算法和极限学习机快速轴承故障识别方法的分类精度随隐层神经元个数变化情况,我们分别选取100个正常样本,内圈故障样本、外圈故障样本和滚动体故障样本构成训练样本集合,经过增强型lpp算法降维到2维,再经过elm进行分类识别。其中增强型lpp算法算法迭代次数为300,elm输入单元个数为2,输出单元个数为4,隐层单元的个数从5到50等间隔变化,间隔为5。特征集合分不含各层的熵值和含各层的熵值两种情况,实验结果分别如图7,8所示。从两个图中显示的实验结果我们可以看出,本发明的检测模型检测性能在隐层个数增大到30以后不再随其增加出现显著提升。因此本发明建议隐层个数设置为30。

为了比较基于增强型lpp算法和极限学习机快速轴承故障识别方法和基于传统lpp算法和极限学习机快速轴承故障识别方法的分类精度,我们通过改变训练样本个数来观察两个检测模型的性能,参数设置同上述实验,结果如图9,10所示。不难看出本发明的检测模型的分类性能在不同训练样本个数下均优于传统lpp算法的检测性能,该实验结果表明经增强型lpp算法降维后得到的数据具有很好的区分能力。

为了比较基于增强型lpp算法和极限学习机快速轴承故障识别方法和基于传统lpp算法和极限学习机快速轴承故障识别方法的分类精度随降维维数的变化情况,我们进行不同维度降维的分类性能对比实验,其中降维维度分别设置为2,3,4和5,隐层个数为30,其他参数同上,实验结果如图11所示。不难发现本发明的检测方法在不同降维维度下的分类性能都明显优于传统lpp算法的分类性能。这也再次证明了增强型lpp算法的优势。

最后,为了验证本发明的基于增强型lpp算法和极限学习机快速轴承故障识别方法在训练时间上的优势,我们进行了不同算法在训练时间和测试精度的对比实验,其中包括经增强型lpp算法降维后的svm(one-all)、svm(one-one)、rbf神经网(rbfnn)、多层感知机神经网(mlp)、elm(本发明方法)和不经增强型lpp算法降维的elm。svm算法的参数采用高斯核,核宽度为1,rbfmlp和elm的隐层单元个数为30,其他参数设置同上,实验结果如图12所示。通过该表的实验结果可以发现本文算法无论在训练时间和测试精度上均优于其他算法,该实验结果表明经增强型lpp算法降维后的数据具有很好的区分能力,使得检测精度大大提高,同时由于elm训练参数少且具有唯一解,使得其所需训练时间少且泛化性能提高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1