一种基于完备总体经验模态分解与随机森林的离心泵故障诊断方法

文档序号:10609493阅读:505来源:国知局
一种基于完备总体经验模态分解与随机森林的离心泵故障诊断方法
【专利摘要】本发明公开了一种基于完备总体经验模态分解与随机森林的离心泵故障诊断方法,该方法包括:(1)利用CEEMD将传感器所获得的离心泵振动信号分解成一系列IMF分类;(2)将IMF分类的样本熵作为信号的特征向量;(3)将CEEMD?样本熵所得的特征向量作为随机森林分类器的输入进行故障诊断。本发明将CEEMD与样本熵用于离心泵振动信号的特征提取,一方面尽可能的避免了EMD分解出现的模态混叠及端点效应等现象,另一方面,特征提取较为方便简洁,计算量小,并对数据长度及噪声不敏感,因而适用性强。本发明将随机森林分类器用于离心泵的故障模式识别,避免了传统分类器过于依赖训练样本而出现过拟合的现象。尽可能的提高了分类准确率。
【专利说明】
-种基于完备总体经验模态分解与随机森林的离心累故障诊 断方法
技术领域
[0001] 本发明设及离屯、累故障诊断的技术领域,具体设及一种基于完备总体经验模态分 解(complete ensemble empirical mode decomposition,CEEMD)与随机森林的离屯、累故 障诊断方法。
【背景技术】
[0002] 离屯、累作为一种关键设备,广泛应用于各个工业领域。在旋转机械中,设备状态信 息隐藏于转子振动信号中,包含了设备各种异常或故障的信息。因此,震动分析在旋转机械 故障诊断领域应用广泛。一般来说诊断信号的分析步骤包含W下几个方面:(1)故障诊断信 号的获取(2)故障特征提取(3)状态确认和故障模式识别。
[0003] 化ang提出的经验模态分解化MD)可W自适应的用于处理此类的非平稳非线性的 机械信号,将信号分解为有限个内禀尺度分量。但EMD分解方法,最重要的缺点之一是模态 混叠的问题。Wu等人提出的总体平均经验模式分解(Ensemble Empiracal Mode Decomposition)方法,能有效解决经验模式分解方法的模态混叠问题,但是邸MD添加的白 噪声不能被完全中和,不具备完备性。
[0004] 因此,完备总体经验模态分解方法被提出,其主要是通过向待分析的信号中添加 连个相反的白噪声信号,并分别进行EMD分解。CEEMD在保证分解效果与EEMD相当的情况下, 减小了由白噪声引起的重构误差。
[0005] 赌的概念近几年作为体征提取的方法进入到故障诊断领域。样本赌是对近似赌的 改进,在脑电及屯、电等医学信号处理中得到广泛应用,样本赌可W量化时间序列的复杂度, 并对数据长度和和噪声不敏感。不同的IMF分量的样本赌可W估计多重时间尺度的复杂性。 因此,它能够增强故障诊断的准确度。
[0006] 在利用CEEMD-样本赌提取故障特征向量之后,需要分类器对其故障类型进行判 断。随机森林在模式识别方面有卓越的表现力。然而,在故障诊断领域应用的却比较少。本 文尝试利用随机森林分类器对离屯、累故障模式进行识别并验证其准确性。

【发明内容】

[0007] 本发明的目的在于:提供一种基于完备总体经验模态分解与随机森林的离屯、累故 障诊断方法,可应用于其进行离屯、累运行状态的监测与诊断。
[000引本发明采用的技术方案为:一种基于完备总体经验模态分解与随机森林的离屯、累 故障诊断方法,该方法包括:
[0009] (1)利用CEEM明尋传感器所获得的离屯、累振动信号分解成一系列IMF分类;
[0010] (2)将IMF分类的样本赌作为信号的特征向量;
[0011] (3)将CEEMD-样本赌所得的特征向量作为随机森林分类器的输入进行故障诊断。
[0012] 其中,步骤(1)中所述的利用CEEMD将传感器所获得的离屯、累振动信号分解成一系 列IMF分类具体包括:加速度传感器安装在离屯、累的电机外壳轴承座的正上方,对离屯、累进 行故障注入,并采集加速度传感器在各种故障模式下的离屯、累振动信号,将所采集的每种 故障模式下的若干组数据进行CEEMD分解,CEEMD可W将离屯、累振动信号自适应分解为若干 IMF分量。
[0013] 其中,步骤(2)中所述的将IMF分类的样本赌作为信号的特征向量具体包括:取 CEEMD分解的前5个IMF分量,W样本赌作为衡量IMF复杂度的量化参数,并作为特征向量。
[0014] 其中,步骤(3)中所述的将CEEMD-样本赌所得的特征向量作为随机森林分类器的 输入进行故障诊断具体包括:将步骤(2)得到的所述的特征向量作为随机森林分类器进行 故障模式识别,从每种故障模式下的若干组数据中任意选取部分组进行训练,其余组作为 测试样本,得到结果后,将测试标签与实际标签进行比对,并计算准确率。
[0015] 本发明与现有技术相比的优点在于:
[0016] (1)、将C邸MD与样本赌用于离屯、累振动信号的特征提取,一方面尽可能的避免了 EMD分解出现的模态混叠及端点效应等现象,另一方面,特征提取较为方便简洁,计算量小, 并对数据长度及噪声不敏感,因而适用性强。
[0017] (2)、将随机森林分类器用于离屯、累的故障模式识别,避免了传统分类器过于依赖 训练样本而出现过拟合的现象。尽可能的提高了分类准确率。
【附图说明】
[0018] 图1为一种基于完备总体经验模态分解与随机森林的离屯、累故障诊断方法流程;
[0019] 图2为随机森林分类器诊断流程;
[0020] 图3为内环故障CEEMD分解图。
[0021]
【具体实施方式】
[0022] 下面结合附图W及【具体实施方式】进一步说明本发明。
[0023] 如图1所示,本发明一种基于CEEMD-Samp^i的随机森林的离屯、累故障诊断方法流 程介绍如下:
[0024] 该方法主要分为Ξ个部分:(1)利用CEEMD将传感器所获得的离屯、累振动信号分解 成一系列IMF分类;(2)将IMF分类的样本赌作为信号的特征向量;(3)将CEEMD-样本赌所得 的特征向量作为随机森林分类器的输入进行故障诊断。该方法流程如下:
[0025] 1.基于CEEMD-Samp化的特征提取过程
[0026] 1.1CEEMD 方法
[0027] C邸MD是在EMD算法基础上提出的一种改进方法。EMD是利用信号的局部特征自适 应的将非线性非平稳信号分解成一系列IMF分量之和残余量,即:
[002引
[0029] 式中:N代表在给定精度下IMF分类的个数,IMFi代表包含不同频率成分的IMF分 量。rN是在N次分解后的残余量。从EMD分解所得的IMF分量从高频到低频排列。
[0030] 在EMD分解方法中,良好的IMF分量的取得与待分解信号的极值点有很大的关系。 如果信号中极值点不够多,EMD分解将停止;如果待分解信号极值点不够均匀时,将会出现 模态混叠的现象。但是,白噪声却可W弥补运一缺点,原因如下:同幅值随机高斯白噪声,如 果进行多次试验,然后把各次实验结果叠加起来,就可W使添加的白噪声相互抵消。利用运 一特性,在待分解信号中添加高斯白噪声,可W使信号连续性更好,极值点分布更加合理、 均匀,更利于EMD分解的进行,得到最佳的IMF分量,最后通过叠加的方式消除所添加高斯白 噪声的干扰。
[0031 ] 作为EMD的改进方法,CEEMD的分解流程如下:
[0032] (1)在原始信号中加入不同的噪声并通过EMD重复分解过程I次,计算总体平均值 并将其定义为目标信号X的第一个IMF分量,即:
[0033]
[0034] 运里,x(t)是原始信号,wi(t)是单位方差的零均值高斯白噪声,N是,N书,σ系数允 许在每个阶段选择信噪比。
[00巧](2)计算一阶残差:
[0036] ri(t) =x(t)-Ci(t),
[0037] 然后,将ri(t)+地i[Wi(t)](i = l,2,-',N)作为新的信号并继续分解直到信号满足 第一个IMF的条件,并定义总体平均值作为第二个IMF分量,定义其为C2(t):
[00;3 引
[0039] (3)重复第一步和第二部直到第(n+1)个IMF分量Cn+i(t)被获得,即:
[0042] 上式表面原始信号得到了精确重构,该方法是一个完备的分解方法。
[0043] 1.2样本赌
[0044] 设原始数据序列为x(l),x(2),…,x(N),共N个数据点,计算该序列样本赌的步骤 如下:
[0045] (1)给定模式维数m,由原序列组成m维矢量X(i) = {x(i),x(i+l),···,x(i+m-l)}(i = 1,2,···,Ν-Μ+1);
[0046] (2)定义X(i)与X(j)之间的距离,
[0047]
[004引(3)给定阔值r,对每一个i值统计d(i,j)<r的数目(称为模板匹配数)及此数目与 距离总数N-m+1的比值,记为马"(r),
[0049]
[0050] 其中:i《j《N-m,j声i,求其对所有i的平均值,
[0化1 ]
[0052] (4)再对 m+1 重复(1)-(3)步,得到 Bm+i(r);
[0化3] (5)理论上,此序列的样本赌为:
[0化4]
[0055]当N取有限值时,可得到序列长度为N时的样本赌估计值为:
[0化6]
[0化7] 1.3随机森林分类器原理
[005引传统的分类模型的构建往往过于依赖训练数据,容易出现过拟合的现象,并且很 多情况下传统分类模型的准确率不好。随机森林是一种统计学理论,它采用Bagging重抽样 的方式从原始样本中抽取多个样本,将每个样本作为训练数据集来构建一颗决策树,最后 组合多颗决策树的分类结果,通过投票得到该随机森林分类器的分类结果。
[0059] 随机森林分类(RFC)是由很多决策树分类模型化村,0〇,4=1,-,}组成的组合分 类模型,且参数集{0k}是独立同分布的随机向量,在给定自变量X下,每个决策树分类模型 都由一票投票权来选择最优的分类结果。RFC的基本思想:首先,利用bootsrtap抽样从原始 训练集抽取k个样本,且每个样本的样本容量都与原始训练集一致;其次,对k个样本分别建 立k个决策树模型,得到k种分类结果;最后,根据k中分类结果对每个记录进行投票表决觉 得其最终分类,见图2。
[0060] RF通过构造不同的训练集增加分类模型间的差异,从而提高组合分类模型的外推 预测能力。通过k轮训练,得到一个分类模型序列化1村),112口),-,,111^村)},再用他们构造一 个多分量模型系统,该系统的最终分类结果采用简单多数投票发。最终的分类决策:
[0061]
[0062] 其中,H(x)表示组合分类器模型,hi是单个决策时分类模型,Y表示输出变量(或称 目标变量),1( ·)为示性函数。
[0063] 本发明应用案例介绍如下:
[0064] 2.1数据准备
[0065] 加速度传感器安装在电机外壳轴承座的正上方,对离屯、累进行故障注入,并采集 其各种故障模式下的诊断数据,实验工作转轴为2900/分钟(即n = 2900r/min),采样频率为 10239Hz。震动信号采集自W下安装加速度计,采样频率10.24kHZ。
[0066] 在该实验中,五种常见的故障在离屯、累中被设置,即正常模式、滚动体故障、内环 故障,外环故障、离屯、累叶轮故障。对于每种故障模式来说,采集20组样本,前八组用于训练 后12组用于测试。
[0067] 2.2基于CEEMD样本赌的离屯、累特征提取
[0068] CEEMD将不同故障模式下的震动信号分解。加入噪声的标准偏差被设定为0,0.05, 0.15,0.2用于对比。作为举例,图3为内环故障CEEMD分解图。
[0069] 为了得到故障特征,样本赌被用于量化前五个IMF分类用已经建立好的参数值m = 2和r = 0.2stcLW比率0.1为例,不同故障模式下每个IMF分量的值列在下表中。比较每种故 障模式,我们发现样本赌的值明显随着不同的故障模式变化,可W反映不同故障类型的不 同复杂度。然后,为了辨别每种故障模式,特征向量应于分类器有效结合。
[0070] 表1不同故障模式IMF分类的样本赌
[0071]
[0072] 2.3基于随机森林的故障分类
[0073] 在该部分,随机森林被用于辨别离屯、累的不同故障模式:辨别准确率如下:
[0074] 表2诊断结果
[0075]
[0076] 如表2中所示,故障准确率从94.58 % 97.08 %变化,验证了提出方法的有效性。在 比例为0的CEEMD分解即为EMD。当比率为0.1的时候有着最高的准确率为97.08%。
【主权项】
1. 一种基于完备总体经验模态分解与随机森林的离心栗故障诊断方法,其特征在于: 该方法包括: (1) 利用CEEMD将传感器所获得的离心栗振动信号分解成一系列頂F分类; (2) 将IMF分类的样本熵作为信号的特征向量; (3) 将CEEMD-样本熵所得的特征向量作为随机森林分类器的输入进行故障诊断。2. 根据权利要求1所述的一种基于完备总体经验模态分解与随机森林的离心栗故障诊 断方法,其特征在于:步骤(1)中所述的利用CEEMD将传感器所获得的离心栗振动信号分解 成一系列MF分类具体包括:加速度传感器安装在离心栗的电机外壳轴承座的正上方,对离 心栗进行故障注入,并采集加速度传感器在各种故障模式下的离心栗振动信号,将所采集 的每种故障模式下的若干组数据进行CEEMD分解,CEEMD可以将离心栗振动信号自适应分解 为若干頂F分量。3. 根据权利要求1所述的一种基于完备总体经验模态分解与随机森林的离心栗故障诊 断方法,其特征在于:步骤(2)中所述的将IMF分类的样本熵作为信号的特征向量具体包括: 取CEEMD分解的前5个IMF分量,以样本熵作为衡量IMF复杂度的量化参数,并作为特征向量。4. 根据权利要求1所述的一种基于完备总体经验模态分解与随机森林的离心栗故障诊 断方法,其特征在于:步骤(3)中所述的将CEEMD-样本熵所得的特征向量作为随机森林分类 器的输入进行故障诊断具体包括:将步骤(2)得到的所述的特征向量作为随机森林分类器 进行故障模式识别,从每种故障模式下的若干组数据中任意选取部分组进行训练,其余组 作为测试样本,得到结果后,将测试标签与实际标签进行比对,并计算准确率。
【文档编号】F04D15/00GK105971901SQ201610286142
【公开日】2016年9月28日
【申请日】2016年5月3日
【发明人】吕琛, 王洋, 秦维力, 周博, 赵万琳
【申请人】北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1