一种不均衡数据svm轴承故障检测方法

文档序号:6008580阅读:153来源:国知局
专利名称:一种不均衡数据svm轴承故障检测方法
技术领域
本发明涉及的是一种轴承故障的检测方法。
背景技术
在工业领域中,滚动轴承对整体机械设备的影响是至关重要的,机械运行过程中对滚动轴承的工作状态进行实时监测,能够有效地确保整体机械设备运行的安全性。目前,轴承故障检测最常用的方法是神经网络方法,但是神经网络方法容易出现维数灾难、局部极值等问题,检测效果往往不是很理想。支持向量机(support vector machine :SVM)是建立在基于统计学习理论和结构风险最小化基础上的一种新型学习方法。相对于传统的智能学习方法,SVM能够较好地解决维数灾难、小样本学习、非线性和局部极值等问题,特别是由于SVM在小样本学习方面展现的良好的泛化性能,使得SVM在滚动轴承故障检测领域中具有广泛的应用。SVM是有监督学习方法,对均衡数据的检测效果最为理想。但由于滚动轴承的故障数据难以获得,训练数据集往往是不均衡的,故障样本为SVM检测器提供的信息较少,导致故障样本容易被错分,从而增加了故障的漏检率。因此,目前多采用将不均衡数据转化为均衡数据的方法来训练SVM检测器。实现数据均衡的方法有以下几种第一种方法是故障样本过采样法,目前使用最多的是该方法,但该方法增加了故障样本数的同时容易产生大量的重复信息,并且在正常样本中存在着大量的冗余信息和噪声会对SVM检测器产生负面影响;第二种方法是正常样本欠采样法,目前常用的欠采样法是随机欠采样法,但该方法减少正常样本数的同时存在较大的随机性,容易丢失正常样本中的有用信息,并且去除冗余信息和噪声并不彻底。

发明内容
本发明的目的在于提供具有较强的去除正常状态样本中的冗余信息和噪声能力的一种不均衡数据SVM轴承故障检测方法。本发明的目的是这样实现的本发明一种不均衡数据SVM轴承故障检测方法,其特征是(1)利用安装在感应电动机输出轴的传感器收集振动信号;(2)利用互信息函数指标和虚假最近邻点法来确定嵌入维数和延迟的时间间隔, 采用时间延迟技术重构正常样本相空间,故障类型的样本在所述的正常样本空间的投影系数为故障特征;(3) α表示需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,取α初值为0.3,利用α的初定值与训练样本中正常类样本数目和故障类样本数目之间的差值分别确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,达到训练数据集均衡;(4)利用步骤(3)均衡后的训练数据集对SVM检测器进行训练,调整α值进行均衡数据的处理再放入SVM检测器进行训练,直至检测性能指标达到0. 6,所述的检测性能指标为几何平均率G = λ/Λ^Ρ,其中P是正常样本检测正确率,N是故障样本检测正确率;(5)对于待测试的轴承数据样本,将其输入到训练好的SVM检测器中,得到滚动轴承的工作状态,实现滚动轴承故障检测。本发明的优势在于本发明将ODR和BSMOTE方法相结合对数据样本采样进行改进,具有较强的去除正常状态样本中的冗余信息和噪声能力,进而提高不均衡数据SVM轴承故障检测器的检测性能。


图1为本发明的流程图;图2为BSMOTE算法的流程图;图3为ODR算法的流程图;图4为不同比例内圈故障数据各种方法G性能比较图;图5为不同比例外圈故障数据各种方法G性能比较图;图6为不同比例滚动体故障数据各种方法G性能比较图。
具体实施例方式下面结合附图举例对本发明做更详细地描述结合图1 6,本发明一种不均衡数据SVM轴承故障检测方法,包括以下步骤(1)利用安装在感应电动机输出轴的传感器收集振动信号;(2)利用互信息函数指标和虚假最近邻点法来确定嵌入维数和延迟的时间间隔, 采用时间延迟技术重构正常样本相空间,故障类型的样本在所述的正常样本空间的投影系数为故障特征;(3) α表示需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,取α初值为0.3,利用α的初定值与训练样本中正常类样本数目和故障类样本数目之间的差值分别确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,达到训练数据集均衡;(4)利用步骤(3)均衡后的训练数据集对SVM检测器进行训练,调整α值进行均衡数据的处理再放入SVM检测器进行训练,直至检测性能指标达到0. 6,所述的检测性能指标为几何平均率G = λ/Λ^Ρ,其中P是正常样本检测正确率,N是故障样本检测正确率;(5)对于待测试的轴承数据样本,将其输入到训练好的SVM检测器中,得到滚动轴承的工作状态,实现滚动轴承故障检测。BSMOTE算法的流程如图2,具体过程如下定义训练数据集是S,故障样本集是F = {f1; f2, ,fn}。al.计算每一个故障样本fi(i = 1,2, ·η)在训练数据集S中的k个最近邻,然后利用这k个最近邻样本对F中的样本进行归类如果这k个最近邻样本全是正常样本,那么认为该样本为噪声样本,将它保存在N'集合中;反之如果k个最近邻样本都是故障样本, 则认为该样本是远离分类边界样本将其保存在S'集合中;如果这k个最近邻样本中既有故障样本又有正常样本,则认为该样本是边界样本,存放在B集合中。
a2.设B={f' 1; f' 2,· f' J,计算集合 B 中每一个样本 f' i;i = l,2,.b 在故障样本集合F中的k'个最近邻fij; j = 1,2,,然后随机选出s(l<s<b)个最近邻样本,分别求出它们与该样本之间全部属性的差值Clij, =Clij, = f ‘ ^fij, , j' =1, 2,· s,并乘以一个随机数IV,IV e (0,1)(如果&.,是&集合或是S'集合中的样本则 Iv e (0,0.5))。最后合成的人工故障样本为Iiij, = f/ +rjj, Xdij,,j' = 1,2,· s。a3.重复步骤a2中人工故障样本的生成过程,直到生成的故障样本数目满足要求后,算法结束。ODR算法流程如图3,具体过程如下定义训练样本集为T,正常样本集为N,ρ是正常样本,即是N集中的样本,我们定义 P的关联集是指N集中的其余样本的k个最近邻中含有样本P的样本集合,关联集用Ap = {npl,np2,·ηρη}表示,其中ρ为npi (npi e Ap)的最近邻。对立样本指的是样本类型和ρ不一致的样本。bl.利用K值最近邻算法寻找训练样本集T中每一个样本的t个最近邻,建立每一个样本的最近邻链表,根据所有样本的最近邻链表创建正常样本的关联集链表。b2.正常样本集N中的每一个样本p,对ρ的关联集中的样本根据K值最近邻算法进行分类,正确分类的个数记Withp ;接着将样本P从这些样本的最近邻链表中删除,使用这些样本各自的第t+Ι个最近邻代替,此时能够被K值最近邻算法正确分类的个数,记 withoutp。b3.根据withp和withoutp的值确定是否删除样本ρ 假如withp彡withoutp,则认为删除P后对训练样本集T分类的影响较小,反之Withp > withoutp时,认为删除P对分类的影响较大。b4.计算正常样本集N中每一个样本在训练样本集T中距离最近的对立样本,并求出两者之间的欧式距离d' p。b5.最后根据withp-withoutp的值从大到小对正常样本进行排列(只在 Withp-Withoutp彡O的情形下),假如两个正常样本的Withp-Withoutp值相同,则按各自的d' p值从大到小的顺序将其排列,然后依次删除正常样本,直到正常样本的数目达到指定的数目时,则算法结束。根据上述检测步骤,本发明采用滚动轴承四种运行状态的实验数据来源于美国 Case Western Reserve University的电气工程实验室,该数据的故障检测特征是由正常样本、外圈故障样本、内圈故障样本和滚动体故障样本四种5维矢量组成,为保证检测器的通用性,将实验数据样本分为正常样本和故障样本,并且实验数据分为训练数据和测试数据。检测性能指标几何平均率G :G = λ/Λ^Ρ,其中P是正常样本检测正确率,N是故障样本检测正确率,指标G综合考虑了正常类和故障类两类样本的检测性能。具体数据选取2000个正常样本,分别以2 1,5 1,10 1,20 1,50 1, 100 1的比例来选取外圈故障、内圈故障和滚动体故障数据进行训练,测试数据分别是 5000个正常样本,1000外圈故障样本,1000内圈故障样本和1000个滚动体故障样本,利用训练样本得到SVM滚动轴承故障检测器,同时对测试样本进行检测判断,得到测试样本的检测结果。将标准的SVM算法、基于SVM和BSMOTE过采样算法相结合的算法(BSM0TE-SVM)、 基于SVM和SMOTE算法相结合的算法(BSM0TE-CSVM)以及本发明提出的方法进行对比,得出对比图,图4表示不同比例内圈故障数据各种方法G性能比较,图5表示不同比例外圈故障数据各种方法G性能比较,图6表示不同比例滚动体故障数据各种方法G性能比较。SVM 算法选择高斯核函数,宽度为1,BSMOTE和SMOTE算法的k值是5,BSMOTE算法的k'值为 5,s为3,惩罚常数C= 1000,初始α值为0. 3。为了测试本发明在实际当中的泛化能力,训练样本选取正常数据样本2000个,故障样本分别由200个内圈故障样本,200个外圈故障样本和200个滚动体故障样本,测试样本为正常样本2000个,故障样本是1000个内圈故障样本,1000个外圈故障样本和1000个
滚动体故障样本,参数设置同上。检测结果从图4、5、6均可以看出,随着不均衡数据比例的增大,本发明提出的基于逐级优化递减和BSMOTE的不均衡数据SVM轴承故障检测器关于指标G好于其它两种过采样的方法,检测性能明显提高。这是由于随着不均衡数据比例增大,正常样本中的冗余信息和噪声也随着增加,但该算法利用ODR算法能够去除正常样本中的冗余信息和噪声样本,大大提高了 SVM检测器的检测性能。从表1中可以看出本发明在不均衡数据下具有较强故障检测的泛化能力。表 权利要求
1. 一种不均衡数据SVM轴承故障检测方法,其特征是(1)利用安装在感应电动机输出轴的传感器收集振动信号;(2)利用互信息函数指标和虚假最近邻点法来确定嵌入维数和延迟的时间间隔,采用时间延迟技术重构正常样本相空间,故障类型的样本在所述的正常样本空间的投影系数为故障特征;(3)α表示需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,取α初值为0.3,利用α的初定值与训练样本中正常类样本数目和故障类样本数目之间的差值分别确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,达到训练数据集均衡;(4)利用步骤C3)均衡后的训练数据集对SVM检测器进行训练,调整α值进行均衡数据的处理再放入SVM检测器进行训练,直至检测性能指标达到0. 6,所述的检测性能指标为几何平均率G : G = λ/Λ^Ρ,其中P是正常样本检测正确率,N是故障样本检测正确率;(5)对于待测试的轴承数据样本,将其输入到训练好的SVM检测器中,得到滚动轴承的工作状态,实现滚动轴承故障检测。
全文摘要
本发明的目的在于提供一种不均衡数据SVM轴承故障检测方法,包括以下步骤收集振动信号,确定嵌入维数和延迟的时间间隔,重构正常样本相空间,确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,对SVM检测器进行训练,调整需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,再放入SVM检测器进行训练,直至检测性能指标达到0.6,将待测试的轴承数据样本输入到SVM检测器中,实现滚动轴承故障检测。本发明对数据样本采样进行改进,具有较强的去除正常状态样本中的冗余信息和噪声能力,进而提高不均衡数据SVM轴承故障检测器的检测性能。
文档编号G01H17/00GK102254177SQ20111010184
公开日2011年11月23日 申请日期2011年4月22日 优先权日2011年4月22日
发明者宋少宇, 童智靖, 陶新民 申请人:哈尔滨工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1