一种基于概率包络的轮对轴承故障诊断方法与流程

文档序号:16082236发布日期:2018-11-27 21:58阅读:178来源:国知局

本发明涉及一种基于概率包络的轮对轴承故障诊断方法,属于故障检测技术领域。



背景技术:

在城市轨道交通迅速发展的今天,轮对轴承作为列车运行的核心部件,因为长期处在高速运转的工作环境下,导致轮对轴承极易产生损坏,在列车高速运行情况下,一旦轴承发生故障将造成车辆延误,若对故障发现不及时并且没有采取相应有效措施,必定会导致热轴、燃轴、切轴等重大事故,甚至是引发重大的人员伤亡等问题,因此,对列车轮对轴承故障检测与诊断研究是十分必要的,是一个值得研究的重要问题。随着轮对轴承之间的耦合性越来越高,造成故障的原因也多为多重原因,轮对轴承信号的采集也是多方面的,采集到的故障信号信息也存在不确定性,即便符合某种分布,很可能也存在波动情况。例如轴承振动信号符合正态分布,但其均值在[a,b]之间,方差在[c,d]之间漂移(其中a,c为区间上边界,a,d为区间下边界)。另外,在对原始信号进行特征提取会带来特征以外的信息缺失问题。对于这种情况,采用传统方法,简单使用分布函数来代替或者用区间来表达都不合适,都存在无法完整描述、信息丢失的问题。



技术实现要素:

本发明要解决的技术问题是提供一种基于概率包络的轮对轴承故障诊断方法,在对原始轮对轴承信号分布类型检验的基础上,建立概率包络模型,提取其几何形状特征作为SVM的输入,训练并得到诊断模型。同时,方法可操作性强,实用性强,不仅在列车轮对轴承故障上具有较好的应用性,而且可以应用于其他类型的机械故障诊断中。

本发明采用的技术方案是:一种基于概率包络的轮对轴承故障诊断方法,包括以下步骤:

步骤1、将采集到的正常轴承数据和故障轴承数据分别进行时频域概率分布对比,判别其分布类型,使用MATLAB模型对采集到的数据进行数据样本分布类型检验,在该模型中使KS检验,*表示分布类型,H为原假设,当H=0时表示采集到的数据满足*分布类型,当H≠0时表示采集到的数据不满足*分布类型,进而将采集到的数据进入下一次的分布测试,直至得到满足的分布类型,如正态分布对应的是均值参数μ和方差参数σ,指数分布对应的是指数参数λ;

步骤2、若原始数据满足某种分布类型则采用基于原始参数概率分布类型的OPPEM建模方法进行建模,即分别获取这些参数的不确定性区间,取参数的最大值、最小值并将[min,max]作为参数区间,按照{([x1,y1],m1),([x2,y2],m2),…,([xn,yn],mn)}结构将获取参数区间进行离散化建立DSS结构体,Dempster-Shafer Structure,简称DSS,是由有限个焦元组成,每个焦元是由一个区间和相应区间对应的信度组成,每个焦元([xi,yi],mi)满足以下条件xi≤yi且∑mi=1,其中i=1,2,…,n,m为信度值,x,y为区间上下界,将DSS结构体的各焦元区间的下边界值按照公式累积叠高可以得到概率包络下边界,区间的上边界值按照公式累积叠高可以得到概率包络的上边界,带入概率分布函数其中来表示CDF上界,Y(x)来表示CDF下界,从而获取概率包络;

步骤3、若原始数据不能确定其分布类型则提取时频域特征,在特征选择方面,采用歪度和峭度作为特征向量,其中N为数据量,xi为测得数据,x为均值,Xrms为均方值,即根据采样频率将数据分为若干组,获得每组数据的歪度或峭度,确定歪度或峭度数据的概率分布类型,然后判别所提取特征的分布类型;

步骤4若提取出的特征满足某种分布类型则采用基于特征参数概率包络的CPPEM建模方法进行建模,如提取出的歪度数据满足正态分布则确定歪度数据的均值和方差的DSS结构体,并且对DSS进行离散化,然后将离散化的DSS上界和下界分别累和得到概率包络的上界和下界,过程与步骤2一致;

步骤5、若提取出的特征不满足则采用基于概率包络定义的DPEM建模方法进行建模,即将原始数据按采样频率转化为m行n列的数组,其中m为采样次数,n为采样频率,截除多余数据;将每次采样数据按从小到大的次序排列,得到新的数组;从m次采样数据中找到每列中的最小值和最大值,分别得到一个最小值和最大值的行向量,分别累加最小值行向量和最大值行向量得到概率包络的下界和上界;

步骤6、通过累积不确定度测量的方法实现对概率包络建模后的特征提取,针对概率包络的几何形状,有以下6种特征:

(A)利用对所有焦点元素区间权重的基本概率分布获得累积宽度,具体提取过程如下:

(1)将概率包络离散化(DSS结构体),假如可以离散n份;

(2)将上界值减去下界值xi并取绝对值,再乘以其对应的信度值m,可以得到n个值;

(3)将得到的n个值进行累积求和;

即为

(B)利用对所有焦点元素区间权重的基本概率分布获取累积对数宽度,其求取过程与(A)类似,只是将第二步改为上界值减去下界值取绝对值后再求对数,然后再乘以其对应的信度值m,即为

(C)利用累积区间边界权重值的基本概率分布获取概率包络下限和上限,求取过程如下:

(1)将概率包络离散化成多个DSS结构体;

(2)分别将上界值和下界值乘以其对应的信度值m,可以得到多个组区间;

(3)将得到的多个组区间边界值进行累积求和,即可得到累积区间;

即为

(D)在累积分布函数的条件值下,获取概率包络的上界和下界的累积边界值,假设构成概率包络的如果累计分布函数值α表示为则概率包络下界和上界的累计边界值为

(E)利用累积区间边界权重值的基本概率分布获得概率包络的下界和上限,累积的不确定测量结果可以被表达为其中c1'和c2'表示DSS的左右边界的平均概率统计;

(F)获得1作为基数的累积对数宽度,用基本概率分布计算所有焦点单元的权重区间,具体过程与(B)类似,只是用1减去上界值减去下界值取绝对值取对数,再乘以相对应的信度值m,即为

步骤7、将提取出来的特征向量作为SVM的输入,采用支持向量机方法对特征向量进行故障分类,具体过程如下:

(1)将提取出的特征向量建立训练数据和测试数据;

(2)归一化训练数据和测试数据;

(3)交叉验证选定SVM超参数和核函数;

(4)输入训练数据得到训练模型;

(5)将测试数据送入训练模型中,得到分类结果。

具体地,所述的步骤2中,概率包络即可表达随机不确定性也可表达认知不确定性,概率包络的定义为:当一个随机变量X,它的估计值不是一个精确的点估计时,其CDF则无法用单一曲线来表达,假设用来表示CDF上界,Y(x)来表示CDF下界,表示随机变量X的低概率测度,其中Y(x)=P(X≤x),因为变量X的每个点计算一次都能得到一个最小和一个最大面积的值,把所有最大和最小面积值按点的方式描绘于坐标图中,然后将最小值的点连成一条线,得到Y(x),将最大值的点连成一条线,得到最终得到概率包络。

本发明的有益效果是:

1.本发明利用概率包络对数据进行建模,较好的包容了轮对轴承故障诊断中存在的不确定性问题,防止了特征提取时的信息丢失现象。

2.本发明提取出概率包络的特征量作为后续诊断的特征不仅可以增加诊断精度而且可以降低因为原数据过大造成的诊断时间过长的问题。

附图说明

图1为本发明方法的流程示意图;

图2为数据分布类型判断示意图;

图3为概率包络示意图;

图4为概率包络的等信度离散化示意图;

图5为轴承正常信号的时域波形;

图6为轴承正常信号的频域波形;

图7为轴承内圈故障信号的时域波形;

图8为轴承内圈故障信号的频域波形;

图9为正常轴承概率包络建模图像;

图10为内圈故障轴承概率包络建模图像。

具体实施方式

为了使技术人员对本发明的流程、目的更加明白,下面结合附图和实施例对本发明做进一步说明。

实施例1:如图1-10所示,一种基于概率包络的轮对轴承故障诊断方法,包括以下步骤:

步骤1、将采集到的正常轴承数据和故障轴承数据分别进行时频域概率分布对比,判别其分布类型,如图2所示,使用MATLAB模型对采集到的数据进行数据样本分布类型检验,在该模型中使KS检验(Kolmogorov-Smirnov是基于累计分布函数,用于检验一个经验分布是否符合某种理论分布或者比较两个经验分布是否有显著性差异的检验方法),*表示分布类型,H为原假设,当H=0时表示采集到的数据满足*分布类型,当H≠0时表示采集到的数据不满足*分布类型,进而将采集到的数据进入下一次的分布测试,直至得到满足的分布类型,如正态分布对应的是均值参数μ和方差参数σ,指数分布对应的是指数参数λ;

步骤2、若原始数据满足某种分布类型则采用基于原始参数概率分布类型的OPPEM建模方法进行建模,即分别获取这些参数的不确定性区间,取参数的最大值、最小值并将[min,max]作为参数区间,如图4所示,按照{([x1,y1],m1),([x2,y2],m2),…,([xn,yn],mn)}结构将获取参数区间进行离散化建立DSS结构体,Dempster-Shafer Structure,简称DSS,是由有限个焦元组成,每个焦元是由一个区间和相应区间对应的信度组成,每个焦元([xi,yi],mi)满足以下条件xi≤yi且∑mi=1,其中i=1,2,…,n,m为信度值,x,y为区间上下界,将DSS结构体的各焦元区间的下边界值按照公式累积叠高可以得到概率包络下边界,区间的上边界值按照公式累积叠高可以得到概率包络的上边界,带入概率分布函数其中来表示CDF上界,Y(x)来表示CDF下界,从而获取概率包络;

步骤3、若原始数据不能确定其分布类型则提取时频域特征,在特征选择方面,采用歪度和峭度作为特征向量,其中N为数据量,xi为测得数据,为均值,Xrms为均方值,即根据采样频率将数据分为若干组,获得每组数据的歪度或峭度,确定歪度或峭度数据的概率分布类型,然后判别所提取特征的分布类型;

步骤4若提取出的特征满足某种分布类型则采用基于特征参数概率包络的CPPEM建模方法进行建模,如提取出的歪度数据满足正态分布则确定歪度数据的均值和方差的DSS结构体,并且对DSS进行离散化,然后将离散化的DSS上界和下界分别累和得到概率包络的上界和下界,过程与步骤2一致;

步骤5、若提取出的特征不满足则采用基于概率包络定义的DPEM建模方法进行建模,即将原始数据按采样频率转化为m行n列的数组,其中m为采样次数,n为采样频率,截除多余数据;将每次采样数据按从小到大的次序排列,得到新的数组;从m次采样数据中找到每列中的最小值和最大值,分别得到一个最小值和最大值的行向量,分别累加最小值行向量和最大值行向量得到概率包络的下界和上界;

步骤6、通过累积不确定度测量的方法实现对概率包络建模后的特征提取,针对概率包络的几何形状,常用的特征有以下6种:

(A)利用对所有焦点元素区间权重的基本概率分布获得累积宽度,具体提取过程如下:

(1)将概率包络离散化(DSS结构体),假如可以离散n份;

(2)将上界值减去下界值xi并取绝对值,再乘以其对应的信度值m,可以得到n个值;

(3)将得到的n个值进行累积求和;

即为

(B)利用对所有焦点元素区间权重的基本概率分布获取累积对数宽度,其求取过程与(A)类似,只是将第二步改为上界值减去下界值取绝对值后再求对数,然后再乘以其对应的信度值m,即为

(C)利用累积区间边界权重值的基本概率分布获取概率包络下限和上限,求取过程如下:

(1)将概率包络离散化成多个DSS结构体;

(2)分别将上界值和下界值乘以其对应的信度值m,可以得到多个组区间;

(3)将得到的多个组区间边界值进行累积求和,即可得到累积区间;

即为

(D)在累积分布函数的条件值下,获取概率包络的上界和下界的累积边界值,假设构成概率包络的如果累计分布函数值α表示为则概率包络下界和上界的累计边界值为

(E)利用累积区间边界权重值的基本概率分布获得概率包络的下界和上限,累积的不确定测量结果可以被表达为其中c1'和c2'表示DSS的左右边界的平均概率统计;

(F)获得1作为基数的累积对数宽度,用基本概率分布计算所有焦点单元的权重区间,具体过程与(B)类似,只是用1减去上界值减去下界值取绝对值取对数,再乘以相对应的信度值m,即为

步骤7、将提取出来的特征向量作为SVM的输入,采用支持向量机方法对特征向量进行故障分类,具体过程如下:

(1)将提取出的特征向量建立训练数据和测试数据;

(2)归一化训练数据和测试数据;

(3)交叉验证选定SVM超参数和核函数;

(4)输入训练数据得到训练模型;

(5)将测试数据送入训练模型中,得到分类结果。

进一步地,所述的步骤2中,概率包络即可表达随机不确定性也可表达认知不确定性,概率包络的定义为:当一个随机变量X,它的估计值不是一个精确的点估计时,其CDF则无法用单一曲线来表达,假设用来表示CDF上界,Y(x)来表示CDF下界,表示随机变量X的低概率测度,其中Y(x)=P(X≤x),因为变量X的每个点计算一次都能得到一个最小和一个最大面积的值,把所有最大和最小面积值按点的方式描绘于坐标图中,然后将最小值的点连成一条线,得到Y(x),将最大值的点连成一条线,得到最终得到概率包络,如图3所示。

举例说明:下面结合一个具体的例子,对本发明进行详细说明。

一种基于概率包络的轮对轴承故障诊断方法,按照下面步骤进行:

步骤1、将加速传感器安装在轴承上,四个轴承安在轴上,将6000磅的径向载荷通过弹簧机构施加到轴和轴承上,旋转速度通过经由摩擦带耦合到轴的AC马达保持恒定在2000RPM,采样频率为1024HZ,通过数据采集装置采集点击轴承振动数据信号,并将信号输入计算机。

步骤2、如图5—图8所示,分别选取正常轴承和内圈故障情况下的信号各60000条构成测试数据,利用MATLAB对原始故障信号进行傅里叶分析后的时域波形和频谱图。

由图5—图8可知,因为各传感器检测信号较为复杂,采集到的信号中常包含背景噪声和不确定性,这就导致故障特征提取不准确,因而降低了故障诊断的精确度。

步骤3、利用MATLAB进行原始数据分布类型测试,根据不同的分布类型采用不同的建模方式进行概率包络建模,通过分布类型检验此次试验采用OPPEM建模方法,选取采样点和采样次数分别为32和30,将数据截取到30×32,并保存到行向量中,通过reshape函数转化为一个30行32列的矩阵中,通过max函数和min函数获取矩阵中同一列不同行的最大值和最小值,对获取到的最大最小值行向量所对应的数据点,分别累加最小值行向量和最大值行向量得到概率包络的下界和上界经过离散化,得到如图9和图10所示的正常轴承和故障轴承概率包络。

由图9和图10可以看出,当轴承出现故障时构建的概率包络模型不能形成光滑的曲线将其包裹,从而经过概率包络建模后的信号降低了因噪声干扰和数据不确定性带来的问题。

步骤4、本发明分别从正常轴承和内圈故障轴承中每300条数据为一组共200组,每组分别提取概率包络特征根据累积宽度矛盾区间累积区间对数累积宽度和权重区间分别对经过概率包络建模后的正常轴承和内圈故障轴承提取出其特征向量如表1和表2所示。

表1正常轴承特征向量

表2内圈故障特征向量

步骤5、根据(x与xj为样本值,σ>0为高斯核函数的带宽)选定SVM的核函数为高斯核函数,并采用K折交叉验证的方法寻求出最恰当的参数值,其中K设为5,最终确认SVM参数C为和σ值分别为100和0.01。

步骤6、将提取出的特征值2/3用于SVM的训练数据,1/3用于模型建立后的故障识别,诊断结果表明诊断精度可以达到99.3%,突显出本发明采用概率包络进行不确性建模和故障特征提取的方法有效性。

以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1