一种基于IWO-KFCM算法的轴承时频谱图识别方法与流程

文档序号:20876107发布日期:2020-05-26 16:33阅读:322来源:国知局
一种基于IWO-KFCM算法的轴承时频谱图识别方法与流程

本发明属于图像处理、机械故障诊断技术领域,尤其是涉及一种基于iwo-kfcm算法的轴承时频谱图识别方法。



背景技术:

滚动轴承是旋转机械中最常见并且是很关键的机械部件,广泛应用于家庭和工业设备中。由于轴承通常在恶劣的工作环境中工作,因此它们在工作中很容易发生故障。如果不及时发现故障,可能会导致机器意外停机,甚至导致灾难性的损坏。因此,有必要采取一种检测方式检测滚动轴承的健康状态,识别是否发生故障,以及故障的类型和故障的严重程度,进而采取必要的措施,防止轴承的进一步损坏,确保设备及时的修整,安全的运行。

随着模式识别技术的发展,将机械设备的振动信号转化为时频谱图进行智能识别的研究不断深入。时频谱图的本质是图像,既具备构成图像本身的数字信息,也有颜色、像素、纹理、灰度和形状等图形信息,这些信息暗含了设备的运行状态及差异。对状态图像进行识别首先需要有效地提取图像特征,近年来,有关时频谱图特征提取的研究层出不穷,如二维线性判别分析、二维主成分分析、二维非负矩阵分解等图像压缩算法,如提取不变矩特征、纹理特征等特征提取方法,这些方法解决了因图像维数巨大导致诊断困难的难题。

其中,聚类分析是一种针对样本相似性进行类别划分的数值方法,目前已广泛应用于模式识别、数据挖掘、图像处理等领域。常用的聚类分析算法有:c均值聚类、模糊c均值聚类(fuzzyc-means,fcm)、模糊核聚类(kernelfuzzyc-means,kfcm)。fcm算法通过引入隶属度对c均值聚类的模式归属进行软化,克服了其准则函数不可微的缺点;kfcm算法在fcm算法基础上引入核函数,将低维非线性特征投影至高维空间,克服了fcm算法对噪声野值点敏感的缺陷,提高了算法鲁棒性。不过两种算法依然存在对初始值敏感和易陷入局部最优的缺点;同时聚类算法具有无监督性。在机械诊断领域,许多学者研究利用已知标签的样本指导未知样本进行聚类分析,提出半监督式的聚类方法。

虽然现有技术有关时频谱图特征提取的研究层出不穷,但是不能更加有效地提取图像纹理特征并实现差异特征选择,聚类效果不够好,无法实现初始聚类中心的优化。其次,以上所述的kfcm算法、半监督kfcm算法,其鲁棒性和聚类精度还不够好,计算效率和聚类性能还有待提高,因此有必要予以改进。



技术实现要素:

本发明的目的是针对上述现有技术存在的不足,提供一种基于iwo-kfcm算法的轴承时频谱图识别方法,它能够有效提取图像纹理并实现差异特征选择,通过杂草算法(iwo),实现初始聚类中心的优化,具有良好的鲁棒性和聚类精度,其计算效率和聚类性能得到很大提升。

为了实现上述的目的,本发明所采用的技术方案是:一种基于iwo-kfcm算法的轴承时频谱图识别方法,包括步骤如下:

步骤1、数据采集、类别标记:设计旋转机械设备的故障实验,采集轴承在不同载荷、不同故障位置、不同故障程度下的振动信号,对各类状态信号进行截取、状态标记,形成已知状态类别的信号数据集和未知状态类别的信号数据集;

步骤2、获取灰度化的时频谱图:对已知状态信号数据集和未知状态信号数据集进行时频分析,获得时频谱图像并对其灰度化;

步骤3、基于时频谱图计算纹理特征:采用sobel算子计算各个灰度图像的梯度阵,并进行正规化,获得代表已知和未知状态图像纹理特征的灰度-梯度共生矩阵,并计算灰度-梯度二次统计特征,对特征矩阵进行归一化处理;

步骤4、对纹理特征进行主成分分析降维:对已知状态数据集和未知状态数据集的灰度-梯度共生矩阵进行主成分分析(pca),选择累计贡献率高于设定值的主成分;

步骤5、对降维后的已知状态纹理特征,通过iwo算法优化,获得各类状态特征的初始聚类中心vi:对已知状态的主成分进行杂草算法(iwo)优化,通过构造适应度函数选择各类最优的前p个已知状态数据样本,计算得到各个已知状态类别的初始聚类中心vi;

步骤6、对降维后的未知状态纹理特征,导入iwo优化的初始聚类中心vi,采用kfcm算法进行聚类分析识别,步骤如下:

(6-1):确定初始聚类数目c,隶属度指数m,导入初始聚类中心vi;

(6-2):根据聚类中心更新式,计算隶属度阵;

(6-3):根据聚类中心和隶属度矩阵更新式,计算各个聚类中心;

(6-4):重复步骤(6-2),(6-3),直到隶属度误差或迭代次数达到设定值。

优选的,所述步骤1中,振动信号来源于实验室平台或者实际工业机械设备。

优选的,所述步骤2中,时频分析的方法可采用小波变换、短时傅里叶变换或魏格纳分布,同类方法分析的参数设定一致,时频谱图像的灰度等级为256。

优选的,所述步骤3中,所述灰度-梯度二次统计特征包括15个特征量:小梯度优势、大梯度优势、灰度分布不均匀性、梯度分布不均匀性、能量、灰度平均、梯度平均、灰度均方差、梯度均方差、相关、灰度熵、梯度熵、混合熵、惯性、逆差距。所述正规化方法具体如下,对灰度阵进行正规化:

f(k,l)=int[f(k,l)×nf/fm]+1

式中:f(k,l)为灰度图像第(k,l)像点的灰度值,f(k,l)为正规化后的灰度阵,nf为灰度阵f(k,l)中的最大灰度值,fm为正规化后希望的最大灰度值,int表示取整运算。

同理,对梯度阵进行正规化

g(k,l)=int[g(k,l)×ng/gm]+1

式中:g(k,l)为灰度图像中第(k,l)像点的梯度值,g(k,l)为正规化后的梯度阵,ng为梯度阵g(k,l)中的最大梯度值,gm为正规化后希望的最大梯度值。在不过分损失图像信息的前提下,最大灰度和梯度值为64。

优选的,所述步骤5中,所述适应度函数可基于可分性判据进行构造,构造具体如下:

假设有k类特征集合{xi(k)}(i=1,2,3,…,mk),每类包含mk个样本。定义样本xi(u)的可分性测度为

式中,dinter为类间距离,dinner为类内距离。采用欧式距离进行度量,表达式为

其中表示j类的平均向量;表示u类的平均向量。

以最小类内距离、最大类间距离为目标函数,构造适应度函数为

式中,样本xi(u)的可分性测度越小,即类内距离小,类间距离大,所得的适应度函数值越大。通过适应度函数选择种群中最优的前p个样本进行聚类中心初始化,以有标签的数据样本来指导聚类,从而提升迭代效率和聚类效果。

优选的,所述步骤5和步骤6中,iwo-kfcm算法具体如下:

设含有m维特征向量数据集合x={xi,i=1,2,...,n}。对其进行聚类,设定为聚类数目为c,通过iwo算法获得第i类聚类中心为vi,uik表示第k个样本对第i类的隶属度(0≤uik≤1)。定义kfcm目标函数,求解以下最优化问题:

式中,m为隶属度指数,一般取1~3;φ为核映射。选取高斯核函数k(x,y)=exp{-||x-y||22}代入目标函数,展开化简可得:

在约束条件下,可得隶属度uik和聚类中心vi的迭代优化公式为

采用上述方法后,本发明和现有技术相比具有的优点是:本发明是将轴承故障诊断问题转化为故障时频图像状态识别问题;通过已知状态信号数据来指导未知状态信号数据,实现机械故障类型的诊断与识别;可以实现多种故障类型,不同故障程度的识别;基于可分性判据的适应度函数在迭代过程中保留了类内距离最小、类间距离最大的特征样本,实现初始聚类中心的优化;所提iwo-kfcm算法具有良好的鲁棒性和聚类精度,计算效率和聚类性能得到较大提升。

附图说明

图1是本发明的识别流程图;

图2是本发明轴承四类状态时频谱图像灰度化的示意图;

图3是本发明实验中80个样本的前4个纹理特征值分布图;

图4是本发明实验中循环20次可分性测度和的曲线图;

图5是本发明实验的iwo优化特征结果图;

图6是本发明实验的聚类平均准确率对比图;

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,一种基于iwo-kfcm算法的轴承时频谱图识别方法,包括步骤如下:

步骤1、数据采集、类别标记:设计旋转机械设备的故障实验,采集轴承在不同载荷、不同故障位置、不同故障程度下的振动信号,对各类状态信号进行截取、状态标记,形成已知状态类别的信号数据集和未知状态类别的信号数据集;

步骤2、获取灰度化的时频谱图:对已知状态信号数据集和未知状态信号数据集进行时频分析,获得时频谱图像并对其灰度化;

步骤3、基于时频谱图计算纹理特征:采用sobel算子计算各个灰度图像的梯度阵,并进行正规化,获得代表已知和未知状态图像纹理特征的灰度-梯度共生矩阵,并计算灰度-梯度二次统计特征,对特征矩阵进行归一化处理;

步骤4、对纹理特征进行主成分分析降维:对已知状态数据集和未知状态数据集的灰度-梯度共生矩阵进行主成分分析(pca),选择累计贡献率高于设定值的主成分;

步骤5、对降维后的已知状态纹理特征,通过iwo算法优化,获得各类状态特征的初始聚类中心:对已知状态的主成分进行杂草算法(iwo)优化,通过构造适应度函数选择各类最优的前p个已知状态数据样本,计算得到各个已知状态类别的初始聚类中心vi;

步骤6、对降维后的未知状态纹理特征,导入iwo优化的初始聚类中心vi,采用kfcm算法进行聚类分析识别,步骤如下:

(6-1):确定初始聚类数目c,隶属度指数m,导入初始聚类中心vi;

(6-2):根据聚类中心更新式,计算隶属度阵;

(6-3):根据聚类中心和隶属度矩阵更新式,计算各个聚类中心;

(6-4):重复步骤(6-2),(6-3),直到隶属度误差或迭代次数达到设定值。

在本实施例中,本发明是将轴承故障诊断问题转化为故障时频图像状态识别问题;通过已知状态信号数据来指导未知状态信号数据,实现机械故障类型的诊断与识别;可以实现多种故障类型,不同故障程度的识别;基于可分性判据的适应度函数在迭代过程中保留了类内距离最小、类间距离最大的特征样本,实现初始聚类中心的优化;所提iwo-kfcm算法具有良好的鲁棒性和聚类精度,计算效率和聚类性能得到较大提升。

其中,该步骤5中的杂草算法具体如下:

杂草算法可以解决一些复杂非线性问题。其基本思想是模拟杂草入侵过程,选择适应度最强的个体进行繁衍。

1)种群初始化

生成一定数量的杂草种群p,初始化最大迭代次数itermax、问题维数d、可产生的最大和最小种子数smax和smin、非线性指数n,区间步长初始值σmin和最终值σmax,最大种群数pmax。

2)生长繁殖

根据适应性函数计算杂草繁殖的种子数量

式中f为适应度值,适应性好的个体具有较大的生存机会。

3)空间扩散

子代个体以父代为中心,σiter为标准差的正态分布方式进行繁殖扩散,繁殖的子代个体与父代个体形成新的种群。σiter定义为

式中,σiter随着iter增大逐渐减少,确保算法前期进行全局搜索(r选择)和后期进行局部搜索(k选择)。

4)竞争排除

根据竞争性法则,按照适应度大小对所有个体排序,选择前pmax个适应度最佳的个体保留。

5)迭代终止

重复2)~4)步直至达到最大迭代次数或者满足最优解条件。

具体的,步骤1中,振动信号来源于实验室平台或者实际工业机械设备。其中,实验条件、采集方式等条件设定一致,如采样频率、采样时间等。数据集中的数据属性一致,如长度、单位等。已知状态数据集涵盖了该机械设备的各类运行状态。

具体的,步骤2中,时频分析的方法可采用小波变换、短时傅里叶变换或魏格纳分布,同类方法分析的参数设定一致,时频谱图像的灰度等级为256。

具体的,步骤3中,灰度-梯度二次统计特征包括15个特征量:小梯度优势、大梯度优势、灰度分布不均匀性、梯度分布不均匀性、能量、灰度平均、梯度平均、灰度均方差、梯度均方差、相关、灰度熵、梯度熵、混合熵、惯性、逆差距。其计算方法为该领域一般技术,为现有技术常用。

所述正规化方法具体如下,对灰度阵进行正规化:

f(k,l)=int[f(k,l)×nf/fm]+1

式中:f(k,l)为灰度图像第(k,l)像点的灰度值,f(k,l)为正规化后的灰度阵,nf为灰度阵f(k,l)中的最大灰度值,fm为正规化后希望的最大灰度值,int表示取整运算。

同理,对梯度阵进行正规化

g(k,l)=int[g(k,l)×ng/gm]+1

式中:g(k,l)为灰度图像中第(k,l)像点的梯度值,g(k,l)为正规化后的梯度阵,ng为梯度阵g(k,l)中的最大梯度值,gm为正规化后希望的最大梯度值。在不过分损失图像信息的前提下,最大灰度和梯度值为64。

具体的,步骤5中,适应度函数可基于可分性判据进行构造,构造具体如下:

假设有k类特征集合{xi(k)}(i=1,2,3,…,mk),每类包含mk个样本。定义样本xi(u)的可分性测度为

式中,dinter为类间距离,dinner为类内距离。采用欧式距离进行度量,表达式为

其中表示j类的平均向量;表示u类的平均向量。

以最小类内距离、最大类间距离为目标函数,构造适应度函数为

式中,样本xi(u)的可分性测度越小,即类内距离小,类间距离大,所得的适应度函数值越大。通过适应度函数选择种群中最优的前p个样本进行聚类中心初始化,以有标签的数据样本来指导聚类,从而提升迭代效率和聚类效果。

具体的,步骤5和步骤6中,iwo-kfcm算法具体如下:

设含有m维特征向量数据集合x={xi,i=1,2,...,n}。对其进行聚类,设定为聚类数目为c,通过iwo算法获得第i类聚类中心为vi,uik表示第k个样本对第i类的隶属度(0≤uik≤1)。定义kfcm目标函数,求解以下最优化问题:

式中,m为隶属度指数,一般取1~3;φ为核映射。高斯核函数k(x,y)=exp{-||x-y||22}代入目标函数,展开化简可得:

在约束条件下,可得隶属度uik和聚类中心vi的迭代优化公式为

实施案例

具体实验数据如下:

数据采集、类别标记。本案例数据集由凯斯西储大学(cwru)轴承数据中心电机试验台实验获得,采集信号数据包含四种状态:正常、内环故障、外环故障、滚动体故障。选择采样频率12khz,载荷为0.746kw时的驱动端轴承信号进行分析,对各类状态信号进行截取、状态标记,形成已知状态类别的信号数据集和未知状态类别的信号数据集(实际状态已知,便于测试计算准确率)。

获取灰度化的时频谱图。对信号进行小波变换,选择复morlet小波作为小波基,获得四类时频谱图像并对其灰度化,灰度等级为256,如图2。也可选择其他时频分析方法,如短时傅里叶变换、魏格纳分布等获取时频图像。

基于时频谱图计算纹理特征。采用sobel算子计算灰度图像的梯度阵,并进行正规化,设定正规化最大灰度和梯度值为64。计算每类图像的灰度-梯度共生矩阵,提取小梯度优势(t1)、大梯度优势(t2)、灰度分布不均匀性(t3)、梯度分布不均匀性(t4)等15个特征量,生成维数为80x15的特征矩阵。由于每个特征分量的物理意义和特征范围不同,对特征矩阵进行零均值归一化处理,图3为80个样本的前4个纹理特征值分布。由图可得,不同特征量存在冗余,t1至t4均能较好的区分正常、外环故障、滚动体故障三类状态,t1、t3、t4中内环故障与滚动体故障特征值分布存在重叠,t2中正常和外环故障较难区分。对纹理特征进行主成分分析降维,对已知状态数据集和未知状态数据集的灰度-梯度共生矩阵进行主成分分析(pca),选择累计贡献率高于设定值的主成分;本实验选择累计贡献率高于95%的前两主成分作为iwo-kfcm算法的特征输入。贡献率可根据实际要求而定。

利用杂草算法对优化已知状态特征从而获取初始聚类中心。随机选择40个特征,每类样本10个,设定初始种群个体数40,最大种群个体数80,问题维数2,最大种子数3,最小种子数1,调和指数3,最大和最小方差为0.5和0.01,循环次数20。在杂草竞争排斥过程中,选择每类前20个适应度最高的子代进行下一代的繁殖,迭代20次后,计算每次杂草种群可分性测度之和得到图4。由图4可得,杂草经过8次迭代后可分性测度和趋平,到20次时测度和差值为1.85x10-8,达到稳定。此时,输入的特征样本分布及四类特征中心如下图5,结果收敛。

采用iwo-kfcm算法进行聚类分析。选择剩余40个样本作为测试样本,设定聚类数n=4(为设备信号状态数),隶属度参数m=2,高斯核参数=1.5,隶属度误差=10-5,最大迭代次数为100,均为正常范围内进行参数选取,以图2优化的初始聚类中心作为输入建立核聚类模型。

为了验证所提算法的优越性,以迭代次数、运行时间和聚类准确率作为评价指标,以随机选择样本作为初始聚类中心(即传统的kfcm算法)和以训练样本各类中心作为聚类中心(半监督kfcm算法)进行对比计算,交叉验证10次,计算时间和迭代次数对比结果如下表1。由表1可得,kfcm的平均迭代次数和计算时间较另外两种方法高,这是因为随机设定中心可能使得初始聚类中心与收敛中心相差较远,导致搜索成本增加;iwo-kfcm的平均计算时间和迭代次数少于kfcm,略优于半监督kfcm,说明经iwo优化中心的半监督模糊核聚类能更快的达到收敛结果。统计三种方法的平均聚类正确率,同时对比所提的iwo-fcm算法,结果如图6所示。由图6可得,kfcm是一种无监督的算法,其聚类准确率较低;半监督kfcm和iwo-fcm算法利用了有标签样本的初始中心对聚类模型进行指导,其聚类精度均较高;iwo-kfcm算法通过核函数将特征非线性映射至高维空间进行聚类,较iwo-fcm算法降低了对噪声和野点的敏感程度,平均聚类准确率能达到100%,较其他三类算法高,多次交叉验证说明本方法具有良好的鲁棒性和聚类精度。

表1三种聚类中心初始化方法对比

综上所述,对四类轴承时频图像状态进行聚类识别,对比kfcm算法、半监督kfcm算法、iwo-fcm算法,总结如下

1)灰度-梯度共生矩阵能有效地提取图像纹理特征,但特征信息存在冗余,通过pca可以实现差异特征选择。

2)基于可分性判据的适应度函数在迭代过程中保留了类内距离最小、类间距离最大的特征样本,从而实现初始聚类中心的优化。

3)iwo-kfcm算法较iwo-fcm算法具有较好的鲁棒性和聚类精度,同时其计算效率较kfcm、半监督kfcm算法高。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1