一种基于宽残差网络学习模型的机械轴承故障诊断技术的制作方法

文档序号:15024707发布日期:2018-07-27 11:33阅读:143来源:国知局

本发明属于机械振动技术领域,涉及故障诊断技术,具体涉及一种基于宽残差网络学习模型的机械轴承故障诊断技术。



背景技术:

旋转轴承是汽车传动系统的关键部件,其运行状态直接影响到整车的舒适性和安全性。对旋转轴承振动进行数据量化分析是一种轴承故障识别的常用手段。轴承振动数据是一种典型的时序数据,传统的分析手段为运用各种时频特征工程人工进行数据特征选取,大大增加了数据的预处理成本。

现有的机械轴承故障诊断大多是基于“规则”方法的诊断技术,需要对静态数据进行预处理,处理过程复杂,特别是在处理海量数据时预处理成本高、易引发人工“信任危机”。对滚动体特征频率以及多个滚动体旋转时形成的叠加频率进行分析发现,由于非平稳故障信号存在强噪声成分以及滚动体旋转过程中相互碰撞叠加呈现振动信号成分比较复杂,调制边频带并不明显,因此,难以通过分析频域波形的频率调制特征来判断故障的类型。

浅层机器学习诊断技术虽然一定程度上解决了振动数据的大数据瓶颈,通过对数据“特征提取”、“建模”、“学习”等过程相对提高了准确率,但是它也同时存在表征能力有限、训练易陷入局部极值的问题。传统的卷积神经网络(cnn)这种深度学习模型如果简单地增加深度,会导致梯度弥散或梯度爆炸,虽然可以通过中间的正则化层(batchnormalization)以及一些数据稀疏化方法(如dropout等)可以适当提高深度学习模型深度,但是又会出现另一个问题,那就是退化问题,网络层数增加,但是在训练集上的准确率却饱和甚至下降了。深度残差网络更容易优化,避免了通过简单增加层数并且能够通过增加相当的深度来提取到不同深度学习网络模型层次(level)的特征越丰富,提高了准确率。但是深度残差网络过于追求网络深度,而忽略了模块自身以及所要分析的振动数据本身。随着模块的增加,模型的表现并没有明显提升,因此可以理解为部分模块其实并没有起到应有的作用,过于追求深度导致“卷积核”小,把振动数据中表征信号特征信息的低频信号过滤掉了。



技术实现要素:

针对现有技术中存在的上述问题,本发明提供了一种基于宽残差网络学习模型的机械轴承故障诊断技术,该技术主要为解决基于传统的振动信号时频分析技术所带来的人工信任危机以及基于浅层机器学习的振动信号处理过程中特征表达能力有限、训练易陷入局部极值的缺陷,探寻一种类似计算机视觉任务、基于振动数据驱动的故障识别模型,为机械振动分析在深度学习中的应用提供一种有益的思路与方法。该技术通过运用宽残差网络,核心是解决了增加深度带来的副作用(退化问题),同时在保持对振动数据故障诊断准确率基本不变的情况下做到了深度学习过程中对振动数据高频噪声信号和低频特征信号的过滤折中。

为此,本发明采用了以下技术方案:

一种基于宽残差网络学习模型的机械轴承故障诊断技术,包括以下步骤:

步骤一,采集振动数据;

步骤二,运用卷积神经网络对样本数据进行训练、测试,对卷积神经网络结构中的各层数据运用数据可视化技术,完成振动数据和卷积神经网络模型结合的初步应用场景构建;

步骤三,引入宽残差网络模型,通过拓宽卷积核达到对振动数据高频噪声信号和低频特征信号的过滤折中。

优选地,步骤一中采集振动数据时采样频率大于信号频率的两倍;单位时间采样所选取的采样点的数量等于采样频率。

优选地,所述采样频率为1024hz;为有效保留原始振动信号的故障特征,单个学习样本设置为32*32大小,即1024个采样点;把振动数据转换为32*32大小的灰度图这种数据集形式,通过位深度为8位的灰度图灰度值的大小代表振动数据的振动幅度,然后把数据集按一定比例进行分割,分为训练集和测试集。

优选地,步骤二中运用tensorflow中的tensorboard数据可视化方法对卷积神经网络模型故障诊断准确率和目标函数损失进行统计;随着训练步数的增多,模型总体呈收敛状态;为了增加诊断准确率,采取增加网络深度的方法。

优选地,步骤三中宽残差网络模型是残差网络的一种变体,是在残差网络的基础上拓宽了残差块卷积核的个数,这样做降低了网络层数,但并没有减少模型参数,既加快了计算速度又做到了通过拓宽卷积核达到对振动数据高频噪声信号、低频相似的过滤折中。

优选地,所述残差网络是由多个残差模块堆叠而成的网络结构;每个残差学习模块包括两个分支,一个是残差函数,另一个是对输入的恒等映射;这两个分支经过一个简单整合后,再经过一个非线性的变换激活函数,从而形成整个残差学习模块。

优选地,所述激活函数是relu激活函数。

优选地,所述宽残差网络是在原始的残差模块的基础上增加了一个系数k,从而拓宽卷积核的个数。

优选地,对源数据进行了数据增强;将源数据图片压缩为28*28的大小然后进行位置移动,可以起到数据扩充增强的效果,同时也做了水平翻转。

优选地,采用elu激活函数替换relu激活函数。

与现有技术相比,本发明的有益效果是:

(1)通过运用宽残差网络,解决了增加深度带来的副作用(退化问题),同时在保持对振动数据故障诊断准确率基本不变的情况下做到了深度学习过程中对振动数据高频噪声信号和低频特征信号的过滤折中。

(2)解决了基于传统的振动信号时频分析技术所带来的人工信任危机以及基于浅层机器学习的振动信号处理过程中特征表达能力有限、训练易陷入局部极值的缺陷,探寻了一种类似计算机视觉任务、基于振动数据驱动的故障识别模型,为机械振动分析在深度学习中的应用提供了一种有益的思路与方法。

(3)机械轴承的故障诊断在宽残差网络的应用可行、准确率高。

附图说明

图1是本发明所提供的一种基于宽残差网络学习模型的机械轴承故障诊断技术的流程图。

图2是振动信号训练集。

图3是振动信号测试集。

图4是故障类型的原始数据。

图5是第1卷积层数据视图。

图6是第2卷积层数据视图。

图7是第3卷积层数据视图。

图8是第1层池化层数据视图。

图9是第1层卷积核数据视图。

图10是故障诊断准确率。

图11是目标函数损失。

图12深度残差模块。

图13是各类型残差块对比图。

图14是宽残差网络结构图。

图15是宽残差网络训练、验证准确率。

图16是宽残差网络目标函数损失。

具体实施方式

下面结合附图以及具体实施例来详细说明本发明,其中的具体实施例以及说明仅用来解释本发明,但并不作为对本发明的限定。

如图1所示,本发明公开了一种基于宽残差网络学习模型的机械轴承故障诊断技术,包括以下步骤:

步骤一,采集振动数据;

步骤二,运用卷积神经网络对样本数据进行训练、测试,对卷积神经网络结构中的各层数据运用数据可视化技术,完成振动数据和卷积神经网络模型结合的初步应用场景构建;

步骤三,引入宽残差网络模型,通过拓宽卷积核达到对振动数据高频噪声信号和低频特征信号的过滤折中。

具体地,步骤一中采集振动数据时采样频率大于信号频率的两倍;单位时间采样所选取的采样点的数量等于采样频率。

具体地,所述采样频率为1024hz;为有效保留原始振动信号的故障特征,单个学习样本设置为32*32大小,即1024个采样点;把振动数据转换为32*32大小的灰度图这种数据集形式,通过位深度为8位的灰度图灰度值的大小代表振动数据的振动幅度,然后把数据集按一定比例进行分割,分为训练集和测试集。

具体地,步骤二中运用tensorflow中的tensorboard数据可视化方法对卷积神经网络模型故障诊断准确率和目标函数损失进行统计;随着训练步数的增多,模型总体呈收敛状态;为了增加诊断准确率,采取增加网络深度的方法。

具体地,步骤三中宽残差网络模型是残差网络的一种变体,是在残差网络的基础上拓宽了残差块卷积核的个数,这样做降低了网络层数,但并没有减少模型参数,既加快了计算速度又做到了通过拓宽卷积核达到对振动数据高频噪声信号、低频相似的过滤折中。

具体地,所述残差网络是由多个残差模块堆叠而成的网络结构;每个残差学习模块包括两个分支,一个是残差函数,另一个是对输入的恒等映射;这两个分支经过一个简单整合后,再经过一个非线性的变换激活函数,从而形成整个残差学习模块。

具体地,所述激活函数是relu激活函数。

具体地,所述宽残差网络是在原始的残差模块的基础上增加了一个系数k,从而拓宽卷积核的个数。

具体地,对源数据进行了数据增强;将源数据图片压缩为28*28的大小然后进行位置移动,可以起到数据扩充增强的效果,同时也做了水平翻转。

具体地,采用elu激活函数替换relu激活函数。

实施例

一种基于宽残差网络学习模型的机械轴承故障诊断技术,具体过程如下:

1.采集振动数据。由采样定理知,采样频率要大于信号频率的两倍。以滚动体故障为例,这里单位时间采样选择1024个采样点,即采样频率为1024hz>2*137.48hz,此采样频率对其他故障也是符合的。为有效保留原始振动信号的故障特征,单个学习样本设置为32*32大小(1024个采样点),把振动数据转换为32*32大小的灰度图这种数据集形式,通过位深度为8位的灰度图灰度值的大小代表振动数据的振动幅度,然后把数据集按一定比例进行分割,分为训练集和测试集,分别如图2和图3所示。

2.首先运用卷积神经网络(cnn)对做了相应数据扩充的样本数据进行训练、测试,对卷积神经网络结构中的各层数据运用了数据可视化技术,并运用tensorflow中的tensorboard数据可视化方法对卷积神经网络模型故障诊断准确率和目标函数损失(loss)做了统计,做到了振动数据和cnn这一经典深度学习模型结合的初步应用场景构建。图4-9为故障类型标签为2的原始数据(共分10类)以及各层的可视化视图,图10为故障诊断准确率(accuracy),图11为目标函数损失(loss)。由图10和图11可以看出随着训练步数的增多,模型总体呈收敛状态。为了增加诊断准确率通常采取增加网络深度的做法。

3.为了克服深度增加带来的训练困难,受lstm中“gate”机制的启发,通过对传统的前馈神经网络加以修正以至于信息能够在多个神经网络层之间高效流动引入了宽残差网络模型(wideresidualnetworks),它是残差网络(residualnetworks)的一种变体,是在残差网络的基础上拓宽了残差块(residualblocks)卷积核的个数,这样做降低了网络层数,但并没有减少模型参数,既加快了计算速度又做到了通过拓宽卷积核达到对振动数据高频噪声信号、低频相似的过滤折中。

假设某常规卷积神经网络有l层,其中第i层(i∈1,2,...,l)的输入为xi,参数为wi,该层的输出yi=xi+1。为了表述的简单易懂,忽略层数和偏置,它们之间的关系可表示如下:

y=f(x,wf)(1)

其中,f为非线性激活函数,参数wf的下标表明该操作对应于f。深度残差网络可用公式(2)表示:

y=f(x,w)+x(2)

对公式(2)做简单的变形,可得:

f(x,w)=y-x(3)

由公式(3)可以看出网络需要学习的函数f为公式(3)右侧的残差项(y-x),称之为残差函数。如图12所示,残差学习模块有两个分支,其一是左侧的残差函数,其二是右侧的对输入的恒等映射。这两个分支经过一个简单整合后,再经过一个非线性的变换relu激活函数,从而形成整个残差学习模块。由多个残差模块堆叠而成的网络结构称作“残差网络”。

图13所示为各类型残差块的结构图。而宽残差网络(wrn),首先由sergeyzagoruyko等在wideresidualnetwork论文中提出,如图14所示,在原始的残差模块的基础上加上了一个系数k,从而拓宽卷积核的个数。按照文章中提出的解释,这样做降低了层数,但并没有减少模型参数,同时还加快了计算速度。

本技术在原wrn基础上做了以下改进:

(1)包含进了l2正则化,此方法解决了振动数据深度学习过程中过拟合、泛化能力差的问题。l2正则化方法是在代价函数后加一个权值w平方和相关的正则化项,在代价函数迭代过程中l2正则化项对权值w的更新是有影响的,它的效果是减小w,实现了权值的衰减,由奥卡姆剃刀法则可知更小的权值可以降低网络的复杂度,做到对数据的拟合恰到好处,特别是振动数据在深度学习过程中。l2正则化抗扰动性强,可以获得一个很小的参数,数据适应能力强。

(2)对源数据做了数据增强,把源数据图片压缩为28*28的大小然后做位置移动起到了数据扩充增强的效果,同时也做了水平翻转。

(3)替换relu激活函数为elu激活函数。由于在wrn中f不是恒等映射时将阻塞正向、反向传播,导致误差增加。relu的输出值没有负值,所以输出的均值会大于0,当激活值的均值非0时,就会对下一层造成一个bias,如果激活值之间不会相互抵消(即均值非0),会导致下一层的激活单元有biasshift。如此叠加,单元越多时,biasshift就会越大。相比relu,elu可以取到负值,这让单元激活均值可以更接近0,类似于batchnormalization的效果但是只需要更低的计算复杂度。

本技术通过实验验证时的超参数中,深度为16,k=4,残差块类型为3*3,batchsize=120,达到了92.x%的准确率,如图15所示,图16所示loss也比较平滑。

通过实验验证,机械轴承的故障诊断在宽残差网络的应用可行、准确率高。

以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则范围之内所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1