基于优化结构卷积神经网络的旋转机械故障诊断方法与流程

文档序号:17344278发布日期:2019-04-09 20:01阅读:197来源:国知局
基于优化结构卷积神经网络的旋转机械故障诊断方法与流程
本发明属于工程机械系统故障诊断
技术领域
,更为具体地讲,涉及一种基于优化结构卷积神经网络的旋转机械故障诊断方法。
背景技术
:旋转机械是在工业中使用最广泛的机械,随着现代工业的发展及机械自动化程度提高,其可靠性,可维护性以及安全性都越来越受到人们的关注。滚动轴承作为旋转机械的核心部件之一,据统计在使用滚动轴承的旋转机械设备中,约有30%的机械故障与轴承损伤有关。而且与其他机械零件部件相比,滚动轴承具寿命离散性大的特点,因而在实际工作中,有的轴承已经超过其设计寿命却依然能正常工作,有的轴承远未达到其寿命却出现了各种故障。若轴承故障没有及时发现会使得机器工作精度下降,甚至会导致整个机器故障,造成事故甚至是人员伤亡。同时,滚动轴承是非常复杂的动力学系统。当轴承出现故障时,其动力学行为通常表现出比较复杂的非线性特征。信号不但呈现出非平稳性,而且常常伴随复杂的自相似性,表现出混沌和分形等非线性特征,在这种情况下,要从非平稳的轴承振动信号中提取表征轴承动力学行为的特征参数,从而识别轴承损伤的严重程度就变得非常困难。但是设备在工作过程中总会经历由正常到退化到最终失效的过程,如果能够实时监测设备健康信息,对于维护策略的制定、降低维护成本和生产损失有着积极的意义。虽然传统的智能故障诊断系统理论成熟,方法多样,但是面对现在越来越复杂的智能工业设备已无法满足要求。首先,大多机器学习的方法无法直接使用原始信号而需要通过人为设计的特征提取器进行特征提取,而特征提取依赖先验知识,且在提取过程中会丢失许多信息。而现有大多故障分类方法都是经过预处理(魏格纳分布、小波变换、经验模态分解等)后,粗粒化地提取序列的特征。时频特征提取之后送入支持向量机、提取mfdfa特征之后送入马氏判别系统、基于信息学的提取数据信息熵后送入k聚类判别。这些方法可以有效的处理非平稳时间序列,但是由于隐去了原始时间序列,转而采用依靠特征分类的方式,难以全面地表达原始时间序列的信息,无法实现高精度的分类。传统的机器学习模型最终的识别精度严重依赖于提取到的特征,并且特征提取存在两个问题:一是处理后的数据是否具有良好的表述信号特征的能力,二是预处理过程极度耗费时间。因此在工程实际使用时,传统的机械学习模型存在速度慢、准确率低的问题,需要研究解决。技术实现要素:本发明的目的在于克服现有技术的不足,提供一种基于优化结构卷积神经网络的旋转机械故障诊断方法,将采集得到的旋转机械工作信号转化为灰度图,通过卷积神经网络完成对旋转机械故障的多分类任务。为实现上述发明目的,本发明基于优化结构卷积神经网络的旋转机械故障诊断方法包括以下步骤:s1:分别在旋转机械正常状态下和r种故障状态下随机截取长度为m2的工作信号ln(m),其中n=1,2,…,n,n表示工作信号的数量,m=0,1,…,m2-1,m2=k×2d,并且m2>t,t表示工作信号的周期,记每段工作信号ln(m)对应的标签为yn,标签yn用于标识工作信号对应的旋转机械的工作状态;将每段工作信号转化为大小为m×m的灰度图in,灰度图中像素点(i,j)的像素值fn(i,j)采用以下公式计算:其中,i,j=0,1,...,m-1,round(·)表示舍入函数,maxn、minn分别表示一维加速度振动信号ln(m)的最大值和最小值;s2:按照以下方法构建得到卷积神经网络:第1层为卷积层conv1,第2层为最大池化层pool1,第3层为卷积层conv2,第4层为最大池化层pool2,第5层为卷积层conv3,第6层为cccp层cccp1,第7层为cccp层cccp2,第5、6、7层构成mlpconv层,第8层为全局平均池化层pool3,第9层为输出层softmax,其中在conv3、cccp1、cccp2中采用修正线性单元relu作为激活函数;s3:将步骤s1中得到的每幅灰度图in作为输入,对应的标签yn作为期望输出,对步骤s2构建的卷积神经网络进行训练;s4:在旋转机械工作过程中,根据需要采集一段长度为m2的工作信号l′(m),采用步骤s1中的相同方法将该工作信号转化为大小为m×m的灰度图i′n,然后将灰度图i′n输入至步骤s3训练好的卷积神经网络中,得到诊断结果。本发明基于优化结构卷积神经网络的旋转机械故障诊断方法,首先在旋转机械正常状态下和故障状态下采集工作信号,然后转换为灰度图,将灰度图和对应的故障标签作为训练样本对构建的卷积神经网络进行训练;在旋转机械工作过程中,采集工作信号并转换为灰度图,输入训练好的卷积神经网络进行故障诊断。本发明具有以下有益效果:1)本发明对原始信号不做特征提取,而是将其直接转化为灰度图,避免了特征提取带来的信息丢失,极大程度的保留了原始信号包含的信息;2)本发明针对旋转机械的工作信号的特点对传统的卷积神经网络进行了改进,使用了卷积-池化模块和mlpconv,即保证了整体结构的简单,又提升了网络的特征表达能力,同时通过使用全局平均池化层替换传统的全连接层,避免了因全连接层的参数量过大造成的过拟合情况;3)本发明提出的优化结构的卷积神经网络具有结构简单、参数量少的特点,故较一般深度学习网络对硬件资源的要求低,可以方便地在主流硬件系统上进行部署使用,同时实验证明基于该卷积神经网络可以有效提高故障分类准确率。附图说明图1是本发明基于优化结构卷积神经网络的旋转机械故障诊断方法的具体实施方式流程图;图2是本实施例中所构建的卷积神经网络结构示意图;图3是本实施例中两个对比卷积神经网络以及本发明中lenin网络的三种变形的故障分类准确率曲线图;图4是本发明中lenin网络不同参数组合的故障分类准确率曲线图;图5是64-64-192的卷积核组合的卷积神经网络在不同尺寸输入灰度图的故障分类准确率曲线图;。图6是本实施例中西储大学轴承故障数据的故障分类准确率直方图;图7是本实施例中自建平台轴承故障数据的故障分类准确率直方图。具体实施方式下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。图1是本发明基于优化结构卷积神经网络的旋转机械故障诊断方法的具体实施方式流程图。如图1所示,本发明基于优化结构卷积神经网络的旋转机械故障诊断方法的具体步骤包括:s101:获取训练样本:首先需要获取训练样本,本发明未直接使用旋转机械工作过程中的工作信号作为样本,而是先将原始的工作信号数据转化为灰度图,将灰度图作为训练样本,再基于灰度图进行后续处理。旋转机械的工作信号一般有一维加速度振动信号、位移信号等,可以根据实际需要选用。本发明中获取训练样本的具体方法为:分别在旋转机械正常状态下和r种故障状态下随机截取长度为m2的工作信号ln(m),其中n=1,2,...,n,n表示工作信号的数量,m=0,1,...,m2-1,m2=k×2d,k>1,d>1,并且m2>t,t表示工作信号的周期,记每段工作信号ln(m)对应的标签为yn,标签yn用于标识工作信号对应的旋转机械的工作状态,显然标签yn存在r+1个取值。将每段工作信号转化为大小为m×m的灰度图in,灰度图中像素点(i,j)的像素值fn(i,j)采用以下公式计算:其中,i,j=0,1,...,m-1,round(·)表示舍入函数,maxn、minn分别表示工作信号ln(m)的最大值和最小值。显然,根据以上操作,可以使得灰度图中的像素值位于0-255。可见,本发明将工作信号划分为m个子序列,每个子序列对应灰度图in中的一行像素点。灰度图的大小,是结合实际工程系统故障分类准确率需要及硬件设备性能特征来选取的。一般来说,如果原始数据量小,则灰度图尺寸就偏小,反之亦然。此外,还需要结合卷积神经网络中的具体参数来设置,选择使最终分类准确率更高的尺寸。s102:构建优化结构/轻量化卷积神经网络:本发明中,对工程机械工作过程中的一维加速度振动信号的特点进行分析,结合使用传统卷积-池化结构和nin网络中的mlpconv层,并用全局平均池化层替代典型卷积神经网络中的全连接层,构建了一个新型的卷积神经网络——lenin网络,其具体结构为:第1层为卷积层conv1,第2层为最大池化层pool1,第3层为卷积层conv2,第4层为最大池化层pool2,第5层为卷积层conv3,第6层为cccp(cascadedcrosschannelparametricpooling,级联跨通道参数化池化)层cccp1,第7层为cccp层cccp2,第5、6、7层构成mlpconv层,第8层为全局平均池化层pool3,第9层为输出层softmax,其中在卷积层conv1、conv2、conv3中采用修正线性单元relu作为激活函数。由于cnn网络的突出优势在于局部感知和权值共享,极大地减少了训练中网络所需学习的参数,因此本发明在lenin网络的前半部分依然采用传统的卷积—池化结构。而mlpconv层是在普通卷积层的基础上进行改进,加入了1*1的卷积层(cccp层),相当于在传统卷积层的基础上将局部感受野作为一个微型神经网络的输入,这个微型网络等效于一个多层感知机,即一个由多个全连接层构成的子网络。本发明在lenin网络的后半部分结合使用mlpconv层,可以有效提升lenin网络的特征表达能力。此外,传统cnn网络中的全连接层却有一个非常典型的弱点就是参数量过大,特别是与最后一个卷积层相连的全连接层。本发明在lenin网络中使用全局平均池化层替代全连接层,与传统的全连接层相比省去了将特征图展开的过程,直接使用与特征图等尺寸的滑窗进行平均池化,相较于全连接层计算量更小,减轻了硬件负担同时有效避免了全连接层参数量过大而造成的过拟合情况。s103:训练卷积神经网络:将步骤s101中得到的每幅灰度图in作为输入,对应的标签yn作为期望输出,对步骤s102构建的卷积神经网络进行训练。目前存在多种卷积神经网络的训练方法,本实施例中选用反向传播算法和加速梯度下降法nesterov进行训练。s104:故障诊断:在旋转机械工作过程中,根据需要采集一段长度为m2的工作信号l′(m),采用步骤s101中的相同方法将该工作信号转化为大小为m×m的灰度图i′n,然后将灰度图i′n输入至步骤s103训练好的卷积神经网络中,得到诊断结果。实施例为了更好地说明本发明的技术方案和技术效果,采用一个具体实例对本发明的工作流程和技术效果进行分析说明。轴承故障是旋转机械中的一种典型故障,因此本实施例分别采用美国凯斯西储大学的轴承故障开放数据和自建故障模拟平台采集的轴承故障数据进行实验测试,所采用数据均为一维加速度振动信号数据。对于西储大学轴承故障数据,选取3种故障类型分别为滚动体故障(b)、内圈故障(ir)、外圈故障(or)和一组正常数据(nr);每种故障类型又分为4种故障程度,分别为0.18mm、0.36mm、0.54mm、1mm;对以上几种故障模式的一维加速度振动信号采用本发明步骤s101中的方法进行处理得到灰度图。通过随机选取的方式,得到训练集共8000个样本,测试集共2000个样本;每个样本包含784(为构成28*28的灰度图)个采样点。表1是本实施例中基于西储大学轴承故障数据构建的轴承故障数据库。表1自建故障模拟平台分别设置轴承内圈故障(ir)、外圈故障(or)和齿轮太阳轮故障(sun),且每种轴承故障类型有两种不同故障程度:i2(故障轴向尺寸δφf=35.7°,故障深度d=0.3mm),i3(δφf=64.3°,d=0.3mm),o2(δφf=38.6°,d=0.3mm),o4(δφf=1°,d=0.3mm)。在不同转速下对每类故障件的每种类型下的每种故障程度随机截取800个样本,样本长度为4096个数据点(方便构成64*64)的灰度图矩阵,训练集包含9600个样本,测试集包含2800个样本。表2是本实施例中基于自建故障模拟平台采集构建的轴承故障数据库。表2将得到的两部分轴承故障数据均转换为灰度图,然后分为训练集和测试集,训练集占整体数据的75%,训练集用于卷积神经网络(lenin网络)的训练,测试集用于对卷积神经网络进行测试,以统计分类准确率。图2是本实施例中所构建的卷积神经网络的结构示意图。表3是本实施例中卷积神经网络的参数配置表。层通道数核尺寸步长补零数conv164510pool164220conv264510pool264220conv3192311cccp1192110cccp2192110pool3192410表3如表3所示,本实施例中卷积层conv1使用64个大小为5×5的卷积核,对输入的灰度图以步长为1做卷积;本实施例中每个卷积层的权重初始化为xavier,偏置值初始化为常数0。最大池化层pool1对conv1输入到pool1的数据以步长为2做2×2的最大池化操作;卷积层conv2使用64个大小为5×5的卷积核,对pool1输入到conv2的数据以步长为1做卷积。最大池化层pool2对conv2输入到pool2的数据以步长为2做2×2的最大池化操作。卷积层conv3使用192个大小为3×3的卷积核,对pool1输入到conv2的数据以步长为1做卷积,并进行1位补零。补零操作是为了控制特征尺寸大小,以补零来防止维度损失,其具体操作为:假设m表示输入单元的大小(宽或高),w表示输出单元的大小(宽或高),f表示卷积核尺寸(kernelsize),s表示步幅,p表示补零(zeropadding)数量。则输出单元的大小为:cccp层cccp1使用192个大小为1×1的卷积核,对conv3输入到cccp1的数据以步长为1做卷积。cccp层cccp2使用192个大小为1×1的卷积核,对cccp1输入到cccp2的数据以步长为1做卷积。全局平均池化层pool3使用192个大小与cccp2输出特征图等尺寸的卷积核,对cccp2输入到pool3的数据以步长为1做平均池化。输出层softmax对pool3层的线性输出进行处理,得到输入的灰度图属于r+1个故障状态类别的相对概率。本实施例中,采用反向传播算法和加速梯度下降法nesterov对lenin网络进行训练,然后采用测试集进行测试。为了更好地说明本发明的技术效果,采用两个对比卷积神经网络以及本发明中lenin网络的三种变形进行对比实验,统计故障分类准确率,其中每个网络分别进行10次训练和测试。图3是本实施例中两个对比卷积神经网络以及本发明中lenin网络的三种变形的故障分类准确率曲线图。表4是本实施例中两个对比卷积神经网络以及本发明中lenin网络的三种变形的故障分类准确率统计表。表4表4中,lenet为传统的lenet网络,其中全连接层fc中卷积核数量为1024;lene+2fc为采用两个级连全连接层的lenet网络,其中全连接层fc1中核数量为1536,全连接层fc2中核数量为32;lenin(1)表示本发明卷积神经网络中conv1卷积核数量为20,conv2的卷积核数量为50;lenin(2)表示conv1_1、conv1_2的卷积核数量均为20,卷积核大小为3×3,conv2_1、conv2_2的卷积核数量均为50,卷积核大小为3×3;相当于用两个3×3的卷积层等效替代原5×5的卷积层,保持卷积核数量不变;lenin(3)表示保持lenin(2)其余不变,将conv1_1、conv1_2、conv2_1、conv2_2的卷积核数量变为64。从图3和表4可以看出,本发明所提出的lenin网络具有较高的故障分类准确率。接下来对不同参数(输入灰度图尺寸,卷积核数量)组合下的lenin网络进行实验,每个参数组合下的lenin网络分别进行10次训练和测试。图4是本发明中lenin网络不同参数组合的故障分类准确率曲线图。表5是本发明中lenin网络不同参数组合下的故障分类准确率统计表。表5如表5所示,在64-64-192的卷积核组合下,分类准确率最好。图5是64-64-192的卷积核组合的卷积神经网络在不同尺寸输入灰度图的故障分类准确率曲线图。从表5和图5可以发现,同一网络结构下,输入不同尺寸的灰度图时,分类准确率也会存在差异,因此在实际应用中可以根据实验来确定灰度图的大小。接下来分别采用本实施例中两个轴承故障数据库构成两组训练集和样本集,选用的灰度图分别为尺寸48*48、64*64,卷积神经网络结构为64-64-192的卷积核组合,使用两个数据库分别进行10次训练和测试。图6是本实施例中西储大学轴承故障数据的故障分类准确率直方图。图7是本实施例中自建平台轴承故障数据的故障分类准确率直方图。表6是本实施例中两个轴承故障数据库下的分类准确率统计表。表6如表6所示,本发明对于轴承故障有很好的分类效果,并且通过自建平台旋转机械(包括齿轮)故障数据的验证,可以看到本发明所提出的lenin网络具有泛化能力,在面对复合故障分类也保持了较好的分类效果。尽管上面对本发明说明性的具体实施方式进行了描述,以便于本
技术领域
的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本
技术领域
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1