基于多尺度深度神经网络的旋转机械故障诊断方法

文档序号:26007701发布日期:2021-07-23 21:26阅读:113来源:国知局
基于多尺度深度神经网络的旋转机械故障诊断方法

本发明涉及轴承等旋转机械故障诊断



背景技术:

近年来,机电装备正朝着大型化、高速化、精密化、系统化和自动化的方向发展。为了保障设备的安全运行,对主要零部件的健康状况进行实时监控有着至关重要的作用。旋转机械是工业生产中的“心脏”,是推动工业生产的原动力,是安全性和可靠性都要求很高的部件,同样也是机械设备中造价最昂贵的。一旦发生故障,如未能及时检测到故障或未能有效地排查和修复潜在的故障,将会导致旋转机械的进一步损坏并影响工业生产,甚至可能危及工作人员的生命安全,从而造成巨大损失。因此,对旋转机械准确有效地进行故障诊断具有重大意义。

目前,旋转机械故障诊断的方法主要有两大类,分别为传统故障诊断方法与深度学习故障诊断方法,如图1所示。传统方法主要分为特征提取、特征降维与模式分类三个步骤。在振动信号故障诊断领域,常见的特征提取方法有时域特征、傅里叶变换、小波变换、经验模态分解(empiricalmodedecomposition,emd)以及统计学特征等。常见的特征降维有主成分分析(principalcomponentsanalysis,pca)、独立成分分析(independentcomponentsanalysis,ica);常见的模式分类算法有支持向量机(supportvectormachine,svm)、bp神经网络(也称多层感知机)、随机森林、贝叶斯分类器以及最近邻分类器等。传统的故障诊断方法的特征提取完全依赖于人工,过程复杂且工作量大,因此很难在实际中得到应用。基于深度学习方法克服了传统学习方法的缺陷,省去了特征提取和特征选择的步骤,直接将信号作为模型的输入,实现端到端的故障诊断。常见处理时序的深度学习故障诊断网络模型主要有卷积神经网络(convolutionalneuralnetwork,cnn),循环神经网络(recurrentneuralnetwork,rnn)。深度归一化卷积神经网络(dncnn)用于机械设备的不平衡故障分类,与常用的cnn相比,dncnn能够更有效地处理数据不平衡情况下的分类问题。

目前,机械故障自动诊断方法中,特征提取是重要的步骤。卷积神经网络是深度学习中一种常用的特征提取方法。它不依赖于人工特征提取,从而避免了人为因素的干扰。但是,传统cnn的单一拓扑结构在提取不同工况下的信号时缺乏自适应性,导致信号在池化过程中的部分信息丢失。另一方面,对于大型机械设备,由于其本身机理结构复杂、规模大、具有强耦合性,并且运行环境恶劣,使得采集到的信号混有随机噪声,对神经网络的学习能力是重大挑战,严重影响故障诊断模型的准确性。

针对上述问题,提出一种基于多尺度深度神经网络的故障诊断方法。首先使用混有噪声的原始时域信号作为输入;其次使用paa(piecewiseaggregateapproximation,paa)算法对输入信号进行下采样,获得不同尺度的信号表示。这种方式能够在一定程度上滤除高频扰动和随机噪声,能够有效的在时域上表征信号的特征。另一方面,还可以防止模型过拟合。如图2中b,c所示,经过下采样是原来的二分之一和下采样是原来的四分之一之后,锯齿状明显减少,也代表噪声和高频明显减少。为了提高模型在特征提取过程中的表达能力,并增强信号在传递过程的鲁棒性与无损性,采用基于注意力机制的长短记忆网络(attentionlongshort-termmemory,alstm)与全卷积神经网络(fullyconvolutionalnetworks,fcn)对多尺度信号进行特征提取。然后将多尺度提取的特征进行融合,最后利用多分类函数进行故障诊断。



技术实现要素:

本发明的目的是为了解决使用人工诊断机械故障的准确率和效率低的问题,而提出的基于多尺度深度神经网络的旋转机械故障诊断方法。

上述发明目的主要是通过以下技术方案实现的:

基于多尺度深度神经网络的旋转机械故障诊断方法,其特征在于首先对输入信号下采样,获得不同尺度的信号表示,其次利用基于注意力机制的长短时记忆网络和多尺度卷积神经网络进行特征提取,然后融合多尺度特征,最后使用分类器对融合后的特征分类,所述方法包含以下步骤:

s1、准备训练数据集,并对数据集进行下采样,得到多尺度信号表示;

采用多尺度的方式对输入信号下采样有助于增强特征提取;本发明使用不同的尺度对输入信号进行下采样,比如对于输入信号x={x1,x2,...,xn},xi为第i个输入信号的值,n是输入信号的长度,通过逐段聚集平均(piecewiseaggregateapproximation,paa)算法进行下采样,获得不同尺度的信号表示{y(window)},window表示尺度,例如当window=2时,下采样信号后为{x0,x2,...,xn2},其可以在一定程度上滤除高频扰动和随机噪声。

s2、利用多尺度卷积神经网络对多尺度信号做特征提取;

目前大多数的研究方法都是通过单尺度卷积核提取特征,但是这种方式会导致特征提取不全面的问题;所以本发明提出使用时间卷积作为全卷积神经网络(fullyconvolutionalnetwork,fcn)的分支用来做多尺度的特征提取,首先使用不同大小的卷积核对多尺度信号提取特征;其次通过串联(concatenate)的方式融合特征;然后再次进行卷积操作;最后利用全局平均池化(globalaveragepooling,gap)对整个网路在结构上做正则化防止过拟合;为了加快训练速度,在第一层融合后,第二层和第三层均使用批标准化(batchnormalization,bn)。s3、利用基于注意力机制的长短时记忆网络对多尺度信号做特征提取;

为了捕获信号中的时间信息,本发明使用基于注意力机制的lstm(attentionlongshort-termmemory,alstm)对多尺度信号进行特征提取,为了防止过拟合,在alstm之后添加dropout层;lstm可以捕获信号中的时间信息,使用注意力机制来关注特征的重要程度;上下文向量c以目标序列y为条件;上下文ci取决于编码器将输入序列映射到隐藏层状态(h1,...,htx),每一个隐藏层状态hi都包含有关整个输入序列的信息,上下文向量ci为隐藏层状态的加权求和:

每个隐藏层状态的权重如下:

其中eij为:

其中ci是上下文向量,hi是编码器隐藏层状态,si-1是解码器隐藏层状态,wa,ua是权重。

s4、将s2和s3提取的多尺度特征进行融合;

设在多尺度特征提取之后,输出的特征为o1...oi和os...on;本发明采用concatenate的方式将卷积神经网络和长短时记忆网络提取的特征进行融合。融合之后的结果为:

o=[o1...oi...os...on](4)

卷积神经网络对于提取深层次特征具有很好的效果,长短时记忆网络能够捕捉长时依赖的信号特征,使用以上两种方式对信号做特征提取并融合,不仅有利于表达每段信号的特征,还有利于提取信号之间的依赖关系,两者相结合能够更好地表示特征,从而有利于提高故障分类的准确率和鲁棒性。

s5、将融合之后的特征,放入全连接层,使用分类器进行分类。

发明效果

本发明针对轴承等旋转机械故障诊断靠人工检测准确率和效率偏低的问题,提出一种基于多尺度深度神经网络的旋转机械故障诊断方法,即利用多尺度下采样的方法表示信号,对输入信号进行多尺度特征提取。模型分别在江南大学轴承数据集(jiangnanuniversitybearingdatasets,jnu)、机械故障预防技术学会轴承数据集(machineryfailurepreventiontechnologybearingdatasets,mfpt)以及时间序列数据集(ucrtimeseriesclassificationarchive,ucrtsc)上进行了多次实验;实验结果如表1-4所示,本发明提出的多尺度深度神经网络故障诊断方法在以上三种数据集上都具有很高准确率和抗噪鲁棒性。

表1ucr数据集的不同模型实验对比accuracy(%)

表2mfpt和jnu数据集的不同模型实验对比accuracy(%)

表3mfpt数据集的不同模块实验accuracy(%)

表4jnu数据集的抗噪性能实验accuracy(%)

附图说明

图1传统方法和深度学习方法比较图示;

图2信号下采样示意图;

图3模型结构图;

具体实施方法

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1:

本发明提供的基于多尺度深度神经网络的旋转机械故障诊断方法,模型结构如图1所示,主要由多尺度下采样,多尺度特征提取,特征融合和分类4个部分组成:

所述模型训练包含步骤:

s1、准备训练数据集,并对数据集进行下采样,得到多尺度信号表示;

s2、利用多尺度卷积神经网络对多尺度信号做特征提取;

s3、利用基于注意力机制的长短时记忆网络对多尺度信号做特征提取;

s4、将s2和s3提取的多尺度特征进行融合;

s5、将融合之后的特征,放入全连接层,使用softmax函数进行分类。

本发明实施例方法是先对输入信号下采样,获得不同尺度的信号表示,其次利用基于注意力机制的长短时记忆网络和多尺度卷积深度神经网络进行特征提取,然后融合多尺度特征,最后使用softmax对融合后的特征分类。

下面对本发明实施例进行详细的说明:

1、信号多尺度下采样:

采用多尺度的方式对输入信号下采样有助于增强特征提取;本发明使用不同的尺度对输入信号进行下采样,比如对于输入信号x={x1,x2,...,xn},xi为第i个输入信号的值,n是输入信号的长度,通过逐段聚集平均(piecewiseaggregateapproximation,paa)算法进行下采样,获得不同尺度的信号表示{y(window)},window表示尺度,例如当window=2时,下采样信号后为其可以在一定程度上滤除高频扰动和随机噪声。

2、多尺度卷积神经网络做特征提取:

目前大多的研究方法主要是通过单尺度卷积核提取特征,但是这种方式会导致信号特征提取不全面的问题;因此本发明使用时间卷积作为全卷积神经网络(fullyconvolutionalnetwork,fcn)的分支用来做多尺度的特征提取。时间卷积网络的输入通常是时间序列信号,定义是对于时间步长t(0<t<t)和长度fo的输入,其中时间t是可变的,每一层中时间步长是tl。标签是yt∈{1,...,c},c是类别个数。因有l个卷积层,为了捕获输入信号的特征,在每个卷积层使用一维滤波器。定义每层滤波器由权重和偏置参数化,其中l∈{1,...,l}是第l层,d是时间间隔。假设第l层,第i个单元的激活矩阵和上一层的激活矩阵的关系如下:

其中f()是线性整流(relu)函数。首先,使用不同大小的卷积核对多尺度信号特征提取,卷积核的个数均为128;其次,通过串联(concatenate)的方式融合特征;然后再进行两次卷积操作,卷积核的个数分别是256和128,图3模型结构中conv为卷积;最后利用全局平均池化(globalaveragepooling,gap)对特征进行展平。为了加快训练,在第一层融合后,第二层和第三层使用批标准化(batchnormalization,bn),此方法中使用relu激活函数。

3、基于注意力机制的长短时记忆网络做特征提取:

为了捕获信号中的时间信息,本发明使用基于注意力机制的lstm(attentionlongshort-termmemory,alstm)的方法对多尺度信号进行特征提取。lstm可以捕获信号中的时间信息,使用注意力机制关注特征的重要程度。为了防止过拟合,在alstm之后添加dropout层。rnn的具体介绍如下:

ht=tanh(wht-1+ixt)(6)

其中tanh为激活函数,w是循环权重,i为预测权重。循环神经网络中,隐藏状态h用于做预测:

yt=softmax(wht-1)(7)

softmax是计算每类的概率,σ是激活函数,w为权重。如果将h作为另一个rnn的输入,可以创建堆叠rnns。

lstm是对rnn的改进,解决了rnn梯度消失和梯度爆炸的问题。其定义如下:

gu=σ(wuht-1+iuxt)(9)

gf=σ(wfht-1+ifxt)(10)

go=σ(woht-1+ioxt)(11)

gc=tanh(wcht-1+icxt)(12)

mt=gfmt-1+gugc(13)

ht=tanh(gomt)(14)

其中,σ为激活函数,为元素相乘,wu,wf,wo,wc是循环权重矩阵,iu,if,io,ic是预测矩阵。lstm可以捕获信号的时间信息,利用注意力机制确定特征的重要程度。其上下文向量c以目标序列y为条件。上下文ci取决于编码器将输入序列映射到隐藏层状态每一个隐藏层状态hi都包含有关整个输入序列的信息,并且重点放在输入序列第i个周围部分。上下文向量ci为隐藏层状态的加权求和:

每个隐藏层状态的权重如下:

其中eij为:

其中,ci是上下文向量,hi是编码器隐藏层状态,si-1是解码器隐藏层状态,wa,ua是权重。使用注意力机制的lstm(attentionlongshort-termmemory,alstm)对多尺度信号进行特征提取,为了防止过拟合,在alstm之后添加dropout层。

4、多尺度特征融合

设在多尺度特征提取之后,输出的特征为o1...oi和os...on;本发明采用concatenate的方式将卷积神经网络和长短时记忆网络提取的特征进行融合。融合之后的结果为:

o=[o1...oi...os...on](18)

5、softmax分类

在特征融合之后,直接连接全连接层,激活函数使用relu,分类使用softmax函数。为了加快收敛速度,模型采用交叉熵作为损失函数,具体如下:

其中,n是样本的数量,m是类别的数量,yic是指示变量(0,1),如果该类别和样本i的类别相同则为1,否则为0,pic是对于观测样本i属于类别c的预测概率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1