基于WDCNN-LSTM的轴承故障诊断方法及系统

文档序号:33624831发布日期:2023-03-25 16:26阅读:79来源:国知局
基于WDCNN-LSTM的轴承故障诊断方法及系统
基于wdcnn-lstm的轴承故障诊断方法及系统
技术领域
1.本发明涉及轴承故障诊断技术领域,尤其涉及基于wdcnn-lstm的轴承故障诊断方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.轴承是电机最重要的零件之一,轴承故障会直接影响到电机的运转,严重甚至会造成电机损伤和使用寿命缩短,突发性的故障更可能会造成人员受伤和高额经济损失,因此对电机轴承进行精准的、实时的故障诊断十分重要。
4.振动信号分析是电机轴承故障诊断中常用的方法。传统的故障诊断方法依靠人类专业知识提取特征并判断其故障状态。传统的特征提取方法是对振动信号分别在时域、频域或者时频域中采用时域统计分析、短时傅里叶变换、小波变换和经验模态分解等方法提取其特征,提取的特征依靠人类丰富的经验来判断具体故障状态,十分耗时耗力,所以需要更加便利的方法提取特征。
5.在过去几年时间里,基于深度学习的方法得到了快速发展,针对轴承故障类型识别困难的问题,以深度学习为主的模式识别方法成为了研究的热点。
6.同样,使用深度学习进行轴承故障诊断和轴承寿命预测也取得了一定的成果。张等提出一种基于第一层宽卷积核的卷积神经网络(deep convolutional neural networks with wide first-layer kernel,wdcnn),第一层卷积采用宽卷积核,增大了感受野,与传统的卷积神经网络相比极大提高了故障诊断的精度。宫文峰等采用全局均值池化技术代替传统cnn的全连接部分,有效解决了传统cnn模型参数过多问题,在减少参数的情况下实现了对轴承的故障诊断。肖雄等将一维振动信号转换为二维灰度图,然后利用卷积神经网络进行特征提取,得到了较好的结果。上述方法在无噪声情况下取得了很好的结果,但是在实际情况中,采集到的振动信号往往伴随着各种随机噪声,这表明无法直接采用带噪声的振动信号对轴承故障做出明确诊断,因此去噪已经成为振动信号处理中一个关键问题。为了解决噪声问题,赵等提出了深度残差收缩网络,将注意力机制与软阈值滤波结合,实现了自适应阈值滤波,在高噪声情况下取得了较好的效果。但是阈值滤波不仅过滤掉了噪声,也会滤掉实际的振动信号,造成原始信号的缺失。卷积自编码网络已经在图像去噪方面得到了广泛应用。为了在滤波的同时,较好的保留原始信号,万齐杨等使用卷积自编码网络去噪,再用cnn网络进行故障诊断。但是该方法用有监督方式进行训练,采用原始振动信号的带噪声时频图作为卷积自编码网络输入,不带噪声时频图作为标签,可实际情况中我们很难得到噪声信号的标签。丁云浩等用一维多尺度卷积自编码网络对轴承故障进行诊断,能在去除噪声的同时较好的还原原始数据。该方法先训练好自编码网络,在网络基础之上添加softmax分类层,对网络进行分类训练微调。但是随着分类训练的进行,预先训练的去噪知识被改变以学习分类,削弱了网络去噪能力。
7.故发明人认为,现有的轴承故障诊断方法不能直接根据含有噪声的振动信号,实现对轴承故障的准确诊断。


技术实现要素:

8.本发明为了解决上述问题,提出了基于wdcnn-lstm的轴承故障诊断方法及系统,构建的轴承故障诊断模型,可以直接对振动信号进行识别,而无需对振动信号进行提前去噪,提高了轴承故障诊断的准确率和效率。
9.为实现上述目的,本发明采用如下技术方案:
10.第一方面,提出了基于wdcnn-lstm的轴承故障诊断方法,包括:
11.获取轴承的振动信号;
12.根据振动信号和训练好的轴承故障诊断模型,获得轴承故障诊断结果;
13.其中,轴承故障诊断模型包括空间特征提取路径和时间特征提取路径;时间特征提取路径包括依次连接的卷积层和lstm;振动信号分别输入时间特征提取路径和空间特征提取路径中,提取时间特征和空间特征;将时间特征和空间特征进行融合,获得融合特征;对融合特征进行识别,获得轴承故障诊断结果。
14.第二方面,提出了基于wdcnn-lstm的轴承故障诊断系统,包括:
15.信号获取模块,用于获取轴承的振动信号;
16.故障诊断模块,用于根据振动信号和训练好的轴承故障诊断模型,获得轴承故障诊断结果;
17.其中,轴承故障诊断模型包括空间特征提取路径和时间特征提取路径;时间特征提取路径包括依次连接的卷积层和lstm;振动信号分别输入时间特征提取路径和空间特征提取路径中,提取时间特征和空间特征;将时间特征和空间特征进行融合,获得融合特征;对融合特征进行识别,获得轴承故障诊断结果。
18.第三方面,提出了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成基于wdcnn-lstm的轴承故障诊断方法所述的步骤。
19.第四方面,提出了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成基于wdcnn-lstm的轴承故障诊断方法所述的步骤。
20.与现有技术相比,本发明的有益效果为:
21.1、本发明提出的轴承故障诊断模型,通过空间特征提取路径和时间特征提取路径从振动信号中获取了空间特征和时间特征,对空间特征和时间特征融合后特征进行识别,提高了轴承故障诊断的准确率。
22.2、本发明的时间特征提取路径在lstm之前添加了宽卷积核的卷积层,有助于抑制原始输入信号中的高频噪声,也有助于学习有用的特征以馈送到lstm块中,使得lstm提取的时间特征更全面有效。
23.3、本发明在lstm中增加了长期记忆链深度,发掘了数据在时序上的有趣关联,进一步保证了提取的时间特征的全面有效性,提高轴承故障诊断的准确率。
24.4、本发明将wdcnn和lstm进行结合。所提出的模型不需要对数据或特征工程进行大量预处理,可以直接作用于原始的数据,不需要手动去提取特征或者是去除噪声。
25.本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
26.构成本技术的一部分的说明书附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。
27.图1为实施例1公开轴承故障诊断模型的整体架构图;
28.图2为实施例1公开的wdcnn结构图;
29.图3为实施例1公开轴承故障诊断模型的效果验证图。
具体实施方式
30.下面结合附图与实施例对本发明作进一步说明。
31.应该指出,以下详细说明都是例示性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
32.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
33.实施例1
34.在该实施例中,公开了基于wdcnn-lstm的轴承故障诊断方法,包括:
35.获取轴承的振动信号;
36.根据振动信号和训练好的轴承故障诊断模型,获得轴承故障诊断结果;
37.其中,轴承故障诊断模型包括空间特征提取路径和时间特征提取路径;时间特征提取路径包括依次连接的卷积层和lstm;振动信号分别输入时间特征提取路径和空间特征提取路径中,提取时间特征和空间特征;将时间特征和空间特征进行融合,获得融合特征;对融合特征进行识别,获得轴承故障诊断结果。
38.对轴承故障诊断模型进行详细说明,轴承故障诊断模型如图1所示,包括空间特征提取路径、时间特征提取路径、全连接层(concatenate)和softmax层。
39.目前,常用的二维卷积神经网络,这种网络结构均含有堆叠式的3
×
3的卷积核。这样既可以加深网络深度,也可以实现以较少的参数,获取较大的感受野,从而抑制过拟合。然而,对于一维振动信号,两层3
×
1卷积的结构,以6个权值为代价,仅仅获取了5
×
1的感受野,反而将上述优势变成了劣势,因此视觉领域的网络结构不适用于轴承故障诊断领域。
40.然而在轴承故障诊断领域,使用这种双层3*1的卷积结构,不能达到好的效果,反而将网络的优势变成了劣势。
41.本实施例的空间特征提取路径采用第一层宽卷积核的卷积神经网(deep convolutional neural networks with wide first-layer kernel,wdcnn),如图2所示,wdcnn包括多个依次连接的卷积块(cnn block),每个卷积块均包括卷积层、relu层和池化层,最后一层卷积块依次连接全连接层和softmax层,其中,首层卷积层采用宽卷积核,宽卷
积核的宽度为64,具体尺寸为:64x1,其余卷积层的卷积核宽度为3,大小为:3x1。
42.将获取的轴承的振动信号输入wdcnn中,输出振动信号的空间特征向量,wdcnn的输出输入flatten层中进行降维处理,输出空间特征。
43.通过使用wdcnn能够抑制振动信号的高频噪声,从而使得获取的空间特征更准确。
44.时间特征提取路径包括依次连接的卷积层和lstm,其中,卷积层采用宽卷积核,其尺寸大小为:64x1,通过在lstm之前使用宽滤波核的1d卷积层路径,能够抑制振动信号中的高频噪声,有助于学习有用的特征以馈送到lstm中。
45.lstm是一种循环神经网络(rnn)的特殊类型,rnn在处理时间序列的问题上有着不错的效果,并且能用减少训练的次数,在故障诊断方面能够抑制输入信号中的高频噪声,rnn和其他的神经网络相似,同样是采用误差反向传播和梯度下降的方式进行更新权重。虽然rnn建立了不同时刻隐藏层之间的联系,实现了记忆的效果,但只是基于前一时刻,由于rnn的“记忆”难以持久,时序上的依赖不可以无限的延伸,所以lstm就出现了。
46.lstm在rnn的基础上增加了一个新的时间链long-term memory,f1根据s
t-1
和输入x
t
决定要修改那些记录,如公式(1)表示:
[0047][0048]
函数f2根据s
t-1
和输入x
t
来决定增加哪些记录,如公式(2)表示;其中,sigmoid函数取值在0-1之间,tanh函数在-1到1之间;
[0049][0050]
两步相结合就得
[0051]ct
=f1*c
t-1
+f2[0052]
其中,w1代表的删除时的权重矩阵,w2代表的增加时的权重矩阵,b1代表删除时偏置,b2代表增加时偏置,为w2的近似估计,为b2的近似估计,s
t
为t时刻lstm中数据情况,包含当前x作为的输入,同时包含上一时刻s
t-1
的状态信息和c
t
的信息。
[0053]
保留短期记忆链s
t
和长期记忆链c
t
并且相互更新,这就是lstm的优势,lstm深度发掘了数据在时序上的有趣关联,通过增加长期记忆链c
t
,能够帮助捕获跨越大量时间步长的动态时间特征,这些时间上不同的lstm路径学习到的特征可以补充卷积路径学习到的更局部的特征,并改善最终的分类结果。
[0054]
将获得的轴承的振动信号输入时间特征提取路径中,先经过卷积层进行振动信号中高频噪声抑制,再通过lstm获取时间特征。
[0055]
将空间特征提取路径输出的空间特征、时间特征提取路径输出的时间特征输入全连接层中进行融合,获得融合特征。
[0056]
将融合特征输入softmax层中,通过对融合特征进行识别,获得轴承故障诊断结果。
[0057]
利用轴承数据中心的数据集对本实施例提出的轴承故障诊断模型进行验证,通过
实验发现,在噪声小的情况下,所有算法的性能都很好,然而随着噪声水平的增加,本实施例构建的轴承故障诊断模型的性能明显优于其他方法,在信噪比-4db的情况下,更是获得了98%的精度,如图3所示。
[0058]
本实施例公开的轴承故障诊断方法,通过在空间特征提取路径中采用wdcnn、并在lstm之前使用宽卷积核的卷积层,能够抑制振动信号中的高频噪声,从而实现了不对振动噪声进行预处理,就能根据振动噪声完成轴承故障的准确识别。
[0059]
实施例2
[0060]
在该实施例中,公开了基于wdcnn-lstm的轴承故障诊断系统,包括:
[0061]
信号获取模块,用于获取轴承的振动信号;
[0062]
故障诊断模块,用于根据振动信号和训练好的轴承故障诊断模型,获得轴承故障诊断结果;
[0063]
其中,轴承故障诊断模型包括空间特征提取路径和时间特征提取路径;时间特征提取路径包括依次连接的卷积层和lstm;振动信号分别输入时间特征提取路径和空间特征提取路径中,提取时间特征和空间特征;将时间特征和空间特征进行融合,获得融合特征;对融合特征进行识别,获得轴承故障诊断结果。
[0064]
实施例3
[0065]
在该实施例中,公开了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1公开的基于wdcnn-lstm的轴承故障诊断方法所述的步骤。
[0066]
实施例4
[0067]
在该实施例中,公开了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1公开的基于wdcnn-lstm的轴承故障诊断方法所述的步骤。
[0068]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1