一种旋转机械的故障诊断方法、装置、设备和介质与流程

文档序号：30183412发布日期：2022-05-26 16:02阅读：74来源：国知局

1.本发明涉及工业互联网技术领域，特别涉及一种旋转机械的故障诊断方法、装置、设备和介质。

背景技术：

2.目前在故障诊断任务中，为确保诊断模型有较好的准确率，需要耗费大量人力、物力去获取不同故障类型充足的有标签数据，而在实际工业生产中，机械设备一般长时间处于正常运行状态，能获取的故障状态数据相对较少，而缺少足够数据会使得模型无法提取到不同故障状态的差异性特征，导致分类器对各类故障的识别率下降。因此，对于某些故障样本数据稀少甚至缺失的情况下，如何提高诊断模型的识别率，目前有着极为迫切的现实需求。目前，故障诊断问题常用的方法是深度学习模型。但是，传统的深度学习模型的学习能力有限，有2个重要问题需要克服：(1)模型需要大量带有标签的数据来提升训练效果，但是数据标签需要耗费巨大的时间和财力成本；(2)现有模型不具备强大的推理能力，没法从以往的学习中获得推理性经验。在故障样本数据稀少的情况下，传统的深度学习网络模型的预测准确性并不理想，因此，需要充分利用样本携带的信息，提升模型对样本的特征提取能力和分类及预测能力。
3.孪生神经网络(siamese network)是一类特殊的深度学习模型。该算法同时接收多个输入样本，计算两个样本之间的相似度，通过损失函数控制梯度下降实现优化学习。当训练样本容量为n时，若每次向孪生网络中输入两个样本(两个样本可能是训练集中的同一样本，此时两个输入不存在差异)，通过这种方法网络可以用n个样本就可以进行n
×
(n-1)次比较。使用孪生神经网络方法可以在训练样本较小的情况下，对样本进行充分训练提高模型有效训练次数，挖掘样本之间的关系，避免因样本量不足而引起过拟合的现象。但是，由于孪生神经网络是一种基于度量学习的方法，它直接通过对嵌入空间内的样本特征进行对比从而实现分类。这使得在训练过程中相同类别的样本会逐渐聚集，不同类别之间的样本会因为互相排斥形成一个间隔空间。由于同种类别中的个别样本也可能具有某些差异性，将这种差异带入到最终的损失函数中，会对网络的优化路径及收敛速度产生副作用，进而影响样本的聚类效果。

技术实现要素：

4.本发明要解决的技术问题，在于提供一种旋转机械的故障诊断方法、装置、设备和介质，能够在某些故障样本数据稀少甚至缺失的情况下，有效提高诊断模型的识别率，同时尽可能减小个别样本本身存在的差异性对模型预测效果的影响。
5.第一方面，本发明提供了一种旋转机械的故障诊断方法，包括：
6.s1、采集旋转机械在不同负载下滚动轴承不同状态的振动加速度数据并进行标准归一化处理，再按照轴承的故障类型进行标签分类，得到有标签的样本；
7.s2、对有标签的样本构建支撑集s＝{(x1,y1),(x2,y2),
…
(xk,yk)}，其中，k为标签
种类的数量，代表具有k种故障类型，xk表示所有标签为k的样本构成的子集；
8.s3、构建孪生卷积神经网络模型，随机从支撑集的k种轴承故障类型中选取轴承故障类别为q的某一样本和剩余k-1类故障中的n个样本及类别q中的剩余样本共同构成样本对，送入所述孪生卷积神经网络模型中进行训练，得到特征嵌入网络；
9.s4、通过所述特征嵌入网络将所述支撑集中每个类别中的待测样本数据统一映射到一个相同的特征嵌入空间中，使得所述特征嵌入空间中的同类别待测样本会围绕一个虚拟的代表待测样本公共特征的原型点聚集成簇；
10.s5、将输入的待测样本与所述支撑集中每个类别的原型点进行比较，分别计算每个待测样本与每个原型点的欧氏距离，从中筛选出与待测样本欧氏距离最小的原型类别，作为该待测样本故障类别的诊断结果。。
11.第二方面，本发明提供了一种旋转机械的故障诊断装置，包括：
12.样本获取模块，用于采集旋转机械在不同负载下滚动轴承不同状态的振动加速度数据并进行标准归一化处理，再按照轴承的故障类型进行标签分类，得到有标签的样本；
13.支撑集构建模块，用于对有标签的样本构建支撑集s＝{(x1,y1),(x2,y2),
…
(xk,yk)}，其中，k为标签种类的数量，代表具有k种故障类型，xk表示所有标签为k的样本构成的子集；
14.特征嵌入网络构建及训练模块，用于构建孪生卷积神经网络模型，随机从支撑集的k种轴承故障类型中选取轴承故障类别为q的某一样本和剩余k-1类故障中的n个样本及类别q中的剩余样本共同构成样本对，送入所述孪生卷积神经网络模型中进行训练，得到特征嵌入网络；
15.映射模块，用于通过所述特征嵌入网络将所述支撑集中每个类别中的待测样本数据统一映射到一个相同的特征嵌入空间中，使得所述特征嵌入空间中的同类别待测样本会围绕一个虚拟的代表待测样本公共特征的原型点聚集成簇；
16.故障类别诊断模块，将输入的待测样本与所述支撑集中每个类别的原型点进行比较，分别计算每个待测样本与每个原型点的欧氏距离，从中筛选出与待测样本欧氏距离最小的原型类别，作为该待测样本故障类别的诊断结果。
17.第三方面，本发明提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面所述的方法。
18.第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面所述的方法。
19.本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：本发明使用孪生卷积神经网络模型解决轴承机械故障诊断中因样本量稀少而影响预测效果的问题；使用原型去替换实际样本构建网络，可以避免相同样本间的无关差异性干扰诊断，同时避免不同类别样本间可能出现的偶然相似性。此外，无论是在网络推理还是相似度计算阶段，用原型替代真实样本构建支撑集，能够减少网络在训练中的抖动现象，更有助于网络更快找到全局最优解，提高模型收敛速度。
20.上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。
附图说明
21.下面参照附图结合实施例对本发明作进一步的说明。
22.图1为本发明实施例一中方法中的流程图；
23.图2为本发明中孪生卷积神经网络诊断模型的设计方法；
24.图3为本发明孪生卷积神经网络诊断模型的特征提取模块原理图；
25.图4为少样本情况下故障诊断识别率实验结果；
26.图5为本发明实施例二中装置的结构示意图；
27.图6为本发明实施例三中电子设备的结构示意图；
28.图7为本发明实施例四中介质的结构示意图。
具体实施方式
29.本技术实施例通过提供一种旋转机械的故障诊断方法、装置、设备和介质，能够在某些故障样本数据稀少甚至缺失的情况下，有效提高诊断模型的识别率，同时尽可能减小个别样本本身存在的差异性对模型预测效果的影响。
30.本技术实施例中的技术方案，总体思路如下：使用孪生卷积神经网络模型解决旋转机械故障诊断中因样本量稀少而影响预测效果准确性的问题；使用原型去替换实际样本构建网络，可以避免相同样本间的无关差异性干扰诊断，同时避免不同类别样本间可能出现的偶然相似性。此外，无论是在网络推理还是相似度计算阶段，用原型替代真实样本构建支撑集，能够减少网络在训练中的抖动现象，更有助于网络更快找到全局最优解，提高模型收敛速度。
31.实施例一
32.如图1和图2所示，本实施例提供一种旋转机械的故障诊断方法，包括：
33.s1、采集旋转机械在不同负载下滚动轴承不同状态的振动加速度数据并进行标准归一化处理，再按照轴承的故障类型进行标签分类，得到有标签的样本；
34.例如下表中，是根据不同位置的损伤尺寸进行分类，得到0-8个标签分类，加上健康一个类别，共9个标签分类：
[0035][0036]
s2、对有标签的样本构建支撑集s＝{(x1,y1),(x2,y2),
…
(xk,yk)}，其中，k为标签种类的数量，代表具有k种故障类型，xk表示所有标签为k的样本构成的子集；
[0037]
s3、构建孪生卷积神经网络模型，随机从支撑集的k种轴承故障类型中选取轴承故障类别为q的某一样本和剩余k-1类故障中的n个样本及类别q中的剩余样本共同构成样本对，送入所述孪生卷积神经网络模型中进行训练，得到特征嵌入网络；
[0038]
s4、通过所述特征嵌入网络将所述支撑集中每个类别中的待测样本数据统一映射到一个相同的特征嵌入空间中，使得所述特征嵌入空间中的同类别待测样本会围绕一个虚拟的代表待测样本公共特征的原型点聚集成簇；
[0039]
s5、将输入的待测样本与所述支撑集中每个类别的原型点进行比较，分别计算每个待测样本与每个原型点的欧氏距离，从中筛选出与待测样本欧氏距离最小的原型类别，作为该待测样本故障类别的诊断结果。
[0040]
所述特征嵌入网络是通过深层嵌入网络卷积计算的方式实现旋转机械振动信号的故障特征提取及空间嵌入，相似的故障样本在经过特征提取变换后，得到相似的空间特征，原本不同类别的故障样本经过特征提取变换后得到不相似的空间特征。
[0041]
如图3所示，所述孪生卷积神经网络模型是一维多尺度注意力的卷积神经网络，包括多尺度特征提取模块和注意力特征加权模块，层结构如下：
[0042]
第一层卷积采用32个64
×
1的卷积核；
[0043]
第二层的多尺度分支为三个，每个尺度使用相同的注意力卷积结构，卷积核大小分别为3
×
1、7
×
1、11
×
1，卷积核数量都为16个；
[0044]
第三、四、五层卷积分别使用64个大小为6
×
1、10
×
1的卷积核，所有池化操作的大小全部为4
×
1；
[0045]
最后一层卷积特征提取层在bn层后直接接上注意力模块、全局池化操作，输出的特征图为64维。
[0046]
所述步骤s3的训练过程中，使用原型对比的损失函数指导孪生卷积神经网络模型对输入样本对进行相似度学习；所述原型对比的损失函数由经验损失和正则项损失两部分组成；具体公式如下：
[0047][0048][0049]
其中，l是最终的损失函数，l(y,x,c)为经验损失函数，为正则项损失，λ代表正则项系数，w代表网络权重，n代表输入样本数量，x代表输入样本，y代表实际故障类别标签，yi代表第i对样本是否相同，c
kj
代表第k类故障的样本原型的第j维特征值，m代表用于调节函数整体收敛力度的超参数；
[0050]
任一类故障的所述样本原型的计算公式描述如下：
[0051][0052]
其中ck代表第k类故障的原型，sk代表第k类故障的样本集，f
θ
(
·
)代表嵌入网络，xi代表第k类的第i个样本。
[0053]
如图4所示，为少样本情况下故障诊断识别率实验结果示意图。
[0054]
基于同一发明构思，本技术还提供了与实施例一中的方法对应的装置，详见实施例二。
[0055]
实施例二
[0056]
如图5所示，在本实施例中提供了一种旋转机械的故障诊断装置，包括：
[0057]
样本获取模块，用于采集旋转机械在不同负载下滚动轴承不同状态的振动加速度数据并进行标准归一化处理，再按照轴承的故障类型进行标签分类，得到有标签的样本；
[0058]
支撑集构建模块，用于对有标签的样本构建支撑集s＝{(x1,y1),(x2,y2),...(xk,yk)}，其中，k为标签种类的数量，代表具有k种故障类型，xk表示所有标签为k的样本构成的子集；
[0059]
特征嵌入网络构建及训练模块，用于构建孪生卷积神经网络模型，随机从支撑集的k种轴承故障类型中选取轴承故障类别为q的某一样本和剩余k-1类故障中的n个样本及类别q中的剩余样本共同构成样本对，送入所述孪生卷积神经网络模型中进行训练，得到特征嵌入网络；
[0060]
映射模块，用于通过所述特征嵌入网络将所述支撑集中每个类别中的待测样本数据统一映射到一个相同的特征嵌入空间中，使得所述特征嵌入空间中的同类别待测样本会围绕一个虚拟的代表待测样本公共特征的原型点聚集成簇；
[0061]
故障类别诊断模块，将输入的待测样本与所述支撑集中每个类别的原型点进行比较，分别计算每个待测样本与每个原型点的欧氏距离，从中筛选出与待测样本欧氏距离最
小的原型类别，作为该待测样本故障类别的诊断结果。
[0062]
所述特征嵌入网络是通过深层嵌入网络卷积计算的方式实现旋转机械振动信号的故障特征提取及空间嵌入，相似的故障样本在经过特征提取变换后，得到相似的空间特征，原本不同类别的故障样本经过特征提取变换后得到不相似的空间特征。
[0063]
如图3所示，所述孪生卷积神经网络模型是一维多尺度注意力的卷积神经网络，包括多尺度特征提取模块和注意力特征加权模块，层结构如下：
[0064]
第一层卷积采用32个64
×
1的卷积核；
[0065]
第二层的多尺度分支为三个，每个尺度使用相同的注意力卷积结构，卷积核大小分别为3
×
1、7
×
1、11
×
1，卷积核数量都为16个；
[0066]
第三、四、五层卷积分别使用64个大小为6
×
1、10
×
1的卷积核，所有池化操作的大小全部为4
×
1；
[0067]
最后一层卷积特征提取层在bn层后直接接上注意力模块、全局池化操作，输出的特征图为64维。
[0068]
所述特征嵌入网络构建及训练模块在训练过程中，使用原型对比的损失函数指导孪生卷积神经网络模型对输入样本对进行相似度学习；所述原型对比的损失函数由经验损失和正则项损失两部分组成；具体公式如下：
[0069][0070][0071]
其中，l是最终的损失函数，l(y,x,c)为经验损失函数，为正则项损失，λ代表正则项系数，w代表网络权重，n代表输入样本数量，x代表输入样本，y代表实际故障类别标签，yi代表第i对样本是否相同，c
kj
代表第k类故障的样本原型的第j维特征值，m代表用于调节函数整体收敛力度的超参数；
[0072]
任一类故障的所述样本原型的计算公式描述如下：
[0073][0074]
其中ck代表第k类故障的原型，sk代表第k类故障的样本集，f
θ
(
·
)代表嵌入网络，xi代表第k类的第i个样本。
[0075]
如图4所示，为少样本情况下故障诊断识别率实验结果示意图。
[0076]
由于本发明实施例二所介绍的装置，为实施本发明实施例一的方法所采用的装置，故而基于本发明实施例一所介绍的方法，本领域所属人员能够了解该装置的具体结构及变形，故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。
[0077]
基于同一发明构思，本技术提供了实施例一对应的电子设备实施例，详见实施例三。
[0078]
实施例三
[0079]
本实施例提供了一种电子设备，如图6所示，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时，可以实现实施例一中任一实施方式。
[0080]
由于本实施例所介绍的电子设备为实施本技术实施例一中方法所采用的设备，故而基于本技术实施例一中所介绍的方法，本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式，所以在此对于该电子设备如何实现本技术实施例中的方法不再详细介绍。只要本领域所属技术人员实施本技术实施例中的方法所采用的设备，都属于本技术所欲保护的范围。
[0081]
基于同一发明构思，本技术提供了实施例一对应的存储介质，详见实施例四。
[0082]
实施例四
[0083]
本实施例提供一种计算机可读存储介质，如图7所示，其上存储有计算机程序，该计算机程序被处理器执行时，可以实现实施例一中任一实施方式。
[0084]
本技术实施例中提供的技术方案，至少具有如下技术效果或优点：本发明使用孪生卷积神经网络模型解决轴承机械故障诊断中因样本量稀少而影响预测效果的问题；使用原型去替换实际样本构建网络，可以避免相同样本间的无关差异性干扰诊断，同时避免不同类别样本间可能出现的偶然相似性。此外，无论是在网络推理还是相似度计算阶段，用原型替代真实样本构建支撑集，能够减少网络在训练中的抖动现象，更有助于网络更快找到全局最优解，提高模型收敛速度。
[0085]
本领域内的技术人员应明白，本发明的实施例可提供为方法、装置或系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0086]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0087]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0088]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0089]
虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本
领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑松唐斯段立伟郑蓉刘朝儒陈松彬颜明泽夏长星
技术所有人：爱普（福建）科技有限公司
我是此专利的发明人

上一篇：一种玻尿酸复合溶液及其制备方法与流程
上一篇：一种工业协议解析和数据转换的方法和系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。