一种基于数据与机理混合驱动的设备智能故障诊断方法

文档序号:37154003发布日期:2024-02-26 17:12阅读:19来源:国知局
一种基于数据与机理混合驱动的设备智能故障诊断方法

本发明属于联邦学习,具体涉及一种基于数据与机理混合驱动的设备智能故障诊断方法。


背景技术:

1、随着数字化制造在工业领域的快速发展,数据驱动的深度学习模型在机械设备健康管理领域得到了迅速发展。卷积神经网络、递归神经网络、深度信念网络等方法不仅减轻了对操作人员专业知识的要求,而且能够快速处理海量数据,广泛应用于航空航天、汽车、船舶、智能制造等行业。

2、尽管现有的深度学习模型在旋转机械关键部件故障检测的样本识别方面表现令人满意,但其有效性很大程度上依赖于基本假设:1)目标任务样本和训练数据遵循数据独立同分布原则,即两者之间不存在明显的分布差异。2)测试数据本身包含样品的标签信息。然而,在现实工业场景中遇到的挑战比这两种假设要复杂得多。训练样本不仅数据质量参差不齐,而且数据之间存在明显的偏移和显著的差异,使得传统的故障诊断策略难以获得预期的结果。因此,li等人提出将混合损失函数集成到多尺度残差网络中,生成高质量的假样本,从而提高诊断模型对故障的灵敏度。liu等利用cramer-vonmises准则提出了一种自适应谐波分量提取模型,有效地消除了噪声干扰,提高了假分量识别的准确性。guo和jiang等人分别从信号处理和图像分析两个不同的角度探讨了旋转设备样本的复合故障信息,分别提出了减轻复合故障引起的模型负传递的方法。

3、可见,目前流行的迁移学习技术主要集中在提高模型对故障样本特征的识别灵敏度上,无法满足极端条件下工业无样本训练场景的要求。jia等提出了一种多表示softmax(mr-softmax)方法来克服特定领域中显著特征引起的迁移限制,并引入了一种不加区分的对抗性训练策略来解决不同源域之间的负迁移问题。zhou等提出了一种利用伪标签提取域间可转移特征对网络进行反向优化的故障诊断策略,用于解决变工况和跨机传输的诊断任务。chen等人提出了一种对抗性域不变泛化(adig)框架来学习域不变特征。由此可见,学习领域不变特征来解决未知领域带来的挑战是当前领域故障诊断的核心。

4、联邦迁移学习(ftl)作为解决跨设备故障诊断问题同时确保客户端数据隐私的最早策略之一,自诞生以来就受到了广泛关注。ftl是一种分布式机器学习技术,它将模型的训练过程分布到每个源客户端,并对每个客户端完成的网络参数进行集成和分析。这种方法不仅确保了所有参与的客户的数据隐私,而且还通过培训促进了客户之间的知识共享,如图1所示。因此,超光速方法得到了越来越多研究者的讨论和探索。如li等人提出了一种多任务联合学习的联邦学习策略,通过约束低复杂度算法的损失函数,实现了车联网凸目标函数的推导。为了解决目标任务中的领域适应偏差问题,peng等提出将联邦学习策略纳入对抗性领域适应网络,有效提高了模型的诊断准确率。此外,zhang等人提出将先验分布纳入局部模型,以减轻联邦通信期间的网络负迁移,有效解决数据隐私问题,同时提高模型诊断准确性。域差异引起的协变量偏移是一直以来联邦学习面临的问题,也是迁移学习中要面临的问题;现有的网络关注信号的整体特征,并没有考虑到信号特定的提取场景、信号本身存在的噪声,以及不同设备的个性化差异等情况对信号的影响。


技术实现思路

1、本发明的目的在于提供一种能够减轻域差异引起的协变量漂移,并纠正网络关注区域的基于数据与机理混合驱动的设备智能故障诊断方法,使全局模型根据每个源客户端的贡献来评估网络参数,提高诊断目标任务的准确率。

2、基于上述目的,本发明采用如下技术方案:

3、一种基于数据与机理混合驱动的设备智能故障诊断方法,包括以下步骤:

4、步骤1,每个源客户端对局部模型进行初始化操作。

5、步骤2,使用源域数据对局部模型进行训练,更新局部模型中特征重构器、特征提取器和分类器的参数。

6、步骤3,使用过渡数据对局部模型进行训练,更新局部模型中特征提取器和分类器的参数。过渡数据可以是公开的数据集,或者是每个客户端没有用以训练的其他工况数据,主要为了避免每个源客户端网络形成只基于本地网络形成个性化的定式。

7、步骤4,将局部模型上传到中心服务器,中心服务器根据局部模型对全局模型的特征提取器和分类器的参数更新。

8、步骤5,将全局模型下载到源客户端,使用全局模型对源客户端任务进行反向验证,得到任务验证损失,使用任务验证损失更新该源客户端中局部模型的特征提取器、特征重构器和分类器的参数。

9、步骤6,循环步骤2-5达到设定次数,使用最终的全局模型对目标任务进行验证。

10、进一步的,在步骤2中,使用源域数据对局部模型进行训练包括以下步骤:

11、步骤2.1,在局部模型中输入源域数据、源域数据标签和源域客户端任务,对局部模型进行一次训练,计算损失函数;用分类损失、反馈损失、重构损失和领域差异损失为依据,更新局部模型中特征重构器、特征提取器和分类器的参数。

12、步骤2.2,对局部模型进行一次训练,训练过程中冻结特征提取器的参数,以重构损失和分类损失为依据,更新局部模型中特征重构器和分类器的参数,使特征重构器和分类器更加关注源域和目标域样本的结构特征。

13、步骤2.3,对局部模型进行一次训练,训练过程中冻结分类器的参数,以重构损失、领域差异损失和反馈损失为依据,更新特征重构器和特征提取器的参数,以提高网络对跨域故障样本的诊断性能。

14、步骤2.4,循环步骤2.1-2.3,直到局部模型达到设定的训练次数。

15、进一步的,在步骤2中,重构损失计算如下:

16、

17、式中,lre是重构损失;p1i和p2i分别是p1分布和p2分布的第i个样本的重构特征输出;nk是p1分布或p2分布的样本数。

18、进一步的,在步骤2中,反馈损失计算如下:

19、

20、式中,lf是反馈损失;mmd是最大平均差异;ns是第一组分布的样本数;nt是第二组分布的样本数;τ是样本进入到网络之后,进行的线性与非线性变换;是第一组分布中的第i个样本;是第一组分布的第j个样本;是第二组分布的第i个样本;是第二组分布的第j个样本;k是将原始变量映射到高维空间的映射关系。

21、进一步的,在步骤2中,分类损失计算如下:

22、

23、式中,os是从源域样本中提取的特征;ys是源域样本集的标签集;是第i个源域样本的标签;i[·]是分类器对样本故障类型的概率得分;c是故障标签的总数;c是所有故障标签中的其中一个。

24、进一步的,在步骤2中,领域差异损失计算如下:

25、

26、式中,ld是领域差异损失;π(p,q)是两组分布p和q的所有联合分布的集合,表示从分布p转变为分布q需要从x转移到y的“质量”;x和y是两组分布;e是相应的分布期望。

27、进一步的,在步骤3中,依据wasserstein距离函数更新局部模型中特征提取器和分类器的参数。考虑到转换数据与源客户端数据可能存在较大的分布差异,且可能包含跨设备的样本数据,将wd设置为纠正损失lcor,以调节参数变量。局部模型的特征重构器不参与过渡数据的纠正训练,只对源客户端进行样本重构,不参与联邦通信和目标任务验证过程。

28、进一步的,在步骤4中,对全局模型的特征提取器和分类器的参数更新的方法包括以下步骤:

29、步骤4.1,中心服务器根据源客户端对全局模型诊断知识的贡献对局部模型的参数进行评估;

30、

31、式中,αi,j表示第j轮联邦交互过程中第i个源客户端对全局模型的评价指标;和分别表示第i个源客户端对第j轮联邦交互过程中本地任务的训练精度和验证精度;

32、步骤4.2,将各源客户端中局部模型的分类器的参数和特征提取器的参数分别加权组合,使用加权组合后的参数替换全局模型中分类器的参数和特征提取器的参数。

33、进一步的,在步骤4中,全局模型中特征提取器的参数为:

34、

35、式中,是全局模型中特征提取器的参数;是第k个局部模型中特征提取器的参数;全局模型中分类器的参数为:

36、

37、式中,是全局模型中分类器的参数;是第i个局部模型中分类器的参数。

38、进一步的,在步骤5中,任务验证损失计算如下:

39、

40、式中,lc-cen是源客户端任务的全局模型任务验证损失;m(·)是全局模型的诊断函数;xi是单一样本。

41、一种电子设备,包括一个或多个处理器;还包括存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任一智能故障诊断方法。

42、一种微控单元,载有能执行上述任一智能故障诊断方法的控制协议或程序。

43、与现有技术相比,本发明的有益效果如下:

44、1、现有的网络关注信号的整体特征,并没有考虑到信号特定的提取场景、信号本身存在的噪声,以及不同设备的个性化差异等情况对信号的影响,不应该关注整体特征,而是需要针对诊断的目的,有目的性的关注故障特征。本技术提出了一种基于双纠正训练的联邦迁移学习策略。该方案旨在通过进行两轮纠正训练来增强源客户端的局部模型,从而减轻域差异引起的协变量漂移,并纠正网络关注区域。此外,本技术通过中央服务器评估本地模型中每个参数的重要性。随着训练步骤的逐渐积累,全局模型能够从每个源客户端学习诊断知识,并验证其对目标任务的适用性。同时,增强了局部模型的域泛化性能。

45、2、为了保证客户端数据的隐私性,在源客户端中使用了特征重构器对训练样本和客户端任务样本进行加密,并且所提出方案的训练不需要任何来自目标客户的样本。为了解决训练样本与最终故障样本在目标域中分布差异较大的问题,引入了域差异损失函数。本技术使用wasserstein距离(wd)来评估数据集之间的差异,与其他距离函数相比,wd的求解过程基于线性规划算法,使得局部模型更加稳定和鲁棒,同时缓解了高维数据空间中可能存在的梯度爆炸问题。

46、3、考虑到每个源客户端任务的唯一性,在接收到局部模型参数后,全局模型无法解决目标客户端未知域的复杂诊断任务。在步骤2和步骤3中对源客户端局部模型进行双重纠正训练,使用源域样本和过渡样本分别对局部模型训练,对其进行细化,准确纠正网络参数的注意区域。通过多个函数约束局部模型的训练过程,以减少域差异引起的协变量漂移现象。并通过过渡数据优化局部模型的参数,局部模型通过过渡数据集对训练网络的参数进行微调,以纠正注意区域,最终提高局部网络捕捉样本普遍特征的能力和跨域样本诊断的鲁棒性。

47、4、为了保护每个客户端的数据隐私,在不共享本地信息数据的情况下从每个源客户端获取故障样本的诊断知识。在方案初始化阶段,各源客户端网络对本地目标任务进行模型训练和优化,直至达到训练步长预设值,本地模型上传参数信息。然后,通过接收每个源客户端共享的诊断知识来初始化中心全局模型框架。全局模型根据每个源客户端的贡献来评估网络参数,而不是简单的平均,以提升全局模型的诊断准确率;将历史经验积累机制融入每个源客户端,利用全局模型的诊断经验来优化局部模型参数,同时保持独特的诊断性能。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1