基于多源数据集成的小样本轴承故障模式识别方法和系统

文档序号:36176328发布日期:2023-11-28 23:06阅读:74来源:国知局
基于多源数据集成的小样本轴承故障模式识别方法和系统

本发明涉及机械装备智能运维及健康管理领域,尤其涉及一种基于多源数据集成的小样本轴承故障模式识别方法。


背景技术:

1、在机械装备旋转部件的故障诊断与模式识别过程中,由于零部件的结构复杂以及工况环境的限制,获得的待监测零部件的历史故障数据通常较为有限。轴承故障模式识别通常需要足够的训练数据以建立准确的模型。然而,小样本问题意味着只有有限数量的故障样本可用于训练,并且每种故障模式的样本数量可能不平衡。这导致训练模型面临挑战,因为它可能无法充分学习和表示不同类型的故障。轴承故障监测通常涉及到传感器采集的振动信号数据,而这些数据可能受到环境噪声和干扰的影响。在小样本情况下,由于数据点有限,可能难以准确区分故障信号和噪声信号,从而影响故障模式的识别性能。且,小样本情况下,有效的特征选择和提取变得更加困难。常规的特征选择和提取方法可能无法捕捉到小样本中隐藏的有效信息,由于样本有限,导致提取的特征无法充分反映故障模式的特征差异,从而影响模型的性能。小样本情况下,不同故障类型的样本数量可能不均衡,这会导致模型对于少数类别的故障模式识别能力较差。由于数量有限,可能会出现样本不足以充分学习和区分罕见的故障类型。小样本问题会限制模型在其他轴承系统或实际应用中的泛化能力。因为在实际应用中,轴承可能存在多种型号和工况条件,模型从一个小样本数据集迁移到另一个数据集时可能无法保持良好的性能。


技术实现思路

1、本发明针对现有小样本轴承故障模式下,样本少导致识别困难,且存在识别不准确的问题,提出一种基于多源数据集成的小样本轴承故障模式识别方法,所述方案具体为:

2、一种基于多源数据集成的小样本轴承故障模式识别方法,所述方法包括:

3、s1:根据公开数据集构建多源数据样本;

4、s2:提取多源数据样本特征,并根据所述特征构建n个源域训练集和1个目标域训练集;

5、s3:将所述1个目标域训练集和n个多个源域训练集进行组合,获取组合后的源域训练集;

6、s4:根据所述目标域训练集和组合后的多源域样本集训练基分类器;

7、s5:根据目标域测试集和所述组合后的多源域样本集计算域间分布度量和样本相似度;

8、s6:根据所述域间分布度量和样本相似度构建权重矩阵;

9、s7:根据所述基分类器对待识别的目标域测试集进行分类识别,获得测试集样本的类别概率;

10、s8:根据所述权重矩阵对测试集样本的类别概率进行加权集成,获取目标域测试集的分类结果,完成故障模式识别。

11、进一步的,还提供一种优选方式,所述步骤s2中提取多源数据样本特征包括:

12、提取多源数据样本中的时域特征、频域特征和时频域特征;

13、所述频域特征包括平均频率、均方根频率、频率中心和根方差频率。

14、进一步的,还提供一种优选方式,所述时频域特征由经验模态分解算法获得,利用经验模态分解算法将原始振动信号分解为一组imf分量。

15、进一步的,还提供一种优选方式,所述步骤s3,包括:

16、

17、其中,表示初始的源域训练集,表示有标签的目标域训练集,dsi表示重组的源域训练集,n为源域训练集的数量。

18、进一步的,还提供一种优选方式,所述步骤s4中采用极限学习机训练基分类器。

19、进一步的,还提供一种优选方式,所述步骤s5的域间分布度量和样本相似度具体为:

20、所述域间分布度量为:

21、

22、其中,wj为域间分布度量,x、y表示不同样本集,mmd表示为最大均值差异;

23、所述样本相似度为:

24、

25、其中,vj为样本相似度ns为源域中样本的数量,xt∈dt为一个待分类目标域样本,cosine()为余弦相似度。

26、进一步的,还提供一种优选方式,所述步骤s7具体为:

27、

28、其中,为分类结果,k表示类别标签,表示不同基分类器的分类结果。

29、基于同一发明构思,本发明还提供一种基于多源数据集成的小样本轴承故障模式识别系统,所述系统包括:

30、样本构建单元:用于根据公开数据集构建多源数据样本;

31、特征提取单元:用于提取多源数据样本特征,并根据所述特征构建n个源域训练集和1个目标域训练集;

32、样本重组单元:用于将所述1个目标域训练集和n个源域训练集进行组合,获取组合后的源域训练集;

33、训练单元:用于根据所述目标域测试集和组合后的多源域样本集训练基分类器;

34、计算单元:用于根据目标域测试集和所述组合后的多源域样本集计算域间分布度量和样本相似度;

35、权重矩阵构建单元:用于根据所述域间分布度量和样本相似度构建权重矩阵;

36、多源集成单元:用于根据所述基分类器对待识别的目标域测试集进行分类识别,获得测试集样本的类别概率;

37、识别单元:用于根据所述权重矩阵对测试集样本的类别概率进行加权集成,获取目标域测试集的分类结果,完成故障模式识别。

38、基于同一发明构思,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序执行上述任一项所述的一种基于多源数据集成的小样本轴承故障模式识别方法。

39、基于同一发明构思,本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行上述中任一项所述的一种基于多源数据集成的小样本轴承故障模式识别方法。

40、本发明的有益之处在于:

41、本发明解决了现有小样本轴承故障模式下,样本少导致识别困难,且存在识别不准确的问题。

42、本发明提出的基于多源数据集成的小样本轴承故障模式识别方法对于待检测零部件的历史故障数据依赖较低,在可利用的历史故障数据极少的情况下,结合同领域或同类型零部件的相关数据以及仿真数据实现轴承故障模式识别,因此具有较高的实际应用价值。

43、本发明提出的基于多源数据集成的小样本轴承故障模式识别方法,充分计算多源域数据集训练的基分类器的组合权重,不仅考虑了数据集间的域间分布度量还考虑了不同数据集中单个样本相似度的影响,通过引入样本相似度矩阵将多分类模型的识别结果有效集成,从而提升了目标域样本分类的准确率。

44、本发明提出的一种基于多源数据集成的小样本轴承故障模式识别方法,通过使用公开数据集构建多源数据样本,可以扩充待监测轴承的历史故障数据。通过引入多源数据,包括其他领域或类型的相关数据以及仿真数据,可以提供更多样本用于模型训练,增加目标域训练集的样本数量,从而有助于提高模型的准确性和泛化能力。本实施方式使用多源数据样本提取特征,并构建n个源域训练集和1个目标域训练集。通过将多个源域训练集与目标域训练集进行组合,获取组合后的源域训练集,可以更好地考虑数据来源的异质性。这有助于提高模型对目标域数据的适应性和识别准确性。

45、本发明提出的一种基于多源数据集成的小样本轴承故障模式识别方法,通过对多源数据样本进行特征提取,并构建源域训练集和目标域训练集。特征的选择和提取过程可以通过合理的特征工程方法,选择具有区分度和代表性的特征。这样可以降低噪声和冗余信息对模型训练的干扰,从而提高模型的准确性和鲁棒性。

46、本发明提供的一种基于多源数据集成的小样本轴承故障模式识别方法,通过将目标域测试集和组合后的多源域样本集结合,使用相同标记和标签体系进行模型训练。这样可以解决不同数据源和数据类型之间标签不一致的问题,保证了模型的训练和评估的一致性。

47、本发明应用于故障识别领域。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1