不均衡数据下轴承故障诊断模型样本自适应加权训练方法与流程

文档序号:26949832发布日期:2021-10-16 00:48阅读:122来源:国知局
不均衡数据下轴承故障诊断模型样本自适应加权训练方法与流程

1.本发明属于轴承故障诊断技术领域,尤其是涉及一种不均衡数据下轴承智能故障诊断模型样本自适应加权训练方法。


背景技术:

2.轴承是机械装备的核心基础部件,是回转支撑系统的“心脏”,其可靠性对保证主机性能、功能、效能至关重要。机械装备中的轴承一旦发生故障,就会导致装备的安全性降低、性能出现衰退等问题,严重时候还会引起装备功能丧失,导致意外停机,造成巨大的产能损失和成本损失。因此,发展一种能够有效识别轴承健康状态的故障诊断方法是必要的。
3.在故障诊断领域中,对轴承健康状态进行识别主要分为基于信号处理的方法和数据驱动的方法。基于信号处理的方法利用各种信号处理技术,如快速傅里叶变换、小波分解,经验模式分解等,对采集到的轴承信号进行分析,判断信号中是否存在不同轴承故障所对应的关键敏感特征。由于这些关键敏感特征仅面向单一条件下轴承典型故障,没有考虑故障分布属性、大小属性等因素,并且从机械装备中采集到的轴承信号传递路径复杂、信噪比低,基于信号处理的故障诊断方法在实际应用中泛化能力受到了严重的制约。随着传感器技术和通信技术的发展,现代机械装备对轴承的监测进入了大数据时代,这些数据中蕴含了丰富的轴承运行信息、状态信息,如果直接从大数据中挖掘不同故障在不同条件(不同转速、不同负载、不同故障分布、不同故障大小)下的关键敏感特征,可以提取到同一故障不同条件下最相似,不同故障之间最具区别特性的特征,可以破解基于信号处理方法特征泛化能力不足的难题,因此数据驱动的故障诊断方法已成为当前故障诊断领域最为热门及前沿的技术。
4.但目前数据驱动的方法大多基于轴承不同健康状态数据均衡的假设,这在实际中是不合理的:一方面,轴承长期运行于健康状态,带故障运行时间较短,因此采集到的轴承运行数据绝大部分为轴承健康状态数据,故障数据较少;另一方面,受轴承各部件属性的影响,各部件在运行过程中发生故障的概率也不同,因此轴承运行数据中不同故障之间的数据量也不一致。综合来看,机械设备轴承运行数据之间存在严重的不均衡现象,这直接影响着数据驱动方法在实际中的应用效果。
5.为了消除使用不均衡数据训练对故障诊断模型的影响,目前已有三类方法被提出,分别为:数据级、模型级、算法级。数据级方法通过对多数类执行欠采样、少数类执行过采样,使轴承监测数据恢复平衡,然后对故障诊断模型进行训练,关于该类方法已公布的专利包括:cn111639461a、cn112257767a、cn111240279a、cn112395558a。模型级方法通过构建对类不均衡不敏感的模型,削弱不均衡数据对故障诊断模型的消极影响,关于该类方法已公布的部分专利包括:cn112364706a。算法级方法通过对不同类别的样本进行加权,抑制数据较多类别对故障诊断模型训练的主导,进而消除不均衡数据对模型的影响,关于该类方法已公布的专利包括:cn111881159a、cn111860658a、cn111340107a。
6.但是上述三种方法仍然存在各种各样的问题:
7.(1)由于数据级方法仅仅依赖现有数据,当故障数据较少时,过采样方法所能带来的信息增益是有限的;当数据不均衡程度较大时,经过欠采样后数据仍存在一定的不均衡问题;
8.(2)由于模型级方法仅仅依靠模型自身优化属性形成对不均衡数据训练过程的调整,当数据不均衡程度较大时,容易出现多数类对训练的主导效应大于模型自身的调整能力。
9.综上所述,数据级和模型级方法仅仅适用于不均衡程度较小的情况,应对实际大数据场景的能力有限。算法级方法由于直接对模型的训练过程进行调整,是一种解决不均衡学习问题的根本方案,但目前算法级方法存在样本加权权重需人工设置,权重选取难的问题,不利于故障诊断模型的快速优化与快速应用。因此,亟需一种可以随训练过程对权重进行自适应调整的新方法,以利于故障诊断模型在不均衡数据下的训练。


技术实现要素:

10.本发明的目的是针对上述问题,提供一种不均衡数据下轴承故障诊断模型样本自适应加权训练方法。
11.为达到上述目的,本发明采用了下列技术方案:
12.一种不均衡数据下轴承故障诊断模型样本自适应加权训练方法,包括以下步骤:
13.s1.获取训练样本;
14.s2.构建轴承故障诊断模型;
15.s3.将所述训练样本输入轴承故障诊断模型,对各训练样本进行特征提取;
16.s4.根据各训练样本的特征预测各训练样本的标签;
17.s5.计算预测标签与真实标签之间的误差,以及各训练样本的权重;
18.s6.根据各训练样本的权重对误差进行加权后反向传播以对模型进行更新;
19.s7.重复步骤s3

s6直至轴承故障诊断模型收敛或者达到指定的迭代步数。
20.在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,在步骤s1中,同时获取训练样本和验证样本,且步骤s7之后还包括:
21.s7.将验证样本输入所述的轴承故障诊断模型,以验证模型有效性。
22.在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,在步骤s1中,通过数据采集系统和/或传感器采集系统采集轴承运行过程中的原始信号,并将原始信号划分为所述的训练样本和验证样本。
23.在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,在步骤s1中,以确定的长度截取所述的原始信号,并将其分为所述的训练样本和验证样本。
24.在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,在步骤s2之前,先对训练样本和验证样本进行包括快速傅里叶变换和归一化的数据预处理。
25.在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,所述的轴承故障诊断模型包括特征提取模块和分类模块;在步骤s3中,由特征提取模块进行特征提取,且特征提取的计算过程如下:
26.将所有训练样本输入故障诊断模型,经过神经网络非线性变换提取得到训练样本的特征为
27.f=h(x)
28.其中:x=[x1;x2;...;x
n
]表示训练样本组成的集合,且x∈r
n
×
d
;h表示故障诊断模型从输入到特征的非线性映射;f=[f1;f2;...;f
n
]表示训练样本特征组成的集合,且f∈r
n
×
k

[0029]
在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,在步骤s4中,由所述分类模块对所述的特征进行分类,且步骤s4具体包括:
[0030]
将所有特征输入所述的分类模块,获得对训练样本标签的预测
[0031][0032]
其中:ψ表示激活函数,表示分类模块对训练样本标签的预测,且w表示分类模块的分类权重,且w∈r
k
×
m
,||w||表示各分类权重的模所组成的向量,||w||∈r1×
m

[0033]
在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,步骤s5中,基于方向相似性计算各训练样本的权重。
[0034]
在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,步骤s5中,通过以下方式计算各训练样本的权重:
[0035]
计算训练样本特征之间的方向相似性:
[0036]
a=(f
·
f
t
)/.(||f||
·
||f||
t
)
[0037]
其中:||f||表示各样本特征的模所组成的向量,且||f||∈r
n
×1;||f||
t
表示相应向量的转置;a表示各样本特征之间的方向相似性矩阵,且a∈r
n
×
n
;/.表示矩阵对应位相除;
[0038]
计算各样本特征与分类权重之间的方向相似性:
[0039]
b=(f
·
w)/.(||f||
·
||w||)
[0040]
其中:b表示各样本特征与各分类权重之间的方向相似性矩阵,且b∈r
n
×
m

[0041]
将样本真实标签转换为“独热编码”形式
[0042]
y
i
=onehot(y
i
)
[0043]
其中:y
i
表示样本标签的独热编码,并且y
i
∈r1×
m
;onehot表示独热编码转换函数;
[0044]
将所有样本的独热编码集成,组成训练样本真实标签独热编码矩阵:y=[y1;y2;...;y
n
];
[0045]
计算各样本特征与同类其他样本特征方向相似性均值:
[0046]
a
mean
=mean_row(a

(y
·
y
t

eye(n)))
[0047]
其中:a
mean
表示各样本特征与同类其他样本特征方向相似性均值矩阵,并且a
mean
∈r
n
×1;mean_row表示求矩阵一行中非0元素的均值;eye(n)表示大小为n
×
n的单位矩阵;

表示对应元素相乘;
[0048]
计算各类别各样本特征与同类其他样本特征方向相似性均值的分布均值:
[0049]
a
mean_mean
=(y
·
y
t
·
a
mean
)/.sum_row(y
·
y
t
)
[0050]
其中:a
mean_mean
各类别各样本特征与同类其他样本特征方向相似性均值的分布均值,并且a
mean_mea
n∈r
n
×1;
[0051]
计算各样本特征与对应类别分类权重的方向相似性:
[0052]
b
sum
=sum_row(b

y)
[0053]
其中:b
sum
∈r
n
×1,sum_row表示求矩阵一行中非0元素的和;
[0054]
基于上述方向相似性的计算结果计算各训练样本的误差权重:
[0055]
λ=sigmoid(a
mean
+a
mean_mean
×
(sigmoid(b
sum

a)

0.5)

b)
[0056]
其中:a和b是超参数。
[0057]
在上述的不均衡数据下轴承故障诊断模型样本自适应加权训练方法中,步骤s5中,通过以下公式计算预测标签与真实标签之间的误差
[0058][0059]
l表示误差函数,y
i
表示样本i的真实标签,表示样本i的预测标签;
[0060]
在步骤s6中,通过以下公式对各样本误差进行加权
[0061][0062]
其中:λ
i
表示样本i的误差权重,l
i
表示样本i的误差,n表示训练样本数目,m表示轴承健康状态类别数;
[0063]
且步骤s6中,将加权结果输入反向传播算法以对模型进行更新。
[0064]
本发明的优点在于:实现了不均衡数据下轴承智能故障诊断模型训练过程样本自适应加权,可使训练过程聚焦于未收敛样本,削弱不均衡数据中多数类对训练的主导,提升智能诊断模型在非均衡数据下的性能。
附图说明
[0065]
图1为本发明不均衡数据下轴承故障诊断模型样本自适应加权训练方法的流程图。
具体实施方式
[0066]
下面结合附图和具体实施方式对本发明做进一步详细的说明。
[0067]
如图1所示,本实施例公开了一种不均衡数据下轴承故障诊断模型样本自适应加权训练方法,包括以下步骤:
[0068]
1)利用数据采集系统和传感器采集系统采集轴承运行过程数据,即轴承运行过程中的原始信号。传感器采集系统包括各种传感器。
[0069]
2)以确定的长度d截取不经任何处理的原始信号,并将其分为训练样本d
train
={x
i
,y
i
}(i∈{1,2,...,n})和验证样本d
test
={x
j
,y
j
}(j∈{1,2,...,l}),x
i
表示训练样本,y
i
∈{1,2,...,m}表示训练样本对应的标签,x
j
表示验证样本,y
j
∈{1,2,...,m}表示验证样本对应的标签,n表示训练样本数目,m表示轴承健康状态类别数,l表示验证样本数。
[0070]
3)对所有训练样本和验证样本进行包括快速傅里叶变换及归一化的数据预处理。预处理步骤可以依据诊断任务难度决定是否执行。
[0071]
4)基于深度学习理论构建包括特征提取模块和分类模块的轴承故障诊断模型,可用的深度学习理论包括但不限于:卷积神经网络、自编码器、循环神经网络等。如图1,特征提取模块包括输入层、卷积层、池化层、全连接层等,分类模块包括特征层等。
[0072]
4.1)特征提取模块进行特征提取的计算过程如下:
[0073]
将所有训练样本d
train
输入故障诊断模型,经过神经网络非线性变换可得训练样本的特征为
[0074]
f=h(x)
[0075]
其中:x=[x1;x2;...;x
n
],表示训练样本组成的集合,且h表示故障诊断模型从输入到特征的非线性映射;f=[f1;f2;...;f
n
],表示轴承故障诊断模型对训练样本所提识别特征组成的集合,且。
[0076]
4.2)分类模块的计算过程如下:
[0077]
首先对分类模块的权重进行归一化
[0078][0079]
其中:w为分类模块的分类权重矩阵,并且;||w||表示各权重矩阵的模所组成的向量,并且。
[0080]
将所有特征输入分类模块,获得故障诊断模型对训练样本标签的预测
[0081][0082]
其中:ψ表示激活函数,包括但不限于sigmoid,softmax等;表示分类模块对训练样本标签的预测,以“独热编码”形式表示,并且形式表示,并且表示对样本i标签的预测,以“独热编码”形式表示,f
i
表示轴承故障诊断模型对训练样本所提识别特征,。
[0083]
计算训练样本特征之间的方向相似性
[0084]
a=(f
·
f
t
)/.(||f||
·
||f||
t
)
[0085]
其中:f
t
表示特征矩阵的转置,||f||表示各样本特征的模所组成的向量,并且;||f||
t
表示相应向量的转置;a表示各样本特征之间的方向相似性矩阵,并且;/.表示矩阵对应位相除。
[0086]
计算各样本特征与分类权重之间的方向相似性
[0087]
b=(f
·
w)/.(||f||
·
||w||)
[0088]
其中:b表示各样本特征与各分类权重之间的方向相似性矩阵,并且。
[0089]
将样本真实标签转换为“独热编码”形式
[0090]
y
i
=onehot(y
i
)
[0091]
其中:y
i
表示样本标签的独热编码,并且;onehot表示独热编码转换函数。
[0092]
将所有训练样本的独热编码集成,组成训练样本真实标签独热编码矩阵:y=[y1;y2;...;y
n
]。
[0093]
计算各样本特征与同类其他样本特征方向相似性均值
[0094]
a
mean
=mean_row(a

(y
·
y
t

eye(n)))
[0095]
其中:a
mean
表示各样本特征与同类其他样本特征方向相似性均值矩阵,并且;mean_row表示求矩阵一行中非0元素的均值;eye(n)表示大小为n
×
n的单位矩阵;

表示对应元素相乘。
[0096]
计算各类别各样本特征与同类其他样本特征方向相似性均值的分布均值
[0097]
a
mean_mean
=(y
·
y
t
·
a
mean
)/.sum_row(y
·
y
t
)
[0098]
其中:a
mean_mean
表示各类别各样本特征与同类其他样本特征方向相似性均值的分布均值,并且。
[0099]
计算各样本特征与对应类别分类权重的方向相似性
[0100]
b
sum
=sum_row(b

y)
[0101]
其中:b
sum
表示各样本特征与对应类别分类权重的方向相似性,;sum_row表示求矩阵一行中非0元素的和。
[0102]
计算各样本误差权重:
[0103]
λ=sigmoid(a
mean
+a
mean_mean
×
(sigmoid(b
sum

a)

0.5)

b)
[0104]
其中:a和b是超参数。根据权重的计算过程可以看出:当样本与同类样本的方向相似性越小,样本误差权重越大;当样本与对应权重的方向相似性越小,样本权重越大。
[0105]
计算分类模块预测标签与真实标签之间的误差
[0106][0107]
l表示误差函数,包括但不限于均方误差、均方根误差、交叉熵等;y
i
表示样本i的真实标签,表示样本i的预测标签。
[0108]
以均方根为例,分类模块预测标签与真实标签之间的误差为:
[0109][0110]
对各样本误差进行加权,求该组训练样本的总误差:
[0111][0112]
其中:mean表示对矩阵所有元素求均值。
[0113]
4.3)将加权结果输入反向传播算法,对模型进行更新。
[0114]
5)循环执行第4)步,直至模型收敛或达到指定的循环次数。
[0115]
6)将验证样本d
test
输入至模型中,验证模型的有效性。
[0116]
通过以上训练过程可以发现所述的样本训练权重是依据样本自身的收敛特性计算获得,计算中考虑了样本的分类特性、类别的分类特性,相较于传统的采用固定权重的方法,自适应能力更强,故障诊断模型的训练更加聚焦于未收敛样本,因此收敛速度更快,尤其是削弱了不均衡数据中多数类对训练的主导。
[0117]
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
[0118]
尽管本文较多地使用了训练样本、验证样本、轴承故障诊断模型、预测标签、真实
标签等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1