基于深度可分迁移学习网络的跨轴承迁移诊断方法

文档序号:32602980发布日期:2022-12-17 17:38阅读:263来源:国知局
基于深度可分迁移学习网络的跨轴承迁移诊断方法

1.本发明属于机械设备故障诊断技术领域,涉及一种基于深度可分迁移学习网络的跨轴承迁移诊断方法。


背景技术:

2.轴承作为一个基础机械通用零件,广泛应用在轨道交通、能源动力、航空航天等重要领域。一旦轴承发生故障,将会造成难以承受的经济损失。因此,近年来对于轴承的智能故障诊断吸引了大批的专家学者进行研究,特别以考虑数据分布差异的迁移学习技术为代表的轴承智能迁移故障诊断方法已经取得了很大的成功。但现有智能迁移故障诊断方法仍然有以下几点局限性:1)模型所用的分类损失函数均为softmax损失,虽然该损失在大多数情况下能够取得很好的效果,但是在轴承信号受噪音污染比较大的时候,其可分特征学习能力较差;2)局限于同台机器不同负载、不同转速以及不同测点的迁移诊断任务;3)选用的分布度量距离未考虑真实信号的分布特性;4)且现有基于联合分布对齐的迁移学习技术存在大量的近似估计,无法保证其理论的可靠性。


技术实现要素:

3.有鉴于此,本发明的目的在于提供一种基于深度可分迁移学习网络的跨轴承迁移诊断方法,提高现有智能迁移诊断方法的精度和泛化能力。
4.为达到上述目的,本发明提供如下技术方案:
5.一种基于深度可分迁移学习网络的跨轴承迁移诊断方法,包括以下步骤:
6.s1:通过加速度传感器采集机械设备上的轴承原始振动信号,以便于构建后续的迁移诊断任务。然后,将采集到的原始振动信号利用滑动采样技术扩充样本数据集;
7.s2:构建基于ijda域适应损失和i-softamx分类损失的ddtln,其中,ijda表示改进联合分布对齐,ddtln表示深度可分迁移学习网络;
8.s3:将划分好的的训练样本输入到步骤s2构建的ddtln中,利用源域有标签样本的i-softamx分类损失函数ly和源域与目标域之间的ijda域适应损失函数l
ijda
对迁移模型进行迭代更新训练;
9.s4:经过多次迭代训练,误差曲线趋于稳定,迁移模型训练完成,训练好的迁移模型将用于跨轴承故障迁移诊断。
10.进一步,步骤s2中,所述ddtln采用卷积神经网络作为主干网络去自适应提取特征,该网络由五个“conv1d”卷积块、一个全局平均池化层和两个全连接层组成;每个“conv1d”卷积块由一个卷积层、一个批次归一化层和最大池化层组成;其中,全局平均池化层和批次归一化层可以加速网络收敛和有效抑制网络的过拟合现象。为了节约计算资源,将ijda域适应损失加在最后全连接层上;同样,i-softmax分类损失也作用在最后的全连接层上。
11.进一步,步骤s2中,i-softamx分类损失函数ly的表达式为:
[0012][0013]
其中,fi表示对应于样本xi的特征提取器的输出向量;c和j是对应于特征向量fi的元素索引;n表示特征向量的个数,即当前输入批次的大小;k≥0和m≥1被定义为两个超参数去控制决策边界,同时当m=1和k=0时,i-softmax分类损失函数等同于原始softmax函数。
[0014]
进一步,步骤s2中,ijda域适应损失函数l
ijda
的表达式为:
[0015][0016]
其中,分布差异指标ddm(a,b)=mmd(a,b)+coral(a,b),其中a和b分别代表源域和目标域的特征表述,mmd(
·
)和coral(
·
)分别为最大平均差异和协方差差异;xs和x
t
分别代表源域和目标域的特征样本,ys和y
t
分别代表源域和目标域特征样本的标签,t(
·
)为特征表示,c和c分别代表第c类和类别数,p(
·
)表示分布概率,(t(x)|y=c)表示第c类的特征向量。
[0017]
进一步,步骤s3中,ijda域适应损失函数l
ijda
通过梯度下降优化网络参数θ
fe
,其梯度表达式为:
[0018][0019]
其中,ns和n
t
分别代表源域和目标域的样本批次大小,fs和f
t
分别表示源域和目标域的特征向量。
[0020]
本发明的有益效果在于:本发明从整体上提高了现有智能迁移诊断方法的精度和泛化能力,具体体现在以下两方面:
[0021]
1)本发明设计了i-softmax分类损失函数,解决现有迁移诊断方法中常用的softmax函数导致的诊断模型可分效果差的问题。
[0022]
2)本发明设计了改进联合分布对齐(ijda)机制,并设计了一个新的分布差异指标(ddm)去实现该ijda机制,从而更好的适配机械振动信号的高斯分布特性。
[0023]
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和
获得。
附图说明
[0024]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
[0025]
图1为本发明提出的深度可分迁移学习网络(ddtln)的结构示意图;
[0026]
图2为四种轴承健康状态的概率密度函数;
[0027]
图3为公式(2)的原理图;
[0028]
图4为i-softmax的原理解释示意图;
[0029]
图5为cwru试验台示意图;
[0030]
图6为rds试验台示意图;
[0031]
图7为swjtu试验台示意图。
具体实施方式
[0032]
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0033]
请参阅图1~图7,本发明设计了一种基于深度可分迁移学习网络的跨轴承迁移诊断方法,具体包括以下步骤:
[0034]
步骤1:通过加速度传感器采集机械设备上的轴承原始振动信号,以便于构建后续的迁移诊断任务。然后,将采集到的原始振动信号利用滑动采样技术扩充样本数据集。
[0035]
步骤2:构建基于ijda机制和i-softamx分类损失的深度可分迁移学习网络(ddtln)。
[0036]
如图1所示,ddtln网络采用卷积神经网络作为主干网络去自适应提取特征。详细参数如表1所示,该网络由五个“conv1d”卷积块、一个全局平均池化层和两个全连接层组成。每个“conv1d”卷积块由一个卷积层、一个批次归一化层和最大池化层组成。其中,全局平均池化层和批次归一化层可以加速网络收敛和有效抑制网络的过拟合现象。为了节约计算资源,本发明所提出的ijda损失加在最后全连接层上;同样,i-softmax分类损失函数也作用在最后的全连接层上。下面将详细介绍深度可分迁移学习网络中的ijda机制和i-softmax分类损失函数。
[0037]
表1 ddtln网络详细参数
[0038][0039]
1)i-softmax分类损失
[0040]
如图2所示,来自轴承不同故障的原始振动信号由于噪声干扰其概率密度函数通常是交叠混合的,图2中,nc、if、bf、of分别表示轴承正常、内圈故障、滚动体故障、外圈故障。因此,其更可分的分类特征被要求,而传统基于softmax函数的智能故障诊断方法其可分特征学习能力有限,无法满足轴承多种故障混合数据的分类诊断。因此基于softmax函数,本发明提出了一种更可分的分类函数,即i-softmax分类损失函数,它有两个超参数(m,k)控制其可分学习的性能,如下式(1)所示:
[0041][0042]
其中,fi表示这个特征提取器(通常为卷积神经网络)的输出向量;c和j是对应于样本xi的标签索引;n代表特征向量的个数,即当前输入批次的大小;k≥0和m≥1被定义为两个超参数去控制决策边界,同时当m=1和k=0时,我们所发明的i-softmax分类损失函数等同于原始softmax函数。因此,本发明提出的i-softmax函数相比于原始softmax函数是一个更具普适性的分类损失函数。
[0043]
为了更清晰的分析i-softmax函数的机理,我们将从角度的视角去剖析。如图3所示,这个特征向量可以通过余弦相似性被分解为角度和幅度,如下式(2)所示:
[0044][0045]
其中,zi定义为倒数第二个全连接层的输出向量;wc为第c个来自于最后两个全连接层的权重向量,同时θc∈[-π,π]为向量wc和zi之间的余弦角。
[0046]
接下来,本发明以一个二分类的例子来分析i-softmax,假设一个来自于类1的样
本特征z,这个原始softmax为了准确分类样本特征z而必然满足下面的不等式:
[0047][0048]
然而,原始softmax仍然不能拥有严格的决策边界,从而影响特征学习的类内压缩性和类间可分性。因此,为了实现更符合要求的决策边界和实现这个合适的分类,对于i-softmax,下式必然要满足:
[0049][0050]
很明显,本发明所提出的i-softmax比原始softmax拥有更严格的决策边界。本质上,i-softmax相比于原始softmax的优越性依然反映在角度上。以为例,可以证明:
[0051][0052]
其中,代表等价边缘角,即控制式(1)中的k和m等价于控制角度θc。
[0053]
如图4所示,本发明以||w1||=||w2||和为例直观演示i-softmax的有效性。同样考虑一个属于类1的特征向量z,为了分类准确,原始softmax将会强迫而对于i-softmax,它将严格强迫因此,它会学习出一个更可分的决策边界。
[0054]
另外,i-softmax在特征学习时,不需要额外的训练技巧,它能够像原始softmax通过随机梯度下降优化网络参数θ
fe
。定义i-softmax输出向量为z,独热编码为y,i-softmax的梯度可以表达为下式:
[0055][0056]
式中为:
[0057][0058]
2)改进联合分布对齐机制(improved joint distribution alignment,ijda)
[0059]
通用的联合分布对齐域自适应机制(joint distribution alignment,jda)定义为由边缘分布对齐(marginal distribution alignment,mda)和类条件分布对齐(class conditional distribution alignment,ccda)组成,公式如(8)所示:
[0060][0061]
其中,等式右边第一项代表mda和第二项代表ccda;xs和x
t
分别代表源域和目标域
的特征样本,ys和y
t
分别代表源域和目标域特征样本的标签,t(
·
)为特征表示,e
p
(
·
)代表在p分布下的期望值,c和c分别代表第c类和类别数。
[0062]
式(8)中存在一个假设条件,即类条件分布等同于条件分布,该假设会降低其jda的理论可靠性和其普适性。因此,本发明提出了ijda域适应机制去完善上述假设,如下式:
[0063][0064]
式(9)通过贝叶斯理论完善了式(8)中的假设,即:
[0065][0066]
同时为了更好的衡量式(9)中的边缘分布差异(等式右边第一项)和条件分布差异(等式右边第二项),以及更好的适配机械振动信号的高斯分布特性,本发明定义了一个新的分布差异指标(distribution discrepancy metric,ddm),如下所示:
[0067]
ddm(a,b)=mmd(a,b)+coral(a,b)
ꢀꢀꢀꢀ
(11)
[0068]
其中,a,b分别代表源域和目标域的特征表述,mmd(
·
)和coral(
·
)分别为最大平均差异和协方差差异,具体形式如下:
[0069][0070][0071]
式(11)中,ns和n
t
分别代表源域和目标域的样本批次大小,和代表源域和目标域,||
·
||h代表再生希尔伯特空间,φ(
·
)代表再生希尔伯特空间中的映射函数。式(13)中d为样本维度大小,covs和cov
t
分别代表源域和目标域样本的协方差矩阵,其公式表达如下所示;
[0072][0073]
其中,i代表元素全为1的行向量。
[0074]
结合ddm分布距离,式(9)中所表述的ijda域适应机制可以重新表述为:
[0075][0076]
上式ijda域适应损失函数可以通过梯度下降优化网络参数θ
fe
,其梯度如下式所示:
[0077]
[0078][0079]
以和为例,详细公式计算如下:
[0080][0081][0082]
步骤3:将划分好的的训练样本输入到构建好的深度可分迁移学习网络(ddtln)中,利用源域有标签样本分类损失函数ly(式(1))和源域与目标域之间的ijda域适应损失函数l
ijda
(式(15))对迁移模型进行迭代更新训练。
[0083]
步骤4:经过多次迭代训练,误差曲线趋于稳定,模型训练完成,训练好的迁移模型将用于跨轴承故障迁移诊断。
[0084]
以上是本发明提出的基于深度可分迁移学习网络的跨轴承迁移诊断方法的流程,下面的实验结果已说明该方法的有效性。
[0085]
验证实验:本实验收集的轴承原始振动信号来自三个试验台,分别是美国凯斯西厨大学公开的cwru标准轴承数据集,cwru轴承数据集示意图如图5所示,它由一个电机、电机两端的轴承、一个扭矩传感器和一个功率计组成;和自测rds轴承数据集,rds试验台示意图如图6所示,它由一个伺服电机、一个联轴器、一个转子和它两端的轴承及轴承座组成。以及来自于西南交通大学的swjtu轴承数据集,其试验台示意图如图7所示,它由电机、支撑轴承、测试所用的故障轴承、加载系统构成。每个轴承数据集包括其故障种类、故障尺寸、转速等信息如表2所示。通过上述三个轴承数据集我们就可以建立六个跨轴承迁移诊断任务,即a

b、b

a、a

c、c

a、c

b和b

c。
[0086]
表2三个轴承数据集的详细信息
[0087]
[0088][0089]
对比实验:
[0090]
为了证明本发明基于深度可分迁移学习网络(ddtln)的迁移诊断方法的优越性,对比当前典型边缘分布对齐的网络模型(ddc、dcoral、dann)和经典的联合分布对齐(jda),其实验结果如表3所示。
[0091]
表3实验结果
[0092][0093]
从表3我们可以得出本发明提出的深度可分迁移学习网络具有更高的迁移诊断精度和更强的泛化能力。特别地,ddtln的平均诊断准确率达到了90%以上;相比较于其他迁移诊断方法,提升约30%的诊断准确率。
[0094]
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1