一种基于对抗迁移学习的多工况电机故障诊断方法及系统

文档序号:31736478发布日期:2022-10-05 03:49阅读:132来源:国知局
一种基于对抗迁移学习的多工况电机故障诊断方法及系统

1.本发明涉及故障诊断技术领域,尤其涉及一种基于对抗迁移学习的多工况电机故障诊断方法及系统。


背景技术:

2.在现代工业生产设备不断朝着结构化、自动化和智能化方向发展的过程中,电机作为最重要的动力和驱动装置,在高速列车、地铁和城际轨道交通设备中得到了广泛的应用。然而,在生产实践中,电机由于长期在恶劣环境下运行,不可避免地会发生故障。目前,在故障诊断中,存在诸多问题,一方面由于保护机制,运营车或者实物试验故障数据采集难度大、成本高,采集所有工况下的不同故障类型数据几乎不可能;另一方面,现有的电机智能故障诊断方法大多忽视了不同工况下传感器数据分布的差异性,而导致在某种工况下所训练的故障诊断模型难以适用于其它工况。
3.可见,现有电机故障诊断方式存在难以实现多工况下的故障诊断的问题。


技术实现要素:

4.本发明提供了一种基于对抗迁移学习的多工况电机故障诊断方法及系统,以解决现有的电机故障诊断方式存在难以实现多工况下的故障诊断的问题。
5.为了实现上述目的,本发明通过如下的技术方案来实现:
6.第一方面,本发明提供一种基于对抗迁移学习的多工况电机故障诊断方法,包括:
7.s1:根据预先构建的源域数据集和目标域数据集构建训练样本集和测试样本集;
8.s2:根据所述训练样本集确定训练样本集源域特征和训练样本集目标域特征;
9.s3:将所述训练样本集源域特征和训练样本集目标域特征进行融合和增强处理,分别得到融合特征和增强特征;
10.s4:分别构建标签分类器模型、全局域判别器模型以及局部域判别器模型,根据所述标签分类器模型、全局域判别器模型以及局部域判别器模型的输出,分别构建标签分类器损失函数、全局域判别器损失函数和局部域判别器损失函数,并得到故障诊断模型损失函数;
11.s5:根据所述故障诊断模型损失函数构建训练最优故障诊断模型参数,根据所述最优故障诊断模型参数、所述测试样本集训练得到目标模型;
12.s6:根据待测电机的实时传感器信号和所述目标模型确定所述待测电机的诊断结果。
13.第二方面,本技术提供一种基于对抗迁移学习的多工况电机故障诊断系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的预测机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。
14.有益效果:
15.本发明提供的基于对抗迁移学习的多工况电机故障诊断方法,通过构建标签分类
器模型、全局域判别器模型以及局部域判别器模型,可以对齐不同工况下的数据分布,提取不同工况下的样本的平移不变特征,使某工况下所训练的故障诊断模型能适用于其它工况,使所训练的故障诊断模型适用多工况运行,而不限于单一工况,提高故障诊断方法在实际运行电机上的适应性。该方法易于实施,无需额外硬件设备,能提高电机和列车实时运行健康监测水平。
附图说明
16.图1是本发明实施例的一种基于对抗迁移学习的多工况电机故障诊断方法流程图;
17.图2是本发明实施例的基于对抗迁移学习的多工况电机故障诊断方法架构图;
18.图3是本发明实施例的特征增强示意图;
19.图4是本发明实施例的所提取的特征经t-sne的可视化图。
具体实施方式
20.下面对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
21.除非另作定义,本发明中使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。
22.应理解,本技术实施例中的一种电机故障诊断方法及系统,可以应用于电机控制系统、轨道交通等的应用场景中,例如高速列车、动车组、或者地铁、城轨等应用场景。此处仅做示例,不做限定。
23.请参见图1-图2,本技术提供的一种基于对抗迁移学习的多工况电机故障诊断方法,包括:
24.s1:根据预先构建的源域数据集和目标域数据集构建训练样本集和测试样本集;
25.s2:根据训练样本集确定训练样本集源域特征和训练样本集目标域特征;
26.s3:将训练样本集源域特征和训练样本集目标域特征进行融合和增强处理,分别得到融合特征和增强特征;
27.s4:分别构建标签分类器模型、全局域判别器模型以及局部域判别器模型,根据标签分类器模型、全局域判别器模型以及局部域判别器模型的输出,分别构建标签分类器损失函数、全局域判别器损失函数和局部域判别器损失函数,并得到故障诊断模型损失函数;
28.s5:根据故障诊断模型损失函数构建训练最优故障诊断模型参数,根据最优故障诊断模型参数、测试样本集训练得到目标模型;
29.s6:根据待测电机的实时传感器信号和目标模型确定待测电机的诊断结果。
30.本实施例以某型永磁同步电机故障诊断为例,对本发明的方法进行进一步说明与验证。本实施例所述工况指的是电机运行的转速。定子绕组匝间短路故障(下文中简称“匝间短路”)和永磁体失磁(下文中简称“失磁”)故障是永磁同步电机常见的两类故障。但是如
不及时诊断匝间短路及失磁故障,会使电机温度升高,加速电机故障演化速度,使电机性能急遽恶化,使系统的稳定性和安全性大打折扣。因此本实施例以电机匝间短路、失磁这2类故障诊断为例,以电机运行在某种转速下不同运行状态(包括正常、匝间短路、失磁)三相电流信号(传感器)数据来构建源域数据集,另一转速下不同运行状态三相电流信号(传感器)数据来构建目标域数据集。
31.本实施例中,根据训练样本集确定训练样本集源域特征和训练样本集目标域特征时,可以采用多尺度卷积神经网络(multi-scale convolutional neural networks,m-cnn)结构构建特征提取器模型,设置特征提取器模型层数及各层参数,得到训练样本集源域特征和训练样本集目标域特征。
32.其中,目标模型为特征提取器模型、标签分类器模型、全局域判别器模型和局部域判别器模型相结合的模型。
33.上述的基于对抗迁移学习的多工况电机故障诊断方法,通过构建标签分类器模型、全局域判别器模型以及局部域判别器模型,可以对齐不同工况下的数据分布,提取不同工况下的样本的平移不变特征,使某工况下所训练的故障诊断模型能适用于其它工况,使所训练的故障诊断模型适用多工况运行,而不限于单一工况,提高故障诊断方法在实际运行电机上的适应性。该方法易于实施,无需额外硬件设备,能提高电机和列车实时运行健康监测水平。
34.可选地,所述s1包括:
35.s11:采集电机在第一设定转速下正常状态和c类故障运行状态下的传感器信号其中分别表示正常、第1类、

、第c类、

、第c类故障运行状态下传感器信号的采样点数,c=0,1,...,c,n表示传感器数量,将该转速下采集的数据视为源域,构建源域数据集源域数据集ds所对应的类别标签为所对应的类别标签为对应的域标签为yd=0,其中,yd=0表示源域,yd=1表示目标域,带标签的源域数据集表示为
36.采集电机在第二设定转速下正常状态和c类故障运行状态下的传感器信号采集电机在第二设定转速下正常状态和c类故障运行状态下的传感器信号其中分别表示正常、第1类、

、第c类、

、第c类故障运行下传感器信号的采样点数,将该转速下采集的数据视为目标域,构建目标域数据集目标域数据集d
t
所对应的类别标签为对应的域标签为yd=1,带标签的目标域数据集表示为
37.s12:以窗口大小为win、步长为stp对源域数据集ds中的数据做时间滑窗,经时间滑窗后构建数据集为其中表示样本数,计算公式满足如下关系式:
38.39.式中,floor表示向下取整;
40.以窗口大小为win、步长为stp分别对源域数据集ds中所有c+1类运行状态下所有数据做时间滑窗,经时间滑窗后构建数据集为数据做时间滑窗,经时间滑窗后构建数据集为分别表示时间滑窗后构建数据集的样本个数,利用经时间滑窗后的源域数据构建源域样本集ls为源域样本集的样本数,其大小可表示为:
[0041][0042]
源域样本集ds所对应的类别标签为所对应的类别标签为带标签的源域样本集记为
[0043]
以窗口大小为win、步长为stp分别对目标域数据集d
t
中所有c+1类运行状态下所有数据分别做时间滑窗,经时间滑窗后构建数据集为分别表示时间滑窗后构建数据集的样本个数,利用经滑窗后的目标域数据构建目标域样本集l
t
为目标域样本集的样本数,其大小可表示为:
[0044][0045]
目标域数据集d
t
所对应的类别标签为所对应的类别标签为带标签的目标域样本集记为
[0046]
s13:将目标域样本集d
t
随机打乱后,以设定比例划分,一部分用于构建训练样本集一部分用于构建测试样本集其中和分别表示目标域样本集中用于训练和测试的样本个数,它们之间的关系为:
[0047][0048]
将源域样本集ds与目标域样本集中的训练样本集所有样本按行拼接,构建训练样本集l
tr
为训练样本的第一维度,其大小可表示为:
[0049][0050]
带标签的训练样本集记为值得注意的是,训练过程中不需要的类别标签,仅需要域标签。
[0051]
利用目标域样本集中的测试样本集构建测试样本集带标签的测试样本集记为值得注意的是,测试过程中不需要的域标签,仅需要类别标签。
[0052]
需要说明的是,训练样本集d
tr
来自于两个部分:源域样本集ds和目标域样本集中
的训练样本集当单样本取自于训练样本集d
tr
第1~ls行时,表明训练样本仅取自于源域样本集ds;当单样本取自于训练样本集d
tr
第ls+1~l
tr
行时,表明训练样本仅取自于目标域样本集中的训练样本集测试样本集d
te
仅来自于目标域样本集中的测试样本集
[0053]
可选地,所述s2包括:
[0054]
s21:采用多尺度卷积神经网络m-cnn结构构建特征提取器模型gf,设定特征提取器层数为nf层;
[0055]
s22:设置特征提取器模型第1层参数;
[0056]
其中,特征提取器第1层为卷积层,第1层卷积输入为维度1
×
win
×
n的训练样本集d
tr
中单样本数据,第1层卷积核的数量为个、大小为步长为填充为经处理后,输出维度为的第1层卷积特征的计算公式满足如下关系式:
[0057][0058]
本实施例中的处理是指经卷积、bn(batch normalization)及relu激活函数操作处理。
[0059]
将维度为的第1层卷积特征输入大小为1
×
p1的第1最大池化层,得到第1层卷积输出得到第1层卷积输出与之间的关系为:
[0060][0061]
式中,ceil表示向上取整;
[0062]
s23:设置特征提取器模型第i层参数,其中,i=2,3,

,n
f-3;
[0063]
特征提取器第i层为卷积层,第i层卷积输入为第i-1层卷积输出第i层卷积核的数量为个、大小为步长为填充为经处理后,输出维度为的第i层卷积特征的计算公式满足如下关系式:
[0064][0065]
将维度为的第i层卷积特征输入大小为1
×
pi的第i最大池化层,得到第i层卷积输出到第i层卷积输出与之间的关系为:
[0066][0067]
i=2,3,...,n
f-3,当i=n
f-3时,得到第n
f-3层卷积输出
[0068]
s24:设置特征提取器模型第n
f-2层参数;
[0069]
特征提取器第n
f-2层为卷积层,第n
f-2层卷积输入为第n
f-3层卷积输出第n
f-2层卷积核的数量为个、大小为1
×
3、步长为1,经处理后,输出维度为的第n
f-2层卷积特征的计算公式满足如下关系式:
[0070][0071]
将维度为的第n
f-2层卷积特征输入第n
f-2自适应最大池化层,得到第n
f-2层卷积输出
[0072]
s25:设置特征提取器模型第n
f-1层参数;
[0073]
特征提取器第n
f-1层为卷积层,第n
f-1层卷积输入为第n
f-3层卷积输出第n
f-1层卷积核的数量为1个、大小为1
×
3、步长为1,经处理后,输出维度为的第n
f-1层卷积特征的计算公式满足如下关系式:
[0074][0075]
将维度为的第n
f-1层卷积特征输入大小为的第n
f-1最大池化层,得到第n
f-1层卷积输出1层卷积输出与之间的关系为;
[0076][0077]
s26:设置特征提取器模型第nf层参数;
[0078]
特征提取器第nf层为卷积层,第nf层卷积输入为第n
f-3层卷积输出第nf层卷积核的数量为1个、大小为1
×
5、步长为1,经处理后,输出维度为的第nf层卷积特征的计算公式满足如下关系式:
[0079][0080]
将维度为的第nf层卷积特征输入大小为的第nf最大池化层,得到第nf层卷积输出层卷积输出与之间的关系为;
[0081][0082]
s27:求取特征提取器模型的输出φf,得到训练样本集特征;
[0083]
将特征提取器的第n
f-2层卷积输出第n
f-1层卷积输出和第nf层卷积输出分别做展平与维度转换,所得的输出维度分别为:度分别为:然后将经展平与维度转换后的3层输出按列拼接,得到特征提取器的输出其中of的大小为:
[0084][0085]
可选地,所述s3包括:
[0086]
s31:将训练样本集源域特征与目标域特征进行特征融合,得到融合特征;
[0087]
将特征提取器模型输出的训练样本集源域特征与目标域特征
进行特征融合,得到融合特征融合特征的域标签与源域样本的域标签一致,融合特征的计算公式满足如下关系式:
[0088][0089]
式中,λ

为融合系数,它的计算公式为:
[0090][0091]
式中,α是beta分布的超参数,λ是0~1的超参数;
[0092]
s32:将训练样本集源域特征与目标域特征进行数据增强,得到增强特征;
[0093]
如图3所示,首先,将特征提取器模型输出的训练样本集源域特征与目标域特征投影到潜在特征上,投影方式为:
[0094][0095]
式中,w
p
为投影矩阵,其维度为2of×
of;
[0096]
然后,采用拆分和拼接的方法,进行随机数据扩充,随机数据扩充过程表示为:
[0097][0098]
式中,分别为经3种方式进行随机数据扩充后所得的扩充特征,γ为0~1的超参数,表示取特征的b:c列,当a=p时表示从潜在特征中选取,当a=t时表示从目标域特征中选取,增强特征的表达式为:
[0099][0100]
式中,rand{a,b,c}表示从a,b,c矩阵中随机选择一个矩阵,增强特征的其域标签与目标域保持一致。
[0101]
可选地,所述s4包括:
[0102]
s41:构建标签分类器模型gy;
[0103]
设定标签分类器的映射函数为f(),其初始化参数为θy,标签分类器的映射关系表示为:
[0104]hy
=f(xy,θy)
ꢀꢀꢀꢀ
(21)
[0105]
式中,xy表示标签分类器模型的输入,hy∈r1×
(c+1)
表示标签分类器模型的输出;当输入为特征提取器的最终输出时,其输出为:
[0106]
φy=f(φf,θy)
ꢀꢀꢀꢀ
(22)
[0107]
当输入为增强特征时,相应的输出为:
[0108]
[0109]
式中,式中,表示增强特征属于第c类的概率;
[0110]
采用退火方法获得增强特征的低熵预测概率:
[0111][0112]
式中,表示增强特征分配到第c个局部域判别器的概率;
[0113]
s42:构建全局域判别器模型gd;
[0114]
设定全局域判别器的映射函数为γ(),其初始化参数为θd,全局域判别器的映射关系可表示为:
[0115]
hd=γ(xd,θd)
ꢀꢀꢀꢀ
(25)
[0116]
式中,xd表示全局域判别器模型的输入,hd∈r1×2表示全局域判别器模型的输出;
[0117]
将目标域特征和混合特征进行梯度反转操作,分别得到反转后的目标域特征和混合特征其域标签分别为yd=1和yd=0,将反转后的目标域特征和混合特征作为全局域判别器的输入,其输出φd∈r1×2;
[0118]
s43:构建局部域判别器模型;
[0119]
对于c+1个运行状态类别,共设置c+1个局部域判别器设定局部域判别器的映射函数为ψ(),c+1个局部域判别器的初始化参数分别为第c个局部域判别器的映射关系可表示为:
[0120][0121]
式中,表示第c个局部域判别器的输入,表示相应的输出;
[0122]
将源域特征和增强特征进行梯度反转操作,分别得到反转后的源域特征和增强特征其域标签分别为yd=0和yd=1,将反转后的源域特征和增强特征作为局部域判别器的输入,若输入第c个局部域判别器,对应输出为
[0123]
s44:构建标签分类器损失函数;
[0124]
设定标签分类器损失的损失度量方式满足如下公式:
[0125][0126]
式中,m表示模型训练的批量大小,表示类别标签c的one-hot向量,为第γ个样本在类别标签为c的条件下,标签分类器将该训练样本诊断为类别c的概率;
[0127]
s45:构建全局域判别器损失函数;
[0128]
设定全局判别器损失的损失度量方式满足如下公式:
[0129][0130]
式中,表示域标签k的one-hot向量,为第γ个样本在域标签为k(k=0,1)的条件下,全局域判别器将该训练样本判别为k域的概率,全局判别器用来对齐源域和目标域之间的边缘分布;
[0131]
s46:构建局部域判别器损失函数;
[0132]
设定局部判别器损失的损失度量方式满足如下公式:
[0133][0134]
式中,mc表示该批量中分配给局部域判别器的样本个数,为第γ个样本在域标签为k的条件下,第c个局部域判别器将该训练样本判别为k域的概率,局部域判别器用来对齐源域和目标域之间的条件分布;
[0135]
s47:则故障诊断模型损失函数满足如下关系式:
[0136][0137]
本实施例中,基于对抗迁移网络的故障诊断方法的损失函数由标签分类器损失、全局域判别器损失及(c+1)个局部域判别器损失3部分构成,它们的损失函数均由交叉熵表征。
[0138]
可选地,所述s5包括:
[0139]
s51:设定迭代次数为n,批量大小为m,学习率为lr,beta分布中的超参数为α,退化温度为t,将训练集d
tr
分批量输入所构建的故障诊断模型构架中,以最小化损失函数为目标,训练得到最优故障诊断模型参数,所述最优故障诊断模型参数包含最优特征提取器参数、最优标签分类器参数、最优全局域判别器参数以及最优局部域判别器参数;
[0140]
s52:获取目标模型的特征提取器gf及标签分类器gy参数,将测试集d
te
输入最优特征提取器和最优标签分类器模型中,得到测试结果获取测试样本的类别标签估计值,第χ个测试样本的类别标签估计值满足如下关系式:
[0141][0142]
式中,为类别标签估计值,index(
·
)表示满足条件
·
的索引,表示第χ个测试样本所对应的标签分类器模型输出,χ=1,2,

,l
te

[0143]
并将最大估计概率对应的索引类别视为类别标签估计值。
[0144]
在一示例中,采样了永磁同步电机运行在9个不同转速下的正常、匝间短路、失磁故障下a、b相电流信号,分别是1000r/min,1100r/min,1200r/min,1300r/min,1400r/min,1500r/min,1600r/min,1700r/min,1800r/min转速下,系统采样频率为2.5
×
104,采样点数均为1.875
×
106。
[0145]
为举例说明,以1800r/min的所采集的传感器信号为源域,以1400r/min的所采集的传感器信号为目标域,构建源域数据集其中目标域数据集其中设定窗口大小win=4096,步长stp=500,分别对源域和目标域下的每种运行状态数据做时间滑窗,得到源域样本集其中目标域样本集其中将目标域样本集d
t
随机打乱后,以2:1比例,构建训练样本集和测试样本集,同时保证训练样本集和测试样本集中正常、匝间短路、失磁的样本为1:1:1,训练样本集记为d
tr
∈r
18500
×
4096
×2,测试样本集记为d
te
∈r
3700
×
4096
×2。
[0146]
将训练样本集作为特征提取器的输入,设定特征提取器模型gf层数为5层,每层的参数及每层的输入输出维度为表1所示。
[0147]
表1特征提取器的参数集
[0148][0149]
批量大小为m=32,迭代次数n=150,参数k设置为3,锐化温度t设置为0.75,beta中超参数α设置为0.9,γ设置为0.75,迭代数n设置为150。初始学习率的值为0.01,学习率lr的计算公式为lr
n+1
=lrn/(1+10*p)
β
(n=1,...,n),其中lrn表示第n次学习率,β设置为0.75,并且p=n/n。采用adam优化算法以最小化损失函数为目标,以最小化损失函数为目标,训练得到故障诊断最优模型参数。
[0150]
将测试样本集d
te
∈r
3700
×
4096
×2输入最优特征提取器和最优标签分类器模型中,得到测试结果并进一步获得测试样本的类别标签估计值
[0151]
在本示例中的案例共进行了18组测试(18个案例),该案例的源工况、目标工况、测试工况以及诊断结果如表2所示。在表2中的案例2下,源工况和目标工况样本经特征提取器后所得的特征,经t-sne降维后得到的2维特征可视化结果如图4所示。
[0152]
表2实验案例和对应测试结果
[0153]
[0154][0155]
从表2可知,经18个案例的测试,平均故障正确率达98.66%,在个别案例上全部诊断正确。从图4可知,经对抗迁移后,所提取的源域特征和目标域特征分布趋于一致,同时,不同类别之间,具有较好的特征可分性,能较好的区分不同运行状态。综上所述,本方法能减小源域及目标域之间的分布差异,使源工况下的所训练的故障诊断模型能适用于目标工况,实现多工况下的电机故障诊断,提高故障诊断方法在实际运行电机上的适应性。
[0156]
本技术实施例还提供一种基于对抗迁移学习的多工况电机故障诊断系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法相对应的步骤。
[0157]
上述的电机故障诊断系统能实现上述的电机故障诊断方法的各个实施例且能达到相同的有益效果,此处,不做赘述。
[0158]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1