基于多任务深度学习的断路器触头系统故障评估方法

文档序号:30182435发布日期:2022-05-26 14:26阅读:109来源:国知局
基于多任务深度学习的断路器触头系统故障评估方法

1.本发明属于万能式断路器触头系统故障评估技术领域,具体地说是一种基于多任务深度学习的断路器触头系统故障评估方法。


背景技术:

2.万能式断路器是低压配电网中的保护和控制设备,其健康状态对配电系统的性能、稳定性有着巨大影响,断路器运行时出现故障不仅会造成巨大的财产损失,而且还会对操作人员以及整个配电网的安全造成巨大威胁。断路器在分合闸过程中,动、静触头发生激烈碰撞,产生的振动信号蕴含着丰富的触头系统及其操作机构信息,因此触头振动信号能够表征断路器的多种运行状态,尤其是机械状态。由于断路器的机械故障是一个从轻微到重度的演变过程,因此检测振动信号对万能式断路器进行故障类型和程度评估,对整个低压配电网的安全可靠运行具有重要意义。
3.与传统机器学习方法不同,深度学习具有更强的非线性特征和深度特征的学习与分析能力,例如曲建岭等(曲建岭,余路,袁涛,等.基于卷积神经网络的层级化智能故障诊断算法[j].控制与决策,2019,34(12):2619-2626.)提出一种基于卷积神经网络的层级化故障诊断算法,通过层级化的网络先识别轴承的故障类型,再对故障程度进行评估。gan等(gan m,wang c,et al.construction of hierarchical diagnosis network based on deep learning and its application in the fault pattern recognition of rolling element bearings[j].mechanical systems and signal processing,2016,72-73:92-104.)设计了一种基于小波包能量特征和深度置信网络(deep belief network,dbn)的两级诊断模型,通过两级诊断模型实现故障类型和程度诊断。
[0004]
上述方法均是一种分层模型,由一个用于故障分类的网络和多个用于单一故障程度评估的网络组成,分层模型忽略了故障类型与故障程度之间的层次信息。


技术实现要素:

[0005]
针对现有技术的不足,本发明拟解决的技术问题是,提供一种基于多任务深度学习的断路器触头系统故障评估方法。
[0006]
本发明解决所述技术问题采用的技术方案如下:
[0007]
一种基于多任务深度学习的断路器触头系统故障评估方法,该方法包括以下步骤:
[0008]
第一步、对断路器触头系统进行故障试验,采集不同工作状态下的触头振动信号;
[0009]
第二步、利用连续小波变换将触头振动信号转换为二维时频图,二维时频图的大小为128
×
128像素;
[0010]
第三步、构建基于多任务的故障评估模型,故障评估模型以resnet18为主干网络,由一个共享层和两个任务层组成,共享层的输出特征图分别作为两个任务层的输入,一个任务层用于评估故障类型,另一个任务层用评估故障程度;
[0011]
其中,共享层包括第一卷积块、最大池化层和第一残差模块,第一残差模块包括第一残差块b1和融合senet结构的残差块a1;用于评估故障类型的任务层包括第一全局平均池化层和第一分类器;用于评估故障程度的任务层包括第二残差模块、第二全局平均池化层和第二分类器,第二残差模块包括第二残差块b2和融合senet结构的残差块a2;
[0012]
融合senet结构的残差块a1和融合senet结构的残差块a2的结构相同,均包括第五卷积块、第六卷积块、全局池化层、第一全连接层、第二全连接层和加权操作,第六卷积块的各个输出特征图经过全局池化层进行挤压操作,再经过第一全连接层和第二全连接层共同构成的激励操作,得到各个输入特征图的权重,最后将各个权重与对应的输入特征图进行加权,加权后的特征图再与融合senet结构的残差块的输入特征图进行相加,得到融合senet结构的残差块的输出特征图;
[0013]
第四步、对基于多任务的故障评估模型进行多任务联合训练,将预训练的故障评估模型用于评估故障类型和故障程度。
[0014]
相比现有技术,本发明的实质性特点和显著进步是:
[0015]
1)本发明的故障评估模型为单输入多任务输出,包含一个共享层和两个任务层,考虑到故障类型和程度之间的相互关系,采用多任务的硬共享机制提取故障类型与程度之间的深层信息,使模型对故障分类和程度评估任务进行互助学习,实现模型对故障类型和程度的同时评估。
[0016]
2)故障评估模型以resnet18为主干网络,在resnet18的残差模块的基础上引入senet结构,通过senet结构提取输入图像在各个通道上的权重系数,使得故障评估模型对各个通道上的特征更具有辨别能力,提高评估结果的准确性。与现有技术中的分层模型结构相比,本发明的故障评估模型通过多任务之间信息共享,使得模型平均准确率提高了3%以上。与其他多任务学习模型相比,本发明能够自适应地提取故障信息,具有更高的运行效率。此外,相较于单任务学习模型,减少了模型参数,为评价断路器的综合性能和退化程度提供了重要信息。
[0017]
3)通过提取断路器触头系统分合闸过程中产生的振动信号进行故障评估,振动信号蕴含着触头系统及其操作机构丰富的信息,能够表征断路器的多种运行状态。通过连续小波变换对触头振动信号进行时频处理,得到二维时频图。相较于短时傅里叶变换、希尔伯特-黄变换两种时频分析方法,连续小波变换得到的时频图的能量分布较为集中,具有更好的时频分辨率,能够凸显时间和频率的局部信息,更适用于万能式断路器振动信号的处理。
附图说明
[0018]
图1为多任务学习硬共享机制的原理图;
[0019]
图2为故障评估模型的结构图;
[0020]
图3为第一残差块或第二残差块的结构图;
[0021]
图4为融合senet结构的残差块的结构图;
[0022]
图5为正常以及各故障状态下触头振动信号的时域波形图;
[0023]
图6(a)为短时傅里叶变换得到的时频图;
[0024]
图6(b)为连续小波变换得到的时频图;
[0025]
图6(c)为希尔伯特-黄变换得到的时频图;
[0026]
图7为不同大小二维时频图的正确率对比图;
[0027]
图8(a)为故障类型的混淆矩阵图;
[0028]
图8(b)为故障程度的混淆矩阵图。
具体实施方式
[0029]
下面结合附图和实施例对本发明的技术方案进行详细说明,但并不以此作为对本技术保护范围的限定。
[0030]
本发明为一种基于多任务深度学习的断路器触头系统故障评估方法(简称方法),将二维小波时频图作为模型的输入,采用多任务联合分类,实现故障类型和程度一起评估;具体包括以下步骤:
[0031]
第一步、对断路器触头系统进行故障试验,采集不同工作状态下的触头振动信号;
[0032]
第二步、利用连续小波变换将触头振动信号转换为二维时频图,二维时频图的大小为128
×
128像素;
[0033]
第三步、构建基于多任务的故障评估模型,故障评估模型以resnet18为主干网络,由一个共享层和两个任务层组成,共享层的输出特征图分别作为两个任务层的输入;其中一个任务层用于评估故障类型,另一个任务层用评估故障程度;
[0034]
多任务学习(mtl)包括软共享和硬共享机制,软共享机制是指每个任务都有单独的参数和模型,且模型与参数之间的距离是正则化的,以便鼓励参数相似化;而硬共享机制则是指多个任务通过共享层来互相帮助学习,可提升模型整体的泛化效果,适合处理相关性较强的任务,而本发明需要同时评估万能式断路器触头系统在分合闸过程中产生的故障类型以及故障程度,二者本身就存在着较强的内在联系,故采用硬共享机制,硬共享机制的原理如图1所示;
[0035]
如图2所示,故障评估模型的共享层包括第一卷积块、最大池化层(maxpool)和第一残差模块,第一残差模块包括第一残差块b1(resblock_b1)和融合senet结构的残差块a1(seresblock_a1);用于评估故障类型的任务层包括第一全局平均池化层(gap_1)和第一分类器;用于评估故障程度的任务层包括第二残差模块、第二全局平均池化层(gap_2)和第二分类器,第二残差模块包括第二残差块b2(resblock_b2)和融合senet结构的残差块a2(seresblock_a2);
[0036]
如图3所示,第一残差块b1和第二残差块b2的结构相同,均包括第二卷积块、第三卷积块和第四卷积块;第一残差块b1或第二残差块b2的输入依次经过第二卷积块和第三卷积块后,再与输入经过第四卷积块后的输出进行相加,得到第一残差块b1或第二残差块b2的输出;
[0037]
如图4所示,融合senet结构的残差块a1和融合senet结构的残差块a2的结构相同,均包括第五卷积块、第六卷积块、全局池化层、第一全连接层、第二全连接层和加权操作(scale),第六卷积块的各个输出特征图经过全局池化层进行挤压操作,再经过第一全连接层和第二全连接层共同构成的激励操作,得到各个输入特征图(第六卷积块的输出特征图)的权重,最后将各个权重与对应的输入特征图进行加权,加权后的特征图再与融合senet结构的残差块的输入特征图进行相加,得到融合senet结构的残差块的输出特征图;
[0038]
挤压操作的表达式为:
[0039][0040]
式中,xq表示第q个输入特征图,h、w分别表示第q个输入特征图的高度和宽度,f
sq
(xq)表示挤压操作的输出值;
[0041]
激励操作的表达式为:
[0042]yq
=σ(ω2δ(ω1f
sq
(xq)))
ꢀꢀꢀ
(2)
[0043]
式中,yq表示第q个输入特征图的权重,ω1表示第一全连接层,δ表示relu激活函数,ω2表示第二全连接层,σ表示sigmoid激活函数;
[0044]
sigmoid激活函数的计算公式为:
[0045][0046]
式中,z表示挤压操作的输出值f
sq
(xq)经过第一全连接层和第二全连接层后的输出值;
[0047]
全局平均池化层(gap)将模型提取的各个输出特征映射为一个值,可以减少过拟合,并降低模型的训练时间;因此,第一全局平均池化层将共享层提取的特征映射为故障类型对应的概率值,第二全局平均池化层将第二残差模块提取的各个特征映射为故障程度对应的概率值;
[0048]
第一卷积块~第六卷积块的结构相同,均包括卷积层(conv)、批归一化层(bn)和relu激活函数;第一卷积块的卷积层的卷积核大小为3
×
3,共享层的最大池化层的卷积核大小为2
×
2;第二卷积块~第四卷积块的卷积核大小分别为3
×
3、3
×
3、1
×
1,步长分别为2、1、2;第五、六卷积块的卷积核大小均为3
×
3,步长均为1。
[0049]
第四步、对基于多任务的故障评估模型进行多任务联合训练,将预训练的故障评估模型用于评估故障类型和故障程度;利用交叉熵损失函数计算故障评估模型损失;故障评估模型损失包含两部分,分别为故障类型评估任务损失loss1和故障程度评估任务损失loss2,因此故障评估模型的总损失为:
[0050]
loss

=aloss1+(1-a)loss2,0<a<1
ꢀꢀꢀ
(4)
[0051]
式中,a为故障类型评估任务损失所占的比重。
[0052]
实施例1
[0053]
本实施例的基于多任务深度学习的断路器触头系统故障评估方法,具体步骤如下:
[0054]
第一步、以dw15-1600型万能式断路器为试品构建故障试验平台,利用lc0159加速度传感器测量振动信号,加速度传感器由lc0201信号调理器供电,通过usb-7648a数据采集卡对振动信号采样,采样频率为20khz,单次振动采样时长为250ms;
[0055]
万能式断路器触头系统包含三个触头,分别为a相、b相和c相;对万能式断路器触头系统进行故障试验,采集万能式断路器触头系统在分合闸过程中包括a相不同期、b相不同期、c相不同期、虚假合闸、分闸不彻底五种机械故障类型下的触头振动信号,五种故障的模拟方式如表1所示;
[0056]
表1故障模拟方式
[0057][0058]
通过改变触头的开距或超程偏离正常值大小来模拟各故障类型的故障程度,为实现故障程度评估的目的,本实施例在故障试验平台上模拟0.5mm、1.0mm、1.5mm、2.0mm、2.5mm、3.0mm、3.5mm、4.0mm、4.5mm共9种距离下的故障状态以及正常状态,将2.0mm以下设置为轻微故障,2.0~3.0mm设置为一般故障,3.5~4.5mm设置为重度故障;一共采集2160组振动数据,故数据集一种包含2160个样本,每个样本的数据长度为5000个采样点;随机选取80%的样本作为测试集,其余样本为测试集。各个样本信息及其对应的类别标签参见表2。
[0059]
表2数据集
[0060][0061]
第二步、利用连续小波变换将触头振动信号转换为二维时频图;
[0062]
图5为万能式断路器触头系统正常状态以及各故障状态的振动信号的时域波形,从中可以看出:触头振动信号具有非线性和非平稳性的特点,不同工作状态之间的时域波形区别不大,难以直接通过单一的时域分析进行区分,因此将触头振动信号的时域波形转换为二维时频图;
[0063]
为进一步选取合适的时频分析方法,本实施例以正常状态下的触头振动信号为例,分别选取海明窗窗长128的短时傅里叶变换、基于cmor3-3小波的连续小波变换和希尔伯特-黄变换三种方法对触头振动信号进行分析,得到三种方法对应的时频图,时频图中触头振动信号的频率随时间进行变化,通过颜色反映各频率的能量大小;图6(a)为短时傅里叶变换得到的时频图,图中能量大的部分呈不规则形状分布,且沿时间轴方向能量变化十分复杂,难以同时兼顾时域和频域的分辨率;图6(b)为连续小波变换得到的时频图,能量较
为集中,能够刻画出信号时间和频率的局部信息,相对于其余两种方法具有更好区分的时频分辨率;图6(c)为希尔伯特-黄变换得到的时频图,频率波动比较大,且在25ms左右出现了频率交叉现象;因此,选用连续小波变换对触头振动信号进行时频转换,将触头振动信号转换为二维时频图,二维时频图同时反映了触头振动信号时域和频域上的特征;
[0064]
转换后的二维时频图大小为605
×
530像素,由于图像大小会对故障评估模型的运行时间和评估结果有一定的影响,因此需要对时频图进行网格规范化压缩处理;分别选用大小为32
×
32、64
×
64、128
×
128、224
×
224的二维时频图进行20次实验,评估结果的准确率曲线如图所示,随着图像尺寸增大,准确率先升高然后降低,故本发明选取二维时频图的尺寸为128
×
128像素。
[0065]
第三步、构建基于多任务的故障评估模型,故障评估模型以resnet18为主干网络,由一个共享层和两个任务层组成,其中一个任务层用于评估故障类型,另一个任务层用评估故障程度;
[0066]
故障评估模型的共享层包括第一卷积块、最大池化层(maxpool)和第一残差模块,第一残差模块包括第一残差块b1(resblock_b1)和融合senet结构的残差块a1(seresblock_a1);用于评估故障类型的任务层包括第一全局平均池化层(gap_1)和第一分类器,用于评估故障程度的任务层包括第二残差模块、第二全局平均池化层(gap_2)和第二分类器,第二残差模块包括第二残差块b2(resblock_b2)和融合senet结构的残差块a2(seresblock_a2);
[0067]
第一残差块b1和第二残差块b2的结构相同,均包括第二卷积块、第三卷积块和第四卷积块;第一残差块b1或第二残差块b2的输入依次经过第二卷积块和第三卷积块后,再与输入经过第四卷积块后的输出进行相加,得到第一残差块b1或第二残差块b2的输出;
[0068]
融合senet结构的残差块a1和融合senet结构的残差块a2的结构相同,均包括第五卷积块、第六卷积块、全局池化层、第一全连接层、第二全连接层和加权操作(scale),第六卷积块的各个输出特征图经过全局池化层进行挤压操作,再经过第一全连接层和第二全连接层的激励操作,得到各个输入特征图(第六卷积块的输出特征图)中权重,最后将各个权重与对应的输入特征图进行加权,加权后的特征图再与融合senet结构的残差块的输入特征图进行相加,得到融合senet结构的残差块的输出特征图;
[0069]
第一卷积块的卷积层的卷积核大小为3
×
3,步长为1,卷积核数目为32;最大池化层的卷积核大小为2
×
2,步长为2;第二卷积块~第四卷积块的卷积核大小分别为3
×
3、3
×
3、1
×
1,步长分别为2、1、2;第五、六卷积块的卷积核大小均为3
×
3,步长均为1;第一全局平均池化层和第二全局平均池化层的卷积核大小均为2
×
2,步长均为1,卷积核数目分别为64、128;第一残差块b1和第二残差块b2的卷积核数目分别为64、128,融合senet结构的残差块a1和融合senet结构的残差块a2的卷积核数目分别为64、128;第一分类器和第二分类器均采用softmax分类器,卷积核数目分别为6、16。
[0070]
第四步、利用训练集对基于多任务的故障评估模型进行训练,批量大小(batch-size)设置为32,最大迭代次数为200次,采用adam优化器,学习率设置为0.001;通过交叉熵损失函数计算故障评估模型损失;故障评估模型损失包含两部分,分别为故障类型评估任务损失loss1和故障程度评估任务损失loss2,因此故障评估模型的总损失为:
[0071]
loss

=aloss1+(1-a)loss2,0<a<1
ꢀꢀꢀ
(4)
[0072]
式中,a为故障类型评估任务损失所占的比重;根据训练取得的效果,当a=0.925时,故障评估模型的总损失最小,故障评估模型的效果最佳。
[0073]
利用训练后的故障评估模型,根据测试集进行故障类型和程度评估,图8(a)、(b)分别为故障类型和程度的混淆矩阵图,从图中可以看出故障类型和程度的识别率均达到97%以上,表明本发明方法不仅可以判别故障类型,同时也可以较准确判断出故障的严重程度。
[0074]
为证明本发明的优势,将本发明的基于多任务的故障评估模型(mtl-seresnet)分别与resnet18、resnet18_1和resnet18_2模型进行对比;其中,resnet18表示程度评估采用原始的resnet18网络,而故障分类则去掉resnet18网络中的最后一组残差模块;三种模型都是采用多任务模型结构;resnet18_1表示mtl-seresnet模型的残差块a1和残差块a2未融合senet结构,原始resnet18网络的平均池化改为全局平均池化,其余结构与一致;resnet18_2表示mtl-seresnet模型的残差块a1和残差块a2未融合senet结构,其他结构与mtl-seresnet一致。以准确率、召回率和精确率作为评价指标,结果如表3所示。
[0075]
表3不同网络结构的评估结果
[0076][0077]
从表3可知原始resnet18网络的参数量最多,使得运行时间较长,且评估效果并不好;将平均池化改为全局平均池化后模型的参数量减少,准确率更好;senet结构引入resnet18的残差模块后,模型提取故障特征的能力有所提升,因此本发明的mtl-seresnet模型预测效果最佳。
[0078]
为了说明本发明多任务预测的优势,将mtl-seresnet模型与采取分层预测的cnn网络进行对比,对比结果如表4所示;其中,cnn网络是首先对故障类型进行预测,再根据分类结果将故障类型对应的故障程度经过cnn网络,最终输出故障程度的预测结果。
[0079]
表4多任务与分层预测结果对比
[0080][0081]
由表4可知,本发明的mtl-seresnet模型具有较强的故障类型和程度之间的信息迁移能力,使得平均识别率得到了有效提升。
[0082]
为了进一步说明将二维时频图作为模型输入的有效性,采用hcnn(二维卷积神经
网络)与本发明的mtl-seresnet模型进行对比,得到表5所示的结果。hcnn和mtl-seresnet两种模型都是多任务,fd表示去除mtl-seresnet模型的故障程度评估任务层,进行单一任务的故障类型评估;di去除mtl-seresnet模型的故障类型评估任务层,进行单一任务的故障程度评估。
[0083]
表5多任务学习模型对比结果
[0084][0085]
从试验结果来看,与hcnn多任务模型相比,本发明的mtl-seresnet模型采用改进的残差模块方式,保留了有用原始输入信息,能够自适应的提取每个任务的故障特征,降低了模型的复杂度,因而准确率更高、运行时间更短。利用原始振动信号进行故障程度评估,并不能全面反映断路器故障状态信息,使得准确率低于二维时频图作为模型输入的准确率;此外,mtl-seresnet模型对于单一任务的故障类型和故障程度评估的准确率分别为98.44%和98.21%,训练时间并没有增加,因此mtl-seresnet模型对于单一任务也具有较好的效果。
[0086]
与现有技术相比,本发明方法首先考虑到触头振动信号非线性和非平稳性的特点,利用连续小波变换方法对其进行时频处理;其次,考虑到故障类型与程度之间的关系,引入了多任务硬共享机制,使得能够同时进行故障类型和程度评估;再次,为了提高模型提取故障特征的能力,在resnet18网络的残差模块中引入senet结构。实验结果表明,该方法具有较高的准确率,适用于万能式断路器触头系统故障评估。
[0087]
本发明未述及之处适用于现有技术。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1