基于改进YOLOv5的GIS红外特征识别系统及方法

文档序号:34650643发布日期:2023-06-29 19:33阅读:90来源:国知局
基于改进YOLOv5的GIS红外特征识别系统及方法

本发明涉及图像处理与目标检测领域,具体涉及一种基于改进yolov5的gis红外特征识别系统及方法。


背景技术:

1、随着深度学习技术的发展,卷积神经网络(cnn)等深度学习模型在红外目标检测中得到广泛应用。尽管很多红外目标检测网络模型已经在各个领域应用,但在电力行业中,红外目标检测网络模型仍有待深入研究。

2、gis设备具有占地面积小、维护工作量小、运行可靠性高、安全性强、噪音小等特点,在电力行业中有着广泛应用。由红外热成像图像对gis设备不同部件进行识别可以解决不少问题,近年来随着目标检测算法的不断更新,其检测速度和精度都有了极大提升,其中yolo系列深度学习算法在电力设备红外图像处理领域得到了成功应用。但目前gis设备红外热成像图像的获取极度依赖于手持式红外热像仪,数据集的获取成为一大难题,而数据集的质量会直接影响算法训练的效果,而边缘智能终端由于算力有限的问题,在gis设备现场巡检中更有待提升。故鉴于轻量化和高识别准确率算法需求,本发明选择yolov5算法进行改进,以构建gis红外目标检测网络模型。


技术实现思路

1、针对现有技术的不足,本发明提出了一种基于改进yolov5的gis红外特征识别系统及方法,本发明采集gis设备部件红外图像,在噪点较多、目标较多的情况下使用基于改进yolov5的gis红外目标检测网络模型对gis设备部件进行识别,具有良好的识别效果。

2、本发明的目的通过如下技术方案来实现:一种基于改进yolov5的gis红外特征识别系统,包括gis红外图像采集模块和gis红外特征识别模块,gis红外图像采集模块采集gis设备部件红外图像,gis红外特征识别模块内置基于改进yolov5的gis红外目标检测网络模型,基于改进yolov5的gis红外目标检测网络模型用于gis设备部件识别;所述基于改进yolov5的gis红外目标检测网络模型包括主干网络、颈部网络、头部网络三部分;主干网络依次由调焦模块、第一cbl模块、csp模块、第二cbl模块、第一融合ca注意力机制的csp模块、第三cbl模块、第二融合ca注意力机制的csp模块、第四cbl模块、spp模块,各模块之间依次为输入输出的关系;颈部网络包括四个gscbl模块和五个gscsp模块,主干网络中spp模块输出的特征依次经第一gscsp模块、第一gscbl模块处理;第一gscbl模块输出的特征经上采样后与第二融合ca注意力机制的csp模块输出的特征进行特征融合,然后依次经第二gscsp模块、第二gscbl模块处理,第二gscbl模块输出的特征经上采样后与第一融合ca注意力机制的csp模块输出的特征进行特征融合,然后经第三gscsp模块处理,得到第一融合特征图;第一融合特征图经第三gscbl模块处理后与第二gscbl模块输出的特征进行特征融合,然后经第四gscsp模块处理,得到第二融合特征图;第二融合特征图经第四gscbl模块处理后与第一gscbl模块输出的特征进行特征融合,然后经第五gscsp模块处理,得到第三融合特征图;头部网络包括三个解耦头,第一融合特征图、第二融合特征图、第三融合特征图分别输入各自对应的解耦头处理,得到九幅特征图输出。

3、进一步优选,每个解耦头均包括三层,第一层为一个cbl模块,第二层为两个cbl模块,第三层为三个卷积层(conv),第一层主要用于降低通道维数;第一层的输出分别进入第二层的两个cbl模块,第二层中的一个cbl模块的输出进入第三层的一个卷积层(带sigmoid激活函数)中,其输出特征图代表分类任务的结果;第二层中的另一个cbl模块的输出进入第三层的另外两个卷积层(其中一个带sigmoid激活函数,另一个不带sigmoid激活函数)中,其输出特征图代表回归任务的结果。

4、进一步优选,所述cbl模块依次由卷积层(conv)、批归一化层(bn)和leaky relu激活函数组成。

5、进一步优选,gscbl模块依次由gs卷积层(gsconv)、批归一化层(bn)和leaky relu激活函数组成。

6、进一步优选,csp模块包括两条输入分支,其中一条输入分支为卷积层(conv),另一条输入分支依次包括cbl模块、若干个残差部件、卷积层;两个输入分支的特征融合后经批归一化层(bn)、leaky relu激活函数、cbl模块处理后输出。

7、进一步优选,融合ca注意力机制的csp模块的输入分为两条输入分支,一条输入分支包括cbl模块、若干个残差部件、ca注意力模块、卷积层;另一条输入分支为卷积层;然后两条输入分支得到的特征融合后,再经过ca注意力模块、批归一化层(bn)、leaky relu激活函数、cbl模块然后得到输出结果。

8、进一步优选,gscsp模块包括两条输入分支,其中一条输入分支为gs卷积层(conv),另一条输入分支依次包括gscbl模块、偶数个gscbl模块、gs卷积层;两个输入分支的特征融合后经批归一化层(bn)、leaky relu激活函数、gscbl模块处理后输出。

9、进一步优选,gs卷积层的输入分为两条输入分支,一条输入分支包括卷积层、dw卷积层(dwconv);另一条输入分支为卷积层;然后两条输入分支得到的特征融合后,再经过通道重组得到输出结果。

10、本发明提供了一种基于改进yolov5的gis红外特征识别方法,通过gis设备部件红外图像数据集训练基于改进yolov5的gis红外目标检测网络模型,用训练好的基于改进yolov5的gis红外目标检测网络模型进行gis红外目标检测。

11、进一步优选,gis设备部件红外图像数据集的构建方式为:获取gis设备部件红外图像,并利用标注工具labelimg完成标记并进行数据增强,得到gis设备部件红外图像数据集,将gis设备部件红外图像数据集划分为训练集和测试集;训练集用于训练基于改进yolov5的gis红外目标检测网络模型,测试集用于评估基于改进yolov5的gis红外目标检测网络模型的性能。

12、进一步优选,训练时,训练集输入基于改进yolov5的gis红外目标检测网络模型的主干网络中,提取训练集的特征;所提取的特征,在颈部网络中得到训练集的特征图;在头部网络中进行预测,通过计算损失函数来确定模型参数的更新方向。

13、进一步优选,用基于改进yolov5的gis红外目标检测网络模型检测测试集,并用平均精度指标和每秒帧率指标评估,不符合评估要求时,更新模型参数继续训练;当符合评估要求时,保留模型参数用于gis红外目标检测。

14、本发明的有益效果如下:

15、1.本发明在主干网络csp模块中引入了ca注意力模块,实现对输入特征图的通道注意力加权,从而提高深度神经网络的表征能力。ca注意力机制的优点主要在于四个方面:1)学习到不同的channel:传统的卷积层在卷积时对所有的channel进行相同的处理,并没有对不同channel的重要性进行区分。而ca注意力机制可以学习到每个通道的重要性,重点关注重要的通道,不太关注无关通道,从而使得网络可以更好的关注到特征的重要信息,提高网络的识别精度。在实际应用中,可以将ca注意力机制应用于卷积层或者残差块中,对每个通道进行加权处理,使得网络可以更好地将不同通道的信息进行整合。2)可以在不同层次上使用:ca注意力机制可以应用于不同的卷积层,甚至可以通过堆叠多个ca注意力模块,构建出具有多尺度特征提取能力的网络。在底层卷积层中,主要提取的是局部的特征,而在高层卷积层中则越来越提取全局的特征。利用ca注意力可以使得底层的卷积层更加关注重要的局部特征,高层卷积层更加关注全局特征,从而提高网络的特征提取能力和泛化能力。3)计算开销较小:ca注意力机制的提出,使得注意力机制在计算上变得更加轻量化。ca注意力机制只需要全局平均池化和全局最大池化操作,将池化的结果进行点乘得到每个通道的权重,再将每个通道的计算结果合并即可。这种方式的计算开销相对较小,可以让模型更高效地计算。4)可以减少过拟合:由于ca注意力机制可以使得网络更关注重要的信息,减少不同通道之间的干扰,因此可以减少过拟合问题,提高模型的泛化能力。

16、2.本发明在颈部网络卷积层的改进,即将yolov5颈部网络中的卷积层(conv)都替换为gs卷积层(gsconv),具有平移不变性和跨尺度特征提取能力。gs卷积层(gsconv)是一种基于传统卷积运算的改进结构,相较于传统的卷积操作,gs卷积层(gsconv)具有如下优点:1)具有平移不变性:gs卷积层(gsconv)在局部卷积的基础上,引入了可学习的全局偏移值,使得卷积后得到的特征图在位置上具有平移不变性。与传统卷积层(conv)相比,gs卷积层(gsconv)够显著提高模型在目标检测、图像分割等任务中的鲁棒性和泛化能力。2)能够提升特征提取能力:传统卷积层(conv)针对不同的感受野提取特征,但是这种感受野的大小和形状是固定的,很难兼顾多尺度的物体信息。而gs卷积层(gsconv)在每个卷积核的感受野加入了全局偏移值,通过偏移操作提取特征,使得每个卷积核都能够兼顾多尺度的信息,从而能够显著提高特征提取的能力。3)可以替代部分池化操作:传统的下采样操作会破坏特征图的空间信息,导致特征图的分辨率下降,从而可能会降低模型的性能。gs卷积层(gsconv)引入的全局偏移值相当于对特征图进行了平移操作,能够部分替代池化操作,从而保持特征图的高分辨率,提高模型的特征提取能力。4)能够增强图像语义信息:gs卷积层(gsconv)在每个卷积核的感受野内引入可学习的全局偏移值,相当于每个像素点进行了平移操作,使得每个卷积核的感受野内像素值都包含了全局位置信息,从而能够更加有效地捕捉到图像的语义信息,提高模型的识别精度。

17、3.本发明在头部网络中,使用解耦头替换原来yolov5自带的yolov3头。解耦头通过将分类任务和回归任务分别交于不同的子头部,提高了网络的表达能力以及特征有效性,从而提高了检测准确度,它是一种对于目标检测任务的有益补充,能够有效提高gis红外目标检测的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1