一种基于改进YOLOv5的SAR图像飞机目标检测方法

文档序号:35243660发布日期:2023-08-25 08:47阅读:62来源:国知局
一种基于改进YOLOv5的SAR图像飞机目标检测方法

本发明涉及图像目标检测领域,尤其涉及一种基于改进yolov5的sar图像飞机目标检测方法。


背景技术:

1、合成孔径雷达(syntheticaperture radar,sar)是一种主动式微波成像传感器,具有全天时、全天候的成像观测能力。sar自20世纪50年代诞生之后,由于其独特的成像机制,其在军事和民用领域都得到了广泛的应用。在民用领域,sar在矿藏资源探测、灾情探测与防治、地形探测与绘制及农业、林业等方面发挥着巨大的作用;在军事领域,sar图像在战场态势感知、典型目标识别和精准指导、隐形目标散射特性的静动态测量等方面具有突出的意义。由于sar的独特性能,sar图像目标解译技术受到了各国的重视,飞机作为其中一类重要的目标,在民用领域,飞机检测有助于机场的有效管理;在军事领域,获取飞机的数量、分布等信息具有重要价值。因此,利用sar图像进行飞机目标的精确检测识别是个研究的热点方向并且具有重要意义。

2、近年来,随着深度神经网络的发展,目标检测模型分为one-stage检测模型和two-stage检测模型。双阶段检测模型先在图像中生产大量的候选区域,再通过卷积神经网络对这些区域进行特征提取,最后识别目标类别和位置。常用的双阶段目标检测模型有r-cnn、fast r-cnn、faster r-cnn等。基于候选区域的双阶段目标检测算法虽然精度很高,但是检测效率不高,而单阶段目标检测方法不需要生成候选区域,直接从输入图像中提取特征,继而预测物体的类别与位置信息。常用的单阶段目标检测模型有ssd和yolo。

3、单阶段检测模型在速度上远远优于双阶段检测模型。在单阶段检测模型检测速度较快的情况下,检测时精度都没有达到预想的要求,在复杂背景中容易虚检、漏检目标。因此,通过改进检测模型进一步提升sar图像飞机目标检测精度具有重要意义。

4、因此,本领域的技术人员致力于开发一种基于改进yolov5的sar图像飞机目标检测方法,能够尽量避免漏检、误检,使得复杂背景下的飞机目标能够被精准检测。


技术实现思路

1、有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是避免漏检、误检,精准检测复杂背景下的飞机目标。

2、为实现上述目的,本发明提供了一种基于改进yolov5的sar图像飞机目标检测方法,对目标检测算法yolov5进行改进,获得改进后的目标检测算法yolov5,包括以下步骤:

3、步骤1、在输入层中采用mosaic数据增强方式,对输入图像进行预处理,采用k均值聚类算法针对飞机目标尺寸优化锚框;

4、步骤2、所述步骤1的特征图输入改进的主干网络,改进的主干网络是指在主干网络中引入坐标注意力机制ca,采用spd-ca卷积块替换主干网络对图像进行下采样所采用的跨步卷积;

5、步骤3、所述步骤2得到的不同尺度的图像特征图输入到改进的yolov5网络中的neck部分,采用设计的ffp特征融合金字塔网络结构改进目标检测算法yolov5的neck结构,实现自适应特征融合;

6、步骤4、所述步骤3得到不同尺度的张量数据,输入到改进的yolov5网络中的预测层部分,在预测层之前添加全局注意力机制gam,捕捉全局信息,减少不准确的目标定位。

7、进一步地,所述步骤1,所述mosaic数据增强方式采用图片随机缩放、随机裁剪、随机排布的方式进行拼接,对输入图像进行预处理,提升小目标的检测效果。

8、进一步地,所述步骤1,采用k-means聚类算法针对数据集中飞机目标尺寸优化锚框,通过对数据进行聚类分析提升先验框和目标框的匹配度,进行自适应锚框计算,对每个检测头都更换所有初始锚框大小。

9、进一步地,所述步骤2,在yolov5模型的主干网络部分将下采样所用的3*3卷积核且步数为2的卷积块替换为设计的spd-ca卷积块,完全替代卷积步长和池化层;spd层是一个由空间到深度的连接层,具体操作是在图像中每隔一个像素提取出一个值,类似于邻近下采样,将特征图分为四张子特征图,具体表示如下:

10、f0,0=x[0:s:2,0:s:2],f1,0=x[1:s:2,0:s:2],

11、f0,1=x[0:s:2,1:s:2],f1,1=x[1:s:2,1:s:2]

12、s为图像尺寸size,之后沿着通道维度将这些子特征映射连接在一起,在对特征映射进行下采样的同时,保留了通道维度的所有信息,避免了信息的非歧视丢失;在spd层后引入坐标注意力机制层ca,加强对目标点的注意,感受飞机目标的位置信息,最后添加一层单步长卷积层去改变使用学习参数的通道数量。

13、进一步地,所述步骤3,从主干网络的后端将所述步骤2得到的图像特征图输入到改进的yolov5网络中的neck部分,neck结构由原来的panet简单双向特征金字塔结构变为设计的ffp特征融合金字塔结构;neck在特征金字塔网络的基础上引入自下而上的路径增强结构,细化主干网络输出的图像特征矩阵实现双向特征金字塔,并吸收bifpn与asff两种结构的思想,在主干网络与自下而上特征融合路径之间增加跳跃连接分支,即处在同一层次的输入节点与输出节点之间添加一条额外的边,使其能在同层次之间融合更多的特征;同时,在双向特征传输的路径当中加入asff特征融合结构,实现不同层次之间特征的交叉融合。

14、进一步地,所述步骤4,不同尺度的特征图数据输入到改进的yolov5网络中的预测层部分,在neck部分后端即预测层之前集成一种全局注意力机制,使得模型结合不同尺度下的目标特征,保留特征融合之后的目标特征信息。

15、进一步地,还包括以下步骤:基于获取到的sar图像飞机目标数据集,得到带有标签的图像数据集。

16、进一步地,所述图像数据集,划分为训练集和测试集,75%作为训练集,25%作为测试集。

17、进一步地,还包括以下步骤:设置训练参数,利用训练集对检测模型进行训练,得到训练后的模型以及权重文件,利用测试集以及精确率、召回率、f1分数等评价指标对训练后的模型进行性能评估。

18、进一步地,所述训练参数,包括:epoch为100,lr为0.01,momentum为0.937,batchsize为8;损失函数由回归定位损失和置信度损失组成进行约束,使用随机梯度下降法sgd对目标函数进行优化,采用训练过程中将模型表现最好的权重参数保存文件对改进的目标检测算法yolov5进行评估,加载后对测试集飞机目标进行测试。

19、在本发明的较佳实施方式中,对于将飞机目标图像输入yolov5模型主干网络进行下采样特征提取时,下采样使用的跨步卷积会造成信息的非歧视丢失,且检测网络没有很好的关注到飞机目标的位置,需要加强网络对飞机目标的注意,减少漏检进一步提升检测效果。本发明改进主干网络,改进的主干网络是指在主干网络中引入坐标注意力机制ca,设计并采用了一种spd-ca卷积块替换主干网络对图像进行下采样所采用的跨步卷积,更加关注飞机目标位置信息。在yolov5模型的主干网络部分将下采样所用的3*3卷积核且步数为2的卷积块替换为设计的spd-ca卷积块,完全替代卷积步长和池化层。spd层是一个由空间到深度的连接层,具体操作是在图像中每隔一个像素提取出一个值,类似于邻近下采样,将特征图分为四张子特征图,之后沿着通道维度将这些子特征映射连接在一起。改进的spd-ca模块包括一个spd层,原理为在下采样过程中存在大量的冗余像素信息,当替代跨跃卷积和池化,模型仍然可以很好地学习特征。spd将图像特征图分成四张子特征图,用通道维度方式将其连接在一起,对特征进行下采样映射的同时,很好地保留通道维度中的所有信息;之后添加高效的坐标注意力机制层ca,通过精确的位置信息对通道关系和长期依赖性进行编码,在特定的位置方向上增加并改善飞机目标的兴趣点;最后连接一个卷积层方便改变通道数量。避免主干网络下采样时特征信息的非歧视丢失;加强对目标点的注意,更好地感受飞机目标的位置信息;此模块设计让通道信息得到了很好的保留,更多的特征信息可以在后面的结构进行融合。

20、对于将图像输入yolov5检测模型主干网络后得到的多尺度图像特征图,飞机目标的图像特征没有很好地进行不同层次之间的特征融合,使网络在传输过程中损失一些信息且不能很好地进行多尺度特征针对性学习,从而会导致检测精度损失。本发明设计了新颖的neck结构ffp特征融合金字塔网络结构改进替换yolov5原来的panet简单双向特征金字塔结构。从主干网络的后端得到的多尺度图像特征图输入到改进的yolov5网络中的neck部分,neck在特征金字塔网络的基础上引入自下而上的路径增强结构,细化主干网络输出的图像特征矩阵实现双向特征金字塔,并吸收bifpn与asff两种结构的思想,在主干网络与自下而上特征融合路径之间增加跳跃连接分支,即处在同一层次的输入节点与输出节点之间添加一条额外的边,使其能在同层次之间融合更多的特征。同时,在双向特征传输的路径当中加入asff特征融合结构,实现不同层次之间特征的交叉融合。使检测模型实现同层次之间能够融合更多有效特征,且交叉融合不同层次之间的特征;实现多尺度、高层次的自适应特征融合。

21、对于检测模型进行飞机目标预测时通常会出现不准确的目标定位,需要加强对预测输出的信息注意,减少飞机目标的错检与虚检。本发明得到的不同尺度的特征图数据输入到改进的yolov5网络中的预测层部分,在neck部分后端即预测层之前集成一种全局注意力机制gam。在特征融合结构之后,即三个输出检测层之前添加全局注意力机制,全局注意力机制可以起到减少网络信息缩减并放大全局维度交互特征的作用,将飞机目标检测网络中跨越通道、空间宽度和空间高度研究注意力权重,保留信息以放大“全局”跨维度交互的能力,能够捕捉此三个维度的重要特征。使得模型更好结合不同尺度下的目标特征,保留更多特征融合之后的目标特征信息;更好地捕捉全局信息,减少不准确的目标定位。

22、本发明与现有技术相比较,具有如下显而易见的实质性特点和显著优点:

23、本发明首先采用k-means聚类优化飞机目标锚框,降低漏错检概率;接着在主干网络通过引入坐标注意力机制设计新的下采样卷积模块,能够更有效地学习目标位置特征;然后在颈部网络结构改进特征融合方式,设计特征融合金字塔结构,增强多尺度学习与特征信息融合;最后,在网络模型末端添加全局注意力机制,使网络获得更多的全局信息与上下文信息,更好地进行飞机目标位置检测。因此,本发明具有能很好避免复杂背景下虚检、漏检飞机目标的优势,与现有技术相比能够更好地提高sar图像飞机目标检测精度,确保飞机能够被准确检测。

24、以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1