一种基于改进YoloV7模型的冰山场景识别方法

文档序号:37079993发布日期:2024-02-20 21:35阅读:19来源:国知局
一种基于改进YoloV7模型的冰山场景识别方法

本发明涉及北极冰区船舶图像识别领域,尤其涉及一种基于改进yolov7模型的冰山场景识别方法。


背景技术:

1、近年来,全球气候变暖现象加剧了北极地区海冰的消融,导致了海冰覆盖范围显著减小,并引发了海冰厚度持续减少的趋势。然而,北极地区特有的环境条件,尤其是海冰和冰山的不断变化,给航线的安全运营带来了巨大挑战。传统的冰山监测方法,如卫星遥感和人工视觉观察,虽然在一定程度上有效,但存在着响应速度慢、成本高和准确性受环境影响大等局限。随着深度学习在图像处理领域的快速发展,利用先进的计算机视觉技术进行冰山识别显得尤为可行。其中经典的faster rcnn算法分辨率通常较小,不利于小物体及多尺度的物体检测;deeplabv3+模型在降采样8倍的尺度上进行预测,导致了边界效果不甚理想。


技术实现思路

1、本发明提供一种基于改进yolov7模型的冰山场景识别方法,以克服上述技术问题。

2、一种基于改进yolov7模型的冰山场景识别方法,包括,

3、step1:获取包含冰山的图像,对图像中的冰山进行标注后构建冰山数据集,基于k-means算法从冰山数据集中获取锚框,根据锚框对冰山数据集中的图像进行数据增强,将数据增强后的图像存储在冰山数据集中,将冰山数据集划分为训练集和验证集;

4、step2:构建yolov7模型,并对yolov7模型进行改进,所述对yolov7模型进行改进包括引入ca注意力机制,确定插入位置,根据插入位置将ca注意力机制插入在yolov7模型中;

5、step3:设置训练参数,所述训练参数包括输入图像尺寸、训练次数、训练集样本数量、权重衰减系数、最大学习率、学习率的下降方式;

6、step4:根据训练集和训练参数对改进的yolov7模型进行训练,并对yolov7模型中的参数进行优化,获取训练后的改进的yolov7模型;

7、step5:根据验证集对所述训练后的改进的yolov7模型进行验证并获取验证结果,判断验证结果是否满足迭代结束条件,若满足,则将训练后的改进的yolov7模型作为最优模型,反之,则返回step3重新设置训练参数并对yolov7模型进行重新训练直至满足迭代结束条件;

8、step6:根据最优模型对待识别的冰山图像进行识别。

9、优选地,所述确定插入位置为通过特征提取网络处理p5特征层之后,插入ca注意力机制。

10、优选地,所述ca注意力机制的处理过程为先将输入特征图分为宽度和高度两个方向分别进行全局平均池化,分别获得在宽度和高度两个方向的特征图,

11、

12、

13、式中:x表示注意力模块的输入特征图;h和w分别代表输入特征图的高度和宽度;c代表特征图的通道索引;和是在高度和宽度维度分别进行全局平均池化之后捕获每个通道沿每个维度空间信息的结果特征;χc(h,i)和χc(j,w)是在特定空间位置(h,i)和(j,w)和特定通道c上的特征值,

14、根据公式(3)将和拼接在一起,之后将它们送入共享的卷积核为1×1的卷积模块,将其维度降低为原来的c/r,然后将经过批量归一化处理的特征图f1送入sigmoid激活函数得到形如1×(w+h)×c/r的特征图f,

15、f=δ(f1([zh,zw]))   (3)

16、式中:w+h是特征图的空间维度,分别代表原始输入特征图的宽度和高度;c/r表示特征图的通道数,r是一个降维因子;f表示注意力机制处理输入特征图后的特征图,用于生成注意力权重;f1表示1×1的卷积操作;δ表示sigmoid激活函数;zh和zw分别表示在高度和宽度上进行全局平均池化后得到的特征,

17、接着将特征图f按照原来的高度和宽度进行卷积核为1×1的卷积操作分别得到通道数与原来一样的特征图fh和fw,经过sigmoid激活函数后分别得到特征图在高度和宽度上的注意力权重gh和在宽度方向的注意力权重gw,

18、gh=σ(fh(fh))     (4)

19、gw=σ(fw(fw))      (5)

20、式中:gh和gw是沿着高度和宽度维度的注意力权重,用于重新加权原始输入特征图;σ为sigmoid激活函数,用于从特征中生成注意力权重;fw和fh表示1×1的卷积操作,应用于分割的张量以匹配输入特征图的通道维度;fw和fh分别指特征图在宽度和高度方向上的特征表示,

21、经过上述计算后将得到输入特征图在高度方向的注意力权重gh和在宽度方向的注意力权重gw,最后在原始特征图上通过乘法加权计算,将得到最终在宽度和高度方向上带有s注意力权重的特征图,公式如下所示,

22、

23、式中:yc(i,j)是在应用注意力权重到输入特征图后,通道c在位置(i,j)的最终输出特征,yc(i,j)代表在通道c上位于(i,j)坐标处的输入特征图的值,i和j分别表示特征图的行和列索引;是沿着高度方向的注意力权重,在通道c上位于i行的权重值;是沿着宽度方向的注意力权重,在通道c上位于j列的权重值。

24、优选地,所述对yolov7模型中的参数进行优化为根据随机梯度下降算法来进行参数的优化。

25、优选地,所述根据锚框对冰山数据集中的图像进行数据增强包括通过对图像进行随机旋转、翻转、裁剪,或调整亮度、对比度、饱和度、通道分离和灰度图进行数据增强。

26、本发明提供一种基于改进yolov7模型的冰山场景识别方法,ca模块通过对输入特征图的通道进行加权,增强了模型对于冰山特征的敏感度,同时抑制了不相关或干扰性信息的影响。引入的ca模块使得改进后的yolov7模型在识别海冰场景中的大型独立海冰和冰山时更加准确。特别是在不同光照和视觉条件下,这种注意力机制有助于模型更好地适应环境变化,提高识别的准确性和鲁棒性。



技术特征:

1.一种基于改进yolov7模型的冰山场景识别方法,其特征在于,包括,

2.根据权利要求1所述的一种基于改进yolov7模型的冰山场景识别方法,其特征在于,所述确定插入位置为通过特征提取网络处理p5特征层之后,插入ca注意力机制。

3.根据权利要求1所述的一种基于改进yolov7模型的冰山场景识别方法,其特征在于,所述ca注意力机制的处理过程为先将输入特征图分为宽度和高度两个方向分别进行全局平均池化,分别获得在宽度和高度两个方向的特征图,

4.根据权利要求1所述的一种基于改进yolov7模型的冰山场景识别方法,其特征在于,所述对yolov7模型中的参数进行优化为根据随机梯度下降算法来进行参数的优化。

5.根据权利要求1所述的一种基于改进yolov7模型的冰山场景识别方法,其特征在于,所述根据锚框对冰山数据集中的图像进行数据增强包括通过对图像进行随机旋转、翻转、裁剪,或调整亮度、对比度、饱和度、通道分离和灰度图进行数据增强。


技术总结
本发明公开了一种基于改进YoloV7模型的冰山场景识别方法,包括获取对图像中的冰山进行标注后构建冰山数据集,对冰山数据集中的图像进行数据增强,构建YoloV7模型并进行改进,设置训练参数,根据训练集和训练参数对改进的YoloV7模型进行训练,并对YoloV7模型的参数进行优化;根据验证集对所述训练后的改进的YoloV7模型进行验证并获取验证结果,判断验证结果是否满足迭代结束条件,若满足,则将训练后的改进的YoloV7模型作为最优模型,反之,返回Step3重新设置训练参数并对YoloV7模型进行重新训练直至满足迭代结束条件;根据最优模型对待识别的冰山图像进行识别。引入的CA模块使得改进后的YOLOv7模型在识别海冰场景中的大型独立海冰和冰山时更加准确。提高了冰山识别的准确性和鲁棒性。

技术研发人员:章文俊,房振,孟祥坤,周翔宇,杨雪,王昱,林椿淇
受保护的技术使用者:大连海事大学
技术研发日:
技术公布日:2024/2/19
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1