一种基于改进YOLOv5的水下图像目标检测方法与系统

文档序号：36401992发布日期：2023-12-16 06:37阅读：45来源：国知局

本发明涉及水下图像检测领域，尤其涉及一种基于改进yolov5的水下图像目标检测方法与系统。

背景技术：

1、目前，经济的飞速发展和人口的不断增长对自然资源的消耗越来越多，人类开发自然资源主要是在陆地上进行的，因此陆地上的许多种自然资源已经越来越少，而占地球表面积约71％的海洋则蕴藏着丰富的生物、矿产等资源，能为人类生产、生活带来巨大的经济利益，这些储量丰富的资源都未经开发。自然资源不断增长的需求使海洋资源成为人类下一个重点开发的资源领域。由于海洋开发的巨大潜力和海洋经济发展的战略需要，尤其是广阔的海洋空间所蕴藏的丰富资源，国际上对海洋经济产生了高度关注和热切期待。我国是一个海洋大国，海洋资源丰富，水下活动也愈趋频繁，如海底探矿、石油平台的监测、海底沉船搜索、坝基裂缝的检测等都需要用到目标检测与识别。但由于机器视觉在水下作业的过程中受到的限制很多，如光照、悬浮物、水对光线的吸收与散射等，水下图像通常对比度低，边缘模糊，图像质量较差，难以准确识别出水下生物，因此，本发明提出了一种能对水下图像目标(水下生物)进行有效检测与准确识别的方法。

技术实现思路

1、为了准确识别水下图像目标，本发明提出了一种基于改进yolov5的水下图像目标检测方法，包括步骤：

2、s01：获取水下图像样本，并对其进行预处理得到图像集，通过标记软件利用矩形框，标定出图像集中各张图像上的水下图像目标，得到yolo格式的标注信息文件；所述标注信息文件中的每一行表示一个水下图像目标对应的标签信息；所述标签信息包括：图像类别、水下图像目标对应的矩形框相对其对应图像的中心坐标，以及矩形框的宽和高相对于对应图像尺寸的宽和高的比例值；通过图像集与其对应的标注信息文件得到数据集；

3、s02：以yolov5模型为基础模型，使用归一化模块、门控卷积模块、gelu激活函数模块与正则化模块组成的特征处理模块，替换yolov5模型中c3模块内的res残差模块，得到第一yolov5模型；

4、s03：通过数据集训练第一yolov5模型，得到改进的yolov5模型；输入待预测的图像至改进的yolov5模型，预测出该图像中水下图像目标的图像类别与位置信息；所述位置信息包括水下图像目标相对于其对应图像的中心坐标，与水下图像目标的宽和高相对于其对应图像宽和高的比例值。

5、进一步地，所述特征处理模块具体包括：

6、第一特征模块，其包括第一通道、第二通道与第一融合模块，其中：

7、所述第一通道包括：

8、第一归一化模块，用于归一化输入特征，使输入特征转换为均值为1、方差为0的归一化数据；

9、门控卷积模块，用于对归一化数据进行卷积计算；

10、第一正则化模块，用于对卷积计算后的归一化数据进行正则化处理，并在处理后输入第一融合模块；

11、所述第二通道，用于将输入特征直接输入第一融合模块；

12、所述第一融合模块，用于融合第一特征模块对应第一通道与第二通道输入的特征数据，得到第一特征模块输出的第一融合特征；

13、第二特征模块，其包括第一通道、第二通道与第二融合模块，其中，第一通道包括：

14、第二归一化模块，用于归一化第一融合特征，得到归一化融合特征；

15、gelu激活函数模块，用于激活归一化融合特征；

16、第二正则化模块，用于对激活后的归一化融合特征进行正则化处理，并在处理后输入第二融合模块；

17、所述第二通道，用于将第一融合特征直接输入第二融合模块；

18、所述第二融合模块，用于融合第二特征模块对应第一通道与第二通道输入的特征数据并输出。

19、进一步地，所述s01步骤中，所述预处理具体为：通过双线性插值法归一化处理水下图像样本，将水下图像样本等比缩放为预设像素的图像，并使用灰色图像填充水下图像样本中的空白颜色，得到图像集。

20、本发明还提出了一种基于改进yolov5的水下图像目标检测系统，包括：

21、数据集获取模块，用于获取水下图像样本，并对其进行预处理得到图像集，通过标记软件利用矩形框，标定出图像集中各张图像上的水下图像目标，得到yolo格式的标注信息文件；所述标注信息文件中的每一行表示一个水下图像目标对应的标签信息；所述标签信息包括：图像类别、水下图像目标对应的矩形框相对其对应图像的中心坐标，以及矩形框的宽和高相对于对应图像尺寸的宽和高的比例值；通过图像集与其对应的标注信息文件得到数据集；

22、模型改进模块，用于以yolov5模型为基础模型，使用归一化模块、门控卷积模块、gelu激活函数模块与正则化模块组成的特征处理模块，替换yolov5模型中c3模块内的res残差模块，得到第一yolov5模型；

23、检测模块，用于通过数据集训练第一yolov5模型，得到改进的yolov5模型；输入待预测的图像至改进的yolov5模型，预测出该图像中水下图像目标的图像类别与位置信息；所述位置信息包括水下图像目标相对于其对应图像的中心坐标，与水下图像目标的宽和高相对于其对应图像宽和高的比例值。

24、进一步地，所述特征处理模块具体包括：

25、第一特征模块，其包括第一通道、第二通道与第一融合模块，其中：

26、所述第一通道包括：

27、第一归一化模块，用于归一化输入特征，使输入特征转换为均值为1、方差为0的归一化数据；

28、门控卷积模块，用于对归一化数据进行卷积计算；

29、第一正则化模块，用于对卷积计算后的归一化数据进行正则化处理，并在处理后输入第一融合模块；

30、所述第二通道，用于将输入特征直接输入第一融合模块；

31、所述第一融合模块，用于融合第一特征模块对应第一通道与第二通道输入的特征数据，得到第一特征模块输出的第一融合特征；

32、第二特征模块，其包括第一通道、第二通道与第二融合模块，其中，第一通道包括：

33、第二归一化模块，用于归一化第一融合特征，得到归一化融合特征；

34、gelu激活函数模块，用于激活归一化融合特征；

35、第二正则化模块，用于对激活后的归一化融合特征进行正则化处理，并在处理后输入第二融合模块；

36、所述第二通道，用于将第一融合特征直接输入第二融合模块；

37、所述第二融合模块，用于融合第二特征模块对应第一通道与第二通道输入的特征数据并输出。

38、进一步地，所述数据集获取模块中，预处理具体为：通过双线性插值法归一化处理水下图像样本，将水下图像样本等比缩放为预设像素的图像，并使用灰色图像填充水下图像样本中的空白颜色，得到图像集。

39、与现有技术相比，本发明至少含有以下有益效果：

40、(1)本发明以yolov5模型为基础模型，使用归一化模块、门控卷积模块、gelu激活函数模块与正则化模块组成的特征处理模块，替换yolov5模型中c3模块内的res残差模块，其通过归一化模块避免了特征数据落在激活函数的饱和区，减少了梯度消失的问题；通过门控卷积模块提升了模型的高阶空间交互性能，其兼容各种卷积的变体，其将自注意的二阶相互作用扩展到任意阶，而没有增加大量的计算量，因此在有效提取特征信息的同时降低了计算和存储的开销；通过正则化模块帮助网络收敛，有效防止了网络过拟合；通过gelu激活函数模块为激活函数引入了随机性使得模型训练过程更加鲁棒，稳定了网络梯度流，因此，本发明通过替换后的c3模块，极大的提高了模型预测的准确度，解决了现有技术中难以准确识别出水下生物的问题；

41、(2)本发明通过图像集与其对应的标注信息文件得到数据集，通过数据集训练第一yolov5模型，得到改进后的yolov5模型，并通过改进后的yolov5模型预测图像中水下图像目标的图像类别与位置信息，实现了对水下图像目标的准确识别。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周桢杰杜宝祯徐海勇陈文明丁文晖
技术所有人：宁波职业技术学院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。