一种声呐图像目标定位方法、系统、电子设备及存储介质

文档序号：36481785发布日期：2023-12-25 12:24阅读：41来源：国知局

本发明涉及水下声呐图像处理，特别是涉及一种声呐图像目标定位方法、系统、电子设备及存储介质。

背景技术：

1、在水下的信息处理中，图像是更为直接有效的信息传递方式，而其中又以声呐图像为主，但因为水下环境的复杂，导致声呐成像遇到很多问题，如低分辨率、散斑噪声、强度不均匀性和旁瓣干扰等。相比光学图像，水下图像的获取有着更大的困难，而且存在着声呐图像获取成本高、质量差等缺点，而公开可用的声呐数据，用于分析与研究中往往存在着数量和质量不足的情况，这给水下目标的检测与识别带来诸多挑战。近年来深度学习异军突起，基于神经网络的深度学习对数据有着很强的特征学习能力，而且其学习到的特征数据对原始数据有着更强的表征性。

2、在光学图像领域，深度学习已经取得了很多高质量的发展，涌现了很多优秀的神经网络模型，这些模型拥有优异的特征提取及目标识别能力。为了应对声呐图像获取成本高、可用数据质量参差不齐的问题，可以通过将基于光学图像训练得到的模型迁移至声呐图像的检测与识别中，利用模型优异的特征提取及表征能力，基于深度迁移学习，对模型进行调整，从而使模型在声呐图像中获得优异的性能。

3、当对图像目标进行识别后，为了进一步对目标进行处理，通常需要对目标进行定位。声呐图像有一个典型的特征：图像中通常只有一个目标。对于图像中只有一个目标，希望给出目标的类型和位置的识别任务被叫做“目标定位”。实现这一任务通常使用全监督目标检测方法，但是这类方法需要人工对图像目标的类型和位置逐个进行标注，工作量很大且准确率较低。

技术实现思路

1、本发明的目的是提供一种声呐图像目标定位方法、系统、电子设备及存储介质，提高了声呐图像目标定位的准确率，降低了人工成本。

2、为实现上述目的，本发明提供了如下方案：

3、一种声呐图像目标定位方法，包括：

4、获取待定位声呐图像；

5、基于所述待定位声呐图像和分类模型，确定所述待定位声呐图像的特征图、梯度和目标的预测类型；所述分类模型是利用训练数据集和测试数据集对resnet-18网络进行训练得到的；所述训练数据集和所述测试数据集均包括多张声呐图像的灰度图和对应的目标的真实类型；所述特征图和所述梯度是利用所述分类模型确定目标的预测类型的过程中的中间量；

6、利用gradcam算法，根据所述特征图和所述梯度确定所述待定位声呐图像中的目标的位置。

7、可选地，所述分类模型的训练过程，包括：

8、获取所述训练数据集和所述测试数据集；所述训练数据集包括：多张训练用灰度图像和对应的目标的真实类型，所述训练用灰度图像为训练用声呐图像的灰度图，所述测试数据集包括：多张测试用灰度图像和对应的目标的真实类型，所述测试用灰度图像为测试用声呐图像的灰度图；

9、以所述训练数据集中的各训练用灰度图像为输入，以对应的目标的真实类型为输出，对resnet-18网络进行训练，得到预训练resnet-18模型；

10、利用降采样方法，分别对所述训练数据集进行n次采样，得到n个降采样数据集；

11、分别利用各所述降采样数据集中的各训练用灰度图像为输入，以对应的目标的真实类型为输出，对所述预训练resnet-18网络进行微调，得到n个微调后的resnet-18模型；

12、基于所述测试数据集分别对预训练resnet-18模型和n个微调后的resnet-18模型进行测试和筛选，得到多个待融合模型；

13、计算所有所述待融合模型的神经元的权重的平均值作为权重平均值，计算所有所述待融合模型的偏置系数的平均值作为偏置系数平均值；

14、将所述权重平均值替换所述预训练resnet-18模型的神经元的权重，将所述偏置系数平均值替换所述预训练resnet-18模型的偏置系数，得到所述分类模型。

15、可选地，基于所述待定位声呐图像和分类模型，确定所述待定位声呐图像的特征图、梯度和目标的预测类型，具体包括：

16、将所述待定位声呐图像灰度化，得到待定位灰度图；

17、将所述待定位灰度图输入至所述分类模型中，得到所述待定位声呐图像的特征图、梯度和目标的预测类型。

18、可选地，利用gradcam算法，根据所述特征图和所述梯度确定所述待定位声呐图像中的目标的位置，具体包括：

19、利用gradcam算法，根据所述特征图和所述梯度确定特征热力图；

20、对所述特征热力图进行连通化，确定连通区域；

21、确定所述连通区域的坐标信息，从而确定所述待定位声呐图像中的目标的位置。

22、可选地，基于所述测试数据集分别对预训练resnet-18模型和n个微调后的resnet-18模型进行测试和筛选，得到多个待融合模型，具体包括：

23、将所述测试数据集中的各测试用灰度图像分别输入到预训练resnet-18模型和n个微调后的resnet-18模型中，得到对应的预测类型；

24、基于各模型输出的预测类型和对应的真实类型，计算各模型的准确率和几何均值指标；

25、将各模型的准确率和几何均值指标的和确定为对应模型的指标值；

26、基于所述指标值，按照预设遗弃率对各模型进行遗弃，得到多个所述待融合模型。

27、一种声呐图像目标定位系统，包括：

28、待定位声呐图像获取模块，用于获取待定位声呐图像；

29、分类模块，用于基于所述待定位声呐图像和分类模型，确定所述待定位声呐图像的特征图、梯度和目标的预测类型；所述分类模型是利用训练数据集和测试数据集对resnet-18网络进行训练得到的；所述训练数据集和所述测试数据集均包括多张声呐图像的灰度图和对应的目标的真实类型；所述特征图和所述梯度是利用所述分类模型确定目标的预测类型的过程中的中间量；

30、定位模块，用于利用gradcam算法，根据所述特征图和所述梯度确定所述待定位声呐图像中的目标的位置。

31、一种电子设备，包括：

32、一个或多个处理器；

33、存储装置，其上存储有一个或多个程序；

34、当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述所述的声呐图像目标定位方法。

35、一种存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如上述所述的声呐图像目标定位方法。

36、根据本发明提供的具体实施例，本发明公开了以下技术效果：

37、本发明公开了一种声呐图像目标定位方法、系统、电子设备及存储介质，首先，获取待定位声呐图像；然后，基于待定位声呐图像和分类模型，确定待定位声呐图像的特征图、梯度和目标的预测类型；分类模型是利用训练数据集和测试数据集对resnet-18网络进行训练得到的；训练数据集和测试数据集均包括多张声呐图像的灰度图和对应的目标的真实类型；特征图和梯度是利用分类模型确定目标的预测类型的过程中的中间量；最后，利用gradcam算法，根据特征图和梯度确定待定位声呐图像中的目标的位置，实现了基于gradcam算法的声呐图像弱监督目标定位，提高了声呐图像目标定位的准确率，降低了人工成本。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张建磊张春燕魏光泽
技术所有人：南开大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。