基于注意力和多尺度特征融合的水下目标检测模型及方法

文档序号:37283178发布日期:2024-03-12 21:24阅读:29来源:国知局
基于注意力和多尺度特征融合的水下目标检测模型及方法

本发明属于水下图像数据处理分析,尤其涉及一种基于注意力和多尺度特征融合的水下目标检测模型及方法。


背景技术:

1、近年来,随着生活水平的提高与科技的快速发展,海洋资源的开发和利用备受关注。水下目标检测能够帮助探测和定位海洋中的资源,监测海洋环境状态,维护海洋安全并提高搜救与救援能力。然而,由于水下图像通常受到光线衰减散射、噪声等多种因素的影响,导致图像质量差且细节模糊。传统的水下目标检测方法通常依赖于手工设计的特征提取器和分类器,如滤波器纹理分析和模型匹配。然而,由于水下图像的不确定性和多样性,传统方法的性能通常不能满足实际需求,特别是在复杂场景和目标边界模糊的检测方面表现较差。

2、相比于传统的基于特征工程的方法,深度学习技术可以自动地从数据中学习到更高维度的特征表示,从而提高目标检测的准确性和鲁棒性。深度学习算法通过构建多层神经网络,利用大规模标注数据进行训练,能够从输入图像中提取出丰富的语义信息,并准确地定位和识别水下目标。并且此类算法具有较强的泛化能力,能够适应不同水下环境和目标类型的变化。常见的深度学习目标检测算法主要是基于卷积神经网络(cnn)的方法,如faster r-cnn、yolo和ssd等。这些模型能够处理复杂的水下图像,克服光线衰减、散射和噪声等问题,提供更精确的目标定位和识别结果。这些深度学习算法在目标检测领域表现出了明显的优势,因此受到了广泛的实际应用。

3、但是,由于水下环境中存在各种背景干扰,如水草、沉积物等。传统的深度学习网络可能无法对复杂水下环境下图像的特征重要性进行区分,导致误检测率较高。同时,水下目标尤其是鱼类在不同姿态和形变下表现出不同的外观特征。传统的深度学习网络可能对目标形变和姿态变化较为敏感,难以对具有变化的目标进行准确检测。


技术实现思路

1、针对上述问题,本发明引入了注意力机制来帮助模型选择和加权输入数据中最相关的特征,并结合多尺度特征融合来解决水下目标检测中的尺度不变性、目标定位精度、目标背景干扰和目标形变姿态变化等问题。通过利用不同尺度的特征信息,提高了模型的感知能力和区分能力,从而提升了水下目标检测的准确性和鲁棒性。

2、本发明第一方面提出了一种基于注意力和多尺度特征融合的水下目标检测模型,包括依次连接的特征提取模块、多尺度特征融合模块和水下目标定位模块;

3、所述特征提取模块基于焦点自注意力,使用预处理后的水下目标图像作为该模块输入,提取图像的低级到高级的语义特征表示,从而得到基础特征表示;

4、所述多尺度特征融合模块是为了适应水下目标图像检测的尺度变化,将基础特征表示输入多尺度特征融合模块进行特征整合,得到具有更强表达能力的融合特征;

5、所述水下目标定位模块是使用基于cnn的目标检测模型,引入图像目标角点的回归策略,基于输入融合特征进行目标图像识别,以得到水下目标图像的检测结果。

6、优选的,所述特征提取模块之前还连接有预处理模块,所述预处理模块的处理流程为:

7、获取水下真实图像;

8、将图像的像素值缩放到范围,使用双线性插值调整图像的大小,并保持图像的纵横比不变;

9、使用高斯滤波在对图像像素进行平滑操作以减少噪声的影响,从而提高图像的质量和清晰度;

10、使用对比度增强、亮度调整和直方图均衡化对图像增强,从而使特征和细节更显著。

11、优选的,所述特征提取模块的具体处理过程为:

12、首先,将目标图片划分为个子图,每个子图的像素点为,以中心的一圈子图作为查询,并采用多粒度提取其周围边缘的标记级别,作为中间子图对于其周围子图查询得到的键和值;对于第一级,以最细的粒度提取最接近中间部分的标记;然后在第二级,扩展注意力区域并池化周围的部分,从而产生池化的标记;在第三级,参与覆盖整个特征图和部分的更大区域;最后,将这三个级别的标记拼接起来计算中间部分所有标记的键和值;

13、将上述得到的标记送入n个fsa 层,采用局部感受野机制池化,并将多个标记的信息进行聚合,以减少计算量;每个标记级别中,首先将标记划分成多个的子窗口,然后用一个线性层进行池化操作,定义为:

14、(1)

15、其中,输入特征图,其中是空间维度,是特征维度;代表每个子窗口的大小,表示线性层,不同层次的特征映射提供了丰富的细粒度和粗粒度信息;

16、在所有的标记级别上获得了池化的特征映射后,进行第一级计算查询,并使用三个线性投影层计算所有层的键和值:

17、(2)

18、然后提取特征映射中每个查询标记的周围标记;对于第个窗口内的查询,从查询所在窗口周围的和中提取个键和值,然后从所有中收集键和值,得到和,其中为各级焦点区域之和,即,;最后,纳入相对位置偏差,并通过以下方式计算的焦点自注意:

19、(3)

20、其中,可学习相对位置偏差,由个焦点级别的个子集组成;是特征维度;

21、经过以上步骤可以得到水下目标图像中各尺度有代表性的基础特征表示,以供后续的多尺度特征融合使用。

22、优选的,所述多尺度特征融合模块的具体处理过程为:

23、将得到的各尺度代表性基础特征表示作为输入,构建一个多尺度特征金字塔来获取鲁棒的特征图;从较高级别的特征图进行上采样,以使用上下文信息增强较低级别的特征图;

24、多尺度特征图定义为、、、、和、、、、,对应的步幅分别为 8、16、32、64、128;定义、、是初始特征层,缩放过程可以描述为:

25、(4)

26、(5)

27、(6)

28、(7)

29、表示级特征金字塔的第层特征,为可变通道数滤波器,卷积核为,步幅为1,为下采样滤波器,卷积核为,步幅为 2,是上采样,是卷积运算;

30、每个构建块通过横向连接获取更高分辨率的特征图和更为概略的图,并生成新的特征图;每个特征图通过一个卷积层,以减小特征图尺寸大小;然后通过横向连接将特征图的每个元素与经过下采样后特征图相加;然后融合的特征图由另一个卷积层处理以生成,用于后续子网络;此为迭代过程,在接近后终止;特征融合过程可以表述如下:

31、(8)

32、经过多尺度特征融合,可以得到各个尺度融合后的最终特征向量表示。

33、优选的,所述水下目标定位模块中引入图像目标角点的回归策略,具体为:

34、将融合特征数据作为待检测目标的输入特征向量,并且根据数据集中的目标标签类别得到待检测的总类别数;

35、引入的目标图像像素目标角点的回归策略,是将图像像素网格的角点也作为召回点,角点与实际框的距离除以相应的步幅,以匹配水下物体的实际大小,角点到真值框的距离分别为 、 、 、,其中,

36、(9)

37、训练目标是网格中心点到真值框的距离;和是真值框的角点,是网格的中心点,角点回归策略为:

38、(10)

39、基于以上策略,优化损失函数,不断提升检测框精度,实现复杂水下环境下的目标检测。

40、优选的,在训练时,首先获取水下目标图像的原始数据集;

41、然后对图像数据集进行预处理,并采用5倍交叉验证法对数据集进行划分,将所有数据集分成5份,不重复地每次取其中1份做测试集,用其他4份做训练集训练模型;最终,将5次评估的结果取平均值作为模型的性能指标。

42、本发明第二方面提供了一种基于注意力和多尺度特征融合的水下目标检测方法,包括以下过程:

43、拍摄获取水下原始目标图像;

44、将目标图像输入到如第一方面所述的水下目标检测模型中;

45、输出水下目标检测结果。

46、本发明第三方面提供了一种水下目标检测设备,其特征在于:所述设备包括至少一个处理器和至少一个存储器,所述处理器和存储器相耦合;所述存储器中存储有如第一方面所述的水下目标检测模型的计算机执行程序;所述处理器执行存储器中存储的计算机执行程序时,使处理器执行水下目标图像检测。

47、本发明第四方面提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有如第一方面所述的水下目标检测模型的计算机程序或指令,所述程序或指令被处理器执行时,使处理器执行水下目标图像检测。

48、与现有技术相比,本发明具有如下有益效果:

49、(1)基于焦点自注意力的特征提取模块:针对水下目标检测中的目标背景干扰等问题,构建基于焦点自注意力的特征提取模块,通过学习自适应的注意力权重,增强目标与背景的区分能力,提高模型的感知能力和区分能力。

50、(2)多尺度特征融合模块:针对水下鱼类目标形变和姿态变化等问题,构建多尺度特征融合模块,利用不同尺度的特征信息,取目标与背景的差异信息,使模型能够自动关注鱼类图像不同尺度特征中与目标相关的部分,在不同尺度上实现精细的目标定位和分割。

51、(3)自适应学习模型框架:引入注意力机制和多尺度特征融合,在水下环境中准确地定位和分割鱼类目标,克服目标形变、光照变化和背景干扰等困难。自适应地调整模型的关注重点,从而提高水下目标检测的性能和鲁棒性,具有较强的适应性,适用于不同水下场景和目标类型的检测任务。

52、总体来讲,本发明在深度学习中引入了多尺度特征融合和注意力机制,用以构建水下目标检测模型,这种方法可以有效提升水下目标检测的精度,特别适用于复杂的水下场景。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1