一种多尺度特征融合的声纳图像目标检测方法

文档序号:36390764发布日期:2023-12-15 08:56阅读:40来源:国知局
一种多尺度特征融合的声纳图像目标检测方法

本发明涉及水下目标识别,具体为一种多尺度特征融合的声纳图像目标检测方法。


背景技术:

1、随着深度学习的快速发展,声纳图像的水下目标识别领域具有广阔的发展空间,新兴的深度学习方法可以有效地提高识别模型的泛化能力,实现端到端信息传输和自主识别,然而,这些任务面临着一些挑战,如提高检测和识别的准确性和速度,最小化计算和通信的成本,以及降低模型的复杂性,解决这些问题是提高水下目标探测系统的整体性能的关键。

2、以人工提取特征的方式对声呐图像进行目标检测,其中主要有基于像素、特征和回波的方法,这些传统的水下目标检测方法,大多基于像素值特征、灰度阈值或者相应目标的先验信息,但水下环境复杂,回波受自噪声、混响噪声和环境噪声等影响,导致声呐图像的分辨率低、边缘细节模糊、斑点噪声严重,以至于很难寻找到良好的像素特征和灰度阈值,另外,水下目标种类众多,获得一定的先验信息代价太高,所以,当前传统算法对水下目标的检测精确度不高,随着深度学习的发展,目前深度学习的检测方法能够提取多层抽象特征,解决了传统方法中人工提取特征的麻烦,同时利用数据增强使少样本的问题得到了解决,现在的声纳图像检测方法显示出了较高的检测速度和精度,但还需要进一步的研究来解决声纳图像特征提取过程中噪声和目标信息合并的挑战,这一挑战目前阻碍了识别精度的提高。

3、金等人(“基于卷积神经网络的水下目标声呐图像识别方法”,西北工业大学学报,第39卷,第2期:第285-291页(2021年))使用卷积神经网络识别水下目标的模型,该网络结合了图像突出区域分割和基于声纳图像特征的金字塔池,防止了模型过拟合,但没有考虑声纳图像识别中复杂背景特征提取和目标特征损失的问题。

4、王等人(x,wang,z,guan,j,wang,and y,wang,“target detection of colorimage sonar based on convolutional neuralnetwork,”j,comput,appl,vol,39,no,s1,pp,187191,jul,2019,)利用双线性插值预处理技术,结合目标检测算法网络,成功实现了声纳图像目标识别,但是实验目标仅为木桩一类,没有解决实验少样本的问题。

5、盛等人(“样本仿真结合迁移学习的声呐图像水雷检测”,智能系统学报,第16卷,第2期:第385-392页(2021年))实现了水雷目标声呐图像仿真,扩增了数据集;同时,结合样本仿真和迁移学习提升了深度学习的准确性,避免了深度学习对小样本学习不足的问题,但是忽略了特征提取过程的全局性和卷积层对上下文特征的学习能力的问题。

6、基于对上述资料的检索,可以看出现有技术存在如下缺陷:

7、现有的声纳图像目标检测模型主要使用堆叠卷积的方式进行特征提取,对于相似度较高的声纳图像前景与背景的区分度差,从而易导致模型错检或者漏检;

8、现有的声呐图像目标检测模型忽略特征的全局上下文信息,使得提取的深度抽象特征的表征能力差,从而降低模型的识别精度。


技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足,本发明提供了一种多尺度特征融合的声纳图像目标检测方法,解决了上述的问题。

3、(二)技术方案

4、为实现以上目的,本发明通过以下技术方案予以实现:一种多尺度特征融合的声纳图像目标检测方法,具体包括以下步骤:

5、s1、特征提取:原始声呐图像输入特征提取模块中,依次经过四次卷积层进行部分特征提取后,进行特征融合,得到四倍降采样特征图,将四倍降采样特征图依次交替进行四次堆积模块和三次降采样操作,依次获取第一有效特征层和第二有效特征层,后引入注意力机制进行空间金字塔池化操作,获取第三有效特征层;

6、s2、特征融合:引入注意力机制对第一有效特征层和第二有效特征层进行卷积后,获取卷积后的第一有效特征层和卷积后的第二有效特征层,第三有效特征层进行动态卷积和上采样操作后,与卷积后的第二有效特征层通过堆积模块进行特征合并,获取一次融合特征层,一次融合特征层进行动态卷积和上采样操作后,通过堆积模块与卷积后的第一有效特征层进行特征合并,获取二次融合特征层,二次融合特征层经过降采样操作后,通过堆积模块与卷积后的第二有效特征层和一次融合特征层进行特征合并,获得三次融合特征层,通过堆积模块与三次融合特征层与第三有效特征层进行特征合并后,获得四次融合特征层;

7、s3、目标识别:将二次融合特征层、三次融合特征层和四次融合特征层分别输入到无卷积计算增量但提高精度的通用新型卷积模块中,输出对应的边界框、类别和置信度信息,进行中心点预测,利用回归预测结果对中心点偏移进行计算,并且进行预测框宽高的预测,同时进行非极大值抑制的操作。

8、本发明进一步设置为:所述s1和s2中的堆积模块包括两个第一卷积分支:

9、一个所述第一卷积分支经过一个1x1卷积做通道数变化;

10、另一个所述第一卷积分支为先经过一个1x1的卷积模块使通道数变化,再经过四个3x3卷积模块做特征提取,最后把四个特征与一个所述第一卷积分支输出结果叠加在一起得到特征融合结果。

11、本发明进一步设置为:所述s1和s2中的降采样操作包括两个降采样分支:

12、一个所述降采样分支经过最大池化层后,经过一个1x1的卷积模块使通道数变化;

13、另一个所述降采样分支经过一个1x1的卷积模块使通道数变化,后进行步长为2的3x3卷积,后输出结果与一个所述降采样分支输出结果叠加在一起得到降采样结果。

14、本发明进一步设置为:所述s1中的空间金字塔池化操作包括两个第二卷积分支:

15、一个所述第二卷积分支通过四个不同的最大池化处理后,输出卷积结果;

16、另一个所述第二卷积分支直接进行卷积处理,输出卷积结果后,与第一所述第二卷积分支输出的卷积结构进行合并,输出池化结果。

17、本发明进一步设置为:所述s2中的动态卷积使用多维注意机制通过并行策略学习四维卷积核空间。

18、本发明进一步设置为:所述s3中的无卷积计算增量但提高精度的通用新型卷积模块用于修改不同尺寸大小的输出特征的图像通道的数量,用于进行特征提取和平滑特征。

19、本发明进一步设置为:所述s3中非极大值抑制根据分类器的类别进行分类概率排序,采取迭代形式不断以最大的框与其他框做重叠度操作,过滤重叠度大的框不断重复,去除冗余候选,预测最优的目标对象。

20、本发明进一步设置为:所述s1和s2中的注意力机制包括挤压步骤、激发步骤和缩放比例步骤;

21、其中挤压步骤为:通过全局平均池化,将每个通道的二维特征(高*宽)压缩为1个实数,将特征图从[高,宽,通道数]==>[1,1,通道数],得到通道的全局特征;

22、所述激发步骤为:给每个特征通道生成一个权重值,通过两个全连接层构建通道间的相关性,输出的权重值数目和输入特征图的通道数相同,[1,1,通道数]==>[1,1,通道数],学习各个通道间的关系,也得到不同通道的权重;

23、所述缩放比例步骤为:将激发步骤得到的归一化权重加权到每个通道的特征上,即通道乘以权重系数,[高,宽,通道数]*[1,1,通道数]==>[高,宽,通道数],计算注意力权重是通过将输入与模型的当前状态进行比较,从而得到每个输入的注意力分数,这些注意力分数反映了每个输入对当前任务的重要性,对输入进行加权是将每个输入乘以其对应的注意力分数,从而根据其重要性对输入进行加权,最后,将加权后的输入进行求和或者拼接,得到最终的输出,从而捕捉到与任务相关的信息。

24、(三)有益效果

25、本发明提供了一种多尺度特征融合的声纳图像目标检测方法。具备以下

26、有益效果:

27、(1)本发明通过结合动态卷积层的设计,提取多维特征,更好提取特征的全局上下文信息,使得提取的深度抽象特征的表征能力提高,从而提高模型的识别精度,使用堆叠卷积的方式进行特征提取在堆叠卷积中加入注意力机制,增强模型,提高了特征提取过程的全局性,更好区分相似度较高的声纳图像前景与背景的区分度差,避免模型错检或者漏检,进一步提高识别精度。

28、(2)本发明通过先经过四个卷积层提取一部分特征并整合,再经过多个堆积模块和降采样操作得到三个有效特征层,有效提取的多维度混合特征信息,可以使网络学习到更多的特征并且具有更强的鲁棒性,克服了信息经过多层后可能消失或膨胀,使特征提取更精确高效。

29、(3)本发明通过降采样操作的设置,使最大池化层只考虑局部小区域最大值信息和实现空间降采样,卷积层可以考虑局部小区域所有值信息同时有助于平滑提取特征避免降采样过程中丢失更多的特征信息,最后两者合并使特征提取到的信息具有两者的优点。

30、(4)本发明通过注意力机制的设定,可以通过选择和聚焦在数据中的重要特征,提高模型的性能和准确性,然后输入空间金字塔池化,能够增大感受野使得算法适应不同的分辨率,同时能够减少计算量使得速度快精度高。

31、(5)本发明通过空间金字塔池化操作的设计,一方面经历了四个不同的最大池化能够处理不同对象,有四种感受野可以区别大目标小目标,另方面用卷积层进行操作,减少了参数量,二者结合将不同形状的特征层进行特征融合,有利于提取出更好的体征,增大提取体征丰富度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1