一种基于特征多尺度融合的船舶目标检测方法

文档序号:35978324发布日期:2023-11-09 21:11阅读:22来源:国知局
一种基于特征多尺度融合的船舶目标检测方法

本发明属于计算机地理空间数据挖掘,特别是涉及一种基于特征多尺度融合的无锚框船舶目标检测方法。


背景技术:

1、随着海洋在国家经济发展格局和对外开放中的作用与地位愈加突出,高效精准的实现对海上船舶目标的识别,对于提高航行安全、加强海上管理有着十分重要的意义。星载合成孔径雷达(sar)是一种主动式传感器,具有全天时全天候的工作能力,探测范围广、获取图像的分辨率较高,是海洋船舶目标监视的重要数据源之一,精准的sar图像船舶检测能够实现对海域的全天候检测和船舶目标信息的获取,显著提升海上态势感知能力。

2、目标检测是计算机视觉领域的重要研究任务之一,深度神经网络能通过线性变换提取图像底层信息,实现对复杂目标的检测与表达,根据是否生成检测框可以将目前应用较为广泛的目标检测算法分为两大类,一是基于锚框的算法,基于锚框的算法可以进一步分为基于回归思想的一步检测法以及基于区域检测思想的两步检测法;一步检测法算法利用cnn的卷积特征得到待检测目标位置坐标以及类别概率值,具有更为简洁的结构和更高效的检测速率,但检测精度往往较低;两步检测算法先对候选区域进行选择性搜索获取候选框,再对候选框进行分类回归,计算精度相较于一步法更高,但与此同时,计算效率有所下降。当前基于锚框的算法依靠数据集先验知识,锚框使得模型更容易收敛,但由于存在超参数设置困难、锚框过多导致冗余计算、正负样本不均衡、锚框重叠使得检测精度降低等问题,训练过程较为低效,实时性差。二是无锚框算法,该算法基于中心区域或关键点的目标检测,这种算法取消了锚框生成基质,加快了检测速度,同时避免了由于锚框设置不合理导致的漏检或重复检测问题;但该算法需要构建特殊损失函数或结构以提高预测精度和稳定性,且由于算法单一位置只产生单一预测框,对于密集分布区域存在重叠或遮挡现象,无法有效检测。该算法的常见网络有:yolox、centernet和fcos等。

3、综上,现有技术存在无锚框算法生成的单一预测框,难以对存在重叠或遮挡的目标密集区域进行有效检测的问题。


技术实现思路

1、本发明的目的在于提供一种基于特征多尺度融合的船舶目标检测方法,以解决现有技术中无锚框算法生成的单一预测框,难以对存在重叠或遮挡的目标密集区域进行有效检测的技术问题。

2、为实现上述目的,本发明所提供的一种基于特征多尺度融合的船舶目标检测方法的技术方案是:

3、一种基于特征多尺度融合的船舶目标检测方法,包括:1)利用特征提取网络对输入图像进行特征提取得到特征映射序列,上述特征提取网络采用可变形卷积的多尺度特征提取网络架构,上述可变形卷积的多尺度特征提取网络架构是在fen网络的基础上增加了可变形卷积模块,利用可变形卷积模块生成多层特征图;2)利用全局关系建模网络对得到的特征映射序列进行不同尺度特征层间的连接,输出检测框位置和检测类别,上述全局关系建模网络采用transformer编解码器架构;3)利用检测网络根据检测框位置和检测类别进行目标检测,实现对图像中船舶目标的识别。

4、有益效果是:通过可变形卷积模块实现对实现对多层不同尺度特征信息的提取,最终得到特征映射序列。将特征映射序列作为全局关系建模网络的输入,在transformer编解码器架构内部进行特征学习,输出检测框位置和检测类别,用检测框位置和检测类别来检测目标。得到的检测框位置和检测类别也是经过对图像进行学习得到的,相比直接设置的锚框精准度更高,且用可变形卷积核能够很好的提取局部的特征,保障对小目标检测的精度,同时保障对目标密集区域的精准识别。

5、作为进一步地改进,特征提取网络还包括有通道注意力机制模块,该模块用于对fen网络中卷积模块输出的不同特征层的通道关系进行建模。

6、有益效果是:在fen网络的基础上引入通道注意力机制捕获不同层特征图间的依赖关系,使特征图之间更换的融合,便于形成更准确的特征映射序列。

7、作为进一步地改进,transformer编解码器包括有transformer编码器和transformer编码器解码器,所述transformer编码器的注意力机制采用孪生注意力机制。

8、有益效果是:在transformer编码器中,使用孪生注意力机制代替多头注意力机制,孪生注意力机制相比多头注意力机制的开销较低,且仍能保证模型的特征提取能力。

9、作为进一步地改进,transformer编码器还包括两个卷积层,两个卷积层通过leaky relu层连接,用于对孪生注意力机制处理的结果进行卷积运算。

10、有益效果是:通过引入卷积运算,可以对注意机制进行有益的补充,更好地捕捉局部信息,增强特征表示能力。

11、作为进一步地改进,transformer解码器的输入为可学习位置编码和码器transformer解码器编码器的编译结果。

12、有益效果是:在全局关系构建中,通过可学习位置编码对对特征映射序列中的特征图进行反复的串行学习,获得全局关系,进一步输出检测框位置和检测类别。

13、作为进一步地改进,全局关系建模网络包括有维度压缩模块,维度压缩模块用于将三维数据压缩为二维数据。

14、有益效果是:通过降低维度提升运算速率。

15、作为进一步地改进,维度压缩模块包括卷积层和flattern层,上述卷积层对输入的特征映射序列进行卷积运算,所述flattern层对卷积运算结果进行二维压缩。

16、有益效果是:通过卷积层对输入的特征映射序列进行卷积运算,通过flattern层对卷积运算结果进行二维压缩,实现对特征映射序列快速准确的维度压缩。

17、作为进一步地改进,检测网络利用两个ffn网络对全局关系建模网络的输出进行处理,得到检测框,利用识别框识别图像中的船舶目标。

18、有益效果是:通过前馈神经网络输出的检测框位置和检测类别,实现对图像中船舶目标的识别。



技术特征:

1.一种基于特征多尺度融合的船舶目标检测方法,其特征在于,包括:

2.根据权利要求1所述的基于特征多尺度融合的船舶目标检测方法,其特征在于,所述特征提取网络还包括有通道注意力机制模块,该模块用于对fen网络中卷积模块输出的不同特征层的通道关系进行建模。

3.根据权利要求1所述的基于特征多尺度融合的船舶目标检测方法,其特征在于,所述transformer编解码器架构包括有transformer编码器和transformer编码器解码器,所述transformer编码器的注意力机制采用孪生注意力机制。

4.根据权利要求3所述的基于特征多尺度融合的船舶目标检测方法,其特征在于,所述transformer编码器还包括两个卷积层,两个卷积层通过leaky relu层连接,用于对孪生注意力机制处理的结果进行卷积运算。

5.根据权利要求3所述的基于特征多尺度融合的船舶目标检测方法,其特征在于,所述transformer解码器的输入为可学习位置编码和transformer编码器的编译结果。

6.根据权利要求1-5任意一项所述的基于特征多尺度融合的船舶目标检测方法,其特征在于,所述全局关系建模网络包括有维度压缩模块,所述维度压缩模块用于将三维数据压缩为二维数据。

7.根据权利要求6所述的基于特征多尺度融合的船舶目标检测方法,其特征在于,所述维度压缩模块包括卷积层和flattern层,所述卷积层对输入的特征映射序列进行卷积运算,所述flattern层对卷积运算结果进行二维压缩。

8.根据权利要求1-5任意一项所述的基于特征多尺度融合的船舶目标检测方法,其特征在于,所述检测网络利用两个ffn网络对全局关系建模网络的输出进行处理,得到检测框,利用识别框识别图像中的船舶目标。


技术总结
本申请涉及一种基于特征多尺度融合的船舶目标检测方法,属于计算机地理空间数据挖掘技术领域,基于特征多尺度融合的船舶目标检测方法采用SIS‑Conformer框架,该框架主要包括三部分:特征提取、全局关系建模、目标检测。其中特征提取采用可变形卷积的多尺度特征提取网络架构MS‑FEN;全局关系建模采用Transformer编解码器作为基本架构,使用孪生注意力机制代替Transformer编解码器架构中的多头注意力机制;目标检测利用Transformer编解码器架构输出的检测框位置和检测类别进行目标检测。通过为Transformer编解码器架构引入卷积运算提升该算法对局部特征和全局特征的提取能力,进一步提高本算法目标检测的精度;通过引入孪生注意力机制降低算法的开销。

技术研发人员:李可欣,郭健,葛文,李冉冲,成毅,王宇君,李宗明,缪坤,陈辉
受保护的技术使用者:中国人民解放军战略支援部队信息工程大学
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1