一种基于渐进特征平滑和尺度适应性膨胀卷积的遥感图像目标检测方法

文档序号:37162820发布日期:2024-03-01 11:59阅读:11来源:国知局
一种基于渐进特征平滑和尺度适应性膨胀卷积的遥感图像目标检测方法

本发明涉及一种基于渐进特征平滑和尺度适应性膨胀卷积的遥感图像目标检测方法,属于计算机视觉目标检测领域。


背景技术:

1、2020年3月28日,凉山州木里县发生了一场严重的森林火灾,遥感监测在实时、准确的指导地面科学救援方面发挥了关键作用;2021年7月河南地区持续强降雨导致卫河决堤灾情,有关部门利用多源遥感手段对卫河沿岸汛情进行监测,对洪水淹没区域和畜禽养殖污染风险源进行重点关注;2022年10月17日,卫星火灾监测平台通过葵花8号静止气象卫星发现永州市新田县内存在大量火灾热异常点,相关部门迅速启动应急响应,对森林火灾区域进行持续监测,并进行了森林火灾风险等级分析;2023年7月28日,第5号台风“杜苏芮”在福建省晋江市沿海登陆,相关部门通过遥感卫星的监测云图有效观测了台风的形态变化和转移路径。从上述介绍来看,遥感影像在灾情信息获取、救灾决策等方面中发挥了重要作用。因此遥感图像目标检测技术的研究具有重要的研究意义和应用价值。

2、为解决遥感图像中目标检测精度较低的问题,许多研究集中在多尺度目标检测和特征融合方面。chen等人设计了一个并行的双重融合特征金字塔结构,包含一个自底向上融合模块,可以同时检测小型和大型目标,从而提高检测精度。wang等人专注于尺度问题,提出了一个专门的模块来融合多尺度特征中的上下文信息。xu等人将通过特征对齐检测方法解决了大纵横比和不同尺度目标的滞后检测问题。yi等人提出了一种高效轻量级的多尺度特征融合网络,在计数精度和运行速度上取得了良好的平衡。lu等人提出了基于注意力和特征融合的端到端的网络。虽然上述方法已经取得了一定的进展,但它们忽略了不同尺度特征之间存在的语义差异,而这些差异对于目标检测至关重要。除此之外,复杂背景也会给目标检测造成干扰。因此,迫切需要一种高精度的多尺度多类别遥感图像目标检测方法来解决上述问题。


技术实现思路

1、针对上述现有方法中的不足,本发明提供了一种基于渐进特征平滑和尺度适应性膨胀卷积的遥感图像目标检测方法, 通过跨通道交互位置感知模块、渐进特征平滑模块和尺度适应性膨胀卷积模块协同作用,提高模型对复杂场景的感知和处理能力;跨通道交互位置感知模块提高了对目标的敏感性;渐进特征平滑模块加强了对目标的准确定位和精确分类;尺度适应性膨胀卷积模块则增强了对不同尺度目标的感知能力;这些模块的协同作用使得模型在遥感图像目标检测中更具鲁棒性和泛化能力,能够处理多类别多尺度目标,提高检测准确性和鲁棒性。

2、为实现上述目的,本发明的具体方案如下:

3、步骤1:获取光学遥感图像目标检测数据集;

4、步骤2:对遥感图像数据集进行预处理;

5、步骤3:建立遥感图像目标检测模型;

6、步骤4:利用所述数据集的训练集进行模型的训练,构建损失函数更新模型的参数,并引入siou定位损失函数加快模型的收敛速度,得到最优的模型;

7、步骤5:利用最优模型来检测所述数据集的测试集图像,得到最终测试结果。

8、进一步地,所述步骤2中对dior遥感数据集xml的标签文件转换为适合yolov7训练的txt格式;数据集按照1:1:2地比例划分为训练集、验证集、测试集,并对dior数据集采用平移、翻转和mosiac方法进行数据增强。

9、进一步地,所述步骤3遥感图像目标检测模型包括:特征提取网络、渐进特征平滑模块、跨通道交互位置感知模块、特征增强网络、尺度适应性膨胀卷积模块、检测头。

10、进一步,所述遥感图像目标检测模型中,首先将经过预处理的遥感图像输入到预设的特征提取网络中,得到不同尺寸大小的特征图;然后,通过预设的跨通道交互位置感知模块对特征图进行特征增强,并通过预设的渐进特征平滑模块融合不同尺度特征;随后,利用预设的特征增强网络对得到不同尺度的平滑特征和增强特征进行多尺度特征融合;此外,将融合后的多尺度特征输入到尺度适应性膨胀卷积模块;最后将经过尺度适应性膨胀卷积模块的特征被输入到预设的检测头,进行多尺度目标检测。

11、进一步地,所述渐进特征平滑模块对浅层特征图和深层特征图进行处理;对于浅层特征图,首先经过卷积层生成两个新的特征图;接着,将特征图a进行重塑并转置得到特征图,同时将特征图b进行重塑得到特征图;进一步地,将和进行点乘,点乘操作让特征图中的每个像素点都产生了联系,使得每个像素的特征表示更加连续,以捕捉更多的细节信息,有助于更精确地定位目标;最后,应用softmax激活函数对点乘后的结果进行非线性映射得到;对于深层特征图,同样先经过卷积层生成1个新的特征图。然后,将特征图c重塑后与特征图进行点乘操作,并将点乘的结果进行重塑得到特征图;最后,对f和c进行适当的权重分配得到输出结果o,能够避免特征信息的突变,实现深层和浅层特征图的平滑融合,这样设计既确保特征间的连贯性,又充分保留丰富的语义信息,有助于目标的准确分类。

12、进一步地,所述跨通道交互位置感知模块由坐标注意力、3×3分支和空间注意力三部分构成;首先将输入特征图分别按照宽度和高度进行全局平均池化,然后将得到的两个具有方向感知的特征图进行拼接并输入到1×1卷积中,并采用swish激活函数得到中间特征图,接着将中间特征图通过1×1卷积和sigmoid激活函数得到高度和宽度方向上的特征图,最后通过对输入特征图与两个方向的特征图进行加权操作得到输出;所述3×3分支仅堆叠单个卷积核大小为3×3的卷积,并添加归一化层和激活函数;所述空间注意力对输入特征分别进行全局最大池化和平均池化,并将得到的两个特征图进行拼接,然后通过卷积核大小为7×7的卷积和sigmoid激活函数得到空间注意力的特征图。

13、进一步地,所述尺度适应性膨胀卷积模块包括三个分支;第一个分支包括一个卷积核大小为1×1的卷积层和一个膨胀率为3,步长为1,填充为3的3×3空洞卷积层;第二个分支包括一个卷积核大小为1×1的卷积层、一个卷积核大小为3×3的卷积层以及一个膨胀率为6,步长为1,填充为6的3×3空洞卷积层;第三个分支包括一个卷积核大小为1×1的卷积层、两个卷积核大小为3×3的卷积层以及一个膨胀率为9,步长为1,填充为9的3×3空洞卷积层;第一个分支的输入与其输出的特征图进行维度的拼接,以成为第二个分支的输入特征图;第二个分支的输入与其输出的特征图进行维度的拼接,以成为第三个分支的输入特征图;将三个分支最后输出的特征图与第一个分支的输入特征图进行拼接并输入到卷积核大小为1×1的卷积层。

14、进一步地,所述步骤4模型的损失函数包含置信度损失、类别损失、定位损失;损失函数的计算公式如下:

15、,

16、其中代表总计的损失,、、分别表示置信度损失、类别损失、定位损失;为平衡损失,在不同的损失前增加各自的权重,依次是、、;采用siou损失函数来计算定位损失,可以较好地反映长与宽的真实差异,其计算公式如下:

17、,

18、其中iou为预测框与真实框的交并比,是距离损失,是形状损失;交叉熵损失函数用来计算置信度损失和类别损失,其计算公式如下:

19、,

20、其中l代表标签置信度,p代表预测置信度。

21、进一步地,所述遥感图像目标检测模型采用随机梯度下降法训练网络,初始学习率、动量、权重衰减和批量大小分别设置为0.01、0.937、0.0005和4。

22、相对于现有技术,本发明的优点和积极效果在于:本发明在基准模型yolov7的基础上,提出了渐进特征平滑模块来加强了对目标的准确定位和精确分类,平滑的融合深层与浅层特征图,保留丰富的语义信息,提高目标的检测性能;本发明设计了一种融合空间信息和维度信息的跨通道交互位置感知模块提高了对目标的敏感性,使模型建立全局空间位置的相互联系,更加关注目标区域;本发明构建了尺度适应性膨胀卷积模块增强对不同尺度目标的感知能力,进一步扩大感受野并增强了细节特征的提取和定位,同时也丰富了全局信息的获取;为加快模型的收敛速度,本发明采用siou损失函数作为定位损失;本发明的遥感图像目标检测模型在大尺度遥感图像中获得了卓越的检测效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1