用于图像伪装目标检测的方法

文档序号:36255884发布日期:2023-12-03 17:16阅读:84来源:国知局
用于图像伪装目标检测的方法

本发明涉及图像处理,具体而言,尤其涉及一种用于图像伪装目标检测的方法。


背景技术:

1、伪装目标检测旨在开发能够检测伪装目标的方法,以增强现有目标检测技术的鲁棒性和可靠性,提高目标检测技术的可靠性和应用范围,以更好地服务于社会和公共安全。在图像伪装目标检测任务中,由于伪装物体形状的复杂性以及轮廓与周围环境之间的高度相似性,准确和完整地识别物体的细节具有很大挑战性。

2、现有的伪装目标检测方法在提取初始特征时,简单地使用诸如resnet和vgg的卷积网络,这样会忽略一些全局语义信息。然而,使用transformer及其变形,或者在卷积和提取低级特征后简单地添加transformer,都过于专注于建模全局上下文,这将导致低分辨率特征缺乏详细的定位信息,导致分割结果粗糙,从而影响检测结果。

3、有鉴于此,本发明提出一种用于图像伪装目标检测的方法。


技术实现思路

1、根据上述提出现有伪装目标检测结果不佳的技术问题,而提供一种用于图像伪装目标检测的方法。本发明主要通过使用resnet模型、swin-transformer模型、通道注意力和空间注意里模块等实现较为准确的伪装目标检测。

2、本发明采用的技术手段如下:

3、本发明提供了一种用于图像伪装目标检测的方法,包括:

4、将原始图像输入resnet模型顺次得到第1特征图、第2特征图、第3特征图、第4特征图和最终特征图;

5、将所述原始图像输入swin-transformer模型得到第6特征图、第7特征图、第8特征图和第9特征图;

6、将所述最终特征图和所述第9特征图融合得到第5特征图,在所述第1特征图至所述第4特征图、所述最终特征图中,所述最终特征图与所述第9特征图的尺寸差值的绝对值最小;

7、根据所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图生成边界;

8、根据所述边界、所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图得到与所述第2特征图对应的第2伪装对象预测图、与所述第3特征图对应的第3伪装对象预测图和与所述第4特征图对应的第4伪装对象预测图;

9、所述第2伪装对象预测图为最终伪装对象预测图。

10、进一步地,将所述最终特征图和所述第9特征图融合得到所述第5特征图,包括:

11、将所述最终特征图输入第1通道注意力模块得到通道注意图、通道细化特征;

12、将所述通道注意图、所述通道细化特征和所述第9特征图输入第1空间注意力模块得到所述第5特征图。

13、进一步地,根据所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图生成所述边界,包括:

14、分别将所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图输入特征增强模块得到对应的第2增强特征、第3增强特征、第4增强特征和第5增强特征;

15、对所述第2增强特征进行卷积操作得到第2过渡特征、对所述第3增强特征进行卷积操作得到第3过渡特征、对所述第4增强特征进行上采样后再进行卷积操作得到第4过渡特征、对所述第5增强特征进行上采样后再进行卷积操作得到第5过渡特征;

16、将所述第2过渡特征和所述第5过渡特征进行级联操作后再进行连续两次卷积操作得到第1组合,将所述第3过渡特征和所述第4过渡特征进行级联操作后再进行连续两次卷积操作得到第2组合;

17、根据所述第1组合进行反向注意力机制得到第1过渡组合,根据所述第2组合进行反向注意力机制得到第2过渡组合;

18、将所述第1组合和所述第1过渡组合逐元素相乘得到第1子组合,第2组合和所述第2过渡组合逐元素相乘得到第2子组合,所述第1子组合和所述第2子组合逐元素相加后再进行relu函数运算得到所述边界。

19、进一步地,根据所述边界、所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图得到与所述第2特征图对应的所述第2伪装对象预测图、与所述第3特征图对应的所述第3伪装对象预测图和与所述第4特征图对应的所述第4伪装对象预测图,包括:

20、将第i特征图输入第i通道注意力模块,2≤i≤5;

21、所述第i通道注意力模块获取所述边界和所述第i特征图生成第i通道图和第i通道特征;

22、第i’空间注意力模块获取所述第i通道图、所述第i通道特征和第i+1通道图并运算得到第i预测结果,对所述第i预测结果进行卷积操作得到第i伪装对象预测图,i’=i且2≤i’≤4。

23、进一步地,所述第i’空间注意力模块获取所述第i通道图、所述第i通道特征和所述第i+1通道图并运算得到所述第i预测结果,按照以下方式得到:

24、

25、其中,xi为所述第i预测结果,r′i为所述第i通道特征,xi+1为第i+1预测结果,ai为所述第i通道图,ai+1为所述第i+1通道图,为逐元素加法运算,sigmoid为sigmoid函数运算,sai′为所述第i’空间注意力模块运算。

26、进一步地,还包括:

27、计算所述第2伪装对象预测图、所述第3伪装对象预测图和所述第4伪装对象预测图的总损失进行掩码监督,按照以下方式得到:

28、

29、其中,ltotal为所述总损失,li为第i伪装对象预测图的损失,2≤i≤4,e为所述边界,ldice为所述边界的注意力损失,am为注意矩阵,lag为所述注意矩阵的注意力引导损失,ge为伪装目标边界的真值图,g0为伪装目标的真值图。

30、进一步地,所述第i伪装对象预测图的损失,按照以下方式得到:

31、li=lwbce(pi,g0)+lwiou(pi,g0);

32、其中,li为所述第i伪装对象预测图的损失,pi为所述第i伪装对象预测图,lwbce为加权二进制交叉熵损失,lwiou为加权iou损失。

33、进一步地,所述注意矩阵,按照以下方式得到:

34、am=relu(bn(conv(f+ft)));

35、其中,am为所述注意矩阵,relu为relu函数运算,conv为卷积运算,f为所述第5特征图,ft为所述第5特征图的转置,bn为批量归一化操作。

36、较现有技术相比,本发明具有以下优点:

37、1、本发明提供的用于图像伪装目标检测的方法,通过使用resnet模型和swin-transformer模型可以很好地训练针对rgb图像的伪装目标检测任务,能够准确地检测出目标完整、轮廓准确的伪装目标标记图,处理具有复杂结构和对象的挑战性检测。

38、2、本发明提供的用于图像伪装目标检测的方法,通过纹理增强和反向注意力机制使生成的边界更加精确和鲁棒。

39、3、本发明提供的用于图像伪装目标检测的方法,引入了通道注意力模块和空间注意力模块,将边界与每个层中伪装对象的特征相结合,捕获通道和空间位置的远程依赖性,并从全局角度增强特征,得到最终伪装对象预测图。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1