用于图像伪装目标检测的方法

文档序号：36255884发布日期：2023-12-03 17:16阅读：84来源：国知局

本发明涉及图像处理，具体而言，尤其涉及一种用于图像伪装目标检测的方法。

背景技术：

1、伪装目标检测旨在开发能够检测伪装目标的方法，以增强现有目标检测技术的鲁棒性和可靠性，提高目标检测技术的可靠性和应用范围，以更好地服务于社会和公共安全。在图像伪装目标检测任务中，由于伪装物体形状的复杂性以及轮廓与周围环境之间的高度相似性，准确和完整地识别物体的细节具有很大挑战性。

2、现有的伪装目标检测方法在提取初始特征时，简单地使用诸如resnet和vgg的卷积网络，这样会忽略一些全局语义信息。然而，使用transformer及其变形，或者在卷积和提取低级特征后简单地添加transformer，都过于专注于建模全局上下文，这将导致低分辨率特征缺乏详细的定位信息，导致分割结果粗糙，从而影响检测结果。

3、有鉴于此，本发明提出一种用于图像伪装目标检测的方法。

技术实现思路

1、根据上述提出现有伪装目标检测结果不佳的技术问题，而提供一种用于图像伪装目标检测的方法。本发明主要通过使用resnet模型、swin-transformer模型、通道注意力和空间注意里模块等实现较为准确的伪装目标检测。

2、本发明采用的技术手段如下：

3、本发明提供了一种用于图像伪装目标检测的方法，包括：

4、将原始图像输入resnet模型顺次得到第1特征图、第2特征图、第3特征图、第4特征图和最终特征图；

5、将所述原始图像输入swin-transformer模型得到第6特征图、第7特征图、第8特征图和第9特征图；

6、将所述最终特征图和所述第9特征图融合得到第5特征图，在所述第1特征图至所述第4特征图、所述最终特征图中，所述最终特征图与所述第9特征图的尺寸差值的绝对值最小；

7、根据所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图生成边界；

8、根据所述边界、所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图得到与所述第2特征图对应的第2伪装对象预测图、与所述第3特征图对应的第3伪装对象预测图和与所述第4特征图对应的第4伪装对象预测图；

9、所述第2伪装对象预测图为最终伪装对象预测图。

10、进一步地，将所述最终特征图和所述第9特征图融合得到所述第5特征图，包括：

11、将所述最终特征图输入第1通道注意力模块得到通道注意图、通道细化特征；

12、将所述通道注意图、所述通道细化特征和所述第9特征图输入第1空间注意力模块得到所述第5特征图。

13、进一步地，根据所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图生成所述边界，包括：

14、分别将所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图输入特征增强模块得到对应的第2增强特征、第3增强特征、第4增强特征和第5增强特征；

15、对所述第2增强特征进行卷积操作得到第2过渡特征、对所述第3增强特征进行卷积操作得到第3过渡特征、对所述第4增强特征进行上采样后再进行卷积操作得到第4过渡特征、对所述第5增强特征进行上采样后再进行卷积操作得到第5过渡特征；

16、将所述第2过渡特征和所述第5过渡特征进行级联操作后再进行连续两次卷积操作得到第1组合，将所述第3过渡特征和所述第4过渡特征进行级联操作后再进行连续两次卷积操作得到第2组合；

17、根据所述第1组合进行反向注意力机制得到第1过渡组合，根据所述第2组合进行反向注意力机制得到第2过渡组合；

18、将所述第1组合和所述第1过渡组合逐元素相乘得到第1子组合，第2组合和所述第2过渡组合逐元素相乘得到第2子组合，所述第1子组合和所述第2子组合逐元素相加后再进行relu函数运算得到所述边界。

19、进一步地，根据所述边界、所述第2特征图、所述第3特征图、所述第4特征图和所述第5特征图得到与所述第2特征图对应的所述第2伪装对象预测图、与所述第3特征图对应的所述第3伪装对象预测图和与所述第4特征图对应的所述第4伪装对象预测图，包括：

20、将第i特征图输入第i通道注意力模块，2≤i≤5；

21、所述第i通道注意力模块获取所述边界和所述第i特征图生成第i通道图和第i通道特征；

22、第i’空间注意力模块获取所述第i通道图、所述第i通道特征和第i+1通道图并运算得到第i预测结果，对所述第i预测结果进行卷积操作得到第i伪装对象预测图，i’＝i且2≤i’≤4。

23、进一步地，所述第i’空间注意力模块获取所述第i通道图、所述第i通道特征和所述第i+1通道图并运算得到所述第i预测结果，按照以下方式得到：

24、

25、其中，xi为所述第i预测结果，r′i为所述第i通道特征，xi+1为第i+1预测结果，ai为所述第i通道图，ai+1为所述第i+1通道图，为逐元素加法运算，sigmoid为sigmoid函数运算，sai′为所述第i’空间注意力模块运算。

26、进一步地，还包括：

27、计算所述第2伪装对象预测图、所述第3伪装对象预测图和所述第4伪装对象预测图的总损失进行掩码监督，按照以下方式得到：

28、

29、其中，ltotal为所述总损失，li为第i伪装对象预测图的损失，2≤i≤4，e为所述边界，ldice为所述边界的注意力损失，am为注意矩阵，lag为所述注意矩阵的注意力引导损失，ge为伪装目标边界的真值图，g0为伪装目标的真值图。

30、进一步地，所述第i伪装对象预测图的损失，按照以下方式得到：

31、li＝lwbce(pi，g0)+lwiou(pi，g0)；

32、其中，li为所述第i伪装对象预测图的损失，pi为所述第i伪装对象预测图，lwbce为加权二进制交叉熵损失，lwiou为加权iou损失。

33、进一步地，所述注意矩阵，按照以下方式得到：

34、am＝relu(bn(conv(f+ft)))；

35、其中，am为所述注意矩阵，relu为relu函数运算，conv为卷积运算，f为所述第5特征图，ft为所述第5特征图的转置，bn为批量归一化操作。

36、较现有技术相比，本发明具有以下优点：

37、1、本发明提供的用于图像伪装目标检测的方法，通过使用resnet模型和swin-transformer模型可以很好地训练针对rgb图像的伪装目标检测任务，能够准确地检测出目标完整、轮廓准确的伪装目标标记图，处理具有复杂结构和对象的挑战性检测。

38、2、本发明提供的用于图像伪装目标检测的方法，通过纹理增强和反向注意力机制使生成的边界更加精确和鲁棒。

39、3、本发明提供的用于图像伪装目标检测的方法，引入了通道注意力模块和空间注意力模块，将边界与每个层中伪装对象的特征相结合，捕获通道和空间位置的远程依赖性，并从全局角度增强特征，得到最终伪装对象预测图。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杜思雨姚翠莉杨镒丞孔雨秋卢湖川
技术所有人：大连理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。