基于无监督动量对比学习的高光谱目标检测方法

文档序号:35870148发布日期:2023-10-28 02:58阅读:66来源:国知局
基于无监督动量对比学习的高光谱目标检测方法

本发明涉及高光谱图像目标检测领域,尤其涉及一种基于无监督动量对比学习和transformer网络的高光谱目标检测方法。


背景技术:

1、高光谱图像是由成像光谱仪在数百个窄且连续的波段上捕获地物表面的反射率得到包含丰富光谱与空间信息的三维立方体图像数据,精细的光谱特征可以有效地反映不同物质的细微特征。得益于高光谱图像极高的光谱分辨率,高光谱图像目标检测能够根据不同地物的光谱差异进行目标检测,在军事和安全应用中的伪装目标识别,污染检测,矿物勘探,食品安全和医疗诊断等领域中有着重要的应用。

2、传统的高光谱图像目标检测方法,如光谱匹配滤波(smf)和自适应相干估计(ace)是假设背景符合多元高斯分布的基于概率统计的经典高光谱目标检测方法,基于子空间投影的正交子空间投影(osp)方法在已知目标与背景先验信息的情况下通过将像元光谱投影到背景子空间的正交子空间中以抑制背景并突出目标。基于约束能量最小化(cem)的目标检测器通过构建有限脉冲响应滤波器并以特定增益约束待检测目标光谱的特征同时最小化背景的影响进行目标检测。传统的高光谱目标检测方法对目标光谱固有可变性的适应性弱,导致检测精度下降。近年来,在高光谱图像目标检测领域出现了基于深度学习的方法。从有监督学习的角度出发,为了训练深层的神经网络,针对训练样本不足的情况,出现了基于迁移学习的方法,为了扩充训练样本,将已知有标签高光谱数据集中的同类像元光谱之间相减,不同类像元光谱之间相减,进而扩充了训练样本的数量,但该方法的目标检测性能很大程度上受限于迁移知识的适配性。从无监督学习的角度出发,基于目标抑制约束的背景学习高光谱目标检测方法使用cem方法对待检测高光谱图像进行粗略检测以获得背景样本,在将背景样本送入施加目标抑制约束的对抗性自动编码器(aae)中进行训练以重建纯净的背景,通过重建背景图像与待检测图像进行比较以实现目标检测,但其检测结果会受到目标和背景样本质量的影响。


技术实现思路

1、根据现有技术存在的问题,本发明公开了一种基于无动量对比学习和transformer网络的高光谱图像目标检测方法,具体包括如下步骤:

2、构建重叠光谱块特征映射与空间位置信息映射,降低输入序列的长度且保留相邻光谱块之间的局部信息,从而提供更高质量的输入序列以提升transformer的性能。首先,对于波段为b的像元光谱通过卷积的方法将原始图像划分为若干重叠光谱块,进而得到嵌入后的光谱向量序列其中n=((b-k)/s+1)是transformer的有效输入序列长度,d是每个嵌入光谱向量序列的维度。然后,在嵌入光谱向量序列之前添加了一个可学习的嵌入映射xlearn,其在训练过程中是通过transformer编码器进行更新迭代的,其在xe中被视作为x的表示。最后以相加的方式将可学习的1d位置信息映射添加到xe中以保留光谱块在原始像元光谱中的位置信息。最终作为transformer编码器输入的嵌入光谱向量序列z0可以表示为:

3、

4、其中是可学习的位置信息映射;

5、构建交互token前馈层,在建立光谱长距离依赖关系的同时不忽略光谱中局部细节信息。在原始transformer编码器的全连接前馈网络基础上通过在前馈层的两个全连接层之间添加depth-wise卷积来补充前馈层中的局部细节,并实现在不同光谱通道中的信息交互,该过程可以描述为:

6、z'=fc(z;ω1)

7、z”=fc(σ(z'+dwconv(z';ω));ω2)

8、其中z为交互token前馈层的输入,ω1与ω2是两个全连接层的参数,ω是1d卷积层的参数,σ是高斯误差线性单元(gelu)激活函数;

9、基于transformer模块构建用于高光谱目标检测任务中进行光谱特征提取的编码器与动量编码器;

10、通过数据增强构建光谱实例鉴别代理任务;

11、通过无监督动量对比学习方式对光谱特征提取编码器和动量编码器进行训练。首先,通过随机采样的方法得到小批次的原始样本xq和增强样本xk,并使用光谱特征提取编码器和动量编码器分别提取xq和xk的表示,继而将其输入进各自投影头中映射得到特征矩阵和该过程可以表示为:

12、

13、

14、θencoder与θm_encoder分别是编码器fencoder(·)和动量编码器fm_encoder(·)的参数。编码器的投影头mlpencoder与动量编码器的投影头mlpm_encoder分别是具有参数θmlpencoder和θmlpm_encoder的含有一个隐藏层的mlp。mlpencoder与mlpm_encoder使用relu激活函数。

15、然后动量编码器将特征矩阵特征送入队列,并作为小负样本集,从而实现正样本的一对多对比学习,其中对比学习过程中的对比损失使用infonce损失函数,如下所示:

16、

17、其中τ是温度超参数,包括一个正样本嵌入特征(假设)和k个负样本嵌入特征。

18、最后在训练时,为了使队列中的特征保持一致性,队列中的特征应该用相同或相似的动量编码器与投影头去产生得到,以帮助模型避免学习到捷径解。因此动量编码器fm encoder(·)与其投影头mlpm_encoder使用动量更新。该过程可以形式化如下:

19、θm_encoder←mθm_encoder+(1-m)θencoder

20、

21、其中m∈[0,1)是动量系数,一般设置为较大值。需要注意的是编码器fencoder(·)与其投影头mlpencoder通过梯度反向传播进行更新;

22、使用训练好的光谱特征提取编码器网络分别提取待检测高光谱图像中各个像元光谱与先验光谱的表示向量,通过余弦相似性衡量待检测像元光谱表示向量与先验目标光谱表示向量之间的相似性,得到仅利用光谱信息的检测结果。

23、通过指数与归一化操作,幂函数与归一化操作对检测结果进行两次非线性拉升以抑制背景,该过程可以形式化如下:

24、s=αb

25、

26、r=sβ

27、

28、其中α与β是调整背景抑制性能的正参数。

29、由于采用了上述技术方案,本发明提供的一种基于无动量对比学习和transformer网络的高光谱图像目标检测方法,该方法有效地解决了在高光谱目标检测领域中背景难以抑制和光谱信息利用不充分的问题,首先设计了重叠光谱块特征映射与交互token前馈层以帮助transformer关注光谱局部细节信息。其次,在进行光谱鉴别性学习时,原始高光谱图像与数据增强后的高光谱图像中同一位置处的像元光谱被视为正样本对,负样本对来自队列。队列能存放大量的负样本且将负样本的数量与mini-batch的大小分离开。为了使队列中负样本的特征保持一致性,使用基于动量更新的动量编码器来提取像元光谱的特征,并通过对比损失在最大化正对相似性的同时最小化负对的相似性来进行光谱鉴别能力学习。最后在目标检测时,训练好的光谱特征提取编码器网络被用于提取目标先验与待检测像元光谱的特征,根据余弦相似性来判断待检测像元光谱的特征与目标先验特征的相似性,以获得目标检测结果。之后利用指数函数与幂函数在0-1之间的函数曲线特性,通过指数与归一化,幂函数与归一化操作对检测结果进行两次非线性拉升以抑制背景。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1