一种稀疏自适应半监督多流形学习的高光谱影像分类方法

文档序号:8431215阅读:380来源:国知局
一种稀疏自适应半监督多流形学习的高光谱影像分类方法
【技术领域】
[0001] 本发明涉及高光谱数据处理方法与应用技术领域,具体涉及一种稀疏自适应半监 督多流形学习的高光谱影像分类方法。
【背景技术】
[0002] 高光谱遥感技术自20世纪80年代以来快速发展,其影像记录了地物目标的连续 光谱,包含的信息更丰富,具备了识别更多种类的地物目标以及更高精度进行目标分类的 能力。但由于高光谱数据由大量波段构成高维特征空间,大多数算法的复杂度随维数呈指 数关系增长,对其处理需要更大的计算量,且其波段间具有高度相关性和冗余性,同时存在 维数很高,分类时易因Hughes现象而无法获得理想结果等问题。科学家通过研宄发现:高 光谱数据可被描述为在低维嵌入空间上的流形(Manifold),即:高维空间的点是在少数独 立变量的共同作用下在观测空间张成一个流形,如果能有效的发现其内在的主要变量,便 能更好地了解高维数据的本质属性和特点。维数约减是解决以上问题的有效办法,能够降 低数据的维数,得到高维数据有意义的低维表示,以便理解其内在的结构及后续处理。
[0003] 迄今为止,在高维数据处理的研宄领域中,国内外学者已经提出了一系列较为经 典的降维算法,主要包括:主成分分析(Principal Component Analysis,PCA)、线性判别 分析(Linear Discriminant Analysis,LDA)、独立成分分析(Independent Component Analysis,ICA)、非负矩阵因子(Non-negative Matrix Factorization,NMF)等。这些方 法的思想就是根据一定的性能目标来寻找一线性或非线性的空间变换,把原始信号数据压 缩到一个低维子空间,使数据在子空间中的分布更加紧凑,为数据的更好描述提供了手段, 另外计算的复杂度也得到了大大降低。由于这些维数约简方法具有描述性强、计算代价 小、易实现及可分性好的特点,因而在高维数据特征提取的研宄中占据了主导地位。但高 光谱遥感数据具有十分复杂的非线性结构,并不全是线性分布的,子空间方法并不能揭示 出高光谱数据中的非线性特性,无法反映出数据点的可分性和非线性,因而使用子空间方 法对高光谱遥感数据进行维数约简并不能取得较好的效果。针对这些问题,He等提出了局 部保持投影(Local Preserving Projrction,LPP)和邻域保持嵌入算法(Neighborhood Preserving Embedding,NPE)等流形学习方法,其通过相似图保留样本的局部近邻结构,在 一定程度上保持了原始数据的非线性流形,但是这两种算法依赖于人工预定义的相似图, 要获得好的性能往往需要更多的训练样本,存在如近邻参数选择困难(如近邻数k、核宽 〇 )、噪声敏感等问题,分类效果受到限制。
[0004] 稀疏保持投影(Sparsity Preserving Projections,SPP)是最近提出的一种基 于稀疏表示理论的无监督降维算法。该算法不同于传统方法的图构建方式(如K-近邻), 其利用样本间的稀疏重构关系建图,是全局性的稀疏构图算法,并归结为L1范数最小化问 题。SPP算法不仅利用稀疏表示的自然判别能力,而且无需人为地选择近邻参数值,一定程 度上缓解了近邻参数选择的困难。在高光谱图像分类中,常面对的是大量的未标记数据以 及相对较少的有标记数据。虽然SPP算法无需对训练样本进行标记,但是没有有效利用标 记样本中所提供的鉴别信息。
[0005] 但是,上述方法都是假设数据中只存在一个单一流形,在实际应用中,数据中存在 多个不同的流形结构。Xiao等提出了一种多流形的面部表情识别,能够有效地揭示出不同 面部表情的内在多流形特性,采用了遗传算法寻求各流形的最优嵌入维度,再由最小化重 构误差分类器进行分类,在面部表情识别中取得的较好的识别效果。Li和yang等人在人 脸识别中分别提出了非参数鉴别多流形和多流形鉴别分析,揭示了人脸数据中的多流形结 构,并取得了很好的识别效果。Tong等人提出一种多流形投影算法应用于工业过程监测 和故障诊断中,揭示出局部和全局流形特性,在工业监测和故障诊断中取得了较好的效果。 Valencia-Aguirre等人提出基于多流形的非线性维数约简方法,并用于C0IL-100数据的 可视化研宄,取得了较好的多流形结构的可视效果。王立志等在"多线性局部与全局保持嵌 入在高光谱遥感影像分类中的应用"一文中发现高光谱遥感数据中存在多个不同的低维流 形结构,采用了局部全局保持嵌入提取出了各流形的鉴别特征,在高光谱地物分类中取得 了较好的分类效果。
[0006] 在稀疏多流形的研宄中,Sun等提出了一种基于稀疏表示的多流形分析,揭示出了 不同纹理图像的内在特性,并取得了较好的分类结果。Elhamifar等人提出了一种稀疏流形 聚类与嵌入(Sparse Manifold Clustering and Embedding,SMCE)算法,该方法能够自适 应的选取来自同一流形的数据,这些来自同一流形的数据点跨越了同一低维仿射子空间, 在此基础上构建的相似图能更好地揭示出数据中不同流形的内在特性,在数据聚类中具有 很好的效果,但该方法只在训练样本有定义,不能直接出来新样本,存在"样本外学习"问 题,而且该方法没有充分利用训练样本的类别信息,限制了算法的鉴别能力。
[0007] 因此,如何从标记数据以及未标记数据中提取出有用的知识来改善学习性能、提 高分类精度,在高光谱图像分类领域中尤为重要。

【发明内容】

[0008] 针对现有技术存在的上述不足,本发明的目的在于提供一种稀疏自适应半监督多 流形学习的高光谱影像分类方法,其通过半监督稀疏鉴别嵌入算法对高光谱遥感影像进行 维数简约,利用少量有标记训练样本以及部分无标记训练样本来发现蕴藏在高维数据的内 在属性以及低维流形结构,以提高对高光谱遥感影像中地物类别的分类精度。
[0009] 为了实现上述目的,本发明采用了如下的技术手段:
[0010] 一种稀疏自适应半监督多流形学习的高光谱影像分类方法,包括如下步骤:
[0011] 1)读入高光谱遥感影像数据;
[0012] 2)将高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从 而由各个数据点的光谱数据向量组成整幅高光谱遥感影像的光谱数据矩阵;
[0013] 3)从高光谱遥感影像中选取部分数据点作为样本数据点,由各个样本数据点的光 谱数据向量组成样本数据矩阵,并根据先验知识从样本数据矩阵中选取部分样本数据点的 光谱数据向量进行已知地物类别的标注,生成相应的样本类别标签;
[0014] 4)利用样本数据矩阵分别对其中每个样本数据点的光谱数据向量在仿射空间中 构建稀疏优化模型,并优化求解得到每个样本数据点对应的仿射空间表示向量,从而得到 样本数据矩阵对应的仿射空间表示矩阵;
[0015] 5)根据样本数据矩阵中标注有样本类别标签的样本数据点进行半监督多流形划 分,构建所有样本数据点的多流形稀疏相似图;
[0016] 6)根据仿射空间表示矩阵和样本数据矩阵中标记的样本类别标签,利用半监督方 法确定多流形稀疏相似图中各样本数据点之间的相似权重值,且根据多流形稀疏相似图中 不同流形结构的划分关系,得到各个流形的半监督相似权重矩阵,进而由各个流形的半监 督相似权重矩阵组成多流形稀疏相似图的半监督相似权重对角矩阵;
[0017] 7)构建低维嵌入目标优化函数,利用多流形稀疏相似图的半监督相似权重对角矩 阵通过稀疏多流形嵌入算法计算得到各流形的投影矩阵,进而得到每个流形中各个样本数 据点相对于其投影矩阵所投影的低维嵌入特征;
[0018] 8)对高光谱遥感影像中的测试数据点,分别利用各流形的投影矩阵对测试数据点 的光谱数据向量进行投影,得到测试数据点的光谱数据向量分别在各流形的投影矩阵下的 低维嵌入特征;
[
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1