范数最小化的监督多视图特征选择方法

文档序号:9327459阅读:354来源:国知局
范数最小化的监督多视图特征选择方法
【技术领域】
[0001] 本发明涉及基于自动视图生成和联合Ili2范数最小化的监督多视图特征选择方 法,属于遥感图像数据处理技术领域。
【背景技术】
[0002] 随着成像技术的发展,遥感图像应用越来越广泛,例如灾害和环境等的勘察与检 测、基础地理数据的更新等很多的领域。这些遥感图像可提取的特征很多,高维特征给遥感 图像的应用带来两大挑战:第一个是高维特征将引发维数灾难。该问题可以用特征选择方 法解决,该方法也受到越来越多的关注。随机森林将特征选择和分类绑定在一起,可以用于 滑坡制图。局部加权判别投影可以处理类别不平衡问题对分类和特征选择的潜在威胁。这 些特征选择方法是面向高分辨率遥感影像的,取得了较好的效果。相对于面向高光谱影像 的方法,面向高分辨率遥感影像的特征选择方法数量较少。
[0003] 第二个问题是特征空间实际上由异质的特征子空间组成。该异质性增加了探索特 征空间的复杂性。该特征空间的异质性未知,且常常被现有的特征选择方法所忽略。在其 他领域,如超光谱图像处理中可以采用多视图学习方法探索异质的特征空间。多视图方法 比传统的单视图方法更好。其原因是可以在不同的视图中利用互补性的信息。
[0004] 为了在降维的同时探索异质的特征空间,有必要发展多视图特征选择方法。目前, 模型遥感图像的多视图特征选择方法不多。无监督多视图特征选择方法(Unsupervised multiview feature selection,MVFS)面向社交媒体数据,定义了面向多视图数据的特征 选择方法。还可以基于分布式编码方法,提出面向多视图图像数据集的识别和索引任务的 无监督特征选择方法。自适应无监督多视图特征选择Adaptive Unsupervised Multi-view Feature Selection(AUMFS)基于I2il范数惩罚项,将数据聚类空间、数据相似性和不同 视图之间的相关性联合起来选择特征。基于张量的多视图特征选择方法Tensor-based multi-view feature selection (DUAL-TMFS)是一个针对大脑疾病的封装器模型,该 模型基于SVM-RFE在张量空间中求解一个整数二次规划问题。面向多视图迀移学习的 判别式特征选择方法 Discriminative feature Selection for MUlti-View Transfer IEarning(DISMUTE)基于I2,i范数,利用数据的多视图信息的同时,提取代表性的跨领域特 征以增强无监督学习的性能。这些方法中,特征的结构相对简单,或者特征视图天然可用。
[0005] 这些方法可能不适于高分辨率遥感图像,因为高分辨率遥感图像的特征非常复 杂。例如,谱特征的均值与灰度共生矩阵Gray Level Co-occurrence Matrix(GLCM)纹理 特征中的均值很相似,与光谱特征中的方差不相似。实际上,特征基于它们的定义相似,而 不是基于它们的简单分类,如光谱、纹理和形状。该例子还告诉我们两个教训:1)特征复杂 关联;2)特征的不同视图表达了不同的信息,可能在不同方向起作用。因此,1)视图应该自 适应地产生;2)为了用尽可能少的特征保留信息,应该在每个视图中都保留少数特征。有 三种方法可以用于第一点的视图生成。第一是随机子空间方法。该方法难以产生满意的结 果。第二是重构和分解原始的单视图成多视图,如矩阵分解和核函数法。第三是特征集合 自动分割。第三种方法一般与固定分类器或者视图数量的先验知识有关。
[0006] 第二点与几个最新的方法有关。组套索Group lasso采用12」范数正则化在组层 面而不是个体层面上稀疏。稀疏组套索Sparse group lasso在group lasso上加了一个 I1范数最小化,使得组和个体层面上都稀疏。相对于I2il范数,I li2范数能带来组内稀疏。 因此,I1,2范数更适合多视图问题。在有序子空间聚类Ordered Subspace Clustering中, 在视频数据的重构误差项上加上Ili2约束,其他项采用Frobenius范数或者1范数。排他 式组套索Exclusive group lasso在正则化项上采用Ili2最小化,在损失函数上I2范数最 小化。采用I 2范数或者Frobenius范数最小化的项容易受噪声干扰。
[0007] 2、特征空间的复杂性增加了算法应用的难度。第一个问题可以通过特征选择方法 自动选择特征解决,如ReliefF和mRMR等。最近兴起的基于I 2il范数正则化的最优化特征 选择方法,如mcLogisticC产生了比传统特征选择方法更好的性能。第二个问题在算法应 用中常常提及,但是很少针对性地探索特征空间的同质性和异质性,并充分利用该特性选 择特征。

【发明内容】

[0008] 本发明目的是为了解决高分辨率遥感图像在特征选择过程中存在的信息丢失的 问题,提供了一种基于自动视图生成和联合I li2范数最小化的监督多视图特征选择方法。
[0009] 本发明所述基于自动视图生成和联合Ili2范数最小化的监督多视图特征选择方 法,它包括以下步骤:
[0010] 步骤一:采集遥感图像数据,对遥感图像数据进行预处理;然后进行特征提取,获 得特征向量集合;再将特征向量集合中所有特征向量归一化,获得原始特征向量集合;
[0011] 步骤二:采用affinity propagation算法将步骤一中获得的原始特征向量集合 生成特征多视图;
[0012] 步骤三:基于Ili2范数对步骤二中生成的特征多视图进行监督多视图特征选择。
[0013] 步骤一中所述对遥感图像数据进行预处理包括对遥感图像数据依次进行几何精 校正与图像配准、图像镶嵌与裁剪、大气校正和坏带去除。
[0014] 步骤一中所述获得特征向量集合的具体方法为:提取预处理后的遥感图像数据的 特征值获得特征数据,所有特征数据由m维特征空间中的η个样本X 1组成,特征数据记为 其中样本X, Y1是标记,yie {l,...,c},c是类别数量;将η个样本X1 '9 :, 的行向量记为样本集X
,样本集X对应的标记向量为y,将η个样 本Xi的列向量形成的m个特征向量记为
[0015] 步骤一中获得原始特征向量集合的方法为:将特征数据[&,.V^1中所有特征值 映射到[0-1]之间,获得原始特征向量集合。
[0016] 步骤二中生成特征多视图的方法为:利用affinity propagation算法,度量特征 向量仁和。之间的相似性S(i,j) :S(i,j) =-|| frA ||2,其中j = 1,2,3……η;
[0017] 再根据f种f ,之间的相似性S (i,j)计算获得自相似性S (t,t):
[0019] 其中1彡t彡η ;
[0020] 特征向量发送响应r (i, j)给f y fj发送可用性a(i, j)给f ;,其中r (i, j)为:
[0024] 由响应r(i, j)和可用性a (i, j)获得特征值聚类中心:
[0026] 式中 k=l,2,3......η;
[0027] 根据特征值聚类中心对原始特征向量集合中所有特征向量进行聚类生成特征多 视图,该多视图包括L个特征子集,令F 1为第1个特征子集,其中每个视图对应一个特征子 集,每个特征子集对应不同的数据特点,1 = 1,2,3……L。
[0028] 步骤三中进行监督多视图特征选择的具体方法为:
[0029] 确定监督多视图特征选择的目标函数为
[0030] 式中特征选择的系数矢量β为:β = [ β D β 2, . . .,β J,β i为特征子集F i所对 应的系数矢量,λ 正则化参数,
[0031] 令E = y-Χβ,使Ee,xl:>则监督多视图特征选择的问题变形为:
[0037] 令V是一个各元素都为正数的矢量,则获得:
[0038] 再对上式进行变形获得最终的监督多视图特征选择的目标函数及其约束为:
[0042] V 彡 〇
[0043] 式中,1是一个各个元素都为1的矩阵,其下标表示特征视图的序号;取U的前m行 作为多视图特征所对应的系数矢量β,根据β的大小选择遥感图像数据多视图的最佳特 征。
[0044] 本发明的优点:本发明涉及到遥感图像特征空间的同质性和异质性构成,并通过 深入分析特征空间的构成选择少量互补性强的特征。它针对遥感图像特征空间的同质性和 异质性,提出了基于I li2范数最小化的监督多视图特征选择方法,将特征空间自动分解为多 个不独立相交但有物理意义的异质特征子空间,即特征视图,然后在每个视图中选择最能 代表该视图的少量同质特征,以在降低特征冗余性的同时克服可能引起信息丢失的弊端, 使不同子空间选出的特征互补性强,最好地表征原始特征空间的特性。
[0045] 本发明通过近邻传播affinity propagation算法生成多个不独立相交但有物理 意义的异质子空间或特征视图,在保证特征空间显著特点的同时,提升了整体性能。
【附图说明】
[0046] 图1是本发明方法的流程图;
[0047] 图2是基于监督多视图特征选择的特征空间同质性和异质性分析方法原理框图;
[0048] 图3a为针对悉尼图像采用SVM时的总体分类精度随特征数量的变化曲线;
[0049] 图3b为针对悉尼图像采用SVM时的Kappa系数随特征数量的变化曲线;
[0050] 图3c为针对悉尼图像采用Bayes分类器时的总体分类精度随特征数量的变化曲 线;
[0051] 图3d为针
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1