面向高分遥感图像的大尺度半监督特征选择方法

文档序号:9564885阅读:1136来源:国知局
面向高分遥感图像的大尺度半监督特征选择方法
【技术领域】
[0001] 本发明涉及半监督特征选择方法,特别涉及一种面向高分遥感图像的大尺度半监 督特征选择方法。
【背景技术】
[0002] 通过提供精准而广泛的土地利用、土地覆盖信息,高分辨率(VHR)遥感图像在现 实生活中起到了极大的作用。高分辨率遥感图像在现实生活中的应用常依赖于面向对象的 图像分析(object based image analysis, 0ΒΙΑ)。OBIA需要各种目标特征,包括目标的光 谱、结构和形状特征,太多的底层特征会降低OBIA的性能。这个矛盾可以通过特征选择方 法缓解。通过有效地选择少量具有更高辨别力的原始特征,特征选择方法对数据挖掘算法 的加速,性能的提尚及t旲型的可理解性的提尚有着直接而显者的影响。
[0003] 现有的特征选择方法主要分为三类:无监督,监督和半监督方法。监督特征选择 算法需要大量的训练数据的标记。当无标记对象的数量远远大于带标记的数据时,监督方 法往往并不适合。非监督特征选择算法忽略标记信息,却也因此可能导致算法性能的恶化。 相比之下,半监督特征选择方法同时利用标记和未标记对象:有标记对象提供的监督信息 通常被转化为背景知识,无标号对象提供几何结构信息。因为背景知识和几何结构信息被 集成到特征选择的过程中,所以相比来说在同时存在标记数据和无标记数据的情况下,半 监督方法更加有效。
[0004] 尽管半监督特征选择具有优势,却很少有应用于高分辨率遥感图像的方法。不对 称局部判别选择(Asymmetrically Local Discriminant Selection, ALDS)基于样本对之 间的多种类型关系,将类别的不对称的误分类代价引入到边的权重矩阵中。在其他的领域 研究中,基于谱分析和形成相同的结构的数据点很可能会有相同的标记的假设上,提出了 光谱特征选择框架(spectral feature selection framework, SPEC)。通过样条回归的半 监督特征选择方法(Semisupervised feature selection via spline regression, S2FS2R) 更好地利用了数据分布与标记和未标记的影像信息的局部几何结构。海森稀疏特征选择 (Hessian sparse feature selection, HFSL)则基于12,1/2范数矩阵范数模型和图的结构来 选择最有识别力的稀疏征。
[0005] 上述各种算法需要事先构建图的拉普拉斯算子矩阵,而建立一个nXn矩阵的计 算成本至少是〇(η 2)。巨大的计算量可能导致准确捕捉高分辨率遥感图像局部几何特征 能力的缺乏,并且使计算过程变得极为低效。最近,凸状半监督多标记特征选择(Convex Semi-supervised multi-label Feature Selection, CSFS)方法可以同时利用标记数据和 未标记数据来选择特性并且也考虑了不同特征之间的相关性。由于最大分辨力的提高和高 光谱图像的普及,还提出了高识别、高信息和低冗余的准则。总的来说,这种不需要构建图 的方法仍然十分稀缺。

【发明内容】

[0006] 本发明目的是为了解决现有高分遥感图像监督特征选择方法中,需要大量训练数 据的标记,当无标记对象的数量远远大于带标记的数据时,影响被选择的特征的合理性的 问题,提供了一种面向高分遥感图像的大尺度半监督特征选择方法。
[0007] 本发明所述面向高分遥感图像的大尺度半监督特征选择方法,它包括以下步骤:
[0008] 步骤一:采集遥感图像数据,对遥感图像数据进行预处理;将预处理后的遥感图 像分割成η个样本,对每个样本进行特征提取,获得样本数据;再将样本数据中的每个特征 归一化处理后,获得归一化后的数据X ;
[0009] 步骤二:针对归一化后的数据X中的每一个特征构建基于损失函数和无标记样本 的概率分布矩阵{y jk}的度量函数;
[0010] 步骤三:对步骤二中获得的度量函数的三个参数依次循环优化,获得相应特征对 应的度量值;
[0011] 步骤四:根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该 特征子集作为大尺度半监督特征选择方法选择获得的数据。
[0012] 步骤一中,设定归一化后的数据X为:
[0014] 其中m为对每个样本进行特征提取获得的特征数量,巧e#为归一化后的数据X 中对应于第j个样本的特征,j = 1,2, 3,......,η ;
[0015] 样本总数η = nl+nu,其中nl为标记样本数,nu为无标记样本数;
[0016] Xj的标记类别为y j,y# {1,…,c},C为类别数。
[0017] 步骤二中:由第i个特征仁的目标函数Q1计算其所表征的内在数据特性,i = 1,2, 3,......,m ;
[0019] 其中||·||F是Fr0beniu S范数,w,€J!l>^为fl的权重系数,b ?e:嚴1?为回归偏置, y]ke [0,1]为第j个无标记样本属于第k个类别的概率,r为需要调整的自适应参数,
为^的标记部分,
为包含nl个元素1的列向量,
为标记数据的标 记矩阵,&为f i的第j个元素;是类别指示向量,它的第k类别的第k个元素是1, 剩余元素为0 ;
[0020] 目标函数Q1中第一项
为标记数据的损失函数,第二项
为无标记数据的损失函数,由概率外作为其权重。
[0021] 步骤三中:获得相应特征对应的度量值的具体过程为:
[0022] 固定模型参数中权重系数W1和回归偏置b i,求解类别概率y]k:
[0023] 由于标记数据的损失函数为常量,则目标函数Q1简化为:
[0027] 由于公式⑶与样本无关,则有:
[0030] 取r>l,则公式(4)的拉格朗日函数为:
[0032] 其中β为拉格朗日乘数;
[0033] 令公式(5)关于y]k的导数为0,则有:
[0035] 将约束Ck= 1,y ]k= 1代入公式(6),获得类别概率y ]k的封闭形式解:
[0037] 再固定类别概率#,求解权重系数W1和回归偏置b i,通过变形以及对目标函数Q1 求关于h的导数,有:
[0039] 其中
代表对Y中每个元素进行能量上的 操作,
为对角矩阵,它的第i个对角元素
q为标量,
[0040] 所述目标函数%作为相应特征对应的度量值。
[0041] 步骤四中:获得遥感图像数据的特征子集的方法为:
[0042] 根据目标函数%的度量值,对相应的特征进行排序,获得遥感图像数据的特征子 集。
[0043] 本发明的优点:本发明提出了一种面向高分遥感图像的大尺度半监督特征选择方 法--自适应半监督特征选择(adaptive semisupervised feature selection, ASFS)方 法。该方法从半监督学习方法出发,建立基于损失函数和无标记样本的概率分布矩阵的特 征度量函数,通过循环优化模型求得每个特征向量对应的度量值。ASFS方法可以度量高分 辨率遥感数据的特征,并且对其进行排序和选择。不同于以前的半监督学习方法,ASFS模 型不依赖于图的拉普拉斯算子矩阵的构建,因此实现了计算复杂度与数据点数量之间的线 性关系,对于大尺度数据也有良好的适应性,在处理海量高分遥感图像时与其他算法相比 显然性能更好。同时,ASFS能够减轻噪声影响。实验评估结果表明,使用本发明所提出的 ASFS算法所得结果的平均总体精度和Kappa系数均优于其他常用的特征选择算法。
[0044] 本发明所述
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1