面向高分遥感图像的大尺度半监督特征选择方法_3

文档序号:9564885阅读:来源:国知局
更好的鲁棒性。公式(5)得到了所述问题的最 优化解。
[0113] 步骤四中对相应的原始特征向量进行排序,需要根据实际情况将最好几个的特征 选入最后的特征子集。
[0114] 本发明方法从半监督学习方法出发,通过选择性的优化关键变量,模型参数和无 标号对象的类别概率分布,对目标方程进行求解。ASFS方法可以测量数据的特征,并且对其 进行排序和选择。同时,ASFS能够应付离群值。
[0115] 下面采用具体实施例验证本发明的效果:
[0116] 为了验证本发明所提出的ASFS算法在解决高分辨率遥感图像处理问题上的性 能,将它和拉普拉斯分数(Laplacian Score, LS)、mcLogisticC 算法、SPEC 算法、TRCFS 算法、S2FS2R算法进行实验比较。如图2所示,实验所用数据集为两幅高分辨率遥感 图像,分别为Sydney的Worldview-2图和Shenzhen的Quickbird-2图,该图像通过 eCognitionDeveloper使用多尺度分割技术进行分割。分割参数包括紧密性,平滑度,形状, 颜色和尺度参数,分别被设置为0. 5,0. 5,0. 1,0. 9和50。分别应用SVM和I-NN这两种常用 监督分类方法,在标记样本数分别为10和50的情况下进行试验,实验过程重复多次进行, 计算每种算法所得结果的所有维度平均总体精度和Kappa系数,实验结果见图3至图6。
[0117] 由图3至图6可看出,从整体来看,本发明所提出的ASFS算法在平均总体精度和 Kappa系数上占有一定优势。在图3和图5中,ASFS方法在所选择的特征数在100以内时 效果明显好于其他算法;在图4和图6中,随着标记样本数增加到50,ASFS算法的表现依旧 占有优势,但与标记样本数较少时相比,优势减小。另外随着特征数的不断增大,所有算法 的结果均趋于相同。说明在特征数极高时,各类算法效果相仿,但特征数有限时,我们所提 出的ASFS算法效果明显更优。
[0118] 表2和表3选取了针对两幅高分辨率遥感图像,在标记样本数为10时,ASFS算法 和LS算法、mcLogisticC算法、SPEC算法、TRCFS算法、S 2FS2R算法在所有维度上的平均总 体精度和Kappa系数。表4和表5为相同实验条件下标记样本数为50时的实验结果。
[0119] 表2针对Sydney数据集标记样本数为10时所有维度平均总体精度和Kappa系数
[0121] 表3针对Shenzhen数据集标记样本数为10时所有维度平均总体精度和Kappa系 数
[0123] 表4针对Sydney数据集标记样本数为50时所有维度平均总体精度和Kappa系数
[0125] 表5针对Shenzhen数据集标记样本数为50时所有维度平均总体精度和Kappa系 数

[0127] 从表2和表3可以看出针对两种不同的数据集,ASFS算法产生的结果好于其他算 法。以针对Sydney数据集使用SVM监督分类方法时为例,ASFS算法平均总体精度最高,为 58. 18, TRCFS 算法其次,为 51. 67, Kappa 系数分别为 40. 54 和 35. 74, mcLogisticC 算法平 均总体精度最低,仅为44. 53。使用I-NN分类方法时,仍是ASFS算法平均总体精度最高,为 68. 41,其次是S2FS2R算法,最低的为SPEC算法,Kappa系数分别为53. 32, 51. 23和49. 07。 从表4和表5,同样可看出ASFS算法产生的结果好于其他算法。由此,可得出结论,基于本 发明所提出的ASFS算法,可以有效提高对高分辨率遥感图像进行半监督特征选择的平均 总体精度和Kappa系数。
【主权项】
1. 一种面向高分遥感图像的大尺度半监督特征选择方法,其特征在于,它包括W下步 骤: 步骤一:采集遥感图像数据,对遥感图像数据进行预处理;将预处理后的遥感图像分 割成η个样本,对每个样本进行特征提取,获得样本数据;再将样本数据中的每个特征归一 化处理后,获得归一化后的数据X; 步骤二:针对归一化后的数据X中的每一个特征构建基于损失函数和无标记样本的概 率分布矩阵{yjk}的度量函数; 步骤Ξ:对步骤二中获得的度量函数的Ξ个参数依次循环优化,获得相应特征对应的 度量值; 步骤四:根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该特征 子集作为大尺度半监督特征选择方法选择获得的数据。2. 根据权利要求1所述的面向高分遥感图像的大尺度半监督特征选择方法,其特征在 于,步骤一中,设定归一化后的数据X为:其中m为对每个样本进行特征提取获得的特征数量,X,e心'"为归一化后的数据X中对 应于第j个样本的特征,j= 1,2, 3,......,η; 样本总数η=nl+nu,其中nl为标记样本数,nu为无标记样本数; X,的标记类别为y.,,y,e(1,...,c},C为类别数。3. 根据权利要求2所述的面向高分遥感图像的大尺度半监督特征选择方法,其特 征在于,步骤二中:由第i个特征的目标函数Qi计算其所表征的内在数据特性,i= 1,2, 3,……,m;其中II·IIP是化obenius范数,W,G奴<'为的权重系数,b,. 6泌1"为回归偏置,y,ke[0,1]为第j个无标记样本属于第k个类别的概率,r为需要调整的自适应参数, f/ €级心为的标记部分,1,,, €汲"W为包含nl个元素1的列向量,X€嚴"心为标记数据的标 记矩阵,fi,为f1的第j个元素;是类别指示向量,它的第k类别的第k个元素是1, 剩余元素为0 ; 目标函数Qi中第一项为标记数据的损失函数,第二项为无标记数据的损失函数,由概率.V;,作为其权重。4. 根据权利要求3所述的面向高分遥感图像的大尺度半监督特征选择方法,其特征在 于,步骤Ξ中:获得相应特征对应的度量值的具体过程为: 固定模型参数中权重系数Wi和回归偏置b1,求解类别概率y,k: 由于标记数据的损失函数为常量,则目标函数Qi简化为:取r〉l,则公式(4)的拉格朗日函数为:錢 其中β为拉格朗日乘数; 令公式巧)关于y,k的导数为0,则有:作) 将约束Ck= 1,y,k= 1代入公式化),获得类别概率y,k的封闭形式解:傑 再固定类别概率3;<,求解权重系数和回归偏置b1,通过变形W及对目标函数Qi求关 于bi的导数,有:贷) 其中,Χ'代表对Y中每个元素进行能量上的操作, SeiT。、""为对角矩阵,它的第i个对角元素所述目标函数Qi作为相应特征对应的度量值。5.根据权利要求4所述的面向高分遥感图像的大尺度半监督特征选择方法,其特征在 于,步骤四中:获得遥感图像数据的特征子集的方法为: 根据目标函数Qi的度量值,对相应的特征进行排序,获得遥感图像数据的特征子集。
【专利摘要】面向高分遥感图像的大尺度半监督特征选择方法,属于半监督特征选择技术领域,本发明是为了解决现有高分遥感图像监督特征选择方法中,需要大量训练数据的标记,当无标记对象的数量远远大于带标记的数据时,影响被选择的特征的合理性的问题。它首先采集遥感图像数据,处理后获得归一化后的数据x;再构建基于损失函数和无标记样本的概率分布矩阵{yjk}的度量函数;对度量函数的三个参数依次循环优化,获得相应特征对应的度量值;根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该特征子集作为大尺度半监督特征选择方法选择获得的数据。本发明用于遥感图像的特征选择。
【IPC分类】G06K9/62
【公开号】CN105320963
【申请号】CN201510689508
【发明人】陈曦, 戚金子, 周共建
【申请人】哈尔滨工业大学
【公开日】2016年2月10日
【申请日】2015年10月21日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1