面向高分遥感图像的大尺度半监督特征选择方法_2

文档序号:9564885阅读:来源:国知局
ASFS方法是一种半监督特征选择方法,它将数据的标记加入训练中, 从而扩展了方法的应用广度,并且对特征进行分类时可以充分利用各种功能类别的互补信 息。不同于以往的方法,ASFS并不需要构造图拉普拉斯算子矩阵。因此,ASFS可以更好的 处理海量高分遥感图像。此外,ASFS自适应抑制边界点的权重。这使得模型有着健壮的边 界点。实验结果表明,该方法优于传统的单一视图方法、经典方法和相关最新方法。
[0045] ASFS算法在将组织结构信息合并为前提信息后,有效的提高了被选择的特征的合 理性。与其他算法相比,本发明中所提出的新方法具有更好的性能,在只有部分训练数据有 标记的情况下,该优势更加明显。
【附图说明】
[0046] 图1是本发明所述面向高分遥感图像的大尺度半监督特征选择方法的流程图;
[0047] 图2a是澳大利亚悉尼沿海地区的Worldview-2实验图像;
[0048] 图2b是澳大利亚悉尼沿海地区的Worldview-2地面实况参考图像;
[0049] 图2c是中国深圳密集城区的Quickbird-2实验图像;
[0050] 图2d是中国深圳密集城区的Quickbird-2地面实况参考图像;
[0051] 图3a是针对悉尼图像采用SVM且标记样本数为10时的总体分类精度随特征数量 的变化曲线;
[0052] 图3b是针对悉尼图像采用I-NN且标记样本数为10时的总体分类精度随特征数 量的变化曲线;
[0053] 图3c是针对悉尼图像采用SVM且标记样本数为10时的Kappa系数随特征数量的 变化曲线;
[0054] 图3d是针对悉尼图像采用I-NN且标记样本数为10时的Kappa系数随特征数量 的变化曲线;
[0055] 图4a是针对悉尼图像采用SVM且标记样本数为50时的总体分类精度随特征数量 的变化曲线;
[0056] 图4b是针对悉尼图像采用I-NN且标记样本数为50时的总体分类精度随特征数 量的变化曲线;
[0057] 图4c是针对悉尼图像采用SVM且标记样本数为50时的Kappa系数随特征数量的 变化曲线;
[0058] 图4d是针对悉尼图像采用I-NN且标记样本数为50时的Kappa系数随特征数量 的变化曲线;
[0059] 图5a是针对深圳图像采用SVM且标记样本数为10时的总体分类精度随特征数量 的变化曲线;
[0060] 图5b是针对深圳图像采用I-NN且标记样本数为10时的总体分类精度随特征数 量的变化曲线;
[0061] 图5c是针对深圳图像采用SVM且标记样本数为10时的Kappa系数随特征数量的 变化曲线;
[0062] 图5d是针对深圳图像采用I-NN且标记样本数为10时的Kappa系数随特征数量 的变化曲线;
[0063] 图6a是针对深圳图像采用SVM且标记样本数为50时的总体分类精度随特征数量 的变化曲线;
[0064] 图6b是针对深圳图像采用I-NN且标记样本数为50时的总体分类精度随特征数 量的变化曲线;
[0065] 图6c是针对深圳图像采用SVM且标记样本数为50时的Kappa系数随特征数量的 变化曲线;
[0066] 图6d是针对深圳图像采用I-NN且标记样本数为50时的Kappa系数随特征数量 的变化曲线;
【具体实施方式】
[0067]
【具体实施方式】一:下面结合图1至图6说明本实施方式,本实施方式所述面向高分 遥感图像的大尺度半监督特征选择方法,它包括以下步骤:
[0068] 步骤一:采集遥感图像数据,对遥感图像数据进行预处理;将预处理后的遥感图 像分割成η个样本,对每个样本进行特征提取,获得样本数据;再将样本数据中的每个特征 归一化处理后,获得归一化后的数据X ;
[0069] 步骤二:针对归一化后的数据X中的每一个特征构建基于损失函数和无标记样本 的概率分布矩阵{yjk}的度量函数;
[0070] 步骤三:对步骤二中获得的度量函数的三个参数依次循环优化,获得相应特征对 应的度量值;
[0071] 步骤四:根据所述的度量值,对特征进行排序,获得遥感图像数据的特征子集,该 特征子集作为大尺度半监督特征选择方法选择获得的数据。
[0072] 步骤一中,设定归一化后的数据X为:
[0074] 其中m为对每个样本进行特征提取获得的特征数量,为归一化后的数据X 中对应于第j个样本的特征,j = 1,2, 3,......,η ;
[0075] 样本总数η = nl+nu,其中nl为标记样本数,nu为无标记样本数;
[0076] Xj的标记类别为y』,e {1,· · ·,c},c为类别数。
[0077] 步骤二中:由第i个特征A的目标函数Q1计算其所表征的内在数据特性,i = 1, 2, 3,......,m ;
[0079] 其中I I · I ^是Frobenius范数,.
为仁的权重系数,
为回归偏置, y]ke [0,1]为第j个无标记样本属于第k个类别的概率,r为需要调整的自适应参数, f/ 为A的标记部分,
为包含nl个元素1的列向量:
为标记数据的标 记矩阵,匕为f i的第j个元素;t, eiT是类别指示向量,它的第k类别的第k个元素是1, 剩余元素为0 ;
[0080] 目标函数Q1中第一项
为标记数据的损失函数,第二项
为无标记数据的损失函数,由概率&作为其权重。
[0081] 步骤三中:获得相应特征对应的度量值的具体过程为:
[0082] 固定模型参数中权重系数W1和回归偏置b i,求解类别概率y]k:
[0083] 由于标记数据的损失函数为常量,则目标函数Q1简化为:
[0087] 由于公式⑶与样本无关,则有:
[0090] 取r>l,则公式(4)的拉格朗日函数为:
[0092] 其中β为拉格朗日乘数;
[0093] 令公式(5)关于y]k的导数为0,则有:
[0095] 将约束Ck= 1,y ]k= 1代入公式(6),获得类别概率y ]k的封闭形式解:
[0097] 再固定类别概率戒:,求解权重系数W1和回归偏置Id1,通过变形以及对目标函数Q 1 求关于h的导数,有:
[0099] 其中
代表对Y中每个元素进行能量上的 操作,
为对角矩阵,它的第i个对角元素
q为标量,
[0100] 所述目标函数仏作为相应特征对应的度量值。
[0101] 步骤四中:获得遥感图像数据的特征子集的方法为:
[0102] 根据目标函数仏的度量值,对相应的特征进行排序,获得遥感图像数据的特征子 集。
[0103] 步骤一中对每个样本进行特征向量提取,所述特征向量如下表1中所示:
[0104] 表 1
[0105]

.?).
[0107] 对遥感图像数据进行预处理包括对其进行分割、提取特征及归一化等。对每个特 征向量归一化处理指将每个特征都归一化到[0,1]区间。对每个样本进行特征向量提取, 获得的特征向量集合用{fj表示。
[0108] 步骤三中,若r = 1,则公式(4)可写为:
[0112] 其中
r有助于自动调整目标的权重。特征空间决策边界周围的无 标签目标常有相似的类别概率,因此可能会带来巨大的误差。假设目标X]为边界目标,则有 y]k=l/c。当r>l时,边界目标的权重A将比确定类别的目标的权重小得多。在这种情况 下,边界目标将被抑制,因此ASFS算法具有
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1