基于半监督流形学习的多光谱遥感数据土地利用分类方法

文档序号:6651758阅读:706来源:国知局
专利名称:基于半监督流形学习的多光谱遥感数据土地利用分类方法
技术领域
本发明涉及一种基于多光谱遥感数据土地利用分类方法,特别涉及一种半监督流 形学习的适用于多光谱数据土地利用分类的方法。
背景技术
人们从20世纪60年代就开始用多光谱技术获取地球表面信息。多光谱成像是利 用多光谱摄影系统或多光谱扫描系统对电磁波谱不同谱段做同步摄影遥感,分别获得植被 及其他地物在不同谱段上的影像的遥感技术。多光谱扫描仪(Multi-spectral Scanner, MSS)是一种光谱测量传感器,它通过记录地物对不同光谱波段的响应来获取地物信息。多 光谱成像是通过扫描的方式完成的。对于每一个分辨率大小的地面区域,MSS—次可获取多 个光谱响应值,每个值对应一个光谱波段。国际遥感界的共识是光谱分辨率在λ/10数量 级范围的称为多光谱(Multi-spectral),这样的遥感器在可见光和近红外光谱区只有几个 波段,如美国Landsat MSS,TM,法国的SPOT等。多光谱遥感图像的特点①工作波段宽,从 近紫外、可见光到热红外波段,波长范围达0. 35 20微米;②各波段的数据容易配准。这 两个特点非其他遥感器所能具有,因而多光谱扫描仪是气象卫星和“陆地卫星”的主要遥感 器。随着传感器技术的进步,新型多光谱传感器的光谱分辨率达到了纳米级,空间分辨率达 到了米级。在相关领域具有广泛的应用和发展空间。在遥感图像的实际使用中,数据集较 以往有了显著的变化,其主要特点可以归纳为高数据量、高维数、高数据增长率以及高分 辨率。随着多光谱传感器的空间分辨率不断地提高,人们可以从遥感图像中获得更多的 有用的数据和信息。多光谱图像数据也越来越多的被用于土地利用和覆被监测领域中来, 这就不可避免的遇到一个关键环节一多光谱图像分类,用计算机对多光谱遥感图像进行 土地利用分类时,多光谱图像数据一般数据量较大,把不同传感器得到的遥感图像进行融 合使用时数据量更大。多光谱图像数据的土地利用分类,通常是建立在不同地物在各波段 反射的电磁波谱差别的基础上的。若以各波段接收到的电磁波强度为坐标,则η个波段可 形成η维波谱空间。各波段上同一像元对应于N维空间的一个点,而同类地物可形成一个 点集。多光谱遥感数据土地利用分类的基本原理在于把波谱空间中的点集区分开来,多光 谱图像分类中,由于数据维数较高、有类别标签的地面样本获取代价比较大,所以有类别标 签的训练样本数量通常很有限,传统的模式识别方法(如贝叶斯方法,神经网络等)大多是 以经典统计学为基础,在假设训练样本数目足够多的前提下进行研究的,这些方法只有当 训练样本数目趋于无穷大时其性能才能达到理论上的最优。目前多光谱遥感数据土地利用 分类主要集中两步,首先对多光谱遥感数据进行分类前的处理一特征提取,这一步主要 目的是既可以消除原图像中对分类或其他处理不利的外部影响因素,又可以消除原图像各 波段间的数据相关性从而避免许多无效的数据处理。其次再选择合适的分类器进行多光谱 遥感数据土地利用分类。针对高光谱图像分类问题,研究者提出如下两方面技术,一是把机器学习引入到多光谱图像分类中,力图在多光谱数据中通过机器学习发现数据内部的变化规律;二是寻 求或改进更有效的分类算法;按照地物分类时是否需要训练样本,这些方法可大致分为两 类监督分类和非监督分类。由于多光谱图像有类别标签的训练样本获取的代价比较大,样 本数目非常有限,所以使用监督分类效果就有些局限性,虽然非监督分类不使用任何关于 数据的先验信息,但是分类效果通常较差。因此,把半监督流形学习方法弓I入进多光谱遥感 数据土地利用分类中,即通过对训练样本的学习,掌握数据内部隐含的规律,实现对未来样 本的准确判决。基于数据的机器学习是现代智能技术中的重要方面,研究从观测数据(训练样 本)出发寻找尚不能通过原理分析得到的规律,利用这些规律对未来数据或无法观测的数 据进行预测。现实世界中存在大量目前无法准确认识但却可以进行观察的事物,因此,把机 器学习引入到多光谱遥感数据土地利用分类中来是十分有必要的,数据经过投影,通过半 监督流形学习法来发现数据内部的变化规律,提高识别精度,这样既比非监督方法精度要 好,又可以弥补使用监督方法时样本获取代价过高的缺点。基于数据的机器学习在现代科 学、技术、经济、社会等各个领域都发挥着十分重要作用。

发明内容
有鉴于此,为了解决上述问题,本发明提出一种把机器学习引入到遥感图像分类 中,融合半监督学习和流形学习的方法,对投影后的多光谱数据的进行训练来找出数据内 部的流行变化规律;同时将用户先验知识提供的标注信息融入到半监督流形学习中,并用 于多光谱遥感图像土地利用分类。本发明的目的是提出一种基于半监督流形学习的多光谱图像土地利用分类方 法;本发明的目的是这样实现的本发明提供的基于半监督流形学习的多光谱图像土地利用分类方法,包括以下步 骤(1)读入多光谱遥感图像数据;(2)读入多光谱遥感图像中选取多个样本数据点,对每一个样本数据点根据其波 段生成一个向量,然后将所得向量组成矩阵,作为样本数据集;(3)根据先验知识从样本数据集中选取部分样本数据进行已知地物类别的标注, 生成样本类别标签;(4)通过样本类别标签来构建度量数据点的相似性与相异性的相似图和相异图;(5)利用热核构建相似图的权重矩阵;(6)根据样本数据集和权重矩阵来计算局部相似结构矩阵和全局相异结构矩阵;(7)通过全局相异结构矩阵和优化目标函数来计算多光谱遥感图像的投影矩阵;(8)通过投影矩阵对整幅多光谱遥感数据进行投影;(9)对投影后的整幅多光谱遥感数据用K-近邻分类算法进行分类;(10)输出多光谱遥感数据地物分类图。进一步,所述步骤O)中的训练样本集通过以下方式实现根据不同波段对地物的光谱反射特性,把多光谱遥感图像数据变为三维数据,X =Ix1, X2, ·,%XN}T,其中MXN是图像的空间尺寸,B表示波段数,矩阵的每一列表示一个波段 的数据值,每一行表示多光谱遥感图像数据中的一个点。进一步,所述步骤(3)中的样本类别标签通过以下方式实现根据先验知识从训 练样本集中选取部分样本数据进行已知地物类别的标注,生成样本类别标签X — { (X” ]_ι),(Χ。,2),·,(Xe,1。),Xc+i,Xc+2,· · ·,XmxiJ式中Ii为对数据点Xi标注的地物类别标签,前C个点具有类别信息,其余的 MXN-C个为无类别标签样本点。进一步,所述步骤(4)中的相似图和相异图包括以下步骤1)将样本数据点分成相似图( 和相异图GD,在相似图( 和相异图&的节点之间 采用k最临近方法k-NN方法定义两个图中的边;2)每一点\对Xi,若\ e knns (Xi),即每一点对(Xi,Xj),两者为近邻且相似度较 高,则用一条边连接图( 中Xi和\两点;3)若\ e knnD(Xi),即相似度较低,则用一条边连接图中Xi和\两点;式中如= {x;,^,·,xf }为点Xi的k个近邻点组成的子集,对每一点Xi,近邻数 据集krm(Xi)可以分为两部分knnD(Xi)与knns(Xi),其中knnD(Xi)表示近邻点来自于不同 类样本点,knns(Xi)则为krm(Xi)中其余部分,需要进一步说明的是,knns (Xi)中部分样本可 能不包含类别信息,但是这些样本距离Xi足够的近,krm (Xi)同knnD(Xi)和knns (Xi)之间的 关系可用下式来表示knnD (xt) = {xj | if I1 Φ Ij}Ioms(Xi) = knn (Xi) _knnD (Xi)显然,如 <Χ)η^ ^(Χ)= 0, Imns(Xi) U knnD(Xi) = knn (Xi);根据knnD (Xi)和knns (Xi),就可以构建相似图( 和相异图(^。进一步,所述步骤(5)中权重矩阵通过以下方式实现
权利要求
1.基于半监督流形学习的多光谱图像土地利用分类方法,其特征在于包括以下步骤(1)读入多光谱遥感图像数据;(2)读入多光谱遥感图像中选取多个样本数据点,对每一个样本数据点根据其波段生 成一个向量,然后将所得向量组成矩阵,作为样本数据集;(3)根据先验知识从样本数据集中选取部分样本数据进行已知地物类别的标注,生成 样本类别标签;(4)通过样本类别标签来构建度量数据点的相似性与相异性的相似图和相异图;(5)利用热核构建相似图和相异图的权重矩阵;(6)根据样本数据集和权重矩阵来计算局部相似结构矩阵和全局相异结构矩阵;(7)通过全局相异结构矩阵和优化目标函数来计算多光谱遥感图像的投影矩阵;(8)通过投影矩阵对整幅多光谱遥感数据进行投影;(9)对投影后的整幅多光谱遥感数据用K-近邻分类算法进行分类;(10)输出多光谱遥感数据地物分类图。
2.根据权利要求1所述的基于半监督流形学习的多光谱图像土地利用分类方法,其特 征在于所述步骤O)中的训练样本集通过以下方式实现根据不同波段对地物的光谱反射特性,把多光谱遥感图像数据变为MXNXB的三维数 据,Xaii = {x1 x2, ·,%ΧΝ}Τ,其中MXN是图像的空间尺寸,B表示波段数,矩阵的每一列表 示一个波段的数据值,每一行表示多光谱遥感图像数据中的一个点。
3.根据权利要求1所述的基于半监督流形学习的多光谱图像土地利用分类方法,其特 征在于所述步骤(3)中的样本类别标签通过以下方式实现根据先验知识从训练样本集 中选取部分样本数据进行已知地物类别的标注,生成样本类别标签X — { (Χι,]" ),(乂2,工2),·,(Xe,1。),Xc+i,Xc+2,· · ·,Xmxn^式中Ii为对数据点Xi标注的地物类别标签,前C个点具有类别信息,其余的MXN-C个 为无类别标签样本点,X为从整幅遥感影像中的选取的部分训练数据。
4.根据权利要求1所述的基于半监督流形学习的多光谱图像土地利用分类方法,其特 征在于所述步骤中的相似图和相异图包括以下步骤41)将样本数据点分成相似图( 和相异图(V在相似图( 和相异图的节点之间采用 k近邻方法方法定义两个图中的边;42)每一点\对Xi,若\e knns (Xi),即每一点对(Xi,Xj),则用一条边连接图( 中Xi 禾口 \两点;43)若\e knnD(Xi),则用一条边连接图中Xi和\两点;式中如/7(戈)={^,<,· 为点Xi的k个近邻点组成的子集,对每一点Xi,近邻数据集 knn(Xi)可以分为两部分knnD(Xi)与Ioms(Xi),其中knnD(Xi)表示近邻点来自于不同类样 本点,knns (Xi)则为krm(Xi)中其余部分,knn(Xi)同knnD(Xi)和knns (Xi)之间的关系可用 下式来表示knnD(xi) = {x]i\ifli ^lj)knns (Xi) = knn (Xi) _knnD (Xi)其中,Aw^(X.)nAw (X.) = 0,krms(Xi) υ knnD(Xi) =Imn(Xi); 44)根据knnD (Xi)和knns (Xi),构建相似图Gs和相异图GD。
5.根据权利要求1所述的基于半监督流形学习的多光谱图像土地利用分类方法,其特 征在于所述步骤(5)中权重矩阵通过以下方式实现权重矩阵为Wij = Ws, ^kijI 1 χ eknn^ix )or χ eknnn(x )其中,Wsii=I1 D 1 1 D 1’y 1 O 其它Aij定义如下‘ 2d (χ.,χ.) r 4 = exp(当Xi GN(Xj)^X1 εN(X1){ O其它其中d2(Xi,Xj)是从\到Xj的距离,t为常数。
6.根据权利要求1所述的基于半监督流形学习的多光谱图像土地利用分类方法,其特 征在于所述步骤(6)包括以下步骤61)计算相似局部结构矩阵Sriw根据输入的多光谱样本数据集X和权重矩阵Wu,通过下列公式计算得到相似局部结构 矩阵^w ι M xN MxNSlw = -Yj Σ WijXx1-X^(X1-XjY1 '=I J=I=XDsXt - XWsXt = X(Ds-WS)XT =XLSXT式中Ds是一个对角阵,且Ds, π =Σ Jij, Ls = Ds-Ws为Laplacian矩阵,T表示矩阵转置;Slw为奇异矩阵采取如下方式计算; Srlw — Slw+SE式中&为β ΧΕ,β表示常数,E表示单位矩阵,E = [1,. . .,1]τ ;62)计算全局相异结构矩阵Srib根据输入的多光谱样本数据集X和权重矩阵Wu,通过下式进行 Srlb — Slb+ST ; 其中ST, Slb定义如下 St = E { (Χ- μ ) (Χ-μ )Τ}CSlb=nYX μ「Μμτ μi=\式中PiS每类的均值;μ为总样本的均值;η为每类含有的样本数;C是总类别数; Srlb表示标注数据和随机选取的无标注数据的全局相异结构矩阵。
7.根据权利要求1所述的基于半监督流形学习的多光谱图像土地利用分类方法,其特 征在于所述步骤(7)投影矩阵A通过以下方式的目标优化函数来实现通过Lagrange函数A、ribAT-λ (ATSrlwAT-l)进行广义的特征值求解,然后投影矩阵A通 过下式目标优化函数获得
8.根据权利要求1所述的基于半监督流形学习的多光谱图像土地利用分类方法,其特 征在于所述步骤(8)中,通过下式进行投影 Y = AtZ ;式中Y为整幅多光谱样本数据集Z通过投影矩阵A投影到嵌入空间的数据集。
全文摘要
本发明公开了一种基于半监督流形学习的多光谱遥感数据土地利用分类方法,涉及土地利用分类的方法;将多光谱遥感数据根据其波段生成矩阵作为样本数据集;从样本数据集中选取部分样本数据,并根据先验知识标注样本类别标签,同时从样本数据集中随机选取部分样本数据作为无标记数据;构建相似图和相异图来度量数据点的相似性与相异性,并计算权重矩阵;通过优化目标函数计算得到投影矩阵;对整幅多光谱遥感数据进行投影;用K-近邻分类算法进行土地利用分类;本发明利用半监督流形学习方法,加入随机选取的无标注样本数据,通过优化目标函数计算投影矩阵,来实现提高土地利用分类的精度,同时有效节约了标注训练样本类别的成本。
文档编号G06K9/66GK102129571SQ20111003427
公开日2011年7月20日 申请日期2011年1月31日 优先权日2011年1月31日
发明者何同弟, 冯海亮, 王立志, 秦高峰, 黄鸿 申请人:重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1