面向遥感影像分类的样本自动选取方法

文档序号:6606543阅读:1549来源:国知局
专利名称:面向遥感影像分类的样本自动选取方法
技术领域
本发明涉及遥感影像处理技术及遥感影像信息提取方法,具体地说,涉及遥感影 像分类技术及其核心的样本自动选取方法,本发明适用于基于多种分类器模型的遥感影像 精确化自动分类。
背景技术
遥感影像分类是很多环境和社会经济应用的基础,因此一直是遥感研究领域的热 点之一;由于诸多因素的影响,遥感分类是一个复杂的综合过程,所以它同时也是研究的难 点。现有遥感分类方法主要集中在应用模式识别的方法,利用遥感像素的波谱信息(或者 辅以纹理等空间信息),采用距离、角度、概率等聚类准则或神经网络分类方法实现。这些 方法在处理特定的问题时都具有一定的效果,然而由于模式识别方法本身的局限性,这些 分类方法都不可避免的需要大量的人工参与,尤其是选择分类样本与指定类别等过程需要 以人工判断或者专家知识作为基础,相应的参考文献包括Tso,B. and Mather, P.M.,2001. Classification Methodsfor Remotely Sensed Data[M] · Taylor and Francis, London ; Lu,D. and Q. ffeng. 2007. A survey ofimage classification methods and techniques for improving classification performance[J]. International Journal of Remote Sensing 28(5) :823-870。针对海量的遥感数据处理要求,同时也为了突破上述缺陷,多年来,国内外学者一 直都在探求能够自动、高效地实现遥感影像解译的方法,研究思路大体分为两种一是研究 新的分类算法,如支持向量机方法、模糊数学方法等;二是将遥感的领域知识加入到机器学 习过程中,亦即将专家目视解译时用到的知识加入到计算机自动解译过程中进行综合分类 提高整个过程的智能化程度。目前讨论比较广泛的是第二种方法,如何提取分类所需的知 识,如何将知识应用于分类过程,这些都是基于知识的遥感自动分类方法设计过程中必须 考虑的问题,而目前还没有哪一种方法能得到一致的认可。相应的参考文献包括Vapnik, V and A. Vashist, Anew learning paradigm :Learning using privileged information. Neural Networks. 2009,22(5-6) :p. 544-557. Pereira, G. C. and N. F. F. Ebecken, Knowledge discovering for coastal waters classification. Expert Systems with Applications,2009. 36(4) :p.8604-8609。地物根据其波谱特性会在遥感影像的不同波段表现出不同的辐射或反射特性,如 何根据这些特征发现地学知识并合理利用是实现自动分类首先要解决的问题。国内外学者 根据不同地物的波谱特性建立了许多遥感特征指数(如NDWI,NDVI等),这是地学知识发现 与应用的重要方法之一。而光谱相似性度量可以根据波谱特性有效描述波谱数据隶属于特 定地物的程度,目前已有一些较为成熟的光谱相似性度量算法。相应的参考文献有Vander Meer, F. , Theeffectiveness of spectral similarity measures for the analysis of hyperspectral imagery. InternationalJournal of Applied Earth Observation and Geoinformation. 2006,8(1) :p. 3-17.
在众多从遥感数据中发掘地学知识或者将知识与数据结合应用的方法中,决策树 是应用比较广泛的一种方法,它具有灵活、直观、效率高等特点,其基本思想是通过一系列 判断条件(关于数据的或者知识判断的)对原始数据集逐步进行细化。应用决策树关键在 于地物类型阈值的确定,确定阈值的方法有样本观测、经验知识及基于信息熵的方法。相 应的参考文献有 Tooke, T. R. , et al. , Extracting urban vegetation characteristics using spectral mixture analysisand decision tree classifications. Remote Sensing of Environment,2009. 113(2) :p.398—407。在遥感影像的分类方法中,目前可见的专利、文献中关注于分类算法的研究较多, 而针对分类过程的自动化及其实用性方面则鲜有涉及,更没有专门考虑从选择样本这个阶 段改进分类的自动化程度。

发明内容
本发明的目的是提供一种面向遥感影像监督分类的全自动样本选择方法,重点应 用决策树方法实现地学知识的发掘与专家知识的融入,针对不同分类器的要求以及特定的 分类任务引入隶属度以自动调整样本分布,在完善自动分类流程的同时保证样本选择精 度,可以取得良好的分类效果。本发明的基本思路为从标准类别库中选择所需类别,利用自适应调整的分类决 策树完成各类样本的自动选择,从而应用各种分类器完成遥感影像的像素级分类过程。本 发明的重点在于样本自动选取过程,具体可分解为三步(1)用户在与标准决策树对应的 标准类别库中选择需要分类的类别,并根据所选类别对标准决策树进行相应剪枝形成当前 的决策树用于选择样本;(2)在影像中随机选取候选样本点,对于每个候选样本点,根据分 类决策树计算其相对于每个类别的隶属度,并根据最近的隶属关系确定其类别,形成相应 类别的样本点;(3)统计每个类别中样本点的分布关系,并进行相应的剔除和添加,使其符 合相对于隶属度的正比(或指数)分布。本发明可以选择ARTMAP、BP神经网络、支撑向量机等模式识别方法中针对多维输 入的相关分类器进行分类,这些方法是相对较为成熟,再结合本发明所提供的样本自动选 取方法,可真正实现遥感影像的自动监督分类,在实际应用中体现更大的优势。本发明的技术方案提供了遥感影像全自动分类的实现方法,包括以下的实施步 骤 1)根据指数知识和波谱知识建立标准决策树,预设相应的标准类别库;2)从预设的标准类别库中选定针对当前影像所需的类别,并根据选定的类别对标 准决策树进行剪枝,形成对应的分类决策树;3)从影像中随机选取一个候选样本点,依据分类决策树每一层级的判断指标确定 该候选样本点对应于每个类别的隶属度,并根据最近的隶属关系确定其类别,作为该类别 的样本点;4)对于每个类别,统计其相应于隶属度值的分布情况,按照与隶属度成正比(或 指数关系)的分布原则,剔除多余样本,或者补足缺失样本;5)重复步骤3),直至所选样本满足步骤4)中的统计要求;6)每个类别都达到相应的样本分布要求和数量时,以样本对应的全部波段值作为多维输入,选择合适的分类器,进行样本的训练,并对影像进行分类,形成最终的分类图;上述实施步骤的特征在于步骤1)中标准库和标准决策树的建立需要参考波谱知识和经验知识,如水体指 数可以作为对水体的评判准则,而植被指数则可以用作对植被的评判准则,因此标准决策 树的建立也意味着标准类别库的形成,每一种标准类别都是标准决策树中的一个叶子节 点。上述各种评判准则的阈值根据经验知识初步确定,并在后续根据实际分类影像进行自 适应调整;步骤2)需对标准决策树进行适当的剪枝即形成仅包含当前类别的子决策树,同 时针对当前影像对评判准则的阈值进行自适应调整;步骤3)是根据分类决策树确定当前影像中随机候选样本点的类别,类型通过计 算隶属度来判别,隶属度则由指数知识和地物波谱知识来确定,符合遥感机理并且采用定 量化计算方法,从而更精确地获取样本;步骤4)根据每个类型中样本的隶属度值统计并确定样本的分布关系,根据分类 器的特点,可以使用不同的样本分布策略,一般来讲,样本数量应按照隶属度从大到小呈递 减的分布,从而保证分类过程中在区分大类的同时,能够有一定数量的参考样本来辨别存 在于各个类型之间的临界区域中的像素点;步骤5)、步骤6)确定所选样本已符合分类的数量和分布后,可选择多种分类器进 行分类,所选分类器需支持多维输入,输出为表示类别的标号值;由于本方法选择的样本可 以是对应于每个类别的隶属度,因此也可由模糊分类器进行分类,分类结果为对应于每个 类别的隶属度向量。本发明与现有技术相比具有如下特点能够充分发掘遥感和地学知识以及专家经 验知识,并加以形式化地表达来指导样本的定量化计算,从而自动地确定类型,同时根据所 选样本的统计信息,自动确定样本的分布和数量,使知识的应用更为有效,自动选择的样本 不仅准确而且具有较广泛的代表性。本发明实现了监督分类的自动化和精确化,还可以充 分发挥监督分类器(如支持向量机、神经网络模型)在不同分类要求中的优势,达到有机结 合的目的,提高了分类的精度以及自动化程度。


图1是遥感影像自动分类流程示意2是自动剪枝生成当前决策树示意3是决策树及样本隶属度判别示例4是波谱角示意5是污水反射率曲线6是某一类别的“隶属度_样本数量”曲线分布7是某一类别的样本规整流程图
具体实施例方式图1为遥感影像自动分类方法的示意图,一共包含6个处理单元,其中C、D、E和F 组成的样本自动选取为本发明的关键环节。开始分类之前首先需要对原始的遥感影像进行预处理(处理单元A),主要包括几何校正、辐射校正等工作,接下来的自动选择样本工作过 程如下首先需要确定当前影像应该分为哪几类(处理单元B),这是监督分类的基本要 求。本发明采用从预设类别库中选择的方法(如图2所示),预设类别库相当于标准决策树 的所有叶子节点,亦即根据标准决策树对预设类别库中的所有类别进行分类。虽然标准决 策树的建立是自动分类的前期工作,但它对分类结果的影响深远,因此有必要对其进行分 析和介绍。标准决策树根据地物标准波谱数据辅以地学专家知识(也可完全依据专家经验 知识)而生成,除了使用积分波段值以外,还延伸使用一系列的指数作为决策树判别准则, 主要有归一化雪被指数(NDSI),其计算公式如下 归一化差异水体指数(NDWI),其计算公式如下 归一化差异植被指数(NDVI),其计算公式如下 陆表水指数(LSWI),其计算公式如下 上述公式中,Geeen代表绿色波段,Mie代表中红外波段,Nie代表近红外波段,Red代 表红色波段,Swik代表短波红外波段。图3所示为标准决策树一个子集的示例,由于通过指数和波段值的判别能很好地 区分地物的大类,因此被用于进行粗分类。根据经验指标的判别,即可确定水体、冰雪、云 层、湿地、植被、其他等几个大类。进一步的小类则需依赖业已测定的地物波谱库来确定,具 体方法见后续说明。建立标准类别库和对应的标准分类决策树后,为了获得与当前分类类别所匹配的 子决策树,我们还需要对上述标准决策树进行自动剪枝处理(图1的处理单元C)。不同于 一般的决策树后剪枝算法,在此我们已经确定需要裁剪的叶子节点,因此处理相对简单,剪 枝的原则是保留所选定类别的叶子节点,将其他叶子节点相关的分叉剪除。确定了类型和相应的决策树后,即可在影像中随机选取候选样本点,根据图3所 示的决策树计算其相对于各个选定类别的隶属度值(图1的处理单元D)。具体计算方法如 下在决策树的每个分叉处都有一定的范围约束,利用此范围即可定义出对应类别的 隶属度,需要说明的是,本发明对于隶属度的计算只在确定叶子节点的那个分叉进行,其他 分叉只用于区分大的类别。以区分水体和冰雪的分叉为例,依据NDWI值,它确定了两个子 类别,其中约束水体的指标为NDWI > 0. 4 (经验值),定义其隶属度Subwatw如下 当NDWI值大于0. 4时,其隶属度随着NDWI值的增大呈线性增大;而当NDWI值小 于等于0.4时,其隶属度则随着NDWI值的减小呈指数减小。δ则由上一级的分叉决定,属 于本分枝时(NDSI>0.3)则给予较大的因子1.0,否则给予较小的因子0.1。由以上公式 确定的隶属度即定义了水体的隶属度值,其他类型也可根据指数值进行相应的定义。以上只针对指数值进行了隶属度的定义,它只适用于几个大类的隶属度计算,对 于更细的小类,则需借助于现有的典型地物波谱库来完成。具体实现方式如下图4所示为一般的波谱角计算方法,图4 (a)为两种地物在二维空间(两个波段) 上的光谱角示意,若S为标准地物波谱在二维空间上的波段矢量,而S’为测试样本的相应 波段矢量,那么SAM即为它们的波谱夹角,并且其大小可以表征两者的相似程度。将其扩展 到多维空间,如图4 (b)所示为某一地物在η维空间中的表示,其中横坐标为波段值,纵坐标 为对应的反射率,S1, S2. . . Sn分别表示该地物在相应中心波段值上的反射率积分值,现假设 S= (R1, R2, R3... Rn)、S' = (R' i;R' 2,R' 3. . . R' n)分别为标准地物的波谱矢量和候 选样本的波谱矢量,则根据如下公式可以计算候选样本与某一标准地物光谱的相似性,以 波谱夹角的反余弦函数表征 针对某一类地物,选取相应的若干条波谱数据,按照遥感数据的波段配置计算波 谱积分值后,形成各自的波谱向量,再与候选样本的光谱向量一一计算波谱角,并取其最小 值,即作为候选样本对应于该类地物的隶属度值。例如,对于污水,本发明选取了 USGS发布 的全球地物波谱数据库中的 water_mont_mix_a. 27273、water_mont_mix_a. 27299、water_ mont_mix_a. 27324、water_mont_mix_a. 27348四条波谱数据作为基准指标(如图5),遥感 数据选用ETM影像的1-6波段数据。首先对以上四条波谱数据分别在0. 45-0. 52 μ m(蓝 波段)、0· 52-0. 60 μ m(绿波段)、0· 62-0. 69 μ m(红波段)、0· 76-0. 96 μ m(近红外波段)、 1. 04-1. 25 μ m(远红外波段)、1. 55-1. 75 μ m(中红外波段)六个波段范围内进行反射率积 分,分别获得六维的波谱积分向量;然后取候选样本点在六个波段上的反射率值(或者DN 值)作为其光谱向量;计算两者向量的波谱角,并对其在W,l]范围内进行归一化,即可作 为该样本点对污水的隶属度。将以上基于指数和基于波谱角的隶属度相结合,即可一一计算候选样本点相对于 每个选中类型的隶属度值,取它们的最大值,即可取得其所属类别。重复计算单个样本的步 骤,即获得每个类别上的样本集合,需对其进行数量和分布的规整(图1的处理单元E),本 发明按照以下方式进行规整。对于每个类别,其样本的分布要求由以下公式确定Num = α · e10.Sub其中Sub表示隶属度,Num表示了分类所需的隶属度为Sub的样本个数,α作为调 整该类别样本总数的一个限定参数。
具体调整样本分布的算法如图7所示,描述如下①对于某一类别的样本,在
区间内将Sub值等分为10个区间W,0. 1],
,…,
;②分别取以上区间的中间值Sub = 0. 05,0. 15,0. 25. ... ,0. 95来计算Num值(取
整)作为该区间内所需的样本个数,此处α可取一个合适的常整数;③对于每一个隶属度区间,在当前随机获得的该类样本集合中按照隶属度值均勻 分布的原则选取所需数量的样本,并且剔除多余的样本,对于样本数量不足的区间,则不考 虑均勻分布的原则而以保证样本数量为优先考虑原则;④若最高三个隶属度区间内的样本数量尚未满足所需数量的一半,则再进行随机 样本选取,或者遍历部分影像,以搜集获得足够的样本点,并跳至③;⑤若还未满足数量要求,则调低α值,再次进行调整计算,跳至②;否则算法结
束ο此算法的优点在于既保证了最能表征每个类别的样本点占有多数,从而使分类尽 量准确;同时又保留了隶属度相对较低的那些样本点,从而使介于各个类型之间的那些模 糊像素点得以区分。至此,对应于选中的每个类型,都已选定了满足数量和分布要求的样本点集合,随 后我们按照一般的“样本预处理_机器学习_机器分类”的步骤,对影像进行分类,并获取 最终的分类图。本发明所选取的样本,可应用于目前流行的各种支持多维输入的分类器进 行分类,具有一定的普适性。本发明的实例在PC平台上实现,经实验证明,本发明能在遥感影像监督分类中实 现了智能和自动地选取样本,并且分类精度与常规人工的分类方法大体相当,使其真正达 到了自动化水平。本发明中所提及方法可用于遥感影像像素级分类相关的大规模应用领域 中,在保证分类精度的前提下,改善其自动化程度,提高工作效率,节省人力,如第二次全国 土地资源调查等大型应用。
权利要求
一种遥感影像全自动样本选择的实现方法,其特征在于包括以下的实施步骤步骤1,根据指数知识和波谱知识建立标准决策树,预设相应的标准类别库;步骤2,从预设的标准类别库中选定针对当前影像所需的类别,并根据选定的类别对标准决策树进行剪枝,形成对应的分类决策树;步骤3,从影像中随机选取一个候选样本点,依据分类决策树每一层级的判断指标确定该候选样本点对应于每个类别的隶属度,并根据最近的隶属关系确定其类别,作为该类别的样本点;步骤4,对于每个类别,统计其相应于隶属度值的分布情况,按照与隶属度成正比(或指数关系)的分布原则,剔除多余样本,或者补足缺失样本;步骤5,重复步骤3,直至所选样本满足步骤4中的统计要求;步骤6,每个类别都达到符合相应的样本分布要求和数量时,以样本对应的全部波段值作为多维输入,选择合适的分类器,进行样本的训练,并对影像进行分类,形成最终的分类图。
2.根据权利要求1所述的自动样本选择方法,其特征在于标准决策树的建立需参考各 种地学知识和经验知识,同时其叶子节点与标准类别库相对应,各种评判标准的阈值确定 根据经验知识初步确定,并在后续根据实际分类影像进行自适应调整,而用于分类样本选 择的决策树在上述标准决策树上进行相应剪枝而自动生成,无须人工干预。
3.根据权利要求1所述的自动样本选择方法,其特征在于随机候选样本点的类型通过 计算隶属度来判别,隶属度则由指数知识和地物波谱知识来确定,同时结合对样本分布的 调整以方便与特定的分类器有效结合或满足特定的分类要求。
全文摘要
本发明提供一种面向遥感影像监督分类过程的全自动样本选择方法,属于计算机遥感影像信息处理技术领域。该方法主要应用决策树方法实现地学知识与专家知识的融入并以此自动选择样本,首先根据各种指数、波谱及经验知识建立标准决策树,然后自动剪枝并形成针对当前影像的分类决策树,再采用此分类树自动选择样本,同时针对不同分类器的要求或特定的分类任务引入隶属度以自动调整候选样本分布,在完善自动分类流程的同时保证样本选择精度,最终配合监督分类可以取得良好的分类效果。
文档编号G06K9/62GK101894270SQ201010236399
公开日2010年11月24日 申请日期2010年7月26日 优先权日2010年7月26日
发明者夏列钢, 沈占锋, 程熙, 胡晓东, 郜丽静, 骆剑承 申请人:中国科学院遥感应用研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1