一种基于代价敏感支持向量机的遥感图像自动解译方法

文档序号:6402957阅读:932来源:国知局
专利名称:一种基于代价敏感支持向量机的遥感图像自动解译方法
技术领域
本发明涉及机器学习在遥感图像自动解译领域中的应用,尤其是涉及到费舍尔线性判别式分析,代价敏感支持向量机,择多滤波器等方法。
背景技术
遥感是指在不和目标接触的情况下,对目标进行探测和感知的一种新兴技术。可以从多种不同的平台上,比如飞机、卫星、航天飞机和宇宙飞船上,通过对地面反射和辐射的电磁波进行探测和感知,然后对获取的信息进行处理和分析,实现对地面资源和环境的探测和监控。自从20世纪60年代以来,随着电子技术、航空航天技术、传感器基础、控制技术、计算机技术和通讯技术的发展,卫星遥感图像技术得到的长足的发展和进步。遥感图像具尺度大,不受自然和交通条件限制等优势,是探测地物信息的最直观,最丰富的载体。多光谱遥感图像是传统的遥感地质应用的数据源,主要有低分辨率遥感图像(如LandsatMSS、SPOT、ASTER 等)和高分辨率遥感图像(IK0N0S、QuickBird 或者 World-View 等)。如何从海量的遥感图像信息中及时、准确的获取信息并加以利用,一直是亟待解决的问题。发明内容


结合随后的附图,从下面的详细说明中可显而易见的得出本发明的上述及其他目的、特征及优点。在附图中:
图1给出了二维空间内的支持向量机示意图2给出了遥感图像自动解译流程图。
图3给出了不同地物类别的数据样本分布图。
图4给出了第一维特征的数据分布图。
图5给出了第二维特征的数据分布图。
图6给出了第三维特征的数据分布图。
图7给出了第四维特征的数据分布图。
图8给出了第五维特征的数据分布图。
图9给出了第六维特征的数据分布图。
图10给出了分类结果的混淆矩阵
图11给出了源数据对应的遥感图像
图12给出了自动解译后的遥感图像具体实施方式
为了更全面地理 解本发明及其优点,下面结合附图及具体实施例对本发明做进一步详细地说明。
为了便于清楚理解起见,首先对本发明相关的工业技术背景和数据处理的理论与方法进行简单地介绍。
(一 )遥感图像自动解译的相关技术和流程
遥感图像自动解译是指采用自动的分类算法对遥感图像中的像元进行分类。首先需要对数据进行预处理,去除不合理的特征值,补全缺失的值,再对数据的特征进行降维,使得不同类的数据样本尽可能的分隔开,同时降低计算复杂度。然后使用支持向量机进行分类,因为不同类别下的数据样本的分布极不均衡,我们使用代价敏感支持向量机来赋予稀有类的训练样本更高的权重值,提高稀有类的召回率。因为数据的地物类型有九种,而传统的支持向量机只能解决二分类问题,所以使用一对多方法来组合多个二分类支持向量构成一个多类别分类器。最后使用择多滤波器来对分类后的数据进行平滑和过滤,去除噪音点,提高分类的准确率。
( 二 )数据处理的理论与方法
基于数据的理论和方法是指从数据中分析和挖掘出知识的方法。基于数据的理论方法包括知识发现,机器学习,统计分析,模式识别和人工智能等领域的方法,如有监督学习,无监督学习,强化学习,主动学习等。本发明主要用到了费舍尔线性判别式分析,代价敏感支持向量机和择多滤波器等。
本发明使用的数据挖掘过程主要分三个阶段:基于费舍尔线性判别式分析的特征降维,基于代价敏感支持向量机的分类和择多滤波器,总而对高分辨率遥感图像中的像元进行分类,实现遥感图像的自动解译。
下面对本发明进行详细说明。
本发明的数据分析处理方法包括如下步骤:
步骤A:数据预处理与特征降维
由于获取数据的过程中存在不可避免的或人为地偏差,部分数据不能反映真实情况,或者需要通过合理的假设简化分析,选取对系统优化有重要影响的参数,同时降低数据中偶然因素的影响,需要在对数据进行分析挖掘前预处理。
步骤Al:数据预处理
在对遥感图像数据进行观察后,我们发现部分记录的特征值缺失。对于缺失值,我们使用改数据记录所属的地物类别下的所有该特征的特征值的平均值来进行缺失值的预测。
步骤A2:特征降维
对源数据进行特征降维,既可以降低数据的特征维数,减少运算量,也可以去除有噪声的特征,提高之后分类的准确率。我们使用费舍尔线性判别式分析来对遥感数据进行降维,费舍尔线性判别式分析是一种有监督的数据降维方法,把源数据投射到能够将不同类别的数据样本尽可能分开的低维空间上。
步骤B:基于代价敏感支持向量机的像元分类
支持向量机是20世纪90年代中期Vapnik等人为了解决小样本学习问题所建立的统计学习理论的基本体系。该理论首先放弃了估计概率密度函数的思路,认为应该在分类中直接构造分类超平面,为了克服过拟合问题,提出了结构风险最小化原理,强调需要在学习过程中根据样本的情况自适应的选取适当复杂的分类函数。1995年,Corte和Vapnik提出了支持向量机算法。核心思想是把样本通过核函数非线性的映射到高维的特征空间当中,然后以结构风险最小化原理为原则,在高维特征空间中构造VC维尽可能低的分类超平面作为分类面,从而使得分类器具有比较好的泛化能力。
由于统计学习理论具有完备的理论体系和坚实的数学基础,以及支持向量机算法的强大的泛化能力,该理论和支持向量机算法在模式识别,机器学习以及其他领域当中受到了极大地重视,在手写体识别、文本识别和人脸识别等实际运用当中也获得了很大的成功。
步骤BI基于支持向量机的遥感图像自动解译
我们需要识别每个像元的地物类别,源数据中的像元分属9个类别,类别数不是很多,我们使用支持向量机来进行分类。我们使用由台湾大学林智仁开发的LIBSVM来对遥感图像进行自动解译。
步骤B2使用代价敏感支持向量机解决不平衡分类问题
通过统计我们得知不同地物类别的像元数量相差很大。为了解决这种不平衡分类问题,我们使用代价敏感支持向量机来对遥感图像数据进行自动解译。
我们赋予稀有类的数据样本更高的错误分类代价来使得代价敏感支持向量机能够更加重视这些稀有类的分类召回率。
步骤B3使用一对多方法来解决支持向量机的多类别分类问题
传统的支持向量机只能进行二分类,而我们的遥感图像的像元属于九个地物类另IJ。为了能够使得支持向量机解决多类别分类问题,我们采用一对多方法来组合多个(九个)二分类支持向量机,二分类支持向量机Si都把每个数据样本分类为Ci和非Ci。最后在进行分类时,我们对每个数据样本,选取其分类间隔最大的那个二分类支持向量机所代表的类别作为该数据样本的分类类别。
分类的结果为:
准确率-召回 率:
权利要求
1.一种基于代价敏感支持向量机的遥感图像自动解译算法,具体的步骤包括: A、基于费舍尔线性判别式分析的特征降维; B、基于代价敏感支持向量机的分类; C、基于择多滤波器的分类结果后处理。
2.根据权利请求I中的步骤A,其具体步骤包括如下内容: 步骤Al:对遥感图像数据的预处理,去除非法数据,如空值数据,负值数据等,补全缺失数据; 步骤A2:对预处理后的遥感图像数据进行特征处理,使用费舍尔线性判别式分析进行特征降维,使得不同类的数据样本尽可能的分开,既能够有利于提高之后分类的准确性,也可以降低数据的维度,减少训练和预测时间。
3.根据权利请求I中的步骤B,其具体步骤包括如下内容: 步骤B1:使用支持向量机进行遥感图像的自动解译。提取像元的六个波段值作为特征,不同的地物类型作为标号,然后使用支持向量机进行训练和分类; 步骤B2:训练数据中不同类别下的数据样本的数量相差很大(见图3)。为了解决这种不平衡分类问题,我们赋予稀有类以更高的分类惩罚权重,使用代价敏感支持向量机来提闻稀有类的召回率,提闻整体的解译效果; 步骤B3:训练数据中的地物类型有9种,传统的支持向量机只能进行二分类,为了使用支持向量机对多类别的遥感图像进行自动解译,我们采用一对多方法来组合多个二分类支持向量机,使其能够进行多类别的分类。
4.根据权利请求I中的步骤C,其具体步骤包括如下内容: 步骤Cl:对支持向量机的分类结果进行平滑和过滤。基于像元的分类方法只考虑当前像元的分类,而不考虑其周围像元的分类结果,导致分类后的结果存在很多噪声,不够平滑,我们使用择多滤波器对分类后的结果进行平滑和去除噪声,使得某一个像元的分类类别为其周围固定大小 窗口内的数量大于某个阀值的地物类别。
全文摘要
本发明属于遥感图像解译领域基于机器学习对遥感图像进行自动解译的一种方法,具体为基于费舍尔线性判别式的数据降维,基于代价敏感支持向量机的分类,和基于择多滤波器的数据后处理,实现对海量遥感数据的精确自动解译。该方法的步骤为首先通过费舍尔线性判别式对遥感图像的波段特征进行降维,既能够使得不同类的数据样本尽可能的分开,也可以降低数据样本的特征维数,减少运算量。然后使用支持向量机进行遥感图像的自动解译,我们使用代价敏感支持向量机来提高稀有类的分类惩罚权重。最后我们使用择多滤波器对分类后的数据进行过滤和平滑,去除分类结果中的噪声。
文档编号G06K9/54GK103218625SQ201310170288
公开日2013年7月24日 申请日期2013年5月10日 优先权日2013年5月10日
发明者陆嘉恒, 潘军伟, 何乐, 王晨, 陶波 申请人:陆嘉恒
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1