一种遥感图像样本智能采集方法

文档序号:6548084阅读:1220来源:国知局
一种遥感图像样本智能采集方法
【专利摘要】本发明提供一种遥感图像样本智能采集方法。该样本采集方法能够有效的选择图像分类所需要的样本集合,降低样本采集的时间和金钱成本。该方法包括以下步骤:对于待分类的遥感图像,首先由用户随机标记少量的样本;用这些少量的样本对图像先进行图像分类;将分类结果转换为各类别的概率;选取图像中最有信息量的一组未标记样本;由用户对这组未标记的样本集合进行类别标记;新标记的样本集合与已有的样本集组成新的样本集;使用新的样本集对图像重新进行训练;迭代进行上述过程;当满足一定的条件时,迭代停止,得到一组样本。
【专利说明】一种遥感图像样本智能采集方法
【技术领域】
[0001]本发明涉及遥感图像处理技术,具体的说,涉及一种遥感图像样本智能采集方法,该样本采集方法能够极大降低图像分类所需要的样本数目,从而降低样本采集的成本。
【背景技术】
[0002]遥感技术在很多领域得到广泛应用,如森林资源规划、农作物估产、环境监测等。遥感图像分类技术是把遥感图像从数据转换为信息的关键步骤。从是否需要训练样本来分,遥感图像分类方法分为监督分类和非监督分类。在遥感图像分类中最常用的是监督分类方法。监督分类方法,需要人工地确定分类体系、各个类别的训练样本等。对监督分类方法而言,在分类器已经确定的情况下,分类效果的好坏很大程度上取决于训练样本的数量与质量。
[0003]目前遥感图像分类中样本采集的方法主要包括,随机采样和分层采样。随机采样是指随机地在整幅图像上选取一些点,然后去实地或者通过图像解译确定这些点的类别信息。随机采样的最大优点在于其统计上和参数估计上的简易性。当图像中某些类别占的数量较少时,随机采样往往会丢掉这些类别。为了保证每个类别都能在采样中出现,可以采用分层采样,即分别对每个类别进行随机采样。上述两种样本采集策略的主要缺点是:不能确定获得满意的分类效果需要多少数目的样本;不知道在已有数量样本的情况下能否获得好的分类效果。基本上可以认为,我们只是这样设计了样本采集的原则(可能耗费了很大的时间和金钱成本),但是能获得什么样的分类效果,只能听“天”由命了。并且,这种样本采集策略都是在图像分类之前完成的。
[0004]本专利提出了一种新型的遥感图像样本采集方法;针对遥感图像处理领域样本采集费时费力等特点,本专利提出了一种能够在分类过程中通过目前的分类结果预测出类别信息非常模糊的样本,然后由样本采集人员对这些样本点进行类别标记,形成更新后的训练样本集,并进行重新分类的样本采集方法。这种样本采集方法是一种迭代的过程,能够在初始有极少量样本的情况下,始终选择对分类最有效的样本集,避免了过多冗余样本的采集,从而很大程度上减少了样本采集的总量,进而降低样本采集的时间和金钱成本。

【发明内容】

[0005]本发明的目的是提供一种遥感图像样本智能采集方法。
[0006]本发明的基本思路为:对于待分类的遥感图像,首先由用户随机标记少量的样本;用这些少量的样本对图像先进行图像分类;依据某种准则,选取图像中分类效果最不准确的一组未标记的样本点;由用户对这组未标记的样本集合进行类别标记;新标记的样本集合与已有的样本集组成新的样本集;使用新的样本集对图像重新进行训练;迭代进行上述过程,得到一组样本。
[0007]本发明的技术方案提供的一种遥感图像样本智能采集的方法,其特征在于包括以下实施步骤:[0008]A对于待分类的遥感图像,首先由用户随机标记少量的样本;
[0009]B使用已有的样本集对图像进行训练,并使用分类器对图像进行分类;
[0010]C对步骤B中每个像素的分类结果转换为各类别的概率;
[0011]D对步骤C中每个像素的类别概率,按照从小到大升序排列;
[0012]E求取步骤D中计算出的每个像素最小的一组(小于类别数目)概率,并求和;
[0013]F对步骤E中每个像素最小的一组概率分别求和之后,对求和的值进行按照从小到大进行顺序排列;并选择出求和值最小的一组像素,作为未标记的样本;
[0014]G由用户对步骤F中获得的一组未标记样本进行样本标记,与步骤A中的样本组成新的样本集合;
[0015]H重复步骤B-步骤G,直到获得足够多的样本集合。
[0016]上述实施步骤的特征在于: [0017]步骤A中待分类的遥感图像主要是指光学图像数据;用户首先对待分类的遥感图像,确认好分类体系,确认总共有几个类别,假设为K个类别;对1(个类别中的每一个类别首先选定少量(少于10个)样本;样本确认可以通过图像解译的方式或者实地样本采集的方式。
[0018]步骤B中所述的选用分类器进行分类,是指选用遥感图像分类中常用分类器,如最大似然分类器、支持向量机分类器等。
[0019]步骤C中所述的每个像素的分类结果转换为各类别的概率,是对某像素X,计算出其属于K个类别中各个类别的概率;对于某些分类器,如最大似然分类器,分类结果中就有属于各个类别的概率;而对于另一些分类器,如支持向量机分类器,分类结果并不直接输出各个类别的概率,需要通过一些计算过程把支持向量机输出结果转换为各个类别的概率。
[0020]步骤D是指,对于任意像素X,对应K个类别的概率按照从小到大进行排列,记为P(k),k = 1,...,K,并且 P (I) < P(2) <...< P(K)。
[0021]步骤E是指,对任意像素X,计算最小的c个概率的和
【权利要求】
1.一种遥感图像样本智能采集方法,其特征在于包括以下步骤: A对于待分类的遥感图像,首先由用户随机标记少量的样本; B使用已有的样本集对图像进行训练,并使用分类器对图像进行分类; C对步骤B中每个像素的分类结果转换为分类各类别的概率; D对步骤C中每个像素的分类类别概率,按照从小到大升序排列; E求取步骤D中计算出的每个像素最小的一组(小于类别数目)概率,并求和; F对步骤E中每个像素最小的一组概率分别求和之后,对求和的值进行按照从小到大进行顺序排列;并选择出求和值最小的一组像素,作为未标记的样本; G由用户对步骤F中获得的一组未标记样本进行样本标记,与步骤A中的样本组成新的样本集合; H重复步骤B-步骤G,直到获得足够多的样本集合。
2.根据权利要求1所述的方法,其特征在于步骤A中每个类别的样本数目少于10个。
3.根据权利要求1所述的方法,其特征在于步骤D中各个像素的类别概率按照从小到大升序排列。
4.根据权利要求1所述的方法,其特征在于步骤E中最小的一组的数目c的取值范围为,I < c < K/2,且为整数,K为分类的类别数目。
5.根据权利要求1所述的方法,其特征在于步骤F中对求取的最小的一组概率进行求和。
6.根据权利要求1所述的方法,其特征在于步骤F中对求取的概率之和最小的一组像素作为未标记的样本。
7.根据权利要求1所述的方法,其特征在于步骤G中用户对步骤F中所选的未标记样本进行类别属性的标记,标记方式为通过图像解译或通过实地样本采集进行类别属性的确认。
【文档编号】G06K9/66GK103984960SQ201410235129
【公开日】2014年8月13日 申请日期:2014年5月30日 优先权日:2014年5月30日
【发明者】霍连志, 赵理君, 李腾, 周增光, 胡昌苗, 郑柯 申请人:中国科学院遥感与数字地球研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1