基于直线单词的高空间分辨率遥感图像词袋分类方法

文档序号：6350579阅读：779来源：国知局

专利名称：基于直线单词的高空间分辨率遥感图像词袋分类方法
技术领域：
本发明涉及一种遥感图像分类方法，具体涉及一种基于直线单词的高空间分辨率遥感图像词袋分类方法，属于遥感图像处理与信息提取领域。
背景技术：
遥感图像分类是遥感图像信息提取的重要任务。伴随着高空间分辨率遥感图像的出现与广泛应用，遥感图像可以提供的地物空间结构信息和表层纹理信息越来越详细，地物边缘也更为清晰。一方面丰富的地物细节信息提升了遥感图像在地物监测、规划、管理等方面的作用，但同时高空间分辨率遥感图像使得地物之间的“同物异谱”和“同谱异物”现象变得更为普遍，遥感图像所能反映的地物类别信息也越来越多，越来越难以区分。这些难点的出现，使得许多传统的分类方法难以适用。面向对象的图像分类方法为高空间分辨率遥感图像分类提供了可行方案。面向对象图像分类方法的优点在于其处理的对象从像元过渡到了特征像元集的对象层次，在可以参与后续分析的特征数量上更为丰富，且更接近人们观测数据的思维逻辑，因此，也更易于地学知识融合。此外，该分类方法在解决常规图像分类时的椒盐噪声效应、结果的可解释性上有很大优势。基于以上优点，面向对象的遥感图像分类方法已成为遥感图像处理与信息提取领域的研究热点。目前常见的面向对象分类的实现过程主要依据特征距离，即根据模式在特征空间中的距离远近判断其相似性程度，从而实现模式分类。然而高空间分辨率遥感图像具有突出的异物同谱现象，许多地物仅依据特征距离往往难以相互区分。如在正射航空图像上，大型建筑物的屋顶和停车场就有可能因为在色调和纹理上非常接近而难以区别。而人区分此类地物的一个重要依据是停车场停泊了许多车辆。这在中低分辨率图像上被淹没的对象内部信息，有可能是实现高分辨率遥感图像分类的重要线索，问题的关键在于如何在高分辨率遥感图像分类中应用上类似于此的分类线索。"Bag of wordS(B0W)”，即词袋模型，最早出现于自然语言处理和文本分类领域。在词袋模型中，文本(包括句子或者文档)被描述为一些无序的单词的集合而忽略了文本的单词顺序和语义信息。通过对已知的文本提取关键字，并将关键字形成词表 (vocabulary)，对于待分类文本，就可在形成的词表中查找关键字，并根据关键字实现分类。这是一种简单但有效的文本分类方法。后来研究人员将其引入计算机视觉领域，形成所谓 “Bag of visual words (BOV) ” 或 “Bag of features (BOF) ” 模型，即把图像看作“文档”，图像的特征形成单词，采用类似文本分类的词袋模型的方式实现图像的分类识别。词袋模型的分类实现过程涉及到特征检测和特征描述、视觉词汇表构建、视觉单词直方图构建、选择某种分类器分类等多个环节。其中，特征检测是在图像上提取用于特征描述的斑块(patch)，采用的方法如稠密的随机块采样和稀疏的兴趣点采样。特征描述为对采样位置处的全局或局部视觉特征进行描述，形成可用于计算机处理的特征。视觉词汇表构建，是利用聚类算法获取所提取特征的聚类中心，并以此作为单词划分的依据。视觉单词直方图构建是利用视觉词汇表，将每幅图像的特征量化为若干视觉单词，并生成每幅图像的视觉单词直方图。最后，选择一种分类器，利用图像的视觉单词直方图作为特征完成图像分类过程。常用的分类器包括最近邻分类、朴素贝叶斯分类等等。Jean-Baptiste Bordes ^A^t ((British Machine Vision Conference)) 2008 期干丨J上发表的“Mixture Distributions for Weakly Supervised Classification in Remote Sensing Images”中提出在词袋模型的基础上引入图像的空间方位信息，并且建立概率模型，该方法利用SIFT局部特征点来建立词袋模型，通过EM算法来建立概率模型，将 Quickbird全色图像划分为温室、工地、高建筑区、居民区、小工业区、高尔夫球场、钓鱼场和胡同8类。但是该分类方法只是对图像进行均勻分块，在块的基础上进行分类，对地物的形态并不能很好的进行描述，同时，该文使用的SIFT点特征不适用于遥感图像中的均值稳定区域。陶超等人在《测绘学报》2010年第40卷第2期发表的“一种基于概率潜在语义模型的高分辨率遥感图像分类方法”论文中，将文本分析中的概率潜在语义模型应用于高分辨率遥感图像分类，提出一种非监督的遥感图像分类新方法。该方法首先利用均值漂移分割方法对图像进行分割，构建图像区域集合，然后提取集合各区域中每个像元的Gabor纹理特征，并对这些特征进行聚类形成视觉单词直方图，最后利用概率潜在语义模型对各区域进行分析，找出其最可能属于的主题或者类别，从而完成图像分类。该文利用一种非监督的遥感图像分类方法来对图像进行分类，同时，文章使用了 Gabor纹理特征来构建词袋特征。

发明内容
现有的图像词袋分类模型一般均使用点特征形成单词，而后统计点的出现频率，形成视觉单词直方图，但点特征容易受噪声影响，同时点特征对地物的描述力度不够。本发明提供一种遥感图像的分类方法，能够提高特征的稳定性及特征对地物的区分力度，获得更好的高空间分辨率遥感图像分类效果。为实现上述发明目的，本发明方法采用的技术方案如下基于直线单词的高空间分辨率遥感图像词袋分类方法，包括以下两个阶段第一阶段训练阶段，采取如下步骤，第一步，提取训练图像的直线特征，并在此基础上计算直线的特征向量(a)利用基于相位编组提取图像中直线的方法获取训练图像的相位直线；(b)计算直线的特征向量，获取直线的密度、长度、长度熵、角度、角度熵、对比度、对比度熵、颜色特征的均值和方差的特征向量；直线密度为以所述直线中点为中心的nXn的窗口内的直线的条数，记为N;直线长度的计算公式如下
权利要求
1.基于直线单词的高空间分辨率遥感图像词袋分类方法，其特征在于，所述方法包括以下两个阶段第一阶段训练阶段，采取如下步骤，第一步，提取训练图像的直线特征，并在此基础上计算直线的特征向量(a)利用基于相位编组提取图像中直线的方法获取训练图像的相位直线；(b)计算直线的特征向量，获取直线的密度、长度、长度熵、角度、角度熵、对比度、对比度熵、颜色特征的均值和方差的特征向量；直线密度为以所述直线中点为中心的nXn的窗口内的直线的条数，记为N ；直线长度的计算公式如下
全文摘要
本发明公开了一种基于直线单词的高空间分辨率遥感图像词袋分类方法。先将待分类图像划分为训练样本和分类样本，对于训练样本的步骤提取训练图像的直线特征并计算直线的特征向量；利用K-Means++算法聚类生成直线视觉词汇表；对训练图像进行分割，在此基础上获取各分割斑块的直线视觉单词直方图；对斑块进行类别标注，并将类别、直线视觉单词直方图存储入库。样本训练后，对于分类样本的步骤提取待分类图像的直线特征；对待分类图像进行分割，在此基础上计算直线的特征向量，并获取各斑块的直线视觉单词直方图；选取SVM分类器对待分类图像进行分类，获得分类结果。本方法利用直线特征建立词袋模型，能够获得更好的高空间分辨率遥感图像分类效果。
文档编号G06K9/66GK102496034SQ20111038635
公开日2012年6月13日申请日期2011年11月29日优先权日2011年11月29日
发明者汪闽, 顾礼斌申请人:南京师范大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾礼斌;汪闽
技术所有人：南京师范大学
我是此专利的发明人

上一篇：用于执行交叉计算的方法和设备的制作方法
上一篇：逐行扫描识别斑马线及测量斑马线距离的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。