一种基于类间识别力特征的遥感场景分类方法与流程

文档序号:14836496发布日期:2018-06-30 12:38阅读:272来源:国知局
一种基于类间识别力特征的遥感场景分类方法与流程

本发明涉及一种基于类间识别力特征的遥感场景分类方法,属于遥感图像处理技术领域。



背景技术:

由于高空间分辨率(high spatial resolution,HSR)遥感场景图像存在较大的类内变化和较小的类间差异性,使得这种遥感场景分类任务变得尤为困难。为了提升分类表现,前人的工作多集中在描述场景的多种特性或设计有效的图像描述子,例如Zhong等人设计了一种基于词包模型的谱特征表示方法[Zhong Y,Zhu Q,Zhang L.Scene Classification Based on the Multifeature Fusion Probabilistic Topic Model for High Spatial Resolution Remote Sensing Imagery[J].IEEE Transactions on Geoscience&Remote Sensing,2015,53(11):6207-6222.],该方法将图像按指定大小图块(patch)划分,分别计算R、G、B图层的均值和标准差并串接为图块特征,聚类并硬编码得到谱词包模型特征表示。等人改进了Gabor纹理描述子[V,Z.Fusion of Global and Local Descriptors for Remote Sensing Image Classification[J].IEEE Geoscience&Remote Sensing Letters,2013,10(4):836-840.],该特征基于子波段之间的互相关性,是一种全局纹理描述子。Yuan等人改进了基于词包模型的结构特征表示[Yuan L X,Li S J,Jiang Y P.Remote Sensing Scene Classification Using a Preclassification Strategy and an Improved Structural Feature[J].IEEE Journal of Selected Topics in Applied Earth Observations&Remote Sensing,2017,10(9):4094–4103.],利用频繁项集挖掘方法和特征分量选择准则设计了FM-hist和FMS-hist特征。还有一些研究利用不同的学习算法融合多种特征来描述图像。例如,文献[Zhu Q,Zhong Y,Zhang L,et al.Scene Classification Based on the Fully Sparse Semantic Topic Model[J].IEEE Transactions on Geoscience&Remote Sensing,2017,55(10):5525-5538.]、[Zhao B,Zhong Y,Xia G S,et al.Dirichlet-Derived Multiple Topic Scene Classification Model for High Spatial Resolution Remote Sensing Imagery[J].IEEE Transactions on Geoscience&Remote Sensing,2016,54(4):2108-2123.]中采用语义主题模型对图像各种特性的语义进行提炼,再融合语义特征对场景进行表征。文献[Zhu Q,Zhong Y,Zhao B,et al.Bag-of-Visual-Words Scene Classifier With Local and Global Features for High Spatial Resolution Remote Sensing Imagery[J].IEEE Geoscience&Remote Sensing Letters,2016,13(6):747-751.]将何种特征用词包模型表示后串接形成图像的表示特征。文献[Bian X,Chen C,Tian L,et al.Fusing Local and Global Features for High-Resolution Scene Classification[J].IEEE Journal of Selected Topics in Applied Earth Observations&Remote Sensing,2017,10(6):2889-2901.]中利用交叉验证方法将两种不同类型的特征融合来表示图像。

由于遥感场景存在较大的类内差异,以及较高的类间相似性,若未注意到不同特征对不同场景的特异性描述,也就是忽视场景类别之间的特性差异,如对结构特性明显的密集住宅,仅采用结构特征描述的效果远优于再引入谱特征的描述。换言之,不同场景之间某些相似的特性若未被排除则会影响场景区分,导致分类准确率较低。以往的分类方法通常直接用可能的所有特性描述场景,未考虑到特征的类间识别力,因此场景图像往往缺乏针对性地表征,因而场景分类准确率还有较大的提升空间。



技术实现要素:

本发明所要解决的技术问题是提供一种基于类间识别力特征的遥感场景分类方法,为各场景类别选择最适的表示特征,从而获得极高的场景分类准确率。

本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种基于类间识别力特征的遥感场景分类方法,首先根据预设至少两个单特征,初始化获得由各个单特征组成的各个串接特征,由各个串接特征组建识别特征组,并建立各个遥感场景类别分别对应该识别特征组,然后执行如下步骤,获得分别对应各个遥感场景类别的分类特征,用于实现后期针对遥感场景的分类;

步骤A.采用预设聚类方法获得各类遥感场景类别下所有图像的唯一的聚类质心,并获得各个遥感场景类别下各图像分别与聚类质心之间的欧式距离,再针对各个遥感场景类别下所有图像,按其与聚类质心之间欧式距离进行降序排序,然后进入步骤B;

步骤B.构建以横坐标为图像标号、纵坐标为图像与聚类质心之间欧式距离的二维坐标,针对所有排序图像在该二维坐标系中进行点标记,并根据图像排序,串接各标记点进行连线,选择连线拐点所对应的纵坐标作为距离阈值Thd,然后进入步骤C;

步骤C.基于距离阈值Thd,分别基于识别特征组中的各个串接特征下,获取各个遥感场景类别分别相对其它各个遥感场景类别的重叠率,然后进入步骤D;

步骤D.分别针对各个遥感场景类别,获取使得遥感场景类别与其它各遥感场景类别之间产生高于预设重叠率阈值的串接特征,并将该遥感场景类别所对应识别特征组中的该串接特征进行删除,即更新各个遥感场景类别分别所对应的识别特征组,然后进入步骤E;

步骤E.分别针对各个遥感场景类别,获取遥感场景类别分别在所对应识别特征组中各个串接特征下、与识别特征组中同样包含该串接特征的遥感场景类别之间的类内离差平方和与类间离差平方和的比值,然后选择最小比值所对应的串接特征,作为该遥感场景类别的分类特征,进而获得各个遥感场景类别分别所对应的分类特征,用于实现后期针对遥感场景的分类。

作为本发明的一种优选技术方案:所述初始化获得由各个单特征组成的各个串接特征后,删除各串接特征中的噪声分量,然后由各个串接特征组建识别特征组。

作为本发明的一种优选技术方案:所述初始化获得由各个单特征组成的各个串接特征后,采用基于熵的特征分量选择方法,删除各串接特征中的噪声分量,然后由各个串接特征组建识别特征组。

作为本发明的一种优选技术方案:所述步骤A中,采用基于局部密度和相对距离的聚类方法,获得各类遥感场景类别下所有图像的唯一的聚类质心。

作为本发明的一种优选技术方案,所述步骤C,分别基于识别特征组中的各个串接特征下,执行如下步骤:

步骤C1.针对所有遥感场景类别进行两两组合划分,获得各个遥感场景类别组合,并分别针对各组合,获得各组合中分属两个遥感场景类别下各图像彼此之间的欧式距离值,构建该组两个遥感场景类别之间的距离矩阵,即获得各组合中两个遥感场景类别之间的距离矩阵然后进入步骤C2;其中,i∈{1、…、N},j∈{1、…、N},i≠j,N表示所有遥感场景类别的数量,mi∈{1、…、Mi},Mi表示第i个遥感场景类别下图像的数量,mj∈{1、…、Mj},Mj表示第j个遥感场景类别下图像的数量,表示第i个遥感场景类别下第mi个图像与第j个遥感场景类别下第mj个图像之间的欧氏距离值;

步骤C2.针对所有遥感场景类别,构建场景重叠度矩阵OD=(odij)N×N,并初始其中各个元素odij的值为0;然后分别针对各组合中两个遥感场景类别之间的距离矩阵Dij,获得距离矩阵Dij中存在元素值小于距离阈值Thd的元素所在的行数,并针对odij的值加上该行数进行更新,即更新获得该组合中两个遥感场景类别下彼此欧式距离小于距离阈值Thd的图像数odij,进而完成场景重叠度矩阵OD的构建,然后进入步骤C3;

步骤C3.根据场景重叠度矩阵OD,按如下公式:

orij=[(odij+odij)/(Mi+Mj)]×100%

获得各彼此两遥感场景类别之间的重叠率orij,进而获得场景重叠率矩阵OR=(orij)N×N,即由场景重叠率矩阵OR,获取各个遥感场景类别分别相对其它各个遥感场景类别的重叠率。

作为本发明的一种优选技术方案,所述步骤D,分别基于识别特征组中的各个串接特征下,执行如下步骤:

步骤D1.构建标记矩阵IN×N,并初始化其中各个元素为0,然后进入步骤D2;

步骤D2.获得场景重叠率矩阵OR中元素值大于预设重叠率阈值Thor的各个元素,接着分别针对该各个元素,获得元素在场景重叠率矩阵OR中的纵向维度和横向维度,并针对标记矩阵IN×N中该纵向维度和该横向维度上的各个元素更新为1,进而根据场景重叠率矩阵OR,完成标记矩阵IN×N的更新,然后进入步骤D3;

步骤D3.分别获得标记矩阵IN×N中各行、各列的元素值之和,并获得最大元素值之和所对应其中一个行的维度序号或列的维度序号;接着针对标记矩阵IN×N中该维度序号的行和该维度序号的列上各个元素的值均更新为0,同时删除该维度序号遥感场景类别所对应识别特征组中的当前串接特征,更新该维度序号遥感场景类别所对应的识别特征组,然后进入步骤D4;

步骤D4.判断标记矩阵IN×N中的所有元素是否均为0,是则完成当前串接特征下的操作;否则返回步骤D3。

本发明所述一种基于类间识别力特征的遥感场景分类方法采用以上技术方案与现有技术相比,具有以下技术效果:本发明所设计基于类间识别力特征的遥感场景分类方法,考虑现有特征类间识别能力的不足,找到并排除掉其中造成易混淆/高重叠率的各串接特征;再针对剩余的各串接特征,利用类内/类间离差平方和的比值,来衡量各特征对场景的类间识别力,进而选择比值最小的特征进行表征,进而获得各个遥感场景类别分别所对应的分类特征,用于实现后期针对遥感场景的分类;实际应用中,本发明具有极高的分类准确率,并且经实验验证,本发明的全局分类准确率高于现有的一些有代表性的场景分类方法。

附图说明

图1是本发明所设计基于类间识别力特征的遥感场景分类方法的流程示意图;

图2a是场景天桥与高速公路的高空间分辨率遥感图像示例;

图2b是工业区与密集住宅的高空间分辨率遥感图像示例;

图3是场景重叠现象的二维可视化图例;

图4是本发明具体实施中的距离曲线及Thd值示例;

图5a-1至图5a-21是本发明具体实施中使用的UCM遥感数据集及场景对应编号;

图5b-1至图5b-30是本发明具体实施中使用的AID遥感数据集及场景对应编号;

图6a是本发明具体实施中UCM数据集对应不同特征维数对应的分类准确;

图6b是本发明具体实施中AID数据集对应不同特征维数对应的分类准确。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。

对于图像特征而言,除了强有力的表征能力,其对于不同场景图像的识别能力同样重要。例如,谱特征反映了地物组成和结构的属性,如图2a,天桥场景中的道路和植被与高速公路场景中的道路和植被在谱特性方面非常相似;但天桥图像独有的交叉型道路可以在结构和纹理特性方面很好地区分这两种场景图像。因此,利用结构和纹理特征而非谱特征来描述两种场景,不仅可以避免冗余描述对类内图像独特性的掩盖,还能够扩大不同类别之间在表征上的差异性。同样地,如图2b,当工业区场景和密集住宅场景用结构特征表示时能够被轻易地区分,而引进其他类型特征表征时则可能会带来混淆。

本发明设计了一种基于类间识别力特征的遥感场景分类方法,实际应用中,首先根据预设至少两个单特征,初始化获得由各个单特征组成的各个串接特征,并采用基于熵的特征分量选择方法(ent-FS算法),删除各串接特征中的噪声分量,然后由各个串接特征组建识别特征组,并建立各个遥感场景类别分别对应该识别特征组。

ent-FS算法是一种特征分量选择方法(详细内容可参考文献[Zhang Y,Wu J,Cai J.Compact Representation of High-Dimensional Feature Vectors for Large-Scale Image Recognition and Retrieval.[J].IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society,2016,25(5):2407-2419.]),其基本思想是利用特征分量之间的互信息或熵来从特征向量中选择有效的分量子集,以达到降维的目的。具体地,利用1-bit量化方法来计算特征值的密度,其中1-bit量化方法可将一个实数x量化进两个离散间隔(bin):

如图3所示,所有的图像均用谱、纹理和结构特征串接并预处理后的特征表示,在二维特征空间中可以直观地看到,较多来自高速公路场景的图像(叉标记)和天桥场景的图像(方框标记)混淆在一起,这是由于它们都含有大面积的道路,因而在谱特性方面十分相似。本方法将类似高速公路和天桥的这类场景称为高重叠率场景。此外,中密度住宅(圈标记)和灌木(三角标记)由于几乎没有图像与其他场景混淆,是典型的低重叠率场景。

如图1所示,本发明所设计一种基于类间识别力特征的遥感场景分类方法,基于上述初始化,具体执行如下步骤,获得分别对应各个遥感场景类别的分类特征,用于实现后期针对遥感场景的分类。

步骤A.采用基于局部密度和相对距离的聚类方法(Alex聚类方法),获得各类遥感场景类别下所有图像的唯一的聚类质心,并获得各个遥感场景类别下各图像分别与聚类质心之间的欧式距离,再针对各个遥感场景类别下所有图像,按其与聚类质心之间欧式距离进行降序排序,然后进入步骤B。

Alex聚类方法(详细内容可参考[Rodriguez A,Laio A.Machine learning.Clustering by fast search and find of density peaks[J].Science,2014,344(6191):1492-1496.])根据样本的密度峰值来确定聚类中心的,能有效检测非球面类别的数据分布。本发明利用Alex聚类方法选择出密度最大的图像样本作为类簇质心,由于该质心周围紧密存在着大量图像,若这些图像属于不同场景类别,那么它们就极易被相互错分。因此,本发明中采用最右拐点对应的较小距离作为阈值。该阈值能够用来决定两幅图像是否相似。

步骤B.构建以横坐标为图像标号、纵坐标为图像与聚类质心之间欧式距离的二维坐标,针对所有排序图像在该二维坐标系中进行点标记,并根据图像排序,串接各标记点进行连线,选择连线拐点所对应的纵坐标作为距离阈值Thd,如图4所示,然后进入步骤C。

步骤C.基于距离阈值Thd,分别基于识别特征组中的各个串接特征下,执行如下步骤C1至步骤C3,获取各个遥感场景类别分别相对其它各个遥感场景类别的重叠率,然后进入步骤D。

步骤C1.针对所有遥感场景类别进行两两组合划分,获得各个遥感场景类别组合,并分别针对各组合,获得各组合中分属两个遥感场景类别下各图像彼此之间的欧式距离值,构建该组两个遥感场景类别之间的距离矩阵,即获得各组合中两个遥感场景类别之间的距离矩阵然后进入步骤C2;其中,i∈{1、…、N},j∈{1、…、N},i≠j,N表示所有遥感场景类别的数量,mi∈{1、…、Mi},Mi表示第i个遥感场景类别下图像的数量,mj∈{1、…、Mj},Mj表示第j个遥感场景类别下图像的数量,表示第i个遥感场景类别下第mi个图像与第j个遥感场景类别下第mj个图像之间的欧氏距离值。

步骤C2.针对所有遥感场景类别,构建场景重叠度矩阵OD=(odij)N×N,并初始其中各个元素odij的值为0;然后分别针对各组合中两个遥感场景类别之间的距离矩阵Dij,获得距离矩阵Dij中存在元素值小于距离阈值Thd的元素所在的行数,并针对odij的值加上该行数进行更新,即更新获得该组合中两个遥感场景类别下彼此欧式距离小于距离阈值Thd的图像数odij,进而完成场景重叠度矩阵OD的构建,然后进入步骤C3。

步骤C3.根据场景重叠度矩阵OD,按如下公式:

orij=[(odij+odij)/(Mi+Mj)]×100%

获得各彼此两遥感场景类别之间的重叠率orij,进而获得场景重叠率矩阵OR=(orij)N×N,即由场景重叠率矩阵OR,获取各个遥感场景类别分别相对其它各个遥感场景类别的重叠率。

步骤D.分别针对各个遥感场景类别,获取使得遥感场景类别与其它各遥感场景类别之间产生高于预设重叠率阈值的串接特征,并将该遥感场景类别所对应识别特征组中的该串接特征进行删除,即更新各个遥感场景类别分别所对应的识别特征组,然后进入步骤E。

具体实际应用中,上述步骤D,分别基于识别特征组中的各个串接特征下,执行如下步骤D1至步骤D4,进而更新各个遥感场景类别分别所对应的识别特征组,然后进入步骤E。

步骤D1.构建标记矩阵IN×N,并初始化其中各个元素为0,然后进入步骤D2。

步骤D2.获得场景重叠率矩阵OR中元素值大于预设重叠率阈值Thor的各个元素,接着分别针对该各个元素,获得元素在场景重叠率矩阵OR中的纵向维度和横向维度,并针对标记矩阵IN×N中该纵向维度和该横向维度上的各个元素更新为1,进而根据场景重叠率矩阵OR,完成标记矩阵IN×N的更新,然后进入步骤D3。

步骤D3.分别获得标记矩阵IN×N中各行、各列的元素值之和,并获得最大元素值之和所对应其中一个行的维度序号或列的维度序号;接着针对标记矩阵IN×N中该维度序号的行和该维度序号的列上各个元素的值均更新为0,同时删除该维度序号遥感场景类别所对应识别特征组中的当前串接特征,更新该维度序号遥感场景类别所对应的识别特征组,然后进入步骤D4。

步骤D4.判断标记矩阵IN×N中的所有元素是否均为0,是则完成当前串接特征下的操作;否则返回步骤D3。

一般的特征评价指标通过计算场景的分类准确率来衡量特征的性能,有别于这评价指标,本发明提出的该指标有着统计学理论依据,且倾向于从两个方面来评价特征性能:一是,特征对场景类内图像的描述能力;二是,特征对不同场景类别之间的区分能力。

步骤E.分别针对各个遥感场景类别,获取遥感场景类别分别在所对应识别特征组中各个串接特征下、与识别特征组中同样包含该串接特征的遥感场景类别之间的类内离差平方和Se与类间离差平方和SA的比值,构建特征评价指标,然后选择最小比值所对应的串接特征,作为该遥感场景类别的分类特征,进而获得各个遥感场景类别分别所对应的分类特征,用于实现后期针对遥感场景的分类。

在上述步骤E中,Se被用于衡量类内相似性,且Se值越小意味着预处理后特征对于类内图像的描述能力越强;SA被用于衡量类间区分性,即SA值越大意味着特征对不同场景的识别能力越强。因此,Se/SA值最小的特征说明它拥有相对较强的场景区分能力,换言之,排除掉造成高重叠率的串接特征后,在剩余串接特征上Se/SA值最小的预处理后特征将被选做用于表征这些场景。

为验证本发明的实验效果,分别在两个有代表性的HSR遥感数据集上验证本发明方法。第一个数据集是21种场景类别的UC Merced数据集(简称UCM)[Yang Y,Newsam S.Bag-of-visual-words and spatial extensions for land-use classification[C]//Sigspatial International Conference on Advances in Geographic Information Systems.ACM,2010:270-279.],第二种数据集是30个场景类别的Aerial Image data set数据集(简称AID)[Xia G S,Hu J,Hu F,et al.AID:A Benchmark Data Set for Performance Evaluation of Aerial Scene Classification[J].IEEE Transactions on Geoscience&Remote Sensing,2017,55(7):3965-3981.]。

本发明所设计遥感场景分类方法实际应用中,给出了上述两个数据集的图像样例。如图5a-1至图5a-21所示,UCM数据集按序依次为:图5a-1.网球场,图5a-2.储油罐,图5a-3.稀疏住宅区,图5a-4.跑道,图5a-5.河流,图5a-6.停车场,图5a-7.天桥,图5a-8.活动房,图5a-9.中密度住宅区,图5a-10.交叉路口,图5a-11.港口,图5a-12.高尔夫球场,图5a-13.高速公路,图5a-14.森林,图5a-15.密集住宅,图5a-16.丛林,图5a-17.建筑物,图5a-18.沙滩,图5a-19.棒球场,图5a-20.飞机,图5a-21.农田。

如图5b-1至图5b-30所示,AID数据集按序依次为:图5b-1.机场,图5b-2.荒地,图5b-2.棒球场,图5b-4.沙滩,图5b-5.桥,图5b-6.市中心,图5b-7.教堂,图5b-8.商业区,图5b-9.密集住宅,图5b-10.沙漠,图5b-11.耕地,图5b-12.森林,图5b-13.工业区,图5b-14.草场,图5b-15.中密度住宅,图5b-16.山,图5b-17.公园,图5b-18.停车场,图5b-19.操场,图5b-20.池塘,图5b-21.港口,图5b-22.火车站,图5b-23.度假地,图5b-24.河,图5b-25.学校,图5b-26.稀疏住宅,图5b-27.广场,图5b-28.体育场,图5b-29.储油罐,图5b-30.高架桥。

实验设置如下所示:

1、对于UCM数据集,随机每个场景类别的80%的图像作为训练集,剩余的作为测试集。对于AID数据集,各类别的50%的图像用作训练集,剩余的作为测试集。每个场景类别均有一个类别编号,编号如图5a-1至图5a-21所示,以及图5b-1至图5b-30所示。

2、谱描述子的词典大小设置为800,FM-hist的大小设置为1000。在FM-hist特征中,对于UCM数据集,其调节系数λ设为4,最小支持度阈值设为200,挖掘至频繁2项集;而对于AID数据集,其调节系数设为2,最小支持度阈值设为350,但同样挖掘至频繁2项集。

3、谱特征、纹理特征和FM-hist特征分别用S、G、I标记。而它们的串接特征,如这三种特征的组合特征则标记为SGI。值得注意的是,实验结果显示单独的谱特征、纹理特征的分类效果很差,而单独的FM-hist特征则表现不错。因此,在实验中仅适用一个单特征和四种串接特征,即I、SGI、SI、GI和SG。

4、未处理的SGI特征的总维数是1860。经特征分量选择后,如图6a所示,UCM数据集的各特征维数设置为860,而如图6b所示,AID数据集的各特征维数设为600。

5、测试集使用基于REF核的支持向量机(SVM)分类器。分类结果用全局准确率(OA)和标准差表示。对于UCM数据集进行5轮随机训练集和测试集的划分,而AID数据集进行10轮随机划分。

如下表1所示,给出了在5%-Thor前提下的各特征表征下,排除造成高重叠率的串接特征。注意到,那些谱特性高度相似的场景,如UCM数据集的天桥(图5a-7)和高速公路(图5a-13),均被含有谱分量的特征选到(即SGI、SI和SG特征),这意味着冗余描述确实可能会导致更多的图像错分。此外,AID数据集中的学校场景(图5b-25)未被I特征选到,却被串接特征选到,反映出单个有识别力特征有时足以描述图像。

表1

如下表2所示,给出了对应不同重叠率阈值的总体分类准确率。以UCM数据集下的5%-Thor为例,不同场景使用所选出的串接特征表示、且所有场景的训练图像用一个SVM分类器一起训练。

表2

如下表3所示,给出了本发明方法与一些有代表性的、基于特征表示的场景分类方法的比较。结果显示,本发明方法表现优异,不仅能够识别出那些易混淆的场景,而且还能为多种场景选出其最合适的表示特征。分析原因,很有可能是本发明方法为各个场景选择了最符合其特性的表示特征。

表3

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1