基于光谱属性信息和空间信息的水库水体分类方法及装置与流程

文档序号:11143393阅读:374来源:国知局
基于光谱属性信息和空间信息的水库水体分类方法及装置与制造工艺

本发明涉及一种水库水体分类方法,尤其涉及一种基于光谱属性信息和空间信息的水库水体分类方法及装置。



背景技术:

遥感具有监测区域范围广,获取数据周期短,地物波谱信息丰富等特点,利用遥感影像可以快速、实时地分析水资源在时空上的动态分布情况。因此,遥感技术在水质动态变化监测、灾情评估、水资源管理及水环境调查等多个方面都有广泛的应用,对水利信息化有着重要的意义。

目前,国内外关于水体时空变化的研究较多,主要包括以下两个方面。一方面是针对区域水资源时空演变规律的研究,如王明常等(参见文献:Wang M,He Y,Xing L et al.Research on evolution and spatial pattern of water in the west part of Jilin Province,2007,22(1):45-49(in Chinese).Doi:10.11873/j.issn.1004-0323.2007.1.45.[王明常,何月,邢立新,等.吉林西部遥感水域空间格局演变研究[J].遥感技术与应用,2007,22(1):45-49.])建立空间信息库对吉林西部水域景观空间格局的动态演变规律进行探究;陈定贵等(参见文献:Chen D,Zhou D,Lv X.Spatial evolution character of surface water bodies pattern due to urbanization of Changchun City.Journal of Jilin University(Earth Science Edition),2008,38(3):437-443(in Chinese with English abstract).Doi:10.3969/j.issn.1671-5888.2008.03.013.[陈定贵,周德民,吕宪国.长春城市发展过程中地表水体空间格局演变特征[J].吉林大学学报:地球科学版,2008,38(3):437-443.])利用遥感信息讨论长春城市发展对于城市市区和城区水体结构、形态和空间分布等多种特征的影响;Fisher等(参见文献:Fisher A,Flood N,Danaher T.Comparing Landsat water index methods for automated water classification in eastern Australia[J].Remote Sensing of Environment,2016,175:167-182.Doi:10.1016/j.rse.2015.12.055)利用水体指数法对澳大利亚东部水体分布情况进行分类。另一方面是针对水体面积的时间序列挖掘分析,如刘洋等(参见文献:Liu Y,You H,Cheng X,et al.Estimation of variation of Poyang Lake area based on long-term MODIS observations.Journal of Geo-information Science,2013,15(3):469-475(in Chinese).Doi:10.3724/SP.J.1047.2013.00469.[刘洋,尤慧,程晓,等.基于长时间序列MODIS数据的鄱阳湖湖面面积变化分析[J].地球信息科学学报,2013,15(3):469-475.])基于长时间序列遥感观测对鄱阳湖的湖面进行提取;孙芳蒂等(参见文献:Sun F,Zhao Y,Gong P,et al.Monitoring dynamic changes of global land cover types:Fluctuations of maj or lakes in China every 8days from 2000-2010.Chin Sci Bull,2014,59,doi:10.1007/s11434-013-0045-0(in Chinese).[孙芳蒂,赵圆圆,宫鹏,等.动态地表覆盖类型遥感监测:中国主要湖泊面积2000~2010年间逐旬时间尺度消长[J].科学通报,2014,1(4):397-411.])利用MODIS建立中国629个湖泊8天时间间隔数据库并分析了中国湖泊的消长情况;邵佳丽等(参见文献:Shao J,Zheng W,Liu C.Analysis of spatial-temporal variations in the main flood season and their influencing factors of the Dongting Lake based on meteorological satellite data.Resources and Environment in the Yangtze Basin,2015,24(8):1315-1321(in Chinese).Doi:10.11870/cjlyzyyhj201508008.[邵佳丽,郑伟,刘诚.卫星遥感洞庭湖主汛期水体时空变化特征及影响因子分析[J].长江流域资源与环境,2015,24(8):1315-1321.])综合多种水体提取方法提取洞庭湖水体面积并探讨其变化情况;万华伟等(参见文献:Wan H,Kang J,Gao S,et al.Study on dynamic change of Hulun Lake water area and climate driving force analysis.China Environmental Science,2016,36(3):894-898(in Chinese with English abstract).Doi:10.3969/j.issn.1000-6923.2016.03.035[万华伟,康峻,高帅,等.呼伦湖水面动态变化遥感监测及气候因素驱动分析[J].中国环境科学,2016,36(3):894-898.])采用水体指数的方法对2000~2013年呼伦湖的水体面积进行了动态变化分析。

有关水体时空格局分布的研究已经很多,也达成了不少研究共识,但是对不同水库水体光谱的空间格局分布特征分析与探讨甚少。定量准确地获取和剖析水库水体信息是水库研究的关键环节,水库水体的广域性、分散性、随机性等特征决定了不可能对其进行统一处理。由于不同水库水体的成因、赋存条件以及受地质构造作用存在较大的差异。因此,影响水库水体成像的因素也不尽相同,这就使得对于不同水库水体需要考虑多种方案,难以有统一的模式。



技术实现要素:

本发明所要解决的技术问题在于克服现有技术不足,提供一种基于光谱属性信息和空间信息的水库水体分类方法及装置,充分考虑了水库水体的光谱属性信息和空间信息,提高了水库水体分类的准确性,为区域性水体动态分析及监测提供科学依据,减少了人为因素的影响,分类效果更具有客观性。

本发明具体采用以下技术方案解决上述技术问题:

基于光谱属性信息和空间信息的水库水体分类方法,包括以下步骤:

步骤A、从研究区域的遥感影像中获取各水库的样本点,并提取样本点的光谱属性特征和空间特征,所述光谱属性特征为标准化后的样本点在各光谱波段的值,所述空间特征为样本点的空间经纬度坐标;

步骤B、构建样本点集合的相似度矩阵,具体包括以下子步骤:

步骤B1、利用下式构建样本点集合的光谱属性特征相似度矩阵SDS:

其中,SDSij表示光谱属性特征相似度矩阵SDS中第i行第j列的元素,Sij为样本点i和j之间的光谱属性特征相似度,sigma为预设系数,exp(·)为指数函数;

步骤B2、利用下式构建样本点集合的地理位置相似度矩阵DDS:

式中,DDSij表示地理位置相似度矩阵DDS中第i行第j列的元素,Ddij为样本点i和j之间的距离;

步骤B3、利用下式构建样本点集合的相似度矩阵SS:

SSij=SDSij*DDSij i,j=1,2,...,n

式中,SSij表示相似度矩阵SS中第i行第j列的元素;

步骤C、在不同的聚类数条件下对样本点集合的相似度矩阵SS分别进行谱聚类,并利用聚类有效性评价指标从中选出最佳聚类数,最佳聚类数条件下的谱聚类结果即为水库水体分类结果。

基于光谱属性信息和空间信息的水库水体分类装置,包括:

特征提取单元,用于从研究区域的遥感影像中获取各水库的样本点,并提取样本点的光谱属性特征和空间特征,所述光谱属性特征为标准化后的样本点在各光谱波段的值,所述空间特征为样本点的空间坐标;

相似度矩阵生成单元,用于构建样本点集合的相似度矩阵,其包括:

光谱属性特征相似度矩阵生成模块,利用下式构建样本点集合的光谱属性特征相似度矩阵SDS:

其中,SDSij表示光谱属性特征相似度矩阵SDS中第i行第j列的元素,Sij为样本点i和j之间的光谱属性特征相似度,sigma为预设系数,exp(·)为指数函数;

地理位置相似度矩阵生成模块,利用下式构建样本点集合的地理位置相似度矩阵DDS:

式中,DDSij表示地理位置相似度矩阵DDS中第i行第j列的元素,Ddij为样本点i和j之间的距离;

相似度矩阵生成模块,利用下式构建样本点集合的相似度矩阵SS:

SSij=SDSij*DDSij i,j=1,2,...,n

式中,SSij表示相似度矩阵SS中第i行第j列的元素;

谱聚类单元,用于在不同的聚类数条件下对样本点集合的相似度矩阵SS分别进行谱聚类,并利用聚类有效性评价指标从中选出最佳聚类数,最佳聚类数条件下的谱聚类结果即为水库水体分类结果。

优选地,所述地域为地区、省、市或县。

优选地,所述聚类有效性评价指标为DB指数。

优选地,使用欧式距离度量所述光谱属性特征相似度。

优选地,所述光谱属性特征为min-max标准化后的样本点在各光谱波段的值。

相比现有技术,本发明技术方案具有以下有益效果:

本发明首次将谱聚类引入水库水体分类中,并通过充分利用遥感影像水库水体的光谱属性信息和空间信息构建光谱权重矩阵,以所构建的光谱权重矩阵作为谱聚类算法的相似度矩阵,能够更好地改善空间分析和空间数据挖掘的信息质量,从而有效提高水库水体分类的准确性。

附图说明

图1为全国省份权重邻接矩阵拓扑图;

图2为DB指数曲线图;

图3为不同聚类方法的正确率比较结果。

具体实施方式

下面结合附图对本发明的技术方案进行详细说明:

针对复杂的水库水体的分类问题,本发明的思路是将谱聚类引入水库水体分类中,并通过充分利用遥感影像水库水体的光谱属性信息和空间信息构建光谱权重矩阵,以所构建的光谱权重矩阵作为谱聚类算法的相似度矩阵,能够更好地改善空间分析和空间数据挖掘的信息质量,从而有效提高水库水体分类的准确性。

为便于公众理解,首先对于谱聚类的内容进行简要介绍。

谱聚类算法是建立在谱图理论基础上的一种新的聚类方法,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。谱聚类的基本思想是利用样本数据之间的相似矩阵(Laplacian矩阵)进行特征分解,即通过拉普拉斯特征映射(Laplacian Eigenmaps)的方式进行降维,然后将得到的特征向量在低维空间进行聚类(参见文献:[Luxburg U V.A tutorial on spectral clustering[J].Statistics&Computing,2007,17(17):395-416.Doi:10.1007/s11222-007-9033-z])。谱聚类的问题相当于一个图的分割问题,即通过给定一个图G=(V,E),其中V为顶点集代表各个数据样本,E为带权的边代表各个样本之间的相似度。谱聚类的目的就是找到一个最佳的图分割的方法,将图G分割成若干个子图,使得连接不同子图的边权重尽可能低,而同一子图内边的权重尽可能高。常用的划分准则有最小割集准则、规范割集准则、比例割集准则、平均割集准则以及最大最小割集准则。图划分的最优解通常是一个松弛NP难问题,通过考虑连续松弛形式,将NP难问题转换为求解相似矩阵的谱分解问题。

设X=(X1,X2,...Xn)为n个样本数据,X的每一行为同一样本的不同属性数据,每一列为不同样本的同一属性数据。构建一个图G=(V,E),图中的每个节点V对应数据样本点,而E用于表示数据之间的相似度,将这个图G用邻接矩阵的形式表示出来,记为W。

式(1)中,xi,xj表示数据样本点,σ表示尺度参数,当i=j时,Wij=0。

将W的每一列元素相加得到N个数置于对角线,其余位置为0,组成一个N*N的对角矩阵,记为度矩阵D,在此基础上可以计算拉普拉斯矩阵L。拉普拉斯矩阵有两类,分别为非正则拉普拉斯矩阵和正则拉普拉斯矩阵。非正则拉普拉斯矩阵,其形式为

L=D-W (2)

正则拉普拉斯矩阵有两种,分别是对称拉普拉斯矩阵,其形式为

Lsym=D-1/2LD-1/2=I-D-1/2WD-1/2 (3)

及随机游走拉普拉斯矩阵,其形式为

Lrw=D-1L=I-D-1W (4)

将n个待聚类的样本视作图G的n个顶点,求出L的前k个特征值,并将前k个特征值从小到大排序,并求得对应的特征向量将k个列向量u1,u2,...,uk组成矩阵U,U∈Rn*k。对于i=1,2,...,n,令yi∈Rk作为U的第i行向量。将U进行多类划分,采用规范割集准则,其是两类划分规范割准则的扩展,定义如式(5)所示:

式(5)中,vol(Ci)为子图Ci所有定点之间的连接权值之和。根据上式可以将最小化规范割准则表示如下形式

minNcut(C1,C2,...,Ck) (8)

式(8)是一个离散优化问题,通过忽略U中元素的离散限制条件,使其可以取任意实数解。根据瑞利商原理,该优化问题最优解由D-1/2LD-1/2最小的k的特征值所对应的特征向量构成的,即找到E=D-1/2WD-1/2的前k个最大特征值对应的特征向量。对U使用K-means算法将点(yi)i=1,2,...,n聚类成簇C1,C2,...,Ck,每行数据对应的聚类簇就是原样本xi对应的聚类簇。

具体而言,本发明所提出的基于光谱属性信息和空间信息的水库水体分类方法,包括以下步骤:

步骤A、从研究区域的多光谱遥感影像中获取各水库的样本点,并提取样本点的光谱属性特征和空间特征,所述光谱属性特征为标准化后的样本点在各光谱波段的值,所述空间特征为样本点的空间坐标;

水库水体遥感影像反映的信息主要有光谱属性信息和空间信息。水库水体的光谱属性信息表现为量化的辐射值,即遥感影像的像元值。该值的大小是由水体内的各种物质对光辐射的吸收和散射性质决定的。水库水体的空间信息表现为水库水体的像元值在空间上的变化,包括遥感影像上水库水体的分布、面积、纹理信息等。由于谱聚类算法直接在相似度矩阵上进行分割聚类,不同形式的相似矩阵对算法的影响很大,所以通过充分利用遥感影像水库水体的光谱属性信息和空间信息构建光谱权重矩阵,能够更好地改善空间分析和空间数据挖掘的信息质量。

本发明首先提取样本点的光谱属性特征:对所有的n个水库水体样本点每个光谱属性特征进行min-max标准化,使结果值映射到[0,1]之间,用以消除不同维度波段像元值的差异,消除量纲不一致的缺陷,使各光谱属性特征之间具有横向可比性。min-max标准化的转换函数如下:

x*=(x-xmin)/(xmax-xmin) (9)

其中xmax为样本数据的最大值,xmin为样本数据的最小值。

样本点的空间特征可直接以样本点的空间经纬度坐标来表示。

步骤B、构建样本点集合的相似度矩阵,具体包括以下子步骤:

步骤B1、构建样本点集合的光谱属性特征相似度矩阵SDS:

聚类分析中常用欧氏距离来度量两个样本之间的相似性,即多维空间点到点之间的几何距离(当然,也可采用曼哈顿距离、汉明距离、闵可夫斯基距离、相关系数等度量方式)。光谱属性特征相似度可定义如下:

通过高斯核函数(也称径向基函数核)计算相似度,两个样本之间距离越大,代表其相似度越小。则光谱属性特征相似度矩阵(Spectrum Distance Similarity)可以定义为

其中,SDSij表示光谱属性特征相似度矩阵SDS中第i行第j列的元素,Sij为样本点i和j之间的光谱属性特征相似度;预设系数sigma的大小影响光谱之间的距离,SDSij随着sigma增大而衰减速度放慢,由于归一化后数据在[0,1]之间,设置sigma为1。

步骤B2、构建样本点集合的地理位置相似度矩阵DDS:

首先计算n个水库水体样本点任意两点间的距离矩阵。距离矩阵计算公式如下:

其中d为两点的弧长,Dd单位为米,R默认值为地球半径长度,即6371米,i,j=1,2,...,n,且当i=j,Ddij=0。

然后构建研究区域的地域邻接权重矩阵,较常用的空间属性表现形式是基于各地域(例如地区、省、市、县这样的行政地理区划)之间的邻接关系,即若两地域之间相邻,则假设其光谱特性之间具有一定的相关性。其邻接关系可以用0和1两个数值来表达,两地域地理位置相互接壤毗邻则定义1,否则定义为0。邻接矩阵Wij定义如下:

根据各地域之间邻接矩阵构建无向图,图1即显示了全国省份权重邻接矩阵拓扑,省份之间的相关性通过直线连接表示,省份旁的数字代表与该省份毗邻的省份数。为了让同一地域内抽取若干水库样本点存在空间自相关性,在此基础上构建改进的邻接权重矩阵nWij。nWij定义如下:

在改进的邻接权重矩阵nWij的基础上可构建n个水库水体样本点空间特征。由于同一个地域内水库样本点存在强相关性,并且随着两样本点距离的增加,相互产生的影响力减小,即假设两地空间距离越近则光谱相似性越高,反之则越低。本发明所使用的基于距离和地域的地理位置相似度矩阵(Data Distance Similarity)为距离的倒数与对应改进的邻接权重矩阵nWij值的乘积,样本点自身的DDSij值设为0。则有:

式中,DDSij表示地理位置相似度矩阵DDS中第i行第j列的元素,Ddij为样本点i和j之间的距离;

步骤B3、构建样本点集合的相似度矩阵SS:

SSij=SDSij*DDSij i,j=1,2,...,n (17)

式中,SSij表示相似度矩阵SS中第i行第j列的元素。

步骤C、在不同的聚类数条件下对样本点集合的相似度矩阵SS分别进行谱聚类,并利用聚类有效性评价指标从中选出最佳聚类数,最佳聚类数条件下的谱聚类结果即为水库水体分类结果:

聚类有效性评价指标用来评价在不同聚类数时聚类结果的优劣,通常包括外部有效性评价指标和内部有效性评价指标。本发明采用非监督分类,故采用内部有效性评价指标。内部有效性评价指标根据数据自身的特点来对聚类结果进行评价,并将最优的聚类结果所对应的聚类数目作为最佳聚类数。其中,DB指数(参见文献[Davies D L,Bouldin D W.A Cluster Separation Measure[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,1979,PAMI-1(2):224-227.Doi:10.1109/tpami.1979.4766909])以其简单易用和良好的评价能力而得到广泛应用。DB指数用于描述样本的类内散度与各聚类中心的间距,将各个类间的指标进行平均,减少离群点对样本聚类产生的噪声影响。DB指数定义为

其中,Nc是聚类数目,wi表示类ci中的所有样本到其聚类中心的平均距离,wj表示类ci中的所有样本到类cj中心的平均距离,cij表示类ci和cj中心之间的距离。一个好的聚类划分应该使得类内样本距离尽可能的最小,类间样本距离尽可能最大,因此结合DB指数定义式(18)可以看出DB指数越小表示类与类之间的相似度越低,聚类效果越佳。

本具体实施方式中所使用的谱聚类算法具体步骤如下:

①计算度矩阵(Degree Matrix)。光谱相似度矩阵SSij每一行(列)的和作为度矩阵对角线上的元素,其余位置为0。度矩阵公式如式(19)所示:

②计算规范对称Laplacian矩阵:

Lsym=DMij-1/2LMij-1/2=I-DMij-1/2SSijMij-1/2 (20)其中,I为单位矩阵。

③对Lsym进行特征值分解,从小到大排列,得到Lsym的前k个特征值对应的特征向量u1,u2,...,uk,这里k设为聚类数。

④将k个列向量u1,u2,...,uk组成矩阵U,U∈Rn*k。对于i=1,2,...,n,令yi∈Rk为U的第i行向量。对称拉普拉斯矩阵需要对yi依次归一化,使得|yi|=1。把U的每一行当成一个新的样本点,对这n个新的样本点进行K-means聚类。

⑤根据DB指数最小值确定谱聚类的最佳聚类数k。

为了验证本发明技术方案的效果,选择了46个全国典型水库(总库容量大于10亿立方米)进行分类验证,高分一号遥感影像水库列表如表1所示。

表1高分一号遥感影像水库列表

对46景2014年10月07日左右遥感影像使用ENVI进行预处理,包括辐射定标、Flassh大气校正及正射校正,从而消除一些非系统性误差,包括地形起伏、星历数据不准确等因素导致的影像几何畸变和大气状况、地形部位等因素造成的影像辐射失真等问题。所选择的遥感影像的基本特点为无浮云及漂浮物,使用ENVI中ROI选择感兴趣水库遥感影像区域。本实验选择水库水体遥感影像ROI区域位于水库中心,大小为15*15像素,每个代表性水库共225个样本点。

每个样本点提取6个特征,包括样本点的光谱属性特征和空间特征。其中样本点的光谱属性特征为高分一号在该像素点的四个波段值,具体的波谱信息见表2。

表2样本点光谱属性特征波段信息

设有n个水库水体样本点,第i个水库水体样本点的空间特征和光谱属性特征分别为

其中xi为样本点纬度坐标,yi为样本点经度坐标,ai1,ai2,ai3,ai4分别为样本点高分一号多光谱蓝、绿、红、近红外的波段值。则样本点特征向量为:

Si=(Pi,Ai)=(xi,yi,ai1,ai2,ai3,ai4) i=1,2,...,n (22)

利用上述的本发明谱聚类算法进行聚类,并通过DB指数最小值确定最佳聚类数。设置的聚类数k取值范围为[2,23]。图2为不同聚类数情况下的DB指数变化曲线,当k为7时,DB指数值最小。根据DB指数定义,此时k=7为最佳聚类数。k=7时的谱聚类类簇结果见表3

表3基于光谱属性特征和空间特征谱聚类类簇结果(k=7)

为了进一步验证本文方法的有效性,将本发明方法结果和其他两种方法进行了对比分析,包括仅基于光谱属性特征谱聚类算法和基于光谱属性特征和空间特征K-means算法,本发明方法为基于光谱属性特征和空间特征谱聚类算法。

定义正确率Acc为正确分类与样本总数的比值。正确分类定义为将同一个水库225个样本都归为同一类。对所有样本进行评判,若经过聚类后该水库样本被分到不同聚类簇内,则选择该水库225个样本中聚类后标签频数最多的作为正确分类,剩余的样本则记为错误分类。正确率Acc定义为

其中,N为样本总数,wrong为某一水库内错误分类总数,Acc取值范围为[0,1]。

图3给出了三种算法的正确率Acc对比结果,从多次运行实验的结果来看,本发明方法即基于光谱属性特征和空间特征谱聚类算法正确率Acc最高,为1.00,且正确率Acc并没有因为聚类数k的增加造成预测正确率的下降。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1