一种端元提取数据预处理方法

文档序号:6514730阅读:1202来源:国知局
一种端元提取数据预处理方法
【专利摘要】本发明提供了一种端元提取数据预处理方法,该方法通过建立基于模糊特征空间核空间引力模型,为高光谱数据像素点定义像元变异指数,实现了高光谱图像变异像素点的检测和移除。首先对高光谱数据集合进行模糊特征空间变换,得到模糊特征。利用像素的模糊特征,运用高斯径向基核函数优化的空间引力模型,计算3×3的空间邻域窗口内,邻域像素对中心像素的累加引力值,该引力值与像素变异指数成反比,对高变异指数像素进行移除。
【专利说明】一种端元提取数据预处理方法
【技术领域】
[0001]本发明涉及数据处理领域,尤其涉及一种端元提取数据预处理方法。
【背景技术】
[0002]高光谱遥感技术已经在精细农业、环境检测、地质勘探、军事侦查等领域显现巨大的优势。然而,尽管高光谱遥感图像具有较高的光谱分辨率,却始终受空间分辨率的制约。较低的空间分辨率导致混合像元在高光谱数据中大量存在。近20年,混合像元分析成为该领域研究学者不容忽视的课题。
[0003]在线型混合模型假设下,若当前像素光谱曲线,有且仅由一种地物光谱构成,定义该像素点为对应于该地物的端元;反之,若当前像素光谱曲线由多种地物光谱线性叠加构成,定义该像素点为混合像素。传统的基于凸面单形体几何理论的端元提取方法,如:最大单形体体积(N-FINDR)、顶点成分分析(VCA)、正交子空间投影(OSP)及像素纯度指数(PPI)等诸多方法,旨在为每类地物寻找其对应的端元像素点。这种单一的端元提取方法——每种地物仅由某一条光谱曲线端元表示——忽略了像素光谱具有变异性的固有特性。
[0004]受光照条件、作物长势、含水量及阴影等条件的影响,像元光谱表现固有的变异性。C.A.Bateson, Gregory P.Asnerc, Roberts等学者针对光谱变异性展开了长期较深入的研究,以端元束集合替代单一端元集合,为待解混像素反演出最小均方误差准则下的丰度估计。这种做法尽管指出了光谱具有变异性的特点,却仍未从根本上解决变异光谱对真实端元光谱在光谱特征空间的干扰。
[0005]目前国内外尚无端元提取数据预处理方面的算法研究。

【发明内容】

[0006]本发明提供了一种端元提取数据预处理方法,用于检测并移除高光谱数据中具有较强光谱变异性的像素点。
[0007]—方面,提供了一种端元提取数据预处理方法,包括:对高光谱数据矩阵X进行模糊K-mean聚类,得到每个像元在模糊特征空间的模糊属性,以该模糊属性取代光谱特征;其次,进行3X3邻域窗口内核空间引力模型的高变异指数像素检测和移除;最后,设定判定阈值因子α,移除高变异指数像素,保留稳定像素点。模糊特征空间核空间引力模型的应用,实现了空间信息和光谱模糊特征信息的一体化,具有在高维非线性空间中从高光谱数据集中分离出高变异指数像素的能力。
[0008]优选的,对高光谱数据进行模糊K-mean聚类,以聚类后像素点的模糊特征向量替代原始光谱特征向量。其中,聚类数目等于由虚拟维数法估计出的端元数目。实现了光谱数据矩阵由原始光谱特征空间到模糊特征空间的变换,将高维的光谱特征数据转换为较低维度的模糊特征数据。
[0009]可选的,运用高斯径向基核函数优化空间引力模型。模型的加权因子采用像素点距离加权因子,遍历计算全局像素点,为像素点定义变异指数。[0010]优选的,设定判定阈值因子α,其中α非定值,因数据自身特性而变化,该因子需根据实际需要做适当调整。同时,该发明指出:判定阈值因子α可在均值引力误差附近范围取值。
[0011]本发明将高光谱数据的光谱和空间特性一体化,实现了对象元变异指数的判定,是一种高光谱端元提取数据预处理方法。该发明可作为现有的基于凸面单形体几何理论的端元提取算法的前期数据预处理方法,降低了变异像素对端元提取算法的干扰,提升了现有基于凸面单形体几何理论的端元提取算法的精度,具有较高的普适性。
【专利附图】

【附图说明】[0012]图I是高变异指数像素在光谱特征空间对真实端元造成淹没现象,单形体体积被错误估计示意图;[0013]图2是高变异指数像素在模糊特征空间中的分布示意图;[0014]图3是高斯径向基核函数优化的空间引力模型检测窗口示意图;[0015]图4a)是二种玉米种子图片;[0016]图4b)是玉米类型I、玉米类型2、玉米类型3对应的光谱特征曲线图;[0017]图4c)是叶片图像;[0018]图4d)是叶片光谱特性曲线图;[0019]图5a)`是模拟数据玉米类型I丰度分布图;[0020]图5b)是模拟数据玉米类型2丰度分布图;[0021]图5c)是模拟数据玉米类型3丰度分布图;[0022]图6a)是高光谱AVIRIS印第安纳州农林数据第10波段图像;[0023]图6b)是印第安纳州农林数据16种地物类别的分布参照图;[0024]图6c)是印第安纳州农林数据16种地物对应灰度级的地物名称;[0025]图7a)是印第安纳州农林数据A(corn-notill)、B (corn-mino)、C(corn)的空间位置图;[0026]图7b)是 corn-notill、corn-mino、corn 的光谱特性曲线图;[0027]图7c)是N-FINDR算法在原始数据中端元提取结果图;[0028]图7d)是N-FINDR算法在FFS-KSAM预处理后的端元提取结果图;[0029]图8是根据本发明实施例的端元提取数据预处理方法流程图。
【具体实施方式】
[0030]下面对本发明实施例涉及的定义进行说明:
[0031 ] 像素点ri的变异性大小由变异指数SIi衡量,若某像素点具有较强的光谱变异性,并在光谱特征空间淹没了真实的端元,该象元被定义为具有较高变异指数的像素。
[0032]本发明所述的方法可以被定义为:模糊特征空间核空间引力模型(Fuzzy FeatureSpace Kernel Spatial Attraction Model, FFS-KSAM)? 本发明首先对高光谱数据进行模糊特征空间变换,在模糊特征空间运用高斯径向基核函数优化的空间引力模型,在3X3的空间邻域窗口内对中心像素进行检测并判定该像元是否属于高变异指数像素。
[0033]线性混合模型假设:高光谱数据矩阵用X表示,其大小为LXN,其中L为波段总数,N为像元总数。第i个混合像素ri的光谱特性为端元的线性叠加,用(I)式表达如下:
【权利要求】
1.一种端元提取数据预处理方法,其特征在于,包括:获取高光谱图像;对所述高光谱图像对应的高光谱数据矩阵进行模糊聚类,得到每个像元在模糊特征空间的模糊属性,以该模糊属性特征向量取代所述矩阵中的光谱特征向量;对所述矩阵进行3X3邻域窗口内核空间引力模型的高变异指数像素检测和移除,移除闻变异指数像素,保留稳定像素点。
2.根据权利要求I所述的方法,其特征在于,模糊聚类的数目等于由虚拟维数法估计出的端元数目。
3.根据权利要求I所述的方法,其特征在于:运用高斯径向基核函数优化空间引力模型。模型的加权因子采用像素点距离加权因子,遍历计算全局像素点,为像素点定义变异指数。
4.根据权利要求I所述的方法,其特征在于:设定判定阈值因子α,其中α根据数据自身特性进行变化。
5.根据权利要求I所述的方法,其特征在于:所述模糊聚类包括模糊K-mean聚类。
【文档编号】G06T7/00GK103530875SQ201310466843
【公开日】2014年1月22日 申请日期:2013年10月9日 优先权日:2013年10月9日
【发明者】赵春晖, 田明华, 赵艮平, 王立国, 崔颖 申请人:哈尔滨工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1