一种面向扎龙湿地遥感图像密度峰值聚类方法与流程

文档序号:15852779发布日期:2018-11-07 10:23阅读:181来源:国知局
一种面向扎龙湿地遥感图像密度峰值聚类方法与流程

本发明属于图像处理领域,尤其涉及一种面向扎龙湿地遥感图像密度峰值聚类方法。

背景技术

遥感技术诞生于上个世纪六十年代,是一门以地理学和物理学为基础,结合了计算机,信号处理,空间监测等科学的综合学科。通过卫星或者航空器上的多个传感器记录下各种地物电磁波的图片,用于环境监测,资源勘探,军事侦察等领域。随着成像光谱技术的发展与成熟,高光谱图像成为了遥感图像的主要成像方式。高光谱图像在获得地表图像信息的同时,也获得其光谱信息,第一次真正做到了光谱与图像的结合。与多光谱遥感影像相比,不仅在信息丰富程度方面有了极大的提高,在处理技术上,对该类光谱数据进行更为合理、有效的分析处理提供了可能。在提供了更为丰富的光谱信息的同时,高光谱图像也造成了“同物异谱,同谱异物”等现象,为我们后期的遥感图像处理带来了难度。

遥感图像聚类作为主要对高光谱图像处理进而得到更详细的地物信息的有效手段之一,一直以来得到了学者广泛地关注。尤其是在图像分辨率与以往相比有了较大提升的情况下,一个优秀的图像处理方法的出现对于我们进一步获取地物的详细信息显得更为重要。与分类问题不同,聚类是一种无监督的学习。对于遥感图像分类,需要预先提取部分目标图像作为训练样本,在训练集中每个类别都具有属于自己的标签,在训练完成得到一个成熟的分类模型之后再对目标图像进行处理。虽然提升了精确度,但是时间复杂度也提高很多,并且由于训练集和先验知识的影响,导致算法不稳定。而聚类算法由于时间复杂度相对较低,而且没有使用训练集预先训练模型排除了人为干扰等因素,能有效减少对含量较少的地物光谱的丢失,适用于高光谱图像中不同波段间的多幅图像。

遥感图像聚类的方法主要包括以下几种:

1.k-means遥感图像聚类算法:

k-means算法作为一种无监督的聚类算法具有简单,快速,高效等优点。但是必须要预先指定聚类数目,同时要确定初始聚类中心点。中心点确定后,通过计算各个像素点与聚类中心得距离以所有像素点距离的标准最低为准则来更新聚类中心。通过不断地迭代过程,最终完成所有像素点的类别划分。在聚类的过程中,类别数目是预先设定好的,因此会导致最终聚类结果不准确,出现高光谱图像像素点错分漏分的情况。其次,中心点的确定完全是人为设定,选取不同的中心点会造成最终结果出现较大偏差,导致算法不稳定为后续对图像信息的进一步提取带来阻碍。当遥感图像特征差异较大时,该算法必须先分为若干个类,在经过整理合并才能得到最终的结果。当图像内的波谱特征比较复杂时,该算法在聚类中心和数目的选择上需要大量的判读工作才能确定。湿地地貌特征复杂,具有城镇,草地,湖泊,农田等十几种地貌特征,此时k-means算法显得不再适用。

2.模糊c均值遥感图像聚类算法:

模糊c均值算法是一种结合了无监督聚类和模糊集概念的图像处理技术,在算机视觉,图像处理等领域具有广泛应用。该算法对于像素点的划分与要求每个像素点只能属于一个类簇中心的硬划分聚类算法不同,通过对模糊集的应用,构建像素点和聚类中心的隶属度矩阵来进行聚类。在某些数据点类别不清晰的数据集上可以取得比普通聚类算法更优秀的结果。但是,该算法同样也存在以下缺陷。它易受初始聚类中心和初始隶属度矩阵的影响,可能收敛到局部极小值,影响着分割的效果;在大量数据集的情况下,比如说遥感图像,模糊c-均值的反复迭代就会造成算法耗时过长。而随着传感器的不断改进,现代遥感图像的像素和分辨率也越来越高,模糊c均值算法在聚类过程中需要反复迭代运算,更加延缓了该算法的收敛速度。

从以上分析来看,目前这两种现有的聚类算法均不适用于湿地的特殊的地理环境分析。因此,针对湿地的遥感图像聚类算法的研究显得十分有意义。



技术实现要素:

本发明的目的在于公开适用于湿地的聚类结果稳定的普适性好的一种面向扎龙湿地遥感图像密度峰值聚类方法。

本发明的目的是这样实现的:

一种面向扎龙湿地遥感图像密度峰值聚类方法,包含如下步骤:

步骤(1):首先对得到的湿地的高光谱图像进行筛选,人为选择出地物清晰,地貌特征明显,分辨率较高并且拍摄时没有或者只有较少云层遮挡的多幅高光谱图像;

步骤(2):用中值滤波器和主成分分析法对多幅高光谱图像进行预处理得到pc1:

采用中值滤波器处理多幅高光谱图像;对中值滤波器处理后的多幅高光谱图像中的每一张采用主成分分析法进行降维处理,在尽量保存原始信息的同时去除与分析指标无关的以及重复的变量。选取样本方差作为综合指标函数指导样本选取,从降维处理后的多幅高光谱图像中选取方差最大的作为pc1;

步骤(3):对pc1进行尺度变换:

采用弱采样的方式进行尺度变换,将待处理的子图尺寸由axb变换为a1xb1,其中a1=a/ksize且b1=b/ksize;ksize为尺度变换指数;

步骤(4):进行pc1的像素点间的相似度计算:

以尺度变换后的pc1的左上角为原点,水平线为x轴,竖直线为y轴建立直角坐标系;

假设经过步骤(3)处理后的子图包含m行n列个像素点,建立含有n=m*n个数据的像素数据集;单个数据包含该像素点在rgb彩色空间下r,g,b分量方向上的像素值,以及位置信息等特征信息;

假设像素点p1,p2属于该像素数据集,则像素点p1,p2的相似度dsim(p1,p2):

dsim(p1,p2)=βdrgb+(1-β)dxy;

上式中,r1表示像素点p1在rgb空间下r分量方向上的像素值,g1表示像素点p1在rgb空间下g分量方向上的像素值,b1表示像素点p1在rgb空间下b分量方向上的像素值;r2表示像素点p2在rgb空间下r分量方向上的像素值,g2表示像素点p2在rgb空间下g分量方向上的像素值,b2表示像素点p2在rgb空间下b分量方向上的像素值;(x1,y1)为像素点p1的坐标,(x2,y2)为像素点p2的坐标;β为权重因子,β∈(0,1);

步骤(5):用密度峰值聚类算法进行聚类处理:

计算各个点的局部密度,创建局部密度矩阵{ρi}:

图像的像素集指标集为is={1,2,...m*n},dij表示像素点i和像素点j的相似度,dc为人为设定的截断距离;

计算各个像素点间与比该像素点具有更高局部密度的像素点的距离值,创建距离矩阵

表示的一个降序排列,即:ρq1≥ρq2≥...≥ρqn;

定义δqi:

当i≥2,

当i=1时,

步骤(6):将局部密度矩阵以及距离矩阵和改进的粒子群演化算法结合,找出最适合作为聚类中心的所有像素点:

在解空间初始化整个种群,将每个像素点均当做粒子群算法中的个体;赋予每个粒子初始速度以及位置,同时在搜索过程中记录每个粒子自身到达的最优位置,以及整个种群的最优个体;

目标函数设定为:

找到局部密度与距离均得到较大值的像素点作为聚类中心,即使目标函数取得最小值的解;

步骤(7):以作为聚类中心的像素点为中心,根据局部密度矩阵以及截断距离对其余的像素点进行划分;

步骤(8):输出处理完毕的遥感图像。

本发明的有益效果为:

本发明在尽量保留图像信息的基础上降低了整个算法的时间复杂度,解决了现有聚类算法选择聚类中心受先验知识影响导致聚类结果不稳定的问题;结合粒子群演化算法,将该问题转化为寻找最优解;密度峰值算法更具有普适性;在时间复杂度允许的情况下,本发明很好地解决了高光谱图像“同物异谱,同谱异物”的问题。

附图说明

图1是一种面向扎龙湿地遥感图像密度峰值聚类方法流程图;

图2是粒子群算法流程图。

具体实施方式

下面结合附图来进一步描述本发明:

如图1,一种面向扎龙湿地遥感图像密度峰值聚类方法,包含如下步骤:

步骤(1):首先对得到的湿地的高光谱图像进行筛选,高光谱图像是航空器或者人造卫星通过传感器收集的不同地貌反射的电磁波。多幅高光谱由于其拍摄时间不同,拍摄时的气候,环境,天气等对遥感图像的影响较大,人为选择出地物清晰,地貌特征明显,分辨率较高并且拍摄时没有或者只有较少云层遮挡的多幅高光谱图像;

步骤(2):用中值滤波器和主成分分析法对多幅高光谱图像进行预处理得到pc1:

针对遥感图像中的椒盐现象,采用中值滤波器处理多幅高光谱图像;中值滤波器把数字图像或数字序列中一点的值用该点的一个领域中各点值的中值代换,主要功能是让周围像素灰度值的差比较大的像素改取与周围的像素值接近的值,从而可以消除孤立的噪声点,便于后续对遥感图像的特征提取,降维。

目前所得到的的高光谱图像均为分辨率较高,所含信息量较为丰富的遥感影像,直接用来做图像聚类处理的原始数据会造成时间复杂度较高,甚至无法处理的情况。所以对中值滤波器处理后的多幅高光谱图像中的每一张采用主成分分析法进行降维处理,在尽量保存原始信息的同时去除与分析指标无关的以及重复的变量。选取样本方差作为综合指标函数指导样本选取,从降维处理后的多幅高光谱图像中选取方差最大的作为pc1;

步骤(3):对pc1进行尺度变换:

采用弱采样的方式进行尺度变换,尽量降低聚类过程中的像素点个数,同时又尽量保留了遥感图像的特征信息。将待处理的子图尺寸由axb变换为a1xb1,其中a1=a/ksize且b1=b/ksize;ksize为尺度变换指数;

步骤(4):进行pc1的像素点间的相似度计算:

以尺度变换后的pc1的左上角为原点,水平线为x轴,竖直线为y轴建立直角坐标系;

假设经过步骤(3)处理后的子图包含m行n列个像素点,建立含有n=m*n个数据的像素数据集;单个数据包含该像素点在rgb彩色空间下r,g,b分量方向上的像素值,以及位置信息等特征信息;

假设像素点p1,p2属于该像素数据集,则像素点p1,p2的相似度dsim(p1,p2):

dsim(p1,p2)=βdrgb+(1-β)dxy;

上式中,r1表示像素点p1在rgb空间下r分量方向上的像素值,g1表示像素点p1在rgb空间下g分量方向上的像素值,b1表示像素点p1在rgb空间下b分量方向上的像素值;r2表示像素点p2在rgb空间下r分量方向上的像素值,g2表示像素点p2在rgb空间下g分量方向上的像素值,b2表示像素点p2在rgb空间下b分量方向上的像素值;(x1,y1)为像素点p1的坐标,(x2,y2)为像素点p2的坐标;β为权重因子,β∈(0,1);

步骤(5):用密度峰值聚类算法进行聚类处理:

计算各个点的局部密度,创建局部密度矩阵{ρi}:

图像的像素集指标集为is={1,2,...m*n},dij表示像素点i和像素点j的相似度,dc为人为设定的截断距离;

计算各个像素点间与比该像素点具有更高局部密度的像素点的距离值,创建距离矩阵

表示的一个降序排列,即:ρq1≥ρq2≥...≥ρqn;

定义δqi:

当i≥2,

当i=1时,

步骤(6):将局部密度矩阵以及距离矩阵和改进的粒子群演化算法结合,找出最适合作为聚类中心的所有像素点:

如图2,在解空间初始化整个种群,将每个像素点均当做粒子群算法中的个体;赋予每个粒子初始速度以及位置,同时在搜索过程中记录每个粒子自身到达的最优位置,以及整个种群的最优个体;

目标函数设定为:

局部密度与距离均得到较大值的像素点做为聚类中心最为适合,为了保证局部密度与距离处在同一数量级,先对局部密度与距离进行归一化操作,找到局部密度与距离均得到较大值的像素点作为聚类中心,即使目标函数取得最小值的解;为了增加粒子的寻优能力,避免陷入局部最优解,除了传统粒子群算法使用的惯性权重用来保持粒子在寻优初期具有较高的速度以免陷入局部最优以外,在粒子寻优过程中加入柯西算子以保证粒子具有一定程度的变异性,使其在寻找最优解的同时能有一定概率跳出局部最优。

步骤(7):以作为聚类中心的像素点为中心,根据局部密度矩阵以及截断距离对其余的像素点进行划分;

找到该图像中最适合作为聚类中心的像素点之后,以这些像素点为中心,根据局部密度矩阵以及截断距离等对其余像素点进行划分。由于在之前的步骤中已经计算过各个像素点之间的距离以及每个像素点自身的局部密度,在聚类过程中并不需要进行多次迭代计算,根据现有的参数足以对整个湿地的遥感图像中的所有像素点进行聚类划分,很大程度上减少了整个算法的时间复杂度。聚类过程完成之后,输出处理完毕的遥感图像。

步骤(8):输出处理完毕的遥感图像。

本发明在尽量保留图像信息的基础上降低了整个算法的时间复杂度,解决了现有聚类算法选择聚类中心受先验知识影响导致聚类结果不稳定的问题;结合粒子群演化算法,将该问题转化为寻找最优解;密度峰值算法更具有普适性;在时间复杂度允许的情况下,本发明很好地解决了高光谱图像“同物异谱,同谱异物”的问题。

以上所述并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1