基于图正则低秩表示维数约简的高光谱图像分类方法与流程

文档序号:12603465阅读:215来源:国知局
基于图正则低秩表示维数约简的高光谱图像分类方法与流程
本发明属于遥感图像处理技术领域,涉及基于图正则低秩表示方法,具体是一种基于图正则的低秩表示维数约简的高光谱图像分类方法,用于解决高光谱遥感数据维数约简和分类问题的方法。

背景技术:
高光谱遥感图像是通过成像光谱仪以几十乃至几百个波段同时对地表物成像,形成由连续波段图像组成三维数据立方体,实现地物空间信息、辐射信息、光谱信息的同步获取,具有“图谱合一”的特点,提高了对地物的分类能力以及监控能力,已经被广泛地应用于军事和民用的很多领域中,如环境监测,精细农业,目标识别等方面。高光谱遥感图像包含了丰富的空间、辐射和光谱三重信息,但是由于高光谱图像波段多,在邻近波段之间存在大量的冗余信息,而且巨大的数据量加大了高光谱图像处理的困难,导致计算复杂度很高,造成图像处理能力的浪费,也会降低高光谱图像的分类精度。有效地维数约简方法可以挖掘高光谱图像的可判别信息,提取出高光谱图像最重要的特征,不仅可以减小运算量,而且还可以提高高光谱图像分类的正确率,因此维数约简在高光谱图像分类的应用中具有十分重要的作用。常见的维数约简方法主要分为线性降维和非线性降维两大类。主成分分析主成分分析方法(PrincipalComponentAnalysis,PCA)是一种最常见的线性降维方法,它的主要目标是通过线性变换寻找一组最优的单位正交向量基,并用它们的线性组合来重构原样本。线性判别分析(LinearDiscriminantAnalysis,LDA)是一种有监督的线性降维方法,它主要目标是最大化类间散度并同时最小化类内散度,LDA需要充足的有标签样本,但是高光谱图像的样本标签的获取非常困难,而且,PCA和LDA的全局的线性数据限制了他们在非高斯分布数据上的有效性。非线性方法主要有基于核的方法以及近年来的流形学习方法,例如等距特征映射(Isometricfeaturemapping,ISOMAP),局部流形嵌入(Locallylinearembedding,LLE)等,ISOMAP是一种通过保持流形上两点间的侧地线距离来保持数据间的全局几何特性,它保证了降维结果的稳健性和全局最优性,但是运算复杂度非常高,对计算设备的内存需求很大。目前高光谱图像降维方法主要存在的问题是:需要处理的数据量很大,不能很好地保留高光谱图像数据提供的所有有用信息;流形学习的降维方法挖掘了高光谱图像的局部流形结构信息,但是计算复杂度较高;在降维过程中没有同时考虑到高光谱图像的噪声影响。

技术实现要素:
本发明的目的在于针对现有技术的不足,提出一种挖掘高光谱图像局部流形结构信息,有效提高高光谱图像分类的正确率的基于图正则低秩表示的高光谱维数约简图像分类的方法。本发明是一种基于图正则低秩表示维数约简的高光谱图像分类方法,包括如下步骤,包括如下步骤:步骤1:输入高光谱图像X,该高光谱图像X包含c类像素点,所有类别像素点共有N个像素点,N个像素点是每一类图像所有像素点的和总数,图像的每一个像素点为一个样本,第i个样本用一个特征向量xi表示,i是样本的序号,i=1,...,N,R表示实数域,样本的特征维数为H。步骤2:根据均值漂移方法将高光谱图像X分割成M块,得到预分割后的高光谱图像XG,对分割后的每一个图像块里的所有样本点做平均,每一个图像块得到一个新样本点m=1,...,M,得到新样本集步骤3:使用图正则低秩表示计算新的样本集Xnew的图正则低秩系数矩阵Z,采用非精确增广拉格朗日乘子法获得图正则低秩系数矩阵Z;步骤4:根据图正则低秩系数矩阵Z,构造基于高光谱图像的新样本集Xnew的特征值方程f,设置降维后的维数d,并学习出降维映射矩阵A;步骤5:将原始高光谱图像X通过降维映射矩阵A映射到低维空间Rd中,得到降维后的样本集x′i是降维后的样本集X′的第i个样本;步骤6:在降维后的样本集X′中每类选取t个样本作为训练样本集Xp,其余的样本作为测试样本集Xq,将训练样本集Xp输入到支撑矢量机SVM中进行分类,学习出来一个分类器,然后将测试样本集Xq输入到这个分类器中,得到测试样本Xq的分类标签向量Y,标签向量Y是高光谱图像X的分类结果。针对高光谱图像降维技术中没有高效地挖掘高光谱图像的局部流形结构信息,很好地保持原图的空间分布特性,本发明的技术方案是,利用均值漂移技术对高光谱图像进行预分割;然后对预分割后的高光谱图像进行图正则低秩表示数据,获取图正则低秩系数矩阵;根据图正则低秩系数矩阵构造出特征值方程;学习出维数约简的映射矩阵,将原始高维数据转换到低维空间中再进行分类。本发明中,对于高光谱图像进行均值漂移预分割不仅减小了图正则低秩表示的计算复杂度,同时也利用到高光谱图像的区域一致性结构特性。使用图正则低秩表示将原图像映射到低秩子空间进行降维维护了原图的空间分布信息,图正则低秩表示方法很好地表示高光谱图像全局信息,同时挖掘出高光谱图像的局部流形结构信息,根据图正则低秩表示系数获取有效地降维映射矩阵,从而提高了高光谱图像的分类正确率,更好地解决了高光谱图像分类的问题。本发明的实现还在于:步骤3所述的构造图正则的低秩表示计算新的样本集Xnew的低秩系数矩阵Z,按照如下步骤进行:3a)用高斯核函数计算新的样本集Xnew的相似性矩阵W,对W每一行进行求和,得到一个列向量Q,对Q进行对角化,得到对角矩阵D,然后计算拉格朗日算子L=D-W;3b)建立基于图正则低秩表示方法的数学模型采用非精确增广拉格朗日乘子法求解该模型,获得新的样本集Xnew的低秩系数矩阵Z,其中,Z∈RM×M表示低秩系数矩阵,E∈RM×M表示误差矩阵,λ1是控制误差矩阵的参数,λ2是控制图正则项Tr(ZLZ)的参数,Tr(·)表示求矩阵的迹,||·||*表示核范数函数,即矩阵奇异值的和,i,j=1,..,M表示l2,1范数。高光谱图像具有区域一致性,所以预分割后的每个图像块基本上类属于同一类别,每个图像块内空间相关程度高,谱段信息相似性高。本发明使用均值漂移法图像预分割后的图像块的均值进行图正则低秩表示,有效地解决了图正则低秩表示运算时间长的问题。使用图正则低秩表示将高光谱图像映射到低秩子空间进行降维,保持了原图的空间分布信息,图正则低秩表示很好地表示出高光谱图像样本间相似性,从而更好地获取高光谱图像的全局信息,同时也挖掘了高光谱图像的局部流形结构信息,而且对图像的噪声更具有鲁棒性,有效地提高高光谱图像分类的正确率,从而获得更好的分类性能。本发明与现有的技术相比具有以下优点:1、本发明由于采用了结合均值漂移预分割的图正则低秩表示方法,不仅降低了图正则低秩表示的计算复杂度,抑制高光谱图像噪声,保持高光谱图像的空间分布特性,而且还可以更加有效地表示出高光谱图像的全局信息,挖掘高光谱图像的局部流形结构信息,能够获得更理想降维映射矩阵,从而获得高维数据在低维空间中更精确的表示,提高后续分类的准确率。2、本发明由于采用维数约减算法对高光谱图像数据进行降维后再分类,很大程度上减少了计算量,提高了分类的速度。对比实验表明,本发明有效提高了高光谱遥感图像的分类准确率,降低了计算的复杂度。附图说明图1是本发明的流程示意图;图2是本发明仿真采用的IndianPine图像;图3是本发明与现有方法在有标记样本数目不同时,采用不同的特征维数得到的分类结果曲线图。具体实施方式下面结合附图和实施例对本发明再作说明实施例1本发明提出了一种基于图正则低秩表示降维的高光谱图像分类方法。目前高光谱图像在军事和民用领域中得到极其重要的应用。但由于高光谱图像的丰富的谱段信息包含了大量的冗余信息,巨大的数据量也影响到高光谱图像的分类效率以及分类精度,因此高光谱图像的降维在高光谱图像分类应用中具有十分重要的作用。针对现有高光谱图像降维方法没有很好地保持高光谱图像的空间分布特性,高效地挖掘高光谱图像的局部流形结构信息等不足,结合均值漂移预分割和图正则低秩表示,本发明提出了一种基于图正则低秩表示降维的高光谱图像分类方法。参照图1,本发明的具体实施步骤包括:步骤1:输入高光谱图像X,该高光谱图像X包含c类像素点,所有类别像素点共有N个像素点,N个像素点是每一类图像所有像素点的和总数,图像的每一个像素点为一个样本,第i个样本用一个特征向量xi表示,i是样本的序号,i=1,...,N,R表示实数域,样本的特征维数为H,根据高光谱图像的波段数目,H的范围一般是几十至几百。步骤2:根据均值漂移方法将高光谱图像X分割成M块,得到预分割后的高光谱图像XG,对分割后的每一个图像块里的所有样本点做平均,每一个图像块得到一个新的样本点m是新样本的序号,m=1,...,M,得到新的样本集具体步骤如下:2a)随机取出高光谱数据X中一个样本点x,以x为圆心,h为半径,做一个空间球Sh,如图2所示,所有落在球内的点xi∈Sh为x的邻域样本,h的取值是根据经验选取,h的取值越小,分块越多,本例中空间球半径h=20;2b)根据高斯核函数得到邻域样本xi和样本x之间的相似度;2c)计算高斯核函数的导数的负方向,即2d)根据式得到空间球Sh内所有邻域样本xi对应的均值漂移向量m(x);2e)如果m(x)<ε时,即收敛,得到x的均值漂移向量;如果m(x)>ε时,则返回2b),继续执行,直到满足收敛条件。阈值ε是根据经验选取,选取的值越小则分割的图像块越小,本例中ε=10-5;2f)重复执行2a),2b),2c),2d),2e),直到遍历所有样本数据x;根据半径h,利用种子生长法对高光谱图像X进行区域标号,最后计算相同标号的样本的均值,得到一个基于图像分块的新的样本集M是新样本的总个数,本例中所用到的IndianPine数据集中,M=161。本发明对获取图像进行预分割,是结合图像自身区域的一种块的分割,尤其针对在高光谱图像,具有高度区域一致性性质的图像具有特殊的意义,例如高光谱图像中河流,植被,建筑物等同类别中相似性很高,即可预分割为同一类,能非常有效地加速图像的处理。步骤3:使用图正则的低秩表示计算新的样本集的低秩系数矩阵Z。建立基于图正则低秩表示方法的数学模型采用非精确增广拉格朗日乘子法求解该模型,获得新的样本集Xnew的低秩系数矩阵Z,其中,Z∈RM×M表示低秩系数矩阵,E∈RM×M表示误差矩阵,λ1是控制误差矩阵的参数,λ2是控制图正则项Tr(ZLZ)的参数,Tr(.)表示求矩阵的迹,||·||*表示核范数函数,即矩阵奇异值的和,i,j=1,...,M表示l2,1范数。λ1和λ2的取值均按照经验取值,λ1和λ2的取值范围一般为0到10。上述优化问题通过非精确增广拉格朗日乘子法求解出图正则的低秩系数矩阵Z。具体步骤如下:3a)用高斯核函数计算新的样本集Xnew的相似性矩阵W,对W每一行进行求和,得到一个列向量Q,对Q进行对角化,得到对角矩阵D,然后计算拉格朗日算子L=D-W;3b)令低秩系数矩阵Z,等价矩阵一J和等价矩阵二S分别为M×M的零矩阵,其中M表示预分割后的样本的总数;误差矩阵E和拉格朗日乘子矩阵Y1,Y2,Y3分别为d×M的零矩阵,其中d是原始样本要降到的维数;矩阵步长参数μ的初始值等于10-6;3c)采用下列公式更新等价矩阵一J:其中Jp表示等价矩阵一J更新后的值,||·||*表示核范数函数,Y2表示拉格朗日乘子矩阵,i,j=1,...,M表示矩阵F范数的平方;3d)采用下列公式更新等价矩阵二S:Sp=(λ1L+μI)-1(Y3+uZ)其中Sp表示等价矩阵二S更新后的值,I表示M×M的单位矩阵,(·)-1表示(·)的逆矩阵,Y3表示拉格朗日乘子矩阵;3e)采用下列公式更新低秩系数矩阵Z:其中Zp表示低秩系数矩阵Z更新后的值;Xnew表示新的样本矩阵,是新的样本矩阵Xnew的转置矩阵,E表示误差矩阵;3f)采用下列公式更新误差矩阵E:其中Ep表示误差矩阵E更新后的值;3g)采用下列公式分别更新拉格朗日乘子矩阵Y1,Y2和Y3:Y1p=Y1+μ(Xnew-XnewZp-Ep)Y2p=Y2+μ(Zp-Jp)Y3p=Y3+μ(Zp-Sp)其中,Y1p,Y2p和Y3p分别表示拉格朗日乘子矩阵Y1,Y2和Y3更新后的值;3h)采用下列公式更新步长参数μμp=min(106,1.1×μ)其中μp为步长参数μ更新后的值,min为取括号内两数的最小值;3i)判断以下表达式是否满足收敛条件,若满足,则得到最后的低秩系数矩阵Z,若不满足,则返回本步骤3c)继续执行,直到满足收敛条件||Xnew-XnewZp-Ep||∞<10-10,||Zp-Jp||∞<10-10和||Zp-Sp||∞<10-10其中||·||∞表示矩阵的无穷范数。步骤4:根据低秩系数矩阵Z,构造基于高光谱图像的新的样本集Xnew的特征值方程f,设置降维后的维数d,并学习出降维映射矩阵A,具体步骤如下:4a)对最后的低秩系数矩阵Z的每一行进行求和,得到一个列向量Q’,对Q’进行对角化,得到对角矩阵D’,然后计算拉格朗日算子L′=D′-Z;4b)构造特征值方程e=1,...,d,其中,ae是第e个特征向量,γ表示特征值,d是降维后的维数,d<H;4c)求解出特征值方程的d个最大特征值γ1,γ2,...,γd及其对应的特征向量a1,a2,…ad;4d)由特征向量a1,a2,…ad构造出降维映射矩阵A=[a1,a2,…ad]∈RH×d,并将原始样本集X通过矩阵A映射到低维空间中,得到新的降维后的样本集步骤5:将原始高光谱图像X通过降维映射矩阵A映射到低维空间Rd中,得到新的降维后的样本集x′i是降维后的样本集X′的第i个样本。步骤6:在降维后的样本集X′中每类选取t个样本作为训练样本集Xp,其余的样本作为测试样本集Xq,将训练样本集Xp输入到支撑矢量机SVM中进行分类,学习出来一个分类器,然后将测试样本集Xq输入到这个分类器中,得到测试样本Xq的分类标签向量Y,标签向量Y是高光谱图像X分类的结果。本发明由于采用了结合均值漂移预分割的图正则低秩表示方法,不仅降低了图正则低秩表示的计算复杂度,抑制图像噪声,保持原图像的空间分布特性,而且还可以更加有效地表示出高光谱图像的全局信息,挖掘高光谱图像的局部流形结构信息,能够获得更理想降维映射矩阵,从而获得高维数据在低维空间中更精确的表示,提高后续分类的正确率。本发明有效地对高光谱图像进行降维,提高高光谱图像处理的效率,适用于各种高光谱图像,尤其在目标识别,环境监测等时效性的应用中具有重要的实际意义。本发明的效果可以通过以下仿真实验进一步说明:实施例2基于图正则低秩表示降维的高光谱图像分类方法,同实施例11.仿真条件:仿真实验采用美国宇航局NASA喷气推进实验室的空载可见光/红外成像光谱仪AVIRIS于1992年6月在印第安纳西北部获取的IndianPine图像,如图2所示,图像大小为145×145,共220个波段,去除噪声以及大气和水域吸收的波段还有200个波段,共16类地物信息,主要类别信息在表1中列出。表1:IndianPine图像的类别属性类别序号类别样本数1Alfalfa462Corn-notill14283Corn-mintill8304Corn2375Grass-pasture4836Grass-trees7307Grass-pasture-mowed288Hay-windrowed4789Oats2010Soybean-notill97211Soybean-mintill245512Soybean-clean59313Wheat20514Woods126515Buildings-Grass-Trees-Drives38616Stone-Steel-Towers93仿真实验在CPU为IntelCore(TM)2Duo、主频2.33GHz,内存为2G的WINDOWS7系统上用MATLABR2012b软件进行。2.仿真内容及分析:使用本发明与现有三种方法对高光谱图像IndianPine进行分类,现有四种方法分别是:支撑矢量机SVM,主成分分析结合支撑矢量机PCA+SVM,核主成分分析结合支撑矢量机KPCA+SVM。本发明基于图正则低秩表示降维结合支撑矢量机的缩写为GRLRR+SVM。其他各类分类方法有SVM、PCA+SVM、KPCA+SVM这些分类方法中的分类器SVM核参数g对应上述顺序,分别设置为10-9,10-9,10-8,本发明MSLRR+SVM中的分类器SVM核参数g设置为10-6,所有方法的惩罚因子C一律设置为10000。本例中拉普拉斯正则项参数λ1设置为1.5,低秩表示中的噪声参数λ2设置为0.0001。从IndianPine数据中选取部分像素点作为有标记像素点,剩余像素点作为无标记像素点,用本发明与现有三种方法对IndianPine数据进行20次分类实验,取分类结果的平均值,作为最终分类正确率,如图3所示,其中图3a是有标记样本数目为全部样本的5%时的分类结果曲线图,图3b是有标记样本为全部样本数的10%时的分类结果曲线图。图3a是四种方法在有标记样本数为总样本数的5%时的分类正确率与特征维数的曲线关系图,图3b是四种方法在有标记样本数为总样本数的10%时的分类正确率与特征维数的曲线关系图,横坐标为特征维数,维数范围是3至50,纵坐标为分类正确率。从图3a可以看出当特征维数大于12时,本发明的分类正确率高于SVM,且在20维以后趋于稳定;从图3b中可以看出当特征维数大于13时,本发明的分类正确率也高于其他方法。从图3a和图3b中可以看出,在维数大于26后,本发明的结果趋于稳定,因此只需要采用26维特征,即可以得到较高的识别率,从而大大减少了计算量。实施例3基于图正则低秩表示降维的高光谱图像分类方法,同实施例1,仿真数据和条件同实施例2.如表2所示,表2是每类选取不同训练样本数时,高光谱图像IndianPine的分类正确率,表2中的结果是30次随机选取训练样本数的分类结果的平均值,MRLRR、PCA和KPCA维数约简到30维,LDA维数约简到15维。本例中,每类分别随机选取8个、12个作为训练样本,其余作为测试样本。从表2中看出,训练样本极少时,本发明的分类正确率要高于其他方法,且随着训练样本书增加,分类正确率也随之提高,优于其他方法。因为LDA对有标签样本的数量要求较高,所以LDA在样本点很少的时候效果很差。由于高光谱图像很难获取有标记信息,因此,本发明学习出来的映射空间更容易进行分类,仅用很少的训练样本即可得到较好的分类性能,对于高光谱图像的分类具有非常重要的作用。表2:每类选取不同训练样本数时的高光谱图像INDIANPINE的分类正确率(%)方法每类选取8个训练样本每类选取12个训练样本MRLRR+SVM66.0172.71KPCA+SVM60.4165.15PCA+SVM62.6066.28LDA+SVM26.0927.08SVM62.8665.99综上,本发明在基于图正则低秩表示维数约减的基础上结合支撑矢量机对高光谱图像进行分类,图正则的低秩表示不仅能够挖掘高光谱图像样本间的相似性,而且考虑到高光谱图像的局部流形结构,因此,本发明学习出来的降维映射矩阵同时利用了高光谱图像的全局和局部结构信息,此外,利用均值漂移对图像进行预分割也减少了低秩表示的计算复杂度。本发明能够在高光谱图像分类上得到较高的分类正确率,与现有的方法相比具有一定的优势。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1