基于光谱和邻域信息字典学习的高光谱图像分类方法与流程

文档序号:12009452阅读:250来源:国知局
基于光谱和邻域信息字典学习的高光谱图像分类方法与流程
本发明属于图像处理技术领域,更进一步涉及高光谱图像分类技术领域中的一种基于光谱和邻域信息字典学习的高光谱图像分类方法。本发明可用于对高光谱图像进行地物分类。

背景技术:
高光谱图像空域和谱域分辨率的提高,为分类提供了更加丰富信息的同时,也带来了巨大的挑战。传统的分类方法包括最大似然分类法、决策树分类法、人工神经网络分类方法、支撑向量机分类方法都仅仅从光谱域层面对地物特征进行分类。然而,高光谱遥感数据不仅包含丰富的地物光谱信息,而且在图像空间维、光谱维两个不同的维度都会对地物特征有具体的描述和表达。传统的高光谱图像分类方法,往往只着重于数据光谱维上的特性,而忽视了空间维的信息,从而使分类精度受到一定的限制。西安电子科技大学在其专利申请“基于均值漂移和组稀疏编码的高光谱图像空谱域分类方法”(专利申请号:201310161280.X,公开号:CN103208011A)中提出了一种基于均值漂移和组稀疏编码的高光谱图像空谱域分类方法。该方法的具体步骤是:首先,使用均值漂移算法mean-shift对高光谱图像作过分割,根据分割结果对高光谱样本进行分组;其次,利用组稀疏编码对分组后的高光谱样本进行稀疏编码;最后,利用支撑向量机和构造的样本集对高光谱样本进行分类。该方法虽然能够很好的利用高光谱图像的空域上下文信息,但是仍然存在的不足是,mean-shift分割方法易产生过分割问题,在边缘地区的分类效果不是很好。西安电子科技大学在其专利申请“基于局部协同表示和邻域信息约束的高光谱图像分类方法”(专利申请号:201310025247.4,公开号:CN103065160A)中提出了一种基于局部协同表示和邻域信息约束的高光谱图像分类方法。该方法的具体步骤是:首先,利用高光谱图像的邻域相似性来约束测试样本和训练样本之间的线性相关性,求解测试样本通过字典协同表示的系数;然后,结合该系数的能量大小,选择N个贡献程度最大的原子构成新的字典,利用新的字典对测试样本进行第二次协同表示。通过计算测试样本和第二次协同表示重构各部分之间的残差,得到最后的分类结果。该方法虽然能够快速地对高光谱图像进行分类,但是仍然存在的不足是,通过比较欧式距离获取邻域样本集矩阵,不能很好的获取样本的邻域信息,导致在同质区域的分类效果不好。

技术实现要素:
本发明的目的在于克服上述已有技术的不足,提出了一种基于光谱和邻域信息字典学习的高光谱图像分类方法,本发明可以充分利用高光谱图像中地物的光谱信息和邻域信息,在边缘和同质区域都能达到理想的分类效果。为实现上述目的,本发明的具体步骤如下:(1)输入高光谱图像。输入待分类的高光谱图像,将输入的高光谱图像中的每一个像素点设定为一个样本。(2)获得样本集。(2a)对高光谱图像所有样本的坐标位置,采用坐标变换方法,得到高光谱图像光谱域的样本集。(2b)设定一个7×7大小的高光谱图像光谱域样本窗口,对高光谱图像光谱域的样本集进行均值滤波,得到高光谱图像邻域的样本集。(3)确定训练样本集与测试样本集。(3a)采用等概率采样的方法,在高光谱图像光谱域的样本集中,依次随机选取10%的样本,作为高光谱图像光谱域的训练样本集,并记录高光谱图像光谱域训练样本集的坐标位置;将剩余90%的样本,作为高光谱图像光谱域的测试样本集。(3b)在高光谱图像的邻域样本集中,选取与高光谱图像光谱域训练样本集的坐标位置对应的样本,作为高光谱图像邻域的训练样本集,将剩余90%的样本作为高光谱图像邻域的测试样本集。(4)字典学习。(4a)对高光谱图像光谱域训练样本集,采用字典学习方法,得到高光谱图像光谱域训练样本集的稀疏编码系数和字典。(4b)对高光谱图像邻域训练样本集,采用字典学习方法,得到高光谱图像邻域训练样本集的稀疏编码系数和字典。(5)求测试样本集稀疏系数。(5a)对高光谱图像光谱域测试样本集,采用稀疏编码系数更新公式,得到高光谱图像光谱域测试样本集的稀疏系数。(5b)对高光谱图像邻域训练样本集,采用稀疏编码系数更新公式,得到高光谱图像邻域训练样本集的稀疏系数。(6)加权稀疏系数:(6a)对高光谱图像光谱域训练样本集与高光谱图像邻域训练样本集的稀疏系数,采用加权公式,计算高光谱图像光谱域训练样本集的稀疏系数。(6a)对高光谱图像光谱域测试样本集与高光谱图像邻域测试样本集的稀疏系数,采用加权公式,计算高光谱图像光谱域测试样本集的稀疏系数。(7)高光谱图像分类:利用线性支撑向量机分类器,对高光谱图像光谱域测试样本集的稀疏系数进行分类,得到分类的高光谱图像。(8)输出分类图像。本发明与现有的技术相比具有以下优点:克服了传统高光谱图像分类方法只利用高光谱图像的光谱信息,忽略了高光谱图像的邻域信息的问题。本方法充分利用了高光谱图像提供的光谱和邻域信息,实现了对高光谱图像的精细分类。(1)本发明采用结合高光谱图像的光谱信息和邻域信息的分类方法,克服了现有技术只利用高光谱图像的光谱信息,对高光谱图像分类会导致边缘部分错分的缺点,使得本发明具有在边缘部分分类更加精确的优点。(2)本发明采用均值滤波获取高光谱图像的邻域信息,克服了现有技术中不能有效利用高光谱图像邻域信息的缺点,使得本发明具有在同质区域分类效果更好的优点。附图说明图1是本发明的流程图;图2是本发明与现有技术对印第安松树IndianPines高光谱图像的分类结果对比图。具体实施方式下面结合附图对本发明做进一步的描述。参照附图1,本发明的实现步骤如下:步骤1,输入高光谱图像。输入待分类的高光谱图像,将输入的高光谱图像中的每一个像素点设定为一个样本。步骤2,获得样本集。首先,采用坐标变换方法,对高光谱图像进行处理,将高光谱图像每一维的样本排成一个行向量,组成一个二维矩阵,得到高光谱图像光谱域的样本集。其次,设定一个7×7大小的高光谱图像光谱域样本窗口,对高光谱图像光谱域的样本集进行均值滤波,得到高光谱图像邻域的样本集。步骤3,确定训练样本集与测试样本集。首先,采用等概率采样的方法,在高光谱图像光谱域的样本集中,依次随机选取10%的样本,作为高光谱图像光谱域的训练样本集,并记录高光谱图像光谱域训练样本集的坐标位置;将剩余90%的样本,作为高光谱图像光谱域的测试样本集。其次,在高光谱图像的邻域样本集中,选取与高光谱图像光谱域训练样本集的坐标位置对应的样本,作为高光谱图像邻域的训练样本集,将剩余90%的样本作为高光谱图像邻域的测试样本集。步骤4,字典学习。首先,采用字典学习方法,得到高光谱图像光谱域训练样本集的稀疏系数和字典,字典学习方法的具体步骤如下:第一步,初始化一个大小为200×256的实数矩阵作为字典。第二步,按照下式,计算高光谱图像光谱域训练样本集的稀疏系数:其中,表示更新得到的高光谱图像光谱域训练样本集的稀疏系数,argmin表示最小值操作,X表示高光谱图像光谱域的训练样本集,D表示字典,Y1表示高光谱图像光谱域训练样本集的稀疏系数,表示求Frobenius范数的平方和操作,γ表示正则化参数,Σ表示求和操作,N表示高光谱图像光谱域训练样本集的总列数,s表示高光谱图像光谱域训练样本集稀疏系数的列数,||·||1表示取1范数操作,Ys表示稀疏系数矩阵Y1的第s列。第三步,按照下式,计算高光谱图像光谱域训练样本集的字典:其中,更新得到的高光谱图像光谱域训练样本集的字典,argmin表示最小值操作,X表示高光谱图像光谱域的训练样本集,D表示第字典,表示更新得到的高光谱图像光谱域训练样本集的稀疏系数,表示求Frobenius范数的平方和操作,s.t.表示约束操作,||·||2表示取2范数操作,i表示高光谱图像光谱域训练样本集字典矩阵D的列数,Di表示字典矩阵D的第i列原子,表示取任意的i操作,i的取值范围为:{1,...,k},k表示字典矩阵D的总列数。第四步,重复执行第一步和第二步10次,得到高光谱图像光谱域训练样本集的稀疏系数和字典。其次,采用字典学习方法,得到高光谱图像邻域训练样本集的稀疏系数和字典,字典学习方法的具体步骤如下:第一步,初始化一个大小为200×256的实数矩阵作为字典。第二步,按照下式,计算高光谱图像邻域训练样本集的稀疏系数:其中,表示更新得到的高光谱图像邻域训练样本集的稀疏系数,argmin表示最小值操作,C表示高光谱图像邻域的训练样本集,D'表示初始化的字典,Y2表示高光谱图像邻域训练样本集的稀疏系数,表示求Frobenius范数的平方和操作,γ表示正则化参数,Σ表示求和操作,M表示高光谱图像邻域训练样本集的总列数,p表示高光谱图像邻域训练样本集稀疏系数的列数,||·||1表示取1范数操作,Yp表示稀疏系数矩阵Y2的第p列。第三步,按照下式,计算高光谱图像邻域训练样本集的字典:其中,表示更新得到的高光谱图像邻域训练样本集的字典,argmin表示最小值操作,C表示高光谱图像邻域的训练样本集,D'表示初始化的字典,表示更新得到的高光谱图像邻域训练样本集的稀疏系数,表示求Frobenius范数的平方和操作,s.t.表示约束操作,||·||2表示取2范数操作,i表示高光谱图像邻域训练样本集字典矩阵D'的列数,表示字典矩阵D'的第j列原子,表示取任意的j操作,j的取值范围为:{1,...,l},l表示字典矩阵D'的总列数。第四步,重复执行第一步和第二步10次,得到高光谱图像邻域训练样本集的稀疏系数和字典。步骤5,求测试样本集稀疏系数。首先,采用稀疏编码系数更新公式,计算高光谱图像光谱域测试样本集的稀疏系数如下:其中,表示更新得到的高光谱图像光谱域测试样本集的稀疏系数,argmin表示最小值操作,X'表示高光谱图像光谱域的测试样本集,表示字典更新得到的高光谱图像光谱域训练样本集的字典,表示高光谱图像光谱域测试样本集的稀疏系数,表示求Frobenius范数的平方和操作,γ表示正则化参数,Σ表示求和操作,A表示高光谱图像光谱域测试样本集的总列数,a表示高光谱图像光谱域测试样本集稀疏系数的列数,||·||1表示取1范数操作,表示稀疏系数矩阵的第a列。其次,采用稀疏编码系数更新公式,计算高光谱图像邻域测试样本集的稀疏系数如下:其中,表示更新得到的高光谱图像邻域测试样本集的稀疏系数,argmin表示最小值操作,C'表示高光谱图像邻域的测试样本集,表示字典更新得到的高光谱图像邻域训练样本集的字典,表示高光谱图像邻域测试样本集的稀疏系数,表示求Frobenius范数的平方和操作,γ表示正则化参数,Σ表示求和操作,B表示高光谱图像邻域测试样本集的总列数,b表示高光谱图像邻域测试样本集稀疏系数的列数,||·||1表示取1范数操作,表示稀疏系数矩阵的第b列。步骤6,加权稀疏系数。首先,对高光谱图像光谱域训练样本集与高光谱图像邻域训练样本集的稀疏系数,采用加权公式,计算高光谱图像光谱域训练样本集的稀疏系数:其中,Y表示高光谱图像光谱域训练样本集的稀疏系数,u表示权重系数,u的取值范围为:[0.1,1],表示高光谱图像光谱域训练样本集的稀疏系数,表示高光谱图像邻域训练样本集的稀疏系数。其次,对高光谱图像光谱域测试样本集与高光谱图像邻域测试样本集的稀疏系数,采用加权公式,计算高光谱图像光谱域测试样本集的稀疏系数:其中,Z表示高光谱图像光谱域测试样本集的稀疏系数,r表示权重系数,r的取值范围为:[0.1,1],表示高光谱图像光谱域测试样本集的稀疏系数,表示高光谱图像邻域测试样本集的稀疏系数。步骤7,高光谱图像分类。利用线性支撑向量机分类器,对高光谱图像光谱域测试样本集的稀疏系数进行分类,得到分类的高光谱图像。步骤8,输出分类图像。下面结合附图2的仿真图对本发明的效果做进一步说明。1.仿真实验条件:本实验的硬件测试平台是:处理器为IntelCore2CPU,主频为2.33GHz,内存2GB,软件平台为:WindowsXP操作系统和MatlabR2012a。本发明的输入图像为高光谱图像印第安松树IndianPines,图像大小为145×145×220,图像共包含220个波段和16类地物,图像格式为TIF。2.仿真内容:本发明用到的三个现有技术对比分类方法分别如下:Melgani等人在“Classificationofhyperspectralremotesensingimageswithsupportvectormachines,IEEETrans.Geosci.RemoteSens.,vol.42,no.8,pp.1778–1790,Aug.2004”中提出的高光谱图像分类方法,简称支撑向量机SVM分类方法。Charles等人在“Learningsparsecodesforhyperspectralimagery,”IEEEJ.Sel.TopicsSignalProcess.,vol.5,no.5,pp.963–978,2011”中提出的高光谱图像分类方法,简称光谱字典学习SDL分类方法。Chen等人在“Hyperspectralimageclassificationusingdictionary-basedsparserepresentation,”IEEETrans.Geosci.RemoteSens.,vol.49,no.10,pp.3973–3985,oct2011”中提出的高光谱图像分类方法,简称同时正交匹配追踪SOMP方法。在仿真实验中,采用以下三个现有指标来评价本发明方法的性能:第一个评价指标是总精度(OA),表示正确分类的样本占所有样本的比例,值越大,说明分类效果越好。第二个评价指标是平均精度(AA),表示每一类分类精度的平均值,值越大,说明分类效果越好。第三个评价指标是卡方系数(Kappa),表示混淆矩阵中不同的权值,值越大,说明分类效果越好。图2为仿真实验中本发明与现有技术对高光谱图像印第安松树IndianPines的分类结果对比图。其中,图2(a)为输入的高光谱图像印第安松树IndianPines的真实地物分布图,其大小为145×145,图2(b)为采用支撑向量机SVM方法对高光谱图像印第安松树IndianPines进行分类的结果图,图2(c)为采用光谱字典学习SDL方法对高光谱图像印第安松树IndianPines进行分类的结果图,图2(d)为采用同时正交匹配追踪算法SOMP对高光谱图像印第安松树IndianPines进行分类的结果图,图2(e)为本发明方法对高光谱图像印第安松树IndianPines进行分类的结果图。3.仿真结果分析:表1为从客观评价指标上对附图2中各方法的分类结果进行评价。表1.附图2中各方法分类结果的定量分析结合表1和附图2可以看出,支撑向量机SVM和光谱字典学习SDL方法的分类结果比较差,主要因为这两种方法都只利用了高光谱图像的光谱信息,忽略了邻域信息,使得分类结果在边缘和同质区域都很差;同时正交匹配追踪SOMP方法的分类结果有很大改善,错分率有所下降,但是同时正交匹配追踪SOMP方法只是利用了空域的四个近邻信息,不能充分挖掘图像的邻域信息,所以依然存在图像边缘和同质区域错分的现象;本发明在视觉和定量分析方面均优于前三种现有技术分类方法,在边缘和同质区域都能达到理想的分类效果。以上仿真实验表明:本发明方法能够充分利用高光谱图像的光谱域和邻域信息,在图像边缘和同质区域都能取得很好的分类结果,能够解决现有技术方法中存在的忽略高光谱图像的邻域信息、分类精度低等问题,是一种非常实用的高光谱图像分类方法。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1