基于稀疏自动编码器的极化SAR图像分类方法与流程

文档序号:12011792阅读:277来源:国知局
基于稀疏自动编码器的极化SAR图像分类方法与流程
本发明属于图像处理技术领域,更进一步涉及目标识别领域中基于稀疏自动编码器的极化合成孔径雷达(SyntheticApertureRadarSAR)图像分类方法。本发明可用于对极化合成孔径雷达SAR图像的地物分类和目标识别。

背景技术:
相比于传统的合成孔径雷达,极化合成孔径雷达SAR利用多个通道的散射信息,可以获得对目标更加全面的认识。极化合成孔径雷达SAR图像分类是极化合成孔径雷达SAR图像解译的重要研究内容,分类图既可作为中间结果为边缘提取、目标检测、识别等提供辅助信息,也可作为最终结果直接输出给用户。它在民用和军用领域均有着巨大的应用价值和理论意义。近年来,很多极化合成孔径雷达SAR图像分类的方法被提取出来,这些方法的基本原理都是利用极化信息,从极化散射矩阵中提取一些与散射机理密切相关的参数,利用这些参数本身,再结合一些其他的方法,对极化合成孔径雷达SAR图像场景中的地物目标进行分类。经典的极化合成孔径雷达SAR图像分类方法包括:电子科技大学在其专利申请“一种基于子孔径分析的极化合成孔径雷达图像分类方法”(专利申请号:200910058210.5,公开号:CN101464956A)中提出了一种基于子孔径分析的极化合成孔径雷达SAR图像分类方法。这种方法首先采用H/ɑ平面对全分辨率极化合成孔径雷达SAR图像进行初始分类,再对其进行子孔径分解,然后根据初始分类计算初始类别中心,最后计算所有子孔径图像中每一个像素点与各类别中心的距离测度,将像素点归类于距离测度最小的那一类。该方法虽然综合了目标在不同视角下的散射特性,以及散射特性的变化,但是仍然存在的不足是,该方法对待分类的极化合成孔径雷达SAR图像信息的丰富性要求高,待处理的高维数据具有无关性和冗余性,计算量大,实现过程复杂。西安电子科技大学在其专利申请“基于谱聚类的极化SAR图像分类方法”(专利申请号:201110164401.7,公开号:CN102208031A)中提出了一种基于谱聚类的极化合成孔径雷达SAR图像分类方法。该方法首先对极化合成孔径雷达SAR图像的每一个像素点提取表征极化合成孔径雷达SAR目标散射特性的散射熵,结合空间坐标信息,利用MeanShift算法对图像进行分割,对各区域进行谱聚类,获得图像的预分类结果,最后对预分类得到的整幅图像用Wishart分类器进行迭代分类。该方法虽然能在任意形状的样本空间上聚类并且收敛于全局最优解,但是仍然存在的不足是,采用高斯函数构造相似矩阵时,尺度参数对分类结构影响较大,并且难以得到最优的参数,导致特征提取的不合理,影响图像分割的稳定性,导致分类精度下降。

技术实现要素:
本发明的目的是克服上述现有技术的不足,提供一种基于稀疏自动编码器的极化SAR图像分类方法。本发明与现有技术中其他极化合成孔径雷达SAR图像分类技术相比计算量小,分类精度和分类效率高。本发明实现上述目的的思路是:先对极化合成孔径雷达SAR图像的相干矩阵进行滤波,再将去噪后的相干矩阵中的每一列向量的元素作为一个样本,将所有样本组成一个样本集,从样本集中随机选取样本组成无标签样本集、训练样本集和测试样本集,然后利用稀疏主分量分析方法获取无标签样本集的稀疏主分量,利用获得的稀疏主分量对所有样本集进行投影,再通过稀疏自动编码器获取无标签样本集的最优权重和偏差,利用获得的最优权重和偏差对训练样本集和测试样本集进行特征提取,最后利用支持向量机SVM进行对提取到的特征进行分类,得到最终分类结果。本发明实现的具体步骤包括如下:(1)输入待分类的极化合成孔径雷达SAR图像的相干矩阵;(2)滤波:采用滤波窗口大小为7×7的李Lee滤波器,对相干矩阵进行滤波,得到去噪后的相干矩阵;(3)选取样本:(3a)在去噪后的相干矩阵中,将每一列向量的元素作为一个样本,将去噪后的相干矩阵中的所有样本组成一个样本集;(3b)从样本集中随机选取8%的样本作为无标签样本集;(3c)从样本集中随机选取5%的样本作为训练样本集,将剩余95%的样本作为测试样本集;(4)获取稀疏主分量:(4a)对无标签样本集中的所有样本取平均值,用无标签样本集中的每一个样本分别减去平均值,获得去均值后的无标签样本集;(4b)对去均值后的无标签样本集,采用稀疏主分量分析方法,得到去均值后的无标签样本集的稀疏主分量;(4c)将去均值后的无标签样本集的稀疏主分量分别与训练样本集、测试样本集和去均值后的无标签样本集相乘,得到降维后的训练样本集、测试样本集和无标签样本集;(5)训练稀疏自动编码器:(5a)在[-2,2]范围内任意选取两个数,分别作为稀疏自动编码器的权重值和偏差值;(5b)对选取的稀疏自动编码器的权重值和偏差值,采用均方差衰减公式,获取整体样本均方差衰减值;(5c)对获得的整体样本均方差衰减值,采用梯度下降法,获取稀疏自动编码器的最优权重值和最优偏差值;(6)提取特征:对降维后的训练样本集和测试样本集,采用特征提取方法,得到训练样本特征集和测试样本特征集;(7)支持向量机分类:对训练样本特征集和测试样本特征集进行分类,得到训练样本特征集和测试样本特征集的分类结果;(8)输出分类结果。本发明与现有技术相比具有以下优点:第一,由于本发明通过引入稀疏主分量分析方法,采用低维的稀疏主分量来表示无标签样本集、训练样本集和测试样本集,克服了现有技术中待处理的高维数据的无关性和冗余性,使得本发明在对极化合成孔径雷达SAR图像进行分类时提高了分类效率。第二,由于本发明通过引入稀疏自动编码器,对训练样本集和测试样本集进行特征提取,克服了现有技术中由于特征提取不合理而造成的分类精度的下降,使得本发明具有对原始数据达到高精度逼近的优点,进而提高了分类精度。第三,由于本发明在分类过程中仅用到相干矩阵信息,不需要其他散射信息,克服了现有技术中对待分类的极化合成孔径雷达SAR图像信息的丰富性要求高的不足,使得本发明对不同的极化合成孔径雷达SAR图像信息具有更强的适应性。附图说明图1为本发明的流程图;图2为本发明的仿真图。具体实施方式下面结合附图对本发明做进一步的描述。参照图1,本发明实现的具体步骤如下:步骤1,输入待分类的极化合成孔径雷达SAR图像的相干矩阵。步骤2,滤波。采用滤波窗口大小为7×7的李Lee滤波器,对相干矩阵进行滤波,得到去噪后的相干矩阵。步骤3,选取样本。在去噪后的相干矩阵中,将每一列向量的元素作为一个样本,将去噪后的相干矩阵中的所有样本组成一个样本集;从样本集中随机选取8%的样本作为无标签样本集;从样本集中随机选取5%的样本作为训练样本集,将剩余95%的样本作为测试样本集。步骤4,获取稀疏主分量。对无标签样本集中的所有样本取平均值,用无标签样本集中的每一个样本分别减去平均值,获得去均值后的无标签样本集。对去均值后的无标签样本集,采用稀疏主分量分析方法,得到去均值后的无标签样本集的稀疏主分量,具体操作步骤如下:第一步,对去均值后的无标签样本集,采用MATLAB软件中的svd函数进行奇异值分解SVD,得到左奇异矩阵、奇异值矩阵和右奇异矩阵,将右奇异矩阵中的每一列向量作为去均值后的无标签样本集的一个特征向量,在所有特征向量中选取前6个特征向量作为去均值后的无标签样本集的主分量的初值;第二步,初始化去均值后的无标签样本集的稀疏主分量,选择零向量作为去均值后的无标签样本集的稀疏主分量的初值,设定ε为迭代停止参数,ε的取值范围为0<ε<<1;第三步,按照下式,计算去均值后的无标签样本集的稀疏主分量的迭代值:其中,B1表示去均值后的无标签样本集的稀疏主分量的迭代值,argmin(·)表示取最小值操作,B0表示去均值后的无标签样本集的稀疏主分量的初值,|·|2表示取模的平方操作,X表示去均值后的无标签样本集,A0表示去均值后的无标签样本集的主分量的初值,(·)T表示转置操作,P(B0)表示去均值后的无标签样本集的稀疏主分量的稀疏度,公式如下:P(B0)=λ|B0|1+γ|B0|2其中,B0表示去均值后的无标签样本集的稀疏主分量的初值,λ表示稀疏自动编码器的套索Lasso惩罚参数,取值为λ=0.2,γ表示稀疏自动编码器的岭ridge惩罚参数,取值为γ=-4,|·|1表示取1-范数操作,|·|2表示取模的平方操作;第四步,计算去均值后的无标签样本集的协方差矩阵与去均值后的无标签样本集的稀疏主分量的迭代值的乘积,采用MATLAB软件中的svd函数对得到的乘积进行奇异值分解SVD,得到左奇异矩阵、奇异值矩阵和右奇异矩阵;第五步,按照下式,计算去均值后的无标签样本集的主分量的迭代值:A1=U1V1T其中,A1表示去均值后的无标签样本集的主分量的迭代值,U1表示奇异值分解SVD得到的左奇异矩阵,V1表示奇异值分解SVD得到的右奇异矩阵,(·)T表示转置操作;第六步,判断去均值后的无标签样本集的稀疏主分量的迭代值是否满足下式迭代停止条件,若满足,迭代终止,执行第七步;若不满足,分别选取去均值后的无标签样本集的主分量的迭代值和稀疏主分量的迭代值作为新的去均值后的无标签样本集的主分量的初值和稀疏主分量的初值,执行第三步、第四步和第五步,直至满足停止迭代条件,迭代终止,执行第七步:其中,B1和B0分别表示去均值后的无标签样本集的稀疏主分量的迭代值和初值,ε表示迭代停止参数,ε的取值范围为0<ε<<1,||·||表示取模操作;第七步,将迭代终止时去均值后的无标签样本集的稀疏主分量的迭代值,作为去均值后的无标签样本集的稀疏主分量。分别用训练样本集和测试样本集中的每一个样本减去无标签样本集的平均值,获得去均值后的训练样本集和测试样本集。将去均值后的无标签样本集的稀疏主分量分别与去均值后的训练样本集、测试样本集和无标签样本集相乘,得到降维后的训练样本集、测试样本集和无标签样本集,降低了各样本集中数据的无关性和冗余性。步骤5,训练稀疏自动编码器。在[-2,2]范围内任意选取两个数,分别作为稀疏自动编码器的权重值和偏差值。对选取的稀疏自动编码器的权重值和偏差值,按照下式,计算稀疏自动编码器的整体样本均方差衰减值:J(W,b)=J(X,Y)+J(W)+P其中,J(W,b)表示稀疏自动编码器的整体样本均方差衰减值,W表示选取的稀疏自动编码器的权重值,W的取值范围为-2<W<2,b表示选取的稀疏自动编码器的偏差值,b的取值范围为-2<b<2,J(X,Y)表示降维后的无标签样本集与稀疏自动编码器输出的样本集之间的误差值,X表示降维后的无标签样本集,Y表示稀疏自动编码器输出的样本集,J(W)表示选取的稀疏自动编码器的权重的衰减值,P表示稀疏自动编码器的稀疏度,公式如下:其中,μ表示稀疏自动编码器的控制稀疏性惩罚参数的权重值,取值为μ=3,∑(·)表示求和操作,ρ表示稀疏自动编码器的稀疏性参数,ρ的取值范围为0<ρ<<1,log(·)表示取以10为底的对数操作,表示稀疏自动编码器中隐藏神经元的平均活跃值。对获得的整体样本均方差衰减值,采用梯度下降法,获取稀疏自动编码器的最优权重值和最优偏差值,具体操作步骤如下:第一步,按照下式,计算稀疏自动编码器的迭代权重值:其中,Wn+1表示第n+1次迭代时稀疏自动编码器的权重值,n表示稀疏自动编码器的权重值的迭代次数,Wn表示第n次迭代时稀疏自动编码器的权重值,α表示稀疏自动编码器的权重值的学习速率,α的取值范围为0<α<1,表示取第n次迭代时稀疏自动编码器的权重值的偏导数操作,J(Wn,bn)表示第n次迭代时稀疏自动编码器的整体样本均方差衰减值,bn表示第n次迭代时稀疏自动编码器的偏差值;第二步,按照下式,计算稀疏自动编码器的迭代偏差值:其中,bn+1表示第n+1次迭代时稀疏自动编码器的偏差值,n表示稀疏自动编码器的偏差值的迭代次数,bn表示第n次迭代时稀疏自动编码器的偏差值,β表示稀疏自动编码器的偏差值的学习速率,β的取值范围为0<β<1,表示取第n次迭代时稀疏自动编码器的偏差值的偏导数操作,J(Wn,bn)表示第n次迭代时稀疏自动编码器的整体样本均方差衰减值,Wn表示第n次迭代时稀疏自动编码器的权重值。在稀疏自动编码器的整体样本均方差衰减值达到全局最小值时,停止迭代,将停止迭代时稀疏自动编码器的迭代权重值和偏差值作为稀疏自动编码器的最优权重值和最优偏差值。步骤6,提取特征。对降维后的训练样本集和测试样本集,采用特征提取方法,得到训练样本特征集和测试样本特征集,具体操作步骤如下:第一步,按照下式,计算训练样本特征集:其中,M表示训练样本特征集,exp(·)表示以自然常数为底的指数操作,W表示稀疏自动编码器的最优权重值,Y表示投影后的训练样本集,b表示稀疏自动编码器的最优偏差值;第二步,按照下式,计算测试样本特征集:其中,N表示测试样本特征集,exp(·)表示以自然常数为底的指数操作,W表示稀疏自动编码器的最优权重值,Z表示投影后的测试样本集,b表示稀疏自动编码器的最优偏差值。步骤7,支持向量机分类。采用libSVM工具箱,对训练样本特征集和测试样本特征集进行分类,得到训练样本特征集和测试样本特征集的分类结果。步骤8,输出分类结果。本发明的效果可通过以下仿真进一步说明。1、仿真条件。本发明的仿真是在主频2.5GHZ的PentiumDual_CoreCPUE6550、内存2GB的硬件环境和MATLABR2008a的软件环境下进行的。2、仿真内容与结果分析。图2为本发明仿真采用的极化合成孔径雷达SAR图像和采用本发明对该图像进行分类的结果图,图像的尺寸大小均为750×1024。其中,图2(a)为NASA-JPL机载L波段AIRSAR系统于1991年获取的荷兰Flevoland农田区域极化合成孔径雷达SAR的RGB合成图像。该极化合成孔径雷达SAR图像中区域的地表覆盖物为各种农作物和水域,图2(b)为采用本发明对图2(a)进行分类的结果图。本发明的仿真实验将待分类的极化合成孔径雷达SAR图像分成15类。从图2(b)可以看出,图像中各区域划分的较为细致,不同区域之间分类后的边缘也较为平滑,水域和农田的交接处被清晰的划分出来,边缘完整准确。由于本发明在采用稀疏主分量分析方法进行降维的同时,也采用了稀疏自动编码器提取极化合成孔径雷达SAR图像的深层特征,使得得到的分类结果区域一致性较好。表明本发明可以有效解决极化合成孔径雷达SAR图像分类问题。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1