基于小波稀疏自编码器的极化SAR图像分类方法与流程

文档序号:16265425发布日期:2018-12-14 21:53阅读:185来源:国知局

本发明属于图像处理技术领域,更进一步涉及极化合成孔径雷达图像分类技术领域中的一种基于小波稀疏自编码器的极化合成孔径雷达SAR(Synthetic Aperture Radar,SAR)图像分类方法。本发明采用一代小波函数与稀疏自编码器相结合对极化合成孔径雷达SAR图像进行分类,可用于极化合成孔径雷达SAR图像目标检测和目标识别。



背景技术:

极化合成孔径雷达已成为国内外合成孔径雷达发展的重要方向之一,而极化SAR图像分类是SAR图像解译的重要研究技术。极化SAR能对目标进行更全面的描述,其测量数据包含了丰富的目标信息,因此极化SAR在目标检测、分类及参数反演等方面具有非常明显的优势。极化SAR图像分类的目的是利用机载或星载极化SAR传感器获得的极化测量数据确定每个像素所属的类别,而分类的方法一直是该领域前沿研究的热点,利用地物的极化散射特性与模式识别领域的分类方法已构建了诸多极化SAR图像分类方法。

西安电子科技大学申请的专利“基于Cloude分解和K—wishart分布的极化SAR图像分类方法”(申请号:201210414789.6,公开号:CN102999761A)中提出了一种基于Cloude分解和K—wishart分布的极化SAR图像分类方法,该方法的具体步骤包括:(1)读入极化SAR图像,对图像中的每一个像素点进行Cloude分解,得到熵H和散射角α;(2)根据熵H和散射角α进行初始分类;(3)对初始分类结果进行K—wishart迭代,得到分类结果。该方法计算复杂度相对较小,与经典方法相比,精度有所提高,但是,该方法仍然存在的不足之处是:该方法属于无监督分类,未经过预处理操作,只能依靠散射信息对地物进行聚类,没有学习到数据的深层特征和细节特征,使得极化SAR分类准确率偏低。

孟云闪发表的论文“LSSVM算法在极化SAR影响分类中的应用”《地理空间信息》,(文章编号:1672-4623(2012)03-0043-03)中公开了一种用LLSVM对极化SAR图像分类的方法,该方法的具体步骤包括:对极化SAR图像进行目标分解,提取5个参数组成的矢量集作为特征;将特征矢量集进行归一化处理;将传统的SVM与LLSVM进行性能对比,获得分类结果。该方法存在的不足之处是:LLSVM分类器无法保证得到的解为全局最优解,并且缺乏稀疏性,容易导致过拟合,无法克服孤立点和噪声的影响,使得极化SAR分类准确率偏低。



技术实现要素:

本发明的目的在于克服上述已有技术的缺点,提出了一种基于小波稀疏自编码器的极化SAR图像的分类方法。本发明与现有技术中其它极化SAR图像分类技术相比,降低了时间复杂度,去除了数据的无关性和冗余性,反应了数据的本质特性,能更好地从低维特征中学到更高维的特征,同时具有良好的去噪效果,并且小波稀疏自编码器具有更强的学习能力,提高了图像的分类精度。

本发明实现上述目的思路是:先对极化SAR图像的协方差矩阵进行预处理,选取相应的训练样本、测试样本、训练标签和测试标签,利用训练样本训练小波稀疏自编码器,调整网络参数,将测试样本输入训练好的网络和分类器中,得到最终分类结果并计算准确率。

其具体步骤包括如下:

(1)输入图像:

输入一幅待分类的极化SAR图像的协方差矩阵C,其中,C矩阵的大小为3*3*N,N表示极化SAR图像像素点的总数;

(2)预处理:

(2a)采用精制极化Lee滤波器,对协方差矩阵C进行滤波,去除斑点噪声,得到极化SAR图像每个像素点的滤波后矩阵;

(2b)采用零相位差成分分析ZCA白化方法,对滤波后矩阵进行白化,得到极化SAR图像每个像素点的预处理后矩阵;

(3)提取图像特征:

分别提取每个像素点预处理后矩阵中位于上三角处的三个元素的实部值和虚部值、预处理后矩阵中位于对角线上三个元素的实部值,组成一个N*9的样本集,N表示极化SAR图像像素点的总数;

(4)选取训练样本和测试样本:

(4a)根据真实的地物标记,将待分类的极化SAR图像分为15类,得到无标签样本本集和标签样本集;

(4b)从标签样本集每一类别中任意选取700个样本作为训练样本集,将剩余的标签样本作为测试样本集;

(5)训练小波稀疏自编码器:

(5a)用一代小波函数作为栈式稀疏自编码器的激活函数,得到小波稀疏自编码器网络结构;

(5b)采用标准正态分布随机数产生函数,随机生成小波稀疏自编码器的权重值和偏差值;

(5c)采用均方差衰减公式,利用随机生成的权重值和偏差值,计算得到整体样本均方差衰减值;

(5d)采用梯度下降法,对获得的整体样本均方差衰减值进行权重值和偏差值的迭代更新,得到小波稀疏自编码器的最优权重值和最优偏差值;

(6)训练Softmax分类器:

输入网络模型参数和训练样本集,得到训练好的Softmax分类器;

(7)调整网络参数:

采用反向传播方法,对整个小波稀疏自编码器进行微调,得到微调后的网络模型结构;

(8)图像分类:

用训练好的小波稀疏自编码器和Softmax分类器,对测试样本集进行分类,将分类得到的极化SAR测试样本像素所属地物类别与真实地物类别进行比对,将类别一致的像素点归于一个类别;

(9)上色:

根据红、蓝、绿三基色原理,对每个像素所属地物类别,用同一颜色标出同类地物,得到上色后的分类结果图;

(10)输出分类结果图。

本发明与现有技术相比有以下优点:

第一、由于本发明采用稀疏自编码器与小波函数相结合,强调了网络结构的深度,从原始的低级特征中学习出更深层、高级的特征,并且小波函数具有良好的时频局部性质,克服了现有技术中原始特征学习不充分、不能刻画数据的细节特征,导致分类准确率低的问题,使得本发明比现有技术具有更加优异的特征表达能力,进而提高了极化SAR图像数据分类的准确率。

第二、由于本发明采用精制极化Lee滤波和白化对数据进行预处理,去除了图像的相干斑噪声,降低了输入数据的冗余性,克服了现有技术中未对原始数据进行预处理操作,导致分类准确率低,区域一致性差的问题,使得本发明的分类结果图的轮廓、边缘更加清晰,提高图像质量,改善了极化SAR分类性能。

第三,由于本发明采用稀疏自编码器,对小波稀疏自编码器的权重值和偏差值进行迭代寻优,克服了现有技术中未将特征输入网络结构进行学习而直接输入分类器,导致无法寻求全局最优解的问题,使得本发明在整体样本均方差达到全局最小值时,获得最优权重值和最优偏差值,为后期分类做好铺垫,提高了极化SAR图像数据分类的准确率。

附图说明

图1是本发明的流程图;

图2是本发明的仿真图。

具体实施方式

下面结合附图对本发明做详细描述。

参照图1,对本发明的具体实施步骤做进一步的详细描述。

步骤1,输入图像。

输入一幅待分类的极化SAR图像的协方差矩阵C,所用极化SAR数据来源为NASA/JPL实验室AIRSAR传感器于1989年在荷兰Flevoland地区获取L波段的全极化数据,分辨率为12.1m*6.7m,尺寸为750*1024像素。该图像的协方差矩阵大小为3*3*N,N是极化SAR图像像素点的总数。

步骤2,预处理。

采用精制极化Lee滤波器,对协方差矩阵C进行滤波,去除斑点噪声,得到极化SAR图像每个像素点的滤波后矩阵。

精制极化Lee滤波的具体步骤如下:

第一步,设定精制极化Lee滤波的滑动窗口,该滑动窗口的大小为5*5像素;

第二步,将滑动窗口用于极化SAR图像数据上,从左到右、从上到下移动,每移动一步,将窗口按照像素空间位置,从左到右、从上到下依次分成9个子窗口;

第三步,将9个子窗口对应位置的像素值求平均值,将得到的均值构成3*3像素的均值窗口;

第四步,选择水平、垂直、45度和135度4个方向的梯度模板,将均值窗口分别与4个模板进行加权取绝对值,选出其中最大值,将最大值作为边缘方向;

第五步,从9个子窗口中取中心窗口边缘方向的左右2个子窗口,分别对2个窗口内的所有像素取均值,用得到的两个均值分别减去中心窗口所有像素值的均值,将均值差值中绝对值小的值所对应的子窗口作为方向窗口;

第六步,按照下式,得到精制极化Lee滤波的权值:

其中,b表示精制极化滤波的权值,var(y)表示方向窗口内极化SAR总功率图像像素的方差值,y表示方向窗口内极化SAR总功率图像的像素,p表示方向窗口内极化SAR总功率图像所有像素的均值,表示输入的极化SAR图像相干斑噪声的方差值;

第七步,按照下式,得到滤波后极化SAR图像中心像素的C矩阵:

x=w+b(y-w)

其中,x表示滤波后极化SAR图像中心像素的C矩阵,w表示方向窗口内极化SAR图像像素的协方差矩阵均值,b表示精制极化滤波的权值。

采用零相位差成分分析ZCA白化方法,对滤波后矩阵进行白化,使要研究的各个变量之间去耦合,降低输入的冗余性,便于分别处理和研究。

数据白化必须满足两个条件:一是不同特征间相关性最小,接近0;二是所有特征的方差相等。ZCA白化只是在PCA白化的基础上做了一个选择操作。ZCA白化相较于PCA白化,使处理后的数据更加接近原始数据,其主要作用是去相关性,而非降维。

步骤3,提取图像特征。

分别提取每个像素点预处理后矩阵中位于上三角处的三个元素的实部值和虚部值、预处理后矩阵中位于对角线上三个元素的实部值,组成一个N*9的样本集,N表示极化SAR图像像素点的总数,样本集中每一列都表示极化SAR图像的一种特征,每一个像素点共包含9个特征。

步骤4,选取训练样本和测试样本。

根据真实的地物标记,将待分类的极化SAR图像分为15类,得到无标签样本集和标签样本集,利用Matlab软件读取标签图,发现此实验数据图可分为15类,分别为:Water,Barley,Peas,Steam Beans,Beet,Forest,Bare Soil,Grass,Rapeseed,Lucerne,Wheat A,Wheat B,Wheat C,Potatoes,Building。

从样本集中每一类别中任意选取700个特征向量作为训练样本集,将剩余的特征向量作为测试样本集。在具体实验中,可以选取不同数量的样本作为训练样本来训练网络,但是,样本数选取过多可能导致时间复杂度增加,计算过程较为复杂,而样本数选取过少,那么训练网络不充分,将直接导致测试样本输入网络后,分类精度偏低,甚至分类器会出现过拟合现象。

步骤5,训练小波稀疏自编码器。

用一代小波函数作为栈式稀疏自编码器的激活函数,得到小波稀疏自编码器网络结构:

Gaussian函数公式如下所示:

其中,yji表示第i个样本通过第j个隐层小波神经元的输出值,j表示隐藏层的第j个小波神经元,j=1,2,3...N,N表示隐层小波元个数,i表示第i个样本,i=1,2,3...P,P表示样本总数,xj表示第j个小波神经元的输入值,e表示以e为底数的指数操作;表示对第j个小波神经元的输入值求平方操作;

Morlet函数公式如下所示:

其中,yji表示第i个样本通过第j个隐层小波神经元的输出值,j表示隐藏层的第j个小波神经元,j=1,2,3...N,N表示隐层小波元个数,i表示第i个样本,i=1,2,3...P,P表示样本总数,cos表示求余弦操作,xj表示第j个小波神经元的输入值,e表示以e为底数的指数操作;表示对第j个小波神经元的输入值求平方操作;

Mexican hat wavelet函数公式如下所示:

其中,yji表示第i个样本通过第j个隐层小波神经元的输出值,j表示隐藏层的第j个小波神经元,j=1,2,3...N,N表示隐层小波元个数,i表示第i个样本,i=1,2,3...P,P表示样本总数,xj表示第j个小波神经元的输入值,表示对第j个小波神经元的输入值求平方操作,e表示以e为底数的指数操作。

采用标准正态分布随机数产生函数,随机生成小波稀疏自编码器的权重值和偏差值。

采用均方差衰减公式,利用随机生成的权重值和偏差值,计算得到整体样本均方差衰减值:

均方差衰减公式如下所示:

J(Wj,bj)=J(xi,yji)+J(Wj)+P

其中,J(Wj,bj)表示小波稀疏自编码器中的第j个小波神经元的整体样本均方差衰减值,Wj表示小波稀疏自编码器中的第j个小波神经元的权重值,-2<Wj<2,bj表示随机生成的小波稀疏自编码器中的第j个小波神经元的偏差值,-2<bj<2,J(xi,yji)表示第j个小波神经元的第i个无标签样本输入xi与输出样本yji之间的误差值,xi表示预处理后的第i个无标签样本输入,yji表示第j个小波神经元的第i个输出样本,J(Wj)表示小波稀疏自编码第j个小波神经元权重值的衰减值,P表示小波稀疏自编码的稀疏度,P的取值为0.1。

采用梯度下降法,对获得的整体样本均方差衰减值进行权重值和偏差值的迭代更新,得到小波稀疏自编码器的最优权重值和最优偏差值。

梯度下降法的具体步骤如下:

第一步,按照下式,计算小波稀疏自编码器的权重值:

其中,Wn+1表示第n+1次迭代时小波稀疏自编码器的权重值,n表示权重值的迭代次数,Wn表示第n次迭代时小波稀疏自编码器的权重值,α表示权重值的学习速率,0<α<1,表示求偏导数操作,J(Wn,bn)表示迭代n次的整体样本均方差衰减值,bn表示第n次迭代时的方差值;

第二步,按照下式,计算小波稀疏自编码器的偏差值:

其中,bn+1表示第n+1次迭代时小波稀疏自编码器的偏差值,n表示偏差值的迭代次数,bn表示第n次迭代时小波稀疏自编码器的偏差值,β表示偏差值的学习速率,β的取值范围为0<β<1,表示求偏导数操作,J(Wn,bn)表示迭代n次的整体样本均方差衰减值,Wn表示第n次迭代时的权重值。

当稀疏自编码器的的整体样本均方差达到全局最小值时,停止迭代,将停止迭代时的稀疏自编码器的权重值和偏差值作为小波稀疏自编码器的最优权重值和最优偏差值。

步骤6,训练Softmax分类器。

输入网络模型参数和训练样本集,得到训练好的Softmax分类器。

步骤7,调整网络参数。

采用反向传播方法,对整个小波稀疏自编码器进行微调,得到微调后的网络模型结构。

步骤8,图像分类。

用训练好的小波稀疏自编码器和Softmax分类器,对测试样本集进行分类,将分类得到的极化SAR测试样本像素所属地物类别与真实地物类别进行比对,将类别一致的像素点归于一个类别,共15类。

步骤9,上色。

根据红、蓝、绿三基色原理,对每个像素所属地物类别,用同一颜色标出同类地物,得到上色后的分类结果图。

步骤10,输出分类结果图。

下面结合附图2对本发明的效果做进一步说明:

1.仿真实验条件。

本发明的仿真实验所使用的输入图像如图2(a)所示,格式为BMP的极化SAR图像作为测试实验,来源为NASA/JPL实验室AIRSAR传感器于1989年在荷兰Flevoland地区获取L波段的全极化数据,分辨率为12.1m*6.7m,尺寸为750*1024。

仿真实验中,软件采用Matlab版本8.5.0(R2015a),电脑型号:Intel Core i5-3470,内存:4.00GB,操作系统:Windows7。

2.仿真内容和结果分析。

使用现有技术支撑向量机SVM的方法对所用极化SAR图像进行仿真实验,分类结果见图2(b);使用现有技术稀疏自编码器SAE对所用极化SAR图像进行仿真实验,分类结果见图2(c);使用本发明对所用极化SAR图像进行仿真实验,其中,图2(d)为Morlet小波稀疏自编码器对所用极化SAR图像的分类结果图;图2(e)为Gaussian小波稀疏自编码器对所用极化SAR图像的分类结果图;图2(d)为Mexican hat wavelet小波稀疏自编码器对所用极化SAR图像的分类结果图。

从图2(d),图2(e),图2(f)的分类结果示意图来看,采用本方法对图2(a)进行分类后,除部分地区的分类结果杂点较多外,其他地区的分类结果杂点较少,并且边缘光滑,清晰可辨。由此可见,本发明能够有效的解决极化SAR图像的分类问题。

本发明与现有技术支撑向量机SVM和现有技术稀疏自编码器SAE分类方法进行分类精度对比,对比结果如表1所示。

表1中的“SVM”表示现有技术支撑向量机分类方法,“SAE”表示现有技术稀疏自编码器分类方法,“小波自编码器”为本发明方法,其中“Morlet”、“Gaussian”、“Mexican”分别表示小波稀疏自编码器中的三种小波激活函数。

表1五种算法分类精度对比表

从表1可以看出,在对极化SAR地物分类的结果中,本发明的三种算法的平均分类精度均高于现有技术栈式稀疏自编码器SAE和现有技术支撑向量机SVM的分类精度,从总体耗时来看,小波稀疏自编码的总用时均小于栈式稀疏自编码SAE用时,且Gaussian小波稀疏自编码器不仅分类精度最高且用时短。支撑向量机SVM是直接利用预处理后的训练样本训练分类器并对图像进行分类,它不能从数据中提取更高维的深层表示特征,导致算法原始特征选择不合理的情况下分类效果差。栈式稀疏自编码器SAE与支撑向量机SVM相比,分类精度有所提升但却要花费较长时间,并且栈式稀疏自编码器SAE的激活函数Sigmoid函数不具有小波函数的时频局部性质,不能刻画数据的细节特征,从而导致提取的特征不能很好的反应数据的本质特性。本发明将小波函数与稀疏自编码器相结合,能有效的利用小波网络框架提取数据的局部信息,且具有更强的学习能力,收敛速度更快。

综上所述,深度网络具有更加优异的特征表达能力,能更好的从原始的低级特征中学习出更高级的特征。采用小波网络框架可以突出不同地物类型之间差别的特征,稀疏自编码器具有自学习、自适应和容错性等特点,并且是一类通用函数逼近器,因此,将两者结合可以使网络结构具有更强的学习能力,降低了时间复杂度同时使得分类精度更高。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1