基于深层特征学习和分水岭的sar图像分类的制作方法_2

文档序号:9200690阅读:来源:国知局
真结果表明,本发明方法较原有的中层特征分类方法能够更加有效的对SAR 图像进行分类。
【附图说明】
[0023] 图1是本发明的算法流程图;
[0024] 图2是稀疏自编码器示例图;
[0025] 图3是本发明在一幅两类简单地物SAR图像上的仿真结果图;
[0026] 图4是本发明在一幅包含城市复杂区域SAR图像上的仿真结果图;
[0027] 图5是本发明在一幅包含森林复杂区域SAR图像上的仿真结果图。
【具体实施方式】
[0028] 参照图1,本发明的具体实施步骤如下:
[0029] 步骤一、对输入的SAR图像进行分水岭过分割,得到分割类标L = IL1, L2, ...,LM}, 其中M值为分水岭分割的总块数,Lni为第m个子块类标,m e [1,Μ]。
[0030] 过分割即M的取值远大于图像的类别数,但能够保证每个子块内所有像素点必定 属于图像同一类别。
[0031] 该步骤的具体过程如下:
[0032] (Ia)对输入的SAR图像进行伽马(Gamma)滤波,得到平滑后的图像I ;
[0033] (Ib)计算I的边缘检测经典算子(prewitt算子)的梯度图G1;
[0034] (Ic)对梯度图G1进行重构得到梯度图G2,重构规则为G 1中设置阈值t约束极大 值区域;
[0035] (Id)对梯度图G2进行分水岭过分割,得到分割类标L = {L i,L2,. . .,LM}。
[0036] 步骤二、对输入的SAR图像进行加窗傅里叶(Gabor)变换得到低层特征F1= [I 1;I2;... ;IN],其中N表示输入的SAR图像中的像素个数,1"表示每个像素点提取的特征向 量,n e [1,N];
[0037] 将待分类的SAR图像每个像素点η在5*5的窗口内进行六个尺度(f = 7. 87694. 5 3104. 09603. 90843. 58042. 6806),三个方向(Θ = 〇。,60。,120。)的 Gabor 小波变换, 并取变换后均值和方差作为该像素点特征向量In,In的维度大小为1*36。
[0038] 步骤三、分别对输入的SAR图像中每类场景中的像素点的Gabor特征向量进行随 机采样,得到训练样本Y= [Y1;Y2;... ;Y。],然后对Y进行奇异值分解(KSVD),得到的聚类 中心作为字典D = [D1, D2, ...,Dk],其中Υ。为采样得到的第c类场景的Gabor特征,D k表示 对Y进行KSVD聚类后得到的第k个聚类中心,C表示输入的SAR图像中的场景类别数,K表 示KSVD中的聚类中心数,K的取值远大于图像中的场景类别数C,ce [l,C],ke [l,K];
[0039] 该步骤的具体过程如下:
[0040] (3a)对低层特征匕进行采样,每类场景采样50个像素点的Gabor特征向量,得到 训练样本 Y = [Y1;Y 2;... ;Y c],Y。的维度是 50*36 ;
[0041 ] (3b)选择Y的前K个像素点的特征向量来初始化字典D ;
[0042] (3c)利用正交匹配追踪(OMP)算法得到字典D上的稀疏系数矩阵X ;
[0043] (3d)根据系数矩阵X对字典D进行K次迭代,更新字典D,更新规则为优化目标函 数:
[0044]
[0045] 每次迭代对Ek进行奇异值(SVD)分解并更新Dk,使得目标函数值最小,其中E k为 去掉字典Dk后的重构误差,T为稀疏表示系数X中非零的数目的上限。
[0046] 步骤四、将Gabor变换得到低层特征中每个像素点提取的特征向量In与字典D中 每个聚类中心Dk进行卷积,然后再应用最大值池化进行降维,得到的卷积特征F 2作为中层 特征;。
[0047] 将SAR图像中每个像素点的Gabor特征向量In与字典D中每个中心D k进行卷积, 由于1"分别与K个聚类中心D k进行卷积,每个像素点的特征从1*36维变化为K*36维,由 于每个像素点的特征维度变大,并且考虑图像的静态特性,可以对由1"与D卷积得到的特 征进行最大值聚合,即最大值池化方法,从而得到卷积特征F2,并将其作为中层特征。
[0048] 步骤五、将卷积特征&输入到稀疏自编码器中,得到编码系数W 1 =[S1, S2, ...,Sh],然后将卷积特征F2与编码系数W i相乘,得到深层特征F 3,其中Sh为每个隐 藏层结点训练得到的系数,H为隐藏层结点个数,he [1,H];
[0049] 稀疏自编码器是一种无监督学习算法,包含输入层,隐藏层,输出层。优化目标是 输出值等于输入值,即Xi= z S即尝试逼近一个恒等函数,使输出接近于输入,图2是稀疏 自编码器的一个示例。输入数据中隐含一定的特定结构,而隐藏层可以学习到数据的稀疏 表示,即为学习到的新特征。由于输入的特征向量均为1*36维,因此这里输入层结点数为 36,隐藏层结点数设为25,输出层结点数为36。
[0050] 该过程分具体步骤如下:
[0051] (5a)首先对输入的卷积特征&进行编码,编码函数f(x)为一个线性映射和非线 性激活函数g(x):
[0052] α 1 = f (χ) = g (ff !X^b1) (1)
[0053] g(x) = (l+exp(-x))_1 (2)
[0054] 其中α 1表示隐藏层神经元i的激活度,W i表示输入层与隐藏层之间的权值系数, 1^为隐藏层偏置,i e [l,H];
[0055] (5b)对隐藏层输出进行解码,解码函数为Zi:
[0056] Z1 = g(^V ·α' + /λ,) (3)
[0057] 其中W2为隐藏层到输出层的权值系数,b 2为输出层偏置;
[0058] (5c)调整网络中的层与层之间的权值系数^2,偏置Vb2,使得解码后的重构误 差最小,该过程通过优化损失函数J来调整参数
[0059]
(4)
[0060] xS Zi*别为稀疏自编码器的输入和输出,m为输入层和隐藏层的节点数,λ为惩 罚系数,取值为0. 0001,W为需要调整的权值系数。
[0061] 稀疏编码器通过约束隐藏层神经元之间的稀疏性,使得大部分隐藏层神经元未被 激活,其状态为0,即对输入没有响应,从而学习到最感兴趣的目标特征,该约束为:
[0062] (5)
[0063] (6)
[0064] β为另一惩罚系数,这里其取值为3, P是稀疏性系数,通常是一个接近于0的较 小值,这里取值为〇. 01,表示隐藏层神经元在训练集上的平均激活度;
[0065] (5d)将卷积特征F2与优化后的编码系数W i相乘,得到深层特征F 3。
[0066] 步骤六、对F3进行随机采样,然后输入到支持矢量机(SVM)中进行分类,获得分类 结果R1,共分为C类场景;
[0067] 对SAR图像的每类场景进行随机采样,并将采样点的深层特征匕作为训练数据, 输入到SVM中进行训练和分类,得到分类结果R1,将图像分为C类场景。
[0068] 步骤七、在分水岭过分割结果的分割类标L的每个子块类标Lm位置对R i进行投 票,统计&在L m位置出现次数最多的场景值c,并将L m位置全部更新为该场景值c,从而得 到最终分类结果R。
[0069] 在步骤一中得到的分水岭过分割结果的分割类标L中每个子块Lm位置上统计步 骤六中分类结果R1的取值,并将该子块L m对应位置全部赋值为R 1在该子块位置上出现次 数最高的场景值c,从而得到最终分类结果R。该步骤能够弥补步骤六的分类结果Rl中个 别像素点错分的情况,使最终分类结果更加均匀。
[0070] 本发明的的效果可通过以下仿真进一步说明:
[0071]
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1