一种基于多视角深度学习框架的SAR自动目标识别方法与流程

文档序号:14444953阅读:1142来源:国知局
一种基于多视角深度学习框架的SAR自动目标识别方法与流程

本发明属于雷达目标识别领域,特别涉及一种雷达目标识别领域中合成孔径雷达自动目标识别技术。



背景技术:

合成孔径雷达(syntheticapertureradar,sar)是一种具有全天候、全天时工作能力的高分辨率微波成像雷达,广泛应用于战场感知侦察、地理信息采集、农林环境监测、地质地貌勘探、海洋资源利用等领域,具有极高的民用与军用价值。由于电磁散射特性和相干成像机理,sar成像对目标方位角较为敏感,且sar图像中存在大量相干斑,使之与光学图像的差异进一步增大,增加了人工解译的难度。sar自动目标识别(automatictargetrecognition,atr)基于现代信号处理和模式识别等理论,在没有人工干预的条件下,迅速准确地检测出目标潜在区域,提取目标特征并判别出目标类别信息,为信息感知和精确打击等多个方面提供了有力的技术支持。

当前主流的saratr方法主要有基于模板的方法和基于模型的方法。但传统方法往往存在受人工经验影响较大,算法复杂度较高等问题,难以提取出最优的目标特征并进行高效精准的分类识别。随着人工智能理论的兴起与发展,深度神经网络作为一种自适应能力强的机器学习算法被广泛应用于图像分类、语音信号处理等多个领域,为saratr开辟了新的思路与方向。

文献“d.a.morgandeepconvolutionalneuralnetworksforatrfromsarimagery.spiedefense+security.internationalsocietyforopticsandphotonics,2015,pp.94750f–94750f.”等构建了单输入卷积神经网络用于解决10类sar目标图像的识别问题,但所用网络的训练需要大量目标样本,训练样本数量较少的情况下容易陷入过拟合,并且网络泛化能力较差。

文献“j.ding,b.chen,h.liu,andm.huang.convolutionalneuralnetworkwithdataaugmentationforsartargetrecognition.ieeegeoscienceandremotesensingletters,vol.13,no.3,pp.364–368,march2016.”采用平移、加噪、姿态合成等方法对原始sar图像进行扩充,以满足卷积神经网络训练的需要。但是该方法并没有增加原始sar图像的有效识别信息,样本扩充后识别性能的提升十分有限,且需分配大量的存储空间。原始sar图像较少的情况下深度神经网络难以得到有效训练的问题仍未得到合理解决。



技术实现要素:

为解决上述技术问题,本发明提出了一种基于多视角深度学习框架的sar自动目标识别方法,利用少量原始sar图像,生成大量多视角组合样本,增加了样本中包含的有效识别信息.

本发明采用的技术方案为:一种基于多视角深度学习框架的sar自动目标识别方法,包括:

s1、采集原始sar图像;

s2、对步骤s1采集的原始sar图像进行预处理;

s3、根据视角大小对预处理后的sar图像进行排序;

s4、根据实际成像条件和性能指标设置视角数目k及观察角大小θ;

s5、根据步骤s4设置的视角数目及观察角大小,生成多视角组合样本;

s6、构建多输入并行深度卷积神经网络;

s7、训练深度神经网络,将s5得到的多视角组合样本输入步骤s6构建的多输入并行深度卷积神经网络进行前向传播,计算代价函数值;使用基于梯度下降的后向传播算法对多输入并行深度卷积神经网络参数进行更新;迭代进行前后向传播,直至代价函数收敛。

进一步地,步骤s1具体为:采集相同分辨率,不同视角的原始sar图像。

进一步地,步骤s2具体为:估计原始sar图像的视角,以该角度将原始sar图像旋转至同一方向;并对旋转后的图像进行基于幂变换的灰度增强。

进一步地,步骤s5具体为:组合同一目标类别中任意k个视角下采集得到的sar图像,使其共同构成一个样本;并限制同一组合样本中sar图像视角的变化不超过θ的大小。

进一步地,步骤s6具体为:所述多输入并行深度卷积神经网络包含多个输入通道,每个通道接收一个视角的sar图像;每个通道的低隐层均为交替的卷积层和池化层,得到不同视角下的特征图;逐渐将不同视角下的特征图进行合并,连接至共同的卷积层提取更高层的特征;最后提取出的特征输入全连接层,得到图像样本的分类标签。

本发明的有益效果:本发明的一种基于多视角深度学习框架的sar自动目标识别方法,利用原始sar图像的不同视角,结合实际应用中的数据采集成本及识别性能要求,设计得到灵活的数据扩充方法,具体的:本发明利用少量原始sar图像,生成大量多视角组合样本,增加了样本中包含的有效识别信息;并且基于深度学习理论,构建多输入并行深度神经网络,自动提取出不同视角的有效特征并给出类别预测结果,实现sar目标的迅速精准识别;本发明可根据实际成像条件和性能指标调节样本视角数目及网络结构,在原始sar图像有限的情况下仍能保证较高的识别率,具有灵活、准确、高效和泛化能力强的优点。

附图说明

图1为本发明实施例提供的方案流程图;

图2为本发明实施例提供的多视角组合样本生成方法的示意图;

图3为本发明实施例提供的具体网络结构示意图。

具体实施方式

为便于本领域技术人员理解本发明的技术内容,首先对以下术语进行解释。

术语:视角估计

视角指合成孔径雷达成像几何中的俯仰角、方位角等姿态信息,其具体估计方法参见文献“j.c.principe,d.xu,andj.w.fisheriii.poseestimationinsarusinganinformationtheoreticcriterion.aerospace/defensesensingandcontrols.internationalsocietyforopticsandphotonics,1998,pp.218–229.”

如图1所示为本发明的方案流程图,本发明的技术方案为:一种基于多视角深度学习框架的sar自动目标识别方法,包括:

s1、采集原始sar图像;具体为:采集相同分辨率,不同视角的原始sar图像。本实施例中视角分布于0°到360°范围内的原始sar图像。

s2、对步骤s1采集的原始sar图像进行预处理;具体为:估计原始sar图像的视角,以该角度将原始sar图像旋转至同一方向;并对旋转后的图像进行基于幂变换的灰度增强;包括:

s21、以表示原始sar图像需要旋转的角度,原始sar图像中坐标(p,q)旋转后以(u,v)表示,则其计算公式为:

其中,p,q分别表示原始sar图像的横坐标和纵坐标;u,v分别表示旋转后的sar图像的横坐标和纵坐标。

s22、对旋转后的图像进行灰度增强:以x表示增强前sar图像,x′表示增强后sar图像,则x′(u,v)=[x(u,v)]β,其中,β表示增强因子。

s3、根据视角大小对预处理后的sar图像进行排序;具体为:以表示第i类目标的sar图像集合,其中每张图像对应于不同的视角将同类目标的sar图像根据其视角大小进行排序;本实施例中将多视角组合样本中不同sar图像按照视角大小升序排列,但是本领域的技术人员应注意这里只是为了便于理解,选择了升序排列;但是本发明并不局限于这一种排序方式,也可设定为降序排列方式。

s4、根据实际成像条件和性能指标设置视角数目k及观察角大小θ;如图2所示,本发明实施例中定义k=3。

s5、根据步骤s4设置的视角数目及观察角大小,生成多视角组合样本;具体为:组合同一目标类别中任意k个视角下采集得到的sar图像,使其共同构成一个样本{xi1,xi2,…,xik};并限制同一组合样本中sar图像视角的变化不超过观察角θ的大小,即

如图2所示,某类目标共包含6个不同方位角的sar图像,共生成9个三视角组合样本;本发明实施例以三视角组合样本为例进行说明,但是本发明并不局限于这一视角数目,也可将视角数目设为二、四或其他整数值。

s6、构建多输入并行深度卷积神经网络;具体为:本发明所用并行深度神经网络包含k个输入通道,每个通道接收一个视角的sar图像;每个通道的低隐层均为交替的卷积层和池化层,得到不同视角下的特征图;并逐渐将不同视角下的特征图进行合并,连接至共同的卷积层提取更高层的特征;最后提取出的特征输入全连接层,得到图像样本的分类标签;另外本发明实施例还在共同的卷积层采用随机失活技术提高网络的泛化能力。

如图3所示为本发明实施例的具体网络结构,其中,卷积层表示方法为“卷积层(特征图数目)@(卷积核大小)”;池化层表示方法为“池化层(池化窗口大小)”;全连接层表示方法为“全连接层(神经元数目)”。

在本实施例中,三个输入通道分别以不同视角的sar图像作为输入,视角1和视角2的输入图像分别经由一组卷积/池化层处理后连接至共同的卷积层,将得到的特征图进行合并;视角3的输入图像经由两组卷积/池化层处理后将得到的特征图与视角1和视角2合并通道产生的特征图进行合并,三个视角合并后的特征图共同作为下一卷积层的输入;本实施例包含两个全连接层,第二个全连接层作为分类器,得到最终类别标签。

s7、训练深度神经网络,将s5得到的多视角组合样本输入步骤s6构建的多输入并行深度卷积神经网络进行前向传播,计算代价函数值;使用基于梯度下降的后向传播算法对多输入并行深度卷积神经网络参数进行更新;迭代进行前后向传播,直至代价函数收敛。具体包括以下步骤:

s71、前向传播,以表示第l层(l≥2)第t个特征图,若第l层为卷积层,则

其中,表示连接第s个输入特征图和第t个输出特征图的卷积核,表示偏置项,σ(·)表示非线性激活函数,符号“*”表示卷积运算;

若第l层为池化层,则

其中,r1、r2表示池化窗口的大小;

若第l层为全连接层,则

a(l)=σ(w(l)a(l-1)+b(l))(4)

其中,a(l)表示第l层的特征图;w(l)表示第l层权重,b(l)为该层偏置项;

若第l层为输出层,则当前样本属于第i类的后验概率为

其中,z(l)表示输出层的输入,c表示总类别数。

s72、计算代价函数值,图3所示实施例中以交叉熵函数作为代价函数,其计算公式为

其中,l(w,b)表示代价函数;w、b分别表示网络中权重与偏置项的集合。

s73、基于梯度下降的后向传播算法对网络参数进行更新,具体计算公式为

其中,α为学习率。

最后本发明还包括:对步骤s7训练完成的网络进行识别性能测试,具体为:将测试样本输入s7中训练完成的网络进行前向传播,得到测试样本属于各类别的后验概率,比较各类后验概率大小,取最大者所对应的类别作为最终预测结果。

表1为实施例中所用网络训练及测试使用的原始sar图像类别及数目,表2为实施例所得识别结果。从结果中可以看出,本发明可利用少量原始sar图像,实现多类sar目标的高效识别,10类目标的平均识别率可达98.17%。

表1原始sar图像类别及数目

表2识别结果

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1