基于PreciseROI-FasterR-CNN的雷达目标图像检测方法与流程

文档序号:18622137发布日期:2019-09-06 22:35阅读:241来源:国知局
基于Precise ROI-Faster R-CNN的雷达目标图像检测方法与流程

本发明属于雷达信号处理技术领域,更具体地,本发明涉及一种基于preciseroi-fasterr-cnn的雷达目标图像检测方法,可用于雷达目标检测智能处理。



背景技术:

雷达作为目标探测和监视的主要手段,在公共安全以及国防安全领域应用广泛。然而受海洋环境复杂、回波信杂比低以及目标复杂运动特性的影响,目标回波极其微弱,具有低可观测性,使得雷达对杂波背景下目标的探测性能难以满足实际需求。杂波中低可观测目标检测技术成为关键制约因素,也是世界性难题,难以实现稳健、可靠和快速的检测。

近年来人工智能得到了广泛的关注和支持,深度学习发展迅猛,而卷积神经网络更是因为其在计算机视觉领域的优异性能在众多领域都得到了广泛的应用。卷积神经网络能够通过卷积核对图像的卷积自动提取图像特征,从而实现良好的目标识别功能。基于卷积神经网络的目标检测方法主要分为两类:基于区域建议网络和基于回归方法的目标检测方法。前者包括r-cnn、spp-net、fastrcnn、fasterrcnn等检测方法,后者衍生了yolo、ssd等检测方法。现在在合成孔径雷达的目标检测方面上得到了较为广泛的应用,李君宝等提出了基于深度卷积网络的sar图像目标检测识别方法,杜兰等提出了基于卷积神经网络的sar图像目标检测算法,黄洁等提出了基于卷积神经网络的遥感图像舰船目标检测方法。然而,雷达遥感图像获取的成本高、技术复杂,普适性较差,相较而言雷达适用范围广,成本不高,检测性能优异,在目标检测上有着广阔的应用前景。因此,将深度学习目标检测方法应用于雷达图像实现目标的检测有着理论的可行性和实践性。本专利提出一种基于preciseroi-fasterr-cnn(preciseregionofinterestsfasterr-cnn,精确感兴趣区域fasterr-cnn)的雷达目标图像检测方法,将雷达回波数据构建成图像,采用深度学习网络来进行图像处理,从而完成目标的智能检测与分类。



技术实现要素:

本发明的目的在于将基于深度学习的图像目标检测方法应用于雷达目标检测领域,提高雷达目标检测和分类性能,提出一种基于preciseroi-fasterr-cnn的雷达目标图像检测方法。其中要解决的技术问题包括:

(1)基于统计模型的检测方法仅在假设的统计模型条件下性能才能达到最优,难以适应变化多样的复杂背景和多类型目标场景;

(2)传统雷达目标检测和分类流程复杂,需要先检测后分类,花费时间长。

(3)原有的fasterr-cnn目标检测算法对于图像的检测处理较为粗放,损失了相当一部分的检测性能,检测过程不够精简,损失了检测速度。

本发明所述的基于preciseroi-fasterr-cnn的雷达目标图像检测方法,其特征在于包括以下技术措施:

步骤一、将雷达回波数据转换为图像,构建训练数据集;

步骤二、构建preciseroi-fasterr-cnn目标检测模型,包括共享卷积神经网络、区域建议网络(rpn)、分类和回归网络,并采用elu激活函数、preciseroipooling方法和软化非极大值抑制(soft-nms)方法;

步骤三、输入训练数据集对模型进行迭代优化训练,得到最优网络参数;

步骤四、将实时雷达回波生成图像,输入训练后的目标检测模型进行测试,完成目标检测与分类。

对比现有技术,本技术方案所述的基于preciseroi-fasterr-cnn的雷达目标图像检测方法,有益效果在于:

(1)突破传统检测方法的限制,能够智能处理不同运动类型的目标,并适应复杂环境;

(2)将深度学习应用于雷达目标检测,能根据训练数据集智能学习和提取目标特征,在一定程度上,输入训练的数据量越大,提取的特征越精细,检测精度也越高,提高目标检测和分类概率;

(3)该方法能够做到检测的同时完成目标类型的分类,做到检测与分类一体化处理,降低处理时间和硬件成本。

附图说明

附图1是基于preciseroi-fasterr-cnn的雷达目标图像检测方法的实施流程图。

附图2是preciseroi-fasterr-cnn模型结构图。

具体实施方式

如图1所示,本发明的处理流程分以下步骤:

1)雷达回波数据采集,构建图像训练数据集

采集多种观测条件和区域下的雷达回波数据,确保采集数据样本的多样性,将回波数据信息转换为图像信息,对图像进行裁剪和数据增强处理,然后进行人工识别分类和标签添加,构建复杂多样的雷达图像训练数据集。

2)构建preciseroi-fasterr-cnn目标检测模型

如图2所示,构建的precise-fasterr-cnn目标检测模型结构分为三部分:共享卷积神经网络、区域建议网络(regionproposalnetwork,rpn)、分类和回归网络,其中,共享卷积神经网络由zfnet、vgg、resnet前端所有的卷积层部分组成,实现目标特征提取任务;区域建议网络rpn实现候选框生成任务;分类和回归网络实现最终的目标检测与分类。

设经过特征变换得到的特征图矩阵为x,p={x1,x2,x3,…,xi,…xn}为输入共享卷积神经网络特征图的集合,则第i个信号对应的特征图矩阵为xi。

(1)共享卷积神经网络部分:

根据任务情况选用深度卷积神经网络(zfnet、vgg、resnet等)中的任一网络的卷积层作为共享卷积层,提取的特征共享给区域建议网络和分类和回归网络。

以zfnet为例。第一层卷积层通过卷积核对输入的特征图xi进行卷积操作,使用偏置系数扩充卷积区域,使边缘特征能够更完整的提取,自动提取特征图中信号的特征,然后经过elu激活函数引入非线性因素,其中α为调节参数,elu激活函数收敛速度快,鲁棒性增强并且能缓解梯度消失。

则输出的j个特征图,

其中,表示第一层对第i个特征图进行卷积操作的第j个卷积核,表示第一层中与第j个卷积核相对应的第j个偏置系数,表示卷积操作,lj为输入的特征图集合,表示第一层输出的第j个特征图;

第二层池化层通过池化函数对进行下采样,降低数据维度和减少运算量,得到第二层输出的第j个特征图池化函数采用平均池化,

其中,函数为平均池化函数,表示在每个大小为c×c池化核窗口内取特征图矩阵的平均值,c为设定的池化核大小;

第三层卷积层通过卷积核对第二层输出的第j个特征图进行卷积操作,使用偏置系数扩充卷积区域,mj为输入的特征图集合,则输出第j个特征图

其中,表示第三层对第i个特征图进行卷积操作的第j个卷积核,表示第三层中与第j个卷积核相对应的第j个偏置系数,表示第三层输出的第j个特征图;

第四层池化层通过池化函数对第三层输出j个的特征图进行下采样,输出的第j个特征图池化函数采用平均池化,

第五层卷积层通过卷积核对第四层输出的第j个特征图进行卷积操作,使用偏置系数扩充卷积区域,lj为输入的特征图集合,则输出第j个特征图

其中,表示第五层对第i个特征图进行卷积操作的第j个卷积核,表示第五层中与第j个卷积核相对应的第j个偏置系数,表示第五层输出的第j个特征图;

第六层卷积层通过卷积核对第五层输出的第j个特征图进行卷积操作,使用偏置系数扩充卷积区域,pj为输入的特征图集合,则输出第j个特征图

其中,表示第六层对第i个特征图进行卷积操作的第j个卷积核,表示第六层中与第j个卷积核相对应的第j个偏置系数,表示第六层输出的第j个特征图;

第七层卷积层通过卷积核对第六层输出的第j个特征图进行卷积操作,使用偏置系数扩充卷积区域,qj为输入的特征图集合,则输出第j个特征图

其中,表示第七层对第i个特征图进行卷积操作的第j个卷积核,表示第七层中与第j个卷积核相对应的第j个偏置系数,表示第七层输出的第j个特征图;

(2)区域建议网络(rpn)部分:

区域建议网络(rpn)是将共享卷积网络输入的特征分别在两条支路处理,一条支路做预分类处理得到每个特征图的每一个像素位置预设的9种形状尺度框属于前景(目标)和背景的得分,另一条支路做回归处理得到对于每个特征图的每一个像素位置预设的9种形状尺度框与加标签的真实检测框之间的4个变换参数,包括2个平移参数和2个伸缩参数,每4个变换参数确定一个候选框,将初步确定的候选框后先用softmax分类的分数排序剔除分数低的候选框,然后采用soft-nms做非极大值抑制处理,选取一定数量的候选框作为最终生成的优质候选框。

首先,该层卷积层通过卷积核对上述第七层输出的第j个特征图进行卷积操作,使用偏置系数扩充卷积区域,rj为输入的特征图集合,则输出第j个候选框区域

其中,表示该层对第i个特征图进行卷积操作的第j个卷积核,表示该层中与第j个卷积核相对应的第j个偏置系数,表示该层输出的第j个候选特征框区域;

网络从该部分开始分为两支路处理,其中一条支路卷积核对上一层输出的第j个候选框区域进行卷积操作,使用偏置系数扩充卷积区域,sj为输入的候选框区域集合,则输出第j个候选框区域

其中,表示该层对第i个候选框区域进行卷积操作的第j个卷积核,表示该层中与第j个卷积核相对应的第j个偏置系数,表示该层输出的第j个候选框区域,g()表示softmax函数,

另一条支路卷积核对上一层输出的第j个候选框区域进行卷积操作,使用偏置系数扩充卷积区域,tj为输入的候选框区域集合,则输出第j个候选特征向量

其中,表示该层对第i个候选框区域进行卷积操作的第j个卷积核,表示该层中与第j个卷积核相对应的第j个偏置系数,表示该层输出的第j个候选特征向量,包括生成的区域候选框的高度、宽度、中心点平面直角坐标四个参数。

rpn网络的两支输出结果生成了大量的区域候选框,进行soft-nms操作,得到精选候选框样本,

其中,si为第i个候选框的得分,m为当前得分最高框,bi为待处理框,nt为检测的阈值,bi和m的iou越大,bi的得分si就下降的越厉害,iou表示预测框与标注框之间的重合度百分比,soft-nms改善了漏检和误检问题,有助于提高检测性能。

preciseroipooling是将区域候选网络输出的候选框映射到输入的特征图的相应区域,将该区域输出为相同的尺度后进行池化操作,计算方法为

其中,

(x1,y1)、(x2,y2)为其中一个bin区域的左上角和右下角坐标,bin为池化前分割成的一个个区域,ic函数计算每一个连续的x,y方向的偏移的乘积,在1个像素以内的偏移,使用该像素(i,j)表示,然后该偏移的乘积和(i,j)的像素值wi,j乘积得到f(x,y)。从(x1,y1)到(x2,y2)对f(x,y)求积分,可以得到整个bin区域的像素的和,求平均得到该bin区域的输出。最终每个bin区域都输出1个数值,形成特征图矩阵,preciseroipooling使像素值有梯度的传递,提高了池化的精度。

(3)分类和回归网络部分:

分类和回归网络是将共享卷积网络提取的特征图和区域建议网络生成的候选框输入preciseroipooling,输出尺度相同的特征,分别在分类和回归网络的两条支路处理,一条支路做分类处理,一条支路做回归处理。

全连接层通过卷积核对preciseroipooling输出的j个特征图yj进行卷积操作,使用偏置系数扩充卷积区域,则该层输出的第j个特征图

其中,表示该层中对第i个特征向量进行卷积操作的第j个卷积核,表示与第j个卷积核相对应的第j个偏置系数

下一个全连接层通过卷积核对第四层输出的j个特征图进行卷积操作,使用偏置系数扩充卷积区域,则该层输出的第j个特征图

其中,表示该层中对第i个特征向量进行卷积操作的第j个卷积核,表示第六层中与第j个卷积核相对应的第j个偏置系数

网络从该部分开始分为两支路处理,其中一条支路卷积核对上一层输出的第j个特征图进行卷积操作,使用偏置系数扩充卷积区域,vj为输入的特征图集合,则输出第j个特征图

其中,表示该层对第i个特征图进行卷积操作的第j个卷积核,表示该层中与第j个卷积核相对应的第j个偏置系数,表示该层输出的第j个特征图,g()表示softmax函数,最后进行q类目标的检测分类,softmax层求出每类的判别概率,输出第j类的检测概率yj;

另一条支路卷积核对上一层输出的第j个特征图进行卷积操作,使用偏置系数扩充卷积区域,zj为输入的特征图集合,则输出第j个特征向量

其中,表示该层对第i个特征图进行卷积操作的第j个卷积核,表示该层中与第j个卷积核相对应的第j个偏置系数,表示该层输出的第j个特征向量,包括生成的区域候选框的高度、宽度、中心点平面直角坐标四个参数;

两支输出的结果进行soft-nms操作生成最终的区域候选框。

3)输入训练数据集对模型进行迭代优化训练,得到最优的网络参数

卷积神经网络训练的目的调整权值系数优化卷积神经网络,进一步提高检测的精确度后获得最优的权值参数。用损失函数来表示输出值与真实值的误差,包括分类损失和回归损失,目标函数是求得损失函数的最小值,从而使得目标检测模型最优化,即通过梯度下降法对参数进行不断的迭代优化,直到损失函数最小,

4)目标检测与分类

重复步骤一,将实时生成的回波数据图像输入到基于大量优质数据训练好的最优目标检测模型中,对目标进行检测和分类一体化处理。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1