一种基于全卷积神经网络的SAR图像目标检测方法与流程

文档序号:11177755阅读:1072来源:国知局
一种基于全卷积神经网络的SAR图像目标检测方法与流程

【技术领域】

本发明属于图像处理技术领域,具体涉及一种基于全卷积神经网络的sar图像目标检测方法。



背景技术:

合成孔径雷达sar是一种高分辨率主动式有源微波遥感成像雷达,具有全天候、全天时、分辨率高等优点,不受时间、天气等的限制,能获得目标更丰富的信息。在对地观测和军事侦查等领域得到了广泛的应用。

sar图像目标检测是sar-atr(自动目标识别)的关键步骤,也是sar图像解译应用的热点。在sar图像中,目标体积较小,背景信息复杂,对目标检测造成了一定的难度。

卷积神经网络作为应用最为广泛的深度神经网络之一,已经成为了语音分析和图像处理领域的研究热点。卷积神经网络的权值共享结构使得参数大大减少,降低了网络模型训练的复杂度。此外,卷积神经网络对于平移、缩放、倾斜等变形具有高度不变性。但是,由于卷积神经网络的下采样和全连接层的结构,使得卷积神经网络的输入大小必须固定,应用不够灵活方便。全卷积神经网络克服了这一缺陷。通过上采样层,全卷积神经网络得到了和原图一样的大小的输出特征图。由于全卷积神经网络的结构中只有卷积层和采样层,因此能够接受任意大小的输入。

目前最为广泛应用的sar目标检测算法是恒虚警率(constantfalsealarmrate,cfar)检测算法。cfar检测算法简单、快速、实时性强。然而由于背景杂波的估计需要一定的先验知识。在先验信息不足的情况下,背景杂波不一定服从预设的分布,将造成杂波统计模型不够准确,带来了检测不准确、虚警率高的问题。同时,由于cfar算法是逐像素的计算,在sar图像尺寸较大时,耗时将相当长,实用性不高。

目前常见的sar图像目标检测方法都有着检测时间长、准确率低的缺陷。



技术实现要素:

本发明的目的在于针对sar图像目标检测方法检测时间长、准确率低的问题,提出一种基于全卷积神经网络的sar图像目标检测方法,通过该方法能够实现端到端的检测,提高检测准确率和检测速度。

本发明的目的通过如下技术方案实现:

一种基于全卷积神经网络的sar图像目标检测方法,包括如下步骤:

(1)获取sar图像,选取出目标训练集和目标测试集;

(2)扩充训练数据集;

(3)构建全卷积神经网络:

(4)将步骤(2)中扩充后的训练数据集输入到步骤(3)的全卷积神经网络中,通过自适应学习率调整算法进行训练,得到训练好的模型;

(5)将步骤(1)的sar图像作为测试图片输入到训练好的模型中进行显著性检测,得到输出的显著性特征图;

(6)对显著性特征图进行形态学处理,去除孤立点和缝隙;

(7)对步骤(6)处理后的显著性特征图进行连通域标记,得到每个连通域的质心;

(8)以每个连通域的质心为中心,提取与各个目标质心对应的检测切片;

(9)将各个检测切片在输入的原始sar图像中标记出来,得到测试数据的目标检测结果。

所述步骤(2)中,扩充训练数据集包括如下步骤:

(2a)从测试集中随机选取m组目标切片,每组n个切片,m和n为正整数;

(2b)对于步骤(2a)中生成的每组目标切片,随机选取一张场景图,将目标切片随机分布到场景图中,共生成m幅场景训练图;

(2c)对于步骤(2b)中生成的每幅场景训练图,生成一幅相对应的特征显著图,具体为,首先生成大小等于原图的全零矩阵,然后将目标切片在图中的对应位置设置为1,共生成m幅和场景训练图一一对应的显著特征图,将这些显著特征图作为在训练全卷积神经网络的训练类标。

所述m取值为3000,n取值为15。

所述步骤(3)中,构建一个由第一卷积层→第一下采样层→第二卷积层→第二下采样层→第三卷积层→第三下采样层→第四卷积层→第四下采样层→第五卷积层→第一上采样层→第六卷积层→第二上采样层→第七卷积层→第三上采样层→第八卷积层→第四上采样层→第九卷积层组成的全卷积神经网络,给定各组的特征映射图,并确定各组卷积层、上采样层、下采样层的尺寸。

所述全卷积神经网络的参数如下:

第一卷积层,卷积核数目为16,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第一下采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第二卷积层,卷积核数目为8,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第二下采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第三卷积层,卷积核数目为8,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第三下采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第四卷积层,卷积核数目为8,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第四下采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第五卷积层,卷积核数目为8,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第一上采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第六卷积层,卷积核数目为8,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第二上采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第七卷积层,卷积核数目为8,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第三上采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第八卷积层,卷积核数目为16,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数;

第四上采样层,核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素;

第九卷积层,卷积核数目为1,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为sigmoid函数。

所述步骤(4)中,通过自适应学习率调整算法进行训练时的具体参数为:损失函数为二值交叉熵,优化算法为自适应学习率调整算法,迭代次数为10代。

所述步骤(5)的具体步骤为:将测试图片输入到训练好的模型中进行显著性检测,得到一个与测试图片大小相同的特征矩阵,该特征矩阵中每个元素的值在0到1之间,将特征矩阵与0.5比较,大于0.5的位置置为1,小于0.5的位置置为0。

所述步骤(6)的具体步骤为:

(6a)对于得到的特征显著图,进行膨胀处理,去除显著图的目标块内部的缝隙;

(6b)对膨胀后的显著图进行去除小连通域的处理,去除不可能是目标的孤立点。

所述步骤(6a)中,膨胀系数为10个像素,步骤(6b)中,保留的连通域的最小值为300个像素。

所述步骤(8)中,切片的中心点大小为7744个像素。

本发明与现有的技术相比具有以下优点:

本发明由于在sar图像目标检测中引入了全卷积神经网络,克服了现有技术对切片进行的像素级别的处理,实现了端到端的目标检测,提高了目标检测的速度;本发明由于使用了数据扩充,得到了远大于原数据的训练数据,充分训练了全卷积神经网络,提高了目标检测的准确率。本发明能够准确的检测出合成孔径雷达sar图像的目标,并且可用于后续合成孔径雷达sar图像的目标识别。

【附图说明】

图1是本发明基于全卷积神经网络的sar图像目标检测方法的实现流程图;

图2是本发明中全卷积神经网络输出的显著性特征图;

图3是用本发明对待检测图像的检测结果图。

【具体实施方式】

以下结合附图对本发明的实现步骤和实验效果作进一步详细描述:

参照图1,本发明的基于全卷积神经网络的sar图像目标检测方法具体实现步骤如下:

步骤1,获取sar图像,具体包括如下步骤:

(1a)从mstar数据库中的数据中选取一部分目标切片作为目标训练集,另一部分作为目标测试集;

(1b)从mstar数据库中的数据中随机选取15幅场景图作为场景训练集,其余的场景图作为场景测试集;

步骤2,扩充目标训练数据集,具体包括如下步骤;

(2a)从目标测试集中随机选取3000组目标切片,每组15个切片;

(2b)对于每组目标切片,随机选取一张场景图,将目标切片随机分布到场景图中,共生成3000幅场景训练图;

(2c)对于每幅场景训练图,生成一幅相对应的特征显著图,具体如下:

首先生成大小等于原图的全零矩阵,然后将目标切片在图中的对应位置设置为1,共生成3000幅和场景训练图一一对应的显著特征图,这些显著特征图在训练全卷积神经网络时将作为训练类标;

步骤3,构建全卷积神经网络,具体的构建方法为:

第一层为卷积层,使用16个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出16个特征图,送入第二层;

第二层为下采样层,将第一层输出的每个特征图经过一个下采样进行降维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将降维后的特征图输入到第三层;

第三层为卷积层,使用8个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出8个特征图,送入第四层;

第四层为下采样层,将第一层输出的每个特征图经过一个下采样进行降维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将降维后的特征图输入到第五层;

第五层为卷积层,使用8个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出8个特征图,送入第六层;

第六层为下采样层,将第一层输出的每个特征图经过一个下采样进行降维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将降维后的特征图输入到第七层;

第七层为卷积层,使用8个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出8个特征图,送入第八层;

第八层为下采样层,将第一层输出的每个特征图经过一个下采样进行降维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将降维后的特征图输入到第九层;

第九层为卷积层,使用8个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出8个特征图,输入第十层;

第十层为上采样层,将第一层输出的每个特征图经过一个上采样进行升维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将升维后的特征图输入到第十一层;

第十一层为卷积层,使用8个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出8个特征图,送入第十二层;

第十二层为上采样层,将第一层输出的每个特征图经过一个上采样进行升维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将升维后的特征图输入到第十三层;

第十三层为卷积层,使用8个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出8个特征图,送入第十四层;

第十四层为上采样层,将第一层输出的每个特征图经过一个上采样进行升维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将升维后的特征图输入到第十五层;

第十五层为卷积层,使用16个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为relu函数,输出8个特征图,送入第十六层;

第十六层为上采样层,将第一层输出的每个特征图经过一个上采样进行升维,下采样的核窗口大小为2×2个像素,相邻局部接受域的中心距离为2个像素,将升维后的特征图输入到第十七层;

第十七层为卷积层,使用1个卷积核,卷积核窗口大小为3×3个像素,相邻局部接受域的大小为1,激活函数为sigmoid函数,输出1个特征图。

步骤4,将扩充后的训练数据输入到全卷积神经网络中进行训练,损失函数为二值交叉熵(binary-crossentropy),优化算法为自适应学习率调整算法(adadelta),迭代次数为10代;

步骤5,将测试图片输入到训练好的模型中进行显著性检测,得到一个与测试图片大小相同的特征矩阵,该特征矩阵中每个元素的值在0到1之间,将特征矩阵与0.5比较,大于0.5的位置置为1,小于0.5的位置置为0,得到二值化后的矩阵,称为显著性特征图,如图2所示,在显著特征图中,值为1的位置表明测试图中对应的该位置可能存在目标,值为0的位置表明测试图中对应的该位置不存在目标;

步骤6,对显著性特征图进行形态学处理,去除孤立点和缝隙,具体包括如下步骤:

(6a)对于得到的特征显著图,首先进行膨胀处理,去除显著图的目标块内部的缝隙,膨胀系数为10个像素;

(6b)对膨胀后的显著图进行去除小连通域的处理,去除不可能是目标的孤立点,保留的连通域的最小值为300个像素;

步骤7,对处理后的特征图进行连通域标记,得到每个连通域的质心;

步骤8,以每个连通域的质心为中心,提取与各个目标质心对应的检测切片,切片的中心点为连通域质心,大小为7744个像素(即88×88的窗口);

步骤9,将各个检测切片在输入的原始sar图像中标记出来,得到测试数据的目标检测结果。

本发明的效果可以通过以下仿真实验进一步说明:

1.仿真条件:

硬件平台为:惠普z840

软件平台为:keras

2.仿真内容与结果:

用本发明方法在上述仿真条件下进行实验。图2为经过步骤6中的形态学处理后的显著特征图,图中黑色表示背景,白色为显著区域即目标可能存在的区域。图3为经过步骤9处理的检测结果图,黑色框表示检测到的目标。从图2和图3可以看到,本发明方法的检测准确率高,在测试图片上没有漏检和虚警。将本发明与os-cfar的检测结果和测试时间进行对比,结果如表1所示:

表1

从表1可见,本发明的漏检率、虚警率均低于传统的os-cfar方法,且检测时间显著缩短。

综上,本发明引入了基于全卷积神经网络的sar目标检测方法,实现了端到端的sar目标检测,检测准确率和检测速度均得到了显著提高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1