基于深度学习SSD框架的道路车辆实时检测方法与流程

文档序号:11063684阅读:来源:国知局

技术特征:

1.基于深度学习SSD框架的道路车辆实时检测方法,包括如下步骤:

1)构建训练数据集:

1a)在交通要道拍摄若干个行驶车辆的视频,将这些视频每隔10帧保存为图片,并存放到JPEGImages文件夹下作为训练数据;

1b)对(1a)的每张图片中车窗部分进行标注,生成txt格式的标注文件并进行xml格式转换,将转换为xml格式的文件均分成两部分,其中将一部分图片的图片名写入到trainval.txt文件中,另一部分则将图片名写入到test.txt文件中,得到训练网络所需的trainval.txt文件、test.txt文件和与图片相对应的xml文件;

1c)将(1b)中的所有xml文件进行合并后存放到Annotations文件夹下,并将生成的trainval.txt文件和test.txt文件存放到ImageSet/Main文件夹下;

2)搭建SSD训练网络架构:

2a)下载并安装caffe-ssd平台;

2b)在caffe-ssd平台中下载并打开VGG-16网络结构的deploy.prototxt文件,修改其卷积层及全链接层的层类别,以此作为基础网络base_network;

2c)在基础网络base_network的末尾添加卷积层及池化层,作为额外的特征提取层;

2d)创建mbox_layers层,并根据基础网络base_network,设定mbox_layers层的相关参数;

3)转换数据格式开始训练:

3a)修改caffe_ssd平台下的标签字典,该标签字典的文件名为labelmap_voc.prototxt;

3b)将1)中准备好的数据集存放到data文件夹下,修改并运行相应程序生成lmdb格式文件;

3c)将3a)中修改过的标签字典文件和3b)生成的lmdb文件输入到搭建好的SSD训练网络进行训练,得到最终的训练模型;

4)利用训练模型进行视频车辆检测:

4a)将任意待测行驶车辆视频按帧输入到训练好的模型中;

4b)对于输入的每一帧图像,该模型将随机地选取整幅图像的多个区域,并采用卷积算法对每个区域进行打分;

4c)设定一个阈值δ=0.3,将每一个区域的得分分别与δ比较,将得分高于δ的区域,判断为包含汽车车窗,并调用绘图命令对这个区域进行标注;将得分值低于δ的区域,判断为不包含车窗或包含不完全车窗,直到图像上所有被判断为包含汽车车窗的区域均标注完成;

4d)重复4b)-4c),将4a)中待测视频的所有帧图像处理后,得到相应的输出视频,此输出视频将会标注出每一个包含汽车前窗的区域,从而完成对一段视频中每一辆汽车的检测。

2.根据权利要求1所述的方法,其中步骤3c)中训练SSD网络,按如下步骤进行:

3c1)用K个随机取值的卷积核对图像进行卷积得到K个特征图;

3c2)从K个特征图中选取几个特征图,按不同的权重输入到损失函数中计算损失值,并采用梯度下降法更新卷积核的大小和权重的大小;

3c3)重复3c1)-3c2),直到损失函数达到最小,记录卷积核和权重的值。

3.根据权利要求1所述的方法,其中步骤4b)中采用卷积算法对每个区域进行打分,按如下步骤进行:

4b1)用K个训练好的卷积核与一个区域进行二维卷积,得到K个卷积值;

4b2)将K个卷积值求加权平均,即得到该区域的打分。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1