一种基于FasterRCNN的红绿灯无人驾驶辅助装置及方法与流程

文档序号:15463708发布日期:2018-09-18 18:47阅读:1036来源:国知局

本发明专利涉及无人驾驶、辅助驾驶领域,尤其涉及一种基于RCNN的红绿灯识别方案设计。



背景技术:

近些年,无人驾驶方向的技术创新不断涌现,众多智能化设备和系统已经在实际道路上得到广泛实践,并可以完成一定程度的自动或辅助驾驶。红绿灯的有效识别便是其中一项非常重要的研究课题,如果能够将当前的红绿灯信息及时准确地传达给驾驶员或者自动驾驶系统,将非常有利于减少交通事故,提高驾驶的安全系数。

现实生活中的红绿灯交通标识复杂多样,除去常见的机动车信号灯的圆形之外,还有人行信号灯、方向指示信号灯等。另外,采用摄像头采集图像时,白天、夜晚、阴雨天等不同天气情况下拍摄的样张色彩表现多样。传统的BGR或HSV图像处理方法很难做出泛化能力很强的系统,因此使用深度学习结合传统图像处理手段势在必行。发明(申请公布号CN 107169421A)发明设计了利用RCNN识别汽车驾驶场景的目标检测算法,发明(申请公布号CN 107665336A)也发明了使用RCNN来进行冰箱内物体的检测方法。



技术实现要素:

鉴于上述现有的技术和背景,本发明的目的在于提供一套基于RCNN区域卷积神经网络的红绿灯自动识别提示装置和方法,以提高无人驾驶或辅助驾驶的安全性和可靠性。

实现本发明的技术解决方案为:一种基于Faster RCNN的红绿灯无人驾驶辅助装置及方法。该系统包括塑料的装置外壳、可旋转的摄像头支架、广角摄像头、显示屏和蜂鸣器提醒模块、树莓派3B+主控。其中,所述的摄像头和支架部分,可以进行360旋转和一定程度的弯曲,便于更好地在车内安装本装置。装置外壳的左侧留有USB接口,内置电池的Micro-USB充电接口和开机按钮。

本发明的树莓派主控主要完成如下步骤:

1.系统启动,加载神经网络模型并确保蜂鸣器、显示屏、广角摄像头等正常工作。如果出现异常情况,则进行语音提示,进行报警;

2.开启广角摄像头,并实时采集图像;

3.对采集后的图像进行图像预处理、图像中红绿灯位置定位、红绿灯最终结果识别。识别的结果通过显示屏、树莓派扬声器和蜂鸣器模块进行提示。

一种基于Faster RCNN的红绿灯无人驾驶辅助装置及方法,具有如下的有益效果:

第一、可自由旋转和弯曲的摄像头支架能够大大扩充装置的安装场景,避免装置因不利的安装而损坏。

第二、基于轻量级的深度学习框架和模型编写的程序,能够在保证识别速度的前提下,大大提高识别稳定性,即使是在阴雨天和夜晚。

第三、广角摄像头的拍摄角度,有利于识别左转或右转的红绿灯。

附图说明

图1是本专利的装置结构示意图

图2是本专利的系统设计示意图

具体实施方式

为了使本技术领域的人员更好地理解本发明的技术方案,下面结合实例及附图对本发明产品作进一步详细地说明。

如图1的结构示意图所示,本发明一种基于Faster RCNN的红绿灯无人驾驶辅助装置及方法,包括所述的广角摄像头模块(1)安装在装置的顶部,摄像头旋转支架(2)连接摄像头与主控,安装在装置中间,(3)为装置主体塑料外壳,树莓派主控、蜂鸣器和内置电池(4)及显示屏(5)位于装置内部,预留的接口(6)位于机身左侧。

所述的树莓派主控通过装置左侧的开机按钮启动,引出一个USB接口,便于设备维护和数据的导出、调试。内置的树莓派电池需要单独提供Micro-USB充电接口。

所述的广角摄像头采集的图像原始分辨率为640×480,系统首先用OpenCV(Python版)将原始图像的分辨率缩小一半至320×240,然后用3×3高斯核进行滤波,用于平滑图像,这些步骤统称为图像预处理,主要用于消除噪点的干扰,减少后续的计算量。

进一步的,预处理后的图像进入红绿灯定位程序,使用预先加载的‘faster_rcnn_inception_mscoco’网络模型将图像进行区域卷积神经网络处理,生成红绿灯的可能候选区域(外接矩Bounding Box)。为了去除干扰,将面积小于10×10和位置位于图像四个角落的候选区域排除掉。

接下来,将筛选后的候选区域单独裁剪出来,对每一块区域都进行OpenCV图像处理:从BGR转换到Lab颜色空间,单独提取出a通道,在a通道上使用Otsu算法自动阈值分割。通过计算Biob在整幅候选区域中的面积占比来区分红灯和绿灯。红灯会是很亮的区域,阈值分割后面积占比很小,而绿灯则是很暗的区域,面积占比很大。

其中主要涉及的Faster RCNN和图像处理算法包括:

1)深度网络搭建:原始由TensorFlow框架提供的RCNN模型使用的是ImageNet数据集,网络结构为5层的ZF网络和16层的VGG-16网络。但本发明使用的是MSCOCO数据集,为了便于超参数调优,搭建Inception网络结构,它可以将1×1,3×3,5×5等卷积核的卷积层、池化层进行叠加。

2)图像缩放和滤波:滤波即平滑图像,通过3×3的高斯卷积核实现。有效地去除目标和背景中的噪声,同时保护图像目标的形状、大小及特定的几何和拓扑结构特征。而且,缩小图片的分辨率可以大大减少后续的计算量。本发明所用的图像处理算法均通过OpenCV实现。

3)Lab颜色模型:OpenCV默认读入的图片是BGR颜色通道顺序。而Lab颜色模型是基于人对颜色的感觉,尤其是其中的a通道,它的取值范围是-128~127,代表了颜色从绿色到洋红色的变化,因此,很适合用来进行红绿灯的识别。

应当理解的是,以上所述仅为本发明的示例性描述,并非对本发明任何形式上的限制。在不脱离本发明设计构思的前提下,本领域普通技术人员对本发明的技术方案做出的各种变型和改进,均应属于本发明所附权利要求的保护。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1