一种基于深度学习的车辆检测方法与流程

文档序号:14217488阅读:355来源:国知局

本发明属于计算机视觉技术领域,具体涉及一种基于深度学习的车辆检测方法,利用深度网络中的最后一层卷积层的特征图进行权值相加的方法实现对车辆的精确定位。



背景技术:

近年来随着经济的不断增长,汽车的数量也在持续增加,由此引发了一系列的交通问题,为解决这些问题智能交通系统成为研究热点。而车辆检测属于智能交通系统中最重要的环节,精确的定位车辆位置对智能交通系统的车辆计数、车辆分类等研究领域有着关键性作用。

目前车辆检测算法主要有基于特征的车辆检测算法、基于视觉的车辆检测算法、基于帧间差分的车辆检测算法等。其中基于视觉和基于帧间差分的车辆检测算法主要基于运动车辆检测,而基于特征的车辆检测算法更常用于静态图像检测。

目前,对于基于特征的车辆检测算法通常需要图像预处理、图像特征提取、图像分类等步骤。李云翀等人将直方图分析和自适应阈值结合来分割阴影和边缘特征,从而得到车辆区域,但该方法对图像光照情况的要求比较高,没有很好的鲁棒性(李云翀,何克忠,贾培发.基于阴影特征和adaboost的前向车辆检测系统[j].清华大学学报:自然科学版,2007,47(10):1713-1716.)。文献提取图像的harr-like特征并用adaboost分类器识别车辆来实现车辆检测,该方法对需要提取大量的harr-like特征,计算量大(金立生,王岩,刘景华,等.基于adaboost算法的日间前方车辆检测[j].吉林大学学报:工学版,2014,44(6):1604-1608.)。李琳辉等人提出根据车底阴影特征结合卷积神经网络进行前方车辆检测,将日间道路环境分为弱光照、正常光照、强光照三类,进行自适应阴影分割生成阴影区域。但是该方法在光照微弱,车辆灰度与道路灰度接近时无法适用,而且光照的划分具有一定的人为限定性,没有很好的鲁棒性和适应性(李琳辉,伦智梅,连静,等.基于卷积神经网络的道路车辆检测方法[j].吉林大学学报(工),2017,47(2):384-391.)。赵英男等人提出gabor滤波器提取特征,并用svm分类器分类的方式实现车辆检测,该方法主要适用于红外车辆,而且应用阈值分割进行候选区域确定,该算法对阈值要求比较高,有一定的局限性。



技术实现要素:

发明目的:为解决现有车辆检测算法过度依赖图像的光照、质量的问题,使车辆检测具有更好的适应性和可应用性,本发明提供一种基于深度学习的车辆检测方法。

技术方案:一种基于深度学习的车辆检测方法,包括以下步骤:

步骤s1:将带有车辆品牌标注信息的车辆数据库进行去均值处理,选取imagenet数据库训练好的深度学习模型作为基本网络模型,在基本网络模型的基础上用去均值的车辆数据库采取微调的方式训练网络,得到最终用于车辆检测的深度学习网络;

步骤s2:将待检测图像缩放到固定尺寸,并对待检测图像进行去均值处理,得到去均值的待检测图像;

步骤s3:将去均值的待检测图像送入深度学习网络中,经过卷积层、池化层、全连接层得到最大分类概率,依据最大分类概率得到对应的全连接层的权值;

步骤s4:将去均值的待检测图像输入到深度学习网络,在最后一层卷积层得到特征图结果,对特征图与步骤s3得到的权值进行叠加,将叠加后的多张特征图结果进行像素值相加,并进行归一化操作,得到最终的特征图结果;

步骤s5:将得到的最终的特征图结果与原始的待检测图像进行图像融合,依据图像处理中的自适应阈值选取,设定图像阈值找到融合后的图像的像素值较大的区域,即最大响应区域,然后依据轮廓查找找到响应最大区域的外接矩形,实现车辆的精确定位和检测。

进一步的,所述步骤s1中微调的步骤包括:固定卷积层的学习率为0.01,将全连接层的学习率调整至0.001,依据训练图像数量=迭代次数*批处理次数,修改迭代次数,批处理次数选为128或64。

进一步的,所述步骤s1中车辆数据库去均值的步骤包括:对车辆数据库中每张图像进行每个位置的像素值累加,然后除以图像总数,得到均值图像,车辆数据库中每张训练图像均减去所述均值图像,得到去均值的车辆数据库数据。

进一步的,所述步骤s2的方法为:图像缩放尺寸的选取依据网络结构,如深度学习网络为lenet或alexnet则缩放至227*227,如深度学习网络为googlenet则缩放至224*224;缩放方法的选取为最近邻插值或双线性插值;去均值的方法为:对车辆数据库中每张图像进行每个位置的像素值累加,然后除以图像总数,得到均值图像,待检测图像减去所述均值图像得到去均值的待检测图像。

进一步的,所述步骤s3获得最大分类概率的权值的方法包括:

步骤s31:将去均值的待检测图像输入深度学习网络;

步骤s32:去均值的待检测图像依次经过不同的卷积核的卷积层,通过二维卷积核对图像进行二维离散卷积,得到卷积层特征图;

步骤s33:将步骤s32中得到的卷积层特征图输入到池化层,对特征图大小进行压缩,池化方法为平均值池化,压缩尺寸选取为2倍窗口,输出池化层特征图;

步骤s34:将去均值的待检测图像输入至深度学习网络中,重复上述s31、s32步骤至池化层特征图大小为7*7,其中卷积层的卷积核大小分别为7*7,5*5,3*3,依次递减,池化层选取为2倍窗口大小;

步骤s35:将步骤s34中的7*7大小的特征图输入全连接层,连接所有的特征,将输出值输入至分类器中,得到最大分类概率;

步骤s36:依据最大分类概率值,获得全连接层的对应的权值。

进一步的,所述步骤s35中分类器选取为:softmax分类器;得到最大分类概率的方法为:遍历分类结果,找到最大值。

进一步的,步骤s4中权值叠加的方法为:将对特征图中的每张特征图都乘以对应的权值,得到新的特征图,然后累加这组新的特征图,将累加结果除以255进行归一化处理得到最终的特征图结果。

进一步的,步骤s5具体包括:

步骤s51,对特征图与原图像采用加权平均值的方式进行图像融合得到最终图像;

步骤s52,设定最终图像中最大像素值的80%作为阈值,二值化该图像;

步骤s53,对步骤s52中二值化后的图像进行轮廓查找,找到响应最大位置的外边界,并依据外边界位置得到轮廓的外接矩形。

进一步的,所述步骤s51中,加权平均值的具体计算方法为:分别遍历特征图和原图像,对二者图像的像素值取不同的权值,融合后图像的相应位置的像素值为特征图相应位置的像素值与原图相应位置像素值的和,具体的权值选取为:特征图的像素值乘以0.3,原图的像素值乘以0.7。

有益效果:相比于现有技术,本发明提供一种基于深度学习的车辆检测方法,具有以下有益效果:减少复杂的图像预处理过程,降低了图像的质量的要求,算法简单,检测效率高,检测精度高,实用性强,具有较好的适应性以及可靠性。有效解决了光照变化,提取特征不丰富,以及噪声的干扰给车辆检测带来的影响。

附图说明

图1是本发明一种基于深度学习的车辆检测方法的使用流程图;

图2是本发明一种基于深度学习的车辆检测方法的训练流程图;

图3是深度学习网络模型googlenet网络结构示意图;

图4是输入的带有车辆目标的原始图像;

图5是将图像输入深度学习网络得到的特征图;

图6是原始图像与特征图像叠加后的示意图;

图7是车辆检测的结果图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明。

本发明属于深度学习技术领域,具体涉及一种基于深度学习的车辆检测方法,利用深度网络中的最后一层卷积层的特征图进行权值相加的方法实现对车辆的精确定位。方法流程见图1和图2。

步骤s1:将带有车辆品牌标注信息的车辆数据库进行去均值处理,选取imagenet数据库训练好的深度学习模型作为基本网络模型,在基本网络模型的基础上用去均值的车辆数据库采取微调的方式训练网络,得到最终训练好的用于车辆检测的深度学习网络。深度学习网络模型见图3。

微调的参数设置为:固定卷积层的学习率为0.01,将全连接层的学习率调整至0.001,依据训练图像数量=迭代次数*批处理次数,修改迭代次数,批处理次数可选为128或64。

去均值处理的方法为:对车辆数据库中每张图像进行每个位置的像素值累加,然后除以图像总数,得到均值图像,车辆数据库中每张训练图像均减去这个均值图像,得到去均值的车辆数据库数据。

步骤s2:将待检测图像缩放到固定尺寸,并进行待检测图像去均值处理,得到去均值的待检测图像。待检测图像见图4。

图像缩放方法为:图像缩放尺寸的选取依据网络结构,如深度学习网络为lenet或alexnet则缩放至227*227,如深度学习网络为googlenet则缩放至224*224;缩放方法的选取为最近邻插值或双线性插值。

去均值的方法为:待检测图像减去均值图像得到去均值的待检测图像。

步骤s3:将去均值的待检测图像送入深度学习网络中,经过卷积层、池化层、全连接层得到最大分类概率,依据最大分类概率得到对应的全连接层的权值。

步骤s31:将去均值的待检测图像输入深度学习网络;

步骤s32:去均值的待检测图像依次经过不同的卷积核的卷积层,通过二维卷积核对图像进行二维离散卷积,得到卷积层特征图;

步骤s33:将步骤s32中得到的卷积层特征图输入到池化层,对特征图大小进行压缩,池化方法为平均值池化,压缩尺寸选取为2倍窗口,输出池化层特征图;

步骤s34:将去均值的待检测图像输入至深度学习网络中,重复上述s31、s32步骤至池化层特征图大小为7*7,其中卷积层的卷积核大小分别为7*7,5*5,3*3,依次递减,池化层选取为2倍窗口大小;

步骤s35:将步骤s34中的7*7大小的特征图输入全连接层,连接所有的特征,将输出值输入至分类器中,得到最大分类概率;

步骤s36:依据最大分类概率值,获得全连接层的对应的权值。

步骤s4:待检测图像输入到深度学习网络,在最后一层卷积层得到特征图结果,对特征图与步骤s3得到的权值进行叠加,将叠加后的多张特征图结果进行像素值相加,并进行归一化操作,得到最终的特征图。最终的特征图见图5。

权值叠加的具体方法为:将对特征图中的每张特征图都乘以对应的权值,得到新的特征图,然后累加这组新的特征图,将累加结果除以255进行归一化处理得到最终的特征图结果。

步骤s5:将得到的最终的特征图结果与原始的待检测图像进行图像融合,依据图像处理中的自适应阈值选取,设定图像阈值找到融合后的图像的像素值较大的区域,即最大响应区域,然后依据轮廓查找找到响应最大区域的外接矩形,实现车辆的精确定位和检测。热图与待检测图像融合后结果见图6。车辆检测的结果图见图7。

步骤s51,对特征图与原图像采用加权平均值的方式进行图像融合得到最终图像。

加权平均值的具体实现方法为:分别遍历特征图和原图像,对二者图像的像素值取不同的权值,融合后图像的相应位置的像素值为特征图相应位置的像素值与原图相应位置像素值的和,具体的权值选取为:特征图的像素值乘以0.3,原图的像素值乘以0.7。

步骤s52,设定最终图像中最大像素值的80%作为阈值,二值化该图像。

步骤s53,对步骤s52中二值化后的图像进行轮廓查找,找到响应最大位置的外边界,并依据外边界位置得到轮廓的外接矩形。

本发明对车辆检测的准确率达到97%以上,单次检测时间小于0.5s,对于不同类型的车辆检测适应性较广,对于由于拍摄原因产生的畸变同样具有较好的效果,适用于多个车辆的检测。

以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1