一种基于自适应滑动窗口和卷积神经网络的路牌检测方法与流程

文档序号:11620946阅读:771来源:国知局
一种基于自适应滑动窗口和卷积神经网络的路牌检测方法与流程

本发明涉及基于计算机模式识别技术,尤其涉及一种基于自适应滑动窗口的卷积神经网络的路牌检测方法。



背景技术:

在日常的交通行驶中,交通路牌起着很大的作用,正确地自动检测交通路牌具有潜在应用价值。当前阶段,路牌的检测方法主要分为三类:基于颜色的方法、基于形状的方法和基于机器学习的方法。在基于颜色的方法和基于形状的方法中路牌的颜色和形状等是已有知识,这些知识需要人为定义。而基于机器学习的方法无需先验知识,例如神经网络、支持向量机、线性判别分析等,但是检测的结果并不理想。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由hinton等人于2006年提出。基于深度置信网络(dbn)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。

卷积神经网络是深度学习中一种典型模型之一,卷积神经网络是近年发展起来并引起广泛重视的一种计算机模式识别方法。20世纪60年代,hubel和wiesel提出了卷积神经网络(convolutionalneuralnetworks,cnn)。cnn是为识别二维形状而特殊设计的一个多层感知器,其网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。现在,cnn已经成为众多科学领域的研究热点之一,并且成功应用于路牌的检测中。

在卷积神经网络的路牌检测方法中,含有路牌的图片需先进行预处理,利用滑动窗口模板多图像进行裁剪,然而滑动窗口模板的确定是成功检测路牌的关键之一。但是输入图片的大小并不一致,若用固定大小的滑动窗口模板进行裁剪,会导致运行时间过长或者检测效果不佳,所以提出一种自适应滑动窗口的路牌检测方法,提高了路牌检测的鲁棒性。

本发明提供了一种基于自适应滑动窗口的卷积神经网络的路牌检测方法,根据输入图像的大小自适应产生相对应的滑动窗口模板,利用模板扫描图像并进行裁剪,产生图块,从而使得卷积神经网络根据裁剪的图块正确检测出路牌,从而提高路牌检测的精确度。



技术实现要素:

本发明所要解决的技术问题是增强路牌检测的鲁棒性,提高路牌检测的正确率。

为了解决上述技术问题,本发明提供了一种基于自适应滑动窗口的卷积神经网络的路牌检测方法,用于路牌检测上;该方法包括:

自适应产生相对应的滑动窗口模板;

运用滑动窗口模板扫描并裁剪图像,产生图块;

对图块进行多次下采样;

利用卷积神经网络对产生的图块进行二分类,输出检测结果。

其中,根据所述训练样本获得所述压缩后的自适应滑动窗口模板,包括:

测量待检测图像的大小;

根据图像大小自适应选择滑动窗口模板的大小。

其中,根据所述训练样本获得图块,包括:

利用滑动窗口模板扫描待检测图像;

利用滑动窗口模板裁剪待检测图像;

得到所需图块。

其中,根据所述获得图像的下采样,包括:

确认扫描图像的所有像素;

对图像进行多次下采样。

其中,根据所述获得卷积神经网络的结构,包括:

采用卷积神经网络的模型分别为一层卷积层,两层激活层。一层最大池化层和两层全连接层;

卷积层的60个卷积核的系数为9×9×3;

最大池化层的大小为6×6;

激活层的激活函数为lrelu,其系数为0.01;

两层全连接层系数分别为2×2×60和1×1×2。

其中,根据所述获得分类器,包括:

定义分类器的参数及其具体结构;

输入特征向量至分类器进行二分类;

分类器输出路牌的检测结果。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为本申请实施例的基于自适应滑动窗口的卷积神经网络的路牌检测方法的流程示意图。

图2为本申请实施例获得自适应滑动窗口模板的流程示意图。

图3为本申请实施例获得所需图块的流程示意图。

图4为本申请实施例获得图像的下采样的流程示意图。

图5为本申请实施例获得特征向量的流程示意图

图6为卷积神经网络convnet的结构示意图。

图7为本申请实施例述及的分类器流程示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。

本申请实施例的基于自适应滑动窗口的卷积神经网络的路牌检测方法,用于路牌的检测。本申请实施例所述的路牌识别,主要是指滑动窗口模板在卷积神经网络上的实现。

本申请的实施例可以根据输入图像的大小自适应产生相对应的滑动窗口模板,运用滑动窗口模板扫描并裁剪图像,产生图块,在所有像素被扫描后,对图块进行多次下采样,之后利用卷积神经网络对产生的图块进行二分类,从而获得更加精确和高效的检测结果。

如图1所示,本申请实施例的基于自适应滑动窗口的卷积神经网络的路牌检测方法,主要包括如下步骤:

步骤s110,自适应产生相对应的滑动窗口模板;

步骤s120,运用滑动窗口模板扫描并裁剪图像,产生图块;

步骤s130,对图块进行多次下采样;

步骤s140,利用卷积神经网络对产生的图块进行二分类,输出检测结果。

本申请实施例中,根据所述获得自适应滑动窗口模板。图2表示出了提取所述自适应滑动窗口模板的主要步骤:

步骤s210,测量待检测图像的大小;

步骤s220,根据图像大小自适应选择滑动窗口模板的大小;

本申请实施例中,根据所述获得所需图块。图3示出了获得所需图块的主要步骤:

步骤s310,利用滑动窗口模板扫描待检测图像;

步骤s320,利用滑动窗口模板裁剪待检测图像;

步骤s330,得到所需图块。

本申请实施例中,根据所述获得图块的下采样。图4示出了获得图像的下采样的主要步骤:

步骤s410,确认扫描图像的所有像素;

步骤s420,对图块进行多次下采样。

对图块进行多次采样的目的是确保含有路牌的图块能够成功被检测出,提高检测的精确度。

本申请实施例中,根据所述获得特征向量。图5示出了获得有特征向量的主要步骤:

步骤s510,采用convnet卷积神经网络模型,分别有一层卷积层,两层lrelu层。一层最大池化层和两层全连接层。

convnet卷积神经网络模型是在经典的lenet-5卷积神经网络上修改得到的,卷积神经网络convnet的结构如图6所示。输入图像要经过大小归一化,每一个神经元的输入来自于前一层的一个局部邻域,并被加上由一组权值决定的权重。提取的这些特征在下一层结合形成更高一级的特征。同一特征图的神经元共享相同的一组权值,次抽样层对上一层进行平均。

步骤s520,卷积层的60个卷积核的系数为9×9×3。

步骤s530,最大池化层的大小为6×6。

最大池化层也可以称为次抽样层,降低特征图的维数。

步骤s540,激活层的激活函数为lrelu,其系数为0.01。

relu的数学表达式为:

f(x)=max(0,x)

从公式中可以看出,输入信号<0时,输出都是0;输入信号>0的情况下,输出等于输入。

relu只需要一个阈值就可以得到激活值,而不用去计算一大堆复杂的运算。然而当很大的梯度流经过relu神经元,在更新参数之后,此神经元往往已经不具备激活作用。因此出现了lrelu激活函数。

lrelu的数学表达式如下:

f(x)=αx,(x<0)

f(x)=x,(x≥0)

这里的α是一个非常小的常量。lrelu即修正了数据分布,又保留了一些负轴的值,使得负轴信息不会全部丢失。

步骤s550,两层全连接层系数分别为2×2×60和1×1×2;

最后一层的全连接层产生的特征向量作为分类器的输入。

本申请实施例中,根据所述构成分类器。图7为本申请实施例述及的分类器示意图,其主要步骤为:

步骤s710,定义分类器的参数及具体结构。

步骤s720,将特征向量输入至分类器。

步骤s730,分类器输出路牌的检测结果。

本申请实施例提出了一种基于自适应滑动窗口和深度学习的卷积神经网络路牌检测的方法,将自适应滑动窗口技术运用于卷积神经网络的路牌检测方法,取得了较高的路牌检测精度。该方法包括:根据输入图像的大小自适应产生相对应的滑动窗口模板,运用滑动窗口模板扫描并裁剪图像,产生图块,在所有像素被扫描后,对图块进行多次下采样,之后利用卷积神经网络对产生的图块进行二分类,从而提高路牌检测的鲁棒性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1