一种基于压缩感知域和卷积神经网络的路牌识别方法与流程

文档序号:11627826阅读:472来源:国知局
一种基于压缩感知域和卷积神经网络的路牌识别方法与流程

本发明涉及基于计算机模式识别技术,尤其涉及一种基于压缩感知域和卷积神经网络的路牌识别方法。



背景技术:

在日常的交通行驶中,交通路牌起着很大的作用,正确地自动识别交通路牌具有潜在应用价值。应用传统的神经网络对路牌进行识别时,首先要对路牌图像进行二值化,但是二值化的结果就忽略可颜色信息,而交通路牌中的黑黄红蓝白颜色各自代表了不同的意义。二值化后所得到的图像有着很多的信息重叠部分,如果图像自身携带“噪声”,则在应用传统的神经网络进行识别的时候出现识别错误的可能性会大大增加。随着全球卫星导航系统的快速发展和广泛应用,车辆自动导航和无人驾驶逐渐成为一个研究和应用热点,故路牌自动快速识别就成为一个亟待解决的问题。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由hinton等人于2006年提出。基于深度置信网络(dbn)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外hubel等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。

卷积神经网络是深度学习中一种典型模型之一,是近年发展起来并引起广泛重视的一种计算机模式识别方法。20世纪60年代,hubel和wiesel提出了卷积神经网络(convolutionalneuralnetworks,cnn)。cnn是为识别二维形状而特殊设计的一个多层感知器,其网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。现在,cnn已经成为众多科学领域的研究热点之一,特别是在模式分类领域。由于cnn不需对图像进行复杂的前期预处理,可以直接输入原始图像,因此已成功应用于路牌识别中。

原始图片包含许多分类时不需要的特征信息,导致卷积神经网络的计算量非常大,运行时间长。但是利用测量矩阵将原始图像转换到压缩感知域,保留主要特征,从而减少计算量和运行时间,提高路牌识别的鲁棒性。

本发明提供了一种基于压缩感知域和深度学习的卷积神经网络的路牌识别方法,利用测量矩阵将图像信号转换到压缩感知域,保留图像中的主要特征,然后直接使用卷积神经网络从图片的压缩感知域中提取特征,对路牌进行识别,提高了路牌识别的鲁棒性。



技术实现要素:

本发明所要解决的技术问题是增强路牌识别的鲁棒性,提高路牌识别的正确率。

为了解决上述技术问题,本发明提供了一种基于压缩感知域和卷积神经网络的路牌识别方法,用于路牌识别上;该方法包括:

利用测量矩阵将图像信号转换到压缩感知域;

将基于压缩感知域的信号作为卷积神经网络的输入;

使用卷积神经网络从中提取有效非线性特征;

通过分类器,对路牌图像进行识别。

其中,根据所述训练样本获得所述基于压缩感知域的图像信号,包括:

根据图像信号的维数确定测量矩阵的大小;

利用测量矩阵将图像信号转换到压缩感知域;

获得基于压缩感知域的图像信号。

其中,根据所述训练样本获得卷积神经网络的输入,包括:

将基于压缩感知域图像的尺寸调整为32×32;

并将其作为卷积神经网络的输入。

其中,根据所述获得有效的非线性特征,包括:

采用经典的卷积神经网络模型,分别有两层卷积层、两层最大池化层,两层全连接层;

网络层1和3为卷基层,分别产生20和50张特征图;

网络层2和4为最大池化层,也可称为次抽样层;

网络层5和6位全连接层,分别产生维数为500×1和10×1的有效非线性特征向量。

其中,所述的分类器,包括:

定义分类器的参数及具体结构;

将特征向量输入至分类器;

分类器输出路牌的标签类别。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为本申请实施例的基于压缩感知域和卷积神经网络的路牌识别方法的流程示意图。

图2为本申请实施例中获得压缩后图像信号的流程示意图。

图3为本申请实施例获得卷积神经网络的输入的流程示意图。

图4为本申请实施例获得有效的非线性特征流程示意图。

图5为卷积神经网络lenet-5的结构示意图。

图6为本申请实施例述及的softmax分类器流程示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。

本申请实施例的基于压缩感知域和卷积神经网络的路牌识别方法,用于路牌的识别。本申请实施例所述的路牌识别,主要是指运用压缩感知域和卷积神经网络。

本申请的实施例可以利用卷积神经网络直接从压缩感知域中提取有效的非线性他正,通过softmax作为分类器,对gtsrb数据集中的路牌图片进行识别。

如图1所示,本申请实施例的基于压缩感知域和卷积神经网络的路牌识别方法,主要包括如下步骤:

步骤s110,利用测量矩阵将图像信号转换到压缩感知域;

步骤s120,将基于压缩感知域的信号作为卷积神经网络的输入;

步骤s130,使用卷积神经网络从中提取有效非线性特征;

步骤s140,通过分类器,对路牌图像进行识别。

本申请实施例中,根据所述获得压缩后的图像信号。图2表示出了提取所述基于压缩感知域的图像信号的主要步骤。

步骤s210,根据图像信号的维数确定测量矩阵的大小;

测量矩阵采用高斯矩阵。

随机高斯测量矩阵是压缩感知中最常用的测量矩阵,该矩阵中的元素服从均值为0,方差为的正态分布,并且元素间相互独立,即

高斯随机测量矩阵的优点在于它几乎和任意稀疏矩阵不想关,且满足受限等距性,同时它需要的测量值数目比较少,对于长度为n,稀疏度为k的原始数据,仅需要m≥cklog(n/k)个测量值就可以高概率的恢复重构出原始数据,其中c是一个非常小的量。

由于路牌图像大小不一,则测量矩阵的大小也不同。

步骤s220,利用测量矩阵将图像转换到压缩感知域;

利用测量矩阵将图像转换到压缩感知域,减小图像的数据量,保留主要特征,同时获得大小统一的图像信号。

步骤s230,获得基于压缩感知域的图像信号。

本申请实施例中,根据所述获得卷积神经网络的输入。图3示出了获得卷积神经网络的输入的主要步骤。

步骤s310,将压缩后图像的尺寸调整为32×32;

因为卷积神经网络的输入图像大小是固定的,所以将压缩后的图像信号统一调整为32×32。

步骤s320,将调整后的图像作为卷积神经网络的输入。

本申请实施例中,根据所述获得有效的非线性特征。图4示出了获得有效的非线性特征的主要步骤。

步骤s410,采用经典的lenet-5卷积神经网络模型,分别有两层卷积层、两层最大池化层,两层全连接层。

lenet-5是一种卷积神经网络,最初用于手写数字识别中。卷积神经网络lenet-5的结构如图5所示,输入图像要经过大小归一化,每一个神经元的输入来自于前一层的一个局部邻域,并被加上由一组权值决定的权重。提取的这些特征在下一层结合形成更高一级的特征。同一特征图的神经元共享相同的一组权值,次抽样层对上一层进行平均。

步骤s420,网络层1和3为卷积层,分别产生20和50张特征图。

网络层1是由6个特征图组成的卷积层。每个神经元与输入图像的一个5×5的邻域相连接,因此每个特征图的大小是28×28。

网络层3是由16个大小为10×10的特征图组成的卷积层。特征图的每个神经元与s2网络层的若干个特征图的5×5的邻域连接。

步骤s430,网络层2和4为最大池化层,也可称为次抽样层。

网络层2是由6个大小为14×14的特征图组成的次抽样层,它是由网络层1抽样得到。特征图的每个神经元与c1层的一个大小为2×2的邻域连接。

网络层4是由16个大小为5×5的特征图组成的次抽样层。特征图的每个神经元与c3层的一个2×2大小的邻域相连接。

步骤s440,网络层5和6为全连接层,分别产生维数为500×1和10×1的有效非线性特征向量。

网络层5是卷积层,总共120个featuremap,每个featuremap与s4层所有的featuremap相连接,卷积核大小是5*5。c5的featuremap变成了1个点,共计有120(25*16+1)=48120个参数。

网络层6,包括84个神经元,与网络层c5进行全连接。

本申请实施例中,根据所述构成softmax分类器。图6为本申请实施例述及的softmax分类器示意图。

步骤s610,定义softmax分类器的参数及具体结构。

步骤s620,将特征向量输入至分类器。

步骤s630,分类器输出路牌的标签类别。

本申请实施例提出了一种基于压缩感知域和深度学习的卷积神经网络的路牌识别方法,直接使用卷积神经网络从图片的压缩感知域中提取特征,对路牌进行识别,提高了路牌识别的精确度。该方法包括:利用测量矩阵将图像信号转换到压缩感知域,并将其作为卷积神经网络的输入,然后直接使用卷积神经网络从中提取有效的非线性特征,对路牌图像进行识别,提高了路牌识别的鲁棒性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1