一种基于非对称卷积神经网络的交通标志识别方法

文档序号:8528457阅读:559来源:国知局
一种基于非对称卷积神经网络的交通标志识别方法
【技术领域】
[0001] 本发明属于智能交通标志识别技术领域,涉及一种基于非对称卷积神经网络的交 通标志识别方法,用以解决交通标志识别问题中识别速度较慢,且鲁棒性不强的问题。
【背景技术】
[0002] 近年来,智能交通系统得到了很大的发展,2010年,奥迪无人驾驶自动汽车行驶 12. 42公里,抵达落基山派克峰顶,标志着智能交通系统中的无人驾驶汽车技术逐渐走向成 熟,而交通标志自动识别是无人驾驶汽车技术的重要组成部分。
[0003] 交通标志识别有着直接的现实应用,如安全驾驶,自动驾驶,场景理解和信号检测 等。交通标志的识别是一个受限的分类问题,因为交通标志类别数目是一定的,并且每一类 交通标志的形态是严格一致的。通过前面的介绍,交通标志识别似乎是比较容易的问题,其 实不然。在实际的交通标志识别过程中,会存在视角变化、不同的光照条件、运动模糊、物理 损坏、遮挡、涂鸦和褪色等多种问题,给交通标志的识别问题造成了困难。
[0004] 分类算法通常分为两类,一类是学习型算法,通过学习找到一个最优的分割 平面,将两类或者多类区分开来,比如SVM(SupportVectorMachine,支持向量机), Adaboost(AdaptiveBoosting,自适应增强),神经网络等;另一类为最邻近算法,是在已 有的训练样本中找到与测试样本最近的一个,进而判断测试样本类别,比如说模板匹配, k-d(k_dimensionality,k维)树等。
[0005] 针对道路交通标志的识别,已经有不少方法被提出。FatinZaklouta等采 用k_d树和随机森林的方法来对交通标志进行分类(ZakloutaF,Stanciulescu B,Hamdoun0?Trafficsignclassificationusingkdtreesandrandom forests[C].NeuralNetworks(IJCNN),The2011InternationalJointConference on.IEEE,2011:2151-2155.),具有快速建立、更新和搜索等优点,且更加适合非 平衡数据。YaxiangFan等采用层次性稀疏表示方法(FanY,SunH,ZhouS,et al.HierarchicalSparseRepresentationforTrafficSignRecognition[C]. Proceedingsof2013ChineseIntelligentAutomationConference.Springer BerlinHeidelberg,2013:653-660.),该方法是利用了稀疏表示对噪音和遮挡具有鲁 棒性,且交通标志不同大类之间的区别明显,而同一类之间的区别相对来说不明显等 特点。SuisuiTang等利用在计算机视觉中已被证明有效的多个特征,HOG(Histogram ofOrientedGradient,梯度方向直方图)、Garbor滤波器特征和LBP(LocalBinary Pattern,局部二值模式)特征,将这三个特征组合起来,用SVM进行分类(TangS,Huang LL.TrafficSignRecognitionUsingComplementaryFeatures[C].Pattern Recognition(ACPR),20132ndIAPRAsianConferenceon.IEEE,2013:210-214.),减小了 计算量,加快了分类速度。Ciresan等提出的Multi-columndeepneuralnetwork通过将 多个卷积神经网络的结果通过线性组合得到最后的结果(Cire§anD,MeierU,MasciJ,et al.Multi-columndeepneuralnetworkfortrafficsignclassification[J].Neural Networks, 2012, 32:333-338.),取得了非常好的效果;PierreSermanet等提出的多尺 度卷积神经网络(SermanetP,LeCunY.Trafficsignrecognitionwithmulti-scale convolutionalnetworks[C].NeuralNetworks(IJCNN),The2011InternationalJoint Conferenceon.IEEE, 2011:2809-2813.),将第一层子采样层和第二层子采样层的结果 组合后,形成多尺度特征,再经过分类器进行分类,还有Ciresan等结合卷积神经网络与 H0G+SVM分类等等,在交通标志分类上面都取得了很好的效果。
[0006] 卷积神经网络因为其对比例缩放和平移等变形有着不变形,在很多领域,包括交 通标志识别领域都取得了很优秀的结果。
[0007] 传统的卷积神经网络中,在同一层通常对前一层得到的特征是采用的同样的处理 方式,因此最终得到的特征类型单一,可能只适用于某一类的分类任务,而且分类效果有 待提升。在这样的背景下,有不少文章都提出了改进措施,例如bagging[Breiman, 1994] 将多个不同模型在不同的子集上训练,取得了不错的效果,Multi-columndeepneural networktCiresan]将多个相同的模型在不同的数据变形中训练,最后将分类结果进行线 性组合,最近提出的dropout在训练的时候将神经结点以50%的概率随机隐藏(置为0) 起来,而在测试的时候不再隐藏结点激活值,而是将激活值乘以50%,取得了不错的效果。 Stochasticpooling是专门针对卷积神经网络提出来的一种平均模型,在训练时pooling 阶段按权值随机选取pooling结果,测试阶段采用按权值加权得到pooling结果。
[0008] 后面的两者可以看做是隐式的平均模型,平均操作隐含在网络内部操作中,而前 面两种是显式的平均模型,平均操作采用显而易见的组合方式实现。平均模型因为可以学 习到多样的特征,因此在分类任务中,效果很好。
[0009] 其中,显式的平均模型Multi-columndeepneuralnetwork[Ciresan]取得了 2011 年,IJCNN举办了GTSRB(GermanTrafficSignRecognitionBenchmark)的交通标志 识别比赛的最好结果,准确率达到了 99.46%,优于人类的表现。
[0010] 但是,在该方法中因为采用了多个模型且各个模型的输入数据不同,所以模型总 的数据量相对来说更大,总的模型规模也更大,不利于实际运用。
[0011] 为了提升效率,总的卷积神经网络结构必然不会很大,而且网络结构过大也会对 学习过程
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1