基于Inception卷积模块的国内交通标志分类方法与流程

文档序号:18756405发布日期:2019-09-24 22:29阅读:219来源:国知局
基于Inception卷积模块的国内交通标志分类方法与流程

本发明涉及图像识别技术领域,具体涉及一种基于inception卷积模块的国内交通标志分类方法。



背景技术:

近几年随着人工智能的火爆,自动驾驶技术也越来越多的被学者、专家所重视,如何准确地获取自动驾驶所必须的路况信息成为一个热点。交通标志是路况信息中不可缺少的一环,其所包含信息决定了自动驾驶系统应以何种模式运行。交通标志牌中含有大量信息,如限行、限速、限高以及危险路况的警示与预告等等,给道路安全提供了重要的辅助作用。交通标志牌的识别算法大致上可分为两类:模板匹配法和神经网络法。神经网络法的高识别率和自学习功能成为它的极大优势。

传统神经网络的最后几层通常使用全链接层传输给softmax层,这种方式使得处理分类较多的网络结构时,最后几层全链接层会带来极多的参数,导致训练速度较慢。



技术实现要素:

本发明的目的在于一种基于inception卷积模块的国内交通标志分类方法,以克服上述现有技术存在的缺陷,本发明简化传统卷积神经网络的结构,使用卷积层与池化层结合代替全链接层和平铺层作用并将参数传递给softmax层,并采用简化的softmax卷积模块,简化整体卷积神经网络结构,减少参数数量,在保证较高准确率的情况下加快训练速度。

为达到上述目的,本发明采用如下技术方案:

基于inception卷积模块的国内交通标志分类方法,包括以下步骤:

步骤1:构建国内交通标志数据集,并根据该数据集构建训练集和测试集;

步骤2:构建基于inception卷积模块的卷积神经网络;

步骤3:将训练集图像数据输入步骤2构建的卷积神经网络,经训练得到训练后的模型;

步骤4:将测试集图像数据输入训练后模型中,得到预测结果。

进一步地,步骤1中的国内交通标志数据集中图像尺寸为64×64×3的rgb彩色图像,其训练集与测试集中数据个数比为8:2。

进一步地,步骤2中所述的卷积神经网络中,包含3个卷积层、2个inception卷积模块、4个池化层,其中:

第一层为卷积层conv1,其卷积核大小为3×3,卷积核数目为9,卷积步长为1,填充方式使用same填充方式,经过conv1即得到64×64×9的特征图;

第二层为inception卷积模块inception_conv2,其有三个分支,分别为branch2_0、branch2_1、branch2_2,其中branch2_0卷积核大小为1×1,卷积核数目为24,卷积步长为1,填充方式使用same填充方式;branch2_1使用两个级联的卷积核,分别为16个1×1的卷积核和24个5×5的卷积核,卷积步长为1,填充方式使用same填充方式;branch2_2使用三个级联的卷积核,分别为32个1×1、64个3×3和64个3×3的卷积核,卷积步长为1,填充方式使用same填充方式,经过inception_conv2即得到64×64×112的特征图;

第三层为池化层pool3,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool3即得到32×32×112的特征图;

第四层为inception卷积模块inception_conv4,其有三个分支,分别为branch4_0、branch4_1、branch4_2,其中branch4_0卷积核大小为1×1,卷积核数目为64,卷积步长为1,填充方式使用same填充方式;branch4_1使用两个级联的卷积核,分别为48个1×1的卷积核和64个5×5的卷积核,卷积步长为1,填充方式使用same填充方式;branch4_2使用三个级联的卷积核,分别为64个1×1、96个3×3和96个3×3的卷积核,卷积步长为1,填充方式使用same填充方式,经过inception_conv4即得到32×32×224的特征图;

第五层为池化层pool5,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool5即得到16×16×224的特征图;

第六层为卷积层conv6,其卷积核大小为5×5,卷积核数目为112,卷积步长为1,填充方式使用valid填充方式,经过conv6即得到12×12×112的特征图;

第七层为池化层pool7,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool7即得到6×6×112的特征图;

第八层为卷积层conv8,其卷积核大小为5×5,卷积核数目为64,卷积步长为1,填充方式使用valid填充方式,经过conv6即得到2×2×64的特征图;

第九层为池化层pool9,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool9即得到1×1×112的特征向量,并输入到softmax层进行分类输出。

进一步地,步骤2中卷积神经网络的每一层都使用bn层对输入数据进行规范化处理。

进一步地,步骤3中对卷积神经网络的训练的超参数设置如下:批量样本数量mini_batch=128,迭代次数train_num=500次,初始学习率learn_rate=0.05,使用指数衰减法对学习率进行衰减,衰减因子deacy=0.96,bn层的权重衰减项设为weight_deacy=0.005。

进一步地,步骤3中卷积神经网络使用小批量梯度下降法进行训练。

与现有技术相比,本发明具有以下有益的技术效果:

本发明采用简化的inception卷积模块,原inception卷积模块使用不同大小的卷积核对特征图进行卷积,使不同尺度的特征融合在一起,且由网络自身决定是否需要这些参数,使得网络在特征提取和目标分类上由显著优势。本发明使用简化后的inception卷积模块,减少原模块中无用的参数和运算量,并使用卷积层与池化层结合替代全链接层和平铺层作用,减少网络参数的同时极大精简了网络结构并减少训练时间,在保证较高准确率的情况下加快训练速度。

附图说明

图1是本发明的流程示意图;

图2是卷积过程示意图;

图3是最大值池化和平均池化过程的池化示意图;

图4是梯度下降示意图;

图5是简化inception卷积模块结构示意图;

图6是本发明网络结构示意图;

图7是本发明卷积神经网络中第二层的可视化特征图;

图8是本发明卷积神经网络中第三层的可视化特征图;

图9是本发明卷积神经网络中第四层的可视化特征图;

在图7、图8、图9中,(a)、(b)、(c)、(d)分别为同一输入特征图下不同层的特征可视化图像;

图10是本发明的训练集损失函数曲线;

图11是本发明的训练集学习衰减率曲线;

图12是本发明的训练集正确率曲线。

具体实施方式

下面结合附图对本发明作进一步详细描述:

参见图1,本发明提供一种基于inception卷积模块的国内交通标志分类方法,设计了一种基于inception卷积模块的卷积神经网络。具体思路是,使用卷积层与池化层结合代替全链接层和平铺层作用并将参数传递给softmax层,并采用简化的softmax卷积模块,简化整体卷积神经网络结构,减少参数数量,在保证较高准确率的情况下加快训练速度。

参见图2,其中为卷积层中使用卷积核对特征图像滤波的过程示意图;

参见图3,其中为池化层中对特征图像分别使用最大值池化和平均值池化的过程示意图;

参见图4,为使用梯度下降法对训练参数优化的过程示意图,其图中曲面为训练过程中所使用的损失函数,图中曲线为被训练参数沿其梯度方向进行训练更新的路径示意图;

参见图5,其中为本方法中所使用的简化后inception卷积模块示意图。交通标志在采集设备所采集到的图像中一般尺寸小于200×200,使用池化层处理后反而将原本有用的信息丢失,因此原inception卷积模块需消耗一定的迭代次数消除池化分支的影响,因此将原本inception卷积模块中的池化层分支删减,减少了需迭代更新的参数数量,从而达到更高效的速度;

参见图6,其中,第一层使用卷积层对特征图进行预先卷积,增加特征图维度,第三至五层使用卷积模块与池化层结合,提取特征图中的有用信息,后四层使用卷积层与池化层结合对特征图进行降维,使特征图维度降低的同时增强输出的稳定性;

参见图7至图9,可看到经过两次卷积模块处理后,图像中的特征信息已被清晰的提取出来,图9中相较于图7,可以明显看到图像的边缘部分被显著突出,因而可以提取到更多的特征信息,有利于训练后模型的分类;

参见图11,可看到本方法中所选用的学习率衰减方式为按指数阶梯衰减;

参见图10与图12,可以看到本方法进行训练过程中,对于训练集可以快速达到较低的损失值与较高的准确率,可以从图中看到,在第10次迭代训练训练集损失函数可降到0.2以下,准确可以达到90%以上。

具体步骤如下:

步骤1:构建国内交通标志数据集,并根据该数据集构建训练集和测试集;国内交通标志数据集中图像尺寸为64×64×3的rgb彩色图像,其训练集与测试集中数据个数比约为8:2。

步骤2:构建基于inception卷积模块的卷积神经网络;所述的卷积神经网络中,包含3个卷积层、2个inception卷积模块、4个池化层,其中:

第一层为卷积层conv1,其卷积核大小为3×3,卷积核数目为9,卷积步长为1,填充方式使用“same”填充方式,经过conv1即得到64×64×9的特征图;

第二层为inception卷积模块inception_conv2,其有三个分支,分别为branch2_0、branch2_1、branch2_2,其中branch2_0卷积核大小为1×1,卷积核数目为24,卷积步长为1,填充方式使用“same”填充方式;branch2_1使用两个级联的卷积核,分别为16个1×1的卷积核和24个5×5的卷积核,卷积步长为1,填充方式使用“same”填充方式;branch2_2使用三个级联的卷积核,分别为32个1×1、64个3×3和64个3×3的卷积核,卷积步长为1,填充方式使用“same”填充方式,经过inception_conv2即得到64×64×112的特征图;

第三层为池化层pool3,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool3即得到32×32×112的特征图;

第四层为inception卷积模块inception_conv4,其有三个分支,分别为branch4_0、branch4_1、branch4_2,其中branch4_0卷积核大小为1×1,卷积核数目为64,卷积步长为1,填充方式使用“same”填充方式;branch4_1使用两个级联的卷积核,分别为48个1×1的卷积核和64个5×5的卷积核,卷积步长为1,填充方式使用“same”填充方式;branch4_2使用三个级联的卷积核,分别为64个1×1、96个3×3和96个3×3的卷积核,卷积步长为1,填充方式使用“same”填充方式,经过inception_conv4即得到32×32×224的特征图;

第五层为池化层pool5,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool5即得到16×16×224的特征图;

第六层为卷积层conv6,其卷积核大小为5×5,卷积核数目为112,卷积步长为1,填充方式使用“valid”填充方式,经过conv6即得到12×12×112的特征图;

第七层为池化层pool7,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool7即得到6×6×112的特征图;

第八层为卷积层conv8,其卷积核大小为5×5,卷积核数目为64,卷积步长为1,填充方式使用“valid”填充方式,经过conv6即得到2×2×64的特征图;

第九层为池化层pool9,池化方式为最大值池化,池化尺寸为2×2,池化步长为2,经过pool9即得到1×1×112的特征向量,并输入到softmax层进行分类输出。且卷积神经网络的每一层都使用bn层对输入数据进行规范化处理

步骤3:将训练集图像数据输入卷积神经网络,使用小批量梯度下降法进行训练得到训练后模型;其中对卷积神经网络的训练的超参数设置如下:批量样本数量mini_batch=128,迭代次数train_num=500次,初始学习率learn_rate=0.05,使用指数衰减法对学习率进行衰减,衰减因子deacy=0.96,bn层的权重衰减项设为weight_deacy=0.005。

步骤4:将测试集图像数据输入训练后模型中,得到预测结果;

表1本发明卷积神经网络参数

基于inception卷积模块的国内交通标志分类方法中卷积神经网络的参数由表1所示。

表2不同迭代次数下测试集准确率(单位:%)

本表为同一参数设置下,lenet-5网络和本发明网络不同迭代次数下训练集准确率。由表中可以看出,本发明相比于传统lenet-5网络收敛速度更快且准确率更高。

表3不同实验下测试集准确率达到93%的迭代次数

由本表可知,使用本发明方法能卷积神经网络约在29次即能达到较高的识别率。

综上所述,本发明方法可以简化整体卷积神经网络结构,减少参数数量,在保证较高识别率的情况下加快训练速度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1