基于轻量化卷积神经网络实现车型识别的DSP系统的制作方法

文档序号:23033659发布日期:2020-11-25 14:39阅读:304来源:国知局
基于轻量化卷积神经网络实现车型识别的DSP系统的制作方法

本实用新型涉及图像处理、深度学习,机器视觉技术和嵌入式领域,特别是涉及一种基于轻量化卷积神经网络实现车型识别的dsp系统。



背景技术:

现有技术中,人类获取信息的主要途径是通过视觉实现的,随着新技术的研究和发展,人们开始用机器来模拟人类视觉的功能,来代替人眼及大脑对景物环境进行感知、解释和理解,由此产生了机器视觉这一门学科;所述的机器视觉的是人工智能领域的热门学科,它融合了信号处理、模式识别、应用数学、神经生理学等学科领域的研究方法与成果,是一门综合性的学科。

我国现有主要以人力监管为主,配合上一些传统监控系统的交通监管方式很难实时有效地对整个城市的交通情况进行处理,而且还会造成大量人力物力的浪费。因此机器视觉已经大量应用到智能交通系统中诸如车型识别,行人检测等。车型识别在智能交通系统中已经被证明是一项关键技术,在处理包括提高收费效率,裁定交通责任和追踪肇事逃逸者等等交通问题上有着得天独厚的优势,目前大多数车型识别系统还是基于台式机架构的,功耗大,实时性不高。相比之下,嵌入式车型识别系统可以实现并行工作,并可以应用到无人驾驶,机器人等领域,具有广泛的前景。



技术实现要素:

为了解决上述问题,本实用新型的目的在于完善现有技术有缺陷的地方,主要针对目前大多数的车型识别系统是基于台式机平台进行开发的,这样的系统不便于携带而且功耗大;除此之外目前的车型识别算法都存在不足,基于先验知识的传统算法需要不断的更新特征模板,适应性差。而基于深度学习的算法随着网络的加深影响了速度,从而提供了一种基于轻量化卷积神经网络实现车型识别的dsp系统;其作用在于能够实现车型识别,当一幅车辆图片输入进系统后,会输出包含车辆品牌型号的具体信息等。

本实用新型的技术方案是:基于轻量化卷积神经网络实现车型识别的dsp系统,包括dsp处理芯片、摄像头模块、dip开关、外部存储ddr单元、flash存储单元,power电源接口以及仿真器。

其中,所述dsp处理芯片与摄像头模块相连接,用于采集车辆图片。

所述dsp处理芯片与dip开关相连接,用来决定dsp系统启动时的驱动数目、boot状态以及配置。

所述dsp处理芯片与外部存储ddr单元相连接,用来存放训练好的网络模型以及网络层运算过程中产生的中间变量。

所述dsp处理芯片与flash存储单元相连接,用于用户更新系统中的程序及数据。

所述dsp处理芯片与power电源接口相连接,用于给dsp处理芯片供电。

在所述dsp系统的内部还安设有仿真器,用于连接dsp处理芯片与ccs开发平台,将ccs开发平台中编写好的代码下载进dsp处理芯片。

所述的dsp处理芯片具有8个功能单元,包括两个乘法器和6个alu算术运算单元。

本实用新型的有益效果:1、基于轻量化卷积神经网络实现车型识别的dsp系统模研究基于特征优化的轻量化卷积神经网络车型识别方法和在dsp嵌入式端的部署,旨在提高车型识别的准确性和实时性;2、该实用新型的车型识别网络充分挖掘了深度可分离卷积在实现网络轻量化的优势,同时在网络中融合了senet模块,通过对样本自学习的方式获得输入样本每个特征的重要程度以此进行特征优化;研究旨在保证车型识别模型轻量化的提高识别准确率,为将车型识别模型移植到嵌入式端实现系统的分布式提供解决方案;3、该实用新型将训练好的模型压缩、剪枝的方式移植到dsp中,能有效改善目前人工设计特征的传统算法适应性差和目前大部分车型识别系统通过台式机连接对海量视频监控数据进行处理造成的功耗大,实时性不高,不易于携带的缺点。

附图说明

图1为本实用新型的结构示意图;

图2为本实用新型中dsp处理芯片的结构示意图;

图3为本实用新型的工作原理示意图;

图中1是dsp处理芯片,2是摄像头模块,3是dip开关,4是外部存储ddr单元,5是flash存储单元,6是power电源接口,7是仿真器,8是ccs开发平台。

具体实施方式

下面结合附图对本实用新型的技术方案做进一步的详细说明:

本实用新型公开了基于轻量化卷积神经网络实现车型识别的dsp系统,包括dsp处理芯片1、摄像头模块2、dip开关3、外部存储ddr单元4、flash存储单元5、power电源接口6及仿真器7。

其中,所述dsp处理芯片1与摄像头模块2相连接,用于采集车辆图片。

所述dsp处理芯片1与dip开关3相连接,用来决定dsp系统启动时的驱动数目、boot状态以及配置。

所述dsp处理芯片1与外部存储ddr单元4相连接,用来存放训练好的网络模型以及网络层运算过程中产生的中间变量。

所述dsp处理芯片1与flash存储单元5相连接,用于用户更新系统中的程序及数据。

所述dsp处理芯片1与power电源接口6相连接,用于给dsp处理芯片1供电。

在所述dsp系统的内部还安设有仿真器7,用于连接dsp处理芯片1与外在的ccs开发平台8,其作用是将ccs开发平台8中编写好的代码下载进dsp处理芯片1。

所述的dsp处理芯片1具有8个功能单元,包括两个乘法器和6个alu算术运算单元。

作为本实用新型的一种改进技术方案,所述dsp系统内部采用了训练好的基于轻量化卷积神经网络模型来实现车型识别;

作为本实用新型的一种优选技术方案,所述摄像头模块2采用ov7670型号,该摄像头模块2体积小,工作电压低,通过减少或消除光学或者电子缺陷如固定图案噪声、拖尾等,提高图像质量,得到清晰的稳定彩色图像。

作为本实用新型的一种优选技术方案,所述dsp处理芯片1采用tms320c6678dsp型号,其具有成本低,低功耗,高性能,高通道密度等优势,具有8个功能单元,包含两个乘法器,6个alu算术运算单元,能够有效提高卷积运算的执行效率。

本实用新型的工作原理:设计好一种基于轻量化卷积神经网络模型并在台式机上通过采集的车辆的数据集将其训练好,在darknet上将车型识别的代码进行语法规则的修改,变量初始化,合理安排内存空间这三个方面裁剪出来并通过ccs开发平台8用仿真器7移植到tms320c6678dsp,在dsp上将移植好的c源文件通过c编译器编译成汇编语言源文件,再通过汇编器编译为coff目标文件,再通过链接器生成可执行coff文件,通过摄像头模块2采集图片输入到系统中得到结果。

本实用新型的技术方案主要包括基于特征优化轻量化卷积神经网络的车型识别算法以及在dsp系统上的具体部署,具体包括以下几个步骤:

步骤1:采用由摄像头模块2拍摄的车辆图片组成数据集,数据集中的所有车辆总共分为5种车型,分别是sedan,van,truck,suv,coach;并且从数据集中按次序读取输入图像x;输入图像的格式为jpeg,尺寸为150×150;

步骤2:构建一个基于特征优化的轻量化卷积神经网络,由常规卷积层,深度可分离卷积层,senet模块,池化层,全连接层和softamx层构成;其中senet层包括全局池化层,全连接层,relu激活层,sigmoid激活层还有最后的scale层;并在matlab平台下利用随机梯度下降法,通过对样本集的不断训练来优化网络参数,使得最终的模型有较好的识别准确率;

(1)、采用深度可分离卷积实现网络的轻量化,深度可分离卷积将普通卷积分为深度卷积和逐点卷积,深度卷积将输入特征图h×w×m分为m组,每组由内核dk×dk卷积,这相当于收集每个通道的空间特征;逐点卷积是指对输入做1×1卷积;通过上一步获得的特征图在深度方向上加权,来使用同一空间位置中不同通道的特征信息;在本实用新型中,dk的取值为3,相比于普通卷积计算量缩小约9倍;

(2)、采用senet实现特征优化;senet有压缩和激励两个操作功能,首先,压缩操作通过全局池化获得全局信息,公式如下:

zc定义了c个特征图的数值分布,维度是1×1×c,uc是通道c的输入特征图;

接着进行激励操作,激励操作通过完全连接层和非线性层获得每个通道的关系,公式如下:

s=fex(z,w)=σ(g(z,w))=σ(w2relu(w1z))

s定义了特征图uc的权重,σ是sigmoid激活函数,是两个全连接层的参数,r是降维系数;

最后输出一个将通道c的权重sc和原来特征图uc相乘得到经过优化的特征图其公式如下:

(3)、训练参数设置如下:初始学习率为0.001,每1000个epoch学习率缩小10倍,权重衰减为0.0005,训练时batchsize为16,采用随机梯度下降的策略使得模型最终达到收敛;

步骤3:在centos6.5系统下,利用gpu和cuda,cudnn库加速,使用matlab平台上训练好模型的参数直接用于基于c语言的darknet开源框架训练,保存最终训练好的网络模型对训练好的模型进行压缩处理;

步骤4:将在darknet上车型识别的代码根据语法规则的修改,变量初始化,合理安排内存空间的方式这三个方面裁剪出来并通过ccs平台移植到tms320c6678dsp;按照ccs的语法规则修改代码把所有的变量声明的部分放在头文件中,并且用关键字extern来声明变量,把所有变量定义的部分放在源文件中;未初始化的变量人为的赋初始值为0;在程序中使用calloc函数代替malloc函数,动态分配内存空间的同时赋初始值为0;在测试程序中创建network这个结构体代表网络结构,包括网络配置参数有car_cfg文件提供的学习率、批训练样本数、学习率调整策略迭代次数等;在网络结构体中定义结构指针layers,指向网络的每一层,预先为每个网络层申请足够的内存空间;

步骤5:在dsp上将移植好的c源文件通过c编译器编译成汇编语言源文件,再通过汇编器编译为coff目标文件,再通过链接器生成可执行coff文件;

步骤6:输入测试图片,得到结果。

本实用新型方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本实用新型原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本实用新型的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1