一种车辆部位识别方法、装置、设备及计算机可读介质与流程

文档序号：15797692发布日期：2018-11-02 21:11阅读：177来源：国知局

本发明涉及模式识别技术领域，特别是一种车辆部位识别方法、装置、设备及计算机可读介质。

背景技术

截至到2016年底，全国机动车保有量达2.9亿，其中汽车1.94亿；机动车驾驶人3.6亿，其中汽车驾驶人超过3.1亿。随着人民生活水平的不断提升，汽车的需求也越来越旺盛，新车、二手车市场持续火热，车辆购买的互联网化势在必行。如今异地交易车辆信息主要来自于车辆照片，因此照片的准确分类对于交易的达成有极大的促进作用。

此前各交易平台往往不对部位进行分类，或者通过人工的方式进行，但人工分类的代价高、耗时长，还容易出错，卖家上传照片后自己分类的用户体验又极差。如果只是随意排序，买家不能第一时间看到自己所需的信息。

因此，现有技术中无法对车辆的部位进行精确识别，从而无法对车辆的不同部位照片进行分类、检索等。

技术实现要素：

本发明针对上述现有技术中的缺陷，提出了如下技术方案。

一种车辆部位识别方法，该方法包括：

样本图像获取步骤，获取车辆样本图像；

样本图像训练步骤，对获取的车辆样本图像使用卷积神经网络进行训练，得到车辆部位识别模型；

车辆部位识别步骤，获取车辆图像，将所述车辆图像输入到车辆部位识别模型中输出车辆部位的名称。

更进一步地，所述车辆样本图像通过以下方式获取：搜索引擎抓取、汽车论坛下载、手机拍摄。

更进一步地，所述卷积神经网络为深度残差网络。

更进一步地，所述样本图像训练步骤具体操作为：

标记步骤，对车辆样本图像进行标记生成样本图像数据库；

深度残差网络设置步骤，设置深度残差网络的层数为152层，每个卷积层具有16个残差模块，每个残差模块的卷积核的大小为3×3；

车辆部位识别模型生成步骤，随机生成深度残差网络的初始权值，输出层利用深度残差网络的输出值与目标值求差得到所述深度残差网络的预测误差，将该预测误差反向传播计算得到每个隐藏层的层误差，将每个隐藏层的激励值乘以该层误差得到该隐藏层的权值的梯度，基于该梯度更新每个隐藏层的权值，反复迭代多次直到输出值与目标值小于一阈值为止。

更进一步地，所述标记步骤中对所述车辆样本图像进行增强处理。

本发明还提出了一种车辆部位识别装置，该装置包括：

样本图像获取单元，获取车辆样本图像；

样本图像训练单元，对获取的车辆样本图像使用卷积神经网络进行训练，得到车辆部位识别模型；

车辆部位识别单元，获取车辆图像，将所述车辆图像输入到车辆部位识别模型中输出车辆部位的名称。

更进一步地，所述车辆样本图像通过以下方式获取：搜索引擎抓取、汽车论坛下载、手机拍摄。

更进一步地，所述卷积神经网络为深度残差网络。

更进一步地，所述样本图像训练单元包括：

标记模块，对车辆样本图像进行标记生成样本图像数据库；

深度残差网络设置模块，设置深度残差网络的层数为152层，每个卷积层具有16个残差模块，每个残差模块的卷积核的大小为3×3；

车辆部位识别模型生成模块，随机生成深度残差网络的初始权值，输出层利用深度残差网络的输出值与目标值求差得到所述深度残差网络的预测误差，将该预测误差反向传播计算得到每个隐藏层的层误差，将每个隐藏层的激励值乘以该层误差得到该隐藏层的权值的梯度，基于该梯度更新每个隐藏层的权值，反复迭代多次直到输出值与目标值小于一阈值为止。

更进一步地，所述标记步骤中对所述车辆样本图像进行增强处理。

本发明还提出了一种车辆部位识别设备，其特征在于，所述设备包括处理器、存储器，所述处理器与所述存储器通过总线相连接，所述存储器中存储机器可读代码，所述处理器执行存储器中的机器可读代码可执行上述之任一项的方法。

本发明还涉及一种计算机可读存储介质，其特征在于，所述存储介质上存储有计算机程序代码，当所述计算机程序代码被计算机执行时可执行上述之任一的方法。

本发明的技术效果为：构建了专门用于识别车辆部位的深度残差网络，提高车辆部位识别的准确度，便于车辆图像的分类及检索。

附图说明

图1是本发明的一种车辆部位识别方法的流程图。

图2是本发明的一种车辆部位识别装置的结构示意图。

图3是本发明的一种车辆部位识别设备的结构示意图。

具体实施方式

下面结合附图1-3进行具体说明。

图1示出了本发明的一种车辆部位识别方法，该方法包括：

一种车辆部位识别方法，该方法包括：

s11样本图像获取步骤，获取车辆样本图像；

s12样本图像训练步骤，对获取的车辆样本图像使用卷积神经网络进行训练，得到车辆部位识别模型。

s13车辆部位识别步骤，获取车辆图像，将所述车辆图像输入到车辆部位识别模型中输出车辆部位的名称。

步骤s11中车辆样本图像获取可通过网络(例如，搜索引擎抓取、汽车论坛下载)、拍摄(例如，手机拍摄)的方式获得，特别是对于不同角度和不同位置图像中的车辆进行采集，构成车辆样本图像数据包，该数据包可以存储在存储介质上，可以存在服务器上等等。

本发明的车辆部位识别方法是基于深度学习，深度学习是机器学习中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，模仿人脑机制来解释数据，例如图像、声音和文本。而卷积神经网络(convolutionalneuralnets，cnn)：一种深度学习的模型，对于大型图像处理有出色表现。更进一步地，resnet(深度残差网络)，是一种卷积神经网络结构，具有良好的性能，本发明构建了专门用于车辆部位识别的深度残差网络，这是本发明的重要发明点，具体见下述操作。

所述样本图像训练步骤s12的具体操作为：

标记步骤，对车辆样本图像进行标记生成样本图像数据库；

深度残差网络设置步骤，设置深度残差网络的层数为152层，每个卷积层具有16个残差模块，每个残差模块的卷积核的大小为3×3；层数的数目及残差模块及核大小都是在车辆部位识别过程中，根据实际测试结果选定的，其识别效果较好，且速度快。

为丰富图像数据库，在标记步骤中，还对图像进行增强处理，如拉伸、缩放、翻转等生成新的车辆样本图像，补充车辆训练样本库。

本发明可以使用运行于linux的caffe架构进行深度残差网络的训练，例如，在caffe的示例程序中有cifar10的demo，里面有获取cifar10数据程序，使用其生成训练数据，其生成的训练数据是二进制的，需要将其转换为lmdb数据。

图2示出了本发明的本发明还提出了一种车辆部位识别装置，该装置包括：

样本图像获取单元21，获取车辆样本图像；

样本图像训练单元22，对获取的车辆样本图像使用卷积神经网络进行训练，得到车辆部位识别模型；

车辆部位识别单元23，获取车辆图像，将所述车辆图像输入到车辆部位识别模型中输出车辆部位的名称。

样本图像获取单元21获取车辆样本图像可通过网络(例如，搜索引擎抓取、汽车论坛下载)、拍摄(例如，手机拍摄)的方式获得，特别是对于不同角度和不同位置图像中的车辆进行采集，构成车辆样本图像数据包，该数据包可以存储在存储介质上，可以存在服务器上等等。

本发明的车辆部位识别装置是基于深度学习，深度学习是机器学习中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，模仿人脑机制来解释数据，例如图像、声音和文本。而卷积神经网络(convolutionalneuralnets，cnn)：一种深度学习的模型，对于大型图像处理有出色表现。更进一步地，resnet(深度残差网络)，是一种卷积神经网络结构，具有良好的性能，本发明构建了专门用于车辆部位识别的深度残差网络的结构，即样本图像训练单元的组成，其包括：

标记模块，对车辆样本图像进行标记生成样本图像数据库；

深度残差网络设置模块，设置深度残差网络的层数为152层，每个卷积层具有16个残差模块，每个残差模块的卷积核的大小为3×3；层数的数目及残差模块及核大小都是在车辆部位识别过程中，根据实际测试结果选定的，其识别效果较好，且速度快。

为丰富图像数据库，在标记步骤中，还对图像进行增强处理，如拉伸、缩放、翻转等生成新的车辆样本图像，补充车辆训练样本库。

本发明的装置可以运行于linux的caffe架构进行深度残差网络的训练，例如，在caffe的示例程序中有cifar10的demo，里面有获取cifar10数据程序，使用其生成训练数据，其生成的训练数据是二进制的，需要将其转换为lmdb数据。

图3示出了本发明还提出了一种车辆部位识别设备，包括处理器31、存储器32和显示屏33，当然该设备还可以包括其他部件，如wifi模块、蓝牙模块、usb接口等等其他需要使用的接口，在此没有示出。处理器31分别与存储器32和显示屏33通过总线相连接，存储器32中可以存储该设备所执行的程序及数据等，处理器31可以执行存储器32中的程序，执行相应的操作，如上述图1中所示出的方法。本发明中的设备可以为服务器、台式主机、平板电脑、笔记本电脑等等，但不限于这些设备。

本发明还涉及一种计算机可读存储介质，所述存储介质上存储有计算机程序代码，当所述计算机程序代码被计算机执行时可执行图1中的方法。

本发明所述的方法，可以通过计算机程序实现，也可以将计算机程序存储在存储介质上，处理器从存储介质上读取计算机程序，并执行相应的方法。

最后所应说明的是：以上实施例仅以说明而非限制本发明的技术方案，尽管参照上述实施例对本发明进行了详细说明，本领域的普通技术人员应当理解：依然可以对本发明进行修改或者等同替换，而不脱离本发明的精神和范围的任何修改或局部替换，其均应涵盖在本发明的权利要求范围当中。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高冬;邱慧;庞敏辉;梁大双;李文佳
技术所有人：优信拍（北京）信息科技有限公司
我是此专利的发明人

上一篇：一种促进低碳源废水处理的新工艺的制作方法
上一篇：一种桥梁检测车链条固定装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。