基于深度学习目标检测的地铁车号识别方法与流程

文档序号:24074055发布日期:2021-02-26 16:28阅读:198来源:国知局
基于深度学习目标检测的地铁车号识别方法与流程

[0001]
本发明涉及地铁检修维护技术领域,具体涉及一种基于深度学习目标检测的地铁车号识别方法。


背景技术:

[0002]
地铁检修维护单位的很多系统需要实时知道到来的车辆车号信息,以便开展工作并记录数据,如自动洗车机、轮对探伤系统、受电弓在线检测系统等,这些系统的等级往往达不到直接接入车辆运行管理信号系统的要求,因此需要从信号系统以外准确快速的获取车辆车号信息。
[0003]
如果不对地铁车辆进行安装rfid标签等改造(通常不允许),就需要使用视觉技术识别车号。目前的方式大都是深度学习的方式直接找到图像上的车号,然后再使用ocr技术识别车号,车号是变化的图像信息,深度学习训练速度慢,识别精确度有待提高。


技术实现要素:

[0004]
本发明的目的是提供一种基于深度学习目标检测的地铁车号识别方法,融合了深度学习的目标检测技术、机械视觉技术和ocr技术,准确快速的获取车辆车号信息。
[0005]
本发明所采用的技术方案为:基于深度学习目标检测的地铁车号识别方法,其特征在于:所述方法包括以下步骤:步骤一:在地铁车辆经过时获得车头图像信息,基于深度学习目标检测技术识别出车头正面的logo;步骤二:根据车头正面logo与车号之间的相对位置关系和大小比例关系,基于机械视觉技术计算出车号在图像上的位置和大小,找到车号位置,图像裁减后使用ocr算法进行文本识别,得到车号数据;步骤三:将车号数据发送给上级服务器。
[0006]
步骤一中,车头图像信息的获得过程为:在检测地铁车辆车号的位置安装一个摄像头,使其能够在车辆经过时在同一画面拍摄到车头正面的logo和车号;在摄像头前方部署一台边缘计算机和一个光电反射车感器,摄像头使用usb数据线连接到边缘计算机,地铁车辆经过时触发车感器,边缘计算机通过车感器检测到车辆到来,触发摄像头录制短视频。
[0007]
步骤一中,识别车头正面logo的过程为:边缘计算机内置检测程序,使用深度学习目标检测技术逐帧检测视频是否拍到车头的logo,如果没有检测到则判定为车感器误触发,如果检测到logo,通过检测程序得到logo在图像上的位置和像素尺寸大小。
[0008]
步骤二中,裁减车号位置的图像后,通过透视变换矫正图像,消除图像变形影响。
[0009]
步骤三中,边缘计算机将车号数据发送给上级服务器,同时,将该处边缘计算机的编号和车辆通过时间也发送给上级服务器。
[0010]
车辆通过时间为车感器被触发的时间。
[0011]
本发明具有以下优点:本发明通过车感器感知车辆到来,控制摄像头录像,并利用深度学习目标检测技术、机械视觉技术和ocr识别技术识别出车辆车号,通过网络将自身编号、车辆通过时间、车辆车号等信息发送给上级服务器。
[0012]
本发明在策略上的核心创新之处在于,不直接识别车号,而是先识别出logo,根据logo与车号之间的位置关系,通过logo找到车号,然后识别车号。logo是固定不变的目标,相比车号的识别准确度会更高,深度学习时所需要的样本更少,训练速度更快。
附图说明
[0013]
图1为本发明硬件布置示意图。
[0014]
图2为车头的车号和logo布置图。
具体实施方式
[0015]
下面结合具体实施方式对本发明进行详细的说明。
[0016]
如图2所示,地铁车辆的车头部分标识了车号,同时也一定有一个特定的logo,不同的车辆的车号会不同,但logo一般是相同的,logo是固定不变的目标。
[0017]
本发明涉及一种基于深度学习目标检测(object detection)的地铁车号识别方法,先识别出logo,根据logo与车号之间的位置关系,通过logo找到车号,然后识别车号,发送给上级服务器。过程的融合了深度学习目标检测技术、机械视觉技术和ocr技术(例如tesseract)。
[0018]
深度学习(deep learning)是机器学习的分支,是一种以人工神经网络为架构,对资料进行表征学习的算法。深度学习是机器学习中一种基于对数据进行表征学习的算法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。本发明可使用的深度学习技术框架为darknet,是一种现有深度学习框架。目标检测(object detection)是计算机视觉及影像处理中的术语,指的是让计算机去分析一张图片或者一段视频流中的物体,并标记出来。本发明可使用的目标检测算法是yolo,为一种现有算法。
[0019]
机器视觉(machine vision、mv)是配备有感测视觉仪器(如自动对焦相机或传感器)的检测机器,其中光学检测仪器占有比重非常高,可用于检测出各种产品的缺陷,或者用与判断并选择出物体,或者用来测量尺寸等,应用在自动化生产在线对物料进行校准与定位。是计算机视觉中最具有产业化的部分,主要大量应用于工厂自动化检测及机器人产业等。简单地说如果图像没有畸变,图像就是真实世界的投影,一个像素就对应现实世界的一个尺寸粒度,举个简化的例子,将一个米尺垂直立在板凳边上拍照片,图像米尺在1米刻度在图像上占了1000个像素长度,那么我们就知道1个像素在这个平面上表示1毫米,板凳
高度占了560个像素,那么板凳的高度就是560毫米。
[0020]
光学字符识别(optical character recognition,ocr)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程,本发明使用的是开源算法tesseract,为一种现有算法。
[0021]
本发明基于上述几种成熟技术提出了以下方法,具体包括以下步骤:步骤一:在地铁车辆经过时获得车头图像信息,基于深度学习目标检测技术识别出车头正面的logo。
[0022]
所述车头图像信息的获得过程为:在检测地铁车辆车号的位置安装一个摄像头,使其能够在车辆经过时在同一画面拍摄到车头正面的logo和车号;在摄像头前方部署一台边缘计算机和一个光电反射车感器,摄像头使用usb数据线连接到边缘计算机,地铁车辆经过时触发车感器,边缘计算机通过车感器检测到车辆到来,触发摄像头录制短视频。
[0023]
所述识别车头正面logo的过程为:边缘计算机内置检测程序,使用深度学习目标检测技术逐帧检测视频是否拍到车头的logo,如果没有检测到则判定为车感器误触发,如果检测到logo,通过检测程序得到logo在图像上的位置和像素尺寸大小。
[0024]
步骤二:根据车头正面logo与车号之间的相对位置关系和大小比例关系(提前输入到检测程序中),基于机械视觉技术计算出车号在图像上的位置和大小,找到车号位置,图像裁减后使用ocr算法进行文本识别,得到车号数据。裁减车号位置的图像后,可通过透视变换矫正图像,消除图像变形影响。由于摄像头通常不可能安装在车头正前方,车号图像会有变形,矫正后能提高识别准确率。
[0025]
透视变换(perspective transformation)是指利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一角度,破坏原有的投影光线束,仍能保持承影面上投影几何图形不变的变换。简而言之,就是将一个平面通过一个投影矩阵投影到指定平面上。
[0026]
步骤三:边缘计算机按照上级服务器的通讯协议要求将车号数据通过网络发送给上级服务器,同时,将该处边缘计算机的编号和车辆通过时间也发送给上级服务器。车辆通过时间为车感器被触发的时间。
[0027]
本发明涉及的硬件部署包括边缘计算机、车感器、摄像头和上级服务器。边缘计算机通过车感器感知车辆到来,控制摄像头录像,并利用深度学习目标检测技术识别出图像上logo标识的位置和大小,然后基于机械视觉算法通过logo标识的位置和大小得到车号位置的图像,经矫正处理后用ocr技术识别出车辆车号,最后按照通讯协议要求将自身编号、车辆通过时间、车辆车号等信息发送给上级服务器。
[0028]
本发明的内容不限于实施例所列举,本领域普通技术人员通过阅读本发明说明书而对本发明技术方案采取的任何等效的变换,均为本发明的权利要求所涵盖。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1