一种基于大数据的套牌车辆识别方法

文档序号:6715622阅读:121来源:国知局
一种基于大数据的套牌车辆识别方法
【专利摘要】本发明提供一种基于大数据的套牌车辆识别方法,属于大数据领域,本发明该方法由3部分组成:(1)卡口间最小时间阈值的计算和最小时间阈值矩阵的建立。(2)同号牌车辆某时间范围内的轨迹的获取。(3)套牌嫌疑车辆的分析和识别。结合现有的GIS系统及卡口设备的位置信息,获取各个卡口设备之间的最短路径和最大行驶速度。继而得到卡口间的最小时间阈值。通过将同号牌车辆轨迹中相邻时间的两个卡口过车时间与相应的卡口间最小时间阈值对比,以及车辆的车身颜色、型号等信息与在车辆管理部门所对应注册的信息的对比,从而判定出套牌嫌疑车辆。
【专利说明】一种基于大数据的套牌车辆识别方法

【技术领域】
[0001]本发明涉及大数据技术,尤其涉及一种基于大数据的套牌车辆识别方法。

【背景技术】
[0002]套牌车是指没有办理入户手续,盗用或伪造别的汽车车牌行驶的汽车,以达到在发生违章和交通事故时逃避责任的目的。我国道路交通安全法明确的禁止套牌车辆,其中第九十六条规定:伪造、变造或者使用伪造、变造的机动车登记证书、号牌、行驶证、检验合格标志、保险标志、驾驶证或者使用其他车辆的机动车登记证书、号牌、行驶证、检验合格标志、保险标志的,由公安机关交通管理部门予以收缴、扣留该机动车,并处200元以上2000元以下罚款;构成犯罪的依法追究刑事责任。
[0003]当汽车行驶在道路上时,车牌是该车的唯一身份标识,是交通部门管理车辆的重要凭证。套牌车的存在具有极大的危害,其严重影响了正常的道路交通秩序。侵犯了国家和他人的合法权益,同时也给交通管理工作和车辆管理带来了困难,特别是一些重、特大道路交通事故难以侦破,以致被害人得不到救治和赔偿。由于套牌车肇事不怕被发现,往往在公路上横冲直窜,不按道行驶,超速行驶,占道行驶,有的甚至还逆向行驶,严重影响道路的交通秩序。套牌车辆一般可以分为以下两类:一是公安交通管理部门核发的真号牌,二是纯粹伪造的号牌。真号牌是指号牌是确实存在的,但存在多辆车对应同一号牌的情况。对于这种情况,一般情况下交警是很难识别和查纠的。
[0004]近年来随着改革开放的进一步深入,人民生活水平不断提高,汽车已经逐步走入寻常百姓的家中,因此车辆的数目迅猛增长。统计数据显示,2000年我国家用汽车有1608.91万辆车,而到2008年车辆猛增到6467.21万辆,是2000年的4.02倍。同时,当前套牌车辆对社会正常秩序的危害是巨大的,当前套牌车辆异常猖撅,仅东莞一个城市警方掌握的套牌车辆就有2万辆,其仅给国家造成的财政损失超过千万,这还不包括因套牌车辆肇事等给地方警力断案以及扰乱交通秩序所带来的损失。因套牌车辆所引起的各种违法犯罪现象时见报端。因此对于套牌车的自动化、智能的识别的需求就尤为迫切。
[0005]大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce、HBase 一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。


【发明内容】

[0006]本发明采用基于大数据的方法,可以对一般情况下交警很难识别和查纠的套牌嫌疑车辆进行自动的识别和提示。一种基于大数据的套牌车辆识别方法,通过大数据技术,在大数据量的情况下,快速的智能的识别出存在套牌嫌疑的车辆。该方法由3部分组成:(1)卡口间最小时间阈值的计算和最小时间阈值矩阵的建立。(2 )同号牌车辆某时间范围内的轨迹的获取。(3)套牌嫌疑车辆的分析和识别。
[0007]结合现有的GIS系统及卡口设备的位置信息,获取各个卡口设备之间的最短路径和最大行驶速度。继而得到卡口间的最小时间阈值。通过将同号牌车辆轨迹中相邻时间的两个卡口过车时间与相应的卡口间最小时间阈值对比,以及车辆的车身颜色、型号等信息与在车辆管理部门所对应注册的信息的对比,从而判定出套牌嫌疑车辆。
[0008]判断某车牌是否存在套牌现象的基本思想是根据车辆在时空上的矛盾冲突。首先需要获得相同号牌车辆在不同的两地出现的时间差(T),然后根据车辆在该段时间内所能行驶的最大距离(Smin)与这两地之间实际行驶的最短距离(Smin)进行比较。ismax〈 Smin时,则可以判定该车辆存在套牌嫌疑。
[0009]在本方法中,有两个因素最为关键:一是A、B两地之间的最短路径Smin;:是车辆行驶的最大距离3_。这两个变量的获得都依赖于真实的地理环境和交通拥堵状况。基于方便计算的考虑,本方法提出了两个基于GIS系统计算Sniil^P Sniax的方法。
[0010]Smax = Vmax* T
SVT
Umin = vmax 氺 1min
其中Vmax是指两地之间按照交管规定车辆所能行驶到的最大速度。我们可以通过GIS系统获取相关道路的最高限速等信息来设定Vmax值。所以对于S min和S _的比较,就可以转化为对T和Tmin的比较。T可以通过同号牌车辆轨迹相邻的两个过车时间的差值取得。我们只需获得两个卡口之间的最短距离即Smin,从而就可以求得Tmin进行比较。
[0011]通过GIS系统,我们可以得到一个以道路路口(十字路口或丁字路口)和卡口为顶点,Tmin为权值的有向图。普通道路为双向通行,且双向的长度与限速通行状况基本相同。对于单行线道路,正向的权值按照上述方式计算,而反向的权值设定为正无穷。通过最短路径算法(例如Dijkstra算法或A*算法)即可求得两个卡口之间最短的Tmin值。对于N个卡口的区域,可以得到一个N*N的卡口最小时间阈值矩阵。
[0012]之后使用mapreduce的方式,对目标卡口范围内,获取同一号牌的车辆轨迹。在map函数中,取得各个卡口的每一条过车信息,将车辆的号牌号码作为key,过车时间、卡口编号、车型、车辆颜色等其他信息作为value传递给reduce。在reduce函数中,对同一个key的数据进行处理,并根据过车时间进行排序,最后就可以得到同一号牌车辆完整行驶轨迹。并将相邻卡口之间按照:“卡口 1,卡口 2,车牌,T值”类似的方式进行输出。之后再使用一个map函数,对前一步输出的T值与相应的卡口最小时间阈值矩阵中的元素对应比较。如果T〈Tmin,则认为该车辆有套牌的嫌疑。
[0013]通过卡口间最小时间阈值的计算和最小时间阈值矩阵的建立,同号牌车辆某时间范围内的轨迹的获取,在大数据量的情况下,快速的智能的识别出存在套牌嫌疑的车辆。

【专利附图】

【附图说明】
[0014]图1是路口和卡口建立示意图。
[0015]图2是原始数据图。
[0016]图3是经过处理后的结果图。

【具体实施方式】
[0017]下面对本发明的内容进行更加详细的阐述:
1、通过GIS系统,为一定范围内的路口和卡口建立图(例如附图1)。S,A,B,C,D,E为卡口和路口,边的权值为两个路口或卡口之间的Tmin值;
2、通过最短路径算法可知,有卡口S到卡口 D的最短路径为S-B-E-D,对应的Tmin值为20 (7+8+5)。由此可以确定定卡口间最小时间阈值。从而进一步可以得到卡口间最小时间阈值矩阵;
3、通过mapreduce方式,获取同一号牌车辆的轨迹数据。例如原始数据如图2。在map阶段读取每一条数据,并将车牌号码作为Key。相同车牌号码的记录将进入同一个Reduce中进行处理。在Reduce中对同一个车牌号码的记录按照过车时间进行排序,例如经过处理后,号牌为鲁A***50的结果如图3 ;
4、对相邻时间的两个记录进行比较,例如在鲁A***50卡口S和卡口 D之间的时间T为11分40.06秒。通过与步骤2中求得的Tmin比较,得知T〈T min。所以可以判定号牌为鲁A***50车辆存在套牌的嫌疑。
【权利要求】
1.一种基于大数据的套牌车辆识别方法,其特征在于,该方法由3部分组成: (1)卡口间最小时间阈值的计算和最小时间阈值矩阵的建立; (2)同号牌车辆某时间范围内的轨迹的获取; (3)套牌嫌疑车辆的分析和识别。
2.根据权利要求1所述的方法,其特征在于,结合现有的GIS系统及卡口设备的位置信息,获取各个卡口设备之间的最短路径和最大行驶速度;继而得到卡口间的最小时间阈值;通过将同号牌车辆轨迹中相邻时间的两个卡口过车时间与相应的卡口间最小时间阈值对比,以及车辆的车身颜色、型号等信息与在车辆管理部门所对应注册的信息的对比,从而判定出套牌嫌疑车辆。
3.根据权利要求2所述的方法,其特征在于,通过GIS系统获取相关道路的最高限速等信息来设定最大行驶速度。
4.根据权利要求3所述的方法,其特征在于,同号牌车辆轨迹中相邻时间的两个卡口过车时间小于相应的卡口间最小时间阈值时,该车辆有套牌的嫌疑。
【文档编号】G08G1/017GK104517445SQ201410744639
【公开日】2015年4月15日 申请日期:2014年12月9日 优先权日:2014年12月9日
【发明者】赵仁明, 辛国茂, 金洪殿, 范荣盛 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1