基于大数据分析的错误卡口位置信息自动识别方法

文档序号:9580049阅读:362来源:国知局
基于大数据分析的错误卡口位置信息自动识别方法
【技术领域】
[0001] 本发明属于数据挖据技术领域,具体涉及到一种基于大数据分析的错误卡口位置 ?目息的自动识别方法。
【背景技术】
[0002] 随着经济和社会的发展,特别是中国十八大以后,城市化进程加速,城市规模不断 扩大,城市人口持续增加,城市汽车保有量飞速增长,特别是大城市和特大城市的汽车保有 量几乎达到峰值。由于城市道路的基本通行能力有限,造成交通负荷度不断增大,交通拥堵 随处可见,交通问题已经成为一个普遍存在的民生问题。
[0003] 随着"互联网+"的提出,智慧交通也被推向一个新的高潮。卡口数据作为交通数 据的重要组成部分之一,在实时道路通行速度计算、交通负载计算、车辆行为模式挖掘等方 面得到了广泛应用。对现有的卡口数据进行试验研究时可以发现卡口的位置信息是十分关 键的基础数据,一旦这些位置信息出错,基于卡口过车信息的数据挖掘和大数据分析将会 产生严重的误导性后果,严重影响数据分析的正确性和可靠性,造成针对卡口数据的分析 和研究不能顺利进行,由于卡口数量众多,多达数万个,而且分布在城市的各个角落,如果 由人工逐一核实比对,将耗费大量的人工和交通费用,并且大部分错误的卡口位置信息很 难由人工去发现和排除。
[0004] 如何能够通过数据分析的手段,在数万个卡口位置信息中自动的识别出存在位置 信息错误嫌疑较大的那些卡口,再由人工现场核实比对,将会大大降低人工的费用和时间。

【发明内容】

[0005] 本发明针对现有技术的不足,提供了一种基于大数据分析的错误卡口位置信息自 动化识别方法。
[0006] 本发明中所谓的卡口是指设置有交通监控设备的道路监控点,用于过车数据的采 集,过车数据是指经过卡口的车辆,被卡口采集到的车辆信息,包括车辆的"车牌号码"、"卡 口编号"和"过车时间";相邻卡口对是指物理位置相邻、可被车辆依次顺序经过的卡口对。
[0007] 本发明技术方案的主要构思:根据海量的历史卡口过车数据,计算出相邻卡口对, 结合GIS地图数据计算相邻卡口对的最短路径长度,并根据过车数据计算车辆在卡口对间 通行速度。依次根据卡口对最短路径异常、卡口对间区间速度异常、异常频率迭代找出位置 信息错误的卡口。
[0008] 本发明方法包括以下步骤:
[0009] 步骤(1).在数据库中导入卡口数据、卡口过车数据、地图数据,卡口数据包含字 段有卡口编号(ΚΚΒΗ)、经度(JD)、炜度(WD),卡口过车数据包含字段有号牌号码(ΗΡΗΜ)、 卡口编号(ΚΚΒΗ)、过车时间(GCSJ),地图数据包含字段有ID(路段主键)、起始经炜度 (first_JD、first_WD)、中间点经炜度(center_JD、center_WD)、终点经炜度(end_JD、end_ WD) 〇
[0010] 步骤(2).设定阈值,分别有过车量阈值GCL_max,路径长度阈值LJCD_max,大速度 阈值DSD_max,小速度阈值XSD_min,速度异常率阈值SDYCL_max,嫌疑卡口阈值XYKK_max。
[0011] 步骤(3).读取一段时间的卡口过车数据,若经过两个相邻卡口之间的过车量大 于卡口过车辆阈值GCL_max,则这两个卡口被定义为相邻卡口对。
[0012] 步骤(4).根据相邻卡口对的位置信息沿着GIS地图路径计算出最短路径长度。
[0013] 步骤(5).若步骤(4)计算出的相邻卡口对的路径长度大于路径长度阈值LJCD_ max,则将此卡口对认定为嫌疑卡口对,并将其信息存于数据库中。
[0014] 步骤(6).读取一段时间的卡口过车数据,根据过车数据的过车时间差和经过的 相邻卡口对的路径长度计算出该车经过相邻卡口对的速度,判断速度是否大于大速度阈值 DSD_max或小速度阈值XSD_min,并记录其数量和总过车量。
[0015] 步骤(7).若速度异常数量占总过车辆大于速度异常率阈值SDYCL_max则认定为 此卡口对为嫌疑卡口对,并将其信息存于数据库中。
[0016] 步骤(8).重复步骤(5)、步骤(6)数次;统计数据库中的嫌疑卡口,得出相同嫌疑 卡口的频次,若频次大于嫌疑卡口阈值XYKK_max,则认定此卡口为错误位置信息的卡口。
[0017] 本发明具有的有益效果:本发明利用真实的卡口过车数据,具有数据量大、数据准 确性高等特点,由此根据过车数据的属性分析出来的错误卡口位置信息的准确性高。本发 明实现了自动化识别错误卡口位置信息,且具有执行速度快、准确性高、高效率等特点。避 免了大量的人为甄别工作。
【附图说明】
[0018] 图1是识别错误位置信息卡口的流程图。
【具体实施方式】
[0019] 以下结合附图对本发明作进一步说明。如图1所示,本发明包括如下步骤:
[0020] 步骤(1).数据准备:在数据库中导入卡口数据、卡口过车数据、地图数据,卡口数 据包含字段有卡口编号(KKBH)、经度(JD)、炜度(WD),卡口过车数据包含字段有号牌号码 (HPHM)、卡口编号(KKBH)、过车时间(GCSJ),地图数据包含字段有ID(路段主键)、起始经 炜度(打1^1:_几、;1^;^81:_10)、中间点经炜度(〇61^61'_几、〇61^61'_10)、终点经炜度(611(1_几、 end_WD)〇
[0021] 步骤(2).训练相邻卡口对(训练数据为1-3个小时的过车数据):
[0022] 2-1.初始化地图网格:将地图按一定边长(设置边长为100-200米)划分方形网 格,若某条道路的中点经炜度坐标在某个方形网眼中,则认为该道路位于该网眼中,将该 道路ID放至该网眼对应的"网眼-道路映射表"(如表3所示)中,key为网眼编号,value 为道路ID集合;若没有对应的"网眼-道路映射表",则为该网眼新建一张空的"网眼-道 路映射表",并放入该道路ID。
[0023] 表 3
[0024]
[0025] 2-2.创建卡口对映射表map(如表2所示),key为卡口对编号(A卡口编号,B 卡口编号),value为{过车量,路径长度,大速度个数,小速度个数,嫌疑标识},map记为 {ΚΙ,K2} {gel, 1jed,dsd,xsd,flag} 〇
[0026] 表 2
[0027]
[0028] 2-3.设定阈值,分别有过车量阈值GCL_max,路径长度阈值LJCD_max,大速度阈值 DSD_max,小速度阈值XSD_min,速度异常率阈值SDYCL_max,嫌疑卡口阈值XYKK_max(如表
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1