面向道路实时速度计算的浮动车数据停车行为模式清洗方法

文档序号:9811641阅读:454来源:国知局
面向道路实时速度计算的浮动车数据停车行为模式清洗方法
【技术领域】
[0001]本发明涉及于数据挖据技术领域,具体涉及到一种面向道路实时速度计算的浮动 车数据停车行为模式清洗方法。
【背景技术】
[0002] 道路速度是交通指挥、导航、出行诱导、拥堵治理等宏观、微观应用的前提,是重要 的基础性数据。因此获得更加接近于真实的数据
[0003] 浮动车数据作为交通数据的重要组成部分之一,在实时道路通行速度计算得到了 广泛的应用。对现有的浮动车数据进行试验研究时可以发现,浮动车异常停止行为产生的 数据被应用于实时道路通行速度计算中会严重影响其速度的准确性。由于浮动车数据量 大,且异常停止行为个别行为且无规律可循,人为很难及时的发现和剔除。

【发明内容】

[0004] 为了克服已有无法有效识别停车行为的不足,本发明提供一种有效识别浮动车停 车行为的面向道路实时速度计算的浮动车数据停车行为模式清洗方法。
[0005] 本发明解决其技术问题所采用的技术方案是:
[0006] -种面向道路实时速度计算的浮动车数据停车行为模式清洗方法,所述清洗方法 包括如下步骤:
[0007] 步骤(1).读取地图数据,地图数据包括路段编号(LDID)、路段点位信息,将地图网 格化得到"网格一路段编号"映射表;
[0008] 步骤(2).根据"车牌号"、"创建时间"升序读取当前时间前设定时间片的浮动车数 据,浮动车数据包括车牌号码CPHM、点位信息GPS_FDC和创建时间CJSJ;
[0009] 步骤(3).计算车辆连续两次记录的距离和时间差,然后通过距离和时间差计算速 度,并根据"网格一路段编号"映射表将该速度添加到第二次记录的车辆点位信息所在的路 段编号上;
[0010] 步骤(4).根据以上步骤得到该时间片各个路段上各个车辆的速度列表;
[0011] 步骤(5).识别并剔除速度列表中由于"伪停止行为"造成的异常停止点,并返回速 度列表,过程如下:
[0012] 5-1.在步骤⑷得到的数据结构LDID_SpeedMap中循环遍历获取LDID中CPHMk的速 度列表speedListj,循环遍历speedListj中所有的速度Vi,如果Vi = 0且Vi+S关0,0〈s〈 = n_i, s为连续停止点的个数,则"伪停止行为"过程的车辆速度记录个数δ = s+1;
[0013] 5-2.根据公式(2)计算"伪停止行为"车辆速度突变阈值SPSSC;当i矣1时公式左边 为该速度列表第一个停止点前的所有速度记录的平均速度,当i = l时,以该路段上一时刻 的平均速度vt作为平均速度阈值;
[0015] 5-3.若Vi+S > = SPSSC,则该速度记录为"伪停止行为"造成的突变速度,从速度列 表中剔除连续停止点的速度记录和突变速度速度记录;
[0016] 5-4.完成"伪停止行为"识别和剔除后返回一个新的LDID_SpeedMap。
[0017] 进一步,所述清洗方法还包括如下步骤:
[0018] 步骤(6).识别并剔除速度列表中由于"真停止行为"造成的异常停止点,并返回速 度列表,过程如下:
[0019] 6-1.经过步骤(5)后从新的LDID_SpeedMap中循环遍历获取LDID中CPHMk的速度列 表speedListj,循环遍历speedListj中所有的速度Vi,如果vi = 0且Vi+S关0,0〈s〈 = n_i,s为 连续停止点的个数;若s> = 3则认为该车出现了"停止行为"跳至6-2判断是否属于"路口停 止行为";
[0020] 6-2 ·得到该停止行为的Vi对应的LDID和GPS_FDCi,遍历intersect ionMap,若 inter sect ionMap中存在该LDID则说明该LDID为路口路段,若不存在进入6-3;从 intersectionMap中获取该LDID对应的路口点(GPS_QD,GPS_ZD),通过公式(3)计算GPS_ roQ与路口的距离并取其最小值L,若L〈L_min,则认为该"停止行为"属于"路口停止行为" 不进行剔除,否则进入6-3判断是否属于"集体停止行为";
[0021] L=min(abs(GPS_FDCi-GPS_QD),abs(GPS_FDCi-GPS_ZD) (3)
[0022] 6-3.得到该停止行为的Vi对应的CJSJi和GPS_FDCi,循环遍历该LDID下其他车辆的 速度列表若出现"停止行为"获取其对应停止点的GPS_roCi,和CJSJi,,根据公式(4)、公式 (5)计算判断条件,
[0023] abs(GPS_FDCi-GPS_FDCi·) < Δ s_min, i Φ i ' (4)
[0024] abs(CJSJi_CJSJi') < Δ t_min, i 关 i ' (5)
[0025] 若该LDID下其他车辆都满足以上判断条件则认为该停止行为属于"集体停止行 为"不进行剔除,否则该停止行为属于"真停止行为",并从速度列表中剔除连续停止点的速 度记录;
[0026] 6-4.完成"真停止行为"识别和剔除后返回一个新的LDID_SpeedMap。
[0027] 再进一步,所述清洗方法还包括如下步骤:
[0028] 步骤(7).经过以上步骤后计算LDID对应的所有速度记录的平均速度并存于数据 库实时速度表中,更新时间片重复步骤(2)至步骤(6)。
[0029] 更进一步,所述步骤(3)中,速度计算过程如下:
[0030] 3-1.根据步骤(2)得到各个车辆在该时间片下的所有记录,记为{CPHMk}_{GPS_ FDCi,CJSJi},keK ien,n为所有记录的个数,K为该时间片车辆的总数;
[0031] 3-2.根据公式(1.1)或(1.2)计算车辆速度Vi,得到车辆速度列表{CPHMk}_{vi, GPS_FDCi,CJSJi}〇
[0032] 采用的是连续两次记录的GPS点的绝对距离,作为车辆的行驶距离,
[0033] 1)在未跨路段的情况下使用公式(1.1)
[0035] 2)在跨路段的情况下使用公式(1.2)
[0036]
[0037] GPSJDi为连续两次记录的GPS点,在跨路段时,两条路段的交点的点位信息。
[0038]所述步骤(7)中,根据LDID_SpeedMap获取LDID下所有车辆速度列表的速度记录并 根据公式(6)计算LDID对应的平均速度,并存入数据库实时道路速度表中供其他应用使用。
[0040] K为该LDID下的车辆数,nk为第k辆车的速度记录个数。
[0041] 本发明的技术构思为:根据实时的浮动车数据,计算出浮动车行驶速度并添加到 相应的路段中,得到路段中各个车辆的速度列表并识别异常停止行为并且剔除异常速度。
[0042] 所述浮动车是指城市公共交通中的出租车和公交车。浮动车在车辆行驶过程中会 每隔一段时间(一般为30秒)上传一次数据,数据包括:浮动车车牌号、浮动车位置信息 (GPS)、数据创建时间等;"停止行为"包括"正常停止行为"和"异常停止行为"。"正常停止行 为"包括:
[0043] "路口停止行为":车辆停在路口(多数情况下在等待红灯属于交通过程中的正常 现象)
[0044] "集体停止行为":指所有浮动车在同一时间同一地点停止的行为(在遇到拥堵的 情况下会出现也属于交通过程中的正常现象)。
[0045] "异常停止行为"包括:
[0046] "真停止行为":车辆异常停止(个别车辆长时间停在一个点,在交通过程中属于个 别行为为异常现象)
[0047] "伪停止行为":数据上传异常造成的停止,表现为连续出现速度为0的点,且在该 点之后速度突变。(如图1所示)。
[0048] 从数据本身的特点来区分"真停止行为"、"伪停止行为"。"真停止行为"包括"真停 止_个体行为"和"真停止_群体行为"。本方案识别的是"真停止_个体行为",这种停止的个 体行为是计算道路速度时的干扰因素,在计算道路实时速度时不予计入样本数据。对于本 专利所阐述的"伪停止行为",主要是指那些因设备故障、传输网络故障、或数据库写入故障 等导致的看上去像停止行为的数据样本。这些停止行为虽然在数据形式上表现为停止,但 数据生产和传输链路错误导致的可能性更大,或者说,我们认为其是"伪停止行为"。将这种 "伪停止行为"也排除在计算道路实时速度的样本数据之外。
[0049] 本发明的有益效果主要表现在:在大数据量且无规律可循的浮动车数据中快速并 且准确的识别数据中的两种停止行为并剔除,在保证数据的实时性的同时,极大的增加了 实时速度的准确性。
【附图说明】
[0050]图1是"伪停止行为"说明图。
[0051 ]图2是跨路段的情况下车辆的行驶距离计算示意图。
[0052] 图3是面向道路实时速度计算的浮动车数据停车行为模式清洗方法的流程图。
[0053] 图4是LDID_SpeedMap数据结构图。
【具体实施方式】
[0054] 下面结合附图对本发明作进一步描述。
[0055] 参照图1~图4,一种面向道路实时速度计算的浮动车数据停车行为模式清洗方 法,定义相关符号如下:
[0056] Vi:车辆速度,单位km/h, ien,n为单个时间片下某车在同一个LDID上的速度记录 个数。
[0057] vavg:路段平均速度,单位km/h。
[0058] δ: "伪停止行为"过程的车辆速度记录个数(速度连续为〇的次数加上1次速度突 变)。
[0059] SPSSC(Stop Point Speed Sudden Change): "伪停止行为"车辆速度突变阈值。
[0060] Δ 同一路段不同车辆的速度记录时间差阈值(设值30秒)。
[0061] Δ s_min:同一路段不同车辆的速度记录位置间隔阈值(设置50米)
[0062] L_min:判断车辆是否停在路口的距离阈值(设置50米)。
[0063]所述浮动车数据停车行为模式清洗方法包括如下步骤:
[0064]步骤(1).地图数据预处理:
[0065] 1-1.读取地图数据,地图数据包括路段编号(LDID)、起点点位信息(GPS_QD)、终点 点位信息(GPS_ZD)、中点点位信息(GPS_MD),将地图网格化(网格边长100-300米)得到"网 格一路段编号"映射表(如表1所不)。
[0066]
[0067] 表 1
[0068] 1-2.因为路段的联通性,路段1与路段2之间终点与起点相连(即为同一个点),统 计地图数据中所有路段的起点和终点,得到"点-路段编号"映射表(如表2所示)。
[0069]
[0070] 表 2
[0071] 1-3.根据"点-路段编号"映射表找到三叉路口或者十字路口的点即LDID个数大于 等于3的点,形成新的"点-路段编号"映射表称为"路口点映射表",将"路口点映射表"进行 翻转形成"路段编号一点"映射表(如表3所示,注:Value中记录的是该路段属于三叉路口或 者十字路口的点位信息,若某路段的起点和终点都属于三叉路口或者十字路口点则Value 中记录该路段的起点点位信息和终点点位信息,若只有其中某一个点为三叉路口或者十字 路口点,则只记录该点的点位信息)称为"路口路段映射表"记intersectionMap。
[0072]
[0073] 表 3
[0074] 步骤(2).根据"车牌号码"、"创建时间"升序读取当前时间往前一个时间片(5min) 的浮动车数据,浮动车数据包括车牌号码(CPHM)、点位信息(GPS_FDC)、创建时间(CJ
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1