一种车辆常跑路线分析方法

文档序号:8282803阅读:638来源:国知局
一种车辆常跑路线分析方法
【技术领域】
[0001] 本发明涉及大规模数据处理的技术领域,具体地涉及一种车辆常跑路线分析方 法。
【背景技术】
[0002] 车辆常跑路线为车辆经常行驶的路线。
[0003] 车辆常跑路线的分析对车联网业务有重要意义。具体体现有:
[0004] 1、分析货车经常行驶路线,可以在货车空载时向货车推荐货运业务,提高货车车 主的运营收入。从另一方面讨论,也可以为零散货源提供有效的运输途径。
[0005] 2、分析货车的常跑路线有助于优化货车的运输路线,为货车司机提供更经济的运 输线路。
[0006] 3、根据车辆的常跑线路,可以在常跑线路的周边构建货车的一些相关服务。例如 维修、加油等。
[0007] 4、根据车辆常跑线路可以对运送危险品的车辆实行更细致的运输监控。减少重大 事故的发生。
[0008] 通常分析车辆常跑路线的方法为:统计所有车辆所有经过的路线的次数来判断车 辆的常跑路线。即:使用了一种蛮力的办法来对所有线路进行频率统计,然后将行驶路线频 率小的路线过滤掉,并给出经常跑的线路。因此,这种方法统计计算量大,耗时耗力巨大,而 且不便于分析利用。

【发明内容】

[0009] 本发明的技术解决问题是:克服现有技术的不足,提供一种车辆常跑路线分析方 法,其统计计算量较少、耗时少、便于分析、计算结果准确。
[0010] 本发明的技术解决方案是:这种车辆常跑路线分析方法,该方法包括以下步骤:
[0011] ⑴将车辆行驶路线序列化;
[0012] (2)根据频繁序列挖掘模型的剪枝理论去除与非频繁序列相关的序列,
[0013] 剩下的序列为频繁序列;
[0014] (3)将步骤(2)的频繁序列进行处理得到车辆常跑路线。
[0015] 本发明将车辆行驶路线序列化,再根据频繁序列挖掘模型的剪枝理论获取频繁序 列,从而得到车辆常跑路线,使得统计计算量大大减少,耗时减少,而且便于分析、计算结果 准确。
【附图说明】
[0016] 图1为根据本发明的数据网格化的示意图。
[0017] 图2为根据本发明的车辆行驶停靠点聚类图。
[0018] 图3为根据本发明的车辆停靠事件序列示意图。
[0019] 图4为根据本发明的车辆常跑路线分析方法的流程图。
【具体实施方式】
[0020] 如图4所示,这种车辆常跑路线分析方法,该方法包括以下步骤:
[0021] (1)将车辆行驶路线序列化;
[0022] (2)根据频繁序列挖掘模型的剪枝理论去除与非频繁序列相关的序列,剩下的序 列为频繁序列;
[0023] (3)将步骤(2)的频繁序列进行处理得到车辆常跑路线。
[0024] 本发明将车辆行驶路线序列化,再根据频繁序列挖掘模型的剪枝理论获取频繁序 列,从而得到车辆常跑路线,使得统计计算量大大减少,耗时减少,而且便于分析、计算结果 准确。
[0025] 如图2所示,为一辆货车的行驶轨迹,其中A、B、C…分别为车辆的停靠网格,方格 I (C1)、2 (C2)、3 (C3)、4 (C4)、5 (C5)、6 (C6)分别为车辆经过的城市。如果按照普通方法计算,需 要统计种路线的行驶频率,分别为:
[0026] 1-2、1-3、1-4、1-5、1-6、2-3、2-4、2-5、
[0027] 2-6、3-4、3-5、3-6、4-5、4-6、5-6
[0028] 但是使用频繁项挖掘模式统计的数量可能就比这个数字要小很多。因为根据频繁 序列挖掘模型的剪枝理论,如果上述路线中路线" 1-2"为非频繁序列,那么路线1-3、路线 1-4、路线1-5、路线1-6将不再统计。因为路线1-3、路线1-4等都经过路线1-2,如果路线 1_2不是常跑路线,路线1_3、路线1_4等肯定不是常跑路线。
[0029] 另外,所述步骤(1)包括以下分步骤:
[0030] (1. 1)对原始车辆数据进行噪声数据过滤;
[0031] (1. 2)对步骤(I. 1)得到的每条数据的经炜度做网格化处理;
[0032] (1. 3)计算每个车辆经过一个网格一次在该网格内的停留时间,如果一个车辆在 一个网格之内的停留时间大于指定时间,认为是一次停靠;通过过滤操作过滤掉停留时间 小于指定时间的网格;
[0033] (1. 4)分析每个停靠网格的信息点POI数据,将POI数据是加油站、维修站的停靠 网格过滤掉,然后对剩下的停靠网格进行单路径增量聚类,形成停靠网格;
[0034] (1. 5)进行序列模式模型的建模。
[0035] 另外,所述步骤(I. 1)中将时间大于2020年或者小于2010年的数据记录过滤掉; 将经度为0或者炜度为0的记录过滤掉;将行驶里程为0的记录过滤掉。
[0036] 另外,所述步骤(1. 2)中当两个数据的经炜度坐标除了最后两位之外都相同时, 这两个数据的经炜度处于同一个网格中。
[0037] 另外,所述步骤(1. 3)中指定时间为10分钟。
[0038] 另外,所述步骤(1. 4)中增量聚类的簇半径为0. 5km。
[0039] 另外,所述步骤(1.5)的序列模式模型中在车辆行驶的过程中形成一个城市序 列,每个城市为该城市序列的一个元素;而每个停靠网格簇为每个元素的一个事件;该模 型用于分析具体每个车辆的运营规律。
[0040] 或者,所述步骤(1. 5)的序列模式模型中将车辆经过的城市形成事件序列,用于 分析车辆运营经过的城市。
[0041] 或者,所述步骤(1. 5)的序列模式模型中将车辆经过的停靠网格簇形成序列,分 析从一个区域到另一个区域的路线,优化路线为车辆提供经济的运输线路。
[0042] 另外,所述步骤(3)中设定最小支持度阈值,如果有序列的最小支持度大于或等 于该阈值,则该序列为一个频繁序列,对应为车辆的一个常跑路线。
[0043] 下面给出具体的例子说明,其中车辆为货车。
[0044] 原始数据为货车一个月的行驶轨迹数据。原始数据中,每一条记录为车载终端相 隔30秒向服务器报告一次货车的运行信息。其中包括:位置GPS、车辆速度、车辆id等。
[0045] 其计算过程为:
[0046] 1、噪声数据过滤。将时间大于2020年,或者小于2010年的数据记录过滤掉;将经 度为〇
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1