一种计算车辆起始地和目的地的方法

文档序号:8299284阅读:904来源:国知局
一种计算车辆起始地和目的地的方法
【技术领域】
[0001]本发明涉及大规模数据处理的技术领域,具体地涉及一种计算车辆起始地和目的地的方法。
【背景技术】
[0002]车辆在行驶的过程中,会通过车载终端间隔地向后台服务器传输行驶记录数据。如何更准确地从这些行驶记录数据中分析出哪些是车辆的起始地,哪些是车辆行驶的目的地,将能开发出更多基于此数据的新应用。
[0003]通常计算车辆起始地和目的地的方法是将所有车辆经过的每个城市分别划分为起始地和目的地进行计算。这样就将很多车辆途经的城市也划分为起始地或者目的地了。这种方法计算量大,不利于数据查询,计算结果模糊,且没有将普通停靠点从起始地和目的地中区分开来。

【发明内容】

[0004]本发明的技术解决问题是:克服现有技术的不足,提供一种计算车辆起始地和目的地的方法,其计算量小,有利于数据查询,计算结果较为准确。
[0005]本发明的技术解决方案是:这种计算车辆起始地和目的地的方法,该方法包括以下步骤:
[0006](I)将车辆行驶轨迹数据网格化;
[0007](2)计算每个车辆经过一个网格一次在该网格内的停留时间;通过过滤操作过滤掉总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,并找出停靠时间排序前50的停靠点;
[0008](3)获取每个车辆的停靠时间排序前50的停靠点的原始数据;
[0009](4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;
[0010](5)进行停靠点特征提取;
[0011](6)根据步骤(5)的特征,通过货车停靠的数据与实际地图进行比较,标注出货车的起始地和目的地,形成标注集;
[0012](7)找出每个特征中的最大值。
[0013]本发明提取车辆每次停靠的多种特征,标注数据,利用机器学习的方法分析每一次停靠地是不是起始地或者目的地,使得计算量小,有利于数据查询,计算结果较为准确。
【附图说明】
[0014]图1为根据本发明的数据网格化的示意图。
[0015]图2为根据本发明的计算车辆起始地和目的地的方法的流程图。
【具体实施方式】
[0016]如图2所示,这种计算车辆起始地和目的地的方法,该方法包括以下步骤:
[0017](I)将车辆行驶轨迹数据网格化;
[0018](2)计算每个车辆经过一个网格一次在该网格内的停留时间;通过过滤操作过滤掉总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,并找出排序前50的停靠点;
[0019](3)获取每个车辆的排序前50的停靠点的原始数据;
[0020](4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;
[0021](5)进行停靠点特征提取;
[0022](6)根据步骤(5)的特征,通过货车停靠的数据与实际地图进行比较,标注出货车的起始地和目的地,形成标注集;
[0023](7)找出每个特征中的最大值。
[0024]本发明提取车辆每次停靠的多种特征,标注数据,利用机器学习的方法分析每一次停靠地是不是起始地或者目的地,使得计算量小,有利于数据查询,计算结果较为准确。
[0025]另外,所述步骤(7)中对每个特征做归一化处理,并且该方法还包括以下步骤:
[0026](8)根据提取特征的停靠点数据,对其进行逻辑回归建模;
[0027](9)对计算结果,运用交叉验证,计算模型的精度、召回率。
[0028]另外,所述步骤⑴包括以下分步骤:
[0029](1.1)数据过滤,将时间大于2020年或者小于2010年的数据过滤掉;将经度为O或者玮度为O的数据过滤掉;将行驶里程为O的数据过滤掉;
[0030](1.2)对于数据的经玮度做网格化处理,将数据的经玮度的最后两位数字改写为50,这样当两个数据的经玮度坐标除了最后两位之外都相同时,这两个数据的经玮度处于同一个网格中;
[0031](1.3)对于每个车辆,按照车辆行驶轨迹数据的记录时间排序之后,计算当前时间跟上一条时间的间隔,并添加在该行驶轨迹数据末尾。
[0032]另外,所述步骤(2)中停留时间为当前网格的最后记录点时间减去前一网格的最先记录点时间,指定时间为10分钟。
[0033]另外,所述步骤(3)通过连接join操作获取每个车辆的排序前50的停靠点的原始数据。
[0034]另外,所述步骤(4)对前50的停靠点的原始数据和聚类后的停靠点做join操作,以便连接上前50的停靠点的原始数据中的时间和在每个停靠点的间隔,按照停靠时间对聚类后的停靠点做排序。
[0035]另外,所述步骤(5)中对于每个停靠点,计算上一个停靠点到该停靠点的行驶时间、该停靠点到下一个停靠点的行驶时间、上一个停靠点到该停靠点的行驶里程、该停靠点到下一个停靠点的行驶里程、在该停靠点的白天停靠时间、晚上停靠时间、该停靠点的平均停靠时间、平均白天停靠时间、平均晚上停靠时间;并按照时间的先后顺序对停靠点数据做排序。
[0036]下面给出具体的例子说明,其中车辆为货车。
[0037]其计算过程为:
[0038]1、原始数据为货车一个月的行驶轨迹数据。数据过滤,将时间大于2020年,或者小于2010年的记录过滤掉;将经度为O或者玮度为O的记录过滤掉;将行驶里程为O的记录过滤掉。对于经玮度做网格化处理,如图1所示,其处理过程为将经玮度的最后两位数字改写为“50”,这样只要两个经玮度坐标除了最后两位的前几位相同,那么认为这两个经玮度相同,也可以认为这些经玮度处于同一个网格中,在图1中,可以认为B、C、D处于网格2中,E、F、G处于网格3中。之后对于每辆货车,按照货车的记录时间排序之后,计算当前时间跟上一条时间记录的间隔(durat1n),并添加在该记录末尾输出。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1