一种基于公交到离站的乘客IC卡数据与站点匹配方法与流程

文档序号:17225988发布日期:2019-03-27 12:39阅读:754来源:国知局
一种基于公交到离站的乘客IC卡数据与站点匹配方法与流程

本发明涉及一种基于公交到离站的乘客ic卡数据与站点匹配方法。



背景技术:

站点匹配在公交ic卡数据处理分析过程中,需要通过乘客刷卡数据和公交车辆到离站点信息找出乘客与站点的对应关系,乘客ic卡数据才能为城市公交出行数据挖掘如公交出行od推算,站点客流预测等提供基础数据。在以往研究中,主要是以聚类方法对ic卡交易数据进行处理,再根据站点间的到离站时间来匹配乘客上车站点,这在一定程度上避免了上车站点时间匹配错位后无法纠正的问题。但由于公交站点分布距离与站点客流变化的多样性和复杂性性,当前算法对上车站点的获得是通过刷卡时gps位置与站点经纬度比较或时间聚类方式取得,存在一定误差。现在车载智能终端能够实现实时报站功能,且将到离站信息及时上报到后台服务器,因此本专利根据乘客所乘车辆、刷卡时间、对应车辆的到离站站历史记录,可准确得到乘客的上车站点。

例如,《基于特征站点的公交ic卡数据站点匹配方法研究》这篇文献设计了一种基于特征站点的公交ic卡数据站点匹配方法,首先利用k-means聚类方法,通过计算交易时间间隔将同一站点产生的交易数据归类,再根据线路站点客流特征和乘客出行的换乘行为寻找线路特征站点(客流峰值站点与换乘站点),站点匹配时优先将特征站点编号与聚类数据进行匹配,从而提高匹配精度,但是该方法的准确性过多的依赖于k-means聚类初始簇的个数选择。

再如,《城市公交乘客下车站点推算方法和有效性评价》基于深圳市公交车afc和gps数据,利用时间匹配和基于带噪声空间密度聚类的方法判别上车站点,但是这种方法在对于车辆刷卡数据较少,即数据存在稀疏的情况下,密度聚类的效果并不明显,会出现某些站点未匹配刷卡数据,尤其是当趟次的刷卡数据也不确定的情况下,而且gps数据在网络传输中会发生中断而缺失(如车辆在过隧道时)。



技术实现要素:

本发明的目的在于提供一种基于公交到离站的乘客ic卡数据与站点匹配方法,以解决上述背景技术中提出的问题。该基于公交到离站的乘客ic卡数据与站点匹配方法根据公交车车辆的智能终端设备收集到的车辆到离站时间数据和乘客刷卡时间数据进行匹配。

为实现上述目的,本发明提供如下技术方案:

一种基于公交到离站的乘客ic卡数据与站点匹配方法,包括如下步骤:

步骤一:从后台服务器中获取公交车车辆到离站时间数据和乘客刷卡时间数据,根据公交车实际运营的情况,构成完整的到离站时间间隔;

步骤二:将公交车每天营运的第一趟首站到站时间和末站离站时间整个时间段为车辆的营运时间,并将营运时间划分为若干个相等时间间隔的时间段,经过车辆的实际数据多次测试,每个相等时间间隔的取值可以为车辆到离站时间间隔的平均值;

步骤三:将刷卡时间数据与每一个时间段匹配并得出每一个时间段里的刷卡时间数,找到刷卡时间点最多的时间段,并以该时间段的中点为特征站点时间,直到所有的时间段遍历完;

步骤四:根据车辆到离站时间求出该车辆每个站点的时间,站点的时间为该站点的到站时间与离站时间的时间中电,并将步骤三中求得的特征站点时间与每个站点时间的差值求得δt的集合;

步骤五:将刷卡时间数据加上δt与站点到离时间进行匹配,并计算出对应的δt的匹配率,直到δt遍历完,输出最大的匹配率以及此时的δt;

步骤六:将步骤五得到的δt对刷卡时间数据进行时间修正并与站点时间进行匹配,从而得到乘客的上车站点。

进一步的,步骤一中离站时间数据和乘客刷卡时间数据需要加上公交车车辆首站的到站时间和末站的离站时间;根据公交车实际运营的情况,设置为首站往前推n分钟,末站往后推n分钟,构成完整的到离站时间间隔。

与现有技术相比,本发明的有益效果是:

本发明的方法,可以不需要公交车gps数据信息,在公交车站点时间数据与乘客刷卡时间数据不一致的情况下,以落入到某个时间间隔最多的刷卡时间点的中点为特征站点时间,根据公交车车辆的智能终端设备收集到的车辆到离站时间数据和乘客刷卡时间数据进行匹配,当乘客刷卡时间数据较少且稀疏的情况下也能获得较高的匹配率,并可以减少其他基于k-means、dbscan等聚类算法的方法由于参数的选择带来的误差,符合现代城市公交车生产营运的实际情况。同时,该方法也可以为城市公交出行数据挖掘如公交出行od推算,站点客流预测等提供基础数据,为智慧公交做准备。

附图说明

图1为本发明一种基于公交到离站的乘客ic卡数据与站点匹配方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“上/下端”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置/套设有”、“套接”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

请参阅图1,本发明提供一种技术方案:

一种基于公交到离站的乘客ic卡数据与站点匹配方法,可以不需要公交车gps数据信息,在公交车站点时间数据与乘客刷卡时间数据不一致的情况下,以落入到某个时间间隔最多的刷卡时间点的中点为特征站点时间,根据公交车车辆的智能终端设备收集到的车辆到离站时间数据和乘客刷卡时间数据进行匹配。

它的核心思想想是:首先,将公交车每天营运的第一趟起始时间和最后一趟到站时间整个时间段为车辆的营运时间,并将营运时间划分为若干个相等的时间间隔,求得每一个时间间隔中落入的刷卡数据,找到某个时间间隔刷卡时间点最多的时间中点为特征站点时间;然后,根据车辆到离站时间求出该车辆每一个站点的时间,计算出特征站点时间与每一个站点时间的时间之差构成时间差集合。最后,从时间差集合中找到与特征站点时间最匹配的时间差即为公交车到离站时间和乘客刷卡时间的时间差,对刷卡时间数据加上此时间差进行时间修正并与每个站点进行匹配,即可得到乘客的上车站点。

具体流程如下:

步骤一:从后台服务器中获取公交车车辆到离站时间数据和乘客刷卡时间数据,由于公交车车辆每一趟的首站只有离站时间,而末站只有到站时间,故需要加上公交车车辆首站的到站时间和末站的离站时间,根据公交车实际运营的情况,这里设置为首站往前推一分钟,末站往后推一分钟,以构成完整的到离站时间间隔。

步骤二:将公交车每天营运的第一趟首站到站时间和末站离站时间整个时间段为车辆的营运时间,并将营运时间划分为若干个相等时间间隔的时间段,经过车辆的实际数据多次测试,每个相等时间间隔的取值可以为车辆到离站时间间隔的平均值。

步骤三:将刷卡时间数据与每一个时间段匹配并得出每一个时间段里的刷卡时间数,找到刷卡时间点最多的时间段,并以该时间段的中点为特征站点时间,直到所有的时间段遍历完。

步骤四:根据车辆到离站时间求出该车辆每个站点的时间,站点的时间为该站点的到站时间与离站时间的时间中电,并将步骤三中求得的特征站点时间与每个站点时间的差值求得δt的集合。

步骤五:将刷卡时间数据加上δt与站点到离时间进行匹配,并计算出对应的δt的匹配率,直到δt遍历完,输出最大的匹配率以及此时的δt

步骤六:将步骤五得到的δt对刷卡时间数据进行时间修正并与站点时间进行匹配,从而得到乘客的上车站点。

本发明的一种基于公交到离站的乘客ic卡数据与站点匹配方法,可以不需要公交车gps数据信息,在公交车站点时间数据与乘客刷卡时间数据不一致的情况下,以落入到某个时间间隔最多的刷卡时间点的中点为特征站点时间,根据公交车车辆的智能终端设备收集到的车辆到离站时间数据和乘客刷卡时间数据进行匹配,当乘客刷卡时间数据较少且稀疏的情况下也能获得较高的匹配率,并可以减少其他基于k-means、dbscan等聚类算法的方法由于参数的选择带来的误差,符合现代城市公交车生产营运的实际情况。同时,该方法也可以为城市公交出行数据挖掘如公交出行od推算,站点客流预测等提供基础数据,为智慧公交做准备。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1