一种公交设备匹配方法与流程

文档序号:17446550发布日期:2019-04-17 05:43阅读:457来源:国知局
一种公交设备匹配方法与流程

本发明属于智能交通系统技术领域,涉及一种公交数据的统计方法,特别是一种公交设备匹配方法,用于城市公交数据同化处理和智能公交系统,能够有效统计公交客流数据。



背景技术:

公交客流量是城市公交网络规划和管理的重要数据,能够挖掘公交客流的时空分布规律,有助于公交线路的管理、调度和优化。随着公交ic卡收费系统的普及,不仅方便了市民出行支付乘坐公交,也为公交系统收集客流信息提供了高效的途径。通常情况下,可以通过公交车gps数据和ic打卡数据的结合获取市民出行客流od,这一方面已经有了成熟的方法和分析成果。如舒国辉、戴霄利用公交调度时间表与乘客刷卡时间进行匹配得到乘客上车站点,下车站点利用两站点模型和站点吸引规律推断乘客下车站点。徐建闽等人对ic打卡数据和gps数据进行融合,在总量控制的条件下推导公交od。

然而,由于某些城市在ic卡收费系统建设时未考虑获取客流的分析应用,导致在ic打卡数据中缺少一些关键信息,造成数据获取困难,为客流的深度挖掘带来很大难度。例如,ic打卡数据中没有记录车辆编号,且其中的设备编号等与公交车gps数据中的车辆编号没有记录对应关系。在这种情况下,无法直接通过ic打卡时间对应gps到离站时间来确定乘客上车站点。近年来,围绕基于公交ic卡数据的上车站点推算开展了大量研究工作。针对无gps数据下单一票制的公交车上车站点推算问题,戴宵等提出了对公交卡乘客的刷卡时间进行聚类分析判断乘客上车站点的方法,郭婕等在对上车站点进行聚类分析的基础上,重点分析了相邻车站的时间间隔,于勇等结合公交运营调度时刻表所提供的车辆及其发车信息,推算各车次到达各站点的时间,提高了上车站点推算精度。针对具有gps数据情况,陈君、杨东援将公交ic卡数据与公交gps数据进行关联,结合调度数据推算公交ic卡乘客上车站点.徐建闽等利用公交gps定位数据和gis电子地图中的车站位置获取公交车的到站地点。但以上研究在数据不完整情况下准确率难以保证。

基于此,本发明寻求设计提供一种公交设备匹配方法,该方法能够基于公交时间数据,针对缺少对应关系的不同公交设备进行关联同化,填补公交数据的缺失,进而进行车辆关联、客流计算和公交分析优化等。



技术实现要素:

本发明的目的在于针对目前各部分公交数据缺少设备对应关系、难以结合使用的问题,提出一种公交设备匹配方法。该方法通过分析记录在公交设备中的数据的时间分布相似性进行公交设备的关联同化。通过gps数据和ic数据,计算出公交gps设备和ic打卡设备的对应关系,进而为计算乘客信息和智能公交系统提供数据支持。

为实现上述目的,本发明涉及的公交设备匹配方法的实现思路是利用不同设备数据的时间分布相似性,来确定设备间的对应关系。一般来说,虽然两种设备之间缺少对应关系,但这两份数据记录了同一辆公交车的行驶行为,因此两种设备的数据分布越相似,它们越有可能对应同一辆车。具体设置方法按照以下步骤进行:

(1)、采集乘客打卡的历史数据:

采集通过公交车ic卡系统收集乘客上车打卡的历史数据,所述历史数据包括打卡设备的每一次打卡记录:打卡设备编号、线路编号、线路名称、卡号、交易日期和时间;

(2)、采集公交到离站gps的历史数据:

采集通过公交车gps定位系统收集的到离站历史数据,所述历史数据包括gps定位设备的每一次到离站记录:gps设备编号、线路编号、线路名称、停靠站点、到站时间、离站时间;

(3)、匹配候选集的生成:

若打卡设备和gps定位设备对应同一辆公交车,则第一次打卡时间和发车时间必然在时间上相近,若某打卡设备p中首次打卡时间出现在某gps定位设备q的首次发车时间之后δt之内,才认为车辆p和q有可能为同一车辆,这样可以从gps定位设备中找出候选的打卡设备集合,δt取值建议为1小时;

(4)、时间分布相似性的计算:

正常情况下乘客打卡时间应处于公交车到站时间之后,离站时间之前,但也会出现由于车内拥挤等原因,乘客打卡延迟的情况,另外考虑到数据上传过程中某些延迟情况,对gps数据中的到离站时间进行如下处理:

其中,tk为处理后的站点k的到离站时间,为原始到站时间,为原始离站时间,δt1为数据质量调整阈值,取值范围为4-6秒,δt2为打卡延迟调整阈值,取值范围为8-12秒;

同一辆车的乘客打卡时间应落在公交车到离站的时间区间内,令为线路li的打卡设备p与gps设备q之间的关联率,关联率越高,p和q越有可能对应同一辆车,关联率定义为:

(5)、关联结果的获取

通过步骤(3)、(4),我们可以由一天的数据获得打卡设备p与gps设备q为同一辆车,为了避免偶然性,同一车辆的打卡设备号和gps设备号一定会在多天数据中出现关联,结合各天数据,取设备匹配结果的众数,即可得到打卡设备和gps设备的对应关系。

本发明与现有技术相比,取得的有益效果如下:

针对缺少车辆对应关系的问题,提出了依据乘客打卡时间与公交车到离站时间重叠性的关联率进行车辆匹配的算法,得到了车辆关联关系。解决了以青岛市为例的部分城市由于ic卡数据质量原因不能对公交数据进行后续客流挖掘的困难,弥补了公交数据的不足,使数据满足使用要求,为公交系统的管理、分析和优化提供了数据保障,且达到了良好的实用效果。

附图说明:

图1为本发明涉及的算法流程图。

具体实施方式:

下面通过实例并结合附图对本发明进一步说明。

实施例1:

本实施例涉及的一种公交支线设置方法通过如下技术方案实现:

(1)、采集乘客打卡的历史数据:

采集通过公交车ic卡系统收集乘客上车打卡的历史数据,所述历史数据包括打卡设备的每一次打卡记录:打卡设备编号、线路编号、线路名称、卡号、交易日期和时间;

(2)、采集公交到离站gps的历史数据:

采集通过公交车gps定位系统收集的到离站历史数据,所述历史数据包括gps定位设备的每一次到离站记录:gps设备编号、线路编号、线路名称、停靠站点、到站时间、离站时间;

(3)、匹配候选集的生成:

若打卡设备和gps定位设备对应同一辆公交车,则第一次打卡时间和发车时间必然在时间上相近,若某打卡设备p中首次打卡时间出现在某gps定位设备q的首次发车时间之后δt之内,才认为车辆p和q有可能为同一车辆,这样可以从gps定位设备中找出候选的打卡设备集合,δt取值建议为1小时;

(4)、时间分布相似性的计算:

正常情况下乘客打卡时间应处于公交车到站时间之后,离站时间之前,但也会出现由于车内拥挤等原因,乘客打卡延迟的情况,另外考虑到数据上传过程中某些延迟情况,对gps数据中的到离站时间进行如下处理:

其中,tk为处理后的站点k的到离站时间,为原始到站时间,为原始离站时间,δt1为数据质量调整阈值,建议为5秒左右,δt2为打卡延迟调整阈值,建议为10秒左右;

同一辆车的乘客打卡时间应落在公交车到离站的时间区间内,令为线路li的打卡设备p与gps设备q之间的关联率,关联率越高,p和q越有可能对应同一辆车,关联率定义为:

(5)、关联结果的获取

通过步骤(3)、(4),我们可以由一天的数据获得打卡设备p与gps设备q为同一辆车,为了避免偶然性,同一车辆的打卡设备号和gps设备号一定会在多天数据中出现关联,结合各天数据,取设备匹配结果的众数,即可得到打卡设备和gps设备的对应关系。

实施例2

本实施例使用青岛市公交gps和ic打卡数据进行了实证分析,数据来源于青岛公交集团和青岛交运集团。数据的时间范围为2017年3月14日-18日、9月11日-17日。使用上述算法步骤,得到的部分gps定位设备和ic打卡设备对饮关系如表1所示:

表19月11日-17日的321路公交线路设备匹配结果

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1