一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法

文档序号:9810664阅读:925来源:国知局
一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法
【技术领域】
[0001]本发明涉及智能化公共交通技术领域,更具体地说,涉及一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法。
【背景技术】
[0002]近年来,公交IC卡得到了广泛应用,提高了持卡乘客的上车效率和支付的便捷性。随着持卡乘客数量的增加,公交IC卡的刷卡记录成为低成本获取客流信息的新途径,受到了国内外公交研究者的高度关注。
[0003]当前,针对刷卡记录较为热门的应用有:在指定的一个或多个时间尺度下,针对特定线路,获取每个站点的上车客流量、下车客流量以及站点之间的OD客流量;针对指定的某些线路,获取其各站点之间的换乘客流量;针对特定区域内的所有线路,获取其各站点的上车客流量、下车客流量以及站点之间的OD客流量;针对特定区域内的所有线路,可以按照另行划定的交通小区,获取各小区的上车客流量、下车客流量以及小区之间的OD客流量。由此可见,刷卡记录对数据统计、挖掘和分析有重要作用。
[0004]但是,刷卡系统往往将设计重点放在运营清分功能上,而忽视记录刷卡站点。因此,在上述数据处理过程中,往往需要先要将刷卡记录结合GPS行车记录系统的报站记录进行时间匹配来推断刷卡站点。现阶段国内大部分城市公交运营公司,GPS(或北斗)行车记录系统(AVL系统)与刷卡系统(AFC系统)相互独立,没有时间同步机制,不可避免产生时间误差,严重者可能超过30min。时间误差对刷卡站点匹配及其它数据挖掘精度带来严重影响。
[0005]此外,刷卡站点匹配还存在着另一个需要解决的问题:由于GPS(或北斗)行车记录系统中的GPS(或北斗)接收机信号受到城市建筑物阴影或恶劣天气的影响,定位失败,造成站点信息缺失,直接导致刷卡记录无法与站点匹配。

【发明内容】

[0006]本发明的目的在于克服现有技术中的缺点与不足,提供一种基于公共交通多源数据融合、既不需要调整和更改设备也不需要添加设备、运算量少、运算速度快的IC卡刷卡站点匹配方法。IC卡刷卡站点匹配方法可有效实现IC卡号与刷卡发生站点相互匹配,有利于客流量统计和数据挖掘。
[0007]为了达到上述目的,本发明通过下述技术方案予以实现:一种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其特征在于,包括以下步骤:
[0008]第一步,获取刷卡系统中待匹配公交车的刷卡记录,刷卡记录包括IC卡号和刷卡时间戳;对刷卡时间戳进行处理获得刷卡时间样本集合;
[0009]获取GPS行车记录系统中待匹配公交车的报站记录,报站记录包括站点标识码a、进站时间戳tja和出站时间戳tca;分别获取各个站点标识码的停站时间区间[tja_tmargin,tCa+tmargin];其中,tmargin为刷卡站点匹配算法允许的时间误差量;
[0010]第二步,设定时间推移量解空间;在时间推移量解空间中生成第一批k个时间推移量tl,t2,...,tk;
[0011]第三步,分别按时间推移量t^ts,...,tk对刷卡时间样本集合进行时间推移,得到k个刷卡时间样本推移集合;依次判断k个刷卡时间样本推移集合中的各元素是否属于任一个停站时间区间[t ja-tmargin,tCa+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;分别计算k个刷卡时间样本推移集合中匹配成功的元素数量占元素总数的比率,获得匹配成功率n,r2,...,rk;
[0012]比较k个匹配成功率ri,r2,...,rk的大小,获得最大值并记录为最大匹配成功率rm;其中,m < k;并将rm对应的时间推移量记录为tm;
[0013]第四步,计算rm对应的时间推移测试量tt:tt=tm土A ;其中,A为偏移测试值;将刷卡时间样本集合按时间推移测试量tt进行时间推移,得到刷卡时间样本测试集合;判断刷卡时间样本测试集合中的各元素是否属于任一个停站时间区间[tja-Uargin,tca+Uargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;计算刷卡时间样本测试集合中匹配成功的元素数量占元素总数的比率,获得匹配测试成功率rt;
[0014]第五步,判断匹配测试成功率rt与最大匹配成功率rm的大小:若rt = rm,则判定U为最优时间推移量,跳至第六步;否则将rm进行衰减;在时间推移量解空间中生成下一批k个时间推移量,tit,...,tk,跳至第三步;
[0015]第六步,按最优时间推移量将所有刷卡时间戳进行时间推移,获得刷卡校正时间戳,以消除刷卡时间戳与报站时间戳的时间误差;将刷卡校正时间戳与停站时间区间[tja-tmargin,tCa+tmargin]进行匹配,以实现IC卡号与站点标识码a之间的匹配。
[0016]本发明IC卡刷卡站点匹配方法,以刷卡系统和GPS行车记录系统为基础,实现刷卡记录和报站记录相互匹配,有利于后续统计客流量并进行数据挖掘。本发明IC卡刷卡站点匹配方法的原理是,在同一天同一线路同一公交车中,GPS行车记录系统与刷卡系统之间的时间差保持恒定,从而可通过寻找最优时间推移量来消除GPS行车记录系统与刷卡系统之间的时间差;消除时间差后,可将刷卡校正时间戳对应的IC卡号与对应的站点标识码a相匹配,从而可得知该刷卡记录发生的站点。本发明IC卡刷卡站点匹配方法采用自适应随机搜索策略,可加快运算速度。
[0017]本发明IC卡刷卡站点匹配方法以匹配成功率和辅助条件为评价体系。通过搜索最大匹配成功率来获取最优时间推移量,可避免由于站点信息缺失带来的误差导致搜索过程进入死循环。辅助条件是指通过判断匹配测试成功率rt与最大匹配成功率的大小来判别是否遇到噪声点,可避免获取错误的最优时间推移量,可提高算法的准确程度。
[0018]进一步的方案是,所述第一步中,对刷卡时间戳进行处理获得刷卡时间样本集合是指,利用聚类算法对刷卡时间戳进行处理形成若干个时间簇,将每个时间簇中最早的刷卡时间戳形成刷卡时间样本集合。采用聚类算法形成刷卡时间样本集合来寻找最佳时间推移量,可极大降低运算量,有利于算法的推广和应用。
[0019]所述第五步中,在时间推移量解空间中生成下一批k个时间推移量,t^ts,...,tk是指,采用遗传算法或差分进化算法或粒子群算法在时间推移量解空间中生成下一批k个时间推移量,t^ts,...,tk。采用遗传算法或差分进化算法或粒子群算法,有效降低运算量,加快运算速度,有利于快速获取最优时间推移量。
[0020]所述第六步中,将刷卡校正时间戳与停站时间区间[tj a-tmargin,tCa+tmargin ] 丁匹配是指,判断各个刷卡校正时间戳是否属于任一个停站时间区间[t ja-tmargin,tCa+tmargin]:若属于,则将该刷卡校正时间戳对应的IC卡号与停站时间区间[t ja_tmargin,tca+tmargin]对应的站点标识码a相匹配;否则将该刷卡校正时间戳记录为失效刷卡校正时间戳。
[0021]第六步之后还包括:
[0022]第七步,获取GPS行车记录系统中待匹配公交车的站点缺失信息表;站点缺失信息表包括发生站点缺失前一正常站点的出站时间戳、站点缺失结束后第一个正常站点的进站时间戳,以及发生站点缺失前一正常站点的出站时间戳至站点缺失结束后第一个正常站点的进站时间戳之间的站点缺失时间区间对应的缺失站点标识码;
[0023]将所述失效刷卡校正时间戳与所述站点缺失时间区间相匹配,以实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配。本发明IC卡刷卡站点匹配方法可解决站点信息缺失而无法进行IC卡刷卡匹配的问题;有效实现IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配,有利于对缺失信息的站点进行客流量统
i+o
[0024]所述第七步中,获取GPS行车记录系统中待匹配公交车的站点缺失信息表是指,将待匹配公交车的报站记录按上行路线和下行路线进行分割形成子集;遍历子集获取GPS行车记录系统中待匹配公交车的站点缺失信息表。
[0025]所述第七步中,实现失效刷卡校正时间戳对应的IC卡号与站点缺失时间区间对应的
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1