一种基于公共交通多源数据融合的ic卡刷卡站点匹配方法_2

文档序号:9810664阅读:来源:国知局
缺失站点标识码相匹配是指,统计各个站点缺失时间区间对应的缺失站点标识码数量;采用如下两种方式之一进行匹配:
[0026]一、缺失站点标识码数量仅为一个,将缺失站点标识码与属于站点缺失时间区间的失效簇中的IC卡号相匹配;
[0027]二、缺失站点标识码数量为两个以上,采用聚类算法将失效刷卡校正时间戳进行处理形成若干个失效簇,失效簇数量与缺失站点标识码数量相同;将缺失站点标识码按次序与失效簇一一对应,以实现缺失站点标识码与失效簇对应的IC卡号相匹配。
[0028]所述Δ取值范围为:Δ
^ tmargino
[0029]优选的方案是,所述Uargin取值范围为:90s < tmargin< 120s。
[0030]与现有技术相比,本发明具有如下优点与有益效果:
[0031]1、本发明IC卡刷卡站点匹配方法,以刷卡系统和GPS行车记录系统为基础,实现刷卡记录和报站记录相互匹配,有利于后续统计客流量并进行数据挖掘;不需要调整、更改和添加硬件设备,可节省成本;
[0032]2、本发明IC卡刷卡站点匹配方法以匹配成功率和辅助条件为评价体系;通过搜索最大匹配成功率来获取最优时间推移量,可避免由于站点信息缺失带来的误差导致搜索过程进入死循环;辅助条件是指通过判断匹配测试成功率rt与最大匹配成功率的大小来判别是否遇到噪声点,可避免获取错误的最优时间推移量,可提高算法的准确程度;
[0033]3、本发明IC卡刷卡站点匹配方法有效降低运算量,加快运算速度,有利于快速获取最优时间推移量,有利于算法的推广和应用;
[0034]4、本发明IC卡刷卡站点匹配方法可解决站点信息缺失而无法进行IC卡刷卡匹配的问题;有效实现IC卡号与站点缺失时间区间对应的缺失站点标识码相匹配,有利于对缺失信息的站点进行客流量统计。
【附图说明】
[0035]图1是本发明IC卡刷卡站点匹配方法的整体工作流程图;
[0036]图2是本发明IC卡刷卡站点匹配方法中基于自适应随机搜索算法获取最佳时间推移量的流程图;
[0037]图3是以某一天某线路某公交车为例计算所得的时间推移量与匹配成功率图对应表。
【具体实施方式】
[0038]下面结合附图与【具体实施方式】对本发明作进一步详细的描述。
[0039]实施例
[0040]—种基于公共交通多源数据融合的IC卡刷卡站点匹配方法,其流程如图1和图2所示,包括以下步骤:
[0041]第一步,获取刷卡系统中待匹配公交车的刷卡记录,刷卡记录包括IC卡号和刷卡时间戳;对刷卡时间戳进行处理获得刷卡时间样本集合;
[0042]获取GPS行车记录系统中待匹配公交车的报站记录,报站记录包括站点标识码a、进站时间戳tja和出站时间戳tca;分别获取各个站点标识码的停站时间区间[tja_tmargin,tca+tmargin];其中,Uargin为刷卡站点匹配算法允许的时间误差量;用户可自行设置Uargin的值;优选地,90s < ?margin ^ 120s;
[0043]第二步,设定时间推移量解空间;在时间推移量解空间中生成第一批k个时间推移量t^t,...315;第一批1^个时间推移量。32,...,tk为自动随机生成;
[0044]第三步,分别按时间推移量t^ts,...,tk对刷卡时间样本集合进行时间推移,得到k个刷卡时间样本推移集合;依次判断k个刷卡时间样本推移集合中的各元素是否属于任一个停站时间区间[t ja-tmargin,tCa+tmargin]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;分别计算k个刷卡时间样本推移集合中匹配成功的元素数量占元素总数的比率,获得匹配成功率n,r2,...,rk;
[0045]比较k个匹配成功率ri,r2,...,rk的大小,获得最大值并记录为最大匹配成功率rm;其中,m < k;并将rm对应的时间推移量记录为tm;
[0046]第四步,计算rm对应的时间推移测试量tt:tt = tm土 a ;其中,A为偏移测试值,Δ< tmargin ;将刷卡时间样本集合按时间推移测试量tt进行时间推移,得到刷卡时间样本测试集合;判断刷卡时间样本测试集合中的各元素是否属于任一个停站时间区间[tja_tmargln,tCa+tmargln]:若属于,则判定该元素匹配成功;否则判定该元素匹配不成功;计算刷卡时间样本测试集合中匹配成功的元素数量占元素总数的比率,获得匹配测试成功率rt;
[0047]第五步,判断匹配测试成功率rt与最大匹配成功率rm的大小:若rt = rm,则判定U为最优时间推移量,跳至第六步;否则将rm进行衰减;在时间推移量解空间中生成下一批k个时间推移量,tit,...,tk,跳至第三步;
[0048]第六步,按最优时间推移量将所有刷卡时间戳进行时间推移,获得刷卡校正时间戳,以消除刷卡时间戳与报站时间戳的时间误差;将刷卡校正时间戳与停站时间区间[tja_tmargin,tca+tmargin]进行匹配,以实现IC卡号与站点标识码a之间的匹配。
[0049]其中,时间推移量解空间为用户自行设定,例如设定为-3600s?+3600s。Δ也是用户自行设定,只需要满足A < ?margin, 例如Δ =1s0
[0050]本发明IC卡刷卡站点匹配方法,以刷卡系统和GPS行车记录系统为基础,实现刷卡记录和报站记录相互匹配,有利于后续统计客流量并进行数据挖掘。本发明IC卡刷卡站点匹配方法的原理是,在同一天同一线路同一公交车中,GPS行车记录系统与刷卡系统之间的时间差保持恒定,从而可通过寻找最优时间推移量来消除GPS行车记录系统与刷卡系统之间的时间差;消除时间差后,可将刷卡校正时间戳对应的IC卡号与对应的站点标识码a相匹配,从而可得知该刷卡记录发生的站点。本发明IC卡刷卡站点匹配方法采用自适应随机搜索策略,可加快运算速度。
[0051]本发明IC卡刷卡站点匹配方法以匹配成功率和辅助条件为评价体系。通过搜索最大匹配成功率来获取最优时间推移量,可避免由于站点信息缺失带来的误差导致搜索过程进入死循环。辅助条件是指通过判断匹配测试成功率rt与最大匹配成功率的大小来判别是否遇到噪声点,可避免获取错误的最优时间推移量,可提高算法的准确程度。例如图3是以某一天某线路某公交车为例计算所得的时间推移量与匹配成功率图对应表,最优时间推移量应该位于A处,B处为噪声点,通过辅助条件可将B排除。
[0052]优选地,所述第一步中,对刷卡时间戳进行处理获得刷卡时间样本集合是指,利用聚类算法对刷卡时间戳进行处理形成若干个时间簇,将每个时间簇中最早的刷卡时间戳形成刷卡时间样本集合。采用聚类算法形成刷卡时间样本集合来寻找最佳时间推移量,可极大降低运算量,有利于算法的推广和应用。
[0053]所述第五步中,在时间推移量解空间中生成下一批k个时间推移量,t^ts,...,tk是指,采用遗传算法或差分进化算法或粒子群算法在时间推移量解空间中生成下一批k个时间推移量,t^ts,...,tk。采用遗传算法或差分进化算法或粒子群算法,形成自适应随机搜索,有效降低运算量,加快运算速度,有利于快速获取最优时间推移量。优选地,在第三步中应记录已计算的时间推移量和对应的匹配成功率,在第五步中,生成下一批时间推移量时应避免选取已计算的时间推移量。
[0054]所述第六步中,将刷卡校正时间戳与停站时间区间[tj a-tmargin,tCa+tmargin ] 5?匹配是指,判断各个刷卡校正时间戳是否属于任一个停站时间区间[t ja-tmargin,tCa+tmargin]:若属于,则将该刷卡校正时间戳对应的IC卡号与停站时间区间[t ja_tmargin,tca+tmargin]对应的站点标识码a相匹配;否则将该刷卡校正时间戳记录为失效刷卡校正时间戳。
[0055]第六步之后还包括:
[0056]第七步,获取GPS行车记录系统中待匹配公交车的站点缺失信息表;站点缺失信息表包括发生站点缺失前一正常站点的出站时间戳、站点缺失结束后第一个正常站点的进站时间戳,
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1