一种基于ic卡数据的公交串车预测方法_2

文档序号：9453991阅读：来源：国知局

[0049] 如图1所示，两辆相邻车次公交车VI和V2在同一个线路行驶的过程中分为两种情况：情况1 :没有公交串车的理想状态：首先在9点02分的时候，公交车VI和V2分别在第1站点和第4站点；在9点18分的时候，公交车VI和V2分别到达了第5站点和第8站点；然后在9点24分的时候，VI到达了第7站点，V2到达了第10站点。两个公交车VI和 V2-直保持着三站左右的距离，在各个站点等待的乘客数量也基本比较平均，没有相遇情况，没有发生串车情况。
[0050] 情况2:公交串车状态：首先在9点02分的时候，公交车VI和V2分别在第一站点和第4站点，各个站点等待的乘客基本比较平均；在9点10的时候，VI到达第3站点，V2到达第5站点和第6站点之间，两列公交车距离开始拉近，V2行驶比较慢，到达站点比较晚，在第6站点之后站点等待的乘客数量增加；9点13分的时候，VI到达第4站点，V2马上到达第6站点；然后在9点19分的时候，VI到达第6站点，V2刚驶出第7站点，两列公交车距离非常接近；最后在9点34分的时候，VI和V2在第10站点相遇，而在下一站第11站等待的乘客数量非常大，发生了公交串车情况。这就说明一个滚雪球效应，一列公交车V2延迟增加下一站乘客的数量，也增加了停车延误时间，显然，这也增加了总线的延迟。另一方面，下一列公交车VI的乘客将会减少，也减少了停车延误时间，没有延迟。
[0051] 预测的评价指标的定义如下：
[0052] 对于公交串车这样有两个类别的分类问题，将样本分为串车情况，用1表示，和不串车情况，用〇表示。对一个串车二分问题来说，如果一个样本是串车1并且也被预测成串车1，这个样本就是一个正确的串车数量；相应地，一个样本是不串车〇被预测成不串车〇，这个样本就是一个正确的不串车数量；
[0053] 下面预测指标，常常用于评价分类算法的性能：
[0054]
[0055]
[0056] (1)准确率 'k丨升*u j At"丨.n u .丨.，wiau u j Hra u，丨丁，卞'、ujh Hra的串车样本和正确的不串车样本）所占比例。
[0057] (2)正确串车率：计算的是正确的串车样本占所有串车样本的比例。
[0058] 本实施例中，为了方便本发明的参数理解及算法体现，对六个步骤中的具体基础数据进行具体说明。
[0059] 公交1C卡数据有北京市XX公司提供，公交1C卡数据包括车次标识、线路标识、站点标识、到站时间和上下车客流量、记录号，交易类型，交易序号，交易日期，交易时间，SAM 卡号，城市号，卡发行号，卡类型，线路号，车辆号，上车站，下车站，司机号和卡号等信息。以北京市XX公司XX路公交车到达某两个目标站点SA，SB为例，四个月的车次标识、站点标识、到站时间和上、下车客流量基础数据如表1和表2 :
[0060] 表1 :北京市XX公司XX路公交车到达第一个目标站点SA的基础数据
[0061]
[0062]

[0063] 表2 :北京市XX公司XX路公交车到达第二个目标站点SB的基础数据
[0064]
[0065] CN 105206040 A IXm -f} 9/11 页
[0066]
[0067] 数据处理主要包括以下几步：
[0068] 1、去除异常点。
[0069] 首先处理数据是按照一天数据进行筛选的，例如提取某一天的基础数据，第二个站点的车次标识、到站时间和上下车客流量要按照第一个站点的车次顺序排列，求得两个站点的旅行时间，根据两个站点的站间距，且知道国家规定的公交车最高车速，可以得出旅行时间是一个正值并且大于某一个定值，所以剔除不符合要求的数据，包括车次标识、到站时间和上下车客流量等信息；
[0070] 然后计算相邻两个车次的车头时距，即Headway，由于第一步中剔除了不符合要求的数据，所以有一些车次不相邻，那只能计算上一个Headway和下一个Headway ;
[0071] 2、输入变量。
[0072] 要实时的预测当前车次到达下一目标站点SB的公交串车情况，相关因素就包括相邻的上一个车次在站点SA的到站时间和上下车人数，在下一站点SB的到站时间和上下车人数，以及本车次在上一站点SA的到站时间和上下车人数。
[0073] 作为输入变量的因素有8个，包括两个目标站点的旅行时间，当前车次在第一目标站点相邻两个车次之间的车头时距，上一车次和当前车次分别在第一目标站点的上下车人数，以及上一车次在第二目标站点的上下车人数。
[0074] 3、输出变量。
[0075] 本发明基于1C卡数据预测公交串车情况，作为输出变量的因素有1个，即公交串车情况，若本车次在下一站点SB发生串车，记为1，若没有发生串车，记为0。
[0076] 以北京市XX公司XX路公交车到达某两个目标站点SA，SB为例，四个月处理后的基础数据，包括8个输入变量和1个输出变量，还有日期如下表3所示：
[0077] 表 3
[0078]
[0079]
[0080] 本发明基于公交1C卡数据预测公交串车情况，采用的算法是最小二乘支持向量机（Least Squares Support Vector Machines，LS-SVM)，米用的工具是 MATLAB 2013b，选取前三个月（20120702-20120930)的数据作为训练数据，后一个月（20121001-20121029) 的数据作为测试数据，通过预算最后得出预测结果如下表4所示：
[0081] 表4预测结果
[0082]
[0083]本发明基于1C卡数据的公交串车预测方法，预测精度高，准确率达93. 77%。可以实时的预测本车次在下一目标站点的公交串车情况，使公交乘客及时地了解公交运行现状，合理安排出行时间，提高出行效率；同时公交运营部门也可以通过此预测结果适当的调度公交车，调整发车间隔，避免公交串车情况发生，提高了公交的服务水平和服务质量。
【主权项】
1. 一种基于IC卡数据的公交串车预测方法，其特征在于：包括W下步骤，第一步，公交车IC卡数据采集：通过3G传输网络实时获取公交车IC卡刷卡信息，所述的公交车IC卡数据包括车次标识、线路标识、站点标识、到站时间、日期和上下车客流量信息；从上述采集到的IC卡数据中选取一条易发生串车的公交线路，在此条公交线路的基础上找寻相邻两个目标站点，并进一步提取每天经过上述两个目标站点的公交车车次W及每个车次到达运两个目标站点的到站时间和上下车人数；第二步，数据处理：需要做车次标识的匹配，将两个目标站点车次标识不对应的数据作为错误数据剔除，同时与车次标识对应的站点标识、到站时间和上下车客流量信息也相应剔除，只保留两个目标站点具有相同车次标识的数据；第=步，实际公交串车情况检测：在两个目标站点具有相同车次标识的情况下，第二个目标站点按照第一个目标站点的车次顺序排列得到两相邻车次的车头时距，若求得的车头时距为正，则说明没有串车情况，记为O;若求得的车头时距为负或者为0,则说明发生了串车情况，记为1 ; 第四步，训练学习数据：要实时的预测当前车次到达第二个目标站点的公交串车情况，相关因素就包括相邻的上一个车次在第一个目标站点的到站时间和上下车人数、在第二个目标站点的到站时间和上下车人数，W及当前车次在第一个目标站点的到站时间和上下车人数；作为训练学习中的输入因素包括两个目标站点的旅行时间、相邻两个车次在第一个目标站点之间的车头时距、相邻上一个车次和当前车次分别在第一个目标站点的上下车人数、W及相邻上一个车次在第二个目标站点的上下车人数；作为输出变量的因素只有1个，即公交串车情况；先提取每一天的小样本数据，然后按时间顺序组成一个大样本数据，按照训练集和测试集3:1的样本数据比例选出训练集；第五步，公交串车预测：采用最小二乘支持向量机算法预测公交串车情况，根据第四步中选取的训练集建立预测模型对当前车次到达第二个目标站点的公交串车情况进行预测，得到预测值。2. 根据权利要求1所述的一种基于IC卡数据的公交串车预测方法，其特征在于，第= 步中所述的第一个目标站点定义为两个相邻的目标站点中先到达的站点，所述的第二个目标站点定义为两个相邻的目标站点中后到达的站点。3. 根据权利要求1所述的一种基于IC卡数据的公交串车预测方法，其特征在于，第= 步中所述的两相邻车次的车头时距，就是当前车次在某一个目标站点的到站时间与相邻上一车次在同一个目标站点的到站时间的差值。4. 根据权利要求1所述的一种基于IC卡数据的公交串车预测方法，其特征在于，第四步中所述的两个目标站点的旅行时间，就是在车次标识对应的情况下，当前车次在第二个目标站点的到站时间和第一个目标站点的到站时间的差值。5. 根据权利要求1所述的一种基于IC卡数据的公交串车预测方法，其特征在于，第五步中所述的预测模型表示为/(X) =i>A(x，x,?) + /，，其中选择径向基函数作为核函数，表示 ./=1. 为；a1为拉格朗日乘子a的数组元素，且《 = bi), 偏移量其中矩阵'核函数矩阵Q=K(Xi，x,)。6.根据权利要求5所述的径向基核函数K(x，Xi)中参数O采取K交叉验证方式来确定，具体过程为：步骤曰，选定O初值，O= 0.01 ; 步骤b，建立LS-SVM模型；步骤C，将选出的训练集分成k份相等的子集，每次将其中k-1份数据作为训练数据，而将另外一份数据作为测试数据；运样重复k次，根据k次迭代后得到的MSE平均值来估计期望泛化误差，最后选择一组最优的参数值，并作为核函数K(X，Xi)的参数O。
【专利摘要】本发明公开了一种基于IC卡数据的公交串车预测方法，属于公共交通信息处理技术领域。所述预测方法包括公交车IC卡数据采集、数据处理、实际公交串车情况检测、训练学习数据和公交串车预测，其中公交串车预测采用最小二乘支持向量机(LS-SVM)算法。本发明结合公交IC卡数据，针对多辆车次，提取大量的乘客信息，不需要车载GPS系统，方便快捷，降低了数据处理成本；同时采用最小二乘支持向量机方法能够更好更快更有效地实现公交串车预测，使乘客能够更好地了解公交运行情况，合理调控出行时间，使公交运营部门也能够及时调整公交发车间隔，提升公交服务水平；本发明处理数据简单，成本低，且有较高预测精度。
【IPC分类】G08G1/00, G06Q10/04
【公开号】CN105206040
【申请号】CN201510483302
【发明人】马晓磊, 陈栋伟, 于海洋
【申请人】北京航空航天大学
【公开日】2015年12月30日
【申请日】2015年8月7日

完整全部详细技术资料下载

当前第2页1 2