一种基于GPS数据的公交准点预测方法与流程

文档序号:12606622阅读:596来源:国知局
本发明涉及公共交通信息处理
技术领域
,具体地说是一种基于GPS数据的公交准点预测方法。
背景技术
:城市公共交通系统是一个人、车、路、信息与规则动态交互作用的复杂系统,是城市的生命线,承载着城市的日常运行,因此,一个稳定、高效的道路交通系统对城市至关重要。畅通、可靠的城市交通运行状态不仅是出行者实现出行目的的基础,也是城市交通管理者的目标。但是城市交通系统在运行时,常常受到恶劣天气、交通时间、交通事故等随机因素的干扰,增加出行者出行过程中的不确定性,降低了道路设施的通行能力,进而使得出行者的目的无法实现,并使城市交通系统整体的运行状态失控。服务可靠性是乘客判断城市公共交通服务质量普遍关心的指标,准点率又是目前国内最常用最直观的服务可靠性指标。准点率越高公共交通发展水平越高,对人们的吸引力越大,其发展水平越高,因此研究城市公共交通的准时性,提高公共交通的准点率,不但对行人出行提供安全、准点、方便、快捷、舒适的服务有着重要的意义,对于运营组织经济效益的提高,运营成本的降低还有对于城市资源优化配置及其城市的发展都有着不可忽视的意义。对于公交准点的研究我国起步较晚,但也积累了一些理论成果。学者们利用可靠性理论,将可靠性相关判断指标移植到公共交通领域,提出公交运行可靠性判断方法,结合实例并进行详细论述。在站点、站间准点的建模上,国内成果较少。大部分只从一个角度考虑,或从乘客角度出发,或从运营管理者角度出发,没有一个结合出行者和运营者两个角度提出提高公交准点的方法。目前关于公交准点的研究主要集中在行程时间可靠度和公交全程准时性方面,较少对公交在各站点间的运行情况进行细致研究。而且,在分析公交行程时间时,以往多采用人工实地调查的方法获得数据,费时、费力且精确度不高。随着我国GPS技术应用更为广泛,实时采集的大量数据并没有得到有效利用。我们需要探寻更好的方法来解决上述问题。技术实现要素:针对上述问题,本发明的目的是提供一种充分考虑公交准点的影响因素、基于GPS数据的公交准点预测系统和方法。预测下游站点的公交准点情况,为行人提供安全、准点、方便、快捷、舒适的出行服务,提高出行效率;同时对于公交运营部门来说,也能够使经济效益提高,更好提升公交服务水平。本发明的方法包括如下步骤:步骤一、公交GPS数据和发车数据采集和处理数据采集:通过3G或4G无线传输网络实时获取公交车GPS轨迹信息,并采集公交车的发车数据,建立公交运行线路和车辆运行信息数据库;所述的公交车GPS数据包括线路标识、车次标识、站点标识、时间、经纬度、速度、方位角和上下行标识信息;所述的公交车发车数据包括线路标识、车次标识、起始时间、结束时间和距首站距离信息;从上述采集到的全网车辆GPS轨迹数据中提取具有上下场站的公交线路作为预测线路,确定线路上的每个站点,并进一步提取每天经过上述站点的公交车车次以及每个车次到达站点的时间;数据处理:进行站点标识匹配,将目标站点标识不对应的数据作为错误数据剔除,同时与站点标识对应的时间信息也相应剔除,只保留相同站点标识的数据。步骤二、公交准点值的判定定义公交车早于时刻表规定时间1分钟内或晚于时刻表规定时间2分钟内到达站点都认为是公交车准点到达,即准点为1,若在此范围之外的情况均属于准点之外,即非准点为0;通过公交车GPS轨迹数据统计各个站点的到站时间,然后与公交车发车数据中到达各个站点的计划时间做相应的差值,最后根据上述对准点和非准点的定义,计算出公交车各个站点的准点值;若上述差值在准点定义范围内,就视为准点,为1,若上述差值不在准点定义范围内,就视为不准点,为0。步骤三、公交准点影响因素的提取两个目标站点的旅行时间、相邻上一个车次和当前车次分别在第一个目标站点的准点值、以及相邻上一个车次在第二个目标站点的准点值作为训练学习中的输入因素;输出为当前车次在第二个目标站点的准点值;先提取每一天的小样本数据,然后按时间顺序组成一个大样本数据,按照训练集和测试集3:1的样本数据比例选出实验数据。步骤四、公交准点的预测采用支持向量机算法预测公交准点情况,根据上一步骤中选取的训练集建立预测模型对当前车次到达第二个目标站点的公交准点情况进行预测,得到预测的准点值。简而言之:首先进行公交车数据采集与处理。通过3G/4G等无线传输网络实时获取公交车GPS轨迹信息,并采集公交车的发车数据,建立公交运行线路和车辆运行信息数据库,然后进行站点标识匹配,将目标站点标识不对应的数据作为错误数据剔除,同时与站点标识对应的时间信息也相应剔除,只保留相同站点标识的数据。选取“快一慢二”准点定义原则,即公交车早于时刻表规定时间1分钟内或晚于时刻表规定时间2分钟内到达站点视为公交准点到达。根据上述方法判定公交车每天多个车次经过各个站点的准点值,若公交的站点时间差在准点定义范围内,就视为准点,为1,若公交的站点时间差不在准点定义范围内,就视为不准点,为0。由于公交系统受到多种因素的综合影响,具有随机性和复杂性。在诸多影响因素中,交通状况是影响公共交通准点最重要、最直接的因素。可用两个目标站点的旅行时间可以代表交通状况。不断变化的公交出行需求也会对公交运行准点造成很大影响。可用公交车上游车次的准点情况代表交通出行需求。要实时的预测公交车当前车次到达第二个目标站点的公交准点情况,首先作为训练学习中的输入因素包括两个目标站点的旅行时间、相邻上一个车次和当前车次分别在第一个目标站点的准点值、以及相邻上一个车次在第二个目标站点的准点值。作为输出变量的因素只有1个,即当前车次在第二个目标站点的准点值。按照训练集和测试集3:1的样本数据比例选出实验数据。最后采用支持向量机(SVM)算法预测公交准点情况,根据上步中选取的训练集建立预测模型对当前车次到达第二个目标站点的公交准点情况进行预测,得到预测的准点值。本发明采用上述技术方案的技术效果在于:1、本发明结合公交GPS数据,针对多辆车次,提取大量的公交车轨迹信息和发车信息,方便快捷,降低了数据处理成本。2、本发明基于支持向量机(SVM)算法对公交准点进行二分类预测,使乘客能够更好地了解公交运行情况,合理调控出行时间;同时使公交运营部门也能够及时调整公交发车间隔,提升公交服务水平。附图说明图1为本发明所述的基于GPS数据的公交准点预测方法的流程图。具体实施方式下面结合附图和实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。本发明提供一种基于GPS数据的公交准点预测方法,包括以下步骤:步骤一、公交GPS数据和发车数据采集和处理数据采集:通过3G/4G等无线传输网络实时获取公交车GPS轨迹信息,并采集公交车的发车数据,建立公交运行线路和车辆运行信息数据库。所述的公交车GPS数据包括线路标识、车次标识、站点标识、时间、经纬度、速度、方位角和上下行标识等信息;所述的公交车发车数据包括线路标识、车次标识、起始时间、结束时间和距首站距离等信息。从上述采集到的全网车辆GPS轨迹数据中提取具有上下场站的公交线路作为预测线路,确定线路上的每个站点,并进一步提取每天经过上述站点的公交车车次以及每个车次到达站点的时间。所述的到达站点的时间定义为站点的到站时间,公交车经过站点其实是经过一个站点场区,有个进场时间和出场时间,我们默认到达站点的时间是经过站点的进场时间,也就是公交车GPS数据到达站点的第一个打点时间。数据处理:由于每天公交站点上下车人数具有随机性且不均匀,而且GPS数据在每个站点的上传信息也存在异常,需要进行站点标识匹配,将目标站点标识不对应的数据作为错误数据剔除,同时与站点标识对应的时间等信息也相应剔除,只保留相同站点标识的数据。步骤二、公交准点值的判定无论是日常的通勤出行还是假日时的交通出行,人们最关心的问题就是能否按时到达目的地。随着人们生活节奏的加快和时间观念的增强,人们在出行时不仅关注用多长时间到达目的地,而且更加关注在这一时间范围内到达的可能性。在实际判断过程中,各运营商有不同的“准点行车”定义范围可供选择。本发明采用“快一慢二”的准点定义原则,即公交车早于时刻表规定时间1分钟内或晚于时刻表规定时间2分钟内到达站点都认为是公交车准点到达,即准点为1,若在此范围之外的情况均属于准点之外,即非准点为0;分析线路中各个站点的准点情况并根据准点定义方法判定站点的准点值。公交车在每天的行驶过程中会有很多车次经过每个站点,这些车次经过各个站点都有个到站时间,首先是通过公交车GPS轨迹数据统计各个站点的到站时间,然后与公交车发车数据中到达各个站点的计划时间做相应的差值,最后根据上面“快一慢二”的准点定义方法,计算出公交车各个站点的准点值,此判定原则是若公交的站点时间差在准点定义范围内,就视为准点,为1,若公交的站点时间差不在准点定义范围内,就视为不准点,为0。步骤三、公交准点影响因素的提取公交系统受到多种因素的综合影响,具有随机性和复杂性。在诸多影响因素中,部分因素随时间变化而变化,会对公交线路运行的准点可靠性产生影响;部分因素虽然自身不会发生变化,但会因为设置的不合理或者其他原因间接降低公交准点率;还有一些突然因素,一旦发生,将会对公共交通的准点产生很大的影响。交通状况是影响公共交通准点最重要、最直接的因素。如果交通不拥堵,大部分公交车会以正常速度、按照既定的时刻表运行,且在中间各站保持较好的准时性。但当道路发生交通拥堵时,公交运行速度急剧下降,准点率随之降低,造成大量乘客在站台的等待时间过长、部分乘客不能及时上车,影响出行效率。可用两个目标站点的旅行时间可以代表交通状况。此外,不断变化的公交出行需求也会对公交运行准点可靠性造成很大影响。平峰时段,公交需求不大,乘客能够在规定时间内上车,公交车在站台停靠时间得到保障。但在高峰时段,乘客上车时间明显拉长,公交车在站台停留超过预定时间,对下游站点造成更大影响,影响公交运行准点可靠性。可用公交车上游车次的准点情况代表交通出行需求。要实时的预测公交车当前车次到达第二个目标站点的公交准点情况,首先作为训练学习中的输入因素包括两个目标站点的旅行时间、相邻上一个车次和当前车次分别在第一个目标站点的准点值、以及相邻上一个车次在第二个目标站点的准点值。作为输出变量的因素只有1个,即当前车次在第二个目标站点的准点值。本发明中先提取每一天的小样本数据,然后按时间顺序组成一个大样本数据,按照训练集和测试集3:1的样本数据比例选出实验数据。所述的两个目标站点的旅行时间,在车次标识对应的情况下,两个目标站点的旅行时间就是当前车次在第二个目标站点的到站时间和第一个目标站点的到站时间的差值。步骤四、公交准点的预测本发明采用支持向量机(SVM)算法预测公交准点情况,根据上步中选取的训练集建立预测模型对当前车次到达第二个目标站点的公交准点情况进行预测,得到预测的准点值。所述的支持向量机(SupportVectorMachines,SVM)算法是一种基于统计学习理论的新型的通用学习方法,它建立在统计学习理论的VC理论和结构风险最小化原理的基础上,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得更好的泛化能力。其基本思想是首先通过非线性变换将输入空间映射到一个高维特征空间,然后在这个新空间中求取最佳线性分类面,而这种非线性变换是通过定义适当的内积函数(核函数)来实现的,在训练集中意支持向量为基础。支持向量机不仅在分类领域中取得了很好的效果,而且有效地解决了高维问题。通过学习SVM可以自动寻找那些对分类有较好区分能力的支持向量,由此构造出的分类器可以最大化类之间的间隔,因而SVM有较好的算法性能和较高的分类精度。给定样本数据集{(xi,yi)|i=1,2,...,n},其中xi为输入值,yi为输出值。在这里xi为4个输入变量,即两个目标站点的旅行时间、相邻上一个车次和当前车次分别在第一个目标站点的准点值、以及相邻上一个车次在第二个目标站点的准点值。yi为1个输出变量,即当前车次在第二个目标站点的准点值。考虑用函数f(x)=ωTx+b,对样本数据集进行拟合,并使得函数y和f(x)之间的距离最小,即损失函数R(y,f(x))=∫L(y,f(x))dx最小,根据结构风险最小化原则,应使得:最小,L为损失函数,这里选用ε不敏感损失函数,其表达式为:相应的优化问题为:min12ωTω+CΣi=1n(ξi+ξi*)]]>St.ωxi+bi-yi≤ϵ+ξi*-ωxi-bi+yi≤ϵ+ξiξi,ξi*≥0]]>其中,ε>0,为拟合精度,ξi为目标值之上超出ε部分所设;为目标之下超出ε部分所设;常数C>0,表示函数f(x)的平滑度和允许误差大于ε的数值之间的折中,利用Lagrange优化方法可将上述问题转化得到其对偶问题:min12Σi,j=1n(αi*-αi)(αj*-αj)xiTxj-Σi=1nαi*(yi-ϵ)-αi(yi+ϵ)]]>St.Σi=1n(αi-αi*)=0αi,αi*∈[0,C]]]>其中,αi与为Lagrange因子,通过核函数K(xi,x)将其转换成高维空间,此时可以求解得到SVM回归函数:f(x)=Σi=1n(αi-αi*)K(xi,xj)+b]]>本发明选择径向基函数为核函数,其具体形式为:K(xi,xj)=exp(-|xi-xj|22σ2)]]>其中参数σ为训练前确定的超参数。通过10折交叉验证的方法对SVM学习模型中的惩罚系数C和RBF核宽度σ进行优化选择,取最优惩罚系数值为最优拉格朗日算子最终建立预测模型。预测模型建立后,根据输入样本得到预测值。实施例1为了进一步说明本具体实施方式,提供了本实施例。在本实施例中,为了方便本发明的参数理解及算法体现,对五个步骤中的具体基础数据进行具体说明。基础数据(发车数据)和实际运行数据(公交GPS数据)有XX市XX公司提供,基础数据是可靠性判断的基础和重要参照,公交车发车数据包括线路标识、车次标识、起始时间、结束时间、到达各个站点的计划时间、起始状态、结束状态和距首站距离等信息。实际运行数据是准点预测的主体和核心数据,公交GPS数据包括线路标识、车次标识、站点标识、时间、经纬度、速度、方位角、上下行标识、距首站距离和开门状态等信息。以XX市XX公司XX路公交车八天的数据为例,其中某一天的GPS基础数据和八天的发车数据如表1和表2:其中表1“上下行”中,0代表上行,1代表下行,2代表离线,3代表上行场站,4代表下行场站。表2“起始状态”和“结束状态”中,3代表上行场站,4代表下行场站。表1:XX市XX公司XX路公交车某一天的GPS基础数据表2:XX市XX公司XX路公交车八天的发车数据(1)公交准点值的判定和公交准点影响因素的提取在本实例中分析线路中各个站点的准点情况并根据“快一慢二”准点定义方法判定公交准点值,然后分析公交系统,提取公交准点的影响因素。a)首先,判定公交各个站点的准点值公交车在每天的行驶过程中会有很多车次经过每个站点,这些车次经过各个站点都有个到站时间,首先是通过公交车GPS轨迹数据统计各个站点的到站时间,然后与公交车发车数据中到达各个站点的计划时间做相应的差值,最后根据上面“快一慢二”的准点定义方法,判定公交车各个站点的准点值,此判定原则是若公交的站点时间差在准点定义范围内,就视为准点,为1,若公交的站点时间差不在准点定义范围内,就视为不准点,为0。b)然后,提取公交准点的影响因素要实时的预测公交车当前车次到达第二个目标站点的公交准点情况,首先作为训练学习中的输入变量有4个,包括两个目标站点的旅行时间、相邻上一个车次和当前车次分别在第一个目标站点的准点值、以及相邻上一个车次在第二个目标站点的准点值。作为输出变量的只有1个,即当前车次在第二个目标站点的准点值。本实施例中一共有八天的数据,按照3:1的比例选择前六天数据作为训练集,后两天的数据作为测试集。以XX市XX公司XX路公交车为例,测试集中的输入变量和输出变量数据如下表3所示:其中,第10个站点为第二个目标站点,第9个站点为第一个目标站点表3预测公交准点的输入输出变量(2)公交准点的预测本发明采用支持向量机(SVM)算法预测公交准点情况,根据上步中选取的训练集建立预测模型对当前车次到达第二个目标站点的公交准点情况进行预测,得到预测的准点值。并最后采用Accuracy(准确率)、Sensitivity(灵敏度)和Specificity(特异度)标准进行评价,计算公式如下:以XX市XX公司XX路公交车为例,后两天作为测试集,最后的预测精度如下表4所示:表4SVM算法的预测精度预测结果Accuracy(%)Sensitivity(%)Specificity(%)预测精度93.6299.4698.62由表4的预测精度可以得出,采用支持向量机(SVM)算法预测公交准点的效果好,可以为乘客提供下游站点的公交准点信息,提高出行效率;也可为公交运营部门提供准点依据,合理安排发车间隔,提高服务水平。本发明基于公交GPS数据提和发车数据,采用的工具是SQLServer2012和MATLAB2013b,选取八天的数据作为实验数据,首先对公交车的GPS数据采集与处理,然后根据“快一慢二”原则判定各个站点的准点值,并分析公交系统,提取公交准点的影响因素,最后采用支持向量机(SVM)算法预测公交准点情况,结果表明SVM预测精度高,预测效果好。对乘客来说,预测下游站点的公交准点情况,能够更好地了解公交运行情况,合理调控出行时间,提高出行效率;同时对于公交运营部门来说,也能够及时调整公交发车间隔,更好提升公交服务水平。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1