一种基于浮动车数据预测多时段行程时间分布的方法

文档序号:6713176阅读:587来源:国知局
一种基于浮动车数据预测多时段行程时间分布的方法
【专利摘要】本发明公开了一种基于浮动车数据预测多时段行程时间分布的方法,本发明在传统KNN算法的基础上,利用贝叶斯模型的学习能力,提高了行程时间预测的鲁棒性和准确性。通过历史数据和实时数据的有效融合,实现了连续多个时段的行程时间均值和方差预测,构建行程时间浮动的置信区间。本发明在各种复杂的城市网络中都能有效预测连续半小时的行程时间分布信息,相比于传统的KNN模型,结果更可靠准确。
【专利说明】一种基于浮动车数据预测多时段行程时间分布的方法
【技术领域】
[0001]本发明属于交通行程时间估计和预测领域,一种基于浮动车数据预测多时段行程时间分布的方法,尤其涉及一种基于低采样频率浮动车数据预测多时段行程时间分布的方法,属于一种带有学习能力的改进KNN多时段行程时间分布预测方法。
【背景技术】
[0002]随着我国城市化进程的加快和汽车保有量的提高,城市交通拥堵日益加剧,而先进的交通信息服务系统(ATIS)是缓解交通拥堵的一种有效途径。作为ATIS应用的一个基本因素,准确可靠的行程时间信息引起了极大的关注。作为衡量交通状况的一个重要指标,行程时间信息为交通管理者提供一种有效的衡量交通网络运行状态的量化指标,同时,准确的交通信息更是先进的交通信息服务系统应用的基础和关键。多时段行程时间的预测不仅可以帮助出行者在多方出行中制定合理的出行计划,减少出行时间和旅行延误,降低能耗,还可以提高交通系统的运行效率,有效的缓解交通拥堵。
[0003]当前国内外关于行程时间预测的研究可分为两大类:高速公路和城市交通网络。对于高速路上行程时间预测的研究是非常丰富的,然而关于城市道路网络行程时间预测的研究是相当有限。相比于高速路上相对简单的交通环境,城市道路的行程时间预测更具有挑战性。在城市交通网络中,行程时间有极大的不确定性,主要由以下几个原因造成的:(I)交通需求的波动性;(2)交通控制,各交叉路口信号灯的影响;(3)交通事故及管制等交通事件的影响;(4)城市交通网络中,车种多,驾驶行为差异化。由于行程时间的不确定性,导致预测的行程时间均值往往严重偏离实际的行程时间,失去了出行参考的价值。因此,很有必要研发城市环境下的行程时间分布预测方法,提供城市行程时间均值和不确定性。
[0004]近年来,浮动车技术成为获取道路交通信息的先进技术手段之一,所谓的浮动车是一般是指安装了车载GPS定位设备并行使在城市主干道上的公共汽车和出租车,可以记录车辆位置,方向和速度等信息。与传统的静态收集手段不同,GPS浮动车可以全天候的,动态实时地收集道路交通信息。虽然GPS浮动车具有低成本,易安装和维护,覆盖范围广不受环境影响等优点。浮动车数据有可能在成本相对较低的情况下提供高品质的实时交通监控与管理和移动性服务的信息。

【发明内容】

[0005]本发明为了解决复杂城市网络中行程时间分布预测问题,提出了一种基于低采样频率浮动车数据预测多时段行程时间分布的方法。
[0006]本发明所采用的技术方案是:一种基于浮动车数据预测多时段行程时间分布的方法,其特征在于,包括以下步骤:
[0007]步骤1:以信号灯为标志对路段进行划分,以N分钟为时间间隔对浮动车数据进行划分,其中NS 5 ;
[0008]步骤2:通过对GPS采样点进行插值,估计每个路段上每辆浮动车的行程时间;[0009]步骤3:利用KNN预测多时段路段行程时间的均值;
[0010]步骤4:利用贝叶斯学习预测多时段路段行程时间的误差分布;
[0011]步骤5:生成路段行程时间分布,并在此基础上,预测行程时间区间。
[0012]作为优选,步骤I中所述的N = 5。
[0013]作为优选,步骤3中所述的预测多时段路段行程时间的均值是利用KNN模型预测多时段路段行程时间的均值。
[0014]作为优选,步骤3中所述的利用KNN模型预测多时段路段行程时间的均值,KNN模型在进行单步预测时,已知t时段之前的实时数据Rt和历史数据Hf f预测时考虑t-Ι时间段到t-Ι时间段的数据,其实现方式包括以下子步骤:
[0015]步骤3.1:判断是否是单步预测,若是,则计算当前状态向量即实时数据Rt和历史数据iff/之间的欧式距离,然后继续步骤3.2 ;否则,跳到步骤3.4 ;
[0016]步骤3.2:根据欧式距离££>严从历史数据/Zf中选择k-近邻,然后确定预测的t时间段行程时间的历史状态量;
[0017]步骤3.3:以欧式距离的倒数作为权重,通过对k_近邻加权预测t时段行程时间均值m,;
[0018]步骤3.4:令t = t+1,用t时段的预测值更新实时数据Rt,从而对实时数据状态向量和历史数据进行更新,得到Rt+1和Ht+1,判断:
[0019]如果t〈t+p,返回步骤3.1、步骤3.2、步骤3.3和步骤3.4,进行多时段行程时间均值预测,通过对k-近邻加权预测t+Ι时间段行程时间均值:
[0020]如果t = t+p,预测结束,P表示连续预测的时间段个数。
[0021]作为优选,步骤4中所述的预测多时段路段行程时间的误差分布,是在传统KNN模型预测多时段行程时间均值的基础上,利用贝叶斯模型对其进行改进,预测多时段路段行程时间的误差分布。
[0022]作为优选,步骤4中所述的利用贝叶斯模型来预测多时段路段行程时间的误差分布ε t,首先假设在同一时间段内,KNN模型的预测误差Xt服从正态分布,即I,~靖爲,Cf],
两个位置参数μ t与< 都未知且相互联系,并分别服从正态分布和倒伽马分布,二者的联合分布为正态-倒伽马分布,则其实现方式包括以下子步骤:
[0023]步骤4.1.初始化样本的自由度Vtl、行程时间的估计均值Hitl和行程时间的方差的初值C。;
[0024]步骤4.2.先验估计:利用当前t时间段的后验分布来估计t+Ι时间段的先验分布;
[0025]步骤4.3.预测:对于t+Ι时间段,利用先验分布的均值和方差信息来预测t+Ι时间段的误差均值ft+1、误差均值的方差Ct+1和误差的方差ct+1 ;
[0026]步骤4.4.更新:随着时间的推移,如果获得t时间段的实时样本,则利用其对预测分布进行后验更新;否则,将上一时段的后验更新信息作为当前时段的样本信息,进行后验更新;步骤4.5.令t = 1+1,如果1^+?+1,返回步骤4.2,进行多时段行程时间均值预测;如果t = t+ρ+Ι,预测结束,其中P表示连续预测的时间段个数。
[0027]本发明针对现有行程时间预测方法多数只估计路段行程时间均值、忽略了城市路网中行程时间的不确定性、多数局限的研究高速路上行程时间均值和分布、城市行程时间分布的预测研究集中于单时段的不足,提出了利用贝叶斯改进传统KNN的方法来解决拥挤城市道路网络中多时段行程时间分布预测的问题,在提高了预测结果鲁棒性的同时,也保证了预测结果的可靠性。
【专利附图】

【附图说明】
[0028]图1:为本发明实施例的流程图。
【具体实施方式】
[0029]本发明要解决的是复杂城市网络中行程时间分布的预测问题,针对低采样频率的浮动车GPS数据,提出了一种带有学习能力的改进KNN的多时段行程时间分布预测方法。
[0030]为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
[0031]本发明的输入数据为地图匹配后的浮动车GPS轨迹点和路网数据,GPS轨迹数据是一系列按照时间顺序排序的GPS点组成,每个GPS点由速度、时间点和位置等组成,交通路网由一系列有向路段和节点组成,且具有时空动态特性,设G = (N, A, Ω)表示一个交通路网,其中,N表示节点集,A表示路段集,Ω表示一系列的离散时间段{Λ...,ηΛ,...},且η为整数,Λ表示时间间隔(本实施例取5min)。这里路段au e A,以城市路网中信号灯为依据进行划分。
[0032]请见图1,本发明所采用的技术方案是:一种基于浮动车数据预测多时段行程时间分布的方法,其特征在于,包括以下步骤:
[0033]步骤1:以信号灯为标志对路段进行划分,以5分钟为时间间隔对浮动车数据进行划分;
[0034]步骤2:通过对GPS采样点进行插值,估计每个路段上每辆浮动车的行程时间;
[0035]由于GPS采样时,多数浮动车不能恰好通过路口,从而大部分GPS采样点落在路段上。因此,实施例通过插值估计出车辆通过路段两端(即交叉路口)的时刻,从而估计出每个路段上每辆浮动车的路段行程时间。
[0036]步骤3:利用KNN模型预测多时段路段行程时间的均值;
[0037]实例利用历史数据和实时数据进行预测,已知t时段之前的实时数据Rt =
[IV1,…,和历史数据
【权利要求】
1.一种基于浮动车数据预测多时段行程时间分布的方法,其特征在于,包括以下步骤: 步骤1:以信号灯为标志对路段进行划分,以N分钟为时间间隔对浮动车数据进行划分,其中N≤5 ; 步骤2:通过对GPS采样点进行插值,估计每个路段上每辆浮动车的行程时间; 步骤3:利用KNN预测多时段路段行程时间的均值; 步骤4:利用贝叶斯学习预测多时段路段行程时间的误差分布; 步骤5:生成路段行程时间分布,并在此基础上,预测行程时间区间。
2.根据权利要求1所述的基于浮动车数据预测多时段行程时间分布的方法,其特征在于:步骤3中所述的预测多时段路段行程时间的均值是利用KNN模型预测多时段路段行程时间的均值。
3.根据权利要求2所述的基于浮动车数据预测多时段行程时间分布的方法,其特征在于:步骤3中所述的利用KNN模型预测多时段路段行程时间的均值,KNN模型在进行单步预测时,已知t时段之前的 实时数据Rt和历史数据< f预测时考虑t-Ι时间段到t-Ι时间段的数据,其实现方式包括以下子步骤: 步骤3.1:判断是否是单步预测,若是,则计算当前状态向量即实时数据Rt和历史数据Ff之间的欧式距离££)广,然后继续步骤3.2 ;否则,跳到步骤3.4 ; 步骤3.2:根据欧式距离从历史数据iff中选择k-近邻,然后确定预测的t时间段行程时间的历史状态量; 步骤3.3:以欧式距离的倒数作为权重,通过对k-近邻加权预测t时段行程时间均值ItIl ;步骤3.4:令t = t+Ι,用t时段的预测值W1更新实时数据Rt,从而对实时数据状态向量和历史数据进行更新,得到Rt+1和Ht+1,判断: 如果t〈t+p,返回步骤3.1、步骤3.2、步骤3.3和步骤3.4,进行多时段行程时间均值预测,通过对k-近邻加权预测t+Ι时间段行程时间均值; 如果t = t+p,预测结束,P表示连续预测的时间段个数。
4.根据权利要求2所述的基于浮动车数据预测多时段行程时间分布的方法,其特征在于:步骤4中所述的预测多时段路段行程时间的误差分布,是在传统KNN模型预测多时段行程时间均值的基础上,利用贝叶斯模型对其进行改进,预测多时段路段行程时间的误差分布。
5.根据权利要求4所述的基于浮动车数据预测多时段行程时间分布的方法,其特征在于: 步骤4中所述的利用贝叶斯模型来预测多时段路段行程时间的误差分布ε t,首先假设在同一时间段内,KNN模型的预测误差Xt服从正态分布,即Xf ~*两个位置参数μ t与--;2都未知且相互联系,并分别服从正态分布和倒伽马分布,二者的联合分布为正态-倒伽马分布,则其实现方式包括以下子步骤: 步骤4.1.初始化样本的自由度Vtl、行程时间的估计均值Hitl和行程时间的方差的初值co ; 步骤4.2.先验估计:利用当前t时间段的后验分布来估计t+1时间段的先验分布;步骤4.3.预测:对于t+1时间段,利用先验分布的均值和方差信息来预测t+Ι时间段的误差均值ft+1、误差均值的方差Ct+1和误差的方差ct+1 ; 步骤4.4.更新:随着时间的推移,如果获得t时间段的实时样本,则利用其对预测分布进行后验更新;否则,将上一时段的后验更新信息作为当前时段的样本信息,进行后验更新;步骤4.5.令t = t+1,如果t〈t+p+l,返回步骤4.2,进行多时段行程时间均值预测;如果t = t+ρ+Ι,预测结束,其中P表示连续预测的时间段个数。
【文档编号】G08G1/01GK103927872SQ201410173814
【公开日】2014年7月16日 申请日期:2014年4月28日 优先权日:2014年4月28日
【发明者】陈碧宇, 时朝阳, 李清泉 申请人:武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1