本发明属于公交行程时间技术领域,特别涉及一种用于公交车辆行程时间预测的模型建立方法及系统。
背景技术
地面公交由于站点停靠、交叉口延误等诸多外部因素导致运行时间不确定,到达时间的随机性使得公交实时调度优化、优先控制技术难以实施和保障,无法提高公交整体运营效率。因此,利用公交gps大量历史数据预测公交路段运行时间可为基础优化公交信号控制与实时调度提供重要应用价值。现有技术多在于预测公交到达下游站点的时间,其在应用上侧重于公交站点的车辆到达预报,预测误差多在1分钟以上,准确率在80%~95%之间,无法满足面向信号控制的公交行程时间预测精度需求。
技术实现要素:
本发明的目的是提供一种用于公交车辆行程时间预测的模型建立方法及系统,以提高公交车辆行程时间的预测精度,满足面向信号控制的公交行程时间预测精度需求。
本发明公开了一种用于公交车辆行程时间预测的模型建立方法,包括以下步骤:
获取预设公交线路路段的公交gps数据;
确定所述预设公交线路路段的起点和终点;
依据所述公交gps数据确定在不同的时间点预设公交线路路段的起点时刻;
依据所述起点时刻确定每个时间点预设公交线路路段的起点时刻对应的终点时刻;
依据起点时刻和终点时刻建立历史行程时间序列;该历史行程时间序列包括多个不同的时间点的历史行程时间,每个时间点的历史行程时间由每个时间点对应的起点时刻和与该起点时刻对应的终点时刻确定;
将所述历史行程时间序列中第一预设比例的历史行程时间确定为参数拟合序列,将所述历史行程时间序列中第二预设比例的历史行程时间确定为模型检验序列;
依据所述参数拟合序列建立自回归积分滑动平均模型;
利用所述模型检验序列判断所述自回归积分滑动平均模型的参数是否需要调整;所述参数包括模型阶数、自回归系数和移动平均系数;
若是,则对所述回归积分滑动平均模型的参数进行调整,将参数调整后的自回归积分滑动平均模型确定为公交车辆行程时间预测模型;所述公交车辆行程时间预测模型用于对公交车辆行程时间进行预测;
若否,则将所述自回归积分滑动平均模型确定为公交车辆行程时间预测模型。
进一步的,依据起点时刻和终点时刻建立历史行程时间序列,具体包括:
获取各个时间点的历史行程时间,具体为
yt=tte-tts(1)
其中,t表示时间点,tts表示第t个时间点对应的起点时刻,tte表示第t个时间点对应的终点时刻,yt为第t个时间点的历史行程时间;
依据各个时间点的历史行程时间建立历史行程时间序列,具体为
yt={y1,y2,y3,...}
yt表示预设公交线路路段的历史行程时间序列。
进一步的,在依据起点时刻和终点时刻建立历史行程时间序列之后,还包括:
计算历史行程时间序列的自相关系数;
依据自相关系数判断历史行程时间序列是否平稳;
若否,则对历史行程时间序列进行差分处理,并确定差分阶数。
进一步的,依据参数拟合序列建立自回归积分滑动平均模型,具体包括:
建立历史行程时间序列关于当期值和前期值的线性函数;
建立历史行程时间序列关于当期值和前期值随机误差的线性函数;
依据历史行程时间序列关于当期值和前期值的线性函数、历史行程时间序列关于当期值和前期值随机误差的线性函数、差分阶数以及滞后算子建立预测模型;所述滞后算子为将所述前期值转化为所述当期值的算子;
利用试算法,确定所述预测模型的模型阶数;
利用所述参数拟合序列确定所述预测模型的自回归系数和移动平均系数;
将确定的模型阶数、自回归系数和移动平均系数后的预测模型确定为自回归积分滑动平均模型。
进一步的,利用模型检验序列判断自回归积分滑动平均模型的参数是否需要调整,具体包括:
利用自回归积分滑动平均模型对所述模型检验序列中各个时间点对应的预设公交线路路段的公交车辆行程时间进行预测,得到预测值;
依据预测值和模型检验序列中的历史行程时间计算最大相对误差预测指标;
依据最大相对误差预测指标计算平均绝对百分误差预测指标;
判断最大相对误差预测指标和平均绝对百分误差预测指标是否均在预设进度范围内;
若是,则不需要调整自回归积分滑动平均模型的参数;
若否,则需要调整自回归积分滑动平均模型的参数。
本发明还公开了一种用于公交车辆行程时间预测的模型建立系统,包括:
数据获取模块,用于获取预设公交线路路段的公交gps数据;
第一确定模块,用于确定预设公交线路路段的起点和终点;
第二确定模块,用于依据公交gps数据确定在不同的时间点预设公交线路路段的起点时刻;
第三确定模块,用于依据起点时刻确定每个时间点预设公交线路路段的起点时刻对应的终点时刻;
时间序列建立模块,用于依据起点时刻和终点时刻建立历史行程时间序列;所述历史行程时间序列包括多个不同的时间点的历史行程时间,每个时间点的所述历史行程时间由每个时间点对应的起点时刻和与所述起点时刻对应的终点时刻确定;
第四确定模块,用于将所述历史行程时间序列中第一预设比例的历史行程时间确定为参数拟合序列,将所述历史行程时间序列中第二预设比例的历史行程时间确定为模型检验序列;
模型建立模块,用于依据所述参数拟合序列建立自回归积分滑动平均模型;
判断模块,用于利用所述模型检验序列判断所述自回归积分滑动平均模型的参数是否需要调整;所述参数包括模型阶数、自回归系数和移动平均系数;
预测模型确定模块,用于若是,则对所述回归积分滑动平均模型的参数进行调整,将参数调整后的自回归积分滑动平均模型确定为公交车辆行程时间预测模型;所述公交车辆行程时间预测模型用于对公交车辆行程时间进行预测;若否,则将所述自回归积分滑动平均模型确定为公交车辆行程时间预测模型。
进一步的,时间序列建立模块,具体包括:
时间获取单元,用于获取各个时间点的历史行程时间;
序列建立单元,用于依据各个时间点的历史行程时间建立历史行程时间序列。
进一步的,本发明还包括:
计算模块,用于计算所述历史行程时间序列的自相关系数;
平稳判断模块,用于依据所述自相关系数判断所述历史行程时间序列是否平稳;
差分处理模块,用于若否,则对所述历史行程时间序列进行差分处理,并确定差分阶数。
进一步的,模型建立模块,具体包括:
第一函数建立单元,用于建立所述历史行程时间序列关于当期值和前期值的线性函数;
第二函数建立单元,用于建立所述历史行程时间序列关于所述当期值和前期值随机误差的线性函数;
第一模型建立单元,用于依据所述历史行程时间序列关于当期值和前期值的线性函数、所述历史行程时间序列关于所述当期值和前期值随机误差的线性函数、所述差分阶数以及滞后算子建立预测模型;所述滞后算子为将所述前期值转化为所述当期值的算子;
模型阶数确定单元,用于利用试算法,确定所述预测模型的模型阶数;
模型系数确定单元,用于利用所述参数拟合序列确定所述预测模型的自回归系数和移动平均系数;
第二模型建立单元,用于将确定所述模型阶数、所述自回归系数和所述移动平均系数后的预测模型确定为自回归积分滑动平均模型。
进一步的,判断模块,具体包括:
预测值获取单元,用于利用自回归积分滑动平均模型对所述模型检验序列中各个时间点对应的所述预设公交线路路段的公交车辆行程时间进行预测,得到预测值;
第一指标计算单元,用于依据所述预测值和所述模型检验序列中的历史行程时间计算最大相对误差预测指标;
第二指标计算单元,用于依据所述最大相对误差预测指标计算平均绝对百分误差预测指标;
指标判断单元,用于判断所述最大相对误差预测指标和所述平均绝对百分误差预测指标是否均在预设进度范围内;若是,则不需要调整所述自回归积分滑动平均模型的参数;若否,则需要调整所述自回归积分滑动平均模型的参数。
有益效果:本发明与现有技术相比,本发明考虑了公交车辆在运营过程中受随机因素影响而呈现的行程时间波动特征,基于时间序列理论,利用公交车辆大量的gps历史数据并通过差分处理将原始时间序列平稳化后,采用arima模型实现了面向公交信号优先控制的高精度路段行程时间预测,并利用差分处理,充分考虑了公交在运行过程中,行程时间序列存在受社会车辆、乘客上下车站、停靠车站等随机因素波动的干扰,能够显著提高模型在公交行程时间预测领域的预测精度。模型预测的行程时间为公交车辆从上个节点至下游交叉口的时间,面对交叉口公交信号优先控制,旨在为信号的实时控制提供重要的数据参考,本发明预测精度高,能够满足面向信号控制的公交行程时间预测精度需求,为公交出行、运行调度提供了重要参考,对城市公交运营实时调度、交叉口公交信号优先控制等提供了基础数据支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍;
图1为本发明实施例一种用于公交车辆行程时间预测的模型建立方法的流程图;
图2为本发明实施例一种用于公交车辆行程时间预测的模型建立系统的结构图。
具体实施方式
下面结合实施例进一步阐述该发明方法。
本发明的目的是提供一种用于公交车辆行程时间预测的模型建立方法及系统,充分考虑了公交在运行过程中,行程时间受社会车辆、乘客上下车站、停靠车站等随机因素波动的干扰,显著提高模型在公交行程时间预测领域的预测精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
为了能够输出符合公交信号优先控制精度要求的行程时间预测结果,本发明基于时间序列理论,利用公交车辆大量gps历史数据,采用自回归积分滑动平均(auto-regressiveintegratedmovingaverage,arima)模型,挖掘gps历史数据中隐藏的公交出行特征规律,考虑公交出行过程中的随机因素影响,并通过不断参数调整,优化预测模型,输出达到精度、鲁棒性要求的预测结果,后续可通过公交车辆gps数据进一步采集和处理分析,对预测模型设定进行优化更新。
图1为本发明实施例一种用于公交车辆行程时间预测的模型建立方法的流程图。
参见图1,实施例的用于公交车辆行程时间预测的模型建立方法,包括:
步骤101:获取预设公交线路路段的公交gps数据。
所述公交gps数据包括公交定位时间信息和公交位置信息。
步骤102:确定所述预设公交线路路段的起点和终点。
步骤103:依据所述公交gps数据确定在不同的时间点所述预设公交线路路段的起点时刻。
步骤104:依据所述起点时刻确定每个时间点所述预设公交线路路段的起点时刻对应的终点时刻。
步骤105:依据所述起点时刻和所述终点时刻建立历史行程时间序列。
所述历史行程时间序列包括多个不同的时间点的历史行程时间,每个时间点的历史行程时间由每个时间点对应的起点时刻和与起点时刻对应的终点时刻确定。
具体包括:
获取各个时间点的历史行程时间,具体为
yt=tte-tts(1)
其中,t表示时间点,tts表示第t个时间点对应的起点时刻,tte表示第t个时间点对应的终点时刻,yt为第t个时间点的历史行程时间;
依据各个时间点的历史行程时间建立历史行程时间序列,具体为
yt={y1,y2,y3,....}
yt表示预设公交线路路段的历史行程时间序列。
步骤106:计算所述历史行程时间序列的自相关系数,自相关系数能够描述同一时间序列在不同时间的相关程度,具体为:
计算历史行程时间序列yt的自相关系数ρ:
其中,r(t,t+k)为历史行程时间序列yt的延迟长度k(k=1,2,3,...,n)自协方差函数,
r(t,t+k)=e(yt-eyt)(yt+k-eyt+k)(3)
ρ(t,t+k)为历史行程时间序列yt的延迟长度k自相关函数,e、d分别为yt的数学期望和方差,所述自协方差函数与自相关函数只依赖于时间的延迟长度k,而与时间的起止点无关。
步骤107:判断所述历史行程时间序列是否平稳。具体为:
依据自相关系数ρ判断历史行程时间序列yt的平稳性,平稳序列通常具有短期相关性,即平稳序列的自相关系数ρ会随着延迟长度k的增加而迅速衰减为0,随后在0附近波动且逐渐收敛于0,确定延迟长度k的阀值,确定任意k,可取5,随着k从1增长到5的过程中,若ρ(t,t+k)的值很快趋近于0,则所述时间序列yt为平稳序列,直接执行步骤109;否则,yt为非平稳序列,则执行步骤108,将非平稳序列转化为平稳序列后,再执行步骤109。
步骤108:对历史行程时间序列进行差分处理,并确定差分阶数。
所述差分阶数d为经过d次差分后可使得yt由非平稳序列转化为平稳序列,根据实际经验,d可取1或2,差分处理并确定差分阶数d后,再执行步骤109。
在时间序列分析中,要求被研究的时间序列是平稳的,否则就会产生“伪回归”,导致预测结果不可信。然而实际中的时间序列往往都是不平稳的,差分处理是获得平稳时间序列的常用方法,有的序列经过一次差分处理就能平稳,有的序列却需要经过多次差分处理才变得平稳。
步骤109:确定参数拟合序列和模型检验序列。
将历史行程时间序列中第一预设比例的历史行程时间确定为参数拟合序列,将历史行程时间序列中第二预设比例的历史行程时间确定为模型检验序列,参数拟合序列用于确定模型参数,模型检验序列用于检验模型输出结果的可靠性。本实施例中的第一预设比例为90%,第二预设比例为10%。
步骤110:依据参数拟合序列建立自回归积分滑动平均模型。具体包括:
确定模型的自回归项,自回归项为历史行程时间序列关于当期值和前期值的线性函数,即第t个时间点的历史行程时间yt可用前期值yt-1、yt-2、……表示,则
实参数
确定模型的移动平均项,移动平均项为历史行程时间序列关于当期值和前期值随机误差的线性函数,即第t个时间点的历史行程时间yt可表示为:
yt=ut-θ1ut-1+θ2ut-2+...+θqut-q(5)
实参数θ1,θ2,...,θq为移动平均系数,是模型的待估参数,q表示第二模型阶数;
引入滞后算子b,该滞后算子是将公交车辆行程时间的前期值转为当期值,即将第t-k时间点的行程时间转为第t个时间点的行程时间yt,
bkyt=yt-k(6)
则,自回归项可简写为
移动平均项可简写为
yt=θ(b)ut(9)
θ(b)=1-θ1b-θ2b2-...-θqbq(10)
依据自回归项、移动平均项、差分阶数d以及滞后算子b建立预测模型,具体为:
确定预测模型的线性函数,第t个时间点的行程时间预测值同样可以表示为其与前期值以及前期的随机误差所组成的线性函数,将该线性函数确定为预测模型的线性函数,即
预测模型的线性函数为(p,q)阶的自回归移动平均模型,根据模型的定义,确定预测模型,在预测模型的线性函数的基础上引入滞后算子b和差分阶数d,则预测第t个时间点的行程时间yt的预测模型可简写为
利用试算法,确定预测模型的模型阶数,模型阶数包括第一模型阶数p和第二模型阶数q,具体为:令p=n,q=n-1,采用试算法,由n=1开始确定第一模型阶数p和第二模型阶数q;
利用参数拟合序列确定预测模型的自回归系数
将确定模型阶数d、自回归系数
步骤111:判断自回归积分滑动平均模型的参数是否需要调整。
该步骤中,利用模型检验序列判断自回归积分滑动平均模型的参数是否需要调整,若是,则执行步骤112,若否,则执行步骤113,所述参数包括模型阶数、自回归系数和移动平均系数。
步骤111具体包括:
利用自回归积分滑动平均模型对模型检验序列中各个时间点对应的预设公交线路路段的公交车辆行程时间进行预测,得到预测值
依据所述预测值和所述模型检验序列中的历史行程时间计算最大相对误差预测指标re,具体为
其中,y't为检验序列中第t个时间点的历史行程时间,
依据最大相对误差预测指标计算平均绝对百分误差预测指标mape,具体为
判断最大相对误差预测指标和平均绝对百分误差预测指标是否均在预设进度范围内,具体为:判断平均绝对百分误差预测指标re是否满足re<15%且平均绝对百分误差预测指标mape是否满足mape<15%;
若是,则不需要调整自回归积分滑动平均模型的参数,直接执行步骤113;
若否,则需要调整自回归积分滑动平均模型的参数,执行步骤112。
步骤112:对回归积分滑动平均模型的参数进行调整,将参数调整后的自回归积分滑动平均模型确定为公交车辆行程时间预测模型,具体为:重新调整第一模型阶数p、第二模型阶数q,令n=n+1,更新预测模型。公交车辆行程时间预测模型用于对公交车辆行程时间进行预测。
步骤113:则将自回归积分滑动平均模型确定为公交车辆行程时间预测模型。公交车辆行程时间预测模型直接输出第一模型阶数p、第二模型阶数q及预测值。
本实施中,在获取预设公交线路路段的公交gps数据之后,还包括:对获取预设公交线路路段的公交gps数据进行预处理,预处理包括数据剔除、地图匹配和投影校正,这样保证了预设公交线路路段的车辆在地图上的信息的准确性,包括准确地定位时间信息与准确地位置信息。
本实施例中的用于公交车辆行程时间预测的模型建立方法,考虑了公交车辆在运营过程中受随机因素影响而呈现的行程时间波动特征,基于时间序列理论,利用公交车辆大量的gps历史数据并通过差分处理将原始时间序列平稳化后,采用arima模型实现了面向公交信号优先控制的高精度路段行程时间预测,预测精度高,能够满足面向信号控制的公交行程时间预测精度需求,为公交出行、运行调度提供了重要参考。
本发明还提供了一种用于公交车辆行程时间预测的模型建立系统,图2为本发明的一种用于公交车辆行程时间预测的模型建立系统的结构图,该系统包括:
数据获取模块201,用于获取预设公交线路路段的公交gps数据;所述公交gps数据包括公交定位时间信息和公交位置信息。
第一确定模块202,用于确定所述预设公交线路路段的起点和终点。
第二确定模块203,用于依据所述公交gps数据确定在不同的时间点所述预设公交线路路段的起点时刻。
第三确定模块204,用于依据所述起点时刻确定每个时间点所述预设公交线路路段的起点时刻对应的终点时刻。
时间序列建立模块205,用于依据所述起点时刻和所述终点时刻建立历史行程时间序列;所述历史行程时间序列包括多个不同的时间点的历史行程时间,每个时间点的所述历史行程时间由每个时间点对应的起点时刻和与所述起点时刻对应的终点时刻确定。
所述时间序列建立模块205,具体包括:
时间获取单元,用于获取各个时间点的历史行程时间,具体为
yt=tte-tts(1)
其中,t表示时间点,tts表示第t个时间点对应的起点时刻,tte表示第t个时间点对应的终点时刻,yt为第t个时间点的历史行程时间;
序列建立单元,用于依据各个时间点的历史行程时间建立历史行程时间序列,具体为:
yt={y1,y2,y3,...}
yt表示预设公交线路路段的历史行程时间序列。
计算模块206,用于计算所述历史行程时间序列的自相关系数。
平稳判断模块207,用于依据所述自相关系数判断所述历史行程时间序列是否平稳。
差分处理模块208,用于若否,则对所述历史行程时间序列进行差分处理,并确定差分阶数。
第四确定模块209,用于将所述历史行程时间序列中第一预设比例的历史行程时间确定为参数拟合序列,将所述历史行程时间序列中第二预设比例的历史行程时间确定为模型检验序列。
模型建立模块210,用于依据所述参数拟合序列建立自回归积分滑动平均模型。
所述模型建立模块210,具体包括:
第一函数建立单元,用于建立所述历史行程时间序列关于当期值和前期值的线性函数;
第二函数建立单元,用于建立所述历史行程时间序列关于所述当期值和前期值随机误差的线性函数;
第一模型建立单元,用于依据所述历史行程时间序列关于当期值和前期值的线性函数、所述历史行程时间序列关于所述当期值和前期值随机误差的线性函数、所述差分阶数以及滞后算子建立预测模型;所述滞后算子为将所述前期值转化为所述当期值的算子;
模型阶数确定单元,用于利用试算法,确定所述预测模型的模型阶数;
模型系数确定单元,用于利用所述参数拟合序列确定所述预测模型的自回归系数和移动平均系数;
第二模型建立单元,用于将确定所述模型阶数、所述自回归系数和所述移动平均系数后的预测模型确定为自回归积分滑动平均模型。
判断模块211,用于利用所述模型检验序列判断所述自回归积分滑动平均模型的参数是否需要调整;所述参数包括模型阶数、自回归系数和移动平均系数。
所述判断模块211,具体包括:
预测值获取单元,用于利用自回归积分滑动平均模型对所述模型检验序列中各个时间点对应的所述预设公交线路路段的公交车辆行程时间进行预测,得到预测值;
第一指标计算单元,用于依据所述预测值和所述模型检验序列中的历史行程时间计算最大相对误差预测指标;
第二指标计算单元,用于依据所述最大相对误差预测指标计算平均绝对百分误差预测指标;
指标判断单元,用于判断所述最大相对误差预测指标和所述平均绝对百分误差预测指标是否均在预设进度范围内;若是,则不需要调整所述自回归积分滑动平均模型的参数;若否,则需要调整所述自回归积分滑动平均模型的参数。
预测模型确定模块212,用于若是,则对所述回归积分滑动平均模型的参数进行调整,将参数调整后的自回归积分滑动平均模型确定为公交车辆行程时间预测模型;所述公交车辆行程时间预测模型用于对公交车辆行程时间进行预测;若否,则将所述自回归积分滑动平均模型确定为公交车辆行程时间预测模型。
本实施例中的用于公交车辆行程时间预测的模型建立系统,基于时间序列理论,采用arima模型,并利用差分处理,充分考虑了公交在运行过程中,行程时间序列存在受社会车辆、乘客上下车站、停靠车站等随机因素波动的干扰,能够显著提高模型在公交行程时间预测领域的预测精度。模型预测的行程时间为公交车辆从上个节点至下游交叉口的时间,面对交叉口公交信号优先控制,旨在为信号的实时控制提供重要的数据参考。
对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。