本发明属于交通流量预测技术领域,尤其涉及一种公交客流量的预测方法及系统。
背景技术:
由于公交客流量是城市交通规划的一个重要指标,因此对公交客流量进行准确、有效的预测能够帮助智能公交系统更好的运行与发展。
目前的对公交客流量预测的研究方法大多都是采用传统的机器学习算法或者结合灰色理论进行预测,这些方法只考虑考了部分因素的影响,因此预测出的公交客流量结果并不准确。
基于此,如何提供一种精准的公交客流量预测方法是目前亟需解决的技术问题。
技术实现要素:
针对现有技术存在的问题,本发明实施例提供了一种公交客流量的预测方法及系统,用于解决现有技术中利用传统的预测方法对公交客流量进行预测时,预测结果不准的技术问题。
本发明提供一种公交客流量的预测方法,所述方法包括:
确定影响公交客流量的预测因素,所述预测因素包括:时间、天气、假期及相似线路的客流量;所述相似线路为与目标公交线路具有多个相同站点的线路;
获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;
基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型;
对所述三元转移张量预测模型进行特征分解,获取特征张量,所述特征张量代表所述目标公交线路在目标时间段内客流量处于目标区间的概率;
根据所述特征张量对所述目标公交线路在所述目标时间段内的公交客流量进行预测。
上述方案中,所述基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型,包括:
基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元客流量状态概率转移图;
基于所述三元客流量状态概率转移图创建所述三元转移张量预测模型;
对所述三元转移张量预测模型进行素性修正。
上述方案中,所述三元转移张量预测模型t为八阶张量:
上述方案中,所述对所述三元转移张量预测模型进行特征分解,获取特征张量,包括:
利用多模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量;或者,
利用变换函数将多模乘幂法运算转换为单模乘幂法运算,利用所述单模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量。
上述方案中,所述利用多模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取特征张量,包括:
将所述八阶张量设置为带有天气阶和假期阶的六阶转移张量
根据所述天气阶及所述假期阶确定所述六阶转移张量的子转移张量,所述子转移张量包括2×nw个;
将2×nw个所述子转移张量进行合并,获取一个五阶分布张量m′∈rw×h×t×l×f;
基于所述八阶张量
上述方案中,所述根据所述特征张量对所述目标公交线路在所述目标时间段内的公交客流量进行预测,包括:
根据公式
本发明还提供一种公交客流量的预测系统,所述系统包括:
确定单元,用于确定影响公交客流量的预测因素,所述预测因素包括:时间、天气、假期及相似线路的客流量;所述相似线路为与目标公交线路具有多个相同站点的线路;
获取单元,用于获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;
创建单元,用于基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型;
分解单元,用于对所述三元转移张量预测模型进行特征分解,获取特征张量,所述特征张量代表所述目标公交线路在目标时间段内客流量处于目标区间的概率;
预测单元,用于根据所述特征张量对所述目标公交线路在所述目标时间段内的公交客流量进行预测。
上述方案中,所述创建单元具体用于:
基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元客流量状态概率转移图;
基于所述三元客流量状态概率转移图创建所述三元转移张量预测模型;
对所述三元转移张量预测模型进行素性修正。
上述方案中,所述三元转移张量预测模型t为八阶张量:
上述方案中,所述分解单元具体用于:利用多模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量;或者,
利用变换函数将多模乘幂法运算转换为单模乘幂法运算,利用所述单模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量。
本发明提供了一种公交客流量的预测方法及系统,所述方法包括:确定影响公交客流量的预测因素,所述预测因素包括:时间、天气、假期及相似线路的客流量;所述相似线路为与目标公交线路具有多个相同站点的线路;获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型;对所述三元转移张量预测模型进行特征分解,获取特征张量,所述特征张量代表所述目标公交线路在目标时间段内客流量处于目标区间的概率;根据所述特征张量对所述目标公交线路的公交客流量进行预测;如此,考虑到时间、天气、假期、相似线路对目标公交线路客流量的影响,基于上述因素建立相应的转移张量预测模型,通过转移张量的主特征分解求特征张量,那么该特征张量表示的就是目标公交线路在天气,时间,假期、相似线路等多种因素影响下在某个客流量区间的概率,再利用特征张量预测未来一段时间内的公交客流量,这样利用多元的预测模型进行预测时,就提高了预测的准确度。
附图说明
图1为本发明实施例一提供的公交客流量的预测方法流程示意图;
图2为本发明实施例一提供的两条相似线路在客流量的变化上的相互影响示意图;
图3为本发明实施例一提供的三元客流量状态概率转移图‘’
图4为本发明实施例一提供的六阶转移张量模型示意图;
图5为本发明实施例一提供的对三元转移张量预测模型进行分解的过程示意图;
图6为本发明实施例一提供的利用
图7为本发明实施例一提供的利用
图8为本发明实施例一提供的对
图9为本发明实施例一提供的对
图10为本发明实施例一提供的利用
图11为本发明实施例二提供的公交客流量的预测装置结构示意图。
具体实施方式
为了解决现有技术中利用传统的预测方法对公交客流量进行预测时,预测结果不准的技术问题,本发明提供了一种公交客流量的预测方法及系统,所述方法包括:确定影响公交客流量的预测因素,所述预测因素包括:时间、天气、假期及相似线路的客流量;所述相似线路为与目标公交线路具有多个相同站点的线路;获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型;对所述三元转移张量预测模型进行特征分解,获取特征张量,所述特征张量代表所述目标公交线路在目标时间段内客流量处于目标区间的概率;根据所述特征张量对所述目标公交线路的公交客流量进行预测。
下面通过附图及具体实施例对本发明的技术方案做进一步的详细说明。
实施例一
本实施例提供一种公交客流量的预测方法,如图1所示,所述方法包括:
s110,确定影响公交客流量的预测因素;
为了可以提高预测模型的预测精度,本步骤中需要确定出影响公交客流量的预测因素,所述预测因素包括:时间、天气、假期及相似线路的客流量;所述相似线路为与所述目标公交线路具有多个相同站点的线路。
这里,因在不同时间,客流量是不同的,比如上下班高峰和普通时间段内的客流量必然是不同的,因此需要考虑时间因素。
天气的不同,也有可能导致客流量不同,比如晴天和雨天的客流量必然也是不同的,因此需要考虑天气因素。
假期与否,客流量也是不同的,因此需要考虑假期因素。
另外,由于某一个站点往往会有多条线路经过,乘客的出发地与目的地也很可能存在多条选择线路。当某一时刻目标公交线路的客流量急剧增加时,乘客可能会选择其他公交乘坐方案,这样客流量的状态在空间上便会发生转移,即一条线路的客流量发生改变时,与之相似的线路(即存在多个相同站点的多条线路)其客流量的变化也会受之影响。因此需要考虑到相似线路的客流量对目标公交线路的影响。
这里,图2示出了两条相似线路在客流量的变化上相互影响,它表示两条线路在客流量的变化关系上,线路1在时刻1到时刻2的范围内突然增大时,相似线路2的客流量可能也会增大。
s111,获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;
确定出预测因素后,获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;这样就考虑到了时间、客流量及线路,即马尔科夫链是三元的,那么创建出的转移张量预测模型也是三元的。
s112,基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型;
基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元客流量状态概率转移图,所述三元客流量状态概率转移图如图3所示;基于所述三元客流量状态概率转移图创建所述三元转移张量预测模型;这里,所述基于三元客流量状态概率转移图创建所述三元转移张量预测模型,具体实现如下:
将时间因素、线路因素对客流量的影响都考虑之后,那么所述三元客流量状态概率转移图可以得出一个六阶转移张量
顾名思义,所述六阶转移张量共包括六阶,分别表示针对当前时间段的线路,具体时间和客流量以及当前时间段的上一时间段的线路,具体时间和客流量。例如,该转移张量中的元素t<1号线路,8点,900,2号线路,7点,1000>,表示在上一时间段为7点且2号线路的客流量为1000的条件下,1号线路在当前时间段为8点,其客流量为900的条件概率值。该六阶转移张量需要满足于下列等式:
得到上述六阶转移张量后,为了提高预测的准确率,本实施例中还需考虑到天气因素和假期因素,因此在六阶转移张量
但是这个八阶张量本身不再表示一个转移张量了,但它在天气阶和假期阶下的子张量,即固定了天气阶w和假期阶h的下标后所得到的六阶张量
为了可以通过多模乘幂法对三元转移张量预测模型进行分解获取特征张量,需要对所述三元转移张量预测模型进行素性修正,实质上是对六阶转移张量进行素性修正,那么最后得到的八阶张量也是素性修正后的张量,具体实现如下:
根据公式(2)对六阶转移张量t进行素性修正:
其中,所述m是时间阶,客流量阶和线路阶三者笛卡尔积后的值,所述a为预设的参数,0<α<1,所述e是全为1的六阶张量。
s113,对所述三元转移张量预测模型进行特征分解,获取特征张量;
当三元转移张量预测模型创建好之后,对所述三元转移张量预测模型进行特征分解,获取特征张量。这里,可以直接利用多模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量;或者,
也可以利用变换函数将多模乘幂法运算转换为单模乘幂法运算,利用所述单模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量。
其中,利用多模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量的具体实现如下:
将所述八阶张量设置为带有天气阶和假期阶的六阶转移张量
根据所述天气阶及所述假期阶确定所述六阶转移张量的子转移张量,所述子转移张量包括2×nw个;每个子转移张量都是六阶。
将2×nw个所述子转移张量进行合并,获取一个五阶分布张量m′∈rw×h×t×l×f;为了方便统一化示,定义一个新的张量乘法
假设两个张量分别为
根据上述定义,那么可以基于所述八阶张量
进一步地,利用变换函数将多模乘幂法运算转换为单模乘幂法运算,利用所述单模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量,具体实现如下:
首先根据
然后根据
然后根据公式
最后对
可以看出,上述过程其实是利用公式
这里,因
以上的三元转移张量预测模型只考虑到了上一时间段的客流量对当前时间段的客流量影响,实质上这个三元转移张量预测模型是三元一步转移张量。
进一步地,如果考虑当前时间段的状态会受到之前更多时刻状态的影响,那么还可以建立一个三元多步的转移张量。例如,对于一个三元两步的转移张量,它表示当前时间段客流量的状态受到上一时间段的客流量状态以及上上时间段客流量状态的影响。因此需要在三元一步转移张量上再增加一个上上时间段的状态,该时刻状态有3个阶,每一个阶分别表示上上时间段时间、线路和公交客流量,成为九阶转移张量
考虑到天气因素和假期因素,与上文同样,天气阶包括nw维,所述假期阶包括2维;那么可将2×nw个9阶子转移张量组合成一个11阶的张量
然后根据
具体地,对11阶张量进行分解,实质是对每一个子转移张量做特征分解,如上文类似,根据公式
具体的算法实现如下:
输入:11阶张量
设11阶张量t中天气阶w的长度为|w|,假期阶h的长度为|h|。
(1)对于每一个w=1,…,|w|;
(2)对于每一个h=1,2,…|h|;
(3)令tsub为t在时间阶和假期阶下的子张量,即tsub=t(w,h,:,:,:,:,:,:,:,:,:);
(4)调用多模乘幂法,并令x(w,h,:,:,:)=multi-modepowermethod(tsub,α,ε),最后输出:5阶特征张量x∈rw×h×t×l×f,所述x(w,h,……)即为最后输出的5阶特征张量。
s114,根据所述特征张量对所述目标公交线路的公交客流量进行预测。
当获取到特征张量后,根据所述特征张量对所述目标公交线路的公交客流量进行预测,需要说明的是,在预测时,是对公交车经过的某个站点的客流量进行预测。
以三元一步转移张量得出的特征向量m为例进行说明,具体是根据公式(3)预测所述目标公交线路在目标时间段内的公交客流量:
其中,所述lk为所述目标公交线路,所述tk为所述目标时间段,所述
由于客流量一般是设置一个区间,这里,一般是取概率对应的最大客流量。
比如以
基于同样的发明构思,本申请还提供一种公交车客流量的预测系统,如实施例二所示。
实施例二
本实施例提供一种公交车客流量的预测系统,如图11所示,所述系统包括:确定单元61、获取单元62、创建单元63、分解单元64、预测单元65;其中,
为了可以提高预测模型的预测精度,确定单元61用于确定影响公交客流量的预测因素,所述预测因素包括:时间、天气、假期及相似线路的客流量;所述相似线路为与所述目标公交线路具有多个相同站点的线路。
这里,因在不同时间,客流量是不同的,比如上下班高峰和普通时间段内的客流量必然是不同的,因此需要考虑时间因素。
天气的不同,也有可能导致客流量不同,比如晴天和雨天的客流量必然也是不同的,因此需要考虑天气因素。
假期与否,客流量也是不同的,因此需要考虑假期因素。
另外,由于某一个站点往往会有多条线路经过,乘客的出发地与目的地也很可能存在多条选择线路。当某一时刻目标公交线路的客流量急剧增加时,乘客可能会选择其他公交乘坐方案,这样客流量的状态在空间上便会发生转移,即一条线路的客流量发生改变时,与之相似的线路(即存在多个相同站点的多条线路)其客流量的变化也会受之影响。因此需要考虑到相似线路的客流量对目标公交线路的影响。
这里,图2示出了两条相似线路在客流量的变化上相互影响,它表示两条线路在客流量的变化关系上,线路1在时刻1到时刻2的范围内突然增大时,相似线路2的客流量可能也会增大。
确定出预测因素后,获取单元62用于获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;这样就考虑到了时间、客流量及线路,即马尔科夫链是三元的,那么创建出的转移张量预测模型也是三元的。
那么创建单元63用于基于各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型。
具体地,创建单元63基于各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元客流量状态概率转移图;所述三元客流量状态概率转移图如图3所示;基于所述三元客流量状态概率转移图创建所述三元转移张量预测模型;这里,所述基于三元客流量状态概率转移图创建所述三元转移张量预测模型,具体实现如下:
将时间因素、线路因素对客流量的影响都考虑之后,那么所述三元客流量状态概率转移图可以得出一个六阶转移张量
顾名思义,所述六阶转移张量共包括六阶,分别表示针对当前时间段的线路,具体时间和客流量以及当前时间段的上一时间段的线路,具体时间和客流量。例如,该转移张量中的元素t<1号线路,8点,900,2号线路,7点,1000>,表示在上一时间段为7点且2号线路的客流量为1000的条件下,1号线路在当前时间段为8点,其客流量为900的条件概率值。该六阶转移张量需要满足于下列等式:
得到上述六阶转移张量后,为了提高预测的准确率,本实施例中还需考虑到天气因素和假期因素,因此在六阶转移张量
但是这个八阶张量本身不再表示一个转移张量了,但它在天气阶和假期阶下的子张量,即固定了天气阶w和假期阶h的下标后所得到的六阶张量
为了可以通过多模乘幂法对三元转移张量预测模型进行分解获取位移的特征张量,需要对所述三元转移张量预测模型进行素性修正,实质上是对六阶转移张量进行素性修正,那么最后得到的八阶张量也是素性修正后的张量,具体实现如下:
根据公式(2)对六阶转移张量t进行素性修正:
其中,所述m是时间阶,客流量阶和线路阶三者笛卡尔积后的值,所述a为预设的参数,0<α<1,所述e是全为1的六阶张量。
当三元转移张量预测模型创建好之后,分解单元64用于对所述三元转移张量预测模型进行特征分解,获取特征张量,所述特征张量代表所述目标公交线路在目标时间段内客流量处于目标区间的概率。
这里,可以直接利用多模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量;或者,
也可以利用变换函数将多模乘幂法运算转换为单模乘幂法运算,利用所述单模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量。
其中,利用多模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量的具体实现如下:
分解单元64将所述八阶张量设置为带有天气阶和假期阶的六阶转移张量
根据所述天气阶及所述假期阶确定所述六阶转移张量的子转移张量,所述子转移张量包括2×nw个;每个子转移张量都是六阶。
将2×nw个所述子转移张量进行合并,获取一个五阶分布张量m′∈rw×h×t×l×f;为了方便统一化示,定义一个新的张量乘法
假设两个张量分别为
根据上述定义,那么可以基于所述八阶张量
进一步地,利用变换函数将多模乘幂法运算转换为单模乘幂法运算,利用所述单模乘幂法运算对所述三元转移张量预测模型进行特征分解,获取所述特征张量,具体实现如下:
首先根据
然后根据
然后根据公式
最后对
可以看出,上述过程其实是利用公式
这里,因
以上的三元转移张量预测模型只考虑到了上一时间段的客流量对当前时间段的客流量影响,实质上这个三元转移张量预测模型是三元一步转移张量。
进一步地,如果考虑当前时间段的状态会受到之前更多时刻状态的影响,那么还可以建立一个三元多步的转移张量。例如,对于一个三元两步的转移张量,它表示当前时间段客流量的状态受到上一时间段的客流量状态以及上上时间段客流量状态的影响。因此需要在三元一步转移张量上再增加一个上上时间段的状态,该时刻状态有3个阶,每一个阶分别表示上上时间段时间、线路和公交客流量,成为九阶转移张量
考虑到天气因素和假期因素,与上文同样,天气阶包括nw维,所述假期阶包括2维;那么可将2×nw个9阶子转移张量组合成一个11阶的张量
然后根据
具体地,对11阶张量进行分解,实质是对每一个子转移张量做特征分解,如上文类似,根据公式
具体的算法实现如下:
输入:11阶张量
设11阶张量t中天气阶w的长度为|w|,假期阶h的长度为|h|。
(1)对于每一个w=1,…,|w|;
(2)对于每一个h=1,2,…|h|;
(3)令tsub为t在时间阶和假期阶下的子张量,即tsub=t(w,h,:,:,:,:,:,:,:,:,:);
(4)调用多模乘幂法,并令x(w,h,:,:,:)=multi-modepowermethod(tsub,α,ε),最后输出:5阶特征张量x∈rw×h×t×l×f,所述x(w,h,……)即为最后输出的5阶特征张量。
当获取到特征张量后,预测单元65用于根据所述特征张量对所述目标公交线路的公交客流量进行预测,需要说明的是,在预测时,是对公交车经过的某个站点的客流量进行预测。
以三元一步转移张量得出的特征向量m为例进行说明,具体是根据公式(3)预测所述目标公交线路在目标时间段内的公交客流量:
其中,所述lk为所述目标公交线路,所述tk为所述目标时间段,所述
由于客流量一般是设置一个区间,这里,一般是取概率对应的最大客流量。
比如以
本发明实施例提供的公交客流量的预测方法及系统能带来的有益效果至少是:
本发明实施例提供的公交客流量的预测方法及系统,所述方法包括:确定影响公交客流量的预测因素,所述预测因素包括:时间、天气、假期及相似线路的客流量;所述相似线路为与目标公交线路具有多个相同站点的线路;获取各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期;基于所述各历史时间段内所述目标公交线路的客流量数据、所述相似线路的客流量数据、所述各历史时间段内的天气以及是否处于假期,根据三元马尔科夫链创建三元转移张量预测模型;利用多模乘幂法对所述三元转移张量预测模型进行特征分解,获取特征张量,所述特征张量代表所述目标公交线路在目标时间段内客流量处于目标区间的概率;根据所述特征张量对所述目标公交线路的公交客流量进行预测;如此,考虑到时间、天气、假期、相似线路对目标公交线路客流量的影响,将过去一段历史时间内的客流量变化规律离散化成一个状态转移图,基于上述因素,根据状态转移图建立相应的转移张量预测模型,通过转移张量的主特征分解求特征张量,那么该特征张量表示的就是该多元状态转移图的稳态分布,即目标公交线路在天气,时间,假期多种因素影响下在某个客流量区间的概率,再利用特征张量预测未来一段时间内的公交客流量,这样利用多元的预测模型进行预测时,就提高了预测的准确度。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。