本发明属于智能交通技术领域,具体地说,是涉及一种交通流量预测方法,更具体地说,是涉及一种基于时空相关性的短时交通流量预测方法。
背景技术:
交通流量预测指的是根据历史的交通数据来预测未来时刻的交通流量变化情况。随着城市智能交通系统的快速发展,作为智能交通系统的重要一环,交通流量预测、尤其是时间序列的数据间隔较小的短时交通流量预测,不仅可以帮助人们规划出行路线、节省出行时间,从而减少交通拥堵以及不必要的资源浪费,而且还为将来信息感知、深度互联、协同共享、智能处理、应用开放的智慧城市建设发挥至关重要的作用。
交通流量的变化随着时间的变化具有随机性,并且容易受到外界条件的干扰。短时交通流量的变化情况更是一种实时的、非平稳的、非线性的随机过程,它的变化情况不仅与当前监测点的前几个时段的交通流量状况相关,而且会受上下游监测点的前几个时刻以及当前时刻交通状况的影响。现有技术中,短时交通流量预测方法主要包括参数模型方法和非参数模型方法。参数模型是指基于某些假设的、具有固定结构的模型,并且可以使用经验数据计算参数。最常用的参数模型是自回归滑动平均模型(autoregressivemovingaveragemodel,arima),其基本思想是利用最近一组的实际交通流量值来预测未来一段时间间隔内的交通流量数据。非参数模型是指没有固定结构,且没有固定参数的模型。目前,最常见的非参数模型当属深度学习中的神经网络模型(neuralnetwork,nn),通过构建多隐藏层的模型和海量交通训练数据来学习更有用的交通数据特征,从而来提高短时交通流量预测的准确性。卷积-长短期记忆神经网络(conventional-longshorttermmemorynetwork,conv-lstm)作为短时交通流量预测的有效方法,利用卷积神经网络来提取交通流量的空间特征,使用长短期记忆网络提取交通流量的时间特征,从而使得预测结果更为准确。
卷积-长短期记忆神经网络虽然考虑了时空和周期性,提高了交通流量预测的准确性,但是其模型复杂,参数多,方法的收敛速度慢,无法做到预测的实时性,这对于实时性要求高的短时交通流量预测而言实用性和可靠性不足。
技术实现要素:
本发明的目的是提供一种基于时空相关性的短时交通流量预测方法,解决现有技术短时交通流量预测存在的模型复杂、预测速度慢等的问题。
为实现上述发明目的,本发明采用下述技术方案予以实现:
一种基于时空相关性的短时交通流量预测方法,所述方法包括:
确定交通流量数据的时空特征的过程:
获取包含目标预测点和多个其他已知监测点在内的当天交通流量数据,确定当天交通流量数据矩阵ftoday,
对所述当天交通流量数据矩阵进行卷积处理,获得交通流量数据的空间特征;
将所述当天交通流量数据的空间特征输入至门控循环单元进行处理,获得融合空间相关性的时间特征序列,作为交通流量数据的时空特征;
确定交通流量数据的周期性特征的过程:
获取所述目标预测点和所述监测点在前一天相同时刻及上周同一天相同时刻的交通流量数据,分别确定前一天交通流量数据矩阵fyesterday和上周交通流量数据矩阵fweek;其中,
将所述前一天交通流量数据矩阵和所述上周交通流量数据矩阵同时输入至双向门控循环单元进行处理,获得交通流量数据的周期性特征;
特征融合及预测过程:
将所述交通流量数据的时空特征和所述交通流量数据的周期性特征进行融合,将融合后的数据输入预测器,预测目标预测点的交通流量。
如上所述的方法,对所述当天交通流量数据矩阵进行卷积处理,获得交通流量数据的空间特征,具体包括:
对所述当天交通流量数据矩阵进行卷积处理,获得卷积后的初始空间特征;
采用平均池化技术处理所述初始空间特征,获得所述交通流量数据的空间特征。
如上所述的方法,对所述当天交通流量数据矩阵进行卷积处理,具体包括:
采用滑动滤波器对所述当天交通流量数据矩阵进行滑动卷积,得到与所述当天交通流量数据矩阵的元素对应的多个卷积值,形成所述当天交通流量数据矩阵的总卷积值a=(a1,a2,…,an),n根据所述当天交通流量数据矩阵的元素数确定;
采用公式g(i)=r(aiw+b)聚合所有的卷积值,获得所述初始空间特征;
其中,g(i)为初始空间特征,r为激活函数,ai为第i行的卷积值,i=1,2,…,n,w为滑动滤波器的权重,b为偏置项。
如上所述的方法,所述获取包含目标预测点和多个其他已知监测点在内的当天交通流量数据,确定当天交通流量数据矩阵,具体包括:
将所述目标预测点的交通流量数据作为矩阵中心,根据监测点与目标预测点的实际距离的近远依次在所述目标预测点的交通流量数据左右两侧填充监测点的交通流量数据至矩阵中,形成所述当天交通流量数据矩阵;且满足:监测点距离所述目标预测点的实际距离越近,在所述当天交通流量数据矩阵中,监测点的交通流量数据距离所述目标预测点的交通流量数据的距离也越近。
如上所述的方法,将所述交通流量数据的时空特征和所述交通流量数据的周期性特征进行融合,具体包括:
采用深度神经网络的全连接层将所述交通流量数据的时空特征和所述交通流量数据的周期性特征进行融合。
如上所述的方法,所述将融合后的数据输入预测器,预测目标预测点的交通流量,具体包括:
将融合后的数据输入到深度神经网络的回归层中,利用回归层预测目标预测点的交通流量。
如上所述的方法,所述方法还包括:
在所述回归层中,使用均方误差作为损失函数进行训练,并使用rmsprop算法优化所述深度神经网络,调整所述深度神经网络的学习速率。
与现有技术相比,本发明的优点和积极效果是:本发明提供的短时交通流量预测方法,利用卷积-门控循环单元提取交通流量的时空特征,利用双向门控循环单元提取交通流量的周期性特征,从而充分考虑了交通流量的时间特征、空间特征和周期性特征,可以解决短时交通流量受时间和空间的影响,且在时间、空间上分布不均的问题,提高了短时交通流量预测的准确性;由于门控循环单元模型结构更加简单,使用的参数少,因此收敛速度快,可以更加准确、快速地预测短时交通流量;而且,卷积与门控循环单元并非并行运行,而是先后运行,先利用卷积提取交通流量数据的空间特征,再将空间特征作为门控循环单元的输入,获得融合空间相关性的时间特征,能够充分融合交流流量特征,有助于提高短时交通流量预测的准确性;而在运用双向门控循环单元提取交通流量的周期性特征时,从交通流量预测的实际情况出发,使用前一天同一时刻的数据和一周前同一天同一时刻的数据作为模型的输入,使得交通流量的预测更加具有真实性和可靠性;从而,应用本发明的方法,使得短时交通流量的预测结果更加准确、快速、可靠,具有较强的实用性。
结合附图阅读本发明的具体实施方式后,本发明的其他特点和优点将变得更加清楚。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是基于本发明时空相关性的短时交通流量预测方法一个实施例的流程图;
图2是基于本发明时空相关性的短时交通流量预测方法中确定交通流量数据的时空特征一个具体实例的流程图;
图3为图2实施例中的门控循环单元的结构图;
图4为图1实施例中的双向门控循环单元的结构图;
图5为采用两种方法预测短时交通流量在迭代次数下的训练时间。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下将结合附图和实施例,对本发明作进一步详细说明。
图1所示为基于本发明时空相关性的短时交通流量预测方法一个实施例的流程图。
如图1所示,该实施例采用下述过程实现短时交通流量预测:
步骤1:采用卷积和门控循环单元确定交通流量数据的时空特征,采用双向门控循环单元确定交通流量数据的周期性特征。
采用卷积和门控循环单元确定交通流量数据的时空特征,具体执行过程参见图2一个具体实施例的流程图。
如图2所示,确定交通流量数据的时空特征的过程为:
步骤11:确定当天交通流量数据矩阵。
获取包含目标预测点和多个其他已知监测点在内的当天交通流量数据,确定出当天交通流量数据矩阵,记为ftoday,表达式为:
在上述表达式ftoday中,r表示目标预测点或监测点,t表示当天某个时刻,
由于交通流量数据的预测点和监测点不均匀分布在不同的区域或路口,收集的交通流量数据的位置呈现不对称状态,且间隔很大,而且,一般的,距离越近的两个点之间的交通流量的影响越大,也即,距离越近,空间相关性越强。为更准确地反映目标预测点与其他监测点之间的空间相关性,作为优选实施例,在确定当天交通流量数据矩阵时,将目标预测点的交通流量数据作为矩阵中心,根据监测点与目标预测点的实际距离的近远在目标预测点的交通流量数据左右两侧填充监测点的交通流量数据至矩阵中,形成当天交通流量数据矩阵。而且,在该当天交通流量数据矩阵中,满足:监测点距离目标预测点的实际距离越近,在当天交通流量数据矩阵中,监测点的交通流量数据距离目标预测点的交通流量数据的距离也越近。
步骤12:对当天交通流量数据矩阵进行卷积处理,获得交通流量数据的空间特征。
作为优选实施方式,该过程采用两步来实现:首先,对步骤11确定的当天交通流量数据矩阵进行卷积处理,获得卷积后的初始空间特征;然后,采用平均池化技术处理初始空间特征,以降低初始空间特征的维度,过滤掉不必要的信息,以获得更抽象的空间特征。
具体来说,首先,采用滑动滤波器对当天交通流量数据矩阵进行滑动卷积,得到与当天交通流量数据矩阵的元素对应的多个卷积值,形成当天交通流量数据矩阵的总卷积值a=(a1,a2,…,an),n根据当天交通流量数据矩阵的元素数确定。
在优选实施例中,采用卷积核为3、滑动步数为1的滑动滤波器f=(f1,f2,f3)进行卷积处理。
首先,将当天交通流量数据矩阵ftoday中第一行的前三个交通流量数据
然后,采用公式g(i)=r(aiw+b)聚合所有的卷积值,获得初始空间特征,形成初始空间特征矩阵,与当天交通流量数据相对应的,在该初始空间特征矩阵中,矩阵的行表示一个时间段的空间特征。其中,g(i)为卷积后的初始空间特征,r为激活函数,ai为第i行的卷积值,i=1,2,…,n,w为滑动滤波器的权重,b为偏置项,r、w和b均已知。
再然后,对初始空间矩阵,以行为单位,分别进行平均池化处理,获得降维后的交通流量数据的空间特征。而且,该空间特征为一个时间序列矩阵,是具有空间特征的时间序列矩阵。
步骤13:将当天交通流量数据的空间特征输入至门控循环单元进行处理,获得融合空间相关性的时间特征序列,作为交通流量数据的时空特征。
门控循环单元结构如图3所示,包括两个门控,分别为更新门和重置门。更新门主要用来控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大,说明前一时刻的状态信息带入越多。重置门用于控制忽略前一时刻的状态信息的程度,重置门的值越小,说明忽略得越多。
将步骤12获得的当天交通流量数据的空间特征作为输入,输入至门控循环单元进行处理,门控循环单元的具体处理过程如下:
将前一时刻的状态信息ht-1和当前时刻的输入xt送到重置门中,以确定从前一时刻丢弃哪部分信息:rt=σ(wr·[ht-1,xt]+br)。其中,rt是重置门的输出,σ是激活函数,wr是重置门的权重,br是重置门的偏置项。
将ht-1和xt送到更新门中,以确定要更新前一时刻的哪部分信息:zt=σ(wz·[ht-1,xt]+bz)。其中,zt是更新门的输出,σ是激活函数,wz是更新门的权重,bz是更新门的偏置项。
将rt和xt运用激活函数tanh,用来产生一个候选的状态信息
通过丢弃ht-1和保留
通过激活函数将ht激活,就可以得到融合空间相关性的时间特征序列yt,作为交通流量数据的时空特征:
yt=σ(wo·ht)。其中,wo是输出数据的权重。
上述各公式中的激活函数、权重及偏置项均为设定值。
交通流量具有非常明显的周期特点,因此,在该实施例的步骤1中,除了采用卷积和门控循环单元确定交通流量数据的时空特征之外,还采用双向门控循环单元确定交通流量数据的周期性特征。双向门控循环单元的的结构如图4所示,图4中,双向门控循环单元由向上堆叠和向下堆叠的单向门控循环单元gru组成,因此,双向门控循环单元需要两个时间序列输入,最终输出结果由正向输出和反向输出两个输出共同决定。对于双向门控循环单元所需要的两个时间序列,为提高预测的准确度,结合交通流量只能获得预测时间之前的交通流量数据、不能获得预测时间之后的交通流量数据的特点,利用前一天相同时刻的交通流量数据和上周同一天相同时刻的交通流量数据作为双向模块循环单元的两个输入时间序列,来提取交通流量数据的周期性特征。
具体的,是基于步骤11中确定当天交通流量数据矩阵时所用的当天交通流量数据中的时刻,分别获取目标预测点和多个其他已知监测点在前一天相同时刻的交通流量数据以及上周同一天相同时刻的交通流量数据;然后,根据步骤11确定当天交通流量数据矩阵的方法,确定出前一天交通流量数据矩阵fyesterday和上周交通流量数据矩阵fweek。
其中,
步骤2:将交通流量数据的时空特征和周期性特征进行融合,将融合后的数据输入预测器,预测目标预测点的交通流量。
在步骤1确定了交通流量数据的时空特征和周期性特征后,将两部分特征融合,具体融合方法可以采用现有技术中的数据融合方法。作为优选实施例,采用深度神经网络的全连接层将交通流量数据的时空特征和交通流量数据的周期性特征顺序连接到特征矩阵中,进行特征融合。
融合后的特征数据输入到预测器中,预测目标预测点的交通流量。预测器也可以采用现有技术中的结构来实现,优选的,采用深度神经网络的回归层作为预测器,将融合后的数据输入到回归层中。利用回归层预测目标预测点的交通流量。并且,在回归层中,为提高预测精确度,使用均方误差作为损失函数进行训练,以准确地描述真实值和预测值之间的差异。同时,还使用rmsprop算法(均方根反向传播算法)优化所述深度神经网络,调整深度神经网络的学习速率,防止损失函数在更新时存在摆动幅度过大的情况,提高预测精度,同时还能够进一步加快函数的收敛速度,提高预测速度。
需要说明的是,在预测阶段,在当天交通流量数据矩阵中,要预测的目标预测点在要预测的时刻的数据是未知的,其余数据均是已知的。前一天交通流量数据矩阵和上周交通流量数据矩阵中的数据均是已知的。而在预测阶段之前,还包括训练阶段,利用已知的数据训练整个预测过程所用的各模型单元,预测阶段是使用训练后的模型单元执行目标预测点在预测时刻的交通流量数据的预测。
在上述图1实施例及其他优选实施例中,利用卷积-门控循环单元提取交通流量的时空特征,利用双向门控循环单元提取交通流量的周期性特征,从而充分考虑了交通流量的时间特征、空间特征和周期性特征,可以解决短时交通流量受时间和空间的影响,且在时间、空间上分布不均的问题,提高了短时交通流量预测的准确性。由于门控循环单元模型结构更加简单,使用的参数少,因此收敛速度快,可以更加准确、快速地预测短时交通流量。而且,卷积与门控循环单元并非并行运行,而是先后运行,先利用卷积提取交通流量数据的空间特征,再将空间特征作为门控循环单元的输入,获得融合空间相关性的时间特征,能够充分融合交流流量特征,有助于提高短时交通流量预测的准确性。而在运用双向门控循环单元提取交通流量的周期性特征时,从交通流量预测的实际情况出发,使用前一天同一时刻的数据和一周前同一天同一时刻的数据作为模型的输入,使得交通流量的预测更加具有真实性和可靠性。从而,使得短时交通流量的预测结果更加准确、快速、可靠,具有较强的实用性。
下面结合具体实例进一步阐述采用上述实施例及优选实施例的短时交通流量预测方法的技术效果。
对采集的交通流量数据,使用上述实施例的卷积-门控循环单元提取时空特征,使用双向门控循环单元提取周期性特征,基于时空特征和周期性特征进行训练及短时交通流量预测,该方法标记为conv-gru。另外,使用相同的交通流量数据,分别采用conv-lstm、cnn-gru(卷积神经网络_门控循环单元,卷积处理与门控循环单元并行运行)、cnn-lstm、gru、lstm以及sae(堆栈自编码器)这六种方法进行短时交通流量预测。对conv-gru的结果与其他六种方法的结果比对分析如下:
使用平均绝对误差(mae)和均方根误差(rmse)两个评价指标来评估预测结果,表1和表2分别示出了七种方法在工作日交通流量预测中的性能和在周末交通流量预测中的性能。
表1:不同方法在工作日交通流量预测中的性能
表2:不同方法在周末交通流量预测中的性能
分析上面两个表中的数据可知,conv-gru方法在mae和rmse上要低于cnn-lstm、cnn-gru、gru、lstm以及sae,和conv-lstm基本相差无几。
进一步分析,conv-gru方法和conv-lstm方法,无论是在预测性能还是预测结果方面都相差不大,但是在两者性能和预测结果相差无几的情况下,conv-gru方法每次迭代所需要的时间要比conv-lstm少,conv-gru方法和conv-lstm不同的迭代次数下的训练时间如图5所示。这主要是由于门控循环单元gru模型与lstm模型相比,少了一个门控单元,这就意味着gru模型比lstm少了几个向量乘法操作,而这在训练数据量特别大或者迭代步数特别多的情况下,gru要比lstm节省很多时间,因此,采用conv-gru,能显著提高预测速度。
以上实施例仅用以说明本发明的技术方案,而非对其进行限制;尽管参照前述实施例对本发明进行了详细的说明,对于本领域的普通技术人员来说,依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明所要求保护的技术方案的精神和范围。