交通流量预测方法、电子设备及存储介质

文档序号:26009793发布日期:2021-07-23 21:29阅读:143来源:国知局
交通流量预测方法、电子设备及存储介质

本发明涉及交通技术领域,尤其涉及一种交通流量预测方法、电子设备及存储介质。



背景技术:

交通流量预测是智能交通研究领域的重要方面。现有的交通流量预测方法主要是对在城市固定位置架设的传感器设备所统计的交通流量数据进行预测。用于统计交通信息的传感器设备通常架设在主干道中,用于统计当前道路的车流量、车速、道路占用率等信息。利用这些固定点的交通信息,研究人员能够对当前道路进行相关的交通预测任务。

但是由于上述数据都是产生于固定的数据搜集点,所以对于此种数据处理的算法只能预测当前道路或是小区域的交通信息。



技术实现要素:

本发明实施例提供一种交通流量预测方法、电子设备及存储介质,能够克服现有技术只能预测当前道路或是小区域的交通信息的缺点。

本发明实施例的第一方面,提供一种交通流量预测方法,包括:对待预测交通流量区域进行网格划分,将所述待预测交通流量区域划分为多个网格单元;

获取所述多个网格单元的相对位置信息以及所述多个网格单元在第一预设时间阈值的第一交通流量信息,其中,所述相对位置信息包括每个网格单元的中心点位置与其他网格单元的中心点位置的相对位置关系所构成的矩阵,所述第一交通流量信息包括在第一预设时间阈值通过每个网格单元的车的数量;

根据所述相对位置信息以及所述第一交通流量信息,通过预选训练好的交通流量预测模型,预测所述待预测交通流量区域在第二预设时间阈值的交通流量信息,其中,所述交通流量预测模型是基于两层时间卷积神经网络和一层图卷积神经网络构成的神经网络模型,用于预测一定区域内的交通流量。

可选地,所述获取所述多个网格单元的相对位置信息的方法包括:

获取每个网格单元的中心点的经纬度信息,以及所述待预测交通流量区域进行网格划分后的维度信息;

根据所述中心点的经纬度信息以及所述维度信息,获取所述每个网格单元的中心点的第一位置信息;

根据所述每个网格单元的中心点的第一位置信息,确定所述多个网格单元的相对位置信息。

可选地,所述通过预选训练好的交通流量预测模型,预测所述待预测交通流量区域在第二预设时间阈值的交通流量信息的方法包括:

所述交通流量预测模型的第一层时间卷积神经网络获取所述相对位置信息以及所述第一交通流量信息的第一时间特征信息,并将所述第一时间特征信息发送至图卷积神经网络,其中,所述第一时间特征信息包括所述相对位置信息以及所述第一交通流量信息的底层时间特征信息;

所述图卷积神经网络将所述第一时间特征信息的时间复杂度降低至预设阈值,获取所述相对位置信息以及所述第一交通流量信息的空间相对性,并将时间复杂度降低至预设阈值的第一时间特征信息发送至第二层时间卷积神经网络;

所述第二层时间卷积神经网络获取时间复杂度降低至预设阈值的第一时间特征信息的第二时间特征信息,并根据所述第二时间特征信息预测在第二预设时间阈值的交通流量信息,其中,所述第二时间特征信息包括时间复杂度降低至预设阈值的第一时间特征信息的高层时间特征信息。

可选地,所述方法还包括:

获取所述待预测交通流量区域当天的天气信息,将所述天气信息拓展为四维天气空间特征信息;

将所述四维天气空间特征信息与所述交通流量预测模型的中间特征信息进行拼接,获取天气时序信息,其中,所述天气时序信息用于指示所述天气信息在预测交通流量信息中所占的比重;

所述交通流量预测模型的第二层时间卷积神经网络获取所述天气时序信息的高层时间特征信息,其中,所述天气时序信息的高层时间特征信息用于提高预测所述交通流量信息的准确性。

可选地,所述方法还包括:

通过预先获取的相对位置信息以及第一交通流量信息训练所述交通流量预测模型,所述训练交通流量预测模型的方法包括:

基于预先获取的相对位置信息以及第一交通流量信息的均值信息,在所述均值信息中加入预设的稳定因子以及预设学习矩阵,训练所述交通流量预测模型,以使待训练的交通流量预测模型的收敛速度达到预设阈值,其中,所述稳定因子用于增加训练所述交通流量预测模型的计算稳定性,所述学习矩阵用于提高所述交通流量预测模型的学习能力。

可选地,所述训练交通流量预测模型的方法包括:

按照如下公式所示的方法训练所述交通流量预测模型:

其中,y表示归一化后的特征数据,x表示输入数据的横坐标,μ表示输入数据的均值,v表示输入数据的方差,eps表示稳定因子,gamma表示第一学习系数矩阵,beta表示第二学习系数矩阵。

可选地,所述交通流量预测模型的第一层时间卷积神经网络获取所述相对位置信息以及所述第一交通流量信息的第一时间特征信息的方法包括:

按照如下公式所示的方法获取所述第一时间特征信息:

其中,g(θ)表示原始图特征,y表示所述第一时间特征信息,k表示切比雪夫多项式的阶数,θi表示第i个图节点特征值,表示拉普拉斯矩阵的近似过程,表示改进后的拉普拉斯矩阵;

所述图卷积神经网络将所述第一时间特征信息的时间复杂度降低至预设阈值的方法包括:

按照如下公式所示的方法将时间复杂度降低至预设阈值:

其中,表示改进后拉普拉斯矩阵中第i-1个近似向量,表示改进后拉普拉斯矩阵中第i-2个近似向量,δmax表示稳定因子,l表示原始拉普拉斯矩阵,in表示全局近似差。

可选地,所述获取所述每个网格单元的中心点的第一位置信息的方法包括:

按照如下公式所示的方法获取所述第一位置信息:

其中,loc(i,j)表示所述第一位置信息,xi表示第i个中心点的横坐标,yi表示第i个中心点的纵坐标,len表示所述中心点的经度,wid表示所述中心点的纬度,n表示所述待预测交通流量区域进行网格划分后的维度信息;

所述确定所述多个网格单元的相对位置信息的方法包括:

按照如下公式所示的方法确定所述相对位置信息:

其中,d(i,k)表示第i个和第i+k个中心点的相对位置信息,xi+k表示第i+k个中心点的横坐标,yi+k表示第i+k个中心点的纵坐标。

本发明实施例的第二方面,提供一种电子设备,包括:处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述任意一项所述的交通流量预测方法。

本发明实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现前述任意一项所述的交通流量预测方法。

本公开提供的交通流量预测方法对待预测交通流量区域进行网格划分,将所述待预测交通流量区域划分为多个网格单元,将城市区域映射为图结构数据,符合图卷积神经网络的设计模式,有利于提高流量预测的准确度;

获取所述多个网格单元的相对位置信息以及所述多个网格单元在第一预设时间阈值的第一交通流量信息,通过对多个网格单元进行时序预测,从而能够得到全局的交通数据变化信息,不会遗漏任何区域;

根据所述相对位置信息以及所述第一交通流量信息,通过预选训练好的交通流量预测模型,预测所述待预测交通流量区域在第二预设时间阈值的交通流量信息,其中,所述交通流量预测模型是基于两层时间卷积神经网络和一层图卷积神经网络构成的神经网络模型,通过利用时间卷积神经网络的空洞卷积思想可以克服传统递归神经网络计算量大,训练速度缓慢的问题,并且时间卷积神经网络的因果卷积机制有助于提取长历史数据信息,使得交通流量中长期预测结果更加准确,此外,双层时间卷积神经网络的设计结构能够使得连续区域的流量特征变化更加明显。

附图说明

图1为本申请实施例交通流量预测方法的流程示意图;

图2为本申请实施例交通流量预测模式的示意图;

图3为本申请实施例将网格映射到坐标系的示意图;

图4为本申请实施例交通流量预测模型的架构示意图;

图5为本申请实施例残差网络实现过程示意图;

图6为本申请实施例通过流量数据验证预测任务准确性的示意图;

图7为本申请实施例a市部分区域车辆分布情况示意图;

图8为本申请实施例连续一小时城市数据预测结果示意图;

图9为本申请实施例现有模型与本申请模型对比试验的结果图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含a、b和c”、“包含a、b、c”是指a、b、c三者都包含,“包含a、b或c”是指包含a、b、c三者之一,“包含a、b和/或c”是指包含a、b、c三者中任1个或任2个或3个。

应当理解,在本发明中,“与a对应的b”、“与a相对应的b”、“a与b相对应”或者“b与a相对应”,表示b与a相关联,根据a可以确定b。根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。a与b的匹配,是a与b的相似度大于或等于预设的阈值。

取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。

在实际应用中,深度学习时序关系预测在智能交通和城市计算领域有非常广泛的应用,其中,递归神经网络在交通流量预测中扮演了一个重要的角色。为了表示交通道路网中不同路段之间的空间关系,基于轨迹起点与终点关联矩阵(odc)能够作为多层级联lstm(longshort-termmemory,长短期记忆网络)的输入。无监督的自动编码器能够加强数据的时序特征,它与lstm的结合能够更好的预测车流量的时序变化。

卷积神经网络的出现强力的推动了深度学习的发展。卷积神经网络的基本过程是先提取底层边缘特征,再到高层特征,最终融合成整个目标的特征。这种由底层到高层的抽象过程被研究者们用在了交通流量预测的空间特征提取过程。比如:多任务深度学习框架可以对多种因素进行相关性特征提取,它将空间节点的输入流量与输出流量分离后进行预测,这种方法适合单位区域内的流量计算,但是这种方法使得所有单位区域的流量时间序列计算任务更加艰难,不适合对大城市区域进行全局流量或是流量走向趋势预测。

stdn考虑了时间的平移动态性,并利用局部cnn的方法对区域流量的空间相对性进行了平移依赖建模。为了提取数据的时序周期依赖性特征,stdn利用lstm和时间注意力机制对长期周期信息和时间进行了平移建模。部分研究按照经纬度分布将城市划分为网格,网格内车辆的进出量作为流量的时间序列,并利用卷积神经网络提取车流量空间的相关性,并用lstm提取车流量时间的依赖性。尽管lstm以及其他的递归神经网络在计算数据复杂的时间相关性方面有巨大优势,但基于lstm的网络被广泛认为难以训练且计算量大,使得训练速度非常缓慢。

cnn通过计算中心像素点以及相邻像素点的加权和来构成featuremap实现空间特征的提取,但是它能够处理的矩阵只能是euclideanstructure.gcn是专门处理noneuclidenstructure的数据,如社交网络、信息网络和交通节点网络。gcn利用谱图卷积神经网络(spectralgraphconvolutionalneuralnetworks)计算图结构及其节点的特征。t-gcn利用gcn学习复杂的拓扑结构来捕获空间依赖关系,利用gru学习交通数据的动态变化来捕获时间依赖关系。但是t-gcn将每条道路作为统计节点来完成对于每条道路的预测任务。这种设计模式不适合预测城市全局的交通数据。

部分研究利用车流量的时间序列数据实现了城市节点的流量预测任务。stgcn是由多层时空卷积块构成的时空卷积网络。为了提升训练速度,研究者用完全卷积结构实现了时序计算模块来捕获复杂的时序依赖性。stgcn的应用非常广泛,可以用来预测交通流量、速度以及道路占用率等参数信息。astgcn是在stgcn的基础上实现的用于预测交通流量的模型。为了增加数据的时间依赖性,它对邻近、每日和每周(recent、daily-periodicandweekly-periodic)三个维度的流量数据进行了建模。astgcn是多个时空模块组成,每个时空模块会进行时空注意力和gcn两个过程来捕获三个维度数据的动态时空关联性。最终它对三个维度的特征进行了加权融合,生成了最终的预测结果。stgcn与astgcn都是对pems数据进行建模,而pems数据是加利福尼亚城市通过在相距很远的固定位置架设传感器收集获得的,数据只代表了固定点的交通信息变化,这就决定了他们都不适合对城市所有的区域进行流量预测工作。

为了解决上述问题,本公开实施例提供一种交通流量预测方法,能够有效克服现有技术的问题,并且带来相应的技术效果。

图1示例性地示出本申请实施例交通流量预测方法的流程示意图,如图1所示,所述方法包括:

步骤s101、对待预测交通流量区域进行网格划分,将所述待预测交通流量区域划分为多个网格单元;

图2示例性地示出本公开实施例交通流量预测模式的示意图,如图2所示,为了得到全局的交通数据变化信息,不遗漏任何区域,本公开实施例对待预测交通流量区域进行网格划分,将待预测交通流量区域划分为多个网格单元。通过网格划分,可以对每个局部区域进行时序预测,继而得到全局的交通数据的变化信息,此种方式能够克服现有的交通流量预测方式只能预测当前道路或者小区域的交通信息的缺点。

对待预测交通流量区域进行网格划分,将所述待预测交通流量区域划分为多个网格单元,从而可以将城市区域映射为图结构数据,符合图卷积神经网络的设计模式,有利于提高流量预测的准确度。

步骤s102、获取所述多个网格单元的相对位置信息以及所述多个网格单元在第一预设时间阈值的第一交通流量信息;

示例性地,所述相对位置信息包括每个网格单元的中心点位置与其他网格单元的中心点位置的相对位置关系所构成的矩阵,所述第一交通流量信息包括在第一预设时间阈值通过每个网格单元的车的数量。

深度学习的发展日新月异,从经典的深度网络(dnn(deepneuralnetworks,深度神经网络)、cnn(convolutionalneuralnetworks,卷积神经网络)、rnn(recurrentneuralnetwork,循环神经网络))到强化学习的图神经网络,深度学习的应用场景越来越丰富。

图神经网络是研究人员借助卷积网络、循环网络以及深度自动编码器的思想设计而成的模型,它主要用于处理具备图结构的数据。在交通流量预测研究中,我们通常可以利用g=(w,v)定义一个图结构,w代表空间节点,v代表节点的流量数据,这种图结构表示了单位时间片内一个区域的空间流量相对关系。借助深度学习强大的数据感知和时序预测能力,我们能够计算出未来每个时间片的g信息,从而完成交通流量的预测任务。

在一种可选的实施方式中,所述获取所述多个网格单元的相对位置信息的方法包括:

获取每个网格单元的中心点的经纬度信息,以及所述待预测交通流量区域进行网格划分后的维度信息;

根据所述中心点的经纬度信息以及所述维度信息,获取所述每个网格单元的中心点的第一位置信息;

根据所述每个网格单元的中心点的第一位置信息,确定所述多个网格单元的相对位置信息。

本公开实施例中,对于空间节点的计算,可以将网格的中心点代表每个区域。图3示例性地示出本公开实施例将网格映射到坐标系的示意图,如图3所示,计算每个区域的相对关系时,可以计算相对应的中心点之间的坐标系距离,网格中每个中心点在坐标系的位置可以如下公式所示:

其中,loc(i,j)表示所述第一位置信息,xi表示第i个中心点的横坐标,yi表示第i个中心点的纵坐标,len表示所述中心点的经度,wid表示所述中心点的纬度,n表示所述待预测交通流量区域进行网格划分后的维度信息;

可以理解的是,len和wid可以分别表示城市在横向和纵向的距离,具体地,两者可以通过数据集实际的gps信息计算得出,本公开实施例对len和wid的计算方式不进行限定。

确定中心点的位置信息后,可以通过如下公式计算每个中心点与其他中心点的相对位置关系,最终可以得到w是一个关于矩阵中心线的对称矩阵:

其中,d(i,k)表示第i个和第i+k个中心点的相对位置信息,xi+k表示第i+k个中心点的横坐标,yi+k表示第i+k个中心点的纵坐标。

示例性地,可以通过数据集的经纬度范围,按照进行网格划分的维度信息,统计第一预设时间阈值内车辆的总数,将其作为第一交通流量信息,其中,第一预设时间阈值可以根据实际需要进行设定,本公开实施例对此不进行限定。

获取所述多个网格单元的相对位置信息以及所述多个网格单元在第一预设时间阈值的第一交通流量信息,通过对多个网格单元进行时序预测,从而能够得到全局的交通数据变化信息,不会遗漏任何区域。

步骤s103、根据所述相对位置信息以及所述第一交通流量信息,通过预选训练好的交通流量预测模型,预测所述待预测交通流量区域在第二预设时间阈值的交通流量信息。

示例性地,所述交通流量预测模型是基于两层时间卷积神经网络和一层图卷积神经网络构成的神经网络模型,用于预测一定区域内的交通流量。

图4示例性地示出本公开实施例交通流量预测模型的架构示意图,如图4所示,图4最左侧可以表示输入数据,输入数据可以进一步包括网格数据和天气数据。

其中,如图4中间部分,可以分别将网格数据输入第一层时间卷积层,将天气数据输入第二层时间卷积层。第一层时间卷积层和第二层时间卷积层均可以由多个残差块组成,多个残差块主要用于追溯更久远的历史信息以及计算更大的感受野范围内的特征。

网格数据经过第一层时间卷积层后,可以将残差块的处理结果进一步输入图卷积网络中,图卷积网络经过进一步处理后,将处理结果输入第二层时间卷积层中,第二层时间卷积层进一步进行批标准化,最后输出线性化处理,得到与网格数据对应的输出特征;

可以理解的是,天气数据输入第二层时间卷积层中,第二层时间卷积层进一步进行批标准化,最后输出线性化处理,得到与天气数据对应的输出特征。

本公开实施例的交通流量预测模型由两层时间卷积神经网络和一层图卷积神经网络构成,可以对网格化输入数据进行特征计算,具体地,第一层时间卷积神经网络可以对输入数据进行底层特征提取,继而通过图卷积神经网络加强数据特征的空间相对关系,最后由第二层时间卷积神经网络完成高层时序特征的计算。

可以理解的是,传统的递归神经网络每次只能处理一个时间步长,当前的计算过程必须等待前一步过程结束才能进行,这意味着递归神经网络无法做到卷积神经网络的大规模并行计算。时间卷积神经网络的基本思想是将多维度的矩阵映射到一维度,通过多层的网络结构获得逐渐增大的感受野,进而实现并行计算的目的。

其中,时间卷积神经网络由多层残差网络(residualblock)组成,每个残差网络主要负责两方面的工作:追溯更久远的历史信息以及计算更大感受野范围内的特征。

具体地,追溯更久远的历史信息主要应用因果卷积思想,其中,因果卷积公式如下所示:

其中,yt表示t阶段的输出值,k表示卷积核尺寸,fi表示第i个滤波器,xt-k+i表示第t-k+i个隐含特征。

{x1,x2,…,xt}表示输入序列,{y1,y2,…,yt}表示隐含层输出序列,{f1,f2,…,fk}表示滤波器。

可以理解的是,因果卷积只关注历史信息而忽略未来信息,结果只会由之前的数据得出,并且k越大,能够追溯的历史信息越多,如果当前层原始输入序列为[0,i],则下一层的原始输入序列则会变成[0,i+1]。

空洞卷积被应用于扩大感受野范围,其中,空洞卷积的公式如下所示:

其中,d表示空洞因子,空洞因子会根据网络的深度按照2的指数进行变化,xt-i·d表示第t-i·d个隐含特征,增大d或者k都可以增加感受野的范围。

本公开实施例可以将时间卷积神经网络映射到二维空间,每一层t时刻的结果只能通过[0,t]时刻的数据进行计算,体现了因果卷积的思想;各个时刻的结果通过在前一层网络中按照空洞因子跳跃取值,体现了空洞卷积的思想。

图5示例性地示出本公开实施例残差网络实现过程示意图,如图5所示,残差网络的实现过程主要包括两层卷积网络和非线性的映射过程,本公开实施例的实验数据分布在四维空间中,通过改进空洞卷积的模式,将原始空洞卷积变成conv2d。为了适应z-score标准化方法,可以使用tanh激活函数代替relu激活函数,并且在每层网络的处理过程中加入权重归一化和dropout正则化残差网络。

在一种可选的实施方式中,所述通过预选训练好的交通流量预测模型,预测所述待预测交通流量区域在第二预设时间阈值的交通流量信息的方法包括:

所述交通流量预测模型的第一层时间卷积神经网络获取所述相对位置信息以及所述第一交通流量信息的第一时间特征信息,并将所述第一时间特征信息发送至图卷积神经网络,其中,所述第一时间特征信息包括所述相对位置信息以及所述第一交通流量信息的底层时间特征信息;

所述图卷积神经网络将所述第一时间特征信息的时间复杂度降低至预设阈值,获取所述相对位置信息以及所述第一交通流量信息的空间相对性,并将时间复杂度降低至预设阈值的第一时间特征信息发送至第二层时间卷积神经网络;

所述第二层时间卷积神经网络获取时间复杂度降低至预设阈值的第一时间特征信息的第二时间特征信息,并根据所述第二时间特征信息预测在第二预设时间阈值的交通流量信息,其中,所述第二时间特征信息包括时间复杂度降低至预设阈值的第一时间特征信息的高层时间特征信息。

图卷积神经网络的图中每个结点时刻因为其临近的结点和非临近的结点的影响,而改变自己的状态,直至达到最终的平衡,关系越近的邻居结点对原始结点的影响越大。

其中,拉普拉斯矩阵能够将数据特征在图卷积神经网络中的传递强度正比于他们之间的状态差异,并且为了将原始节点对自身的影响加入计算过程中,可以使用拉普拉斯矩阵的改进版本,具体可以如下公式所示:

l=d-1/2∝d-1/2

其中,l表示拉普拉斯矩阵的改进版本,∝表示w加入自连接之后的邻接矩阵,d-1/2表示∝的节点度分布。

通过引入自身度矩阵,可以解决自传递的问题,并且通过对邻接矩阵的两边乘以节点的度开方取逆后,可以实现邻接矩阵的归一化操作。原始的谱图卷积实现了每个节点与傅里叶变换乘积的滤波器,但是由于特征向量是高阶,并且拉普拉斯矩阵的特征分解在大型图结构中,因此分解过程效率很低。

为此本公开实施例通过k阶切比雪夫多项式对拉普拉斯矩阵进行近似优化,具体如下公式所示:

其中,g(θ)表示原始图特征,y表示所述第一时间特征信息,k表示切比雪夫多项式的阶数,θi表示第i个图节点特征值,表示拉普拉斯矩阵的近似过程,表示改进后的拉普拉斯矩阵。

其中,的计算公式如下所示:

其中,表示改进后拉普拉斯矩阵中第i-1个近似向量,表示改进后拉普拉斯矩阵中第i-2个近似向量,δmax表示稳定因子,l表示原始拉普拉斯矩阵,in表示全局近似差。

通过上述方法可以保证当前节点只考虑k范围内的节点对其产生的影响,可以很大程度上降低时间复杂度。

在一种可选的实施方式中,所述方法还包括:

获取所述待预测交通流量区域当天的天气信息,将所述天气信息拓展为四维天气空间特征信息;

将所述四维天气空间特征信息与所述交通流量预测模型的中间特征信息进行拼接,获取天气时序信息,其中,所述天气时序信息用于指示所述天气信息在预测交通流量信息中所占的比重;

所述交通流量预测模型的第二层时间卷积神经网络获取所述天气时序信息的高层时间特征信息,其中,所述天气时序信息的高层时间特征信息用于提高预测所述交通流量信息的准确性。

可以理解的是,天气对于交通流量是一种隐式因素,它不能直接表示流量的大小,但是天气在生活中通过影响人们的出行活动间接地影响的交通流量的变化,比如,当下雨或是下雪时,人们的外出活动就会减少,道路车流量或是人流量在这些天气情况中会明显变小。

在模型设计中,可以加入天气作为隐式因素进行计算,而且考虑天气的计算比重。因为天气是非直接影响因素,所以它在整个计算特征的过程中比重不能太高,否则最终的结果就会因为天气因素影响太大而出现数据发散现象。

具体地,可以获取待预测交通流量区域当天的天气信息,在图卷积神经网络过程之后加入标准化之后的天气数据,并且可以将天气数据扩增到四维天气空间特征信息;

将四维天气空间特征信息与交通流量预测模型的中间特征信息进行拼接,获取天气时序信息;

本公开实施例交通流量预测模型的第二层时间卷积神经网络会对拼接后的天气时序信息进行高层特征进行计算。

在一种可选的实施方式中,所述方法还包括:

通过预先获取的相对位置信息以及第一交通流量信息训练所述交通流量预测模型,所述训练交通流量预测模型的方法包括:

基于预先获取的相对位置信息以及第一交通流量信息的均值信息,在所述均值信息中加入预设的稳定因子以及预设学习矩阵,训练所述交通流量预测模型,以使待训练的交通流量预测模型的收敛速度达到预设阈值,其中,所述稳定因子用于增加训练所述交通流量预测模型的计算稳定性,所述学习矩阵用于提高所述交通流量预测模型的学习能力。

在一种可选的实施方式中,所述训练交通流量预测模型的方法包括:

按照如下公式所示的方法训练所述交通流量预测模型:

其中,y表示归一化后的特征数据,x表示输入数据的横坐标,μ表示输入数据的均值,v表示输入数据的方差,eps表示稳定因子,gamma表示第一学习系数矩阵,beta表示第二学习系数矩阵。

为了防止数据量过大而导致网络性能不稳定,可以在激活函数激活之前对特征数据进行归一化处理。对数据进行归一化处理能够使梯度下降的方向偏向空间垂直等高线的方向,继而能够提升模型的收敛速度,并且能够平均化每个层次的数据在特征计算中的权重提高模型的精度。

本公开提供的交通流量预测方法对待预测交通流量区域进行网格划分,将所述待预测交通流量区域划分为多个网格单元,将城市区域映射为图结构数据,符合图卷积神经网络的设计模式,有利于提高流量预测的准确度;

获取所述多个网格单元的相对位置信息以及所述多个网格单元在第一预设时间阈值的第一交通流量信息,通过对多个网格单元进行时序预测,从而能够得到全局的交通数据变化信息,不会遗漏任何区域;

根据所述相对位置信息以及所述第一交通流量信息,通过预选训练好的交通流量预测模型,预测所述待预测交通流量区域在第二预设时间阈值的交通流量信息,其中,所述交通流量预测模型是基于两层时间卷积神经网络和一层图卷积神经网络构成的神经网络模型,通过利用时间卷积神经网络的空洞卷积思想可以克服传统递归神经网络计算量大,训练速度缓慢的问题,并且时间卷积神经网络的因果卷积机制有助于提取长历史数据信息,使得交通流量中长期预测结果更加准确,此外,双层时间卷积神经网络的设计结构能够使得连续区域的流量特征变化更加明显。

本公开实施例使用25个节点的pems流量数据检验交通流量预测模型在非临近节点流量预测任务中的准确性。

图6示例性地示出本公开实施例通过流量数据验证预测任务准确性的示意图,如图6所示,pems数据的规律性较强,连续两天内的流量变化趋势基本一致,交通流量预测模型和上述复杂的模型对pems数据的预测结果差别较小并且预测效果较好。

实验结果是固定区域根据时间变化产生的流量变化。横坐标代表连续的时间戳,每个单位代表5分钟,纵坐标代表该区域的实际流量。

由图6(a)的结果,我们可以获知加入tcn进行时间依赖性的特征提取之后,实验结果比只用gcn进行空间特征提取的结果要更加好。对于迅速变化数据,尤其是迅速下降的数据,gcn特征计算能力不足。

由图6(b)的结果,我们可以获知通过递归神经网络的方式加强时序预测能够预测出流量的时间变化趋势,但是由于缺少了空间相对性的计算,单纯的递归神经网络在局部峰值计算方面效果不佳。

由图6(c)的结果,我们可以获知相较于其他两种拥有时空卷积块的模型,交通流量预测模型在局部区域流量预测方面更加优秀,它对迅速变化数据以及数据的局部峰值更加敏感。

由图6(d)的结果,我们可以获知相较于其他两种使用传统递归神经网络的时空模型,交通流量预测模型没有出现欠拟合现象,其在连续额时间戳预测过程中,数据一直有着很好的拟合效果。

由图6(e)的结果,由交通流量预测模型与加入天气参数后的交通流量预测模型的对比结果,我们可以获知交通流量预测模型加入隐式因素天气之后,它在波动峰值点的预测更加准确,而且没有出现过拟合现象。

图7示例性地示出本公开实施例a市部分区域车辆分布情况示意图,如图7所示,图中颜色更深的点代表某一时刻车辆在该区域的分布情况。根据图7的区域c,可以得到c区域是景区,车辆在此区域的总量较少,通过网格划分以及矩阵映射的结果,如图7(b)所示,可以获知c区域在时间序列中数值较小,c,d和e时空序列中数值变化较大。由图7(b)的结果,可以获知对于在时间序列中流量迅速增加的网格状固定区域预测任务,t-gcn和stdn表现出了欠拟合现象,它表现为在连续的时间戳中,数据特征一直不变化。

通过实验,可以发现这种现象是由图7的结果产生的,并且此种现象在空间序列预测中也有表现,它表现为在数据迅速变化时,模型准确率过低。

图8示例性地示出本公开实施例连续一小时城市数据预测结果示意图,如图8所示,图8展示了被划分为5*5的城市网格被模型以连续一小时的数据预测未来15分钟、30分钟、45分钟的结果。通过横坐标为15和20时的结果,可以得出不同的模型在面对差值较大的变化时有不同的数据拟合能力。

现有的模型在预测网格连续区域的流量信息时,欠拟合现象不是偶尔发生的,它会随着时间的延长一直进行传递,从而严重影响数据预测的效果。交通流量预测模型在三个时间段的预测结果都非常贴近实际值并且优于其他模型的预测值。通过借助tcn的空洞卷积以及因果卷积的优势克服了这种欠拟合现象,空洞卷积逐渐增大的感受野能够获取跨网格的流量变化信息,从而降低因为相邻区域的数据波动对准确率造成的影响,使得我们的模型预测结果在空间范围内也变现的较为稳定.因果卷积能够加强历史数据的权重特征,从而加强空间稳定性在时序中的传递。

卷积神经网络层和递归神经网络层的参数数量分布情况在很大程度上影响网络的整体性能。我们通过设置交通流量预测模型与现有模型参数总量的对比实验来体现交通流量预测模型的性能优势。

图9示例性地示出本公开实施例现有模型与本申请模型对比试验结果示意图,如图9所示,如前所述,gru和lstm这类递归神经网络存在参数众多和计算量大的弊端,所以他们的参数数量相对较多。tgcn与stdn都是在递归神经网络的基础上进行模型拓展,所以他们在结果中占据了参数量最多的位置。交通流量预测模型,stgcn和astgcn严格意义上都是纯卷积网络实现,他们没有使用递归神经网络,所以他们的参数总量较少并且性能较高。

在本次实验中,可以选择mae和rmse作为实验结果的评估指标,其中,ti代表真实值,pi代表预测值,mae能更好反应预测值误差的实际情况,rmse能够衡量预测值与真实值之间的数据量偏差。可以对15分钟,30分钟和45分钟的预测结果进行了评估运算,同其他模型的对比结果如表1所示:

表1:本申请模型与其他模型的对比结果

由对比实验结果得知,本申请的模型相较于其他模型具有更高的准确率,相较于在现有的模型中表现最优秀的stgcn,本申请的模型在mae中误差最大降低了6.32%,在三个时间戳中平均降低了5.47%,在rmse中,误差最大降低了7.64%,在三个时间戳中平均降低了6.90%。

其中,ti表示第i个实际值,pi表示第i个预测值,m表示序列长度。

本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。

其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(applicationspecificintegratedcircuits,简称:asic)中。另外,该asic可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(rom)、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:centralprocessingunit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digitalsignalprocessor,简称:dsp)、专用集成电路(英文:applicationspecificintegratedcircuit,简称:asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1