一种短时交通流量预测方法与流程

文档序号:17734141发布日期:2019-05-22 03:03阅读:217来源:国知局
一种短时交通流量预测方法与流程

本发明涉及交通技术领域,尤其涉及一种短时交通流量预测方法。



背景技术:

近年来,随着社会飞速发展,城市化进程继续推进,城市常驻人口和汽车保有量飞速增长。这给城市交通基础设施带来了极大挑战,过时的交通规划很难适应飞速增长的交通需求,导致城市交通问题越来越复杂。也就是说,为了提高交通运行效率,仅仅通过增加道路数量及基础设施是远远不够的,还要通过提高交通管理系统的运行效率,以充分发挥现有道路的功能。

因此智能交通系统应运而生,人们希望通过智能交通系统高效地解决上述难题。交通诱导系统和交通控制系统是智能交通系统中的重要组成部分,而合理的交通状态判别及准确的交通流量预测能够提高交通诱导的准确性和交通控制的有效性,在智能交通系统中具有重要地位,是完成诱导和控制的关键和保障。

现有技术中的缺陷为:1)现有方法大多只关注单个检测器所采集的交通信息,而忽略了路网的拓扑结构,这样即忽略了相邻检测器之间的而相关性,又无法验证模型在真实路网上的运行效率和准确性;2)现有方法大多没有对流量的变化趋势进行考虑,没有利用时间序列数据中前后时间点的相关性,使得模型容易陷入过拟合的情况,模型泛化能力不好;3)现有方法对原始数据的利用率不高,若要达到理想精度需要大量的数据,提高了对设备的要求。



技术实现要素:

本发明的实施例提供了一种短时交通流量预测方法,以克服现有技术的缺陷。

为了实现上述目的,本发明采取了如下技术方案。

一种短时交通流量预测方法,所述方法包括:

根据路网中道路传感器采集的历史数据和路网拓扑结构数据,构建用于预测模型的数据集;

对所述数据集进行归一化处理,并检查所述数据集中测量数据中的缺失值;

利用全连接网络和seq2seq网络构建神经网络作为短时交通流量预测模型,并利用归一化处理后的数据集对预测模型进行训练,选取误差最小的模型最为最终的神经网络预测模型;

利用所述最终的神经网络预测模型,对多个道路传感器采集的实时流量数据进行处理,得到预测流量数据。

优选地,所述道路传感器采集的历史数据集包括时间数据和交通数据,历史数据集xglobal中时间数据包括:采样时刻时间t和是否为节假日tholidays;交通数据包括:当前检测断面检测器编号εc、当前检测断面的车道数εl、当前检测器所在快速路编号k、当前检测断面单位周期内交通流量vcur(t)(veh/h)、当前检测断面单位周期内平均速度vcur(t)(km/h)、当前检测断面单位周期内通过的大车数量ccur(t)(veh)、当前检测断面单位周期内平均占有率ocur(t)(%);

所述路网拓扑结构数据包括:上游相连检测断面单位周期内交通流量vpre(t)(veh)、上游相连检测断面单位周期内平均速度vpre(t)(km/h)、上游相连检测断面单位周期内通过的大车数量cpre(t)(veh)、上游相连检测断面单位周期内平均占有率opre(t)(%)。

优选地,所述的方法还包括:

将所述历史数据集的采样时间间隔延长为15min,流量变化进行加和处理,平均速度及占有率取均值,并将所得数据按快速路编号k进行划分,作为趋势数据集其中i∈k;

将趋势数据集转化为符合seq2seq网络输入的格式。

优选地,所述历史数据集的采样时间间隔为5min。

优选地,所述将趋势数据集转化为符合seq2seq网络输入的格式,即每5个采样时刻获取数据合并为一个输入样本,每个样本的标签为后5个采样时刻的真实交通流量。

优选地,对所述数据集进行归一化处理,并检查所述测量数据中的缺失值,包括:

对数据集中的每个字段xi分别进行归一化处理,有其中xi′为每个字段归一化后的结果;

检查每个字段中的缺失值和异常值,对测量数据的缺失值采用周边路段传感器数据的平均值进行填充,对于测量数据中为0的异常值采用同一检测器前后异常出现的前后时刻测量均值进行替换。

优选地,所述利用全连接网络和seq2seq网络构建神经网络作为短时交通流量预测模型,并利用归一化处理后的数据集对预测模型进行训练,选取误差最小的模型作为最终的神经网络预测模型,包括:

构建预测模型,所述预测模型包括4层激活函数为relu的全连接层,k个5层的seq2seq网络,以及1层线性的全连接层;

使用符合seq2seq网络输入格式的趋势数据集分别训练k个seq2seq网络;

seq2seq网络的目标函数为均方误差函数mse,mse误差的计算方式为:

其中,y为真实流量,为预测流量,n为总样本数;

缓存训练完成的seq2seq模型的编码器部分;

将所述历史数据集xglobal输入全连接层,同时将对应的趋势数据集中的数据输入训练好的seq2seq模型,并将全连接层输出与seq2seq模型编码器部分的输入合并;

将合并后的数据输入线性全连接层,并以mse作为整个预测模型的目标函数,训练全连接层和线性全链接层的参数,训练完成得到最终的神经网络预测模型。

优选地,利用所述最终的神经网络预测模型,对多个道路传感器采集的实时流量数据进行处理,得到预测流量数据,包括:

对于实时采集的流量数据,构建符合seq2seq结构输入的数据;

原始数据与构建符合seq2seq结构输入的实时采集的流量数据同时输入所述短时交通流量神经网络预测模型,得到最终预测结果。

由上述本发明的实施例提供的技术方案可以看出,本发明实施例针对交通流量变化具有非线性和周期性的特点,提出了一种融合了全连接网络和seq2seq网络的短时(采样间隔在半小时以下)交通流量神经网络预测模型,融合深度学习中全连接网络对整体特征的提取能力,与seq2seq网络对时间序列变化趋势的学习能力,在保证信息量不丢失的情况下,使得模型学习更多周期性特征,提高预测精度,为城市交通流量预测问题提供了一种新的思路。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种短时交通流量预测方法的流程图;

图2为本发明实施例提供的融合全连接网络和seq2seq2网络的短时交通流量预测流程图;

图3为本发明实施例提供的seq2seq网络结构示意图;

图4为本发明实施例提供的短时交通流量预测网络结构示意图。

具体实施方式

下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。

本发明实施例提供了一种短时交通流量预测方法的处理流程如图1所示,包括如下处理步骤:

根据路网中道路传感器采集的历史数据和路网拓扑结构数据,构建用于预测模型的数据集;

对数据集进行归一化处理,并检查数据集中测量数据中的缺失值;

利用全连接网络和seq2seq网络构建神经网络作为短时交通流量预测模型,并利用归一化处理后的数据集对预测模型进行训练,选取误差最小的模型最为最终的神经网络预测模型;

利用最终的神经网络预测模型,对多个道路传感器采集的实时流量数据进行处理,得到预测流量数据。

如图2所示,本发明实施例提供的融合全连接网络和seq2seq网络的短时交通流量预测方法的算法流程图,其预测系统包括模型的训练部分和实时交通数据的预测部分。在训练部分中,首先通过历史交通数据构建趋势数据集并对数据进行初步处理,通过增大采样时间的方式保留时间序列的变化趋势,并且通过快速路编号对数据进行简单的划分,提高单个模型的准确度;其次,使用趋势数据集分别训练与快速路编号相对应的seq2seq网络,并保留网络的编码器部分;接下来,将历史交通数据集与趋势数据集对齐,即每个历史交通数据样本对应趋势数据集中最后的时间节点,将这两个数据集分别输入到全连接网络和训练好的seq2seq网络中,得到的结果组合后输入到激活函数为线性函数的全连接层中训练所有全连接网络的参数,使其达到满意的精度。在预测模块中,使用上述训练模型对实时交通流量数据进行处理,并预测下一时间点的交通流量。

具体包括以下步骤:

(1)根据路网中道路传感器采集的历史数据和路网拓扑结构特征,构建用于预测模型的数据集;

道路传感器采集历史数据集包括时间数据和交通数据,其中历史数据集xglobal中时间数据包括:采样时刻时间t和是否为节假日tholidays;交通数据包括:当前检测断面检测器编号εc;当前检测断面的车道数εl;当前检测器所在快速路编号k;当前检测断面单位周期内交通流量vcur(t)(veh/h);当前检测断面单位周期内平均速度vcur(t)(km/h);当前检测断面单位周期内通过的大车数量ccur(t)(veh)和当前检测断面单位周期内平均占有率ocur(t)(%);其中历史数据集的采样时间间隔为5min;

路网拓扑结构数据包括:上游相连检测断面单位周期内交通流量vpre(t)(veh);上游相连检测断面单位周期内平均速度vpre(t)(km/h);上游相连检测断面单位周期内通过的大车数量cpre(t)(veh);上游相连检测断面单位周期内平均占有率opre(t)(%);

以上拓扑信息可在历史数据集中检索获得。

为了获取交通流量的趋势变化信息,将历史数据集的采样时间间隔延长为15min,流量变化进行加和处理,平均速度及占有率取均值;并将数据按快速路编号k进行划分,作为趋势数据集其中i∈k。

将趋势数据集转化为符合seq2seq网络输入的格式,即每5个采样时刻获取数据合并为一个输入样本,每个样本的标签为后5个采样时刻的真实交通流量。

趋势数据集格式如表1所示:

表1趋势数据集格式

与趋势数据集对应的标签如表2所示:

表2趋势数据集标签

在表1、表2中,t1至t9采样时间顺序递增,且采样间隔为15min。

(2)对数据集进行归一化处理,并检查数据中的缺失值;

对数据集中的每个字段xi(如流量、平均速度等)分别进行归一化处理,有其中xi′为每个字段归一化后的结果;

检查每个字段中的缺失值和异常值,对测量数据的缺失值采用周边路段传感器数据的平均值进行填充,对于测量数据中为0的异常值采用同一检测器前后异常出现的前后时刻测量均值进行替换。

(3)利用全连接网络和seq2seq网络构建神经网络作为短时交通流量预测模型,并利用步骤(2)中获取的数据对预测模型进行训练,选取误差最小的模型最为最终的预测模型,具体包括以下步骤:

构建预测模型,该模型包括4层激活函数为relu(线性整流函数)的全连接层,k个5层的seq2seq网络,以及1层线性的全连接层;

使用转化为符合seq2seq网络输入的格式的趋势数据集i∈k分别训练k个seq2seq网络;

seq2seq网络的目标函数为均方误差函数mse:

其中,y为真实流量,为预测流量,n为总样本数;

缓存训练完成的seq2seq模型的编码器部分;

图3为完整的seq2seq网络结构示意图,采用输入lstmcell个数为5,训练完成后保存编码器部分参数。

图4为短时交通流量预测网络结构图示意图,如图4所示,

将历史数据集xglobal输入全连接层,同时将对应的趋势数据集中的数据输入seq2seq模型,并将全连接层输出与seq2seq模型编码器部分的输入合并;

将合并后的数据输入线性全连接层,并以mse作为整个预测模型的目标函数,训练全连接层和线性全链接层的参数。

(4)利用已训练的神经网络模型,对多个道路传感器采集的实时流量数据进行处理,得到预测流量数据,即对于实时采集的数据,构建符合seq2seq结构输入的数据,将原始数据与构建所得数据同时输入步骤(2)所得预测模型,得到最终预测结果。

本领域技术人员应能理解,上述所举的采样时间间隔和输入lstmcell个数仅为更好地说明本发明实施例的技术方案,而非对本发明实施例作出的限定。任何根据用户实际情况调整时间间隔和输入lstmcell个数,均包含在本发明实施例的范围内。

综上所述,本发明实施例首先通过结合道路传感器采集信息科路网拓扑结构构建短时交通流量预测模型历史数据集;其次根据历史数据集构建趋势数据集,其中趋势数据集符合seq2seq网络的输入格式;接下来使用趋势数据集对seq2seq网络进行训练并保留网络的编码器部分,最后将历史交通数据集与趋势数据集对齐,训练与seq2seq编码器相连的全连接网络。本发明实施例公开了一种融合了深度学习中全连接网络与seq2seq网络的短时交通流量预测方法,融合深度学习中全连接网络对整体特征的提取能力,与seq2seq网络对时间序列变化趋势的学习能力,在保全局特征不丢失的情况下,使得多个更有针对性的seq2seq网络学习更多周期性特征,提高预测精度,为城市交通流量预测问题提供了一种新的思路。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1