一种基于深度学习神经网络结构的交通流预测方法

文档序号:8943941阅读:505来源:国知局
一种基于深度学习神经网络结构的交通流预测方法
【技术领域】
[0001] 本发明涉及一种基于深度学习神经网络结构的交通流预测方法,属于交通预测的
技术领域。
【背景技术】
[0002] 随着我国汽车产业的发展,城市及高速公路道路拥堵问题日益严峻。通过对交通 流数据深入挖掘,并在此基础上建立短期交通流预测模型,能够有效预测交通拥堵状况从 而引导车辆选择合理出行路线。
[0003] 短时交通流预测某个路段或某条路径上未来的交通状况,时间间隔一般不超出15 分钟。对管理者来说这一预测可以用以制订和实施交通管理计划,对交通流进行调控,以减 缓这一期间可能出现的交通拥挤和安全隐患。相对于长期预测分析来说,短时交通流预测 将作为历史数据使用。
[0004] 短时交通流预测方法主要包括两部分:交通流历史数据标准库的建立及预测模型 构建。前者为短时交通流预测提供数据保障,后者未来交通状态的预测提供准确的方法。到 目前,已经有一系列技术和手段被开发应用于短期交通流的预测,但结果却不令人满意的 课题。
[0005] 传统的交通流数据预测方法主要有K-最近邻分类、支持向量机、BP神经网络和决 策树等,这些方法在一定规模的交通流数据基础上进行建模,从而进行预测,取得了一定的 预测成效。但随着大数据时代的到来,诸如支持向量机这类浅层模型难以有效发掘海量数 据下的隐含信息,无法获得最佳性能。

【发明内容】

[0006] 本发明的目的在于,提供一种基于深度学习神经网络结构的交通流预测方法。本 发明的方法可以对交通流数据进行更深入的挖掘分析,因此在对交通流进行短期预测时更 为精准,性能更优。
[0007] 本发明的技术方案:一种基于深度学习神经网络结构的交通流预测方法,其特点 是:通过采集各类交通流数据,并利用深度自动编码器模型对采集各类交通流数据进行训 练,在训练过程中对深度自动编码器模型进行调整,最后利用调整后的深度自动编码器模 型对短期交通流进行预测。
[0008] 上述的基于深度学习神经网络结构的交通流预测方法,具体包括以下步骤:
[0009] ①交通流数据的采集;
[0010] ②交通流数据的预处理;
[0011] ③利用深度自动编码器模型对交通流数据进行训练;(深度自动编码器模型由编 码器、解码器和隐含层组成)
[0012] ④用有监督学习算法对深度自动编码器模型进行微调;
[0013] ⑤根据步骤④得到的最终的深度自动编码器模型对短期的交通流进行预测。
[0014] 前述的基于深度学习神经网络结构的交通流预测方法中,所述步骤①中的交通流 数据包括:
[0015] (1)运用高速公路上安装车流量检测器采集的流量和车速交通流数据;
[0016] (2)视频图像非结构数据转换而成的结构型交通流数据;
[0017] (3)道路(高速公路路基、路面、桥梁和隧道等)养护数据;
[0018] (4)高速公路交通事故发生后事件报送数据;
[0019] (5)同路段环比类似历史交通流数据。
[0020] 前述的基于深度学习神经网络结构的交通流预测方法中,所述步骤①的具体方 法:将每一年的交通流数据划分为M个组,每一组中按照周一至周日分别将各天的交通流 数据归为7类,生成7*M个的交通流数据的集合,并将每个集合中的交通流数据按时间段划 分为空闲时段数据和繁忙时段数据。(其中,所述交通流数据是关于时间序列的数据,每一 个集合中包含5个以上所述被归为同一类的原始交通流时间序列数据。)
[0021] 前述的基于深度学习神经网络结构的交通流预测方法中,所述集合内的交通流数 据为关于时间间隔连续的数据;若繁忙时段数据中出现时间间隔不连续情况,则认定为原 始交通数据缺失,对于数据缺失点,采用平均插值方法补齐,若某个时间点的交通流数据超 出了阈值,则认定为错误数据,并对错误数据的进行剔除,同时采用平均插值方法进行补 齐;若空闲时段数据中出现时间间隔不连续情况,则认定为原始交通数据缺失,对于数据缺 失点,采用其它集合的同时间点的交通流数据的平均值进行补齐,若某个时间点的交通流 数据超出了阈值,则认定为错误数据,并对错误数据的进行剔除,同时采用其它集合的同时 间点的交通流数据的平均值进行补齐。
[0022] 前述的基于深度学习神经网络结构的交通流预测方法中,所述步骤③的具体方法 包括以下步骤:
[0023] (1)逐层构建单层神经元,每次构造一个单层网络。
[0024] (2)当所有层构造完后,每层采用wake-sle印算法进行调优,每次仅调整一层,逐 层调整。
[0025] 前述的基于深度学习神经网络结构的交通流预测方法中,所述调优的具体方法包 括以下步骤:
[0026] A、将交通流数据输入第一层的编码器,生成一个编码,这个编码为输入的一个表 示,然后将这个编码输入解码器,解码器会输出一个重建信息,再通过计算输入的交通流数 据的特征和重建信息的残差,使用梯度下降法修改第一层的编码器的生成权重;
[0027] B、将第一层输出的编码当成第二层的输入数据流,采用与步骤A相同的方法修改 第二层的编码器的生成权重,并重复此步骤直至所有层的编码器的生成权重修改完毕。
[0028] 前述过程实际为无监督学习。
[0029] 前述的基于深度学习神经网络结构的交通流预测方法中,所述步骤④的具体方 法:
[0030] 将最后一层输出的编码输入支持向量机分类器(SVM),再使用有标签样本进行有 监督训练,实现对各层的编码器的微调。
[0031] 前述的基于深度学习神经网络结构的交通流预测方法中,数据的训练是通过在分 布式系统上的CPU集群进行并行运算来实现的,从而可以加速数据的挖掘与分析。
[0032] 与现有技术相比,本发明通过深度自动编码器模型对交通流数据进行训练学习, 从而形成了可以对交通流数据进行深度学习的神经网络结构,它相对于传统的交通流数据 预测模型而言,可以对数据进行更深入的分析,并可有效提取数据的潜在分层特征,而且还 免去了人工提取数据特征的巨大工作量,提高了特征提取的效率,降低了原始输入的维数。 因此使用本发明的预测模型进行短期交通流预测时,可以提高预测的精准度。
[0033] 而且本发明的方法中通过采用对交通流数据的分组、分时段,并对不同时段的数 据进行不同的补齐和纠错方法,不仅简化了输入交通流数据的复杂性,降低了模型的计算 难度及计算量,而且在很大程度上也进一步提高了短期交通流预测的精准度,并可提高预 测的稳定性,不易出现明显错误。
[0034] 随着车辆的增多,各种交通流数据接踵而至,处理大量的交通流数据就需要一种 能处理海量数据的编码模型,深度自动编码器模型在这一方面具有明显优势,它可以称为 未来处理大数据的过程中不可或缺的模型工具。本发明将深度自动编码器模型应用于交通 流的处理上面,将对车辆安排合理出行带来极大方便,一方面可以缓解道路的拥堵现状,另 一方面可减少车辆在等待的过程中石化燃料的消耗,从而起到缓解空气污染的现状。
【附图说明】
[0035] 图1是本发明的基本步骤流程图。
【具体实施方式】
[0036] 下面结合实施例对本发明作进一步的说明,但并不作为对本发明限制的依据。
[0037] 实施例。一种基于深度学习神经网络结构的交通流预测方法,其基本流程如图1 所示,包括以下步骤:
[0038] ①交通流数据的采集;
[0039] ②交通流数据的预处理;
[0040] ③利用深度自动编码器模型对交通流数据进行训练;
[0041] ④用有监督学习算法对深度自动编码器模型进行微调;
[0042] ⑤根据步骤④得到的最终的深度自动编码器模型对短期的交通流进行预测。
[0043] -、交通流数据的采集
[0044] 采集各类交通流数据为后续深度学习提供丰富的当前数据和历史数据。主要包含 以下方面:
[0045] (1)运用高速公路上安装车流量检测器采集的流量和车速交通流数据;
[0046] (2)视频图像非结构数据转换而成的结构型交通流数据;
[0047] (3)道路养护数据;
[0048] (4)高速公路交通事故发生后事件报送数据;
[0049] (5)同路段环比类似历史交通流数据。
[0050] 二、数据的预处理
[0051] 考虑到道路中一天中不同时段交通流规律的不同,将一天的时间划分为繁忙时段 和空闲时段,繁忙时段一般为6:00~0:00,空闲时段一般是0:00~6:00,可以根据各路段 的情况灵活设定。本发明实施例中对于繁忙时段和空闲时段采用不同的方法进行处理,下 面进行详细说明。
[0052] 对于交通流数据要按照一定规律对其分组,形成相应的数据集。以年为单位,对每 一天根据设定的采集周期采集原始交通流数据,以获得各天的原始交通流时间序列数据, 原始交通流时间序列数据每间隔5分钟采集一次。按照设定规律将一年划分为M = 4个组 即4个季度,每一组中按照周一至周日分别将各天的原始交通流时间序列数据归为7类,生 成7*M = 28个的原始交通流时间序列数据集合。其中,每一个集合中包含5个以上所述被 归为同一类的原始交通流时间序列数据。
[0053] 根据设定的采集周期采集交通流数据以获得当天在当前时间点之前的原始交通 流时间序列数据(X 1, X2, x;5. ..,xt,Xn),其中Xt为t时间点的交通数据流,X "为当前点的交通 流数据。例如:采集周期可以为5分钟,当前时间点η为10:00,则交通流时间序列数据中 x n :为9:55的交通流数据,依次类推。如果采集原始交通流数据从0:00开始,则交通流时 间序列数据中X1S 〇:〇〇的交通流数据;如果采集原始交通流数据从6:00开始,则交通流 时间序列数据中X1S 6:00的交通流数据。
[0054] 在繁忙时段,若时间间隔不连续(如8:00,8:10),则定义为原始交通数据缺失。对 于数据缺失点,采用平均插值方法补齐。对原始交通流时间序列数据错误的判断采用阈值 法,超出阈值的原始交通流数据,定义为错误数据。对于错误数据的剔除,采用平均插值方 法补齐。
[0
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1