用于旅行时间预测的深度学习网络模型及其建立方法与流程

文档序号：11678894阅读：270来源：国知局

本发明属于智能交通信息处理技术领域，具体涉及一种旅行时间预测模型及其建立方法。

背景技术：

旅行时间作为交通状态的重要评价指标之一，已成为先进的出行服务信息系统和先进的道路交通管理系统的关键组成部分，实时准确的旅行时间信息发布对于精细化的交通管理、改善出行服务具有重要的理论研究价值与现实意义。

现有的研究中已经有一些预测旅行时间模型的建立方法，概括起来主要包括参数方法和非参数方法两类，参数方法包括宏观交通流模型、时间序列法、卡尔曼滤波法等，该类方法建模简单，精度高，但受随机干扰因素影响大，不确定性强；非参数方法包括神经元网络法、支持向量机、k最近邻方法等，该类方法不需要先验知识和参数识别，具有较强的容错性和鲁棒性，但对历史数据量有一定要求。总结来说，现有研究主要存在以下两点不足：现有方法多是基于固定检测器数据，覆盖面积小，数据缺失大，准备不充分；预测模型受随机因素影响大，无法应对交通流高度时变特性和非线性变化特征的难题，鲁棒性和精确性差。

目前，深度学习在人工智能领域得到了广泛应用，其中卷积神经网络和循环神经网路分别在计算机视觉和自然语言处理领域取得了巨大成功。

技术实现要素：

本发明的一个目的是提供了一种旅行时间预测方法，所述方法包括：将卷积神经网络输出的交通状态的空间特征，和/或循环神经网络输出的旅行时间的时序分布规律，作为输入，融合后输出，既得预测的旅行时间。

所述交通状态包括整个目标路径的交通状态；所述旅行时间包括真实旅行时间；再具体的，所述真实旅行时间包括整个测试时间内的真实旅行时间，和/或整个测试时间内，任意时刻的真实旅行时间；所述交通状态为待预测时刻前的交通状态；所述整个测试时间为待预测时刻前的时间；

所述交通状态包括交通速度值；所述交通状态的空间特征包括所述交通速度值在所述目标路径的不同路段的分布演变；所述旅行时间的时序分布规律包括所述整个测试时间内，不同出发时刻的真实旅行时间的分布演变；

所述融合包括通过融合网络进行融合。

具体的，所述融合网络包括全连接层。

具体的，所述卷积神经网络包括：卷积层、池化层、和/或flatten层；所述循环神经网络包括：lstm层；和/或，所述确定了具体结构和/或参数的融合网络包括：dropout和/或全连接层。

具体的，所述卷积神经网络的结构和/或参数包括：输入-卷积层1-池化层1-卷积层2-池化层2-卷积层3-flatten层；所述卷积层1和/或卷积层3包括滤波器个数是32，卷积核大小是(3,3)；所述卷积层2和/或卷积层3包括滤波器个数是64，卷积核大小是(2,2)；所述池化层1和/或池化层2包括池化核大小是(2,2)；所述循环神经网络的结构和/或参数包括：输入-lstm层-输出；所述lstm层包括神经元个数是64；和/或，所述融合网络的结构和/或参数包括：输入-dropout层1-全连接层1-dropout层2-全连接层2-dropout层3-输出层；所述dropout层1和/或dropout层2的参数设置为0.5；所述dropout层3的参数设置为0.3；所述全连接层1包括神经元个数是512；所述全连接层2包括神经元个数是128；所述输出层包括神经元个数是1。

所述卷积神经网络还包括输入，所述输入包括，以整个测试时间整个目标路径的时空速度矩阵为输入；

所述循环神经网络还包括输入，所述输入包括，以通过整个目标路径的真实旅行时间序列作为输入。

具体的，所述整个测试时间整个目标路径的时空速度矩阵包括，将所述整个目标路径的长度计为纵坐标轴，将所述整个测试时间的长度计为横坐标轴，将所述横、纵坐标轴围成的矩形面积部分划分成若干固定大小的方格；其中，每个方格的纵坐标代表该方格包含的目标路径的长度值，每个方格的纵坐标方向的长度计为固定路段的长度值；每个方格的横坐标代表该方格包含的测试时间值，每个方格的横坐标方向的长度计为固定时间间隔的时间长度；采集所述每个方格内的浮动车的真实速度数据，在保证方格内浮动车样本量的情况下，计算每个方格内的浮动车的平均速度作为每个方格内的速度值，所得所有方格内的所述速度值的集合即为整个测试时间整个目标路径的时空速度矩阵；所述横、纵坐标所代表的意义可以互换；

具体的，所述通过整个目标路径的真实旅行时间序列包括，以给定测试时刻为横坐标，以原点纵坐标为纵坐标，在所述时空速度矩阵中定位通过的第一个方格，将所述第一个方格内的所述固定路段的长度值除以所述速度值，所得计算结果为通过所述第一方格的真实旅行时间；以所述第一方格的真实旅行时间为横坐标，以与所述第一个方格的纵坐标连续的下一个所述固定路段的纵坐标为纵坐标，定位通过的第二个方格，以所述第二个方格的所述速度值来计算得出所述第二个方格的真实旅行时间；以同样的方法，依次定位出通过的所有方格，并计算得出包含了整个目标路径的所述定位出通过的所有方格的真实旅行时间，将所述所有方格的真实旅行时间相加，其和为该给定测试时刻，通过整个目标路径的真实旅行时间；以相同的方法，可计算得到待预测出发时刻及选取的待预测出发时刻前任意时刻通过整个目标路径的真实旅行时间；所述待预测出发时刻及选取的待预测出发时刻前任意时刻通过整个目标路径的真实旅行时间的集合为所述通过整个目标路径的真实旅行时间序列。

具体的，所述划分包括平均划分；

具体的，所述计算每个方格内的浮动车的平均速度作为该方格内的速度值，包括将采集到的所述每个方格内的浮动车的真实速度数据的总和除以所述浮动车的总数量后计算得出。

具体的，可用s表示所述整个测试时间整个目标路径的时空速度矩阵，s＝[s1,s2,…,st]，其中st表示整个目标路径的每个固定时间间隔的速度值的集合，即st＝[x1,x2,…，xn]，x代表所述每个方格内的速度值，n代表所述整个目标路径所包含的所述固定路段的总个数，t代表所述整个测试时间包含的所述固定时间间隔的总个数；

具体的，可用t表示所述通过整个目标路径的真实旅行时间序列，即t＝[t1,t2,…,tm]，其中tm代表待预测出发时刻，通过整个目标路径的真实旅行时间；t1代表待预测出发时刻前m个时间间隔的最后时刻通过整个目标路径的真实旅行时间；所述时间间隔的长度可根据需要任意调节，可与所述时空速度矩阵中的时间间隔长度一致，也可不一致。

本发明的又一个目的是提供一种旅行时间预测方法，所述方法包括：

以整个测试时间整个目标路径的时空速度矩阵为输入，经卷积神经网络处理后，输出；

和/或，将通过整个目标路径的真实旅行时间序列作为输入，经循环神经网络处理后，输出；

将上述卷积神经网络的输出和循环神经网络的输出，同时作为输入，经融合网络处理后，输出。

具体的，所述划分包括平均划分；

具体的，所述方法还包括预测结果的准确性评价，所述评价包括平均绝对百分误差和/或平均绝对误差评价，所述误差的数值越小，表示准确性越高。

具体的，所述平均绝对百分误差的公式为：

所述平均绝对误差的公式为：

具体的，所述评价为分别取一个工作日和一个非工作日、和/或针对交通高峰期和平峰期的预测结果进行评价。

本发明的又一个目的是提供上述任一所述方法的应用；所述应用包括：用于旅行时间预测，建立旅行时间预测模型、和/或制备可预测旅行时间的产品。

本发明的再一个目的是提供一种适于实现指令的系统、终端设备，和/或一种适于存储指令的存储设备、和/或介质，所述指令包括：

以整个测试时间整个目标路径的时空速度矩阵为输入，经确定了具体结构和/或参数的卷积神经网络处理后，输出；

和/或，将任意时刻通过整个目标路径的真实旅行时间序列作为输入，经确定了具体结构和/或参数的循环神经网络处理后，输出；

将上述卷积神经网络的输出和循环神经网络的输出，同时作为输入，经确定了具体结构和/或参数的融合网络处理后，输出。

本发明的再一个目的是提供上述所述系统、终端设备、存储设备、和/或介质的制备方法。

具体的，所述制备方法包括，将所述指令导入、写入、和/或移入所述系统、终端设备、存储设备、和/或介质中。

具体的，所述指令适于处理器加载并执行。

具体的，所述终端设备包括移动和/或智能终端；具体的包括手机、电脑、笔记本电脑、机器人、和/或系统；所述存储设备包括手机、电脑、笔记本电脑、机器人、和/或系统的存储设备；所述介质包括硬盘、移动硬盘、光盘、软盘、文档、文件、u盘。

本发明的再一个目的是提供上述所述系统、终端设备、存储设备、和/或介质；和/或，所述系统、终端设备、存储设备、和/或介质的制备方法的应用。

所述应用包括：旅行时间预测；和/或制备可预测旅行时间的产品。

本发明根据当前速度信息估算出真实旅行时间，利用卷积神经网络对速度数据进行卷积操作，提取交通状态在空间上的特征，同时利用循环神经网络对旅行时间数据进行操作，提取旅行时间时序演变规律，将两个网络的输出进行串联同时作为输入到神经网络的全连接层，实现两个网络的融合。

本发明实现了基于浮动车数据的旅行时间预测，通过对浮动车数据精细化处理，充分考虑交通状态时空关系，进而得到高精度数据。本发明对浮动车数据精细化处理过程，巧妙的利用了目前主要应用于人工智能领域的卷积神经网络和循环神经网络，并将所述网络进行融合，通过网络的融合，实现了交通时空关系的融合，深度挖掘交通状态演变规律，最终实现了精确预测旅行时间。

与以往各类旅行时间预测模型相比，本发明提供的方法将交通状态的时空关系融合起来，充分挖掘历史数据特征，克服了其他方法无法应对交通流高度时变特性和非线性变化特征的难题，不需要先验知识和参数识别，具有较强的容错性和鲁棒性，精度高，稳定性好。

附图说明

图1是本发明旅行时间预测模型建立方法的流程示意图。

图2是深度学习网络结构示意图。

具体实施方式

下面结合实施例对本发明进行进一步说明。

本发明提供了一种基于浮动车数据的考虑交通状态时空关系的旅行时间预测模型及其建立方法，流程如图1所示。下面以北京市二环快速路为例，对本发明旅行时间预测模型建立过程进行详细说明，北京市二环快速路的全长为32.7km，本发明实施例根据2015年1月1日至2月14日从早上6点到晚上10点的提取的共计45天的浮动车历史数据，利用本发明所提出的方法进行旅行时间预测模型的建立、训练和验证，下面具体说明建模的各个步骤。

步骤1)浮动车数据处理。

将包含北京市二环的路网划分为大小为100m×100m的网格，将采集到的浮动车数据按照每2min时间间隔映射到与目标路段相应的网格中。并假定每个方格内的交通状况是均质的，在保证方格内浮动车样本量的情况下(一般至少5辆)，计算方格内的样本车辆的平均速度。将方格内样本车辆的平均速度值作为此路段的交通状态的速度值，由此得到目标路径每100m每2min的速度值，将其拓展到整个路径和所有时刻。

基于北京市二环快速路一天内从早上六点到晚上十点的浮动车速度数据，可得到一个大小为320×480的时空速度矩阵，320代表320个100m，共计32km；480代表480个2min时间间隔，共计16h。每天的浮动车数据对应一个时空速度矩阵。

根据上述时空速度矩阵，可计算出任意出发时刻(本实施例具体选取了每天从早上七点到晚上九点)通过整个目标路径的真实旅行时间。某个给定出发时刻的真实旅行时间是指，一辆车以该给定时刻为出发时间，通过目标路径所有固定路段的真实旅行时间。在计算真实旅行时间的时候，要保证车辆进入不同方格后速度动态更新，即要根据计算得到的该车辆经过的第一个方格的真实旅行时间，来定位该车辆在下一个固定路段所经过的方格，即为该车经过的第二个方格，由第二个方格内的速度值来计算该车经过第二个方格的真实旅行时间；以相同的方法，依次定位出该车辆经过的包含目标路径的所有方格，最终通过累加该车辆通过的每个方格的真实旅行时间得出通过整个路径的真实旅行时间。

步骤2)建立旅行时间的预测模型。

(2.1)搭建提取交通状态的空间特征的卷积神经网络(cnn)；如图2所示，目标路网的交通状态可由整个测试时间内整个目标路径的速度矩阵体现，即可通过包含所有路段所有时间间隔的时空速度矩阵表示，即s＝[s1,s2,…,st]，其中st是一个状态向量，表示某时刻所有路段的速度集合，即st＝[x1,x2,…，xn]，x代表路段的速度值(具体的本实施例中x为上述得到的目标路径每100m每2min的速度值)，n代表路段的个数(具体的本实施例中n为上述得到的320)，t代表整个测试时间内的时间间隔总个数(具体的本实施例中t选取30)，以s为输入，利用卷积神经网络从时空速度矩阵中提取交通状态的空间特征，输出可理解为交通状态在空间范围的抽象表达或目标路径的交通状态的空间特征，即[h1,h2,h3…,hn]，并将此作为全连接层的部分输入。卷积神经网络结构组成如下：输入-卷积层1-池化层1-卷积层2-池化层2-卷积层3-flatten层，网络的具体参数设置见表1。

(2.2)搭建提取真实旅行时间时序特征的循环神经网络；如图2所示，将待预测出发时刻前m个时间间隔(本实施例中m为15个，所述时间间隔具体为2min)，每个时间间隔的最后时刻通过整个目标路径的真实旅行时间序列作为输入，即t＝[t1,t2,…,tm]，其中tm代表第m个时间间隔的最后时刻的真实旅行时间。

本模型为了充分挖掘旅行时间的时序关系，克服传统循环神经网络(rnn)梯度消失的问题，引入长短时记忆网络(lstm),作为循环神经网络的一个变种，lstm能克服传统循环神经网络在长期依赖的问题。利用lstm网络对旅行时间序列进行挖掘，输出为时序的旅行时间序列在时间范围的抽象表达，即[p1,p2,…,pm],并将此作为全连接层的部分输入，循环神经网络结构组成如下：输入-lstm层-输出，网络的具体参数设置见表1；

步骤3)网络模型融合；如图2所示，将卷积神经网络和循环神经网络的输出串联起来，同时作为输入(前后串联，拉直为一条向量)，接入两个全连接层，从而实现对两个神经网络的融合，即交通状态时间和空间两个层面的融合，通过融合，能够将交通状态的时空关系充分挖掘，使得预测结果更准确。融合网络结构组成如下：输入-dropout层1-全连接层1-dropout层2-全连接层2-dropout层3-输出层，网络的具体参数设置见表1。

表1神经网络结构参数表

步骤3)模型准确性评价。

为了评价本发明的预测模型的预测精度，分别选取历史平均、瞬时旅行时间以及naiveknn方法与本发明方法进行对比，以2015年1月1号(非工作日)和2015年1月8号(工作日)为例，分别计算出各种方法与给定各个出发时刻对应预测时间，以平均绝对百分误差和平均绝对误差作为度量误差指标，如公式(1)和(2)所示，对预测结果进行评价。

其中，mae表示平均绝对误差，mape表示平均绝对百分比误差，t(t)和分别代表真实的旅行时间和预测值，n代表预测的时间间隔数。

选取1月8号和1月1号共计2天可得到误差对比表2。

表2误差对比表

通过对比可发现，本发明提出的方法，无论是在拥堵高峰还是平峰都取得了较好的预测效果，本发明方法均优于其他方法且与真实值非常接近，表明本发明预测精度高，预测效果好。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王云鹏;张志豪;余贵珍;任毅龙;陈鹏
技术所有人：北京航空航天大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.机器人 2.嵌入式控制系统开发
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、毕老师：机构动力学与控制
4、袁老师：1.计算机视觉 2.无线网络及物联网
5、周老师：1.智能机器人技术 2.智能检测与控制技术 3.机构运动学与动力学 4.机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。