一种基于LSTM模型的机场交通拥堵预测方法及装置与流程

文档序号:16091645发布日期:2018-11-27 23:05阅读:532来源:国知局

本发明涉及计算机科学和智能交通技术领域,特别涉及一种基于LSTM模型的机场交通拥堵预测方法及装置。



背景技术:

伴随我国城市化进程的快速推进,城市拥堵已经成为困扰城市发展的重要因素之一,如何提高城市交通运行效率、缓解拥堵压力已经成为城市实现可持续健康发展必须解决的问题。面对挑战,各大城市和导航公司相继发布“交通拥堵延时指数”,来作为交通管理和引导的重要手段。如,北京市交通委员会发布的“交通指数”和“交通运行分析报告”,高德地图发布的“中国主要城市拥堵排名”等。

利用这些指数信息可以有效提高城市交通管理水平,但交通指数仅能反映当前交通状况,对未来交通状况的变化缺乏预见性。而且交通拥堵不仅会带来出行效率的降低、出行成本、事故发生率的增高,而且也会因油耗的增高和燃油的不完全燃烧造成能源浪费和大气污染。如何避免和缓解交通拥堵成为人们关心的问题。

另一方面,随着车联网技术的应用和大数据时代的到来,人们可以利用多种手段对交通拥堵进行监测,例如Andrea等[1]使用GPS跟踪器和智能手机识别实时的交通拥堵和事故,Kong等通过浮动车轨迹数据对城市交通拥堵进行识别和预测,提供路况服务的互联网公司也主要基于浮动车模型,Bauza和Gozalvez基于车辆与车辆、车辆与基础设施节点间信息交换来监测道路交通拥堵。

近几十年来,学者就交通流预测问题已经发展出多种模型,大体上分为以下几类:(1)以时间序列方法为代表,对交通拥堵延时指数构建ARIMA等模型,预测未来一段时间(如天,小时,分钟等)的交通状况,如Voort等研究了ARIMA模型在交通流预测上的应用,Williams等利用季节性ARIMA模型进行交通流的短时预测;(2)K近邻、支持向量机、核函数回归等非参数方法,如Smith等比较研究了非参数回归和季节性ARIMA模型的预测效果,于滨等基于K近邻非参数方法对交通流进行短时预测,达庆东等运用非参数回归建立交通流流量和速度模型;(3)用高斯过程等贝叶斯方法,将交通状况视为随机过程建模并预测,如康军事等;(4)Kalman滤波方法在交通流预测上的应用,如XIEYuan-chang等、XUDong-wei等人的研究。(5)基于人工神经网络的短时交通流预测技术,如姚志洪等、况爱武等人的研究。这些方法在其特定的场景下均取得很好的应用效果,但仍然有待改进。



技术实现要素:

鉴于上述问题,本发明提供了一种基于LSTM模型的机场交通拥堵预测方法及装置,该方法基于空间和时间效应的考虑,且增加航空气象信息,将区域内交通视作一个时空相关的系统,基于LSTM模型得到预测结果,可进一步提升机场周边预设范围内道路拥堵指数预测的准确度。

第一方面,本发明实施例提供一种基于LSTM模型的机场交通拥堵预测方法,包括:

实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

将所述交通状况信息、航班起降信息和航空气象信息,输入LSTM模型;

获取所述LSTM模型的输出结果,所述输出结果为预测未来时段机场周边预设范围内道路的拥堵指数。

在一个实施例中,所述LSTM模型训练过程如下:

实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

将所述交通状况信息、航班起降信息和航空气象信息,按照时间进行关联;

关联后获得每小时内的道路拥堵指数、航空数据和气象数据,合并节假日、工作日和其他活动时间序列数据,构成数据集;

对所述航空数据和气象数据增加滞后效应,生成所述LSTM模型。

在一个实施例中,对所述航空数据、气象数据增加滞后效应,生成所述LSTM模型,包括:

将LSTM模型用于时间序列预测,得到输出向量ht后,连接一个全连接层,从而最终得到预测值:

其中,σ表示激活函数;Wout为全连接层矩阵,维度为1×dh;ht表示输出向量;bout表示截距项;为第s条时间序列t+1期的预测值。

在一个实施例中,所述LSTM模型的损失函数,包括:MAE和MAPE损失函数;

向前预测n步的损失函数公式为:

公式(8)中,MAEs是衡量预测效果的指标名称;s表示道路;t表示时间;l表示时间序列;n表示向前预测的步长;表示实际拥堵指数;表示预测的拥堵指数;

公式(9)中,MAPEs是另一个衡量预测效果的指标名称;s表示道路;t表示时间;l表示时间序列;n表示向前预测的步长;表示实际拥堵指数;表示预测的拥堵指数。

在一个实施例中,实时获取机场周边预设范围内道路的交通状况信息,包括:

通过数据接口实时获取机场周边预设范围内道路的车流量和行驶速度,计算道路拥堵指数。

第二方面,本发明实施例提供一种基于LSTM模型的机场交通拥堵预测装置,包括:

获取模块,用于实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

输入模块,用于将所述交通状况信息、航班起降信息和航空气象信息,输入LSTM模型;

预测模块,用于获取所述LSTM模型的输出结果,所述输出结果为预测未来时段机场周边预设范围内道路的拥堵指数。

在一个实施例中,所述LSTM模型包括:

获取子模块,用于实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

输入子模块,用于将所述交通状况信息、航班起降信息和航空气象信息,按照时间进行关联;

构成子模块,用于根据输入子模块关联后获得每小时内的道路拥堵指数、航空数据和气象数据,合并节假日、工作日和其他活动时间序列数据,构成数据集;

生成子模块,用于对所述航空数据和气象数据增加滞后效应,生成所述LSTM模型。

在一个实施例中,所述生成子模块,具体用于将LSTM模型用于时间序列预测,得到输出向量ht后,连接一个全连接层,从而最终得到预测值:

其中,σ表示激活函数;Wout为全连接层矩阵,维度为1×dh;ht表示输出向量;bout表示截距项;为第s条时间序列t+1期的预测值。

在一个实施例中,所述LSTM模型的损失函数,包括:MAE和MAPE损失函数;

向前预测n步的损失函数公式为:

公式(8)中,MAEs是衡量预测效果的指标名称;s表示道路;t表示时间;l表示时间序列;n表示向前预测的步长;表示实际拥堵指数;表示预测的拥堵指数;

公式(9)中,MAPEs是另一个衡量预测效果的指标名称;s表示道路;t表示时间;l表示时间序列;n表示向前预测的步长;表示实际拥堵指数;表示预测的拥堵指数。

在一个实施例中,所述获取子模块中实时获取机场周边预设范围内道路的交通状况信息,包括:

通过数据接口实时获取机场周边预设范围内道路的车流量和行驶速度,计算道路拥堵指数。

本发明实施例提供的上述技术方案的有益效果至少包括:

本发明实施例提供的一种基于LSTM模型的机场交通拥堵预测方法,实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;将所述交通状况信息、航班起降信息和航空气象信息,输入LSTM模型;获取所述LSTM模型的输出结果,所述输出结果为预测未来时段机场周边预设范围内道路的拥堵指数。该方法基于空间和时间效应的考虑,且增加航空气象信息,将区域内交通视作一个时空相关的系统,基于LSTM模型得到预测结果,可进一步提升机场周边预设范围内道路拥堵指数预测的准确度。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例提供的基于LSTM模型的机场交通拥堵预测方法的流程图;

图2为RNN模型结构示意图;

图3为经典RNN模型(左)与LSTM模型(右)的结构图;

图4为LSTM模型模块结构图;

图5为本发明实施例提供的LSTM模型训练过程的流程图;

图6为2017年7月首都机场高速拥堵延时指数的示意图;

图7为机场高速公路拥堵延时指数与航空客流量关系示意图;

图8为本发明实施例提供的基于LSTM模型的机场交通拥堵预测装置框图;

图9为本发明实施例提供的LSTM模型的框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

参照图1所示,本发明实施例提供的基于LSTM模型的机场交通拥堵预测方法,包括:S101~S103;

S101、实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

S102、将所述交通状况信息、航班起降信息和航空气象信息,输入LSTM模型;

S103、获取所述LSTM模型的输出结果,所述输出结果为预测未来时段机场周边预设范围内道路的拥堵指数。

本实施例中,上述步骤S101实时获取机场周边预设范围内道路的交通状况信息,比如为道路上的车流量、汽车行驶速度,可以进而计算出道路拥堵指数。

以北京首都机场为例,通过数据接口实时获取机场周边58条道路车流量和行驶速度,进而计算道路拥堵指数,计算公式为道路设计时速除以实时平均行驶速度;也可以是通过其他现有计算方式计算出的道路拥堵指数。比如:如果当前车流量为0时,拥堵指数为1(表示完全不拥堵),拥堵指数越大表示道路越拥堵,最终得到如下数据结构:

实时获取北京首都机场航班起降信息,包括实际国内达到架次、实际国内到达人数、实际国际达到架次、实际国内到达人数、实际国内出发架次、实际国内出发人数、实际国际出发架次、实际国际出发人数、计划国内达到架次、计划国内到达人数、计划国际达到架次、计划国内到达人数、计划国内出发架次、计划国内出发人数、计划国际出发架次、计划国际出发人数。

通过机场数据接口,实时获取首都机场航班数据,特别的当有空中交通管制时,实际航空数据为0,但计划数据仍然不为0。其中,获取航班信息为具体航班明细,如“21点03分,从北京飞往上海的航班”,对以上获取数据在每个小时上进行汇总,即将具体的航班的信息汇总为数据,汇总后的数据含义为“20170809日0时到1时之间国内达到飞机架次之和以及到达人数之和等”。并将数据组织为如下结构:

实时获取机场周边航空气象信息,包括风速、风向、温度、降水、雷电、雾、尘等航空影响因素;

通过气象数据接口获取实时航空气象报文数据,包括例行天气报文(METAR)与特殊天气报文(SPECI),经过报文解析模块提取报文中的气象信息,特别的气象数据为每隔半小时的报文数据,在建模时取离整点时刻最近的气象状况作为整点时刻的气象,如气象报文时间为21点05分,在建模时我们将其作为21点整点的气象数据,将航空数据组织为如下结构:

将上述交通状况信息、航班起降信息和航空气象信息,输入LSTM模型;其中包括模型因变量和模型自变量;模型因变量比如为机场周边58条道路的小时级别拥堵指数,共计58个因变量。模型自变量包括,气象数据、航班数据以及拥堵指数滞后项。其中气象变量包括:风速、风向、温度、降水、雷电、雾、尘共计7个变量;航空变量包括:实际国内达到架次、实际国内到达人数、实际国际达到架次、实际国内到达人数、实际国内出发架次、实际国内出发人数、实际国际出发架次、实际国际出发人数、计划国内达到架次、计划国内到达人数、计划国际达到架次、计划国内到达人数、计划国内出发架次、计划国内出发人数、计划国际出发架次、计划国际出发人数共计16个变量;拥堵指数的二阶滞后项,如预测上午9时的拥堵指数,二阶滞后为上午8点和上午7点的拥堵指数。

LSTM模型的输出结果,即:为预测未来时段机场周边预设范围内道路的拥堵指数。在预测未来交通状况时,将航空数据、气象数据以及家假日数据作为输入,带入到模型中运算,得到机场周边58条道路的拥堵指数预测值。该方法基于空间和时间效应的考虑,且增加航空气象信息,将区域内交通视作一个时空相关的系统,基于LSTM模型得到预测结果,可进一步提升机场周边预设范围内道路拥堵指数预测的准确度。

LSTM模型最早由SeppHochreiter和JürgenSchmidhuber于1997年提出,用来解决RNN模型中梯度消失或梯度膨胀的一种特定变形。通过在RNN中引入多个门限,使得在模型参数固定的情况下,不同时刻积分可以改变,从而避免梯度消失或膨胀问题。LSTM模型在序列数据预测方面取得了令人震惊的效果。

LSTM模型是RNN模型中应用最广最广泛的模型之一,RNN模型最大的特点在它的隐藏层输出不仅连接输出层,还连接下一时刻的隐藏层。图2是RNN模型结构示意图,等号右侧是展开后的RNN网络结构,包括输入层X、隐藏层模块A和输出层h,其中重复模块A在网络中任意时刻结构均相同。与典型神经网络不同的是,模块A的输出包括相同的两份,一份传递至输出层,一份传递至下一个隐藏模块。由于在经典RNN模型中模块A仅通过一个tanh激活函数对输入变量做变换,导致RNN模型在处理序列数据时,特别是长序列时,常常遇到梯度消失和梯度膨胀的问题,最终导致模型不收敛。

参照图3所示,LSTM模型基于RNN模型发展而来,区别在于中间重复模块不同。在LSTM模型重复模型(又称存储单元)中包括由四个相关作用的激活函数(其中三个是sigmoid函数,一个是tanh函数)构成的三种门限结构,分别是遗忘门、输入门和输出门,通过这种门限结构来模拟开关控制信息的输入和输出,实现训练误差可以正向和反向传播,以达到训练模型至收敛的目的。

现假设有k个内生时间序列变量m个外生变量令那么现在目标是建立LSTM模型预测未来内生变量s=1,...,k。为了使得LSTM模型能对序列保持记忆,构建样本时需使用滞后项xt-1,xt-2,因此从这个角度来说,LSTM模型用于时间序列时,在激活函数均为线性变换的情况下可以退化为VAR模型,因此VAR模型实际上是LSTM模型的一个特例。

参照图4所示,LSTM模型核心是存储单元中的三种门限结构,存储单元最终得到状态向量Ct和输出向量ht,具体包括以下三个过程:

1)由公式1构成遗忘门限(forget gate),通过设置连接矩阵Wf来决定从上一时刻输出向量ht-1中去除或保留哪些信息

ft=σ(Wf·[ht-1,xt]+bf) 公式(1)

其中,xt为dk+m维原始输入,ht-1为dh维输出,隐藏层维度为dc(通常dh=dc),[ht-1,xt]表示将两个向量拼接更长的向量,维度为dh+dk+m,Wf为遗忘门系数矩阵维度为dc×(dh+dk+m),bf为偏置向量,维度为dc,经激活函数σ逐点变换后得到ft,维度为dc。

2)输入门(input gate),来决定单元状态向量Ct该如何更新,具体如下:

it=σ(Wf·[ht-1,xt]+bi) 公式(2)

通过公式(2)得到向量it,维度为dc,其次通过公式(3)得到临时状态向量最后将上一期状态向量Ct-1与临时状向量加权求和,更新状态向量Ct。

3)式(5)和式(6)构成输出门(output gate),在获得最新单元状态向量Ct后,利用tanh激活函数,得到输出向量ht

ot=σ(Wo·[ht-1,xt]+bo) 公式(5)

ht=ot*tanh(Ct) 公式(6)

LSTM模型中模块之间结构完全相同,且不同模块之间共享权值矩阵Wf、Wi、Wc和Wo,这使得模型参数规模得到控制。

将LSTM模型用于时间序列预测时,得到输出向量ht后,还会连接一个全连接层,从而最终得到预测值,如公式(7)所示

其中,σ表示激活函数;Wout为全连接层矩阵,维度为1×dh;ht表示输出向量;bout表示截距项,也称之为偏置量是待估计的一个参数;为第s条时间序列t+1期的预测值。

本文选择MAE(mean absolute error,平均绝对误差)和MAPE(mean absolute percentage error,平均绝对百分误差)作为LSTM模型的损失函数,主要有两点考虑:第一,时间序列预测本质上是回归问题,因而不适合选择分类问题中普遍使用的交叉熵作为损失函数;第二,MAE和MAPE相比于MSE(mean square error,均方误差)有更好的稳健性。向前预测n步的损失函数如公式(8)-(9)所示

表示道路s,比如58条道路中一条,在l时刻(如上午9时)的真实拥堵指数,而表示预测的拥堵指数,n表示向前预测的步长(预测未来n小时),MAEs是衡量预测效果的指标名称,英文全称为Mean Absolute Error。

表示道路s,比如58条道路中一条,在l时刻(如上午9时)的真实拥堵指数,而表示预测的拥堵指数,n表示向前预测的步长(预测未来n小时),MAPEs是另一个衡量预测效果的指标名称,英文全称为Mean AbsolutePerccent Error。

求解LSTM模型的方法是BPTT(Back Propagation Through Time)算法,其基于BPTT算法,能够在不同网络层和不同时刻传导梯度,进而更新模型参数。

在一个实施例中,上述LSTM模型训练过程如下:参照图5所示,包括:S501~S504;

S501、实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

S502、将所述交通状况信息、航班起降信息和航空气象信息,按照时间进行关联;

S503、关联后获得每小时内的道路拥堵指数、航空数据和气象数据,合并节假日、工作日和其他活动时间序列数据,构成数据集;

S504、对所述航空数据和气象数据增加滞后效应,生成所述LSTM模型。

步骤S503中,对获得和解析的所有数据进行关联,按照时间进行关联,关联后可以得到每小时的道路拥堵指数、航空数据以及气象数据,同时将依据时间关联节假日等信息,构成完整数据集。其中,道路拥堵指数为因变量,其他所有数据为自变量。

训练模型的步骤具体包括:增加航空数据、气象数据增加滞后效应。比如,设当前时刻为2017年8月9日上午10时,在预测的自变量中再增加2017年8月9日上午9时,2017年8月9日上午8时,2017年8月9日上午7时这三个时刻的航空和气象数据,原因是当前时刻的交通状况会受前几个时刻的航空等因素影响,如航班达到后,旅客需要一定时间拿取行李或乘坐地面交通工具,这往往后明显的时滞。

下面通过具体实施例来实证分析本发明预测方法的准确性。

1数据说明及描述分析

比如本发明使用数据为2016年8月1日00:00:00时至2017年7月31日23:00:00北京首都国际机场辖区内58条道路的交通拥堵延时指数(由高德提供)和航班进出港数据(由中国民航科学技术研究院提供),时间粒度为小时级,共计8756个时间点。由此整理和衍生出的变量见表1。其中,拥堵延时指数是指城市居民平均一次出行实际旅时间与自由流状态下的比值,作为拥堵程度的评价指标。

表1:变量说明

通过数据描述分析,发现以下规律:

(1)不同道路拥堵状况差异明显

对北京首都国际机场辖区内58条道路拥堵延时指数建模预测,用y1,...,y58表示58条道路的拥堵延时指数时间序列数据。每条道路的拥堵情况存在较大差异,其中机场货运路、机场高速和机场高速辅路是三条最为繁忙的道路,平均拥堵延时指数2在1.3以上,而其余道路很少出现拥堵。其中,机场货运路拥堵延时指数最高,平均拥堵延时指数达1.9,但其原因是出租车排队等候,而非真正的交通拥堵。三条连接北京市区与机场的主要道路拥堵情况存在较大差异,机场高速是连接机场与北京市区最短的高速干道,拥堵延时指数最高,其次是机场高速辅路,而机场货运路虽然对机场客流起到了分流作用,但即便是早晚高峰时段,这条道路也没有出现明显的交通拥堵。针对每条道路拥堵情况差异较大的特点,本文对每条道路分别建模,建模时考虑了道路之间可能存在的相互影响。

(2)道路拥堵周期性特征明显

图6表示2017年7首都机高速拥堵延时指数,从图6可,首都机场高速的拥堵延时指数呈现明显的周期性,工作日、周六、周日差异明显,工作日的高峰时段通常出现在7:00~11:00,拥堵延时指数均在2以上,周六基本上全天不会出现拥堵,周日的拥堵通常出现在下午13:00~17:00。因此,建模时引入时段、星期和是否工作日的时间因素。从图6中可以观察到拥堵延时指数和时段有类似于正弦曲线的关系,考虑引入谐波分析中知两项以表示时段效应,同理考虑引入四项以表示星期和月份效应,其中t表示时段,w表示星期,m表示月份。相比于引入时段、星期、月份的虚拟变量,这样处理的好处在于不仅可以减少待估参数的个数,而且考虑了周期性。

(3)地面交通与航空因素密切相关

参照图7所示,由于航班实际进(出)港时间和计划进(出)港时间可能存在不一致,本文对进出港航班信息进行加工,得到每小时按公司计划时间和实际进出港时间两个维度的进出港客流量数据。根据经验判断,人们通常会按航班的计划离港时间提前1-2小时到达机场,并在航班实际进港后1-2小时离开机场。图7展示的是滞后期计划离港人数和实际进港人数与机场高速拥堵延时指数的时序图,场高速拥堵延时指数与滞后期计划离港人数和实际进港人数存在较强的相关关系,计算得到相关系数在0.6左右。因此,本文引入滞后1期和滞后2期的计划离港人数和实际进港人数4个与航空因素相关的变量,用于预测地面交通拥堵延时指数。

3.2数据集构造

本文建模包括以下变量:58条道路及其2阶滞后项合计174个变量,按计划时间离港人数和按实际时间到港人数的1阶和2阶滞后项合计4个变量以及7个时间变量,共计185个变量,样本量为8754。(滞后3期的计划离港人数与道路拥堵延时指数的相关系数只有0.23,实际进港人数与道路拥堵延时指数亦只有0.15,因此仅考虑滞后1期和2期的航空客流量数据。由于考虑了2阶滞后,因此样本量损失2。)

为构建稳健的预测模型,防止过拟合以及比较模型预测效果,本文将数据集划分为训练集、验证集和测试集三个部分,其中前80%序列数据作为训练集(2016年8月1日00:00:00至2017年5月19日23:00:00),后20%数据作为交叉验证集(2017年5月20日00:00:00至2017年7月24日23:00:00),数据集最后一周数据(2017年7月25日00:00:00至2017年7月31日23:00:00)作为测试集。训练集用于建立模型并估计模型参数,验证集用于选择模型参数并防止模型过拟合,测试集用于比较最终预测结果。本文选取MAE和MAPE作为模型预测效果的评价指标,二者取值越小表明模型预测效果越好。

3.3比较模型

本文选取线性模型ARMA和VAR模型作为对照模型。对研究中涉及的所有时间序列进行单位根检验,均在0.05的显著性水平下拒绝单位根原假设,表明时间序列平稳,可以建立ARMA和VAR模型。ARMA模型和VAR模型见公式(10)-(11)。

其中,表示第t期第k条道路的拥堵延时指数,DS表示按计划时间的离港人数,AR表示按实际时间的到港人数,WE表示是否工作日的虚拟变量。

与LSTM模型不同,ARMA模型和VAR模型均为线性模型。ARMA模型仅考虑每条道路自身滞后期的影响,而VAR模型不仅考虑自身滞后期的影响,还加入了其他道路滞后期的影响,即考虑了可能存在的空间相关。

4模型结果及分析

比如选取58条道路其中的首都机场高速双向道路,即从首都机场到东直门方向和从东直门到首都机场方向,用于比较模型的预测效果。(见表2-3)

表2首都机场高速(首都机场至东直门方向)拥堵延时指数预测比较

表3首都机场高速(东直门至首都机场方向)拥堵延时指数预测比较

从预测效果看,LSTM模型几乎在所有预测期一致优于ARMA和VAR模型。对于机场高速首都机场至东直门方向,在预测期内,LSTM模型的MAPE均值仅为8.6%,以MAE评价的预测效果比ARMA提升42%,比VAR提升22%。与未考虑航空因素的LSTM模型相比,考虑航空因素的LSTM模型的预测效果提升了13%,证实了机场道路交通预测的特殊性,即受航空因素影响较大。

对于机场高速东直门至首都机场方向,在预测期内,LSTM模型的MAPE均值仅为9.0%,预测效果相比于ARMA和VAR亦有较大幅度的提升,分别提升了20%和10%,与未考虑航空因素的LSTM模型相比,预测效果亦有提升,提升幅度为9%。

从MAE和MAPE两项指标的稳定性来看,二者并没有随着时间推移而显著增大,表明模型预测能力具有良好的鲁棒性。

上述实施例基于北京首都国际机场空地数据对机场道路拥堵延时指数进行预测。证实了滞后期的航空客流量对路面交通拥堵预测效果的提升有显著影响,MAE提升10%左右;其次,基于深度学习算法的LSTM模型的预测效果一致优于线性模型ARMA和VAR模型,预测精度显著提升。本发明实施例中可以得出,在预测交通拥堵时,不同道路由于道路属性迥异,影响交通状况的因素也各不相同,在如果能充分分析导致道路拥堵的原因后,预测模型效果会有明显的提升。

本发明实施例提供的方法,有利于提升机场路面交通拥堵延时指数的预测效果,从而对相关管理部门的工作提供更精确地指导,例如交通警察警力的部署等。未来研究还可以进一步考虑更多影响交通状况的因素,如天气状况、节假日因素以及交通事故等,来进一步提升机场道路预测的准确度。

基于同一发明构思,本发明实施例还提供了一种基于LSTM模型的机场交通拥堵预测装置,由于该装置所解决问题的原理与前述基于LSTM模型的机场交通拥堵预测方法相似,因此该装置的实施可以参见前述方法的实施,重复之处不再赘述。

本发明实施例还提供了一种基于LSTM模型的机场交通拥堵预测装置,该装置参照图8所示,

获取模块81,用于实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

输入模块82,用于将所述交通状况信息、航班起降信息和航空气象信息,输入LSTM模型;

预测模块83,用于获取所述LSTM模型的输出结果,所述输出结果为预测未来时段机场周边预设范围内道路的拥堵指数。

在一个实施例中,所述LSTM模型包括:

获取子模块91,用于实时获取机场周边预设范围内道路的交通状况信息和机场航班起降信息、以及机场周边预设范围内航空气象信息;

输入子模块92,用于将所述交通状况信息、航班起降信息和航空气象信息,按照时间进行关联;

构成子模块93,用于根据输入子模块关联后获得每小时内的道路拥堵指数、航空数据和气象数据,合并节假日、工作日和其他活动时间序列数据,构成数据集;

生成子模块94,用于对所述航空数据和气象数据增加滞后效应,生成所述LSTM模型。

在一个实施例中,所述生成子模块94,具体用于将LSTM模型用于时间序列预测,得到输出向量ht后,连接一个全连接层,从而最终得到预测值:

其中,σ表示激活函数;Wout为全连接层矩阵,维度为1×dh;ht表示输出向量;bout表示截距项;为第s条时间序列t+1期的预测值。

在一个实施例中,所述LSTM模型的损失函数,包括:MAE和MAPE损失函数;

向前预测n步的损失函数公式为:

公式(8)中,MAEs是衡量预测效果的指标名称;t表示时间;l表示拥堵指数;n表示向前预测的步长;表示道路s;表示预测的拥堵指数;

公式(9)中,MAPEs是另一个衡量预测效果的指标名称;s表示道路;t表示时间;l表示时间序列;n表示向前预测的步长;表示实际拥堵指数;表示预测的拥堵指数。

在一个实施例中,所述获取子模块91中实时获取机场周边预设范围内道路的交通状况信息,包括:

通过数据接口实时获取机场周边预设范围内道路的车流量和行驶速度,计算道路拥堵指数。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1