一种基于深度学习的航班延误预测方法与流程

文档序号:19636265发布日期:2020-01-07 12:02阅读:1516来源:国知局
一种基于深度学习的航班延误预测方法与流程

本发明涉及航班延误预测技术领域,具体涉及一种基于深度学习的航班延误预测方法,用于航班延误预测。



背景技术:

随着民航业的快速发展,航班延误逐渐成为一个热点话题。航班延误成因较难解释,因为其可能受制于多重因素,例如天气原因,出发地或者目的地机场管理原因,航空公司管理原因,航空管制原因,前序航班原因,旅客原因等等,甚至多重原因叠加或多种原因形成连锁效应。

对于机场而言,尤其是规模较大的机场,航班延误将导致非常有限的航路、跑道、机场设施等资源分配计划被打乱,也可能导致旅客滞留,从而显著增加机场的安全、运营和调度压力,造成航空公司或旅客满意度下降;对航空公司而言,其营业利润严重依赖于每架飞机严格按照计划时刻表运营,每次航班延误将导致运营、维护和人力成本的增加,并可能导致后序的运营计划全部被打乱,后序航班持续延误或被迫取消,各种成本进一步上升;对旅客而言,航班延误为出行途中最不愿意碰到的情况,时间、精力因此而损耗,后序行程也因此受到影响;对于保险公司而言,航班延误的研究与预测也对其旅行保险、航班延误险等险种的定价与经营有重要的意义。更加精确和有效的航班延误预测模型的建立有助于对机场、航空公司、保险公司和旅客这些方面在管理、决策和选择的方面具有深远的价值和意义。

相关学者对于航班延误预测的研究主要从以下几个角度进行:

(1)基于机场视角的延误预测,即针对机场起降数据以统计性数据为主,通过航班的起降数据进行分析并预测延误状况;

(2)基于航空公司视角的延误预测,即针对航空公司下属的各个航班的延误情况进行分析并预测未来的延误;

实际上,导致航班延误的因素有很多,如出发地或者目的地机场管理原因,航空公司管理原因,航空管制原因,前序航班原因,旅客原因等等,甚至多重原因叠加或多种原因形成连锁效应。而国内外现有研究大多数只从某一个或少量方面的角度进行研究,而对于航班延误时序性角度的研究更少,这就导致无法通过综合因素来考究航班延误的状况,使得预测结果不够精确。国内外对于航班延误预测这个领域中的研究仍存在以下问题:(1)现有的通过神经网络预测航班延误的方法,其网络结构简单,网络层数深度只有几层,不能够更好地有效地提取特征,从而导致预测结果不精确够。



技术实现要素:

本发明的目的在于解决现有航班延误预测方法中存在的缺点和不足,提出一种基于深度学习的航班延误预测方法,以实现准确率更高的航班延误预测方法。

本发明解决其技术问题所采用的方案是:

一种基于深度学习的航班延误预测方法,包括如下步骤:

步骤1:处理数据集并将处理后的数据集输入到网络模型中。

步骤2:将步骤1中处理好的数据集以时序的矩阵形式输入到lstm网络中提取时序上的时序特征。

步骤3:将步骤2中由lstm网络提取到的时序特征输入到resnet网络中进行更深层的特征提取。

步骤4:预测航班延误状态并计算预测准确率。

本发明有益效果如下:

本发明将航班延误预测的时序性特征加入到模型中,使用特征数量更多的样本作为输入,并加入具有残差结构的网络将网络层数做深,在将网络做深的基础上保留浅层网络中具有的特征,使特征在深层的网络中不被损耗,提高航班延误预测模型的准确率。

附图说明

图1为本发明的整体流程图,整体流程分为4个模块,第一模块为数据输入模块,此模块将预处理好的数据输入到第二个模块lstm网络结构中,在lstm网络模块中提取航班延误在时许上的特征,此后将提取到的特征输入resnet网络结构中继续提取深层次特征,最后通过输出航班延误的具体预测时间。

图2为本发明网络结构的结构图,首先将数据以时序形式输入到lstm网络中,其中所使用到的特征包括:origin_airport,destinattion_airprot,data,flight_number,arival_delay。通过左侧的lstm网络提取到时序特征后,将此特征和airline,departure_delay,taxi_out,wheels_off,elapsed_time,air_time,distance,wheels_on,taxi_in这些特征一起输入到resnet网络结构中,通过多层的残差块结构提取深层特征,最后使用softmax函数将预测结果分为4个模块输出。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

步骤1:处理数据集并将处理后的数据集输入到网络模型中。

1-1数据集中包含英文,如机场、航空公司等,将英文全部转化为数字,使相同的英文字母对应相同的数字。编码方式使用ascii码组合形式,例如数据集中atl表示hartsfield-jacksonatlantainternationalairport,将atl编码为658476,las编码为766583,如此方式将322个机场分别编码。

1-2将处理英文后的数据集中的数据进行预处理,删除冗余特征、处理缺失值、去除不合理数据、特征归一化。

1-3将处理后的数据集分成三个类别重新制作。

1-3-1.将数据集中的数据按航班类别筛选,将不同的航班一年内所有的起降数据分开到不同的数据集中。例,筛选航班号为1173的航班,属于6876航空公司,将其全部筛选出来放入一个csv文件中,共329条数据。以此方式共挑选10个航班的数据进行实验。

1-3-2.将数据集中的数据按机场类别筛选,将不同的机场分类,筛选某个机场一年内所有的起降航班到不同数据集中。例,atl机场的编码为658476,筛选出降落在此机场的所有航班,共64744条航班数据。以此方式共挑选10个机场的数据进行实验。

1-3-3.将数据集中的数据按航空公司类别筛选,不同的航空公司一年内所有的航班起降数据筛选到不同数据集中。例,aa航空公司代表americanairlinesinc,其编码为6565。将其航空公司所属的所有航班起降数据筛选出来共712936条数据,以此方式共挑选10个航空公司的数据进行实验。

1-4数据集标签化。将数据集中“arrival_delay”到达延误这个一列的数据做标签,将其分为四个类别:

①延误时间小于0分钟;

②延误时间大于0分钟小于45分钟;

③延误时间大于45分钟小于90分钟;

④延误时间大于90分钟。

本发明的预测即对这一数据进行预测。

步骤2:将步骤1中处理好的数据集以时序的矩阵形式输入到lstm网络中提取时序上的特征。首先确定选择输入lstm网络中的输入特征,选择的输入特征包括:

共18个特征。以步骤1-3-1为例,将航班号为1173的航班数据文件共329条数据以20个时间步依次输入到网络中,则输入到lstm的数据维度为xt(329,20,18)。lstm的隐藏层数设为35。

2-1使用lstm的当前输入xt和上一个状态传递下来的ht-1,拼接得到四个状态:z、zi、zf、zo。ht-1为接收到的上一个节点的输入,其中,xt表示输入到lstm的数据维度;z为输入的数据通过tanh激活函数将数据转换成-1到1之间的值;zi、zf、zo为由数据集的拼接向量乘以权重矩阵后,通过sigmoid激活函数转换成0到1之间的数值作为门控状态。其中:

w为z状态下设置的权重值,wi为zi状态下设置的权重值,wf为zf状态下设置的权重值,wo为zo状态下设置的权重值。

2-2.lstm的忘记阶段。将步骤2-1中计算得到的zf作为忘记阶段的忘记门控,来控制上一个状态ct-1中得到的特征的保留和遗忘,其中,ct为lstm网络当前时刻的一个传输状态,ct-1则为上一个时刻的传输状态;

2-3.lstm的选择记忆阶段。将步骤2-1中的zi作为选择记忆阶段的选择记忆门控,将重要的特征着重记录,不重要的特征少量记录。

2-4.lstm的输出阶段。将步骤2-1中的zo作为输出阶段的输出门控,决定当前状态的输出特征。

2-5.数据通过lstm网络输出得到多维的时序特征。该时序特征的向量表示为yt(118440,6580,6462,360)维度的数据。

步骤3:将lstm网络提取到的时序特征yt输入到resnet网络中进行更深层的特征提取。

将时序特征输入到resnet152的残差结构中,首先将yt设为resnet第一层的特征xl,通过xl+1=xl+f(xl,wl)的残差结构将浅层网络的特征传递到深层中,使特征在深层的网络中不被损耗,提高特征提取器的效率。通过递归,深层单元第l层特征的表达式为:

其中,l表示的是残差网络的深层单元第l层,l表示的是残差网络的浅层单元第l层,xl为深层单元第l层的特征,xl为浅层单元第l层的特征,i为残差网络的的任意第i层,xi为第i层单元的特征,wi为第i层单元的权重值。

即特征xl为一系列矩阵向量的乘积。接下来进行残差网络的反向传播计算,其损失函数为e,反向传播求导为:

经过计算后,得到的深层特征xl的向量维度表示为(50008,3040,2736,3800)维度的数据。

步骤4:预测航班延误状态并计算预测准确率。

4-1将步骤3中提取出的深层特征xl经由softmax函数分成四类预测结果:

1)延误时间小于0分钟;

2)延误时间大于0分钟小于45分钟;

3)延误时间大于45分钟小于90分钟;

4)延误时间大于90分钟。

本发明所使用到的softmax函数式为:

其中,x1,x2,x3,x4分别为所分的四个类别中的第一个元素,xi为类别中的第i个元素,n为各个类别总元素个数。

4-2.将预测出的四类结果与步骤1中做好的标签进行对比,计算出预测的准确率acc。准确率通过计算模型预测出的延误预测结果与标签对应的类别相等的总数除以总的测试集个数即为航班延误预测的准确率。其中用y表示测试样本中的总测试集个数,m表示预测结果与标签对应的类别相等的总数,则准确率计算公式如下:

实验中,网络结构设置的超参数如下:学习率设为0.01;batch_size设为100;lstm结构的隐藏层数为35;每层节点数设为30;resnet结构的输入维度与lstm的隐层数一致为35;resnet的隐层数为152层。误差函数使用交叉熵损失函数:l=-[ylogy′+(1-y)log(1-y′)];网络结构中的优化算法为stochasticgradientdescent算法。

本发明所提出的结构加入了航班延误在时序上的特征,并通过残差结构网络在加深网络层数的同时保留浅层网络中的特征信息,较传统方法提高了航班延误预测的准确率。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1