一种基于贝叶斯网的航班离港滑行时间动态预测方法与流程

文档序号:16001335发布日期:2018-11-20 19:29阅读:238来源:国知局

本发明属于计算机仿真技术领域,特别是涉及一种基于贝叶斯网的航班离港滑行时间动态预测方法。



背景技术:

机场是航空运输体系的重要枢纽,随着航空运输业务量激增,世界范围内的主要机场都出现了不同程度的容量饱和问题,也由此导致了机场航班延误、拥堵等现象。如何通过动态预测方法对航班离港所面临的场面态势进行推演、计算和评价,并采取有效措施提高机场整体运行效率,以减少航班延误已成为计算机仿真技术领域的难点。

贝叶斯网是一个有向无环图(Directed Acyclic Graphs,DAG),其中各节点都带有各自的随机变量,节点间的有向边表示变量间的关系。构建贝叶斯网的方法有以下三种:一是以大数据作为支撑,通过对大量数据的机器学习得到先验知识,即通过参数学习确定贝叶斯网的网络结构与参数;二是根据行业从业人员及专家的经验等,定性地建立各节点的关联关系及关联强度,这在模型构建初期与缺失关键环节数据的情况下是非常有用的一种方法。三是将以上两种方法结合起来,即以业内专家的背景知识为依托,初步建立贝叶斯网模型并定性地确定模型结构;而后在运行大数据的支持下,验证、完善模型结构并定量的确定模型中的关键参数。但目前尚未发现基于贝叶斯网的航班离港滑行时间动态预测方法。



技术实现要素:

为了解决上述问题,本发明的目的在于提供一种基于贝叶斯网的航班离港滑行时间动态预测方法。

为了达到上述目的,本发明提供的贝叶斯网络构建与预测方法包括按顺序进行的下列步骤:

1)根据目标机场场面运行方式,分析机场场面运行数据库中各字段,从中提取出航班离港运行数据,并由这些数据构成机场航班离港运行数据集;

2)确定上述机场航班离港运行数据集是否完备,如不完备,采用极大似然算法获得缺失数据,由此获得完备机场航班离港运行数据集;

3)由专家根据上述完备机场航班离港运行数据集中的数据确定航班离港可变滑行时间的各影响因素,然后利用因子分析法逐一分析各影响因素,确定出停机位、离港时间、离港时间偏差、滑行航班数量与延误态势这5项影响因素为主要影响因素,并将每一影响因素作为一个节点;然后检验各影响因素间的互信息,以验证各节点的独立性;

4)使用Netica搭建贝叶斯网估计模型,然后导入完备机场航班离港运行数据集中上述5项影响因素的数据进行参数学习,从而得到不同影响因素条件下的贝叶斯网航班离港可变滑行时间估计模型,之后将近期获得的各影响因素的新增数据添加到完备数据集中并利用这些数据对航班离港可变滑行时间估计模型进行增量学习,得到贝叶斯网航班离港可变滑行时间动态估计模型;

5)将待预测航班的5项影响因素的实际运行数据输入上述贝叶斯网航班离港可变滑行时间动态估计模型中,估计出该航班离港可变滑行时间的后验概率分布,舍弃其中发生概率较小的取值项,然后利用航班离港可变滑行时间取值Ti及其概率p(i)计算出期望值E(n),此期望值即为该航班离港可变滑行时间。

在步骤1)中,所述的机场航班离港运行数据集中详细记录了航班的执行日期、出港异常、异常原因、停机位以及计划、预计、实际起飞时刻、撤轮档时刻、离港时间、离港时间偏差、滑行航班数量与延误态势在内的数据。

在步骤2)中,所述的极大似然算法的实现过程如下:

步骤1、当进行第一次迭代时,先选用一组与缺失数据相同的初始数据θ0作为修补数据,得到碎权样本,而后计算基于修补数据的第一代最大似然估计值θ1,公式如下:

其中是修补数据中满足条件样本的权重之和;rl表示满足条件样本的个数,即基于修补数据的最大似然估计值;

步骤2、继续进行迭代,并在第t次迭代中根据其最大似然估计值θt得到期望的对数似然函数Q(θ|θt);

步骤3、求使步骤2中得到的对数似然函数Q(θ|θt)达到最大时的最大似然估计值θ,并根据下式计算出第t+1次迭代时的最大似然估计值θt+1

步骤4、重复步骤2、步骤3直至最大似然函数收敛时,算法结束,即当利用极大似然算法所得对数似然函数序列{l(θ0|D),l(θ1|D),l(θ2|D),...,l(θt|D),l(θt+1|D)}中第t次和第t+1次迭代得到的最大似然估计值θt与θt+1满足算法收敛条件l(θt|D)≤l(θt+1|D)时,输出第t+1次迭代时的最大似然估计值θt+1作为缺失数据。

在步骤3)中,所述的检验互信息的公式为:

式中Xi,Xj表示两节点代表的随机变量,P(Xi,Xj)表示随机变量Xi,Xj的联合分布概率,P(Xi)P(Xj)分别表示随机变量Xi,Xj的概率;

依次计算5个影响因素相互之间的互信息M(Xi,Xj),变量阈值ε设置为0.2,当M(Xi,Xj)<ε时,说明两影响因素互相独立。

在步骤5)中,所述的利用航班离港可变滑行时间取值Ti及其概率p(i)计算出期望值E(n)的公式为:

E(n)=∑(p(i)×Ti)/∑p(i) (4)。

本发明提供的基于贝叶斯网的航班离港滑行时间动态预测方法具有如下优点:建立了结合机器学习技术与民航专家知识相结合的航班离港可变滑行时间动态估计模型,能准确、快速分析离港航班所处机场场面态势,为民航机场航班放行与管理提供强有力的决策支持。本方法既具备了简单、高效、高精度的特点,反应出了机场交通系统中航班离港滑行的自主性和个体差异性,而且对机场场面交通运行态势的分析及评估具有较高的应用价值。

附图说明

图1为本发明提供的基于贝叶斯网络的航班离港滑行时间动态预测方法流程图。

图2为不同停机位的平均离港滑行时间对比图。

图3为不同离港时间的平均离港滑行时间对比图。

图4为不同离港时间偏差的平均离港滑行时间对比图。

图5为贝叶斯网估计模型的数据学习结果。

图6为在已知停机位与计划离港时间条件下的后验概率分布。

图7为已知先验条件下的后验概率分布。

具体实施方式

下面结合附图和具体实施例对本发明提供的基于贝叶斯网络的航班离港滑行时间动态预测方法进行详细说明。

如图1所示,本发明提供的基于贝叶斯网络的航班离港滑行时间动态预测方法包括按顺序进行的下列步骤:

1)根据目标机场场面运行方式,分析机场场面运行数据库中各字段,从中提取出航班离港运行数据,并由这些数据构成机场航班离港运行数据集;机场航班离港运行数据集中的部分航班离港运行数据示例如表1所示:

表1、航班离港运行数据示例

机场航班离港运行数据集中详细记录了航班的执行日期、出港异常、异常原因、停机位以及计划、预计、实际起飞时刻、撤轮档时刻、离港时间、离港时间偏差、滑行航班数量与延误态势在内的数据。其中计划起飞时刻对应航班计划,预计起飞时刻对应根据实际情况修正后的起飞时刻。

2)确定上述机场航班离港运行数据集是否完备,如不完备,采用极大似然(EM)算法获得缺失数据,由此获得完备机场航班离港运行数据集;

极大似然算法的实现过程如下:

步骤1、当进行第一次迭代时,先选用一组与缺失数据相同的初始数据θ0作为修补数据,得到碎权样本,而后计算基于修补数据的第一代最大似然估计值θ1,公式如下:

其中是修补数据中满足条件样本的权重之和;rl表示满足条件样本的个数,即基于修补数据的最大似然估计值;

步骤2、继续进行迭代,并在第t次迭代中根据其最大似然估计值θt得到期望的对数似然函数Q(θ|θt);

步骤3、求使步骤2中得到的对数似然函数Q(θ|θt)达到最大时的最大似然估计值θ,并根据下式计算出第t+1次迭代时的最大似然估计值θt+1

步骤4、重复步骤2、步骤3直至最大似然函数收敛时,算法结束,即当利用极大似然算法所得对数似然函数序列{l(θ0|D),l(θ1|D),l(θ2|D),...,l(θt|D),l(θt+1|D)}中第t次和第t+1次迭代得到的最大似然估计值θt与θt+1满足算法收敛条件l(θt|D)≤l(θt+1|D)时,输出第t+1次迭代时的最大似然估计值θt+1作为缺失数据。

3)由专家根据上述完备机场航班离港运行数据集中的数据确定航班离港可变滑行时间的各影响因素,然后利用因子分析法逐一分析各影响因素,确定出停机位、离港时间、离港时间偏差、滑行航班数量与延误态势这5项影响因素为主要影响因素,并将每一影响因素作为一个节点;其中三项影响因素对平均离港滑行时间的影响程度如图2-图4所示。然后利用式(3)检验各影响因素间的互信息,以验证各节点的独立性。

计算互信息的表达式为:

式中Xi,Xj表示两节点代表的随机变量,P(Xi,Xj)表示随机变量Xi,Xj的联合分布概率,P(Xi)P(Xj)分别表示随机变量Xi,Xj的概率。从式(3)可知,当P(Xi,Xj)=P(Xi)P(Xj)时,M(Xi,Xj)=0,即表示两随机变量完全互相独立。M(Xi,Xj)越接近0,随机变量Xi,Xj的独立程度越高。

但在根据实际构建的贝叶斯网中,往往很少存在完全互相独立的随机变量。为便于应用,通常通过设置变量阈值ε的方法来判断两随机变量是否独立。当M(Xi,Xj)>ε时,表示两随机变量为非独立关系;反之则为独立关系。

依次计算5个影响因素相互之间的互信息M(Xi,Xj),变量阈值ε设置为0.2,当M(Xi,Xj)<ε时,说明两影响因素互相独立,即能从不同维度表征场面影响因素对航班离港可变滑行时间的影响,计算结果如表2所示。

表2、各影响因素间的互信息

4)使用Netica搭建贝叶斯网估计模型,然后导入完备机场航班离港运行数据集中上述5项影响因素的数据进行参数学习,从而得到不同影响因素条件下的贝叶斯网航班离港可变滑行时间估计模型,之后将近期获得的各影响因素的新增数据添加到完备数据集中并利用这些数据对航班离港可变滑行时间估计模型进行增量学习,得到贝叶斯网航班离港可变滑行时间动态估计模型;

图5为在停机位与计划离港时间等先验条件已知情况下利用贝叶斯网航班离港可变滑行时间动态估计模型对航班离港可变滑行时间估计的后验概率分布。从先验条件中已知航空器停泊于右侧近机位,离港时间为TIME1,贝叶斯网航班离港可变滑行时间动态估计模型根据以上信息得出的后验概率分布如图5所示,对比图6可知,该后验概率分布更为集中,航班离港可变滑行时间在15-17min的概率大幅提高。图7为已知先验条件下的后验概率分布,从图中可看出,与该先验条件相对应的航班离港可变滑行时间的后验概率分布集中于12-17min。从以上分析可看出,根据先验条件获取情况,贝叶斯网航班离港可变滑行时间动态估计模型能得到对应程度与精确性的后验概率,适应了实际场面作业的要求。

5)将待预测航班的5项影响因素的实际运行数据输入上述贝叶斯网航班离港可变滑行时间动态估计模型中,估计出该航班离港可变滑行时间的后验概率分布,舍弃其中发生概率较小的取值项,然后利用航班离港可变滑行时间取值Ti及其概率p(i)根据式(4)计算出期望值E(n),此期望值即为该航班离港可变滑行时间;

E(n)=∑(p(i)×Ti)/∑p(i) (4)

表3中给出了本发明作为输入的某航班的实际运行数据,根据输入估计出的航班离港可变滑行时间的后验概率分布的结果如表4所示。

表3、某航班实际运行数据

表4、航班离港可变滑行时间的后验概率分布结果

舍弃其中发生概率较小的取值项“18-20min”与“大于21min”,保留其余区间内的航班离港可变滑行时间取值,根据式(4)计算得到的期望值为12.24min,与实际结果11min对比,误差为1.24min,结果满足了±2min的容差要求,说明本发明方法能满足现实需求。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1