基于大数据分析的机场概率交通需求预测方法与流程

文档序号:11966155阅读:554来源:国知局
基于大数据分析的机场概率交通需求预测方法与流程
本发明属于机场空域航空器飞行安全分析领域,特别是一种基于大数据分析的机场概率交通需求预测方法。

背景技术:
随着中国航空运输业的飞速发展,航班增多,空中交通拥挤日益突显,机场作为整个航空运输网络的起讫点,航班延误频发,严重影响居民正常出行,因此,制定科学有效的空中飞行管理计划就显得尤为重要。次日飞行计划制定是空中交通管理的一个关键环节,直接影响当日航班执行的效率以及空域资源的使用率,也是预战术与战术阶段飞行流量管理的主要依据和参考,是解决交通拥堵的前提和基础。在目前空中交通流量管理的过程中,交通需求都是以确定性形式体现,即一定时间尺度下空域中所对应的交通需求预测结果是一个确定的数值。但是现有的确定性预测方法是以统计分析为主要手段,没有考虑天气影响、管制行为等不确定因素的影响,因此必将导致部分时隙浪费或虚耗,将加剧机场延误程度。为了弥补传统确定性预测方法的不足,以大量历史运行数据分析为基础,挖掘分析预测误差的分布规律,开展一定时间尺度下机场交通需求的概率预测,指导拥挤管理策略的实施,对于提升管制运行效率、提高空域资源利用率具有重要意义和现实需求。

技术实现要素:
针对上述问题,本发明提出了一种基于大数据挖掘分析的机场概率交通需求预测方法,该方法以航空公司和空中交通管制单位管制运行海量数据为基础,以统计分析为手段,挖掘预测误差的分布规律,结合确定性固定单一预测结果,获取概率预测结果,适用于规律性机场交通需求预测,本发明是这样实现的:一种基于大数据分析的机场概率交通需求预测方法,具体步骤如下:步骤一,在目标机场起降航班预测时刻和实际时刻的飞行数据中选取一个航季内连续的M天,M≥7,作为一个时段,包括:1.1,目标机场该时段内起降航班预测时刻的飞行数据,包括航班号、预计起飞时间和预计落地时间;1.2,目标机场该时间段内起降航班的实际飞行数据,包括航班号、实际起飞时间和实际落地时间;步骤二,统计分析15分钟时间片所选时段目标机场预计和实际航班总量,具体为:2.1,以15分钟作为一个时间片,分别统计所选时段目标机场各日一个时间片内预计起飞航班量、实际起飞航班量、预计降落航班量和实际降落航班量,形成各日96个时间片起飞预测值、降落预测值、起飞实际值和降落实际值散点,再分别将起飞与降落的航班量加和,获得目标机场各日对应时间片内预计起降航班总量和实际起降航班总量;2.2,将各日对应时间片起降航班总量的预测结果和实际结果进行对比,取其差值,作为绝对预测误差值,令第i日第j时间片的起降航班总量预测结果为实际结果为Dij,则预测相对误差为步骤三,确定所选M天时段内的典型日,并判定该时段分区,具体步骤为:3.1,统计目标机场航班该时段内实际起降总量,并根据各日实际起降量的数值按照从小到大的顺序进行排序,选取序号为M·95%(四舍五入取整)所对应的日期作为典型日;3.2,根据典型日的96个时间片起降量比例以及起降总量,将96个时间片进行时段分区,获得分区数量为K,第k个分区表示为Ck,具体为:依据时间顺序,将一天24h划分为4个时段分区,依次为C1-C4分区,其中,时间点0:00至C2分区之间为C1分区,为全天闲时段,航班量少;C2为早上离场高峰段,该分区离场航班较多,进离场航班比例低于0.5;C3为C2早上离场高峰结束后至傍晚,该时段分区内出现进离场高峰,且进离场航班比例位于0.4-0.7之间;C4分区为C3分区进离场高峰结束后至时间点24:00,其间出现晚间进场高峰,进离场航班比例一般大于0.4,但航班总量小于C3分区。步骤四,使用二重划分法确定起降航班总量预测误差分布规律,具体步骤为:4.1,统计各分区的时间片数量,令Ck含有的时间片数量为Qk;4.2,设置一整数步长ΔDk,ΔDk不小于2且不大于Ck内时间片航班量最大值的五分之一,实现对Qk个时间片起降航班总量的等间隔划分;4.3,根据步骤4.2获得的各间隔内样本数量,设置一样本个数d,从起降航班总量两侧向中间方向对步骤4.2获得的等间隔区间进行合并,使每个起降航班总量区间的样本数量不小于30,同时记录每个区间段的界值,最后获得Wk层航班量分区;4.4,统计时间分区Ck起降航班总量第层分区中样本的个数,令其为步骤五,在样本二重划分的基础上,确定误差分布概率,具体步骤为:5.1,计算时间分区Ck起降航班总量第层个样本起降航班总量的相对误差vr5.2,根据时间分区Ck起降航班总量第层样本的相对误差,令的相对误差范围为为相对误差最大值与最小值之差,选取一误差作为区域间隔的宽度,获得预测误差区域间隔S个,第s个区域内样本个数为且5.3,计算时间分区Ck起降航班总量第层预测误差的离散确切概率分布5.4,对K个时间分区历史起降航班总量遍历,获得Q个预测误差离散确切概率分布函数,步骤六,对机场起降航班量的点估计与区间估计进行概率预测,具体为:6.1,根据次日飞行计划制定流程,按照步骤一和步骤二中统计次日某时间片PT航班量为6.2,点估计概率预测:判定PT时间片所属时间分区Ck,并判定所属Wk中的某层,根据步骤5.3获得的预测误差的离散确切概率分布函数,判定其相对误差分布,反推航班量概率分布,令相对误差为Δvs时概率为则航班量发生概率为时预测结果为可形成以航班量为横坐标,预测概率为纵坐标的直角坐标散点图;令此时pmax对应的相对误差定义为Δvmax,则PT时间片概率性点估计预测结果为6.3确定置信度α,α≥90%,在PT时间片概率性点估计预测结果的基础上,从概率为pmax点向两侧扩散,首选连续散点且发生概率较高的点,直至累计概率大于等于α,此时对应的航班量预测结果最小的值为最大的值为则PT时间片概率性区间预测结果为优选的,本发明所述预测方法中,步骤1.1所述目标机场起降航班预测时刻和实际时刻的飞行数据是通过如下方法获得的:A)由航班计划、临时审批计划、补班飞行计划中提取以目标机场为起飞机场或目的机场的航班信息,形成以目标机场为起飞机场的离场航班初始飞行计划信息,包括航班号、预计起飞时间;以及以目标机场为目的机场的进场航班初始飞行计划信息,包括航班号、起飞机场的预计起飞时间;B)根据空中交通管制单位收到的航空公司递交的经批准的次日飞行计划申请、临时审批计划、补班飞行计划和航空公司拍发的飞行预报,并剔除航空公司次日不执行的航班,更新以目标机场为起飞机场的离场航班初始飞行计划信息,形成以目标机场为起飞机场的离场航班飞行计划信息,包括航班号、预计起飞时间;C)根据空中交通管制单位收到的领航计划报中预计经过总时间字段,更新以目标机场为目的机场的进场航班初始飞行计划信息,即将起飞机场的预计起飞时间加上预计经过总时间可得在目标机场的预计降落时间,形成以目标机场为目的机场的进场航班飞行计划信息,包括航班号、目标机场的预计降落时间。D)根据目标机场的实际飞行数据,提取目标机场所有起降航班的历史飞行数据,包括航班号、实际起飞时间和实际落地时间。本发明中的航季是指,冬春为一个航季,夏秋为一个航季,每年两个航季。本发明中的空中交通管制单位包括空中交通服务报告室、机场塔台管制单位、进近管制单位、区域管制单位、民航地区空中交通管理局运行管理单位、民航局空管局运行管理单位。本发明以大量历史运行数据分析为基础,挖掘分析预测误差的分布规律,结合确定性固定单一预测结果,获取概率预测结果,开展一定时间尺度下机场交通需求的概率预测,指导拥挤管理策略的实施,对于提升管制运行效率、提高空域资源利用率具有重要意义。附图说明图1是本发明方法流程图。图2是典型日时间分区划分结果示意图。图3是一重等间隔划分示意图。图4是二重划分结果示意图。图5是预测误差区域间隔划分结果示意图。具体实施方式为方便本发明技术方案的理解,以下结合附图以及具体实施例,对本发明进行进一步详细说明,应当理解,此处所描述的具体实例仅用以解释本发明,并不用于限定本发明。实施例1如图1所示,一种基于大数据挖掘分析的机场概率交通需求预测,具体步骤如下:步骤一,收集数据,选择国内某机场作为目标机场,收集最近的冬春、夏秋航季为时间节点完整的计划和实际飞行数据。收集该段时间内目标机场起降航班预测时刻和实际时刻相关的历史数据,包括航班计划、航空公司递交的经批准的次日飞行计划申请、临时审批计划、补班飞行计划、航空公司派发的飞行预报(PLN报)、空中交通管制单位派发的领航计划报(FPL报),以及目标机场实际飞行数据,根据空中交通管制单位制定次日飞行计划的工作流程,开展数据准备工作,具体为:步骤1.1,收集该目标机场该目标时段内起降航班预测时刻和实际时刻的飞行数据,包括:A)由航班计划、临时审批计划、补班飞行计划中提取以目标机场为起飞机场或目的机场的航班信息,形成以目标机场为起飞机场的离场航班初始飞行计划信息,包括航班号、预计起飞时间;以及以目标机场为目的机场的进场航班初始飞行计划信息,包括航班号、起飞机场的预计起飞时间;B)根据空中交通管制单位收到的航空公司递交的经批准的次日飞行计划申请、临时审批计划、补班飞行计划和航空公司拍发的飞行预报,并剔除航空公司次日不执行的航班,更新以目标机场为起飞机场的离场航班初始飞行计划信息,形成以目标机场为起飞机场的离场航班飞行计划信息,包括航班号、预计起飞时间;C)根据空中交通管制单位收到的领航计划报中预计经过总时间字段,更新以目标机场为目的机场的进场航班初始飞行计划信息,形成以目标机场为目的机场的进场航班飞行计划信息,包括航班号、目标机场的预计降落时间;步骤1.2,收集目标机场所有起降航班的实际飞行数据,包括航班号、实际起飞时间和实际落地时间。步骤二,在数据准备工作完成的基础上,统计分析15分钟时间片目标机场的机场预计进离场航班总量以及实际进离场航班总量,具体为:步骤2.1,以15分钟作为一个时间片,一日(24h)可分为96个时间片;分别统计所选时段目标机场各日一个时间片内预计起飞航班量、实际起飞航班量、预计降落航班量和实际降落航班量,形成各日96个时间片起飞预测值、降落预测值、起飞实际值和降落实际值散点,再分别将预计起飞航班量和预计降落航班量加和,获得目标机场各日对应时间片内预计起降航班总量和实际起降航班总量;步骤2.2,将各日对应时间片起降航班总量的预测结果和实际结果进行对比,取其差值,作为绝对预测误差值,令第i日第j时间片的起降航班总量预测结果为实际结果为Dij,则预测相对误差为步骤三,选取一个航季内的M天(本实施例中M的取值为14)作为一个时段,确定该时段内的典型日,并判定该时段分区,具体步骤为:3.1,选取2014年8月18日至2014年8月31日作为一个时段,该时段属于夏秋航季,M=14,统计目标机场航班该时段内实际起降总量,并根据各日实际起降量的数值按照从小到大的顺序进行排序,选取序号为M·95%所对应的日期作为典型日,本实施例中选择号为13(14*95%≈13)的飞行计划作为典型日,即2014年8月20日为典型日;3.2,根据96个时间片起降量组合比例以及起降总量,将96个时间片进行时段分区,获得分区数量为K,第k个分区表示为Ck;本实施例中将典型日各时间片航班总量以及进场航班的比例作为度量因素,将96个时间片进行分区,结果如图2所示,其中,凌晨0:00到5:00属于全天闲时段,总航班量少,为C1分区;5:00到9:00属于离场高峰段,进离场总量少且离场比例高,进离场航班比例低于0.5,为C2分区;9:00至18:00进离场高峰,进离场比例均衡,进离场航班比例处于0.4-0.7,且下午进离场高峰结束,为C3分区;18:00至24:00,进离场总量较高且进场比例高,直至24:00晚高峰结束,航班总量低于C3分区,为C4分区;步骤四,使用二重划分法确定起降航班总量预测误差分布规律,具体步骤为:4.1,统计各分区的时间片数量,令Ck含有的时间片数量为Qk;本实施例中选取10点至18点所属的第三个分区(C3)进行二重划分,即该分区属于全天较忙的时段,含有的时间片数量Q3=36,使用二重划分法对样本分布特点进行分析;4.2,首先进行第一重划分,C3分区各时间片航班量最小值为2架次,最大值为16架次,选择步长ΔD3为2,进行第一重等间隔划分,获得第一重划分的8个区间段,各区间段样本数分别为1,15,63,178,182,58,6,1;一重等间隔划分结果如图3所示;步骤4.3,根据步骤4.2获得的各间隔内样本数量,设置一样本个数d,根据中心极限定理,样本数必须不小于30,令d=30,从起降航班总量两侧向中间方向对步骤4.2获得的等间隔区间进行合并,使每个起降航班总量区间的样本数量符合样本参考区间要求,同时记录每个区间段的界值,最后获得Wk层航班量分区;本实施例中,二重划分要求样本数不能少于30个,则将第一重划分的前三个区间和后三个区间分别合并,形成最终的4个分层,即W3=4;步骤4.4,统计时间分区C3起降航班总量第层分区中样本的个数,令其为本实施例中,各层样本数分别为L1=79,L2=178,L3=182,L4=65;二重划分结果如图4所示。步骤五,在样本二重划分的基础上,确定误差分布概率,具体步骤为:5.1,计算时间分区Ck起降航班总量第层个样本起降航班总量的相对误差vr本实施例中,第三分区(C3)第二层共有178(L2=178)个样本,计算各样本的相对误差,并统计误差分布规律;5.2,根据第三分区起降航班总量第二层样本的相对误差,选取一误差作为区域间隔的宽度,获得预测误差区域间隔S个,第s个区域内样本个数为且本实施例中,误差定义为20%,则获得10个误差区域间隔(S=10),如图5所示;5.3,计算第三分区起降航班总量第二层预测误差的离散确切概率分布其结果如表1所示:表1第三分区起降航班总量第二层预测误差的概率分布结果序号误差范围样本数概率分布1-60%60.0337082-40%20.0112363-20%100.0561840%280.157303520%550.308989640%290.162921760%280.157303880%110.0617989100%60.03370810120%30.0168545.4,依照相同方法,第三分区起降航班总量第一、三、四层预测误差的概率分布结果如表2-4所示:表2第三分区起降航班总量第一层预测误差的概率分布结果序号误差范围样本数概率分布1-80%50.0641032-40%100.12820530120.153846440%210.269231580%180.2307696120%30.0384627160%50.0641038200%20.0256419240%10.01282110280%10.012821表3第三分区起降航班总量第三层预测误差的概率分布结果序号误差范围样本数概率分布1-60%20.0109892-40%200.109893-20%570.31318740%370.203297520%260.142857640%290.159341760%90.049451880%20.010989表4第三分区起降航班总量第四层预测误差的概率分布结果步骤六,对机场起降航班量的点估计与区间估计进行概率预测,具体为:6.1,根据次日飞行计划制定流程,按照步骤一和步骤二中统计次日某时间片PT航班量为本实施例中,假定统计次日10:00-10:15的起降航班量为10架次;6.2,点估计概率预测:判定次日10:00-10:15时间片所属时间分区Ck为第三时间分区,起降航班量为10架次,则处于第三层,根据步骤5.3获得的离散确切概率分布判定其相对误差分布,反推航班量概率分布,令相对误差为Δvs时概率为则航班量发生概率为时预测结果为可形成以航班量为横坐标,预测概率为纵坐标的直角坐标散点图;令此时pmax对应的相对误差定义为Δvmax,则PT时间片概率性点估计预测结果为本实施例概率性预测结果如表5所示:表5概率预测结果序号误差范围概率预测结果概率分布1-60%250.0109892-40%170.109893-20%130.31318740%100.203297520%80.142857640%70.159341760%60.049451880%50.010989说明该时间片出现进离场架次13的可能性最大,发生概率为31.3%;6.3,确定置信度α=90%,在10:00-10:15时间片概率性点估计预测结果的基础上,从概率为pmax=-20%点向两侧扩散,首选连续散点且发生概率较高的点,直至累计概率不小于α,此时对应的航班量预测结果最小的值为最大的值为本实施例中,从误差-20%依次向两边扩展,当两边误差分别为-40%和40%时,累计概率达到92.9%,大于所需置信度90%,此时则10:00-10:15时间片置信度为90%的区间预测结果为(7,17)。本实施例中,数据的获取途径有以下三种:1)民航局空管局每年制定的航班计划;2)飞行动态格式电报AFTN和SITA;3)管制自动化系统。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1