一种基于贝叶斯网的航班过站时间动态估计方法

文档序号:6623095阅读:378来源:国知局
一种基于贝叶斯网的航班过站时间动态估计方法
【专利摘要】一种基于贝叶斯网的航班过站时间动态估计方法。其是将数据挖掘的方法用于航班过站时间估计中,首先提取出了对航班过站时间有显著影响的几个因素,运用贝叶斯网得出过站时间估计模型,进而得到不同条件下过站时间估计值。在进行航班离港时间估计时,只需要知道在航班进港信息的条件下,运用过站时间估计模型即可得出过站时间取值的概率分布,在此基础上,通过求期望值,得出过站时间的可能取值。另外,针对航班数据不断增加的特点,本发明运用的方法能够不断对新增加的数据进行学习,并且确保学习的结果与对所有数据进行重新学习的结果一致性,使过站时间估计模型能够动态调整,并且定期更新过站时间估计值,以适应不断变化的外界情况。
【专利说明】-种基于贝叶斯网的航班过站时间动态估计方法

【技术领域】
[0001] 本发明属于民航航空【技术领域】,特别是涉及一种基于贝叶斯网的航班过站时间动 态估计方法。

【背景技术】
[0002] 航班延误,作为航空运输服务纠纷的焦点,近几年随着中国民航运输量的不断增 长,这个问题受到越来越多的关注。航班延误不仅给机场、航空公司带来直接的经济损失, 给旅客的正常出行造成很大的不便,还会严重扰乱机场的正常秩序。导致航班延误的原因 多种多样,常见的原因有天气原因、航空管制、机械故障、飞机调配、飞行计划等。在航班延 误发生前进行有效的预测,是民航业发展过程中期望达到的一个目标。对于航空公司来说, 每一架飞机在一天之内执行多个航班,在上游航班发生延误的情况下对下游航班延误状况 进行有效的预测,对于提高航公公司的服务质量,提升航空公司的竞争力具有重要的现实 意义。
[0003] Flyontime. us是美国一个面向公众免费开放的航班延误时间分析系统。该系统向 全社会免费开放,任何人都可以通过它查询分析美国各次航班的延误率、机场等候时间、航 班时刻及天气信息。该系统使用的数据主要来源于美国交通部,而安检排队等待的时间则 通过普通旅行人员提交给系统获得。该系统主要是采用统计方法研究在某一段时间内每个 机场所有的航班延误分布。
[0004] 美国FlightCaster公司开发了航班延误信息服务系统,该系统采用一种高级算 法搜集国内每个航班过去几年的数据,然后将其与实时情况匹配来确定航班的延误情况, 可以提前预测未来几个小时内的航班情况。同时也为iPhone和Blackberry提供了终端应 用,提供航班延误预告。
[0005] 欧洲非常重视航班信息服务。欧洲民航管理机构(EUROCONTROL)实施了研发欧洲 航空信息系统过站时间规则库(European AIS Database, EAD)的科技计划,EAD集成并整 合了成员国航空信息系统过站时间规则库的信息,是目前世界上规模最大的集中式航空信 息服务系统,EAD的网上航空信息服务范围已经覆盖欧洲的大部分国家。
[0006] 新加坡樟宜机场是亚洲最繁忙的大型枢纽机场之一,该机场的信息发布系统能够 提供实时、准确的航班动态信息,其航班进出港动态信息(登机广播、上客、舱门关闭、起 飞、着陆等消息)已经实现了实时更新和发布。
[0007] 近几年,部分国内机场如首都机场、新白云机场等已通过建立网站、电话呼叫中心 等手段,向旅客提供航班动态查询服务。也有的在微博等社交网络网站上建立专属页面,在 出现延误航班情况时,通过文字、图片等形式向旅客进行解释沟通。
[0008] 飞友科技(民航资源网)已开发出"非常准"、"VariFlight"等相关产品向旅客免 费提供航班动态定制服务,也向一些小型机场提供航班信息服务。
[0009] 但是,上述系统存在下列问题:总的来说,信息不完整,各影响因素变动的随机性 较大等,因此目前缺少一种能够用数据挖掘的办法对航班历史数据进行学习,在众多因素 的影响下估计过站时间,从而在遇到相同状况时对过站时间进行有效估计的方法。


【发明内容】

[0010] 为了解决上述问题,本发明的目的在于提供一种基于贝叶斯网的航班过站时间动 态估计方法。
[0011] 为了达到上述目的,本发明提供的基于贝叶斯网的航班过站时间动态估计方法包 括按顺序进行的下列步骤:
[0012] 步骤一:对历史航班数据进行预处理,从中提取出包括前航班到达延误时间、前航 班到达时间段、计划过站时间、起飞机场、飞机类型和实际过站时间在内的数据作为影响因 素;
[0013] 步骤二:假设上述各因素对实际过站时间都具有影响且影响是相互独立的,由此 确定出贝叶斯网拓扑结构;然后运用上一步骤得到的数据,采用最大似然估计法得到贝叶 斯网参数,由此得到过站时间估计模型;
[0014] 步骤三:对上述得到的过站时间估计模型进行推理,得到不同状况下的过站时间 估计值;
[0015] 步骤四:对进港航班的离港时间进行预测;
[0016] 步骤五:经过一段时间后,采用步骤一的方法对新的历史航班数据进行预处理,得 到新的训练样本;然后将之前得到的模型作为先验知识,结合新的训练样本,采用贝叶斯估 计法修正贝叶斯网参数;修正完参数以后,对新的过站时间估计模型进行推理,并且更新过 站时间规则库;
[0017] 步骤六:定期重复步骤五,动态更新过站时间规则库。
[0018] 在步骤一中,所述的航班历史数据包括航班号、飞机号、航班计划起飞时间、计划 降落时间、实际起飞时间、实际降落时间、起飞机场、目的机场和航班座位数;前航班到达延 误时间为前航班实际到达时间减去前航班计划到达时间,计划过站时间为航班计划表中下 一航班的计划起飞时间减去上一航班的计划到达时间。
[0019] 所述的采用最大似然估计法得到贝叶斯网参数,由此得到过站时间估计模型的方 法为:
[0020] 假设d =丨%.//= 1 α ;々=1丨为所有参数组成的向量,η为节点个 数,Qi为π 0Q的取值组合个数,Α为节点Xi的取值个数,Θ ijk = P% = k/ π 〇 = j) 为当Xi父节点取值为第j个取值,Xi取值为第k个取值的概率,Di,i = 1,2,...,m为样本 数据,则向量^的对数似然函数为:
[0021] /(^//)) = log /^(/)/ / ^) = ^10^^/^(/), ?θ) (1) i-1 /-1
[0022] 当θ $取如下值时,对数似然函数取得最大值:
[0023] 丁^,右 ΣΧ>0 t Yw, k=1 (2) -,若否 l ^
[0024] 其中,mijk是航班数据中满足Xi = k,π (X) = j的样本数量,ri为节点Xi的取值 个数;若历史航班数据源中i>V+ =Q,则设参数为均匀分布;由式(2)确定出贝叶斯网参 k^l 数,由此得到过站时间估计模型。
[0025] 对得到的过站时间估计模型进行推理,得到不同状况下的过站时间估计值的方法 为:
[0026] 3. 1对过站时间估计模型进行推理,得到不同情况下过站时间的概率分布;
[0027] 3. 2对过站时间求期望值:
[0028] = C,)) i
[0029] 其中E(t)为在其他条件确定时过站时间期望值,?\为第i个过站时间区间的中 值,P(i)为过站时间在第i个区间中的概率,以求得的过站时间期望值E(t)作为此种状况 下过站时间的估计值;
[0030] 3. 3将不同条件下的过站时间估计值插入到过站时间规则库中,为航班离港时间 预测提供条件。
[0031] 在步骤四中,对进港航班的离港时间进行预测的方法为;如果上一航班不发生进 港延误或延误时间小于10分钟,则下一航班的估计起飞时间为计划时间;如果延误时间大 于10分钟,则从过站时间规则库中得出相应状况下的估计过站时间;如果实际进港时间加 上估计过站时间小于下一航班的计划过站时间,则下一航班的估计离港时间为计划离港时 间;如果上一航班的实际进港时间加上估计的过站时间大于下一航班的计划离港时间,则 下一航班的估计离港时间为实际进港时间加上估计过站时间;如果延误时间大于10分钟, 并且过站时间规则库中没有相应的过站时间信息,则估计的过站时间为计划过站时间,下 一航班的估计离港时间为实际进港时间加上计划过站时间。
[0032] 在步骤五中,采用贝叶斯估计法修正贝叶斯网参数的方法为:
[0033] 假设《为由t,%:,...,?所组成的子向量,a ijk为先验知识中满足Xi = k和31 (X) =j的样本数量,八^.)为狄利克雷分布D[%,ay2,由贝叶斯公式得:
[0034]

【权利要求】
1. 一种基于贝叶斯网的航班过站时间动态估计方法,其特征在于:所述的方法包括按 顺序进行的下列步骤: 步骤一:对历史航班数据进行预处理,从中提取出包括前航班到达延误时间、前航班到 达时间段、计划过站时间、起飞机场、飞机类型和实际过站时间在内的数据作为影响因素; 步骤二:假设上述各因素对实际过站时间都具有影响且影响是相互独立的,由此确定 出贝叶斯网拓扑结构;然后运用上一步骤得到的数据,采用最大似然估计法得到贝叶斯网 参数,由此得到过站时间估计模型; 步骤三:对上述得到的过站时间估计模型进行推理,得到不同状况下的过站时间估计 值; 步骤四:对进港航班的离港时间进行预测; 步骤五:经过一段时间后,采用步骤一的方法对新的历史航班数据进行预处理,得到新 的训练样本;然后将之前得到的模型作为先验知识,结合新的训练样本,采用贝叶斯估计法 修正贝叶斯网参数;修正完参数以后,对新的过站时间估计模型进行推理,并且更新过站时 间规则库; 步骤六:定期重复步骤五,动态更新过站时间规则库。
2. 根据权利要求1所述的基于贝叶斯网的航班过站时间动态估计方法,其特征在于: 在步骤一中,所述的航班历史数据包括航班号、飞机号、航班计划起飞时间、计划降落时间、 实际起飞时间、实际降落时间、起飞机场、目的机场和航班座位数;前航班到达延误时间为 前航班实际到达时间减去前航班计划到达时间,计划过站时间为航班计划表中下一航班的 计划起飞时间减去上一航班的计划到达时间。
3. 根据权利要求1所述的基于贝叶斯网的航班过站时间动态估计方法,其特征在于: 在步骤二中,所述的采用最大似然估计法得到贝叶斯网参数,由此得到过站时间估计模型 的方法为: 假设6 = !^ /z+ = U= I,=I,为所有参数组成的向量,η为节点个数,qi 为以Xi)的取值组合个数,A为节点Xi的取值个数,Θ ijk = P(Xi = k/ JI (Xi) = j)为当Xi 父节点取值为第j个取值,Xi取值为第k个取值的概率,Di,i = 1,2, . . .,m为样本数据,则 向量$的对数似然函数为: m m 1{θ / D) = log Yl P(Dt / ^) = X log P(Dt 1Θ) (1) /-1 l=\ 当取如下值时,对数似然函数取得最大值:
其中,mijk是航班数据中满足Xi = k,π 〇 = j的样本数量,&为节点Xi的取值个 数;若历史航班数据源中i>v=〇,则设参数为均匀分布;由式(2)确定出贝叶斯网参数, k 二1 由此得到过站时间估计模型。
4. 根据权利要求1所述的基于贝叶斯网的航班过站时间动态估计方法,其特征在于: 在步骤三中,对得到的过站时间估计模型进行推理,得到不同状况下的过站时间估计值的 方法为: 3. 1对过站时间估计模型进行推理,得到不同情况下过站时间的概率分布; 3. 2对过站时间求期望值: 厂⑴= [/)(/" X (:)>) i 其中E(t)为在其他条件确定时过站时间期望值,?\为第i个过站时间区间的中值, P(i)为过站时间在第i个区间中的概率,以求得的过站时间期望值E(t)作为此种状况下过 站时间的估计值; 3. 3将不同条件下的过站时间估计值插入到过站时间规则库中,为航班离港时间预测 提供条件。
5. 根据权利要求1所述的基于贝叶斯网的航班过站时间动态估计方法,其特征在于: 在步骤四中,对进港航班的离港时间进行预测的方法为;如果上一航班不发生进港延误或 延误时间小于10分钟,则下一航班的估计起飞时间为计划时间;如果延误时间大于10分 钟,则从过站时间规则库中得出相应状况下的估计过站时间;如果实际进港时间加上估计 过站时间小于下一航班的计划过站时间,则下一航班的估计离港时间为计划离港时间;如 果上一航班的实际进港时间加上估计的过站时间大于下一航班的计划离港时间,则下一航 班的估计离港时间为实际进港时间加上估计过站时间;如果延误时间大于10分钟,并且过 站时间规则库中没有相应的过站时间信息,则估计的过站时间为计划过站时间,下一航班 的估计离港时间为实际进港时间加上计划过站时间。
6. 根据权利要求1所述的基于贝叶斯网的航班过站时间动态估计方法,其特征在于: 在步骤五中,采用贝叶斯估计法修正贝叶斯网参数的方法为: 假设4/.为由...,4所组成的子向量,aijk为先验知识中满足Xi = k和π (X)= j的样本数量,八^)为狄利克雷分布由贝叶斯公式得:
(4) 其中厂(60为向量泾的先验概率分布,P(卢//))为向量焱的后验概率分布;由于 尸(爲 /D)服从狄利克雷分布D[--yl + …,、+%],所以:
(5) 采用式(5)修正贝叶斯网参数,其中mijk为新样本中满足\ = k和π (\) = j的样本 数量。
【文档编号】G06F19/00GK104156594SQ201410391944
【公开日】2014年11月19日 申请日期:2014年8月11日 优先权日:2014年8月11日
【发明者】丁建立, 赵键涛, 曹卫东, 胡海生, 黄威 申请人:中国民航大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1