一种基于数据挖掘分析的航班到达时刻预测方法及系统与流程

文档序号:22186726发布日期:2020-09-11 21:55阅读:195来源:国知局
一种基于数据挖掘分析的航班到达时刻预测方法及系统与流程

本发明涉及航班运行管理领域,尤其涉及一种基于数据挖掘分析的航班到达时刻预测方法及系统。



背景技术:

民航业务量的逐年增长对航班运行水平提出了更高的要求,尤其是航空公司航班准点率、机场运行效率方面。航班到达时刻的准确估计有利于提高机场和航空公司的运行效率和安全水平,对提升航班准点率、改善航班保障与运行效率、优化资源分配与任务规划具有重要而直接的意义。当前,航班到达时刻估计准确率不够理想,数据挖掘技术的发展为航班预达时刻估计提供了新方法,丰富的航班运行历史数据库也为基于数据挖掘的预测方法提供了充足的数据支撑。



技术实现要素:

针对现有技术存在的不足之处,本发明的目的在于提供一种基于数据挖掘分析的航班到达时刻预测方法及系统,能够从ads-b系统、acars系统等设备中采集航班历史数据,首先对数据进行关联、标准化处理,然后依据特征变量筛选、特征值计算通过皮尔森相关系数计算得到各特征变量与到达时刻之间相关系统,并构建基于xgboost算法的回归预测模型,不断调参优化模型,得到最佳准确率的回归预测模型,在模型中输入被预测航班的特征变量数据后即可预测得到航班的预测到达时刻。

本发明的目的通过下述技术方案实现:

一种基于数据挖掘分析的航班到达时刻预测方法,包括:

s1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配、多维分类及标准化处理与存储,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场,所述航班历史数据包括航班动态、ads-b系统中的运行轨迹、acars系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;

s2、历史运行数据特征筛选与相关性分析:对步骤s1中的历史运行数据进行特征变量筛选、特征值计算,并对数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析;

s3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于xgboost算法的回归预测模型,并使用测试数据验证模型准确性,通过不断调参优化,获取最佳准确率的回归预测模型;

s4、将被预测航班的特征变量数据输入到回归预测模型中并计算得到航班剩余飞行时间的预测值。

为了更好地实现本发明,本发明步骤s1方法包括如下:

依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离d1、与目的机场距离d2、已飞行时间t1、剩余飞行时间t2、延误时间dt。

作为优选,本发明步骤s2方法包括如下:

利用皮尔森相关系数法分析历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据。

作为优选,本发明步骤s2方法皮尔森相关系数计算公式如下:

其中x,y为两个变量的样本观测值,n为样本数量。

作为优选,本发明步骤s3方法包括如下:

利用历史运行数据及其特征变量分析结果,构建基于xgboost算法的回归预测模型,预测函数表示为:

依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于xgboost算法的回归预测模型,预测函数表示为:

其中fk(xi)为第i个样本根据第k颗回归树确定的值;

并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型。

作为优选,本发明步骤s4方法包括如下:

依据步骤s3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。

一种基于数据挖掘分析的航班到达时刻预测方法,包括:

s1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离d1、与目的机场距离d2、已飞行时间t1、剩余飞行时间t2、延误时间dt;所述航班历史数据包括航班动态、ads-b系统中的运行轨迹、acars系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;

s2、历史运行数据特征筛选与相关性分析:利用皮尔森相关系数法分析步骤s1中历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据;皮尔森相关系数计算公式如下:

其中x,y为两个变量的样本观测值,n为样本数量;

s3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于xgboost算法的回归预测模型,预测函数表示为:

依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于xgboost算法的回归预测模型,预测函数表示为:

其中fk(xi)为第i个样本根据第k颗回归树确定的值;

并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型;

s4、依据步骤s3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。

一种基于数据挖掘分析的航班到达时刻预测系统,包括数据采集模块、存储模块、标准化处理模块、皮尔森相关系统计算模块、数据输入模块、回归预测模型和输出显示模块,数据采集模块用于采集输入航班历史数据,所述航班历史数据来源包括ads-b系统、acars系统、雷达监视系统,标准化处理模块用于对航班历史数据按照特征维度参数进行关联匹配、多维分类及标准化处理并得到历史运行数据,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场;皮尔森相关系统计算模块用于对历史运行数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析,回归预测模型用于利用历史运行数据及其特征变量分析结果构建基于xgboost算法的回归预测模型;数据输入模块用于输入测试数据验证、优化回归预测模型,数据输入模块还用于输入被预测航班的特征变量数据;输出显示模块用于输出根据回归预测模型计算得到的航班剩余飞行时间的预测值。

本发明较现有技术相比,具有以下优点及有益效果:

(1)本发明从ads-b系统、acars系统等设备中采集航班历史数据,首先对数据进行关联、标准化处理,然后依据特征变量筛选、特征值计算通过皮尔森相关系数计算得到各特征变量与到达时刻之间相关系统,并构建基于xgboost算法的回归预测模型,不断调参优化模型,得到最佳准确率的回归预测模型,在模型中输入被预测航班的特征变量数据后即可预测得到航班的预测到达时刻。

(2)本发明充分利用历史运行数据进行标准处理、皮尔森相关系数计算处理并建立出回归预测模型,通过回归预测模型实时预测航班的预测到达时间,提高了航班到达时刻的预测精度,有利于航班飞行实时指导与实时监视。

附图说明

图1为本发明航班到达时刻预测系统的原理结构框图。

具体实施方式

下面结合实施例对本发明作进一步地详细说明:

实施例一

一种基于数据挖掘分析的航班到达时刻预测方法,包括:

s1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配、多维分类及标准化处理与存储,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场,所述航班历史数据包括航班动态、ads-b系统中的运行轨迹、acars系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;本实施例的航班历史数据主要来源于航班动态、ads-b系统中的运行轨迹、acars系统中的运行轨迹、飞行计划航路,当然还可以来源于其他监视设备(比如雷达监视设备)。

s2、历史运行数据特征筛选与相关性分析:对步骤s1中的历史运行数据进行特征变量筛选、特征值计算,并对数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析;

s3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于xgboost算法的回归预测模型,并使用测试数据验证模型准确性,通过不断调参优化,获取最佳准确率的回归预测模型;

s4、将被预测航班的特征变量数据输入到回归预测模型中并计算得到航班剩余飞行时间的预测值。

本实施例中步骤s1方法包括如下:

依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离d1、与目的机场距离d2、已飞行时间t1、剩余飞行时间t2、延误时间dt。

本实施例中步骤s2方法包括如下:

利用皮尔森相关系数法分析历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据。

本实施例中步骤s2方法皮尔森相关系数计算公式如下:

其中x,y为两个变量的样本观测值,n为样本数量。

其公式演算方法如下:

本实施例中步骤s3方法包括如下:

利用历史运行数据及其特征变量分析结果,构建基于xgboost算法的回归预测模型,预测函数表示为:

依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于xgboost算法的回归预测模型,预测函数表示为:

其中fk(xi)为第i个样本根据第k颗回归树确定的值;

并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型。

本实施例中步骤s4方法包括如下:

依据步骤s3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。

如图1所示,一种基于数据挖掘分析的航班到达时刻预测系统,包括数据采集模块、存储模块、标准化处理模块、皮尔森相关系统计算模块、数据输入模块、回归预测模型和输出显示模块,数据采集模块用于采集输入航班历史数据,所述航班历史数据来源包括ads-b系统、acars系统、雷达监视系统,标准化处理模块用于对航班历史数据按照特征维度参数进行关联匹配、多维分类及标准化处理并得到历史运行数据,所述特征维度参数包括航班号、航班日期、三字码、机号、机型、起降机场;皮尔森相关系统计算模块用于对历史运行数据中各特征变量与到达时刻之间进行皮尔森相关系数计算分析,回归预测模型用于利用历史运行数据及其特征变量分析结果构建基于xgboost算法的回归预测模型;数据输入模块用于输入测试数据验证、优化回归预测模型,数据输入模块还用于输入被预测航班的特征变量数据;输出显示模块用于输出根据回归预测模型计算得到的航班剩余飞行时间的预测值。

实施例二

一种基于数据挖掘分析的航班到达时刻预测方法,包括:

s1、航班历史运行数据匹配融合及标准化处理:依据特征维度参数对航班历史数据进行关联匹配并构建出航班运行数据集,所述航班运行数据集包括航班号、机号、机型、起降机场、航空公司;对航班运行数据集中包括航班轨迹、航班动态在内数据进行特征计算和标准化处理,特征计算所含的特征项包括如下:航班轨迹点、与起飞机场距离d1、与目的机场距离d2、已飞行时间t1、剩余飞行时间t2、延误时间dt;所述航班历史数据包括航班动态、ads-b系统中的运行轨迹、acars系统中的运行轨迹、飞行计划航路,处理后得到历史运行数据;

s2、历史运行数据特征筛选与相关性分析:利用皮尔森相关系数法分析步骤s1中历史运行数据的特征项参数与航班到达时刻之间的相关性,所述特征项参数包括航程距离、航程时间、起飞延误时间、到达延误时间、执飞机型、载客、载重;分析计算历史运行数据各飞行轨迹中的如下数据:各个航迹点的时间、与起飞时间时间差、与落地时间时间差、与起飞机场距离、与落机场距离;并筛选出具有显著相关性的属性与数据,同时去除弱相关和无相关性的的属性与数据;皮尔森相关系数计算公式如下:

其中x,y为两个变量的样本观测值,n为样本数量;

s3、构建预测模型:利用历史运行数据及其特征变量分析结果,构建基于xgboost算法的回归预测模型,预测函数表示为:

依据步骤二筛选的历史运行数据特征参数,使用历史运行数据训练构建构建基于xgboost算法的回归预测模型,预测函数表示为:

其中fk(xi)为第i个样本根据第k颗回归树确定的值;

并使用不同的历史运行数据进行预测测试优化,获取得到最佳准确率的回归预测模型;

s4、依据步骤s3得到的回归预测模型,输入被预测航班的当前运行特征参数,运行特征参数包括航班号、航空公司、机号、机型、起降机场、载重、所在位置、已飞时间、已飞距离、剩余距离,回归预测模型计算得到航班的剩余飞行时间,并得到落地时间预测;在航班实际落地后,将实际运行特征变量与实际落地时间反馈至回归预测模型,实现对回归预测模型进行更新学习。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1