一种基于支持向量机的航班到港延误预测方法与流程

文档序号:32470052发布日期:2022-12-07 07:05阅读:75来源:国知局
一种基于支持向量机的航班到港延误预测方法与流程

1.本发明涉及数据处理领域,特别是涉及一种基于支持向量机的航班到港延误预测方法。


背景技术:

2.目前,我国航空业发展非常迅速,但同时,航班延误的现象也大幅增加,繁忙机场的进离港延误航班数量和延误时间难以预测,因天气原因、航空管制、飞机故障、旅客原因和航空公司原因造成的大量航班延误,往往,当前一航班出现任何纰漏都有可能引发后续航班的连锁反应,往往到后面延误时间越长,因此对航班延误的准确预测十分重要。
3.然而,现有技术中,往往使用过去一年或过去几年的航班延误数据对航班延误情况进行预测,预测结果的准确率并不高。


技术实现要素:

4.针对上述技术问题,本发明采用的技术方案为:一种基于支持向量机的航班到港延误预测方法,所述方法包括如下步骤:
5.s100,获取预设未来时间节点内的待预测航班属性数据a=[a1,a2,

,ai,

,am],ai是指待预测航班对应的第i个属性数据,i的取值范围是1到m,m是指属性数据的数量,其中,m个属性数据至少包括:所述待预测航班的类型、计划到港时间和计划离港时间;
[0006]
s200,基于待预测航班属性数据a获取第一特征数据b=[b1,b2,

,bj,

,bn],其中,bj是第j个第一特征数据,bj根据a1,a2,

,ai,

,am中的至少一个得到,j的取值范围是1到n,n为第一特征数据的数量;
[0007]
s300,将第一特征数据b输入目标支持向量机模型,获取待预测航班到港延误预测结果。
[0008]
本发明至少具有以下有益效果:获取预设未来时间节点的待预测航班属性数据,将待预测航班属性数据进行处理,获取第一特征数据,将第一特征数据输入目标支持向量机模型,获取航班到港延误预测结果,不同于现有技术中使用历史数据判断航班延误情况的方法,本发明通过未来时间节点的数据对未来时间节点的航班进行到港延误预测,能够更灵活、更准确地预测航班延误情况。
附图说明
[0009]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]
图1为本发明实施例提供的一种基于支持向量机的航班到港延误预测方法的流程图;
[0011]
图2为本发明实施例提供的训练用航班原始数据随机排序输入构建的支持向量机模型预测50次的结果显示图;
[0012]
图3为本发明实施例提供的训练用航班原始数据随机排序输入构建的支持向量机模型预测100次的结果显示图。
具体实施方式
[0013]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0014]
本发明实施例1提供了一种基于支持向量机的航班到港延误预测方法,如图1所示,所述方法包括如下步骤:s100,获取预设未来时间节点内的待预测航班属性数据a=[a1,a2,

,ai,

,am],ai是指待预测航班对应的第i个属性数据,i的取值范围是1到m,m是指属性数据的数量,其中,m个属性数据至少包括:所述待预测航班的类型、计划到港时间和计划离港时间。
[0015]
s200,基于待预测航班属性数据a获取第一特征数据b=[b1,b2,

,bj,

,bn],其中,bj是第j个第一特征数据,bj根据a1,a2,

,ai,

,am中的至少一个得到,j的取值范围是1到n,n为第一特征数据的数量。
[0016]
可选地,当bi为航班计划飞行时间时,通过待预测航班属性数据中航班计划到港时间和航班计划离港时间进行计算获取;当bi为第一特征航班计划到港时间或第一特征航班计划离港时间时,通过待预测航班属性数据中航班计划到港时间或航班计划离港时间建立分段函数获取;当bi为其它第一特征数据时,通过待预测航班属性数据进行归一化处理获取。
[0017]
s300,将第一特征数据b输入目标支持向量机模型,获取待预测航班到港延误预测结果。
[0018]
基于s100-s300,获取预设未来时间节点的待预测航班属性数据,将待预测航班属性数据进行处理,获取第一特征数据,将第一特征数据输入目标支持向量机模型,获取航班到港延误预测结果,不同于现有技术中使用历史数据判断航班延误情况的方法,本发明通过未来时间节点的数据对未来时间节点的航班进行到港延误预测,能够更灵活、更准确地预测航班延误情况。
[0019]
具体地,目标支持向量机模型的获取包括如下步骤:
[0020]
s401,获取预设时间段内的训练用航班属性数据集d={d1,d2,

,dr,

,ds},其中,dr={d
1r
,d
0r
},d
1r
=[d
1r1
,d
1r2


,d
1ri


,d
1rm
],d
1ri
是指第r个训练用航班对应的第i个属性数据,d
0r
用于表示第r个训练用航班是否延误,且第r个训练用航班的m个属性数据和所述待预测航班的m个属性数据相同,r的取值范围是1到s,s是所述预设时间段内的训练用航班的数量。
[0021]
在s401之前还包括以下步骤:
[0022]
s000,获取预设时间段内的训练用航班原始数据集h={h1,h2,

,hr,

,hs},其中,hr=[h
r1
,h
r2


,h
rg


,h
rz
],h
rg
是指第r个训练用航班对应的第g个属性数据,训练用航
班的z个属性数据至少包括:训练用航班的计划离港时间、计划到港时间、实际到港时间和航班类型。
[0023]
s001,根据训练用航班原始数据集h获取训练用航班延误数据l={l1,l2,

,lr,

,ls},其中,lr为hr的航班延误数据,用于表示第r个航班是否延误。
[0024]
具体地,当hr中的实际到港时间-计划到港时间≥w时,lr=0,表示第r个训练用航班延误,否则lr=1,表示第r个训练用航班无延误,其中,w是指预设延误阈值。
[0025]
s402,基于所述训练用航班属性数据集d,获取第一航班特征数据集e={e1,e2,

,er,

,es}和第一航班类别数据f={f1,f2,

,fr,

,fs},其中,第r个第一航班特征数据er=[e
r1
,e
r2


,e
rj


,e
rn
],er根据d
1r1
,d
1r2


,d
1ri


,d
1rm
中的至少一个得到,且所述第一航班特征数据er中的特征和第一特征数据b中的特征相同;对应的第一航班类别数据fr=d
0r

[0026]
具体地,所述第一航班特征至少包括:航班计划飞行时间,第一特征航班计划到港时间,第一特征航班计划离港时间,航班计划到港时间位于白天或夜晚,航班计划离港时间位于白天或夜晚,航班计划到港时间是否在高峰时间段,航班计划离港时间是否在高峰时间段,航班类型是客运航班或货运航班。
[0027]
进一步地,hr对应的航班计划飞行时间=hr对应的航班计划到港时间-hr对应的航班计划离港时间。
[0028]
进一步地,当hr对应的航班计划到港时间在[00.00,1.00)时,将第一特征航班计划到港时间标记为“1”,当hr对应的航班计划到港时间在[1.00,2.00)时,将第一特征航班计划到港时间标记为“2”,
……
,当hr对应的航班计划到港时间在[23.00,24.00)时,将第一特征航班计划到港时间标记为“24”。
[0029]
进一步地,当hr对应的航班计划离港时间在[00.00,1.00)时,将第一特征航班计划离港时间标记为“1”,当hr对应的航班计划离港时间在[1.00,2.00)时,将第一特征航班计划离港时间标记为“2”,
……
,当hr对应的航班计划离港时间在[23.00,24.00)时,将第一特征航班计划离港时间标记为“24”。
[0030]
进一步地,当hr对应的航班计划到港时间在[8.00,20.00)时,将航班计划到港时间位于白天或黑夜标记为1,表示航班计划到港时间位于白天,否则,将航班计划到港时间位于白天或黑夜标记为0,表示航班计划到港时间位于黑夜。
[0031]
进一步地,当hr对应的航班计划离港时间在[8.00,20.00)时,将航班计划离港时间位于白天或黑夜标记为1,表示航班计划离港时间位于白天,否则,将航班计划离港时间位于白天或黑夜标记为0,表示航班计划离港时间位于黑夜。
[0032]
进一步地,当hr中的计划到港时间在(x1,x2)或(x3,x4)时,hr对应的航班计划到港时间是否在高峰时间段是1,表示第r个训练用航班对应的航班计划到岗时间在到港高峰时间段,否则,hr对应的航班计划到港时间是否在高峰时间段是0,表示第r个训练用航班对应的航班计划到港时间不在到港高峰时间段。
[0033]
更进一步地,通过如下方式获取到港高峰时间段(x1,x2)和(x3,x4):
[0034]
s1,基于训练用航班属性数据集d获取到港航班数量列表e={e1,e2,

,ey,

,e
24
},ey是指(y,y+3)的航班计划到港数量,其中,y为第y个时间段的时间起点,(y+3)为的y个时间段的时间终点,y的取值范围是1到24。
[0035]
s2,将e

对应的时间段作为(x1,x2),其中,e

满足如下条件:e

=max(e1,e2,

,ey,

,e
24
)。
[0036]
s3,将e

对应的时间段作为(x3,x4),其中e

是指除e

外航班计划到港数量中最大值对应的时间段。
[0037]
基于s1到s3,通过获取预设时间段内计划到港航班时间,将航班计划到港数量最多和次多对应的时间段作为到港高峰时间段,在进行预测时,本发明通过预设未来时间节点的航班数据预测当天的计划到港航班高峰时间段,不同于现有技术中使用历史数据获取高峰时间段的方法,对于高峰时间段的预测更为准确、及时。
[0038]
进一步地,当hr中的计划离港时间在(y1,y2)或(y3,y4)时,hr对应的航班计划离港时间是否在高峰时间段标记为1,表示第r个训练用航班对应的航班计划离港时间在离港高峰时间段,否则,hr对应的航班计划离港时间是否在高峰时间段标记为0,表示第r个训练用航班对应的航班计划到港时间不在离港高峰时间段。
[0039]
具体地,可通过到港高峰时间段相同的方法获取离港高峰时间段(y1,y2)和(y3,y4)。
[0040]
进一步地,当hr为客运时,将第r个训练用航班类型标记为1,表示第r个训练用航班为客运;否则,将第r个训练用航班类型标记为0,表示第r个训练用航班为货运。
[0041]
s403,基于第一航班特征数据集e和第一航班类别数据f对构建的支持向量机模型进行训练,并将训练后的支持向量机模型确定为目标支持向量机模型。
[0042]
具体地,s403包括以下步骤:
[0043]
s4031,将第一航班类别数据f分为s1个训练集和s2个测试集。
[0044]
可选地,s1/(s1+s2)=0.8。
[0045]
s4033,构建支持向量机模型并设置参数值,利用s1个训练集对构建的支持向量机模型进行训练,得到训练后的支持向量机模型。
[0046]
具体地,本发明支持向量机模型选取sigmoid函数作为核函数。
[0047]
s4035,对训练后的支持向量机模型进行评估,当评估结果满足第一预设条件的模型确定为待测试支持向量机模型。
[0048]
在本发明一实施例中,所述第一预设条件可以为预测结果的准确率大于50%。
[0049]
s4037,将s2个测试集输入所述待测试支持向量机模型中,获取测试结果。
[0050]
s4039,当测试结果满足第二预设条件时,将训练后的支持向量机模型确定为目标支持向量机模型。
[0051]
在本发明一实施例中,目标支持向量机模型gamma参数数值为1/k,coef0参数数值为0,惩罚系数数值为0.5。
[0052]
在本发明一实施例中,根据采集的航班数据,获取训练用航班原始数据和训练用航班延误数据,表1为w=-5min时的部分数据示例。
[0053]
表1数据示例(w=-5min)
[0054]
序号h
r1hr2hr3hr4hr5hr6hr7hr8
lr185971000112180221901001031551714111111
490211901001152155100000161951410111101
[0055]
将训练用航班原始数据随机排序输入构建的支持向量机模型,预测50次,如图2所示,当w=-5min时,即实际到港时间晚于计划到港时间5分钟时,50次预测中的准确率均值为54.62%,准确率最高为56.96%。当w=-10min时,50次预测结果中准确率均值为64.40%,准确率最高为66.96%。对比不同预设延误阈值w的预测准确率结果,可知,w值越小,即预设延误阈值越小,预测结果越精确。对于训练用航班原始数据随机排序输入构建的支持向量机模型,对于预测结果影响不大,预测结果较为稳定。
[0056]
将100次训练用航班原始数据随机排序输入构建的支持向量机模型,进行实验,如图3所示,当w=-5min时,100次预测结果中准确率均值为54.50%,最高预测准确率为80.00%。当w=-10min时,100次预测结果中预测结果准确率均值为64.80%,最高预测准确率为66.84%。对比不同常数值w值的准确率结果,w值越接近0,单次预测准确率较高,但波动性较大,准确率结果不稳定。
[0057]
对比图2和图3可知,在有限样本数量情况下,对于航班晚点时间预测精细程度要求不高,即w越小时,预测准确率均值越高,稳定性越强,预测准确率越高。样本数量较大时,w越小,预测准确率越高,预测值稳定。
[0058]
因此,对于有限样本数量的情况下,预测航班到港时间延误5分钟以上的最高准确率为80.00%,预测延误10分钟以上的航班准确率在65%左右。对于大规模样本的情况,预测航班到港延误5分钟或10分钟的准确率分别在55%、65%左右,预测结果较为稳定。
[0059]
通过数据分析,国内货运航班比客运航班的平均延误时间长,客运货运航班的数据离散程度都比较大、偏离延误时间平均值程度大,预测难度大,且情景复杂。
[0060]
通过上述分析,w的设置对于预测准确率的影响较大,w为负数时,其值越小,预测结果越精准,全样本数据的随机排列对预测结果影响较小,预测结果稳定。随机不重复选取有限个样本数据,w的大小对于预测结果的稳定性有影响,w为负数时,其值越小,预测结果越稳定。
[0061]
本发明的实施例还提供了一种非瞬时性计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。
[0062]
本发明的实施例还提供了一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
[0063]
本发明的实施例还提供一种计算机程序产品,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使该电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的方法中的步骤。
[0064]
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1