一种基于sarima和rbf神经网络集成组合模型的机场货运量预测分析方法

文档序号:9274988阅读:623来源:国知局
一种基于sarima和rbf神经网络集成组合模型的机场货运量预测分析方法
【技术领域】
[0001] 本发明涉及一种交通运输规划设计与管理技术领域,特别是涉及一种基于SARIMA 和RBF神经网络集成组合模型的机场货运量预测分析方法。
【背景技术】
[0002] 随着民航业务的高速发展,民航机场运输规模迅速增长,机场货运量的合理预测 可以为机场发展提供导向作用,也可以为机场管理者提供决策支持。机场货运量数据作 为一种时间序列数据,其预测方法随着技术的不断突破,可以分为两类:一类是传统预测 方法,如:经济计量法、回归分析法、灰色预测法、自回归差分移动平均(Autoregressive IntegratingMovingAverage,ARIMA)等,其中时间序列分析中的自回归差分移动平均相 当灵活,融合了时间序列和回归分析的优点,在预测应用中最为广泛。另一类为人工智能预 测模型,如BP神经网络模型、RBF神经网络模型等。其中RBF神经网络具有全局逼近能力, 从根本上解决了BP神经网络的局部最优问题,而且拓扑结构紧凑,结构参数可实现分离学 习,收敛速度快,是神经网络预测的首选。
[0003] 申请号为201410764609. 6的专利文献公开了一种基于ARIMA模型的预测公交客 流的方法,该申请主要是建立最优的ARIMA模型预测一段时间内的客流量,但该模型主要 刻画客流数据序列的线性部分,对客流数据序列的大体趋势进行拟合,但不能很好地刻画 影响客流量数据序列变化的非线性因素。
[0004] 申请号为201510019088. 6的专利文献公开了一种基于灰熵分析和改进贝叶斯融 合的交通流预测方法,该申请首先根据历史交通流量分别建立线性最小二乘回归模型以及 径向基函数神经网络模型来进行交通流量预测,其次考虑交通流量之间的关联度,根据灰 熵分析计算预测交通流量与历史交通流量关联度等级,并选取关联度等级较高的历史交通 流量作为预测模型输入数据,根据输入数据获得每个预测模型的预测值,接着结合改进贝 叶斯融合的方法及相关的历史交通流量,计算每个预测模型在预测该时刻交通流量时的权 重,最终获得该时刻的预测交通量,实现短时交通流的预测。但该模型主要是通过权值计算 预测交通量,还不能达到最优的预测结果,同时此发明也只是对两个模型进行权值分配后 的叠加,对提高精度有一定帮助,但并未从本质上刻画影响交通流量的线性和非线性因素, 预测精度还有一定的提升空间。
[0005] 为了有效地利用各种模型的优点,Bates等在1969年提出了组合预测的思想, 就是将几个模型通过适当方式进行组合,以期获得最优预测结果。南娟将经济计量法与回 归分析法进行熵权法组合对机场货运量预测,预测结果显示该预测算法具有较高的预测精 度;傅培华等运用Shapley值法将BP神经网络和灰色理论预测模型进行组合,并对航空货 运量进行了预测,得到的预测结果更加接近实际结果。但目前组合模型的预测结果还不能 满足机场实际运行需求的精度。
[0006] 综上所述,在本领域急需一种科学合理的机场货运量预测方法,能达到机场实际 运行需求的精度,为机场管理决策提供依据。

【发明内容】

[0007] 本发明提出一种将线性SARIMA和非线性RBF神经网络集成组合(记为: SARIMA-RBF)的机场货运量预测方法,该方法科学的结合了SARIMA和RBF神经网络各自的 优点,最终仿真结果表明,预测精度得到提高,并达到机场实际运行需求的精度。
[0008] 本发明的目的是通过以下技术方案予以实现。如图1所示,本发明分为以下操作 步骤:
[0009] 步骤1,用SARIMA模型对机场货运量原序列Yt进行建模,预测出机场货运量线性 部分为at,则机场货运量线性部分预测残差为Et:Et=Yt_at。
[0010] 步骤2,根据确定的RBF神经网络的样本集,输入拓阶重构后的机场货运量序列Y, 输出机场货运量残差时间E,构造RBF神经网络预测模型,预测得到补偿SARIMA模型残差结 果et。
[0011] 步骤3,将两种模型的预测结果组合成为最终的预测结果:yt=at+et。
[0012] 所述步骤1包括如下操作:
[0013] (11)利用机场数据库系统得到机场关于时间的机场货运量时间序列数据;
[0014] (12)根据机场货运量时间序列的散点图、自相关函数图识别其平稳性;
[0015](13)对非平稳的机场货运量时间序列数据进行平稳化(差分)处理;并得到d和 D的取值;其中d,D分别表示非季节性和季节性差分次数;
[0016] (14)根据平稳后的时间序列自相关图和偏自相关图确定p、q,P、D的可能取值, 然后采用贝叶斯信息法(BIC)确定出最佳的模型阶数,检验是否具有统计意义;
[0017](15)利用已通过检验的模型进行预测机场货运量的线性部分;
[0018] 所述步骤2包括如下操作:
[0019] (21)将一维机场货运量时间序列进行拓阶重构,转换成多维时间序列;
[0020] 由于SARIMA模型的周期为S,为不失一般性,设最优阶数为m=S+1,得到的时间 序列输入为
[0021] 则机场货运量一维残差时间序列输出可表示为
1=1
[0022] (22)进行网络结构设计,确定径向基函数;径向基函数就是某种沿径向对称的标 量函数,通常定义为空间任一点Y到某一中心Ci之间欧式距离的单调函数。本发明采用高 斯径向基函数,艮I
[0023] (23)网络训练:选取聚类算法,利用聚类算法确定RBF隐层中心、最小二乘算法确 定连接权值,训练网络,拟合学习段时间序列,直到网络收敛于一定的标准。否则,可重新改 变网络的初始权值甚至网络的拓扑结构,直至训练结果满意;所述聚类算法采用K-均值聚 类算法确定基函数的中心,步骤如下:
[0024] 初始化聚类中心{CiGRn|i= 1,2,......,N},通常是将Ci设置为最初的N训 练样本,然后将输入的样本集合按最近邻规则分组,即将Y分配给中心为{CieRn|i= 1,2,......,N}输入样本聚类集合{ 0= 1,2,......,N},即YG0i且满足Ci = min|lY-cJ|,其中,i= 1,2,......N。
[0025] 重新调整聚类中心,计算0冲样本的平均值,即聚类中心ci: ,其中叫 ni y^0, 为(^中的驶入样本数。直到聚类中心的分布不再变化,得到的{CiGRn|i= 1,2,......, N}为RBF网络最终的基函数中心。
[0026] 权值选择最小二乘法直接计算
(3)
[0027] (24)利用检验段数据检验训练好的网络模型预测机场货运量的非线性部分。
[0028] 优选地,在对所述机场货运量时间序列数据进行分析前可以将其进行数据归一化 处理。因货运量历史数据是一种非平稳数据,有的数据差值较大,数据差异过大对模型训练 速度会产生不利影响。为消除这种不利影响,对机场货运量原始数据进行归一化,具体公式 如下:
[0029]
[0030] 式中,y表示机场货运量原始时间序列,y*表示预处理后的机场货运量时间序列, ymi,y_分别表示机场货运量最大值和最小值。
[0031] 最后将预测的最终结果进行反归一化,其反归一化公式为:
[0032] y=y*(ymax-ymin)+ymin (5)
【附图说明】
[0033] 图1是本发明的结构示意图。
[0034] 图2是机场货运量时间序列图
[0035] 图3是机场货运量时间序列自相关图
[0036] 图4是1次差分后的机场货运量时间序列图
[0037] 图5是1次差分后的机场货运量时间序列自相关图
[0038] 图6是1次差分和1次季节性差分后的机场货运量时间序列自相关图
[0039] 图7是1次差分和1次季节性差分后的机场货运量时间序列偏自相关图 [0040]图8是ARIMA(0,1,1) (1,1,1)12模型机场货运量预测
[0041] 图9是RBF网络训练结果图
[0042] 图10
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1