一种基于时空卷积网络的OD市场航空客流量预测方法

文档序号:29065422发布日期:2022-03-01 18:43阅读:422来源:国知局
一种基于时空卷积网络的OD市场航空客流量预测方法
一种基于时空卷积网络的od市场航空客流量预测方法
技术领域
1.本发明属于大数据技术领域,尤其涉及一种基于时空卷积网络的od市场航空客流量预测方法。


背景技术:

2.长期以来,准确预测航空客流量一直是航空运输业内各主体进行统筹规划的首要任务。航空公司可以据此判断od市场是否能够盈利或对现有运力供给做出调整,机场则能够及时评估当前基础设施容量与客流量的匹配情况。然而,客流量受航空运输市场多方面因素的影响具有不确定性和难预测性,因此,如何科学准确地预测od市场航空客流量始终是民航运输领域研究的热点之一。
3.根据现有国内外研究情况,基于模型构建机理可以将交通领域的流量预测方法划分为参数法和非参数法。参数法的模型结构需要根据相应的理论假设和统计分析确定,模型参数则利用相关的历史时间序列数据估计得到,该种方法的相关模型有:最小二乘回归模型、自回归滑动平均模型、自回归分布滞后模型、时变参数模型、向量自回归、灰色预测模型等。另外,从系统动力学的角度,可以构建影响客流量变化的各因素相互之间的动态子模型,通过系统仿真得到航空客流量预测结果。由于参数法预测模型是从计量经济建模的思想出发,来试图建立和拟合能够准确反映客流量变化的具体化模型,但这类模型很难表征因果变量的非线性关系并且对于处理起伏变化剧烈的数据泛化能力不够。
4.基于机器学习的非参数方法也被广泛应用于市场客流量预测,这种方法的相关应用手段有:bp神经网络、支持向量回归、随机森林回归、自适应模糊神经网络、小波神经网络以及组合预测模型等。尽管组合预测模型得到的结果都优于单个预测模型,但所建模型多为浅层结构无法精确挖掘大型数据背后的深层次信息,且机器学习方法在处理高维非线性交通数据上仍具有局限性,因此制约了机器学习预测的进一步拓展。
5.近几年,在交通数据呈爆炸式增长的大背景下,从人工神经网络研究衍生发展而来的深度学习,为进一步提高客流量预测准确度提供了新的途径。特别是卷积神经网络,其独特的网络结构特点使其被广泛应用于计算机视觉、图像识别领域,传统神经网络是以一维向量的数据形式作为输入,而卷积神经网络的不同之处就在于以多维矩阵数据形式作为输入,并通过卷积操作代替原有的神经元连接方式,这种多层卷积操作可以自动提取具有空间特性数据之间的关联特征,从而减少了人为构造特征带来的误差,由此可将其迁移应用于具有时空特性的航空客流量数据的预测问题中。
6.综上所述,以往预测航空客流量的方法多集中于参数法、浅层机器学习和组合预测。其中,参数法涉及模型构建在很大程度上会受到人为主观因素的影响,同时参数估计的准确度又会影响模型最终预测的精度;而浅层机器学习和组合预测则会存在预测过程陷入过拟合等情形。此外,航空客流量预测都只考虑单个od市场在时间维度上的历史数据,忽略了空间位置上有联动相关作用的相邻机场对所预测od市场客流量的影响,未能从区域多机场角度去预测od市场客流量。


技术实现要素:

7.本发明的目的是提供一种基于时空卷积网络的od市场航空客流量预测方法,解决了采用时空卷积网络对航空客流量进行预测,实现同一区域多个出发机场到同一目的机场多个od市场客流量的同时预测的技术问题。
8.为实现上述目的,本发明采用如下技术方案:
9.一种基于时空卷积网络的od市场航空客流量预测方法,包括:
10.通过客户端服务器选定某一个区域多机场系统,统计、整理并存储区域多机场系统内各出发机场到目的机场的航空客流量数据;
11.预测模型服务器获取航空客流量数据,并对航空客流量数据预处理,构建od客流网格图和外部影响因素特征向量,搭建基于时空卷积网络的od市场航空客流量预测模型,形成预测模型相应的训练集;
12.od市场是指从出发机场origin airport到目的机场destination airport的航空旅客运输市场;
13.通过调节数据特性和预测模型的网络结构,确定不同数据集下预测模型最优的超参数设置;超参数包括网络结构的超参数和数据特性的超参数,网络结构的超参数包括卷积层数、卷积核大小和卷积核数量,数据特性的超参数包括趋势性片段选取的样本长度和周期性片段选取的样本长度;
14.中心服务器根据航空客流量历史数据,同时预测数个od市场的航空客流量。
15.优选的,管理人员通过客户端服务器输入多机场系统内出发机场三字代码、目的机场三字代码,各od市场对应的月客流量;
16.客户端服务器根据时间自动排列生成各od市场的客流量时间序列数据,客户端服务器将客流量时间序列数据传送给数据库模块进行存储。
17.优选的,预处理航空客流量数据,包括小波阈值去噪和数据归一化处理,其中,小波阈值去噪采用软阈值两层分解的方法;
[0018][0019]
优选的,构建od客流网格图和外部影响因素特征向量,具体包括:
[0020]
步骤a1:定义o={o1,o2,

,on}表示出发机场集合,n为出发机场总数;d表示目的机场;用《o,d》表示一个od市场,o∈o;
[0021]
预测模型服务器根据各区域多机场系统内出发机场的经纬度以及相对地理位置分布情况,将n个出发机场映射到i
×
j的网格图r中,网格(i,j)表示在网格图r中的任意一个网格,i表示网格的行数,j网格的列数,网格(i,j)表示第t个月该位置对应的系统内出发机场o到系统外目的机场d的客流量用一个二维张量x
t
∈ri×j表示第t个月系统内出发机场到系统外同一目的机场的od客流网格图,其中,
[0022]
步骤a2:定义外部影响因素包括月份属性和是否包含节假日这两个特征,将外部影响因素处理为0-1向量,即用0或1表示预测月份属性和是否包含节假日两个特征,前12位对应表示1月份到12月份,第13位表示是否包含节假日;
[0023]
优选的,预测模型服务器利用python的keras神经网络库中的函数化模块,搭建基于时空卷积网络的od市场航空客流量的预测模型,通过已知的m个历史观察值xm={x
t
|t=
1,2,

,m},预测k个月的数个od市场的航空客流量xk={x
t
|t=m+1,m+2,

,m+k};
[0024]
通过改变网络结构和数据特性这两部分超参数,来确定预测模型最适合的超参数设置,利用adam优化器对预测模型进行训练优化,并在训练过程中采用早停策略来避免模型过拟合。
[0025]
优选的,中心服务器预测数个od市场的航空客流量的具体步骤包括:
[0026]
步骤b1:提取od客流网格图的片段,根据客流量在时间维度上的依赖性,针对预测时间点分别按不同时间间隔提取两个时间片段:分别为趋势性网格图片段x
tre
和周期性网格图片段x
per
,具体提取形式如下:
[0027][0028][0029]
其中,l
tre
和l
per
作为预测模型中的可调节的数据特性超参数,分别表示趋势性片段选取的样本长度和周期性片段选取的样本长度;
[0030]
步骤b2:构建时空卷积网络,基于提取的两个不同时间间隔的网格图片段,分别构建结构相同的时空卷积网络分支捕获od客流量的时空特性,时空卷积网络分支以s+1(s≥1)个卷积层为基础;
[0031]
以趋势性部分的时空卷积网络分支为例,用以趋势性部分的时空卷积网络分支为例,用表示趋势性网格图片段,通过第一个卷积层c1将(x
tre
)
(0)
转换成一个新的张量(x
tre
)
(1)
,转换公式如下:
[0032][0033]
其中,和是第一个卷积层的学习参数,在卷积层c1操作之后按上式继续加入(s-1)个卷积层,在第s个卷积层后,再经过一个只包含一个卷积核的卷积层c
s+1
,最终得到趋势性部分的输出结果(x
tre
)
(s+1)
;同理,用上述相同的操作构建周期性部分的时空卷积网络分支,得到输出结果(x
per
)
(s+1)

[0034]
步骤b3:构建外部影响因素网络,预测模型考虑的外部影响因素包括月份属性和是否包括节假日两个方面,基于第t个预测时间点,得到相应的外部影响因素特征向量e
t
,利用一个两层全连接神经网络分支作为外部影响因素网络,第一层可被视为嵌入层,主要是将外部因素定量化加入到预测模型,第二层则是将第一层得到的特征映射成高维张量,其大小应和x
t
一致以便与时空卷积网络的输出结果融合,得到输出结果x
ext

[0035]
步骤b4:融合获取预测结果,以学习参数的形式赋予时空卷积网络输出结果(x
tre
)
(s+1)
和(x
per
)
(s+1)
不同的权重矩阵,并进行聚合得加权后的输出结果,计算公式如下:
[0036]
x
con
=w
tre
*(x
tre
)
(s+1)
+w
per
*(x
per
)
(s+1)
[0037]
其中,*表示哈达马乘积;w
tre
和w
per
分别表示趋势性和周期性部分的权重,即两部分输出分别对最终预测结果的影响程度,进一步通过tanh函数将计算结果x
con
和外部影响因素网络输出结果x
ext
映射到[-1,1]之间,得最终预测结果xk,计算公式如下:
[0038]
xk=tanh(x
con
+x
ext
)
[0039]
以最小化预测值矩阵xk和真实值矩阵之间的均方误差为目标训练预测模型:
[0040][0041]
其中,θ表示模型的所有学习参数。
[0042]
本发明所述的一种基于时空卷积网络的od市场航空客流量预测方法,解决了采用时空卷积网络对航空客流量进行预测,实现同一区域多个出发机场到同一目的机场多个od市场客流量的同时预测的技术问题,本发明首度将时空卷积网络应用于航空客流量预测领域,实现同一区域多个出发机场到同一目的机场多个od市场客流量的同时预测,给航空客流量预测提供了一种新思路;本发明将卷积网络中的卷积核看作是捕获od客流空间相关性的媒介,则一个卷积层中包含多个卷积核就能准确捕获od客流在空间维度上复杂的潜在特征关系,提升预测效果;本发明综合考虑了od客流量的时间依赖性、空间相关性以及外部影响因素的作用,以rmse作为模型的评估标准,以长三角16个主要机场到广州白云国际机场的od客流量数据为例,预测模型对比arima(自回归滑动平均模型)、svr(支持向量回归)、elman神经网络和lstm(长短期记忆网络),拟合效果更优。
附图说明
[0043]
图1是本发明基于时空卷积网络的od市场航空客流量预测方法的总流程图;
[0044]
图2是本发明基于时空卷积网络的od市场航空客流量预测模型框架;
[0045]
图3是本发明实施例中od客流网格图的构造示意图;
[0046]
图4是本发明实施例中提出的模型方法与其他模型在不同od市场的客流拟合结果;
[0047]
图5是本发明实施例中提出的模型方法与其他模型在不同预测间隔的客流拟合结果。
具体实施方式
[0048]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0049]
如图1-图5所示,一种基于时空卷积网络的od市场航空客流量预测方法,包括:
[0050]
通过客户端服务器选定某一个区域多机场系统,统计、整理并存储区域多机场系统内各出发机场到目的机场的航空客流量数据;
[0051]
预测模型服务器获取航空客流量数据,并对航空客流量数据预处理,构建od客流网格图和外部影响因素特征向量,搭建基于时空卷积网络的od市场航空客流量预测模型,形成预测模型相应的训练集;
[0052]
od市场是指从出发机场origin airport到目的机场destination airport的航空旅客运输市场;
[0053]
目的机场即多机场系统外的目的机场。
[0054]
通过调节数据特性和预测模型的网络结构,确定不同数据集下预测模型最优的超参数设置;超参数包括网络结构的超参数和数据特性的超参数,网络结构的超参数包括卷
积层数、卷积核大小和卷积核数量,数据特性的超参数包括趋势性片段选取的样本长度和周期性片段选取的样本长度;
[0055]
数据集就是指区域多机场系统内各出发机场到目的机场的航空客流量数据(即多个od市场航空客流量);不同的区域多机场系统会形成不同的数据集,但数据类型都是客流量。
[0056]
超参数是指在开始训练预测模型之前,人为设置好的模型参数。
[0057]
中心服务器根据航空客流量历史数据,同时预测数个od市场的航空客流量。
[0058]
优选的,管理人员通过客户端服务器输入多机场系统内出发机场三字代码、目的机场三字代码,各od市场对应的月客流量;
[0059]“出发机场”是指选定的“区域多机场系统”内所有或部分机场,如长三角地区所有的机场。
[0060]“目的机场”是指在选定的“区域多机场系统”外的机场,有且只能选择一个,如北京首都国际机场。
[0061]
客户端服务器根据时间自动排列生成各od市场的客流量时间序列数据,客户端服务器将客流量时间序列数据传送给数据库模块进行存储。
[0062]
优选的,预处理航空客流量数据,包括小波阈值去噪和数据归一化处理,其中,小波阈值去噪采用软阈值两层分解的方法。
[0063]
优选的,构建od客流网格图和外部影响因素特征向量,具体包括:
[0064]
步骤a1:定义o={o1,o2,

,on}表示出发机场集合,n为出发机场总数;d表示目的机场;用《o,d》表示一个od市场,o∈o;
[0065]
预测模型服务器根据各区域多机场系统内出发机场的经纬度以及相对地理位置分布情况,将n个出发机场映射到i
×
j的网格图r中,网格(i,j)表示在网格图r中的任意一个网格,i表示网格的行数,j网格的列数,网格(i,j)表示第t个月该位置对应的系统内出发机场o到系统外目的机场d的客流量用一个二维张量x
t
∈ri×j表示第t个月系统内出发机场到系统外同一目的机场的od客流网格图,其中,
[0066]
如图3所示,每一个网格都预先对应了一个出发机场o,网格(i,j)对应于某个月该网格所表示的出发机场o到目的机场d的客流量;网格图就相当于是一个流量矩阵,作为模型的输入。
[0067]
在本实施例,根据长三角区域多机场系统内各出发机场的经纬度以及相对地理位置分布情况,将16个出发机场映射到4
×
4的网格图,各出发机场在网格图中的映射位置如图3左下角所示。
[0068]
步骤a2:定义外部影响因素包括月份属性和是否包含节假日这两个特征,将外部影响因素处理为0-1向量,即用0或1表示预测月份属性和是否包含节假日两个特征,前12位对应表示1月份到12月份,第13位表示是否包含节假,如预测2018年10月份的客流量则转换为[1,0,0,0,0,0,0,0,0,0,0,0,1];
[0069]
优选的,预测模型服务器利用python的keras神经网络库中的函数化模块,搭建基于时空卷积网络的od市场航空客流量的预测模型,如图2所示,为预测模型的框架;
[0070]
通过已知的m个历史观察值xm={x
t
|t=1,2,

,m},预测k个月的数个od市场的航
空客流量xk={x
t
|t=m+1,m+2,

,m+k};
[0071]
通过改变网络结构和数据特性这两部分超参数,来确定预测模型最适合的超参数设置,利用adam优化器对预测模型进行训练优化,并在训练过程中采用早停策略来避免模型过拟合。
[0072]
早停策略:1)通过将原始训练数据集划分成训练集和验证集;2)模型在训练集上进行训练并在每个epoch周期计算模型在验证集上的误差;3)当模型在验证集上的误差比上一次训练结果差的时候停止训练;4)使用上一次迭代结果中的参数作为模型的最终参数。
[0073]
即通过权衡训练周期和泛化错误达到最佳的模型训练效果,避免模型过拟合
[0074]
在本实施例中,固定学习率为0.002,每批处理样本数为3,训练轮数为100,以长三角16个主要机场到广州白云国际机场的od客流量数据为例,设置网络结构中卷积层数量∈{1,2,3},卷积核大小∈{(2,2),(3,3)},卷积核数量∈{16,32,64,128},数据特性中趋势性片段、周期性片段选取的样本长度∈{2,3,4};实施例选用2010年1月-2017年12月的数据作为训练数据,2018年1月-2018年12月的数据作为测试数据,预测时间间隔为1个月。
[0075]
以绝对误差δ、mae(平均绝对误差)和rmse(均方根误差)作为评估标准,不同算法模型航空客流量预测对比如表1所示,与其他模型在不同od市场的客流拟合结果如图4所示,与其他模型在不同预测间隔的客流拟合结果如图5所示:
[0076][0077]
表1
[0078]
根据航空客流量历史数据,利用确定好超参数设置的预测模型,预测一段时间内多个od市场的航空客流量。
[0079]
优选的,中心服务器预测数个od市场的航空客流量的具体步骤包括:
[0080]
步骤b1:提取od客流网格图的片段,根据客流量在时间维度上的依赖性,针对预测时间点分别按不同时间间隔提取两个时间片段:分别为趋势性网格图片段x
tre
和周期性网格图片段x
per
,具体提取形式如下:
[0081][0082][0083]
其中,l
tre
和l
per
作为预测模型中的可调节的数据特性超参数,分别表示趋势性片段选取的样本长度和周期性片段选取的样本长度;
[0084]
步骤b2:构建时空卷积网络,基于提取的两个不同时间间隔的网格图片段,分别构建结构相同的时空卷积网络分支捕获od客流量的时空特性,时空卷积网络分支以s+1(s≥1)个卷积层为基础;
[0085]
以趋势性部分的时空卷积网络分支为例,用以趋势性部分的时空卷积网络分支为例,用表示趋势性网格图片段,通过第一个卷积层c1将(x
tre
)
(0)
转换成一个新的张量(x
tre
)
(1)
,转换公式如下:
[0086][0087]
其中,和是第一个卷积层的学习参数,在卷积层c1操作之后按上式继续加入(s-1)个卷积层,在第s个卷积层后,再经过一个只包含一个卷积核的卷积层c
s+1
,最终得到趋势性部分的输出结果(x
tre
)
(s+1)
;同理,用上述相同的操作构建周期性部分的时空卷积网络分支,得到输出结果(x
per
)
(s+1)

[0088]
步骤b3:构建外部影响因素网络,预测模型考虑的外部影响因素包括月份属性和是否包括节假日两个方面,基于第t个预测时间点,得到相应的外部影响因素特征向量e
t
,利用一个两层全连接神经网络分支作为外部影响因素网络,第一层可被视为嵌入层,主要是将外部因素定量化加入到预测模型,第二层则是将第一层得到的特征映射成高维张量,其大小应和x
t
一致以便与时空卷积网络的输出结果融合,得到输出结果x
ext

[0089]
步骤b4:融合获取预测结果,以学习参数的形式赋予时空卷积网络输出结果(x
tre
)
(s+1)
和(x
per
)
(s+1)
不同的权重矩阵,并进行聚合得加权后的输出结果,计算公式如下:
[0090]
x
con
=w
tre
*(x
tre
)
(s+1)
+w
per
*(x
per
)
(s+1)
[0091]
其中,*表示哈达马乘积;w
tre
和w
per
分别表示趋势性和周期性部分的权重,即两部分输出分别对最终预测结果的影响程度,进一步通过tanh函数将计算结果x
con
和外部影响因素网络输出结果x
ext
映射到[-1,1]之间,得最终预测结果xk,计算公式如下:
[0092]
xk=tanh(x
con
+x
ext
)
[0093]
以最小化预测值矩阵xk和真实值矩阵之间的均方误差为目标训练预测模型:
[0094][0095]
其中,θ表示模型的所有学习参数。
[0096]
本发明所述的一种基于时空卷积网络的od市场航空客流量预测方法,解决了采用时空卷积网络对航空客流量进行预测,实现同一区域多个出发机场到同一目的机场多个od市场客流量的同时预测的技术问题,本发明首度将时空卷积网络应用于航空客流量预测领域,实现同一区域多个出发机场到同一目的机场多个od市场客流量的同时预测,给航空客流量预测提供了一种新思路;本发明将卷积网络中的卷积核看作是捕获od客流空间相关性的媒介,则一个卷积层中包含多个卷积核就能准确捕获od客流在空间维度上复杂的潜在特征关系,提升预测效果;本发明综合考虑了od客流量的时间依赖性、空间相关性以及外部影响因素的作用,以rmse作为模型的评估标准,以长三角16个主要机场到广州白云国际机场的od客流量数据为例,预测模型对比arima(自回归滑动平均模型)、svr(支持向量回归)、elman神经网络和lstm(长短期记忆网络),拟合效果更优。
[0097]
在本发明中,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出
或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0098]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0099]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0100]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0101]
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0102]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1