一种基于时空图卷积网络的公共交通流量预测方法

文档序号:29137389发布日期:2022-03-05 02:09阅读:121来源:国知局
一种基于时空图卷积网络的公共交通流量预测方法

1.本发明涉及交通流量预测领域,具体涉及时空图卷积网络用于回归问题及其实际应用于公共交通流量预测领域。


背景技术:

2.近年来,随着城市化的进一步发展,智能交通系统对城市管理起到了重要作用,而公共交通流量预测是智能交通系统中的关键一环。城市公共交通运行速度和状态会直接影响乘客的乘坐体验和交通运输容量。若能够对公共交通运输状态进行准确预测,则有助于规划交通路线和动态管理,方便百姓出行,提高生活质量。
3.实际公共交通流量通常具有非常高的非线性和复杂性,单纯使用已有的时间序列算法只能够简单预测车站某时段内乘客流量,无法考虑车站间的空间关系。若将车站网络以图的形式建模,然后采用基于图的深度学习方法预测交通流量则只考虑了空间关系,忽略了动态时空相关性。
4.通过整合以时间序列形式展现的交通流量数据以及以图的形式建模的车站网络数据,即结合循环神经网络和图卷积神经网络——时空图卷积网络,统筹交通流量的动态时空相关性,可以较好的预测某时段内经过某站点的交通流量。但目前的时空图卷积方法都是先将站点网络建模为普通无向图,边的权重由节点间的物理距离决定,这不符合实际车站分布情况,因为现实生活中有大量的站点相距不远却难以直接到达。因此,我们需要改变建模思路,寻求更合适的建模方式。


技术实现要素:

5.针对上述情况,本发明提供一种基于时空图卷积网络的公共交通流量预测方法。提出的方法包括数据预处理,更合适的站点网络建模方式以及整合了循环神经网络的和图卷积神经网络的时空图卷积网络。将站点作为图中的节点,边的权重不再取决于节点间的距离而是一段时间内的车站的交通流量。考虑到不同的站点具有不同的实际意义,为每个站点都随机初始化了节点特征,并在训练过程中加以学习。对每一个时间段内的交通流量都以上述形式建模为图得到时序公共交通图后将其输入时空图卷积神经网络,便可预测未来一段时间内的公共交通流量。
6.一种基于时空图卷积网络的公共交通流量预测方法,步骤如下:
7.步骤(1)、获取公共交通流量数据并进行预处理。
8.步骤(2)、公共交通网络建模。
9.步骤(3)、构建时间序列特征;
10.步骤(4)、构建时空图卷积网络;
11.将时间序列特征a和节点特征x作为时空图卷积网络的输入。时空图卷积由图卷积网络和门控循环单元构成。
12.步骤(5)、训练时空图卷积网络;
13.步骤(6)、时空图卷积网络的测试过程;
14.训练完成后,将测试集输入在步骤(5)中保存下来的时空图卷积网络中即可得到测试结果,用于预测未来某一时间段交通流量。
15.步骤(1)具体方法如下:
16.收集三个月内某一地区地铁的乘客流量数据。以30分钟为时间窗口,统计每个时间窗口内的乘客数量以及他们的出发地和目的地。将所有数据按照6:2:2的比例划分为训练集、验证集和测试集。
17.步骤(2)具体方法如下:
18.将地铁站点作为顶点即节点,建立邻接矩阵其中n为节点数,即地铁站点数量。a
i,j
表示一个时间窗口内由站点i去往站点j的乘客数量,得到有向有权无环图。将该图命名为流量共现图,其邻接矩阵为流量共现矩阵。由于每个所处地理位置不同,其周围地域功能不同,故随机初始化可学习参数作为节点特征,其中d为特征维度。
19.步骤(3)具体方法如下:
20.考虑到乘客数量变化的周期性和实时性,选择邻接、日、周乘客流量数据作为特征。邻接特征属于实时特征,由被预测时间窗口邻接的tn个时间窗口的流量共现矩阵拼接后得到日特征属于周期特征,由前td天与被预测时间窗口处于相同时段的流量共现矩阵拼接后得到周特征同样属于周期特征,由前tw周与被预测时间窗口处于相同时段的流量共现矩阵拼接后得到将三种特征拼接便得到最终用于训练的时间序列特征其中||表示拼接,t=tw+td+tn。被预测窗口的流量共现矩阵为实际值y
t

21.步骤(4)具体方法如下:
22.将时间序列特征a和节点特征x作为时空图卷积网络的输入。
23.时空图卷积由图卷积网络和门控循环单元构成。
[0024][0025]zt
=σ(gcn(a
:,t
,x;wz)+h
t-1
uz)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0026]rt
=σ(gcn(a
:,t
xwr)+h
t-1
ur)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0027][0028][0029]
其中为时间序列特征a中的第t个时间窗口的特征,是时间步t时的输入;是a
:,t
的度矩阵;h
t
是时间步t时的输出;z
t
和r
t
分别是重置门和更新门;x,wz,uz,wr,ur为可学习参数;σ是激活函数,

为哈达玛积。被预测时间段的流量共现矩阵由最后一个时间步的输出h-1
经过全连接层得到:
[0030]yp
=σ(h-1
w+b)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0031]
其中w和b为可学习参数。
[0032]
步骤(5)具体方法如下:
[0033]
对时空图卷积网络进行训练。按照步骤(1)所述的比例选取训练集和验证集。采用adam优化器,mse损失函数。在验证过程中将预测得到的流量共现矩阵y
p
和实际流量共现矩阵y
p
展平为一维数据后使用mse、rmse和mape进行评价,将性能最优的网络参数保存下来。
[0034]
本发明有益成果如下:
[0035]
针对复杂的公共交通流量预测问题,该方法能够高效准确地预测未来一段时间内乘坐公共交通工具出行的乘客流量,便于规划线路,错开高峰时段,提高乘坐体验,提升百姓生活质量。
附图说明
[0036]
图1为本发明中的流量共现图及流量共现矩阵示意图;
[0037]
图2为本发明中的时空图卷积示意图。
具体实施方式
[0038]
以下结合附图及实施例,对本发明进一步详细说明。
[0039]
一种基于时空图卷积网络的公共交通流量预测方法,步骤如下:
[0040]
步骤(1)、获取公共交通流量数据并进行预处理。
[0041]
收集三个月内某一地区地铁的乘客流量数据。以30分钟为时间窗口,统计每个时间窗口内的乘客数量以及他们的出发地和目的地。将所有数据按照6:2:2的比例划分为训练集、验证集和测试集。
[0042]
步骤(2)、公共交通网络建模。
[0043]
在计算机科学中,图是由顶点和边两部分组成的一种数据结构。图g能够通过顶点集合v和它包含的边e来描述,即:
[0044]
g=(v,e)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0045]
顶点也称节点,两个术语是可以互换的。
[0046]
将地铁站点作为顶点即节点,建立邻接矩阵其中n为节点数,即地铁站点数量。a
i,j
表示一个时间窗口内由站点i去往站点j的乘客数量,得到有向有权无环图。将该图命名为流量共现图,其邻接矩阵为流量共现矩阵。由于每个所处地理位置不同,其周围地域功能不同,故随机初始化可学习参数作为节点特征,其中d为特征维度。
[0047]
步骤(3)、构建时间序列特征;
[0048]
考虑到乘客数量变化的周期性和实时性,选择邻接、日、周乘客流量数据作为特征。邻接特征属于实时特征,由被预测时间窗口邻接的tn个时间窗口的流量共现矩阵拼接后得到日特征属于周期特征,由前td天与被预测时间窗口处于相同时段的流量共现矩阵拼接后得到周特征同样属于周期特征,由前tw周与被预测时间窗口处于相同时段的流量共现矩阵拼接后得到将三种特征拼接便得到最终用于训练的时间序列特征其中||表示拼接,t=tw+td+tn。被预测窗口的流量共现矩阵为实际值y
t

[0049]
步骤(4)、构建时空图卷积网络;
[0050]
将时间序列特征a和节点特征x作为时空图卷积网络的输入。时空图卷积由图卷积网络和门控循环单元构成。当前的输入为a
:,t
和上一个时刻传递下来的隐状态h
t-1
,这个隐状态包含了之前时刻的相关信息。结合a
:,t
和h
t-1
,gru会得到当前时刻的输出和传递给下一个时刻的隐状态h
t

[0051]
具体说来,首先通过上一个时刻传递下来的隐状态h
t-1
和当前时刻的输入a
:,t
来获取这一时刻更新门z
t
(式(9))和重置门r
t
(式(10))的状态。在有了门控信号后,使用重置门得到重置之后的数据h
t-1'
=h
t-1
⊙rt
,再将经过一个全连接层后h
t-1'
与经过图卷积层的输入a
:,t
相加,然后通过一个tanh激活函数将数据缩放到(-1,1)的范围内,得到表示当前时刻的隐藏信息(式(11))。最后使用更新门选择记忆过去时刻的信息多一些还是遗忘过去时刻信息多一些(式(12))。更新门(z
t
)大小越接近1,代表记忆的信息越多;越接近0,代表遗忘的信息越多。需要说明的是,最初时刻的隐状态h0被初始化为0。
[0052][0053]zt
=σ(gcn(a
:,t
,x;wz)+h
t-1
uz)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0054]rt
=σ(gcn(a
:,t
xwr)+h
t-1
ur)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0055][0056][0057]
其中为时间序列特征a中的第t个时间窗口的特征,是时间步t时的输入;是a
:,t
的度矩阵;h
t
是时间步t时的输出;z
t
和r
t
分别是重置门和更新门;x,wz,uz,wr,ur为可学习参数;σ是激活函数,

为哈达玛积。被预测时间段的流量共现矩阵由最后一个时间步的输出h-1
经过全连接层得到:
[0058]yp
=σ(h-1
w+b)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0059]
其中w和b为可学习参数。
[0060]
步骤(5)、训练时空图卷积网络;
[0061]
对时空图卷积网络进行训练。按照步骤(1)所述的比例选取训练集和验证集。采用adam优化器,mse损失函数。在验证过程中将预测得到的流量共现矩阵y
p
和实际流量共现矩阵y
p
展平为一维数据后使用mse、rmse和mape进行评价,将性能最优的网络参数保存下来。
[0062]
步骤(6)、时空图卷积网络的测试过程;
[0063]
训练完成后,将测试集输入在步骤(5)中保存下来的时空图卷积网络中即可得到测试结果,用于预测未来某一时间段交通流量。
[0064]
实施例1:
[0065]
步骤1:收集杭州市二零二一年七月、八月、九,月总计三个月所有地铁乘客出行记录,包括出发站和到达站,出入站时间。截止2021年9月,杭州共有180个地铁站。以30分钟为时间窗口,统计每个时间窗口内的乘客数量以及他们的出发站和目的站。由此得到每三十分钟的所有乘客流向。将所有数据按照6:2:2的比例划分为训练集、验证集和测试集。
[0066]
步骤2:将所有地铁站点都作为节点,建立邻接矩阵其中n=180。a
i,j
表示一个时间窗口内由站点i去往站点j的乘客数量,得到流量共现图,其邻接矩阵为流量共现矩阵(如图1所示)。由于每个地铁站点周围地域功能不同,故为每个地铁站点随机初始化可学习参数作为节点特征,其中d=64。
[0067]
步骤3:考虑到乘客数量变化的周期性和实时性,选择邻接、日、周乘客流量数据作为特征。邻接特征属于实时特征,由被预测时间窗口邻接的三个小时共六个时间窗口的流量共现矩阵拼接后得到故tn=6。日特征属于周期特征,由前4天与被预测时间窗口处于相同时段的流量共现矩阵拼接后得到故td=4。周特征同样属于周期特征,由前两周与预测时间窗口处于相同时段的流量共现矩阵拼接后得到故tn=2。将三种特征拼接便得到最终用于训练的时间序列特征其中||表示拼接,t=tw+td+tn=12。被预测窗口的流量共现矩阵为实际值y
t

[0068]
步骤4:将时间序列特征a和节点特征x作为时空图卷积网络的输入。时空图卷积由图卷积网络和门控循环单元构成(图2)。当前的输入为a
:,t
和上一个时刻传递下来的隐状态h
t-1
,这个隐状态包含了之前时刻的相关信息。结合a
:,t
和h
t-1
,gru会得到当前时刻的输出和传递给下一个时刻的隐状态h
t

[0069]
具体说来,首先通过上一个时刻传递下来的隐状态h
t-1
和当前时刻的输入a
:,t
来获取这一时刻更新门z
t
(式(14))和重置门r
t
(式(15))的状态。在有了门控信号后,使用重置门得到重置之后的数据h
t-1'
=h
t-1
⊙rt
,再将经过一个全连接层后h
t-1'
与经过图卷积层的输入a
:,t
相加,然后通过一个tanh激活函数将数据缩放到(-1,1)的范围内,得到表示当前时刻的隐藏信息(式(16))。最后使用更新门选择记忆过去时刻的信息多一些还是遗忘过去时刻信息多一些(式(17))。更新门(z
t
)大小越接近1,代表记忆的信息越多;越接近0,代表遗忘的信息越多。需要说明的是,最初时刻的隐状态h0被初始化为0。
[0070][0071][0072][0073][0074]
其中为时间序列特征a中的第t个时间窗口的特征,是时间步t时的输入;h
t
是时间步t时的输出;z
t
和r
t
分别是重置门和更新门;x,wz,uz,wr,ur为可学习参数;σ是sigmoid激活函数,

为哈达玛积。t∈[1,12],h
t-1
初始化为被预测时间段的流量共现矩阵由最后一个时间步的输出h-1
经过全连接层得到
[0075]yp
=σ(h-1
w+b)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0076]
其中w和b为可学习参数,σ为relu激活函数。
[0077]
步骤5:按照步骤1所述的比例选取训练集和验证集。采用adam优化器,mse损失函
数。在验证过程中使用mse、rmse和mape作为评价指标,将表现最好的网络参数保存下来。
[0078]
步骤6:将采用步骤1,步骤2新搜集到的数据构建成的数据输入在步骤5中保存下来的网络中即可得到预测结果,可用来预测未来某一时间段交通流量。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1