基于时空注意力图卷积网络的交通速度预测方法和装置与流程

文档序号:27623387发布日期:2021-11-29 14:48阅读:116来源:国知局
基于时空注意力图卷积网络的交通速度预测方法和装置与流程

1.本发明涉及智能交通领域和深度学习领域,更具体的,涉及一种基于时空注意力图卷积网络的交通速度预测方法和相关装置。


背景技术:

2.随着人均收入的不断提高,城市交通变得越来越拥挤,交通预测也成为了一个越来越重要的研究课题,准确、及时地对交通情况进行预测不仅对交管部门的管理提供了一个有效的治理手段,同时也为出行者提供了合理的规划。交通预测对于城市规划、交通管理、交通治理和财产安全都具有重要意义。然而,由于交通情况在时间上和空间上都具有复杂性,在时空预测上一直都是一个具有挑战性的课题。
3.早期的交通速度主要是基于一些统计方法或者是简单的机器学习方法。其中具有代表性的就是自回归综合移动平均法(arima)、向量自回归法(var)、k最近邻法(knn)和支持向量回归(svr)。这些方法虽然能预测交通速度,但随着交通路网的空间复杂性的提升,以及在时间上的关联性的提升,导致预测的精度较低。传统的交通速度预测很难挖掘到时间以及空间上的关联性,极大地限制了在时空挖掘上的性能。
4.因此,如何设计一种综合考虑交通状态下的时空关联性的速度预测方法,是本领域技术人员亟待解决的技术问题。


技术实现要素:

5.鉴于上述问题,本发明的目的是提供一种基于时空注意力图卷积网络的交通速度预测方法和相关装置,使得对于交通速度的预测更具有准确性。
6.本发明第一方面提供了一种基于时空注意力图卷积网络的交通速度预测方法,包括以下步骤:
7.对采集到现有速度数据集进行采样,获得有关时间序列的分量数据矩阵;
8.构建时间注意力网络;
9.将所述分量数据矩阵输入到所述时间注意力网络中,得到时间关联矩阵;
10.构建空间注意力网络;
11.将所述时间关联矩阵输入到所述空间注意力网络中,融合得到时空关联矩阵;
12.将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练;
13.通过训练好的模型进行速度预测。
14.本方案中,所述将所述分量数据矩阵输入到所述时间注意力网络中,得到时间关联矩阵具体包括:
15.将所述分量数据矩阵输入到所述时间注意力网络中,得到时间注意力矩阵t:
16.17.其中,k
e
、l1、l2、l3、v
e
为可学习的参数,σ表示sigmoid激活函数,为所述分量数据矩阵,c
r
‑1表示第r层输入数据的通道数,t
r
‑1表示第r层输入数据时间维度的长度;
18.所述时间注意力矩阵t经过归一化后根据所述时间注意力矩阵捕捉节点之间的关联强度:
[0019][0020]
t
i,j
反映时间i,j之间的时间关联强度,与所述分量数据矩阵相乘得到时间关联矩阵
[0021][0022]
本方案中,所述将所述时间关联矩阵输入到所述空间注意力网络中,融合得到时空关联矩阵具体包括:
[0023]
将所述时间关联矩阵输入到所述空间注意力网络中,得到时空注意矩阵s:
[0024][0025]
其中,k
s
、h1、h2、h3、v
s
为可学习的参数;
[0026]
根据所述时空注意矩阵s计算得到时间关联矩阵s


[0027][0028]
本方案中,所述将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练,得到预测速度具体包括:
[0029]
将路网拓扑矩阵输入到拉普拉斯矩阵l中:
[0030][0031]
其中,a表示输入的路网拓扑矩阵,d为度矩阵,具体为对角矩阵,对角线的元素为a
ij
代表的是第i行j列的元素;
[0032]
所述图卷积网络具体为切比雪夫多项式形式的图卷积网络,表示为:
[0033][0034]
其中,*g表示一个图的卷积操作,是缩放后的归一化拉普拉斯矩阵,λ
max
是l的最大特征值,θ

k
(k=0,1,

k)是切比雪夫多项式的第k项的系数,为可学习参数;
[0035]
k阶的切比雪夫多项式的定义如下:
[0036]
t
k
(x)=2xt
k
‑1(x)

t
k
‑2(x);
[0037]
结合输入的路网拓扑矩阵与所述时空关联矩阵,得到最终的图卷积公式:
[0038][0039]
对所述图卷积公式进行模型训练后,通过训练好的模型进行速度预测。
[0040]
本方案中,所述对现有的速度数据集进行采样,获得有关时间序列的分量数据矩阵具体包括:
[0041]
对现有的速度数据集进行三个维度的采样,分别获得有关时间序列的时分量数据矩阵、天分量数据矩阵和周分量数据矩阵;
[0042]
所述将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练具体为:
[0043]
将路网拓扑矩阵输入到图卷积网络,并分别与三个维度的所述时空关联矩阵进行结合,且采用三个维度的分量数据矩阵分别进行模型训练,并进行融合输出。
[0044]
本方案中,在所述通过训练好的模型进行速度预测之前,还包括:
[0045]
构建的损失函数
[0046]
其中,y
t
表示实际交通速度,表示预测速度,l
reg
为避免过度拟合参数,ω为用于减小预测误差的超参数。
[0047]
本发明第二方面还提供一种基于时空注意力图卷积网络的交通速度预测系统,包括存储器和处理器,所述存储器中包括基于时空注意力图卷积网络的交通速度预测方法程序,所述基于时空注意力图卷积网络的交通速度预测方法程序被所述处理器执行时实现如下步骤:
[0048]
对采集到现有速度数据集进行采样,获得有关时间序列的分量数据矩阵;
[0049]
构建时间注意力网络;
[0050]
将所述分量数据矩阵输入到所述时间注意力网络中,得到时间关联矩阵;
[0051]
构建空间注意力网络;
[0052]
将所述时间关联矩阵输入到所述空间注意力网络中,融合得到时空关联矩阵;
[0053]
将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练;
[0054]
通过训练好的模型进行速度预测。
[0055]
本方案中,所述对现有的速度数据集进行采样,获得有关时间序列的分量数据矩阵具体包括:
[0056]
对现有的速度数据集进行三个维度的采样,分别获得有关时间序列的时分量数据矩阵、天分量数据矩阵和周分量数据矩阵;
[0057]
所述将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练具体为:
[0058]
将路网拓扑矩阵输入到图卷积网络,并分别与三个维度的所述时空关联矩阵进行结合,且采用三个维度的分量数据矩阵分别进行模型训练,并进行融合输出。
[0059]
本方案中,在通过训练好的模型进行速度预测之前,还包括:
[0060]
建的损失函数
[0061]
其中,y
t
表示实际交通速度,表示预测速度,l
reg
为避免过度拟合参数,ω为用于减小预测误差的超参数。
[0062]
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括机器的一种基于时空注意力图卷积网络的交通速度预测方法程序,所述基于时空注意力
图卷积网络的交通速度预测方法程序被处理器执行时,实现如上述任一项所述的一种基于时空注意力图卷积网络的交通速度预测方法的步骤。
[0063]
本发明公开的一种基于时空注意力图卷积网络的交通速度预测方法和相关装置,方法包括:对采集到现有速度数据集进行采样,获得有关时间序列的分量数据矩阵;构建时间注意力网络;将分量数据矩阵输入到时间注意力网络中,得到时间关联矩阵;构建空间注意力网络;将时间关联矩阵输入到空间注意力网络中,融合得到时空关联矩阵;将路网拓扑矩阵输入到图卷积网络,并与时空关联矩阵进行结合,进行模型训练;通过训练好的模型进行速度预测。通过将时间注意力网络与空间注意力网络融合形成时空注意力网络,提取交通网络在时间上跟空间上的关联性,同时结合图卷积网络不断融合邻接节点的信息,来对交通速度进行预测,提升对于交通速度预测的准确性。
附图说明
[0064]
图1示出了本技术一种基于时空注意力图卷积网络的交通速度预测方法的流程图;
[0065]
图2示出了本发明一种基于时空注意力图卷积网络的交通速度预测系统的框图。
具体实施方式
[0066]
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
[0067]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
[0068]
图1示出了本技术一种基于时空注意力图卷积网络的交通速度预测方法的流程图。
[0069]
如图1所示,本技术公开了一种基于时空注意力图卷积网络的交通速度预测方法,包括以下步骤:
[0070]
s102,对采集到现有速度数据集进行采样,获得有关时间序列的分量数据矩阵;
[0071]
s104,构建时间注意力网络;
[0072]
s106,将所述分量数据矩阵输入到所述时间注意力网络中,得到时间关联矩阵;
[0073]
s108,构建空间注意力网络;
[0074]
s110,将所述时间关联矩阵输入到所述空间注意力网络中,融合得到时空关联矩阵;
[0075]
s112,将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练;
[0076]
s114,通过训练好的模型进行速度预测。
[0077]
需要说明的是,首先,根据已经得到的数据进行数据采样,获取有关时间序列的数据,在采样的数据上提取出速度特征;构建一个时间注意力网络,将采样得到的数据输入到构建的时间注意力网络,提取速度之间的时间关联性。然后构建一个空间注意力网络,将得
到的结果进一步处理后的结果作为输入,输入到构建的空间注意力网络,融合提取时空关联性。
[0078]
需要说明的是,接下来,根据路网矩阵,构建一种时空注意力图卷积模型,利用图卷积网络gcn训练得到的时空关联数据,同时与路网拓补图结合,进行模型训练。最后根据训练好的模型进行速度预测。
[0079]
本发明所提供的一种基于时空注意力图卷积网络的交通速度预测方法,通过将时间注意力网络与空间注意力网络融合形成时空注意力网络,提取交通网络在时间上跟空间上的关联性,同时结合图卷积网络(gcn)不断融合邻接节点的信息,来对交通速度进行预测,通过捕捉交通网络间的时空关联性来提升对于交通速度预测的准确性。
[0080]
根据本发明实施例,所述对现有的速度数据集进行采样,获得有关时间序列的分量数据矩阵具体包括:
[0081]
对现有的速度数据集进行三个维度的采样,分别获得有关时间序列的时分量数据矩阵、天分量数据矩阵和周分量数据矩阵;
[0082]
所述将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练具体为:
[0083]
将路网拓扑矩阵输入到图卷积网络,并分别与三个维度的所述时空关联矩阵进行结合,且采用三个维度的分量数据矩阵分别进行模型训练,并进行融合输出。
[0084]
需要说明的是,根据数据集采集的规律,在数据集上对三个时间维度的数据进行采集:分别采集三个不同时间维度的数据具体为y
h
、y
d
和y
w
,其中y
h
代表最近时间的时分量数据矩阵,y
d
代表最近天分量数据矩阵,y
w
代表最近周分量数据矩阵,这三个时间组件共享相同的网络结构。可以根据采样数据每5分钟采集一次的规律性,划分出三个不同时间维度的采样批次。对采样的数据进行处理,提取速度特征,依据速度特征构建训练集和测试集。本发明实施例中,具体可以是预测未来一小时的交通速度,因此时间窗口取12,并在这基础上取出最后12个时间步为测试样本。
[0085]
根据本发明实施例,所述将所述分量数据矩阵输入到所述时间注意力网络中,得到时间关联矩阵具体包括:
[0086]
将所述分量数据矩阵输入到所述时间注意力网络中,得到时间注意力矩阵t:
[0087][0088]
其中,k
e
、l1、l2、l3、v
e
为可学习的参数,σ表示sigmoid激活函数,为所述分量数据矩阵,c
r
‑1表示第r层输入数据的通道数,t
r
‑1表示第r层输入数据时间维度的长度;
[0089]
所述时间注意力矩阵t经过归一化后根据所述时间注意力矩阵捕捉节点之间的关联强度:
[0090][0091]
t
i,j
反映时间i,j之间的时间关联强度,与所述分量数据矩阵相乘得到时间关联矩阵
[0092][0093]
需要说明的是,在时间维度上,不同时间段的交通条件之间存在相关性,在不同的情况下,相关性也有变化。同样地,使用时间注意力机制自适应地捕捉数据之间的时间关联性。
[0094]
构建一个时间注意力网络,主要方式如下:将采样得到的时间序列的节点速度矩阵输入到构建的时间注意力网络,得到
[0095][0096]
根据当前层的输入,动态计算时间注意矩阵t,其中,k
e
、l1、l2、l3、v
e
为可学习的参数。σ表示sigmoid激活函数,定义如下:
[0097][0098]
代表的是第r层的时间关联模块。c
r
‑1表示第r层输入数据的通道数,t
r
‑1表示第r层输入数据时间维度的长度。
[0099]
t矩阵经过归一化然后根据计算出的时间注意矩阵捕捉节点之间的关联强度:
[0100][0101]
t
i,j
动态反映时间i,j之间的时间关联强度,同时用原采样矩阵相乘得到完整时间关联矩阵:
[0102][0103]
根据本发明实施例,所述将所述时间关联矩阵输入到所述空间注意力网络中,融合得到时空关联矩阵具体包括:
[0104]
将所述时间关联矩阵输入到所述空间注意力网络中,得到时空注意矩阵s:
[0105][0106]
其中,k
s
、h1、h2、h3、v
s
为可学习的参数;
[0107]
根据所述时空注意矩阵s计算得到时间关联矩阵s


[0108][0109]
需要说明的是,在空间维度上,不同位置的交通条件相互影响。本发明实施例使用了一种空间注意机制自适应地捕捉空间维度中节点之间的动态相性,将带有时间注意力的矩阵与空间注意力网络融合得到时空注意力矩阵。
[0110]
将时间注意力网络得到的输出(时间关联矩阵)输入到空间注意力网络进一步融合得到时空注意矩阵s:
[0111][0112]
根据时间注意矩阵的输入,动态计算时空注意s,其中,其中k
s
、h1、h2、h3、v
s
为可学习的参数。
[0113]
根据计算出的时空注意矩阵捕捉节点之间的关联强度:
[0114][0115]
s

动态反映时间i,j之间的时空关联强度;
[0116]
根据得到的时空关联矩阵s

与输入的路网邻接矩阵动态调整权值生成节点的注意力系数。通过时空关联,更能把握好路网速度在时间空间上的关联性,在速度的预测上具有更宽阔的视野。
[0117]
根据本发明实施例,所述将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练,得到预测速度具体包括:
[0118]
将路网拓扑矩阵输入到拉普拉斯矩阵l中:
[0119][0120]
其中,a表示输入的路网拓扑矩阵,d为度矩阵,具体为对角矩阵,对角线的元素为a
ij
代表的是第i行j列的元素;
[0121]
所述图卷积网络具体为切比雪夫多项式形式的图卷积网络,表示为:
[0122][0123]
其中,*g表示一个图的卷积操作,是缩放后的归一化拉普拉斯矩阵,λ
max
是l的最大特征值,θ

k
(k=0,1,

k)是切比雪夫多项式的第k项的系数,为可学习参数;
[0124]
k阶的切比雪夫多项式的定义如下:
[0125]
t
k
(x)=2xt
k
‑1(x)

t
k
‑2(x);
[0126]
结合输入的路网拓扑矩阵与所述时空关联矩阵,得到最终的图卷积公式:
[0127][0128]
对所述图卷积公式进行模型训练后,通过训练好的模型进行速度预测。
[0129]
需要说明的是,基于图卷积网络的交通速度预测就是根据历史交通数据来预测未来的交通状况,通过时空关联矩阵与路网拓扑矩阵来构建时空注意力图卷积网络(sta

gcn)模型。
[0130]
为了捕捉路网的关联性,本发明采用切比雪夫多项式的图卷积聚合邻居节点的信息。根据路网使用拉普拉斯矩阵:
[0131][0132]
a表示输入的路网拓扑矩阵,d是度矩阵,是一个对角矩阵,对角线的元素为a
ij
代表的是第i行j列的元素。
[0133]
切比雪夫多项式形式的图卷积网络表示为:其中,*g表示一个图的卷积操作。由于图信号的卷积运算等于已被转换为光谱域的这些信号的乘积图傅里叶变换,上述公式可以理解为傅里叶将g
θ
和x分别转换为光谱域,然后将它们变换的再乘并进行傅里叶逆变换,得到卷积运算的最终结果。然而,直接对拉普拉斯矩阵进行特征值分解是很困难的,尤其是对于路网来说。因此,本发明采用切比雪夫多项式近似但有效地
解决了这个问题,是缩放后的归一化拉普拉斯矩阵,λ
max
是l的最大特征值,θ

k
(k=0,1,

k)是切比雪夫多项式的第k项的系数,它是可学习的参数,是在模型训练过程中通过优化损失函数不断迭代更新的。k阶的切比雪夫多项式的定义如下:
[0134]
t
k
(x)=2xt
k
‑1(x)

t
k
‑2(x);
[0135]
利用切比雪夫多项式的近似展开来求解这个公式对应于提取周围每个节点的信息。
[0136]
结合输入的路网邻接矩阵与得到的时空关联矩阵,得到最终的图卷积公式:
[0137][0138]
通过时空注意力机制提取路网在时空上的关联性,结合路网矩阵进行建模,对三个不同时间维度的网络进行训练。
[0139]
根据三个不同时间维度的相同网络学习后,融合输出:
[0140][0141]
对于三个时间维度来说,预测的节点对每个维度的依赖不同,因此每个节点的三个分量的影响权重不同,应从历史数据中学习。其中

是哈达达玛积。w
h
、w
d
和w
w
是学习参数,反映了三维时间分量对预测目标的影响程度。跟据最后的融合输出得到预测速度。
[0142]
根据本发明实施例,在所述通过训练好的模型进行速度预测之前,还包括:
[0143]
构建的损失函数
[0144]
其中,y
t
表示实际交通速度,表示预测速度,l
reg
为避免过度拟合参数,ω为用于减小预测误差的超参数。
[0145]
需要说明的是,根据时空注意力图卷积模型的预测速度与真实速度的差异比较,提出一种新的损失函数计算方法,在每次迭代时不断更新,加快模型训练速度,该方法可以使三个不同时间维度的网络同时收敛。
[0146]
构建的损失函数定义如下:
[0147]
构建的损失函数为
[0148]
其中y
t
表示实际交通速度,表示预测速度,用于最小化实际交通速度与预测之间的误差。l
reg
有助于避免过度拟合问题,而ω是一个超参数,最大限度地减小实际交通速度与实际交通速度之间的误差预测。
[0149]
时空注意力机制能够根据输入数据中各个节点的特征学习到节点之间的隐含时空相关性,由于节点之间的注意力分数是根据输入动态计算的,因此当路网的拓扑结构发生变化时它也能够捕捉到;另外,由于空间自注意力集中聚合了所有节点的信息,因此它也能够从全局捕获路网的空间相关性。
[0150]
图2示出了本发明一种基于时空注意力图卷积网络的交通速度预测系统的框图。
[0151]
如图2所示,本发明公开了一种基于时空注意力图卷积网络的交通速度预测系统2,包括存储器21和处理器22,所述存储器21中包括基于时空注意力图卷积网络的交通速度预测方法程序,所述基于时空注意力图卷积网络的交通速度预测方法程序被所述处理器22执行时实现如下步骤:
[0152]
对采集到现有速度数据集进行采样,获得有关时间序列的分量数据矩阵;
[0153]
构建时间注意力网络;
[0154]
将所述分量数据矩阵输入到所述时间注意力网络中,得到时间关联矩阵;
[0155]
构建空间注意力网络;
[0156]
将所述时间关联矩阵输入到所述空间注意力网络中,融合得到时空关联矩阵;
[0157]
将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练;
[0158]
通过训练好的模型进行速度预测。
[0159]
需要说明的是,首先,根据已经得到的数据进行数据采样,获取有关时间序列的数据,在采样的数据上提取出速度特征;构建一个时间注意力网络,将采样得到的数据输入到构建的时间注意力网络,提取速度之间的时间关联性。然后构建一个空间注意力网络,将得到的结果进一步处理后的结果作为输入,输入到构建的空间注意力网络,融合提取时空关联性。
[0160]
需要说明的是,接下来,根据路网矩阵,构建一种时空注意力图卷积模型,利用图卷积网络gcn训练得到的时空关联数据,同时与路网拓补图结合,进行模型训练。最后根据训练好的模型进行速度预测。
[0161]
本发明所提供的一种基于时空注意力图卷积网络的交通速度预测方法,通过将时间注意力网络与空间注意力网络融合形成时空注意力网络,提取交通网络在时间上跟空间上的关联性,同时结合图卷积网络(gcn)不断融合邻接节点的信息,来对交通速度进行预测,通过捕捉交通网络间的时空关联性来提升对于交通速度预测的准确性。
[0162]
根据本发明实施例,所述对现有的速度数据集进行采样,获得有关时间序列的分量数据矩阵具体包括:
[0163]
对现有的速度数据集进行三个维度的采样,分别获得有关时间序列的时分量数据矩阵、天分量数据矩阵和周分量数据矩阵;
[0164]
所述将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练具体为:
[0165]
将路网拓扑矩阵输入到图卷积网络,并分别与三个维度的所述时空关联矩阵进行结合,且采用三个维度的分量数据矩阵分别进行模型训练,并进行融合输出。
[0166]
需要说明的是,根据数据集采集的规律,在数据集上对三个时间维度的数据进行采集:分别采集三个不同时间维度的数据具体为y
h
、y
d
和y
w
,其中y
h
代表最近时间的时分量数据矩阵,y
d
代表最近天分量数据矩阵,y
w
代表最近周分量数据矩阵,这三个时间组件共享相同的网络结构。可以根据采样数据每5分钟采集一次的规律性,划分出三个不同时间维度的采样批次。对采样的数据进行处理,提取速度特征,依据速度特征构建训练集和测试集。本发明实施例中,具体可以是预测未来一小时的交通速度,因此时间窗口取12,并在这基础上取出最后12个时间步为测试样本。
[0167]
根据本发明实施例,所述将所述分量数据矩阵输入到所述时间注意力网络中,得到时间关联矩阵具体包括:
[0168]
将所述分量数据矩阵输入到所述时间注意力网络中,得到时间注意力矩阵t:
[0169]
[0170]
其中,k
e
、l1、l2、l3、v
e
为可学习的参数,σ表示sigmoid激活函数,为所述分量数据矩阵,c
r
‑1表示第r层输入数据的通道数,t
r
‑1表示第r层输入数据时间维度的长度;
[0171]
所述时间注意力矩阵t经过归一化后根据所述时间注意力矩阵捕捉节点之间的关联强度:
[0172][0173]
t
i,j
反映时间i,j之间的时间关联强度,与所述分量数据矩阵相乘得到时间关联矩阵
[0174][0175]
需要说明的是,在时间维度上,不同时间段的交通条件之间存在相关性,在不同的情况下,相关性也有变化。同样地,使用时间注意力机制自适应地捕捉数据之间的时间关联性。
[0176]
构建一个时间注意力网络,主要方式如下:将采样得到的时间序列的节点速度矩阵输入到构建的时间注意力网络,得到
[0177][0178]
根据当前层的输入,动态计算时间注意矩阵t,其中,k
e
、l1、l2、l3、v
e
为可学习的参数。σ表示sigmoid激活函数,定义如下:
[0179][0180]
代表的是第r层的时间关联模块。c
r
‑1表示第r层输入数据的通道数,t
r
‑1表示第r层输入数据时间维度的长度。
[0181]
t矩阵经过归一化然后根据计算出的时间注意矩阵捕捉节点之间的关联强度:
[0182][0183]
t
i,j
动态反映时间i,j之间的时间关联强度,同时用原采样矩阵相乘得到完整时间关联矩阵:
[0184][0185]
根据本发明实施例,所述将所述时间关联矩阵输入到所述空间注意力网络中,融合得到时空关联矩阵具体包括:
[0186]
将所述时间关联矩阵输入到所述空间注意力网络中,得到时空注意矩阵s:
[0187][0188]
其中,k
s
、h1、h2、h3、v
s
为可学习的参数;
[0189]
根据所述时空注意矩阵s计算得到时间关联矩阵s


[0190][0191]
需要说明的是,在空间维度上,不同位置的交通条件相互影响。本发明实施例使用了一种空间注意机制自适应地捕捉空间维度中节点之间的动态相性,将带有时间注意力的矩阵与空间注意力网络融合得到时空注意力矩阵。
[0192]
将时间注意力网络得到的输出(时间关联矩阵)输入到空间注意力网络进一步融合得到时空注意矩阵s:
[0193][0194]
根据时间注意矩阵的输入,动态计算时空注意s,其中,其中k
s
、h1、h2、h3、v
s
为可学习的参数。
[0195]
根据计算出的时空注意矩阵捕捉节点之间的关联强度:
[0196][0197]
s

动态反映时间i,j之间的时空关联强度;
[0198]
根据得到的时空关联矩阵s

与输入的路网邻接矩阵动态调整权值生成节点的注意力系数。通过时空关联,更能把握好路网速度在时间空间上的关联性,在速度的预测上具有更宽阔的视野。
[0199]
根据本发明实施例,所述将路网拓扑矩阵输入到图卷积网络,并与所述时空关联矩阵进行结合,进行模型训练,得到预测速度具体包括:
[0200]
将路网拓扑矩阵输入到拉普拉斯矩阵l中:
[0201][0202]
其中,a表示输入的路网拓扑矩阵,d为度矩阵,具体为对角矩阵,对角线的元素为a
ij
代表的是第i行j列的元素;
[0203]
所述图卷积网络具体为切比雪夫多项式形式的图卷积网络,表示为:
[0204][0205]
其中,*g表示一个图的卷积操作,是缩放后的归一化拉普拉斯矩阵,λ
max
是l的最大特征值,θ

k
(k=0,1,

k)是切比雪夫多项式的第k项的系数,为可学习参数;
[0206]
k阶的切比雪夫多项式的定义如下:
[0207]
t
k
(x)=2xt
k
‑1(x)

t
k
‑2(x);
[0208]
结合输入的路网拓扑矩阵与所述时空关联矩阵,得到最终的图卷积公式:
[0209][0210]
对所述图卷积公式进行模型训练后,通过训练好的模型进行速度预测。
[0211]
需要说明的是,基于图卷积网络的交通速度预测就是根据历史交通数据来预测未来的交通状况,通过时空关联矩阵与路网拓扑矩阵来构建sta

gcn模型。
[0212]
为了捕捉路网的关联性,本发明采用切比雪夫多项式的图卷积聚合邻居节点的信
息。根据路网使用拉普拉斯矩阵:
[0213][0214]
a表示输入的路网拓扑矩阵,d是度矩阵,是一个对角矩阵,对角线的元素为a
ij
代表的是第i行j列的元素。
[0215]
切比雪夫多项式形式的图卷积网络表示为:其中,*g表示一个图的卷积操作。由于图信号的卷积运算等于已被转换为光谱域的这些信号的乘积图傅里叶变换,上述公式可以理解为傅里叶将g
θ
和x分别转换为光谱域,然后将它们变换的再乘并进行傅里叶逆变换,得到卷积运算的最终结果。然而,直接对拉普拉斯矩阵进行特征值分解是很困难的,尤其是对于路网来说。因此,本发明采用切比雪夫多项式近似但有效地解决了这个问题,是缩放后的归一化拉普拉斯矩阵,λ
max
是l的最大特征值,θ

k
(k=0,1,

k)是切比雪夫多项式的第k项的系数,它是可学习的参数,是在模型训练过程中通过优化损失函数不断迭代更新的。k阶的切比雪夫多项式的定义如下:
[0216]
t
k
(x)=2xt
k
‑1(x)

t
k
‑2(x);
[0217]
利用切比雪夫多项式的近似展开来求解这个公式对应于提取周围每个节点的信息。
[0218]
结合输入的路网邻接矩阵与得到的时空关联矩阵,得到最终的图卷积公式:
[0219][0220]
通过时空注意力机制提取路网在时空上的关联性,结合路网矩阵进行建模,对三个不同时间维度的网络进行训练。
[0221]
根据三个不同时间维度的相同网络学习后,融合输出:
[0222][0223]
对于三个时间维度来说,预测的节点对每个维度的依赖不同,因此每个节点的三个分量的影响权重不同,应从历史数据中学习。其中

是哈达达玛积。w
h
、w
d
和w
w
是学习参数,反映了三维时间分量对预测目标的影响程度。跟据最后的融合输出得到预测速度。
[0224]
根据本发明实施例,在所述通过训练好的模型进行速度预测之前,还包括:
[0225]
构建的损失函数
[0226]
其中,y
t
表示实际交通速度,表示预测速度,l
reg
为避免过度拟合参数,ω为用于减小预测误差的超参数。
[0227]
需要说明的是,根据时空注意力图卷积模型的预测速度与真实速度的差异比较,提出一种新的损失函数计算方法,在每次迭代时不断更新,加快模型训练速度,该方法可以使三个不同时间维度的网络同时收敛。
[0228]
构建的损失函数定义如下:
[0229]
构建的损失函数为
[0230]
其中y
t
表示实际交通速度,表示预测速度,用于最小化实际交通速度与预测之间的误差。l
reg
有助于避免过度拟合问题,而ω是一个超参数,最大限度地减小实
际交通速度与实际交通速度之间的误差预测。
[0231]
时空注意力机制能够根据输入数据中各个节点的特征学习到节点之间的隐含时空相关性,由于节点之间的注意力分数是根据输入动态计算的,因此当路网的拓扑结构发生变化时它也能够捕捉到;另外,由于空间自注意力集中聚合了所有节点的信息,因此它也能够从全局捕获路网的空间相关性。
[0232]
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括机器的一种基于时空注意力图卷积网络的交通速度预测方法程序,所述基于时空注意力图卷积网络的交通速度预测方法程序被处理器执行时,实现如上述任一项所述的一种基于时空注意力图卷积网络的交通速度预测方法的步骤。
[0233]
本发明公开的一种基于时空注意力图卷积网络的交通速度预测方法和相关装置,方法包括:对采集到现有速度数据集进行采样,获得有关时间序列的分量数据矩阵;构建时间注意力网络;将分量数据矩阵输入到时间注意力网络中,得到时间关联矩阵;构建空间注意力网络;将时间关联矩阵输入到空间注意力网络中,融合得到时空关联矩阵;将路网拓扑矩阵输入到图卷积网络,并与时空关联矩阵进行结合,进行模型训练;通过训练好的模型进行速度预测。通过将时间注意力网络与空间注意力网络融合形成时空注意力网络,提取交通网络在时间上跟空间上的关联性,同时结合图卷积网络(gcn)不断融合邻接节点的信息,来对交通速度进行预测,通过捕捉交通网络间的时空关联性来提升对于交通速度预测的准确性。
[0234]
以下为本发明所提供的一种基于时空注意力图卷积网络的交通速度预测方法的应用例:
[0235]
1.数据的预处理
[0236]
本发明在pemsd4和pemsd8数据集上进行实验。pemsd4数据集包含了2018年1月1日至2018年2月28日旧金山湾区307个环形检测器的交通数据(包括流量、速度、车道占用率)。pemsd8数据集包含了2016年7月1日至2016年8月31日圣贝纳迪诺地区170个环形检测器收集的交通数据(包括流量、速度、车道占用率)。原始数据包括两部分,一部分是交通数据,另一部分是各个传感器之间的距离。数据预处理包括切分数据集制作训练、测试样本。
[0237]
2.模型训练
[0238]
加载处理好的数据集到上述实施例中的公式(1)

公式(5),得到节点间的时空关联矩阵s


[0239]
结合输入的路网关联矩阵a,将时空关联矩阵s

输入到公式(6)进行模型训练。然后计算平均绝对误差mae、均方根误差rmse这2种性能指标,2种性能指标定义如下:
[0240][0241][0242]
其中x
i
,分别代表真实值跟预测值中的第i个元素,n表示元素总数。
[0243]
表1本发明跟ha、arima、var在pemsd4数据上的对比
[0244][0245]
表2本发明跟ha、arima、var在pemsd8数据上的对比
[0246][0247]
可以发现,本发明在各个程度上的预测都达到了较好的效果。融合了时空关联的图网络在预测的准确度上都得到了不错的效果,具有一定的参考价值和实际经济效益。
[0248]
在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
[0249]
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0250]
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0251]
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0252]
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1