一种基于多分量注意力图神经网络的交通速度预测方法

文档序号:36253305发布日期:2023-12-03 06:41阅读:51来源:国知局
一种基于多分量注意力图神经网络的交通速度预测方法

本发明属于智能交通领域,具体涉及一种基于多分量注意力图神经网络的交通速度预测方法。


背景技术:

1、随着人工智能技术的不断提高和智能交通系统的快速发展,智能交通已经成为建设智慧城市的重要方向之一,近几年,交通速度预测是在智能交通系统中受到了研究人员的关注,成为了重要的研究方向。可靠、准确的交通速度预测不仅能够为通行者选择实时准确的行驶路线提供依据,还能够进一步均衡道路的交通流量,从而有效缓解或避免交通拥堵问题。

2、交通速度预测是一个典型的时空序列预测问题,人类行驶行为在各个路段的历史数据构成一个复杂的三维数据。由于现实交通中人类的行驶行为是动态周期变化的,如周二的行驶行为与周一和上周二的行驶行为是相似的,而周一的行驶行为与周天行驶行为的相似程度偏低。因此,如何有效的建模时空序列中的时间、空间相关性和历史信息中的动态周期特征是解决此类问题的关键。

3、近年来,研究人员通过图神经网络建模交通序列中的空间相关性,在交通预测中取得了一定的成功。但以往的研究多基于最近时刻的交通状况对未来时刻进行预测,或使用固定的融合权重对多个历史信息进行融合,忽略了交通序列中动态变化的周期性。


技术实现思路

1、为了解决上述问题,本发明提出了一种基于多分量注意力图神经网络的交通速度预测方法,对交通速度的历史数据进行精细化分,对多种历史周期信息进行建模,使用注意力机制充分融合了局部和全局的时空特征,提升时空建模的细粒度;同时将多种周期信息与预测时刻的时间特征建立联系,在不同时间使用不同的周期融合权重,提升模型的预测效果。

2、本发明的技术方案如下:

3、一种基于多分量注意力图神经网络的交通速度预测方法,包括如下步骤:

4、步骤1、定义交通速度传感器的网络结构,并对历史时刻的交通速度序列进行处理,然后建立模型映射关系;

5、步骤2、根据交通速度序列的时间和空间相关性,构建多分量注意力图神经网络模型用于交通速度预测;

6、步骤3、使用步骤1处理的历史时刻的交通速度序列训练多分量注意力图神经网络模型,得到训练完成的模型;

7、步骤4、采集当前时刻前一小时的交通速度数据,并从历史时刻的交通速度序列中获取对应的日周期和周周期信息,输入训练完成的多分量注意力图神经网络模型,预测未来时间段的交通速度。

8、进一步地,步骤1中,将真实交通情境中的交通速度传感器网络建模为一个有向图,其中,表示交通速度传感器节点的集合,表示交通速度传感器节点之间连接关系的集合,表示交通速度传感器网络的邻接矩阵,表示交通速度传感器节点数量;设表示邻接矩阵中的一个特定元素,当交通速度传感器节点与交通速度传感器节点的距离低于阈值时,为1,反之为0;

9、将历史时刻的交通速度序列处理成四维时空序列,其中,表示时空序列的切片数量,表示每个切片包含的序列个数,对应交通速度传感器节点数量,即,表示每个小时中时间序列的长度,3表示每个时空序列都包含交通速度数据、时间点、周三个特征;

10、融合小时、日、周三个历史周期信息和预测时刻的时间信息进行建模,将小时周期历史信息定义为,日周期历史信息定义为,周周期历史信息定义为;其中,表示当前时间,表示每天的序列数量,表示采用历史序列的长度;表示交通速度传感器网络在时刻的交通速度信息;将预测时刻的时间信息定义为,其中,表示预测时刻的时间步长,表示交通速度传感器网络在时刻的时间信息;

11、将三个周期的历史信息、预测时刻的时间信息、交通速度传感器网络的集合共同作为模型的输入,预测未来时间段的交通速度;模型输入和输出的映射关系表示为:;其中,表示映射。

12、进一步地,步骤2中,多分量注意力图神经网络模型包括小时周期时空特征提取模块、日周期时空特征提取模块、周周期时空特征提取模块、多周期特征融合模块、输出层共五部分;多分量注意力图神经网络模型进行交通速度预测的具体过程如下:

13、步骤2.1、分别通过小时周期时空特征提取模块、日周期时空特征提取模块、周周期时空特征提取模块提取小时周期、日周期、周周期的时空特征;

14、步骤2.2、将小时周期、日周期、周周期的时空特征通过多周期特征融合模块进行合并,得到多周期时空特征;

15、步骤2.3、设定预测时刻的时间信息,联合多周期时空特征输入分量注意力层,得到最终的时空特征;

16、步骤2.4、将最终的时空特征经过输出层将特征维度由放缩到1,得到最终的交通速度预测结果。

17、进一步地,步骤2.1中,小时周期时空特征提取模块、日周期时空特征提取模块、周周期时空特征提取模块均使用相同结构的时空特征提取模块构建;时空特征提取模块由卷积层、三个时空层和跳跃注意力层构成;其中,三个时空层堆叠组成,三个时空层分别用来提取不同尺度的时空特征,第一时空层的输出为第二时空层的输入,第二时空层的输出为第三时空层的输入;三个时空层的输出级联在一起后的结果为最终所需的时空特征;每个时空层的结构相同,均包含两个时间卷积层、一个图卷积层。

18、进一步地,时空特征提取模块提取时空特征的过程如下:

19、步骤2.1.1、将周期历史信息输入一个的二维卷积层,通过二维卷积操作后得到特征维度为的时空序列,并将送入第一时空层;

20、步骤2.1.2、经过两个并行的时间卷积层提取特征,并使用激活函数进行非线性变换,将变换后的结果相乘得到时间特征;的计算公式如下:

21、 (1);

22、其中,表示哈达玛积;表示tanh激活函数;表示sigmoid激活函数;和分别是两个时间卷积层的权重;

23、步骤2.1.3、将输入扩散卷积层,在个空间步上使用前向扩散矩阵、后向扩散矩阵和自适应扩散矩阵建模相邻交通速度传感器节点在前向、反向和全局上的空间相关性,得到时空特征;的计算公式如下:

24、 (2);

25、 (3);

26、 (4);

27、 (5);

28、其中,为前向扩散矩阵,为第个空间步的前向扩散矩阵;为后向扩散矩阵,为第个空间步的后向扩散矩阵;为自适应扩散矩阵;为第个空间步的自适应扩散矩阵;、和分别表示第个空间步中可学习的参数矩阵;为对扩散矩阵按行求和的操作;为归一化指数函数;为randomized leaky relu激活函数;为源节点嵌入向量;为目标节点嵌入向量;

29、步骤2.1.4、将与进行残差连接,得到第一时空层的输出;

30、步骤2.1.5、将作为第二时空层的输入,按照与步骤2.1.2-步骤2.1.4相同的过程,得到第二时空层的输出;

31、步骤2.1.6、将作为第三时空层的输入,按照与步骤2.1.2-步骤2.1.4相同的过程,得到第三时空层的输出;

32、步骤2.1.7、将、、在最后一个维度上合并得到新的时空特征,其中表示、、三个序列长度的和;

33、步骤2.1.8、将送入跳跃注意力层,计算不同尺度时空特征之间的相关性,得到单个周期的时空特征;跳跃注意力层中采用4个注意力头,每个注意力头均使用不同的权重;

34、在小时周期时空特征提取模块中,步骤2.1.1中输入的周期历史信息为小时周期历史信息,经过步骤2.1.1-步骤2.1.8的过程后,提取得到小时周期时空特征;

35、在日周期时空特征提取模块中,步骤2.1.1中输入的周期历史信息为日周期历史信息,经过步骤2.1.1-步骤2.1.8的过程后,提取得到日周期时空特征;

36、在周周期时空特征提取模块中,步骤2.1.1中输入的周期历史信息为周周期历史信息,经过步骤2.1.1-步骤2.1.8的过程后,提取得到周周期时空特征。

37、进一步地,步骤2.2的具体过程如下:

38、将、、在特征维度上进行合并,得到多周期时空特征,此处的,表示周期信息的个数。

39、进一步地,步骤2.3的具体过程如下:

40、步骤2.3.1、设定预测时刻的时间信息,其中表示时间信息的特征维度;将输入一个的卷积层得到一个特征维度为的时间特征;

41、步骤2.3.2、多分量注意力层采用多头注意力机制;将时间特征作为查询,多周期时空特征作为键和值,输入多分量注意力层,多头注意力机制会分别映射到三个子空间中,计算时间特征与多周期时空特征的相关性,得到最终的时空特征。

42、进一步地,步骤2.4的具体过程如下:

43、首先,将输入一个rrelu激活函数对解码后的时空特征进行非线性激活;然后,再输入一个的二维卷积将维度放大到,并使用rrelu激活函数进行非线性激活;最后,再输入一个的二维卷积将维度放缩到1,得到最终的输出结果;具体公式如下:

44、 (6);

45、其中,、分别表示两个卷积层的权重。

46、本发明所带来的有益技术效果:本发明提出了多分量注意力层,将历史信息按照不同周期进行细分,并使用预测时刻的时间特征将不同周期的历史信息进行融合,实现了根据预测时刻的不同拥有不同的融合权重。本发明提出了时空特征提取模块,将不同尺度的时空特征进行融合,改善了时间卷积的膨胀系数增加时带来的丢失局部信息问题,提高了模型的时空建模细粒度。本发明是一种基于多周期信息进行的交通速度预测的方法,提出了使用预测时刻的时间特征对不同周期历史信息进行融合的通行时间预测方法,解决了传统统计模型和现有深度学习预测方法不能很好地捕捉时间序列的动态周期性问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1