交通状态预测方法、装置、电子设备及存储介质

文档序号：33017544发布日期：2023-01-20 17:23阅读：26来源：国知局

1.本发明涉及城市计算技术领域，尤其涉及一种交通状态预测方法、装置、电子设备及存储介质。

背景技术：

2.城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战(如环境恶化、交通拥堵、能耗增加、规划落后等)的过程，可以帮助人们理解各种城市现象的本质，甚至预测城市的未来。城市计算在智能交通领域应用的过程中，常涉及交通状态的预测问题。
3.交通状态指的是交通流的运行状况，可以反映道路上车辆和行人的流动状态。现有的基于机器学习实现的交通状态预测方法，由于应用的深度学习模型结构设计不合理，无法准确、高效的提取交通状态数据中隐藏的非线性特征和时空关联性特征，导致最终得到的预测结果精度较低，难以实现准确的交通状态预测。

技术实现要素：

4.本发明提供一种交通状态预测方法、装置、电子设备及存储介质，用以解决现有技术中交通状态的预测方法由于应用的深度学习模型结构设计不合理，存在预测结果精度低的缺陷，实现更高精度的交通状态预测。
5.第一方面，本发明提供一种交通状态预测方法，该方法包括：
6.接收历史时段内的第一交通状态数据；
7.基于所述第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于所述时空相关性提取的结果和所述时域变化提取的结果，确定未来时段内的第二交通状态数据。
8.根据本发明提供的交通状态预测方法，所述基于所述第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于所述时空相关性提取的结果和所述时域变化提取的结果，确定未来时段内的第二交通状态数据，包括：
9.对所述第一交通状态数据进行隐空间转换，得到初始隐状态数据；
10.对所述初始隐状态数据分别进行时空相关性提取和时域变化提取，得到所述时空相关性提取的结果和所述时域变化提取的结果；
11.将所述时空相关性提取的结果和所述时域变化提取的结果进行融合，得到隐空间特征融合结果；
12.基于所述隐空间特征融合结果，预测得到所述第二交通状态数据。
13.根据本发明提供的交通状态预测方法，对所述初始隐状态数据进行时空相关性提取，包括：
14.将所述初始隐状态数据输入短程架构搜索模块，并在所述短程架构搜索模块中建立候选邻接矩阵集合；
15.从所述候选邻接矩阵集合中确定所述短程架构搜索模块中各个图卷积层对应的目标候选邻接矩阵；
16.基于所述目标候选邻接矩阵，对所述初始隐状态数据进行图卷积运算，得到各个所述图卷积层对应的第一中间隐状态数据；
17.将各个所述第一中间隐状态数据进行融合，得到所述时空相关性提取的结果。
18.根据本发明提供的交通状态预测方法，所述将各个所述第一中间隐状态数据进行融合，得到所述时空相关性提取的结果，包括：
19.分别对各个所述第一中间隐状态数据进行裁剪处理，得到第一处理结果；
20.分别对各个所述第一处理结果进行线性映射处理和非线性激活处理，得到第二处理结果；
21.将各个所述第二处理结果进行聚合处理，得到所述时空相关性提取的结果。
22.根据本发明提供的交通状态预测方法，对所述初始隐状态数据进行时域变化提取，包括：
23.将所述初始隐状态数据输入长程架构搜索模块，并在所述长程架构搜索模块中建立候选操作集合；
24.从所述候选操作集合中确定长程架构搜索模块中各个顶点对应的目标候选操作；
25.基于所述目标候选操作对所述初始隐状态数据进行时间卷积运算，得到各个所述顶点的第二中间隐状态数据；
26.将各个所述第二中间隐状态数据进行融合，得到所述时域变化提取的结果。
27.根据本发明提供的交通状态预测方法，所述候选操作集合包括零映射操作、恒等映射操作以及拥有不同卷积核和卷积类型的门控时间卷积操作中至少一种。
28.根据本发明提供的交通状态预测方法，所述第一交通状态数据具体通过如下过程得到：
29.获取历史时段内的交通路网的原始交通数据；
30.将所述交通路网中各关键对象作为节点，将各关键对象之间的连接关系作为边，并基于各关键对象之间的连接关系建立初始邻接矩阵，基于所述节点、所述边以及所述初始邻接矩阵，构建得到交通路网图；
31.基于所述交通路网图和所述原始交通数据，确定所述历史时段内不同时刻各节点的交通状态；
32.基于所述不同时刻各节点的交通状态，得到第一交通状态数据。
33.第二方面，本发明还提供一种交通状态预测装置，该装置包括：
34.接收模块，用于接收历史时段内的第一交通状态数据；
35.处理模块，用于基于所述第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于所述时空相关性提取的结果和所述时域变化提取的结果，确定未来时段内的第二交通状态数据。
36.第三方面，本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述交通状态预测方法。
37.第四方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程
序，该计算机程序被处理器执行时实现如上述任一种所述交通状态预测方法。
38.本发明提供的交通状态预测方法、装置、电子设备及存储介质，通过对历史时段内的第一交通状态数据进行处理，得到未来时段内的第二交通状态数据，由于可以实现基于第一交通状态数据分别进行时空相关性提取和时域变化提取，能够获取第一交通状态数据中隐藏的非线性特征和时空关联性特征，从而使得输出的第二交通状态数据可靠性更高，提高了交通状态预测结果的精度。
附图说明
39.为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
40.图1是本发明提供的交通状态预测方法的流程示意图；
41.图2是本发明实施例中交通状态预测方法的整体架构示意图；
42.图3是本发明实施例中交通预测模型的整体架构示意图；
43.图4是本发明实施例中短程架构搜索模块的主要架构示意图；
44.图5是本发明实施例中候选邻接矩阵的构建原理示意图；
45.图6是本发明实施例中门控时间卷积神经网络的主要架构示意图；
46.图7是本发明实施例中长程架构搜索模块的主要架构示意图；
47.图8是本发明实施例中样本数据的获取流程示意图；
48.图9是本发明提供的交通状态预测装置的结构示意图；
49.图10是本发明提供的电子设备的结构示意图。
具体实施方式
50.为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
51.下面结合图1至图10描述本发明实施例提供的交通状态预测方法、装置、电子设备及存储介质。
52.图1示出了本发明实施例提供的交通状态预测方法，该方法包括：
53.步骤101：接收历史时段内的第一交通状态数据；
54.步骤102：基于第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于时空相关性提取的结果和时域变化提取的结果，确定未来时段内的第二交通状态数据。
55.本实施例中第一交通状态数据可以表征先前的一段时间(即历史时段)内交通路网中各关键对象的交通状态随时间的变化关系，本实施例中关键对象指的是交通路网中可以反映不同位置的关键信息，具体可以是交通路网中不同的路段或者车道等。
56.在示例性实施例中，上述历史时段内的第一交通状态数据，具体可以通过如下过程得到：
57.获取历史时段内的交通路网的原始交通数据；
58.将交通路网中各关键对象作为节点，将各关键对象之间的连接关系作为边，并基于各关键对象之间的连接关系建立初始邻接矩阵，基于节点、边以及初始邻接矩阵，构建得到交通路网图；
59.基于交通路网图和原始交通数据，确定历史时段内不同时刻各节点的交通状态；
60.基于不同时刻各节点的交通状态，得到第一交通状态数据。
61.在一些实施例中，在得到历史时段内的交通路网的原始交通数据之后，还可以对原始交通数据进行预处理，后续基于交通路网图和预处理后的原始交通数据，确定历史时段内不同时刻各节点的交通状态，可以提高第一交通状态数据的准确性。
62.在本实施例中，交通路网的原始交通数据可以通过设置在交通路网内的传感器或者摄像头等数据采集设备预先获取到，本实施例中交通状态预测方法的执行主体具体可以是预先构建的交通预测模型，交通预测模型可以配置于交通管理人员的监管终端设备中，比如交通监管用的计算机或者监控台等硬件载体，上述获取得到的原始交通数据可以集中存储于硬件载体内的数据存储层。
63.在实际应用过程中，交通状态预测可以从时间和空间两个维度针对路口的流量进行建模预测，预测的流量为各路口分方向的流量。本实施例中交通路网可以建模为交通路网图其中，v表示交通路网中将各关键对象视为节点后得到的节点集合，且有|v|＝n，n表示节点的数量，e表示边的集合，a表示邻接矩阵，可以是初始邻接矩阵或者候选邻接矩阵，用来描述交通路网图中节点之间的连接关系。
64.根据上述交通路网图可知，t时刻的交通状态可以表示为可以理解为t时刻的交通状态能够通过一个n
×
d维的向量呈现出来，其中的d表示每个节点的交通状态的特征维度。
65.此种情形下，本实施例中交通状态预测问题可以定义为：学习一个函数f(
·
)，使之可以将历史时段的交通状态准确映射为未来时段的交通状态，即将第一交通状态数据映射为第二交通状态数据，具体可以表示如下：
[0066][0067]
其中，表示t-t+1时刻的交通状态，表示t时刻的交通状态，表示t+1时刻的交通状态，表示t+t
′
时刻的交通状态，t表示输入的第一交通状态数据对应的时间序列长度，t
′
表示输出的第二交通状态数据对应的时间序列长度。
[0068]
本实施例主要通过构建交通预测模型来解决上述交通状态预测问题。
[0069]
本实施例提供的交通状态预测方法在搭载硬件载体实际应用过程中，可以直观的通过图2示出的模块架构呈现，整体架构可以分为数据存储模块201、数据接入转换模块202、交通预测模型203以及数据安全模块204等几个重要部分。
[0070]
其中，数据存储模块201主要用于存储历史获取到的以及实时获取到的原始交通数据，上述原始交通数据可以涵盖能够影响或表征交通状态的各种原始数据，比如车流量、天气数据、事故信息、大型事件、poi(point of interest，兴趣点)、人流量、传感器信息、路
段信息、路口信息以及车道信息等原始数据。
[0071]
为提升交通预测模型203对于低质量数据的鲁棒性和稳定性，例如当原始交通数据较为稀疏或有严重缺失时，为防止交通预测模型203的预测精度急剧下降，保证训练得到的交通预测模型203可以满足正常需求，合理的数据预处理也是交通状态预测方法在执行前的重要步骤。
[0072]
为此，本实施例还设置了数据接入转换模块202，数据接入转换模块202主要用于对原始交通数据做预处理，数据预处理的方式包括但不限于数据清洗、数据脱敏、缺失补全、拓扑构建以及训练数据生成等处理过程，可以保证后续输入交通预测模型203的第一交通状态数据更加准确和完整。
[0073]
交通预测模型203主要用于接收第一交通状态数据，并对输入的第一交通状态数据进行分析处理，进而输出第二交通状态数据，实现交通状态的准确预测。
[0074]
由于交通数据在时空维度上具有复杂的相关性，因此构建良好的交通预测模型以提取时空关联特征对提升交通预测的准确性至关重要。同时，交通路网中不同关键对象之间的空间相关性是多方面的，可以由交通网络的拓扑结构或时间序列的相似度，异或所在地域之间的兴趣点相似度决定。此外，由于非线性变化和周期性的混合，同一关键对象在不同时刻的时间依赖性也很复杂。
[0075]
虽然目前存在具有时空提取功能的预测模型，但其中的时空提取模块都是人为设计且预先定义的，无法根据不同数据做自适应调整，导致预测结果的准确性仍难以保证。为此，本实施例建立交通预测模型，基于模型内部结构的改进实现更准确的交通状态预测。
[0076]
本实施例中交通预测模型203主要包括多模态嵌入表征层、时空关联建模层、时域变化建模层、特征融合层以及预测结果转换导出层；
[0077]
多模态嵌入表征层主要用于将第一交通状态数据由交通路网图对应的向量转换为更高维度的隐空间向量，即初始隐状态数据；
[0078]
时空关联建模层主要用于对初始隐状态数据进行时空相关性提取，得到时空相关特征提取后的隐空间向量，即时空相关性提取的结果；
[0079]
时域变化建模层主要用于对初始隐状态数据进行时域变化提取，得到时域变化特征提取后的隐空间向量，即时域变化提取的结果；
[0080]
特征融合层主要用于将时空相关性提取的结果和时域变化提取的结果进行融合，得到特征融合后的隐空间向量，即隐空间特征融合结果；
[0081]
预测结果转换导出层主要用于基于隐空间特征融合结果，预测并输出第二交通状态数据。
[0082]
经过上述交通预测模型203中各个层结构的处理，可以实现基于第一交通状态数据对第二交通状态数据的预测功能。
[0083]
数据安全模块204主要用于保证交通状态预测的整个流程中数据传输的安全，防止数据泄露，并用于抵挡网络攻击，在实际应用过程中，数据安全模块204可以贯穿于这个架构中，进而可以保证数据存储模块201、数据接入转换模块202以及交通预测模型203中数据处理和数据传输过程的安全性。
[0084]
在示例性实施例中，基于第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于时空相关性提取的结果和时域变化提取的结果，确定未来时段内的第二交通
状态数据，具体可以包括：
[0085]
对第一交通状态数据进行隐空间转换，得到初始隐状态数据；
[0086]
对初始隐状态数据分别进行时空相关性提取和时域变化提取，得到时空相关性提取的结果和时域变化提取的结果；
[0087]
将时空相关性提取的结果和时域变化提取的结果进行融合，得到隐空间特征融合结果；
[0088]
基于隐空间特征融合结果，预测得到第二交通状态数据。
[0089]
本实施例提供的上述基于第一交通状态数据得到未来时段内的第二交通状态数据的实现流程可以在交通预测模型203中完成，因此与上述实施例中交通预测模型203中各个层结构之间的数据传递流程对应。
[0090]
图3示出了本实施例中交通预测模型203的主要架构，首先，可以使用一个全连接层(full connection layer，fc)，即图3中fc1，通过线性映射的方式对第一交通状态数据进行隐空间转换，整个交通预测模型可以通过时空同步图卷积网络来提取时空相关性特征，在每一个图卷积层，均设置了短程架构搜索模块(即图3中sasm)以及长程架构搜索模块(即图3中lasm)来实现段时间段内的时空相关性特征提取和长时间段内的时域变化特征提取。
[0091]
之后，以第一层图卷积层为例，sasm输出的数据与lasm输出的数据通过求和的方式进行融合，融合得到的数据可以应用于以下两个方面：一方面，融合得到的数据经过全连接层fc2进行线性映射，并与残差连接计算后的数据进行求和融合后输入下一个图卷积层，另一方面，融合得到的数据经过全连接层fc3进行线性映射后，与其余各个图卷积层的输出数据一并经过跳跃连接后依次经过激活函数relu和多层感知器(multilayer perceptron，mlp)后输出最终的预测结果，即第二交通状态数据。
[0092]
交通预测模型203中第i层的残差连接计算结果将作为第i+1层的输入数据，表示如下：
[0093][0094]
其中，表示第i+1层的输入数据，表示第i层残差连接部分的全连接层，即全连接层fc2，和分别表示第i层中sasm和lasm的输出数据，表示第i层的输入数据。
[0095]
为了缓解梯度消失，本实施例对交通预测模型203中每一层使用参数化的跳跃连接，以获得最终预测结果xo，表示如下：
[0096][0097][0098]
其中，xo表示最终预测结果，即第二交通状态数据，l表示交通预测模型的层数，表示第i层输出的跳跃连接结果，表示第i层跳跃连接部分的全连接层，即全连接层fc3，mlp表示多层感知器，+表示加和操作。
[0099]
在示例性实施例中，对初始隐状态数据进行时空相关性提取，具体可以包括：
[0100]
将初始隐状态数据输入短程架构搜索模块，并在短程架构搜索模块中建立候选邻接矩阵集合；
[0101]
从候选邻接矩阵集合中确定短程架构搜索模块中各个图卷积层对应的目标候选邻接矩阵；
[0102]
基于目标候选邻接矩阵，对初始隐状态数据进行图卷积运算，得到各个图卷积层对应的第一中间隐状态数据；
[0103]
将各个第一中间隐状态数据进行融合，得到时空相关性提取的结果。
[0104]
本实施例中时空关联建模层所要实现的功能具体可以通过建立短程架构搜索模块(short-range architecture search module，sasm)实现。图4示出了本实施例中短程架构搜索模块的主要架构，短程架构搜索模块主要可以通过一个有向无环图(directed acyclic graph，dag)展现出来，该有向无环图由l个顶点组成，图4中以0、1、2、3四个顶点为例示出了该有向无环图的架构，有向无环图中l个顶点个数，本质上表示l个图卷积层，每层的第一中间隐状态数据可以表示为x(i)，其中i＝1，2，
···
，l。将初始隐状态数据表示为x0，本实施例中每层的第一中间隐状态数据都是基于当前层以前的各层输出的第一中间隐状态数据计算得到的，即基于所有的前身计算得到的，具体可以表示为：
[0105][0106]
其中，x
(j)
为第j层的第一中间隐状态数据，表示将第i层的第一中间隐状态数据与先前层的第一中间隐状态数据进行混合操作，也就是将第j层之前的各层的第一中间隐状态数据进行混合处理，x(i)为第j层之前的第i层的第一中间隐状态数据。
[0107]
为了最大化利用节点间复杂多样的相关性(具体可以通过邻接矩阵表示)，本实施例将短程架构搜索模块的混合操作设计如下：
[0108][0109]
其中，表示对第一中间隐状态数据x进行混合操作，x表示输入的第一中间隐状态数据；a和a
′
均表示候选邻接矩阵，为预定义的候选邻接矩阵所组成的集合，候选邻接矩阵a和a
′
属于上述集合；和均表示可学习的架构参数，可以作为与节点对(i,j)相关的候选操作ax所对应的加权权重。
[0110]
在本实施例中，无论是初始邻接矩阵，还是候选邻接矩阵，均可以通过计算交通路网图中不同节点间的空间距离或时间序列相似度距离，并通过阈值高斯核函数计算不同节点对之间的权重得到，计算公式如下：
[0111][0112]
其中，w
ij
表示节点vi与节点vj之间的边权重，dist(vi,vj)表示节点vi与节点vj之间的空间距离或基于dtw(dynamic time warping，动态时间规整)算法的时间序列相似度距离，σ表示空间距离或时间序列相似度距离的标准差，κ表示预设的距离阈值。
[0113]
本实施例中提到的初始邻接矩阵或者候选邻接矩阵，可以理解为与上述不同节点
对之间的权重w
ij
是对等的。
[0114]
在示例性实施例中，将各个第一中间隐状态数据进行融合，得到时空相关性提取的结果，具体可以包括：
[0115]
分别对各个第一中间隐状态数据进行裁剪处理，得到第一处理结果；
[0116]
分别对各个第一处理结果进行线性映射处理和非线性激活处理，得到第二处理结果；
[0117]
对各个第二处理结果进行聚合处理，得到时空相关性提取的结果。
[0118]
在图卷积的消息传递过程中，节点的时空信息是沿着给定的图结构传播的，因此聚合不同传播范围的第一中间隐状态数据以获得消息传递的全面信息是有意义的。非线性激活、线性映射和层聚合是图卷积的必要组成部分。为此，本实施例设置了末端激活与融合模块(final activation&fusion module,fafm)。
[0119]
首先对搜索空间中所有的第一中间隐状态数据x(i)，其中，i＝1，2，
···
，l使用裁剪操作，即对所有的第一中间隐状态数据x(i)进行裁剪处理，用于简化消息传递的结果。
[0120]
之后，本实施例通过多个门控线性单元(gated linear unit，glu)来进行线性映射和非线性激活。上述操作可以表述为:
[0121][0122]
其中，表示对第一中间隐状态数据x(i)进行裁剪处理、线性映射和非线性激活处理后的结果，即第二处理结果，crop为裁剪操作，glui为单独应用于第一中间隐状态数据x(i)的glu模块。
[0123]
本实施例中glu模块的数据处理操作可以表示为：
[0124][0125]
其中，glu(x)表示门控线性函数，均表示可学习参数，
⊙
表示哈达玛积，σ表示sigmoid激活函数，x表示输入数据，可以是任意的第一中间隐状态数据。
[0126]
最后，本实施例通过最大池化操作来聚合所有的第二处理结果，即对各个第二处理结果进行聚合处理，得到的聚合处理后的输出结果，即时空相关性提取的结果可以表示为：
[0127][0128]
其中，x
out
表示聚合处理后的输出结果，maxpool表示最大池化操作，表示由第二处理结果组成的集合向量。
[0129]
在短程架构搜索结束时，本实施例可以根据各个图卷积层中处理节点对之间的映射关系时，各个候选邻接矩阵对应的权重值，选择权重值最高的候选邻接矩阵作为目标候选邻接矩阵，进而将每个混合操作替换为对应最大架构参数(即权重值)的候选操作来确定短程架构搜索模块的最终架构，具体可以表示如下：
[0130][0131]
其中，表示最终确定的与第一中间隐状态数据x对应的混合操作，x表
时刻至t4时刻的空间图矩阵t4时刻至t3时刻的空间图矩阵以及t4时刻的空间图矩阵构建得到的；
[0139]
候选邻接矩阵a4是基于t1时刻的空间图矩阵t1时刻至t2时刻的单位矩阵t2时刻至t1时刻的单位矩阵t2时刻的空间图矩阵t2时刻至t3时刻的单位矩阵t3时刻至t2时刻的单位矩阵t3时刻的空间图矩阵t3时刻至t4时刻的单位矩阵t4时刻至t3时刻的单位矩阵以及t4时刻的空间图矩阵构建得到的。
[0140]
在示例性实施例中，对初始隐状态数据进行时域变化提取，具体可以包括：
[0141]
将初始隐状态数据输入长程架构搜索模块，并在长程架构搜索模块中建立候选操作集合；
[0142]
从候选操作集合中确定长程架构搜索模块中各个顶点对应的目标候选操作；
[0143]
基于目标候选操作对初始隐状态数据进行时间卷积运算，得到各个顶点的第二中间隐状态数据；
[0144]
将各个第二中间隐状态数据进行融合，得到时域变化提取的结果。
[0145]
时域变化建模层所要实现的功能具体可以通过建立长程架构搜索模块(long-range architecture search module,lasm)实现。本实施例中长程架构搜索模块主要基于时间卷积神经网络(time convolution neural network，tcn)实现，时间卷积神经网络本质上是一维神经网络，其优点是特征提取效率高。相比之下，门控时间卷积神经网络(gated tcn)在效率损失不明显的情况下，实现了更强的提取能力，并已被广泛应用于序列建模。参见附图6，本实施例中门控时间卷积神经网络采用两个平行的一维神经网络(即tcn)，分别采用正切双曲激活函数tanh和sigmoid激活函数σ。
[0146]
此外，本实施例还引入一维扩张卷积以增强tcn的感受野。然而，由于卷积核和卷积类型过于简化，传统的tcn在时空建模中难以处理长序列和捕获长程时间模式。为此，本实施例试图从以下两方面改进传统的tcn，一方面，需要考虑各种卷积类型，如标准卷积、分离卷积和扩张卷积等；另一方面，应该联合使用不同的卷积核大小来捕获不同范围(特别是长范围)的时间依赖性。
[0147]
根据以上分析，本实施例设计了长程架构搜索模块，图7示出了本实施例中长程架构搜索模块的主要架构，长程架构搜索模块的搜索空间是一个由nv顶点组成的有向无环图，将搜索空间中的输入数据，即初始隐状态数据表示为x0，第i个顶点的第二中间隐状态数据表示为y(i)，i＝1,2,
…nv
，长程架构搜索模块的输出结果可以通过求和的方式(即图7中add操纵)得出，可以表示为：
[0148][0149]
其中，y
out
表示长程架构搜索模块的输出结果，即时域变化提取的结果；o和o
′
均表
示候选操作，不同候选操作组成集合示候选操作，不同候选操作组成集合并且和均表示可学习的架构参数，具体可以理解为作为与顶点对(i,j)相关的候选操作o所对应的加权权重，y(i)表示第i个顶点的第二中间隐状态数据。
[0150]
本实施例中候选操作集合具体可以包括零映射操作、恒等映射操作以及拥有不同卷积核和卷积类型的门控时间卷积操作中至少一种，图7中示出了包括零映射操作、恒等映射操作以及gated tcn1和gated tcn2两种门控时间卷积操作，比如可以是1
×
3卷积核的标准卷积、1
×
5卷积核的扩张卷积或者1
×
7卷积核的分离卷积等门控时间卷积操作。
[0151]
在长程架构搜索结束时，本实施例同样可以根据处理各个顶点对之间的映射关系时，各个候选操作对应的权重值，选择权重值最高的候选操作作为目标候选操作，进而将每个混合操作替换为对应最大架构参数的目标候选操作来得到长程架构搜索模块的最终架构，具体可以表示如下：
[0152][0153]
其中，o
(i,j)
表示对顶点对(i,j)的目标候选操作，argmax表示寻找具有最大评分的参量，即确定权重值最高的候选操作，表示作为与顶点对(i,j)相关的候选操作o所对应的加权权重。
[0154]
本实施例提供的交通预测模型中，架构参数包括不同候选邻接矩阵的权重值，比如短程架构搜索模块中的还包括候选操作的权重值，比如长程架构搜索模块中的
[0155]
网络参数代表了模型中除架构参数外的所有可学习参数，如全连接层、多层感知器和候选操作中门控时间卷积中的参数。本实施例在对交通预测模型进行训练时，首先分别使用训练集和验证集交替更新网络参数和架构参数，直到满足停止准则。然后，用训练集对得到的模型架构进行进一步训练，直到满足停止条件后，得到训练好的交通预测模型。
[0156]
最后，通过测试集对训练好的交通预测模型进行测试，本实施例选取平均绝对误差mae、均方根误差rmse和平均绝对百分比误差mape作为评价指标，上述三个评价指标的计算方法分别如下：
[0157][0158]
其中，表示真实值y与预测值之间的平均绝对误差，|ω|表示总的样本数量，yi表示第i个真实值，表示第i个预测值。
[0159][0160]
其中，表示真实值y与预测值之间的均方根误差，|ω|表示总的样本数量，yi表示第i个真实值，表示第i个预测值。
[0161][0162]
其中，表示真实值x与预测值之间的平均绝对百分比误差，|ω|表示总的样本数量，yi表示第i个真实值，表示第i个预测值。
[0163]
参见附图8，在获取样本数据时，本实施例采用滑动时间窗口法生成样本数据，并以一定比例划分训练集、验证集和测试集。
[0164]
在实际应用过程中，本实施例中交通预测模型由adam优化器训练得到，批大小为32，学习率为0.001，损失函数采用上述mae。本实施例采用早期停止的方式进行模型训练，以提升模型的泛化能力，降低过拟合的风险。
[0165]
本实施例基于四个公开的交通数据集pems03、pems04、pems07以及pems08对交通预测模型进行测试，与现有的交通预测模型进行比对，现有的交通预测模型分别是基于fc-lstm、dcrnn、stgcn、astgcn(r)、gradh wavenet、stsgcn、stfgnn、autostg建立的，本实施例中交通预测模型可以定义为是基于autosts建立的，autosts指的是基于上述短程架构搜索模块和长程架构搜索模块建立的改进后的交通预测模型，本实施例中选取的评价指标包括平均绝对误差mae、均方根误差rmse和平均绝对百分比误差mape，本实施例提供的交通预测模型与现有的八个交通预测模型的测试结果如表1所示：
[0166]
表1模型测试结果对比数据
[0167]
[0168][0169]
基于上表1可以看出，本实施例提供的交通预测模型，相比于其他八个现有的交通预测模型，在四个公开的交通数据集上测试得到的结果，平均绝对误差mae、均方根误差rmse和平均绝对百分比误差mape三个评价指标均明显低于其他八个现有的交通预测模型，由此可知，本实施例提供的交通预测模型的预测性能得到大幅度的提升，预测精度更高。
[0170]
由于本实施例提供的交通预测模型是端到端的深度学习模型，因此将交通预测模型训练好以后，交通预测模型的应用过程只需将交通路网中不同关键对象(比如不同路段或传感器)的邻接矩阵和历史时间序列(即第一交通状态数据)输入交通预测模型，交通预测模型的输出便是未来一段时间(即未来时段)的交通状况预测值(即第二交通状态数据)。
[0171]
在实际应用过程中，输入的历史时间序列的长度和输出的预测时间序列的长度可以提前设定，例如时间粒度可以设置为五分钟，输入的历史序列长度可以设置为1小时，预测时间训练的长度也可以是1小时，即预测未来1小时的交通状态，此种情形下输入和输出的时间序列的时间步数均是60/5＝12步。本实施例仅是示例性的说明预设参数的设定方案，具体取值可以根据实际应用需要合理设定，在此不做过多赘述。
[0172]
下面对本发明提供的交通状态预测装置进行描述，下文描述的交通状态预测装置与上文描述的交通状态预测方法可相互对应参照。
[0173]
图9示出了本发明实施例提供的交通状态预测装置，该装置包括：
[0174]
接收模块901，用于接收历史时段内的第一交通状态数据；
[0175]
处理模块902，用于基于第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于时空相关性提取的结果和时域变化提取的结果，确定未来时段内的第二交通状态数据。
[0176]
在示例性实施例中，上述处理模块902具体可以用于：
[0177]
对第一交通状态数据进行隐空间转换，得到初始隐状态数据；
[0178]
对初始隐状态数据分别进行时空相关性提取和时域变化提取，得到时空相关性提取的结果和时域变化提取的结果；
[0179]
将时空相关性提取的结果和时域变化提取的结果进行融合，得到隐空间特征融合结果；
[0180]
基于隐空间特征融合结果，预测得到第二交通状态数据。
[0181]
进一步地，上述处理模块902具体可以通过如下方式实现对初始隐状态数据进行时空相关性提取：
[0182]
将初始隐状态数据输入短程架构搜索模块，并在短程架构搜索模块中建立候选邻接矩阵集合；
[0183]
从候选邻接矩阵集合中确定短程架构搜索模块中各个图卷积层对应的目标候选邻接矩阵；
[0184]
基于目标候选邻接矩阵，对初始隐状态数据进行图卷积运算，得到各个图卷积层对应的第一中间隐状态数据；
[0185]
将各个第一中间隐状态数据进行融合，得到时空相关性提取的结果。
[0186]
更进一步地，上述处理模块902具体可以通过如下方式实现将各个第一中间隐状态数据进行融合，得到时空相关性提取的结果：
[0187]
分别对各个第一中间隐状态数据进行裁剪处理，得到第一处理结果；
[0188]
分别对各个第一处理结果进行线性映射处理和非线性激活处理，得到第二处理结果；
[0189]
将各个第二处理结果进行聚合处理，得到时空相关性提取的结果。
[0190]
进一步地，上述处理模块902具体可以通过如下方式实现对初始隐状态数据进行时域变化提取：
[0191]
将初始隐状态数据输入长程架构搜索模块，并在长程架构搜索模块中建立候选操作集合；
[0192]
从候选操作集合中确定长程架构搜索模块中各个顶点对应的目标候选操作；
[0193]
基于目标候选操作对初始隐状态数据进行时间卷积运算，得到各个顶点的第二中间隐状态数据；
[0194]
将各个第二中间隐状态数据进行融合，得到时域变化提取的结果。
[0195]
在示例性实施例中，候选操作集合具体可以包括零映射操作、恒等映射操作以及拥有不同卷积核和卷积类型的门控时间卷积操作中至少一种。
[0196]
在示例性实施例中，上述第一交通状态数据具体可以通过如下过程得到：
[0197]
获取历史时段内的交通路网的原始交通数据；
[0198]
将交通路网中各关键对象作为节点，将各关键对象之间的连接关系作为边，并基于各关键对象之间的连接关系建立初始邻接矩阵，基于节点、边以及初始邻接矩阵，构建得到交通路网图；
[0199]
基于交通路网图和原始交通数据，确定历史时段内不同时刻各节点的交通状态；
[0200]
基于不同时刻各节点的交通状态，得到第一交通状态数据。
[0201]
综上所述，本发明实施例提供的交通状态预测装置，通过接收模块接收第一交通状态数据，并通过处理模块对历史时段内的第一交通状态数据进行处理，得到未来时段内的第二交通状态数据，由于可以基于第一交通状态数据分别进行时空相关性提取和时域变化提取，能够获取第一交通状态数据中隐藏的非线性特征和时空关联性特征，从而使得输
出的第二交通状态数据可靠性更高，提高了交通状态预测结果的精度。
[0202]
图10示例了一种电子设备的实体结构示意图，如图10所示，该电子设备可以包括：处理器(processor)1010、通信接口(communications interface)1020存储器(memory)1030和通信总线1040，其中，处理器1010，通信接口1020，存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令，以执行交通状态预测方法，该方法包括：接收历史时段内的第一交通状态数据；基于第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于时空相关性提取的结果和时域变化提取的结果，确定未来时段内的第二交通状态数据。
[0203]
此外，上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0204]
另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各实施例所提供的交通状态预测方法，该方法包括：接收历史时段内的第一交通状态数据；基于第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于时空相关性提取的结果和时域变化提取的结果，确定未来时段内的第二交通状态数据。
[0205]
又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时以实现上述各实施例提供的交通状态预测方法，该方法包括：接收历史时段内的第一交通状态数据；基于第一交通状态数据分别进行时空相关性提取和时域变化提取，并基于时空相关性提取的结果和时域变化提取的结果，确定未来时段内的第二交通状态数据。
[0206]
以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
[0207]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0208]
最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管
参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李勇颜欢李府显金德鹏
技术所有人：清华大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.机器人 2.嵌入式控制系统开发
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、毕老师：机构动力学与控制
4、袁老师：1.计算机视觉 2.无线网络及物联网
5、周老师：1.智能机器人技术 2.智能检测与控制技术 3.机构运动学与动力学 4.机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。