一种基于多视角时空对抗框架的路网缺失数据修复方法

文档序号:32054541发布日期:2022-11-04 20:35阅读:77来源:国知局
一种基于多视角时空对抗框架的路网缺失数据修复方法

1.本发明涉及时空交通数据修复领域,对于基于交通数据的事故预测、风险预 警、交通流量预测等具有重要意义,有助于提升城市服务、建设智慧城市。


背景技术:

2.随着信息通信技术的飞速发展,交通检测设备捕获的数据呈指数级增长,我 们对交通数据详细分析的要求也越来越高。交通监控数据分析可以帮助降低管理 成本并制定安全的城市规划策略;在城市服务中,公交和出租车服务是市民上下 班必不可少的,可以通过分析历史数据优化这些公共服务;对于商业组织来说, 交通数据分析可以帮助了解用户行为,从而达到为客户提供更好的商业服务和提 高商业竞争力的目的。例如,交通数据可以通过了解人类运动模式对商业区进行 选址;对于个人而言,通过分析历史大数据,可以很好地了解居民的行为。
3.我们通常通过道路传感器获取交通数据,这些数据对于智能交通系统的发展 至关重要。尤其是近年来,基于交通数据的深度学习建模方法大行其道,使我们 更加关注高质量的交通数据。但是,世界各国的传感器接收和传输不可避免地存 在数据丢失或数据损坏等问题。这就给基于完整数据的各种下游任务带来了挑战, 数据的缺失导致下游任务结果不理想。例如,基于加州交通部的性能测量系统 (caltrans performance measurement system,pems)的交通数据可以计算高速公 路使用和拥堵延误、测量和预测行驶时间、评估坡道计量方法以及验证交通理论, 但大多数情况下pems没有收到完整的样本。因此,非常有必要提出一种高效、 高质量的交通数据插补方法。
4.但是目前的各种基于深度学习的交通数据修复方法仍然存在两个主要缺点: 一是大多数方法都没有综合考虑现实路网的时空特征,仅仅根据路网的周期性、 单一的时间相关性或单一的空间相关性来修复数据,忽略了路网时空联合学习对 数据修复的影响;另一方面,大多数考虑到时空相关性的方法,只从时空视角出 发,进行时空模型的简单堆叠来学习路网特征,而没有单独详细分析时间视角和 空间视角对路网数据修复性能的影响。


技术实现要素:

5.针对上述情况,本发明提出了一种新的基于深度学习的交通数据修复方法。 基于匹配真实路网的功能,提取交通路网的前后向时间相关性和不同路口的空间 分布相关性,我们设计具有两个生成器的生成对抗网络(generative adversarialnetwork,gan)来逐步细化时间和空间特征的学习,实现了从时间、空间和时空 三个视角对缺失的交通数据进行修复,可以在很大程度上提高城市服务,对于基 于交通数据的下游任务具有重要意义。
6.本发明是通过以下技术方案达到上述目的:一种基于多视角时空对抗框架的 路网缺失数据修复方法,包括如下步骤:
7.(1)确定需要进行交通数据修复的路段,通过道路传感器采集该路段的原始 数据并进行预处理,以确保数据的规范化和可用性;
8.(2)基于采集的历史交通数据,捕获交通数据的时间特征,利用基于注意力 机制的双向长短期记忆网络(bidirectional long short-term memory network
ꢀꢀ
based on attention mechanism,bilstm_att)模型学习时间特征分布,通过时间 生成器和鉴别器对其进行时间视角的数据插补;
9.(3)基于采集的历史交通数据,捕获交通数据的空间特征,利用图卷积网络 (graph convolutional network,gcn)模型对路网的空间分布进行学习,通过空 间生成器和鉴别器对其进行空间视角的数据插补;
10.(4)结合(2)和(3)所得的结果进行时空联合训练,实现从三个角度进行 数据修复,得到高质量的数据插补结果。
11.(5)利用上述交通数据修复模型修复采集路段的交通数据。
12.其中步骤(1)具体包括如下步骤:
13.1.1:构造交通流矩阵x,进行交通数据的归一化处理;
14.1.2:构造路网邻接矩阵s,基于采集的各条道路的空间相关性,将原始不同 路口关系数据处理成规范化的路网邻接矩阵;
15.1.3:构造缺失分布矩阵m,当前时刻道路检测器采集的值缺失则为0,存 在为1;
16.1.4:构造噪声矩阵z,使网络模型随机化,产生随机分布,避免生成对抗网 络(generative adversarial network,gan)模式坍塌;
17.1.5:构造指示矩阵h,保证gan在对抗过程中的结果是期望的目标分布, 计算公式如下:
18.h=x

m+0.5(1-m)
ꢀꢀꢀꢀꢀ
(1)
19.其中

为哈达玛乘积,x为交通流矩阵,m为缺失分布矩阵。
20.其中步骤(2)具体包括如下步骤:
21.2.1:基于步骤(1)中所得到交通流数据,构造长短期记忆网络(long short
‑ꢀ
term memory network,lstm),通过学习交通数据的时间特性,模拟生成与真实 数据相似的样本。lstm模型可以根据门的状态丢弃或者增加信息,lstm通过 下面的公式进行门和单元的信息更新:
[0022][0023]
其中w矩阵表示网络参数,tanh()表示双曲正切函数,σ()表示sigmoid 函数,h
t
表示隐藏状态,表示调整门,

表示哈达玛积运算。
[0024]
2.2:通过反向lstm进行特征提取,对交通流数据进行逆时序处理,再将 前向和后向的输出向量进行拼接后得到该时刻的最终特征表达;
[0025]
2.3:针对2.1和2.2构建的双向长短期记忆网络(bilstm)模型处理后的 结果,计算每个时序的权重,然后对所有时序的向量进行加权求和来作为特征向 量,由此产生时间
生成器的输出,计算公式如下:
[0026][0027]
其中矩阵u表征为经过bilstm模型学习后的输出,w
α
∈dn在训练中作为 训练参数。u首先经非线性激活函数激活,然后使用注意力机制(加权求和的软 性注意力)得到更进一步的表示,α∈d
t
代表注意力分布,α可以理解为u中的 t个向量分别受关注的程度。γ=uα
t
∈dn实际上是基于注意力分布对各个隐状 态进行加权求和。
[0028]
2.4:根据2.1、2.2和2.3构成了bilstm_att模型,其作为时间生成器g
t
的内核,时间生成器与鉴别器共同模拟了路网时间特征分布学习,时间生成器损 失l
g1
计算公式如下:
[0029][0030]
其中β是超参数,h表征为指示矩阵。
[0031]
其中步骤(3)具体包括如下步骤:
[0032]
3.1:对步骤(2)得到的插补结果进行预处理,计算公式如下:
[0033][0034]
其中x为源数据,m为缺失分布矩阵,x
bilstm_att
为步骤(2)的数据插补结 果。
[0035]
3.2:按照3.1中所得到插补数据构造gcn所需要的节点特征,将数 据经过gcn模型的处理,最终得到嵌入了空间特征学习的交通数据插补结果 x
gcn
,计算公式如下:
[0036][0037]
其中表征为时间生成器g
t
的修复结果,fc为全连接操作,relu为激活函 数,conv1和conv2是对数据进行卷积操作,卷积公式如下:
[0038][0039]
其中s表示邻接矩阵,in表示单位矩阵,d是度矩阵 d=∑js
ij
,λ是l矩阵的最大特征值,tk(
·
)表示k阶切比雪夫多项式,θ表示 切比雪夫系数的向量。
[0040]
3.3:根据3.1和3.2构成了空间生成器gs的内核,空间生成器与鉴别器共同 模拟了路网空间特征分布学习,空间生成器损失l
g2
计算公式如下:
[0041][0042]
其中x为源数据,d为鉴别器,h为指示矩阵,β表示超参数,m为缺失 分布矩阵,x
gcn
为步骤(3)的数据插补结果。
[0043]
其中步骤(4)具体包括如下步骤:
[0044]
4.1:对步骤(2)(3)的插值数据进行预处理,计算公式如下:
[0045][0046]
其中

表征哈达玛乘积,x为源数据,x
gcn
表征为空间生成器gs的修复结 果,m为缺
失分布矩阵。
[0047]
4.2:对4.1得到的时空修复数据进行时空鉴别器判别真伪,鉴别器损失计算 公式如下:
[0048][0049]
4.3:最终整体模型实现minmax目标为:
[0050][0051]
重复(2)、(3)和(4)的步骤,使得生成器和判别器不断优化,在相互博弈 中达到动态平衡,从而实现高精度的交通数据修复效果。
[0052]
最终,本发明实现了对路网缺失数据的有效修复,对于提高城市服务质量具 有重要意义。
[0053]
本发明的创新之处在于:
[0054]
(1)提出了多视角时空学习策略,从时间、空间、时空三个视角综合分析时 空特征,最大限度地利用多视角训练来修复路网数据。
[0055]
(2)设计了两个具有独立参数的生成器来分阶段捕获时间和空间特征。多阶 段时空特征插补使模型更加灵活。
[0056]
(3)首次将gan,gcn,bilstm和注意力机制结合应用到交通流数据插 补的场景中。
附图说明
[0057]
图1是本发明的整体流程图
[0058]
图2是本发明所使用的bilstm_att时间模型流程图
[0059]
图3是本发明所使用的gcn空间模型流程图
[0060]
图4是本发明实例中本发明与其他方法在均方根误差(rmse)评估指标下的 效果对比图
[0061]
图5是本发明实例中本发明与其他方法在平均绝对误差(mae)评估指标下 的效果对比图
[0062]
具体实施方法
[0063]
下面结合美国加州高速公路发现实例对本发明进行进一步描述。
[0064]
本实例中的交通数据修复方法整体框架如图1所示,具体包括以下步骤:
[0065]
(1)确定需要进行交通数据修复的路段,通过道路传感器采集该路段的原 始数据并进行预处理,以确保数据的规范化和可用性:
[0066]
从pems官网获取公开数据集pems04和pems08,然后对数据进行预处 理,构造出我们需要的初始化数据,本发明所用到的数据集统计如表1所示,其 中数据采集周期为两个月,检测器每间隔五分钟采集一条数据,每天288条数据, 本发明主要在交通流特征上进行了数据修复实验,前80%数据用作训练集,后20%数据用作测试集,具体信息如下:
[0067][0068]
表1
[0069]
(2)使用预处理的数据,捕获交通数据的时间特征,利用bilstm_att模 型学习时间特征分布,bilstm_att结构如图2所示,通过时间生成器和鉴别 器对其进行时间视角的数据插补:
[0070]
2.1:基于步骤(1)中所得到交通流数据,构造长短期记忆网络(lstm), 通过学习交通数据的时间特性,模拟生成与真实数据相似的样本。lstm存储单 元由遗忘门f
t
、输入门i
t
、输出门o
t
控制,可以根据门的状态丢弃或者增加信息, 它们通过下面的公式进行门和单元的信息更新:
[0071][0072]
其中x
t
=(x
1t
,x
2t
,...,x
nt
)表示变量的第t个时间间隙所有路口观察值,w矩阵 表示网络参数。
[0073]
2.2:通过反向lstm进行特征提取,交通数据的前向时间信息和后向时间 信息都可能对当前时刻的交通状态产生一定影响,本发明通过反向lstm对交 通流数据进行逆时序处理,再将前向和后向的输出向量进行拼接后得到该时刻的 最终特征表达;
[0074]
2.3:通过bilstm模型处理后,将结果置入attention层进行噪声信息与重 点信息的筛选。attention层可以有效捕捉道路传感器在不同时间点之间的关系, 从而更好地捕获交通路网的时间特征。具体是通过计算每个时序的权重,然后对 所有时序的向量进行加权求和来作为特征向量,由此产生时间生成器的输出,计 算公式如下:
[0075][0076]
其中矩阵u=[u1,u2,...,u
t
]∈d
n*t
(t为时间长度),这里u
t
=bilstm(x
t
), x
t
=(x
1t
,x
2t
,...,x
nt
)表示变量的第t个时间间隙所有路口观察值。
[0077]
2.4:根据2.1、2.2和2.3构成了bilstm_att模型,其作为时间生成器g
t
的内核,时间生成器与鉴别器共同模拟了交通路网时间特征分布。在训练过程中, 采用mse作为损失函数,adam作为优化函数,在模型的循环迭代中loss逐渐降 低至趋于稳定,时间生成器损失l
g1
计算公式如下:
[0078][0079]
(3)捕获交通数据的空间特征,利用gcn模型对路网的空间分布进行学习, 通过空间生成器和鉴别器对其进行空间视角的数据插补:
[0080]
3.1:对步骤(2)得到的插补结果进行预处理,保留具有真实值的位置,并 将生成的数据填充到缺失位置,从而提高观察值对模型的引导力,计算公式如下:
[0081][0082]
3.2:按照3.1中所得到插补数据构造图卷积神经网络(gcn)所需要的 节点特征和邻接矩阵,gcn模型结构如图3所示。在训练过程中,采用mse作 为损失函数,adam作为优化函数,在模型的循环迭代中loss逐渐降低至趋于稳 定。将数据经过gcn模型的处理,最终得到嵌入了空间特征学习的交通流插 补结果x
gcn
,计算公式如下:
[0083][0084]
3.3:根据3.1和3.2构成了空间生成器gs的内核,空间生成器与鉴别器共同 模拟了独立的路网空间特征分布学习,空间生成器损失l
g2
计算公式如下:
[0085][0086]
(4)结合步骤(2)和(3)所得的结果进行时空联合训练,实现从三个角度 进行数据修复。在模型的训练过程中,我们采用adam梯度下降算法进行参数优 化和学习率调整,得到高质量的数据插补结果:
[0087]
4.1:对时间生成器与空间生成器模拟的交通流数据进行预处理,计算公式如 下:
[0088][0089]
4.2:对预处理后的交通流数据进行时空鉴别器判别真伪,鉴别器损失计算公 式如下:
[0090][0091]
4.3:最终整体模型实现minmax目标为:
[0092][0093]
重复(2)、(3)和(4)的步骤,使得生成器和判别器不断优化,在相互博弈 中达到动态平衡,从而实现高精度的交通数据修复效果。
[0094]
(5)利用上述交通数据修复模型修复采集路段的交通数据。
[0095]
最终,本发明实现了对路网缺失数据的有效修复,图4展示的是不同方法在 pems04数据集和均方根误差(rmse)评价指标下的对比图,图5展示的是不 同方法在pems08数据集和平均绝对误差(mae)评价指标下的对比图。经过 对比其它算法,可以发现本发明提出的基于多视角时空对抗框架方法(mst-gan) 在数据修复方面相较于其它方法具有一定的优势,对于提高城市服务质量、构建 智慧城市、推进交通事业的发展具有重要意义。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1