一种基于多视角时间矩阵分解的缺失交通数据修复方法

文档序号:32305720发布日期:2022-11-23 09:55阅读:70来源:国知局
一种基于多视角时间矩阵分解的缺失交通数据修复方法

1.本发明涉及智能交通技术领域,具体来说,涉及一种基于多视角时间矩阵分解的缺失交通数据修复方法。


背景技术:

2.随着感知技术、计算机技术和通信技术的日渐成熟,大量分布在城市路网的移动传感器与固定检测器海量获取了时空交通数据,为智能交通系统(its)的高质量稳定运行提供了保证。然而,由于部分交通数据天然的稀疏性以及检测系统的软硬件故障,导致交通数据缺失已成为不可忽视的问题。一般而言,交通数据的缺失类型包括随机缺失(rm)、聚类缺失(cm),每种类型的缺失比率根据实际环境而变化。因而,由不同缺失类型和缺失比率混合所形成的复杂缺失数据给交通数据处理带来了巨大的挑战。因此,发展能够准确修复缺失交通数据的新方法已成为its的关键研究之一。
3.目前,交通数据的修复方法主要包括均值插值、线性时序插值、历史平均法、矩阵分解(陈小波,陈程,陈蕾,等.基于改进低秩矩阵补全的交通量数据缺失值插补方法[j].交通运输工程学报,2019,19(5):180-190.doi:10.3969/j.issn.1671
‑ꢀ
1637.2019.05.019.)。这些算法在特殊条件下都取得了一定的修复效果,但随着交通环境等因素的变化,这些传统的修复模型无法很好的捕捉复杂交通数据的时空特性,导致缺失交通数据的修复精度低,泛化能力较差。


技术实现要素:

[0004]
为克服现有技术的不足,本发明提供一种基于多视角时间矩阵分解的缺失交通数据修复方法。该方法在整合有效的截断机制基础上,利用矩阵分解技术从不同时间角度对交通数据建模,并通过局部残差反馈的方式融合时间矩阵分解模型的输出结果。该方法深度挖掘了城市路网的时空特性,有效提高了缺失交通数据的修复性能。
[0005]
本发明的目的至少通过如下技术方案之一实现。
[0006]
一种基于多视角时间矩阵分解的缺失交通数据修复方法,包括以下步骤:
[0007]
s1、获取城市路网原始交通数据集并将其合理矩阵化,得到原始交通数据矩阵;
[0008]
s2、从矩阵时间维与空间维分别剖析交通数据的时空交叉耦合特性,并从时间邻近性、周期性及趋势性角度重塑原始交通数据矩阵,得到多个时间矩阵;
[0009]
s3、采用向量自回归过程依次对多个时间矩阵进行分解与重构,多个时间矩阵对应的子模型采用多元高斯分布假设及gibbs采样进行模型参数推断和更新;
[0010]
s4、引入一种截断机制,局部定向减少各子模型的输出残差,采用多种伸缩与填充系数组合提升模型修复性能;
[0011]
s5、利用局部反馈方法逐步融合多个子模型输出,促使交通数据修复结果最优,最终建立一个多视角时间矩阵修复模型;
[0012]
s6、利用真实交通数据集对多视角时间矩阵修复模型进行训练与性能评估。
[0013]
进一步地,步骤s1具体如下:
[0014]
获取城市路网原始交通数据并将其矩阵化,所得完整的原始交通数据矩阵为:
[0015][0016]
其中,表示原始交通数据矩阵;i代表城市路网中传感器的数量;j代表城市路网中传感器工作的时间点;行向量表示第i个传感器在所有时间点上采集的交通数据;列向量表示所有传感器在第j个时间点上采集的交通数据;x
ij
代表第i个传感器在第j个时间点上采集的原始交通数据。
[0017]
进一步地,步骤s2具体包括以下步骤:
[0018]
s2.1从矩阵时间维和空间维分别剖析原始交通数据固有的时空交叉耦合特性;
[0019]
(1)空间相关性:城市路网中所有传感器在同一时间点采集的交通数据因道路环境与人类活动而相互关联。一般而言,传感器的距离或位置越近,交通数据的空间相关性越强,越有利于缺失交通数据修复;
[0020]
(2)时间相关性:每个传感器在不同时间点上采集的交通数据相互影响,如某个传感器在相邻时间/相邻天的相同时间/相邻周的相同天所在的相同时间上采集的交通数据相关性程度高。一般而言,时间上越相近,交通数据的时间关联性越强;
[0021]
(3)时空依赖性:城市路网中信息传播沿空间维和时间维同时发生,交通数据在三维路网环境下呈现出时空依赖性。具体表现为传感器在下一个时间点影响其相邻传感器的交通数据。由于空间距离和时间范围的限制,这种复杂的时空特征通常是局部的。一般来说,空间上越相邻且时间上越相近,交通数据之间的时空依赖性越强。
[0022]
s2.2假设传感器的工作天数为每天按固定时间间隔采集到个交通数据,则交通数据矩阵可以改写为基于数据的时空交叉耦合特性,依次从时间

邻近性’、

周期性’及

趋势性’角度重塑原始交通数据矩阵分别形成如下不同形状的时间矩阵:
[0023]
·

邻近性’时间矩阵时间矩阵
[0024]
·

日周期性’时间矩阵时间矩阵
[0025]
·

周周期性’时间矩阵时间矩阵
[0026][0027]
·

月趋势性’时间矩阵时间矩阵
[0028][0029]
其中,和分别表示相邻周和相邻月的天数集合;对上述

邻近性’、

日周期性’、

周周期性’和

月趋势性’时间矩阵分别建模,就可以从不同角度挖掘交通数据的时空特性,最大程度提高缺失交通数据的修复精度。
[0030]
进一步地,步骤s3中,对于

邻近性’时间矩阵

日周期性’时间矩阵

周周期性’时间矩阵以及

月趋势性’时间矩阵分别进行如下近似分解:
[0031][0032]
其中,同时代表同时代表为空间特性矩阵;为时间特性矩阵。
[0033]
进一步地,采用向量自回归(var)过程表征时间特性矩阵的每个时间分量
[0034][0035]
其中,每个系数矩阵大小为它代表了部分隐藏空间;δ表示var 的阶数;表示时间滞后集;ej代表高斯噪声矩阵。
[0036]
进一步地,假设所有x
ij
都满足如下精度为τi的高斯分布:
[0037][0038]
其中,τi符合gamma先验τi~gamma(α,β),α和β分别代表形状和比率参数;
[0039]
满足多元高斯分布超参数使用共轭gaussian

wishart 先验求解:
[0040][0041]
其中,为平均向量;w(w0,υ0)满足wishart分布,尺度矩阵w0大小为υ0为自由度。
[0042]
进一步地,对于每个时间矩阵,系数矩阵执行共轭矩阵正态逆先验 (mniw),即
并且,并且,的概率密度函数表述为:
[0043][0044]
其中,协方差矩阵协方差矩阵m0为给定的初始矩阵;应用非信息性先验确定所有常值参数,并采用gibbs采样更新
[0045]
进一步地,步骤s4具体如下:
[0046]
设置步骤s3中每个子模型输出的修复矩阵为l为r、d、w或m,引入一种截断机制以局部定向减少各子模型输出残差;所述截断机制首先利用伸缩系数进行如下计算:
[0047][0048]
其中,记为各时间矩阵建模后经伸缩处理所产生的残差矩阵;如果残差矩阵满足即残差矩阵中元素大于修复矩阵o
l
中对应位置的元素,则利用填充系数φ替换残差矩阵的对应元素。
[0049]
进一步地,步骤s5具体如下:
[0050]
利用一种局部反馈方法按如下公式逐步融合各个子模型的输出结果
[0051][0052]
其中,表示残差矩阵的方向矩阵;符号表示矩阵间的哈达玛积;通过不同角度对时间矩阵建模,充分挖掘交通数据的时空依赖特性,保证缺失数据的修复性能最佳。
[0053]
进一步地,步骤s6具体如下:
[0054]
利用平均绝对百分比误差mape、均方根误差rmse和平均绝对误差mae 对修复结果进行评价,计算公式如下:
[0055][0056][0057]
[0058]
其中,ω代表交通数据矩阵中已观察数据的索引集合,|ω|代表ω的大小;x
ij
和分别代表真实的交通数据值及其修复值。
[0059]
本发明的有益效果主要表现在:利用矩阵分解从多角度提取城市路网交通数据集的时空特性,建立可靠的交通数据修复模型。其中,gibbs采样执行模型推断和参数更新,截断机制作用于各子模型的输出以促使局部残差值不断减少,局部反馈方法融合所有子模型的输出结果,有效提高了交通数据的修复性能。
附图说明
[0060]
图1是本发明的一种基于多视角时间矩阵分解的缺失交通数据修复方法的流程图。
[0061]
图2是本发明的修复模型在截断机制下不同伸缩系数对模型评价指标的影响变化图。
[0062]
图3是本发明的修复模型在广州交通速度数据集上对路段1从2016年8月 1日到2016年8月10日的交通数据修复结果示意图。
具体实施方式
[0063]
为了更清楚地说明本发明的技术方案,下面结合附图对示例性实施例进行说明。
[0064]
实施例1:
[0065]
一种基于多视角时间矩阵分解的缺失交通数据修复方法,如图1所示,包括以下步骤:
[0066]
s1、获取城市路网原始交通数据集并将其合理矩阵化,得到原始交通数据矩阵,具体如下:
[0067]
获取城市路网原始交通数据并将其矩阵化,所得完整的原始交通数据矩阵为:
[0068][0069]
其中,表示原始交通数据矩阵;i代表城市路网中传感器的数量;j代表城市路网中传感器工作的时间点;行向量表示第i个传感器在所有时间点上采集的交通数据;列向量表示所有传感器在第j个时间点上采集的交通数据;x
ij
代表第i个传感器在第j个时间点上采集的原始交通数据。
[0070]
s2、从矩阵时间维与空间维分别剖析交通数据的时空交叉耦合特性,并从时间邻近性、周期性及趋势性角度重塑原始交通数据矩阵,得到多个时间矩阵,具体包括以下步骤:
[0071]
s2.1从矩阵时间维和空间维分别剖析原始交通数据固有的时空交叉耦合特性;
[0072]
(1)空间相关性:城市路网中所有传感器在同一时间点采集的交通数据因道路环境与人类活动而相互关联。一般而言,传感器的距离或位置越近,交通数据的空间相关性越强,越有利于缺失交通数据修复;
[0073]
(2)时间相关性:每个传感器在不同时间点上采集的交通数据相互影响,如某个传感器在相邻时间/相邻天的相同时间/相邻周的相同天所在的相同时间上采集的交通数据相关性程度高。一般而言,时间上越相近,交通数据的时间关联性越强;
[0074]
(3)时空依赖性:城市路网中信息传播沿空间维和时间维同时发生,交通数据在三维路网环境下呈现出时空依赖性。具体表现为传感器在下一个时间点影响其相邻传感器的交通数据。由于空间距离和时间范围的限制,这种复杂的时空特征通常是局部的。一般来说,空间上越相邻且时间上越相近,交通数据之间的时空依赖性越强。
[0075]
s2.2假设传感器的工作天数为每天按固定时间间隔采集到个交通数据,则交通数据矩阵可以改写为基于数据的时空交叉耦合特性,依次从时间

邻近性’、

周期性’及

趋势性’角度重塑原始交通数据矩阵分别形成如下不同形状的时间矩阵:
[0076]
·

邻近性’时间矩阵时间矩阵
[0077]
·

日周期性’时间矩阵时间矩阵
[0078]
·

周周期性’时间矩阵时间矩阵
[0079]
·

月趋势性’时间矩阵时间矩阵
[0080]
其中,和分别表示相邻周和相邻月的天数集合;对上述

邻近性’、

日周期性’、

周周期性’和

月趋势性’时间矩阵分别建模,就可以从不同角度挖掘交通数据的时空特性,最大程度提高缺失交通数据的修复精度。
[0081]
s3、采用向量自回归过程依次对多个时间矩阵进行分解与重构,多个时间矩阵对应的子模型采用多元高斯分布假设及gibbs采样进行模型参数推断和更新,具体如下:
[0082]
对于

邻近性’时间矩阵

日周期性’时间矩阵

周周期性’时间矩阵以及

月趋势性’时间矩阵分别进行如下近似分解:
[0083][0084]
其中,同时代表同时代表为空间特性矩阵;为时间特性矩阵;采用向量自回归(var)过程表征时间特性矩阵的每个时间分量
[0085][0086]
其中,每个系数矩阵大小为它代表了部分隐藏空间;δ表示var 的阶数;表示时间滞后集;ej代表高斯噪声矩阵;假设所有x
ij
都满足如下精度为τi的高斯分布:
[0087][0088]
其中,τi符合gamma先验τi~gamma(α,β),α和β分别代表形状和比率参数;满足多元高斯分布超参数使用共轭gaussian

wishart 先验求解:
[0089][0090]
其中,为平均向量;w(w0,υ0)满足wishart分布,尺度矩阵w0大小为υ0为自由度;对于每个时间矩阵,系数矩阵执行共轭矩阵正态逆先验(mniw),即并且,并且,的概率密度函数表述为:
[0091][0092]
其中,协方差矩阵协方差矩阵m0为给定的初始矩阵;应用非信息性先验确定所有常值参数,并采用gibbs采样更新
[0093]
s4、引入一种截断机制,局部定向减少各子模型的输出残差,采用多种伸缩与填充系数组合提升模型修复性能,具体如下:
[0094]
设置步骤s3中每个子模型输出的修复矩阵为l为r、d、w或m,引入一种截断机制以局部定向减少各子模型输出残差;所述截断机制首先利用伸缩系数进行如下计算:
[0095][0096]
其中,记为各时间矩阵建模后经伸缩处理所产生的残差矩阵;如果残差矩
阵满足即残差矩阵中元素大于修复矩阵o
l
中对应位置的元素,则利用填充系数φ替换残差矩阵的对应元素。
[0097]
s5、利用局部反馈方法逐步融合多个子模型输出,促使交通数据修复结果最优,最终建立一个多视角时间矩阵修复模型,具体如下:
[0098]
利用一种局部反馈方法按如下公式逐步融合各个子模型的输出结果
[0099][0100]
其中,表示残差矩阵的方向矩阵;符号表示矩阵间的哈达玛积;通过不同角度对时间矩阵建模,充分挖掘交通数据的时空依赖特性,保证缺失数据的修复性能最佳。
[0101]
s6、利用真实交通数据集对多视角时间矩阵修复模型进行训练与性能评估,具体如下:
[0102]
利用平均绝对百分比误差mape、均方根误差rmse和平均绝对误差mae 对修复结果进行评价,计算公式如下:
[0103][0104][0105][0106]
其中,ω代表交通数据矩阵中已观察数据的索引集合,|ω|代表ω的大小;x
ij
和分别代表真实的交通数据值及其修复值。
[0107]
本实施例中,实施过程如下:
[0108]
(1)选择实验数据:
[0109]
本实施例中,选择的公开交通数据集为中国广州城市路网交通速度数据集,对动态自适应生成对抗网络的修复性能进行实际评估。选择的缺失类型为rm 和cm,缺失比率分别为10%,20%,30%,40%,50%,60%,70%,80%和90%。根据实验测试,设置截断机制的填充系数φ={2,2,2},伸缩系数根据图2设定为2。
[0110]
(2)实验结果展示:
[0111]
在不同缺失类型和比率下,广州交通速度数据集的修复评价指标如表1所示。
[0112]
表1
[0113][0114]
实施例2:
[0115]
本实施例中,选择的公开交通数据集为杭州地铁客流数据集,对动态自适应生成对抗网络的修复性能进行实际评估。
[0116]
杭州地铁客流数据集的修复评价指标如表2所示。
[0117]
表2
[0118]
实施例3:
[0119]
本实施例中,选择的公开交通数据集为metr-la交通速度数据集,对动态自适应生
成对抗网络的修复性能进行实际评估。
[0120]
metr-la交通速度数据集的修复评价指标如表3所示。
[0121]
表3
[0122][0123]
图3为修复模型在广州交通速度数据集上对路段1从2016年8月1日到 2016年8月10日的交通数据的修复结果。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1