一种基于低秩的多源交通数据的补全方法

文档序号:9912384阅读:1427来源:国知局
一种基于低秩的多源交通数据的补全方法
【技术领域】
[0001] 本发明属于图像处理和智能交通的技术领域,具体地涉及一种基于低秩的多源交 通数据的补全方法。
【背景技术】
[0002] 近年来,随着城市化进程的不断推进,城市路网建设的速度已无法满足城市汽车 保有量激增的需求,交通拥堵现象日趋严重。但是由于环境及经济的原因,人们很难再通过 简单的修建或拓宽公路的方法来解决城市交通拥堵问题。因此,如何优化已经存在的交通 路网、引导人们的出行路线,在控制交通拥堵问题中起到了越来越关键的作用。目前,智能 运输系统(ITS)在优化交通路网的工作中扮演了重要的角色。为了能够分析和避免交通拥 堵现象,ITS需要大量完整、准确、实时的交通数据。我国当前已在主要的交通路段安装了大 量不同类型的检测器,如感应线圈检测器,微波传感器,视频检测器等,以便给交通拥堵的 分析提供数据基础。这些检测器可以采集到多种类型的交通流数据,如速度,占有率,交通 流量等。
[0003] 不幸的是,由于检测器自身硬件故障、数据传输失败等原因,我们得到的交通数据 往往会有不同程度的数据丢失或者噪声。这些缺失的交通数据往往会严重制约ITS的分析 性能。因此,获取完整的交通观测数据已经成为亟待解决的重要问题。
[0004] 机器学习算法在一些矩阵补全应用上取得的巨大成功吸引了我们的目光,其挖掘 数据中隐含信息的能力为交通数据补全指明了新的研究方向。传统的矩阵补全任务是指依 据一个矩阵中的部分观测数据来预测其丢失的数据,它广泛的应用于图像恢复、图像去噪 等。这些数据的内部结构具有很强的全局相关性,因此秩最小化(低秩)被用作约束重构数 据来恢复丢失部分的数据。尽管探测器采集到的交通数据是离散的,但从空间和时间的角 度来看,同一时间段内的相邻路段采集到的交通数据是相似的(空间相关性),同一路段的 连续时间段内采集到的交通数据是相似的(时间相关性)。所以,基于秩最小化的矩阵填充 算法适用于具有时空相关性的交通数据。最近,一种基于张量表示和秩最小化约束的矩阵 补全方法被应用于道路平均速度数据补全的应用中。该方法将单个探测器在多天、不同时 段采集到的道路平均速度数据表示为张量xeR 1XmXn,其中1表示采集交通数据的天数,m表 示一天中采集交通数据的小时数,η表示每小时采集的交通数据的个数。考虑到道路平均速 度数据在一天中的连续时间段内呈现出周期性的变化,以及在多天的相同时间段表现出历 史相似性,即时间相关性。因此可以通过对重构的张量数据;e作低秩约束来恢复出丢失数 据。尽管这种方法取得了非常好的实验效果,但是它的研究对象只是单个探测器针对数据 的时间相关性,没有考虑多个探测器构造的路网间的空间相关性。另一方面,直接对重构样 本进行低秩约束,使得我们很难根据样本的特性为模型加入更多的信息。
[0005] 由于采集设备的硬件故障或通信故障,通常观测到的交通数据往往会有不同程度 的数据丢失或者噪声。这些缺失的交通数据往往会严重制约ITS的分析性能。因此,我们在 利用交通数据分析交通问题前,需要一种能够尽可能准确的数据补全算法来将交通数据中 的丢失数据进行补全。

【发明内容】

[0006] 本发明的技术解决问题是:克服现有技术的不足,提供一种基于低秩的多源交通 数据的补全方法,其能够使得补全的数据的精准度在数据丢失率较大时大幅提高。
[0007] 本发明的技术解决方案是:这种基于低秩的多源交通数据的补全方法,该方法包 括以下步骤:
[0008] (1)从多源交通数据中构造数据矩阵;
[0009] (2)分别计算每种交通数据矩阵的低秩表示;
[0010] (3)约束每个矩阵的低秩表示彼此之间相似。
[0011] 本发明将低秩表示模型应用到了交通数据补全中,与传统的单一类型交通数据的 补全方法不同,本发明联合多种类型的交通数据(多源交通数据)共同对丢失的数据进行补 全,并引入表示学习模型来挖掘多源交通数据的内部结构并约束其相似,使得补全的精准 度在丢失率$父大时大幅提尚。
【附图说明】
[0012] 图1是根据本发明的多源交通数据的说明图。
[0013] 图2是根据本发明的交通数据的补全方法的流程图。
[0014]图3示出了交通流量数据补全MAPE。
[0015] 图4示出了交通流量数据补全RMSE。
[0016] 图5示出了交通占有率数据补全MAPE。
[0017]图6示出了交通占有率数据补全RMSE。
[0018]图7示出了交通速度数据补全MAPE。
[0019] 图8示出了交通速度数据补全RMSE。
【具体实施方式】
[0020] 如图2所示,这种基于低秩的多源交通数据的补全方法,该方法包括以下步骤:
[0021 ] (1)从多源交通数据中构造数据矩阵;
[0022] (2)分别计算每种交通数据矩阵的低秩表示;
[0023] (3)约束每个矩阵的低秩表示彼此之间相似。
[0024] 本发明将低秩表示模型应用到了交通数据补全中,与传统的单一类型交通数据的 补全方法不同,本发明联合多种类型的交通数据(多源交通数据)共同对丢失的数据进行补 全,并引入表示学习模型来挖掘多源交通数据的内部结构并约束其相似,使得补全的精准 度在丢失率$父大时大幅提尚。
[0025] 优选地,所述步骤(2)中:根据公式(3)计算每种交通数据矩阵的低秩表示
[0026]
[0027] 其中,X(v)表示第v种交通数据的观测矩阵,E(v)和Z(v)分别表示第v种交通数据的重 构误差矩阵和系数矩阵,参数λ和β分别表示调节重构误差项和系数间相关性的权重。
[0028] 优选地,所述步骤(3)中:根据公式(6)迭代分别优化变量J,Z和Υ,
[0029]
[0030] 其中,矩阵Y中的每一个元素表示一个拉格朗日乘子,变量μ是权重参数用来调节 误差项liz-m
[0031] 优选地,所述步骤(3)中为了在第(k+1)次迭代中更新变量Jk+1,固定变量Z和Y的 值,并相应的求解公式(7):
[0032]
) ) £
[0033]首先合并公式(7)中的内积项和F范数项,得到公式(8):
[0034]
C B)
[0035]公式(8)的一个闭合解为:
[0036]
[0037]其中? (·)表示奇异值阈值操作符。
[0038] 优选地,所述步骤(3)中为了在第(k+Ι)次迭代中更新变量Zk+1,固定变量J和Y的 值,并相应的求解公式(9):
[0039]
[0040] 通过对其求导的方法得到一个变量Z的闭合解:
[0041]
[0042] 优选地,所述步骤(3)中在第(k+Ι)次迭代中,更新矩阵¥1{+1通过公式(11):
[0043] Yk+i = Yk+yk(Zk+i-Jk+i) (11)
[0044] 另一个惩罚参数μ>0被更新通过
[0045] ]ik+l-Π 1 iΠ (P]4k,14max)
[0046]其中,ymax是yk的一个上界,一旦收敛条件| | Z-J | |〇〇被满足,就获得最终的低秩表 示Ζ*和恢复后的数据ΧΖ*。
[0047] 以下更详细地说明本发明。
[0048] 基于张量表示和秩最小化约束的矩阵补全方法可以通过对重构的张量数据;e作低 秩约束来恢复出丢失数据。尽管这种方法取得了非常好的实验效果,但是它的研究对象只 是单个探测器针对数据的时间相关性,没有考虑多个探测器构造的路网间的空间相关性。 另一方面,直接对重构样本进行低秩约束,使得我们很难根据样本的特性为模型加入更多 的信息,因此我们决定将低秩表示(LRR)引入到我们的模型中。
[0049]我们的研究对象是交通路网中多个传感器一段时间的数据构成的矩阵或者张量, 通过约束数据中的时间相似性和空间相关性来补全丢失数据。与传统的关于低秩约束的算 法直接约束重构样本本身不同,低秩表示算法是在样本自表示的基础上,对系数矩阵进行 低秩约束的。这样我们就可以对系数矩阵添加交通数据的时空约束,即间接的对重构样本 添加时空约束,使得算法更贴近交通数据补全的应用。由于探测器在同一时刻可以观测到 多种类型的交通数据,这些不同类型的交通数据存在有相似的内部结构。因此,除了时间相 似性和空间相关性,我们又联合多种类型交通数据的结构相关性(即多源异构数据)来共同 补全丢失数据。
[0050]多源异构数据是由多种不同属性的信息构成的数据,这些数据通常会分享一些彼 此相关的信息,如数据内部结构上的相似性。通过挖掘多源异构数据结构上的相关性可以 改善算法的性能。在交通工程中,我们通常使用平均速度、流量、占有率三个指标来描述一 段公路的拥堵状况。在平均速度发生变化时,流量和占有率的数值可能会产生相似的变化 趋势。同理,另外两个影响因素各自变化时,也会产生同样的效果。因此,本文中我们约束这 三种交通数据具有相似的内部结构,从而间接地利用三种交通数据的联系
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1