基于时空对比自监督的城市细粒度流量预测方法及系统与流程

文档序号:28595026发布日期:2022-01-22 10:10阅读:106来源:国知局
基于时空对比自监督的城市细粒度流量预测方法及系统与流程

1.本发明属于智慧交通技术领域,尤其涉及一种基于时空对比自监督的城市细粒度流量预测方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
3.智慧城市是人工智能技术在交通流量数据上的应用。它包括道路流量监控、交通信号控制、交通信息采集和引导和智能交通方面。其中智能交通作为其中的重要组成部分。它需要对当地全局进行细粒度城市流量监控,有助于规划城市路段、削减交通拥堵风险。
4.目前针对城市流量进行监控的技术,一方面是通过在城市内部署大量监控流量的传感器设备,但是运行和维护的成本高;另一方面是通过图像超分辨率的方法,对城市流量数据进行结构化处理。现有的细粒度流量预测方法存在模型复杂、参数量过多和训练周期长等问题,并且未考虑流量数据时空特性等问题。


技术实现要素:

5.为克服上述现有技术的不足,本发明提供了一种基于时空对比自监督的城市细粒度流量预测方法及系统,基于对比自监督思想构建空间编码器和时间编码器,充分考虑空间维度上区域级流量的相似性及时间维度上全局流量分布的相似性,从而提高了预测准确度。
6.为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
7.一种基于时空对比自监督的城市细粒度流量预测方法,包括以下步骤:
8.获取待预测城市的一段时间的多幅流量分布图,并基于每一幅流量分布图构造细粒度流量分布图和粗粒度流量分布图;
9.对所述粗粒度流量分布图根据图中区域之间的相似性进行对比自监督学习,得到空间编码器;
10.对特定时刻粗粒度流量分布图,根据其与其他时刻流量分布图之间的相似性进行对比自监督学习,得到时间编码器;
11.基于所述细粒度流量分布图和粗粒度流量分布图,训练细粒度流量预测模型,用于所述区域细粒度流量的预测;所述细粒度流量预测模型包括用于将空间编码器和时间编码器组合的拼接层、解码器和上采样层。
12.进一步地,构造细粒度流量分布图和粗粒度流量分布图方法为:
13.根据流量分布数据得到细粒度流量分布图,并按照设定的粗细粒度放缩因子得到粗粒度流量分布图。
14.进一步地,对所述粗粒度流量分布图根据图中区域之间的相似性进行对比自监督学习,得到空间编码器包括:
15.对所述粗粒度流量分布图进行高层语义特征提取;随机选定锚点区域,基于高层语义特征将该区域与同一幅图中其他区域进行相似性度量,获取正样本集合和负样本集合,进行对比自监督学习。
16.进一步地,通过对比自监督学习得到时间编码器包括:
17.对所述粗粒度流量分布图进行高层语义特征提取;将特定时刻的粗粒度流量分布图作为锚点;基于高层语义特征将该时刻与其他时刻进行相似性度量,获取正样本集合和负样本集合,进行对比自监督学习。
18.进一步地,采用多层感知机进行高层语义特征提取。
19.进一步地,所述解码器为带有relu激活函数的卷积层。
20.进一步地,所述细粒度流量预测模型训练过程中,还设有结构性约束条件,要求下采样粗粒度流量分布图中区域流量之和等于粗粒度流量分布图中相应区域流量大小。
21.一个或多个实施例提供了一种基于时空对比自监督的城市细粒度流量预测系统,包括:
22.训练数据获取模块,用于获取待预测城市的一段时间的多幅流量分布图,并基于每一幅流量分布图构造细粒度流量分布图和粗粒度流量分布图;
23.空间对比自监督学习模块,用于对所述粗粒度流量分布图根据图中区域之间的相似性进行对比自监督学习,得到空间编码器;
24.时间对比自监督学习模块,用于对特定时刻粗粒度流量分布图,根据其与其他时刻流量分布图之间的相似性进行对比自监督学习,得到时间编码器;
25.流量预测模型训练模块,用于基于所述细粒度流量分布图和粗粒度流量分布图,训练细粒度流量预测模型,用于所述区域细粒度流量的预测;所述细粒度流量预测模型包括用于将空间编码器和时间编码器组合的拼接层、解码器和上采样层。
26.一个或多个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述基于时空对比自监督的城市细粒度流量预测方法。
27.一个或多个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述基于时空对比自监督的城市细粒度流量预测方法。
28.以上一个或多个技术方案存在以下有益效果:
29.提出一种基于时空对比自监督进行城市细粒度流量预测的方法,针对流量数据特征,基于对比自监督思想构建空间编码器和时间编码器,充分考虑空间维度上区域级流量的相似性及时间维度上全局流量分布的相似性,使城市细粒度流量预测模型具有丰富的时空数据特性,从而提高了预测准确度。
30.在结合空间编码器和时间编码器进行最终细粒度流量预测模型训练过程中,通过设定结构性约束,保证细粒度区域的流量之和严格等于相应粗粒度流量大小,进一步提升了预测效果。与以往的城市流量预测模型相比具有网络简单、参数量少、训练周期短、预测效果好等特点。
附图说明
31.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示
意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
32.图1为本发明实施例中基于时空对比自监督进行城市细粒度流量预测方法流程图;
33.图2为本发明实施例中粗粒度和细粒度流量分布图及结构性约束示意图;
34.图3为本发明实施例中空间编码器训练流程图;
35.图4为本发明实施例中城市区域内总流量随时间的变化趋势图;
36.图5为本发明实施例中时间编码器训练流程图;
37.图6为本发明实施例中基于时空对比自监督进行城市细粒度流量预测模型整体架构示意图。
具体实施方式
38.应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
39.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
40.在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
41.对比自监督技术介绍:机器学习中的基本方法有监督学习、半监督学习和无监督学习。它们最大的区别是模型在训练时是否需要人工标注的标签信息,监督学习利用大量的标签数据来训练模型,使模型最终学习到输入和输出标签之间的相关性;半监督学习利用少量有标签的数据和大量无标签的数据来训练网络;而无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间的关系。其中对比自监督属于无监督学习的一种,通过建立正负样本对来加强正样本之间的特征关系,从而拉远与负样本之间的距离。
42.实施例一
43.城市细粒度流量预测旨在根据观察得到的粗粒度流量(人流量、自行车流量、车流量)推断城市中细粒度流量。本实施例公开了一种基于时空对比自监督进行城市细粒度流量预测方法,运用自监督方法来预测细粒度的城市流量,根据流量数据的时空特性,设计两种辅助任务网络,使简单的网络结构能够从数据中获得强大的表示能力,然后结合两个预训练的编码器微调网络来进行城市细粒度的流量预测。具体来讲,流量数据具有时空特性。从空间角度上,在一个城市中,具有相同职能的城市区域有很多(例如:办公区、娱乐区和居住区等),它们在地理位置上分布不同但具有相似的流量分布状况。针对空间角度设计区域对比自监督,区域对比自监督目的是使相同职能的城市区域特征彼此相近,而使不同职能区域特征远离。从时间角度上,交通流量数据具有周期性和邻近性。在主要的城市干道,上下班通勤期间流量相似。针对时间角度设计时间对比自监督,时间对比自监督目的是使相似流量时刻的特征彼此相近,而使不相似流量时刻特征远离。通过两个自监督任务的训练,使两个编码器分别学习数据的时空特性,最后微调两个编码网络进行城市细粒度流量预测。
44.如图1和图6所示,所述方法具体包括以下步骤:
45.步骤1:获取待预测城市的一段时间的多幅流量分布图,并基于每一幅流量分布图构造细粒度流量分布图和粗粒度流量分布图。
46.其中,流量分布图从公开的数据网站获得,包括行人数据、自行车数据和机动车数据,对其进行预处理。
47.根据经纬度划分尺度不同,我们可以得到粗粒度流量分布图和细粒度流量分布图,并确定粗细流量分布图之间的放缩因子n∈z
+
,例如图2的放缩因子n=2。最终得到粗粒度流量分布图和细粒度流量分布图。构造城市细粒度流量预测任务:
[0048][0049]
本实施例首先获取细粒度流量分布图,然后根据设定的放缩因子对所述细粒度流量分布图进行处理,得到粗粒度流量分布图。
[0050]
步骤2:对所述粗粒度流量分布图根据图中区域之间的相似性进行对比自监督学习,得到空间编码器。
[0051]
现有的城市细粒度流量预测中仅考虑邻近区域的流量情况,而忽略语义信息相似但距离不相似的区域。本实施例设计了一种空间对比自监督网络(reg),下称空间编码器,包括高层语义特征提取模块和对比自监督学习模块。所述高层语义特征提取模块采用多层感知机,对粗粒度流量分布图进行高层语义特征提取;所述对比自监督学习模块随机选定区域作为锚点,基于高层语义特征将该区域与同一幅图中其他区域进行相似性度量,获取正样本集合和负样本集合,进行对比自监督学习,并采用对比损失函数对所述空间编码器进行评估。若对比损失函数的值不满足设定条件,则选择其他区域作为锚点,继续进行学习,若满足设定条件,则停止迭代。
[0052]
具体地,对于粗粒度流量分布图首先通过多层感知机将其变化为高层语义表示z
reg
∈r
hw
×c。从高层语义表示中选取锚点xq,通过计算锚点区域和其他区域之间的欧式距离得出正样本和负样本。计算对比损失函数:
[0053][0054]
其中sim(u,v)是计算特征之间相似度函数(例如,内积或者余弦相似度)。通过这样的方式,正样本之间的特征彼此拉近,而使与负样本的特征距离远离。
[0055]
如图3所示,空间对比自监督预训练过程中,在当前粗粒度流量分布图中,有许多相似的流量区域。随机选取一个区域记为锚点xq,流量相似的区域和不相似的区域命名为正样本和负样本。因为正样本和负样本在流量大小上展现出不同的分布状况,这种特性在它们的高层语义信息表现应该是相同的。
[0056]
步骤3:对特定时刻粗粒度流量分布图,根据其与其他时刻流量分布图之间的相似性进行对比自监督学习,得到时间编码器,包括高层语义特征提取模块和对比自监督学习模块。
[0057]
现有的城市细粒度流量预测仅根据粗粒度流量分布图来推断细粒度流量分布图,
而忽略了不同时刻对流量推断的影响。本实施例设计了一种时间对比自监督网络(tcn),下称时间编码器,包括高层语义特征提取模块和对比自监督学习模块。所述高层语义特征提取模块采用多层感知机,对粗粒度流量分布图进行高层语义特征提取;所述对比自监督学习模块对所述粗粒度流量分布图进行高层语义特征提取;将特定时刻的粗粒度流量分布图作为锚点;基于高层语义特征将该时刻与其他时刻进行相似性度量,获取正样本集合和负样本集合,进行对比自监督学习。并且,监督过程中,还执行自监督辅助任务,用于缩小锚点和正样本之间的编码特征差异,并使负样本特征与锚点特征远离。
[0058]
如图4和图5所示,根据每个时刻流量图的总流量绘制一条曲线发现流量数据具有周期性。时间对比自监督过程中,在任何一个时间戳,我们可以得到锚点a,计算锚点与其他时间戳上流量分布图的欧式距离可以得到正样本集(如图中b点所处时刻)和负样本集(如图中c点和d点所处时刻)。根据正负样本集中选出一个与锚点最相似的流量分布图和最不相似的流量分布图。
[0059]
所述自监督辅助任务采用triplet loss,使锚点和正样本的高层语义表示更为相近,而使与负样本之间的表现远离。给定一组粗粒度视图triplet loss计算如下:
[0060][0061][0062]
其中f(
·
)是可学习的非线性变换,α是正边界参数。
[0063]
步骤4:基于所述细粒度流量分布图和粗粒度流量分布图,训练细粒度流量预测模型,用于所述区域细粒度流量的预测。
[0064]
通过步骤2和步骤3的预训练,我们分别得到空间编码器enc
reg
和时间编码器enc
tcn
,它们含有丰富的时空数据特征。然后结合预训练得到的空间编码器和时间编码器,训练细粒度流量预测模型。
[0065]
所述细粒度流量预测模型包括依次连接的用于将空间编码器和时间编码器组合的拼接层、解码器和上采样层。
[0066]
其中,所述拼接层用于对两个编码器特征进行张量拼接操作:
[0067]hreg
=enc
reg
(xc)
ꢀꢀꢀ
(5)
[0068]htcn
=enc
tcn
(xc)
ꢀꢀꢀ
(6)
[0069]
ha=concat(h
reg
,h
tcn
)
ꢀꢀꢀ
(7)
[0070]
其中concat是张量拼接操作得到ha∈rh×w×
2c

[0071]
所述解码器为一个带有relu激活函数的卷积层,用于对其进行非线性变换得到hd∈rh×w×c:
[0072]
hd=relu(conv(ha))
ꢀꢀ
(8)
[0073]
所述上采样层,用于对于解码器得到的hd,使用上采样操作对其进行尺寸扩展和特征降维:
[0074]
uf=upsampling(hd)
ꢀꢀꢀ
(9)
[0075][0076]
其中uf∈r
nh
×
nw
×c,
[0077]
为了进一步提高流量预测的准确性,在细粒度流量预测阶段还引入结构性约束。如图2所示,我们将某个区域的流量根据划分尺度不同分为(a)粗粒度流量分布图和(b)细粒度流量分布图。城市细粒度流量预测是根据(a)粗粒度流量分布图来推断(b)细粒度流量分布图,但是城市细粒度流量预测具有严格的结构性约束,要求细粒度区域的流量之和严格等于相应粗粒度流量大小。因此设计一个归一化约束:
[0078][0079]
其中是中的第i行和第j列的区域,并且表示概率值。最终预测细粒度流量分布图其中

表示元素乘法。用均方误差作为损失函数进行计算:
[0080][0081]
其中f表示微调模型,θ表示模型中可学习的参数。
[0082]
分别将所述细粒度流量分布图和粗粒度流量分布图作为模型的输出和输入进行训练,即得到细粒度流量预测模型。
[0083]
实施例二
[0084]
本实施例的目的是提供一种基于少样本的城市细粒度流量预测系统,所述系统包括:
[0085]
训练数据获取模块,用于获取待预测城市的一段时间的多幅流量分布图,并基于每一幅流量分布图构造细粒度流量分布图和粗粒度流量分布图;
[0086]
空间对比自监督学习模块,用于对所述粗粒度流量分布图根据图中区域之间的相似性进行对比自监督学习,得到空间编码器;
[0087]
时间对比自监督学习模块,用于对特定时刻粗粒度流量分布图,根据其与其他时刻流量分布图之间的相似性进行对比自监督学习,得到时间编码器;
[0088]
流量预测模型训练模块,用于基于所述细粒度流量分布图和粗粒度流量分布图,训练细粒度流量预测模型,用于所述区域细粒度流量的预测;所述细粒度流量预测模型包括用于将空间编码器和时间编码器组合的拼接层、解码器和上采样层。
[0089]
实施例三
[0090]
本实施例的目的是提供一种电子设备。
[0091]
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如实施例一中所述的方法。
[0092]
实施例四
[0093]
本实施例的目的是提供一种计算机可读存储介质。
[0094]
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现
如实施例一中所述的方法。
[0095]
以上实施例二至四中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0096]
现有的城市细粒度流量预测方法具有模型复杂、参数量过多、训练周期长和未考虑流量数据时空特性等问题。针对流量数据特征,本发明采用对比自监督思想设计两种自监督辅助任务来帮助学习流量数据特性,在此提出一种基于时空对比自监督进行城市细粒度流量预测方法。该方法的空间对比侧重基于内在空间探索区域级流量相似性;时间对比侧重探索全局流量分布相似性。通过建立正负样本对,使锚点与正样本之间的特征相似,从而远离负样本特征。通过训练两个简单的网络结构,使城市细粒度流量预测模型具有丰富的时空数据特性,大大提升了预测效果。本发明与以往的城市流量预测模型相比具有网络简单、参数量少、训练周期短、预测效果好等特点。
[0097]
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0098]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1