一种通勤数据生成方法及系统

文档序号:27250549发布日期:2021-11-03 20:30阅读:264来源:国知局
一种通勤数据生成方法及系统

1.本发明涉及数据生成技术领域,尤其涉及一种通勤数据生成方法及系统。


背景技术:

2.通勤数据生成(commuting flow generation)是在由于基础设施不完善等原因而无法获取通勤数据的城市生成接近真实的通勤数据。城市中人群的通勤信息是非常有价值的,它可以反映出城市中早晚高峰的人口流动的规律,通过发掘其中的规律,可以更加科学地指导城市中资源的合理分配,比如优化路网的设置,公交车辆的合理调度以及安保资源的分配等。群体视角的人群通勤规律既可以发挥其城市发展的参考作用又避免了个体隐私的泄露。
3.传统的城市人口通勤信息获取的方法通常为普查的方式,进行精准到人的问卷调查,需要花费很高的时间和金钱成本。随着移动互联网设备的普及,可以通过采集到的海量的个体gps(global positioning system)移动轨迹数据提取到人口的通勤信息,但是由于发展中城市以及新兴城市基础设施不够完善,无法通过这种现代化手段进行通勤信息的获取,所以使用区域属性信息来生成通勤人流的研究就逐渐发展开来。然而目前生成通勤人流的技术存在对数据匮乏的目标城市进行模型建模没有考虑空间拓扑对人口流动的影响,导致模型得到的人流数据结果较差,从而导致生成通勤数据不够真实可靠的问题。


技术实现要素:

4.本发明实施例提供一种通勤数据生成方法及系统,用以解决目前在人口移动数据缺乏的目标城市生成可靠准确的通勤数据的问题。
5.第一方面,本发明实施例提供一种通勤数据生成方法,包括:
6.确定待生成通勤数据的目标城市人口普查数据;
7.将所述待生成通勤数据的目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据;
8.其中,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。
9.进一步地,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的,包括:
10.基于分别划分为若干区域的源城市和目标城市的地图数据得到包含区域邻接关系的源城市拓扑结构数据和目标城市拓扑结构数据;
11.基于所述源城市拓扑结构数据和目标城市拓扑结构数据构建所述图神经网络模型,并基于所述历史保存的人口普查数据聚合得到包括源城市拓扑结构数据在内的源城市的区域静态属性数据和包括目标城市拓扑结构数据在内的目标城市的区域静态属性数据;
12.将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型后进行自适应对抗训练,得到所述通勤数据生成模型。
13.进一步地,将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型后进行自适应对抗训练,得到所述通勤数据生成模型,包括:
14.将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型,得到起点区域特征、终点区域特征和起点终点区域连通性特征拼接的区域对特征;
15.将所述区域对特征与距离直接元素相乘得到增强距离的二阶特征,将所述起点区域特征、终点区域特征、起点终点区域连通性特征和增强距离的二阶特征拼接,得到新的区域对特征;
16.基于所述新的区域对特征进行自适应对抗训练后得到所述通勤数据生成模型。
17.进一步地,所述图神经网络模型包括起点图注意力网络、终点图注意力网络和图同构网络;
18.将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型,得到起点区域特征、终点区域特征和起点终点区域连通性特征拼接的区域对特征,包括:
19.将所述源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述起点图注意力网络,得到所述起点区域特征;
20.将所述源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述终点图注意力网络,得到所述终点区域特征;
21.将所述源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图同构网络,得到所述起点终点区域连通性特征;
22.将所述起点区域特征、所述终点区域特征和所述起点终点区域连通性特征拼接后得到所述区域对特征。
23.进一步地,将所述区域对特征与距离直接元素相乘得到增强距离的二阶特征,其计算公式如下:
[0024][0025]
其中,h
i&j
表示区域r
i
与区域r
j
经过所述图神经网络模型提取出的区域对特征,e
ijt
为距离直接元素。
[0026]
进一步地,基于所述新的区域对特征进行自适应对抗训练后得到所述通勤数据生成模型,包括:
[0027]
基于所述新的区域对特征完成域分类和共性特征提取的对抗训练后,基于所述源城市通勤数据对通勤人数预测loss函数进行监督学习得到所述通勤数据生成模型。
[0028]
进一步地,基于所述新的区域对特征完成域分类和共性特征提取的对抗训练,包括:
[0029]
基于分类loss函数对所述新的区域对特征进行域分类得到源城市区域对特征和目标城市区域对特征,同时基于最大平均差异mmd loss函数提取源城市和目标城市的共性
特征,以完成域分类和共性特征提取的对抗训练。
[0030]
第二方面,本发明实施例提供一种通勤数据生成系统,包括:
[0031]
数据确定单元,用于确定待生成通勤数据的目标城市人口普查数据;
[0032]
数据生成单元,用于将所述待生成通勤数据的目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据;
[0033]
其中,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。
[0034]
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一方面所提供的任一项所述通勤数据生成方法的步骤。
[0035]
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面所提供的任一项所述通勤数据生成方法的步骤。
[0036]
本发明实施例提供的一种通勤数据生成方法及系统,通过将目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。本发明实现了在人口移动数据缺乏的目标城市生成可靠准确的通勤数据。
附图说明
[0037]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]
图1是本发明提供的一种通勤数据生成方法的流程示意图;
[0039]
图2是本发明提供的通勤数据生成模型的训练流程示意图;
[0040]
图3是本发明提供的单样本区域对特征构建示意图;
[0041]
图4是本发明提供的图神经网络信息传播示意图;
[0042]
图5是本发明提供的域自适应对抗训练模型示意图;
[0043]
图6是本发明提供的一种通勤数据生成系统的结构示意图;
[0044]
图7是本发明提供的电子设备的结构示意图。
具体实施方式
[0045]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0046]
本发明的技术构思是使用容易获得的城市中的区域属性信息(如人口统计及poi
分布等)来生成难以获得却具有很高价值的人口通勤信息。人口通勤信息是指城市中人口的居住地与工作地的区域联合分布,及人们在哪里居住,到哪里去工作。通勤信息会反应早晚高峰的人口移动规律,而早晚高峰非常考验城市交通设施的负载能力。通勤信息获取并不容易,本发明将解决其中的困难,使得在数据匮乏的城市生成人口通勤数据成为可能。本发明在于使用来自源城市的区域静态属性数据、城市拓扑结构数据和人口通勤数据与来自目标城市的区域静态属性数据、城市拓扑结构数据来生成目标城市的人口通勤数据。这样就可以解决目标城市人口通勤数据缺乏的问题。
[0047]
区域:可以通过任意的划分方式,将整个城市划分成为n个区域r1,r2,

,r
n

[0048]
区域静态属性:能够代表一个区域特点的静态属性,如人口统计信息、poi分布信息或者如用地规划等信息,用一个特征向量x
i
来表示,其中,x
i
代表区域r
i
的静态属性特征。
[0049]
城市拓扑结构网络:城市的拓扑结构网络能够代表区域之间的空间关联,比如是否邻近或者是否有高速路或者地铁等高效长距离的交通方式相连等。本发明中的拓扑结构使用无向带权图g=(v,e,a)来表示,其中,v=v1,v2,

,v
n
表示图中的节点,e={e
ij
|v_i和v_j在地理上相连}表示连接节点的边,边也可以有自己的特征,比如距离等,a∈{0,1}
n
×
n
表示图中的节点的邻接矩阵,当区域r_i。
[0050]
人口通勤数据:城市人口通勤数据记录了城市中所有人的群体的居住地与工作地的区域联合分布,其中包括所有区域两两之间的通勤人数,如多少人住在区域a,工作在区域b。通勤数据能够反映出上下班人流高峰期时的人口移动规律,本发明使用来表示从区域r
i
到区域r
j
通勤人数,其中,
[0051]
下面结合图1

图7描述本发明提供的一种通勤数据生成方法及系统。
[0052]
本发明实施例提供了一种通勤数据生成方法。图1为本发明实施例提供的通勤数据生成方法的流程示意图,如图1所示,该方法包括:
[0053]
步骤110,确定待生成通勤数据的目标城市人口普查数据;
[0054]
步骤120,将所述待生成通勤数据的目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据;
[0055]
其中,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。
[0056]
本发明实施例提供的通勤数据生成方法,基于图神经网络的实现,能够充分建模城市中的拓扑结构信息,提高数据生成的可靠性;基于域自适应对抗训练的迁移方法,利用在数据充沛的源城市学到的人口移动知识,充分利用大数据带来的优势在数据匮乏的目标城市生成人口通勤信息。
[0057]
需要说明的是,域自适应(domain adaptation)方法是一类应用非常广泛的迁移学习方法,把源域(source domain)与目标域(target domain)的特征进行相似成分提取。使用源域提取到的特征结合源域的真实数据进行模型训练,然后在没有数据的目标域上进行数据生成,以达到无中生有的目的。本发明最终是要找到一个从区域静态属性与城市拓扑结构到人口通勤信息的一个映射,模型在设计时使用图神经网络提取城市的拓扑特征,
结合域自适应对抗训练的方法,利用源城市充沛的数据来弥补目标城市没有数据的缺陷,通过提取源城市与目标城市中的共性,来使用共性特征生成目标城市的人口通勤信息。
[0058]
基于上述任一实施例,如图2所示,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的,包括:
[0059]
步骤210,基于分别划分为若干区域的源城市和目标城市的地图数据得到包含区域邻接关系的源城市拓扑结构数据和目标城市拓扑结构数据;
[0060]
步骤220,基于所述源城市拓扑结构数据和目标城市拓扑结构数据构建所述图神经网络模型,并基于所述历史保存的人口普查数据聚合得到包括源城市拓扑结构数据在内的源城市的区域静态属性数据和包括目标城市拓扑结构数据在内的目标城市的区域静态属性数据;
[0061]
步骤230,将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型后进行自适应对抗训练,得到所述通勤数据生成模型。
[0062]
具体地,首先对平台保存的源城市与目标城市的地图数据进行划分,得到若干个区域;然后综合平台中的人口统计数据,poi位置数据等信息,聚合得到源城市与目标城市的区域的静态属性数据;通过区域的邻接关系构建城市拓扑,构建图神经网络模型;通过积累的轨迹数据或者普查的信息得到源城市的通勤数据。经过聚合之后的区域属性数据,然后经过归一化等预处理,使得特征在各个维度的分布不会有非常大的波动范围。然后使用源城市的区域静态属性数据、城市拓扑结构数据以及真实的通勤人流数据,并结合目标城市的静态属性数据和城市拓扑结构数据,经过模型训练的数据生成目标城市的通勤人流数据。
[0063]
基于上述任一实施例,将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型后进行自适应对抗训练,得到所述通勤数据生成模型,包括:
[0064]
将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型,得到起点区域特征、终点区域特征和起点终点区域连通性特征拼接的区域对特征;
[0065]
需要说明的是,基于对区域静态属性特征与城市人口通勤间相关度的分析,最终经过筛选保留下来的区域静态特征属性包括:人口总数、分性别人口数量、分年龄段人口数量、分人种人口数量、分收入阶段人口数量、家庭户数量、有工作的人口数量以及各个种类的poi数量。其中每个区域的静态属性特征数据结构如下:
[0066][0067][0068]
这些静态属性特征都是数值型特征,即数值的大小具有表示数量的含义。在数据预处理过程中,对于每个特征维度,都使其归一化至[

1,1]的范围内,能够有效提升模型的训练速度。最终得到的每个区域的特征都是一个元素在[

1,1]范围内的特征向量。
[0069]
将所述区域对特征与距离直接元素相乘得到增强距离的二阶特征,将所述起点区域特征、终点区域特征、起点终点区域连通性特征和增强距离的二阶特征拼接,得到新的区域对特征;
[0070]
需要说明的是,得到由四部分组成的新的区域对特征(起点区域特征、终点区域特征、起点终点区域连通性特征和距离增强二阶特征)会经过一个前馈神经网络,得到一维的输出,经过tanh激活函数归一化至[

1,1]之间,再经过目标城市由源城市的人口数量反归一化至通勤人数的推测。
[0071]
基于所述新的区域对特征进行自适应对抗训练后得到所述通勤数据生成模型。
[0072]
基于上述任一实施例,所述图神经网络模型包括起点图注意力网络、终点图注意力网络和图同构网络;
[0073]
将所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图神经网络模型,得到起点区域特征、终点区域特征和起点终点区域连通性特征拼接的区域对特征,包括:
[0074]
将所述源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述起点图注意力网络,得到所述起点区域特征;
[0075]
将所述源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述终点图注意力网络,得到所述终点区域特征;
[0076]
将所述源城市的区域静态属性数据和目标城市的区域静态属性数据输入所述图同构网络,得到所述起点终点区域连通性特征;
[0077]
将所述起点区域特征、所述终点区域特征和所述起点终点区域连通性特征拼接后得到所述区域对特征。
[0078]
具体地,两个区域之间的通勤人口数量是受多方面影响的,首先会受到起点区域的影响和重点区域的影响,其次它还会受到两个区域之间连通性的影响,这里的连通性是指两个区域之间是否容易互相到达,比如两个区域之间是否有高速路或者地铁相连,或者两个区域之间本身在地理空间上就非常接近,这种就属于连通性比较高的两个区域。图神经网络模型最终的属性要求三部分拼接在一起,一是起点区域的静态属性特征向量,二是终点区域的静态属性特征向量,三是起点终点区域的连通性特征,包括两者之间的距离(单位km)和是否有地铁线路(是表示为1,否表示为0)。因此会使用两种、三个不同的图神经网络模型来进行特征提取,图注意力网络(graph attention networks)用来提取区域特征,图同构网络(graph isomorphism networks)用来提取区域的连通性特征。经过图神经网络处理后的三部分特征将拼接在一起进行通勤人数的推测,如图3所示的单样本区域对特征构建示意图。
[0079]
需要说明的是,基于地理空间分布上具有一定的连续性,所以在空间上邻近的两个区域具有一定的相似性,并且一个区域的特性不仅仅只受到它自己的影响,也会受到它周围相邻区域的影响,所以本发明使用了图神经网络利用城市拓扑结构的区域之间相连,对每个区域进行更加深入地融合了相邻区域特征的特征提取。
[0080]
在图神经网络的每一层计算中,每个节点都会融合其相邻节点的信息,如图4所示。在区域特征提取时,使用的是经过注意力机制增强了的图注意力网络,其中每个节点在聚合其邻居节点的特征时,根据节点的重要性,给予不同的节点不同的权重,计算过程如下:
[0081][0082]
其中,α
ij
表示区域r
i
与区域r
j
之间的关联重要程度,其计算如下:
[0083][0084]
在进行区域连通性特征提取时,使用的是图同构网络,在把区域连通性根据其空间位置进行与邻近的信息进行图上的平滑处理,增强区域连通性特征的鲁邦性,其计算如
下:
[0085][0086]
更进一步地,在对区域做起点和终点不同处理的时候,本发明使用两个不同的图注意力网络来分别提取区域作为起点的特征和区域作为终点的特征,进一步提升提取的特征的表达能力。
[0087]
基于上述任一实施例,将所述区域对特征与距离直接元素相乘得到增强距离的二阶特征,其计算公式如下:
[0088][0089]
其中,h
i&j
表示区域r
i
与区域r
j
经过所述图神经网络模型提取出的区域对特征,e
ijt
为距离直接元素。
[0090]
需要说明的是,两个区域之间的通勤人口数量是受到两个区域之间的连同程度非常大的影响的,特别是距离属性,如果两个区域之间相距较远,那么大概率不会有大量的通勤人流,即人们都不愿意把居住地与工作地分开较远,增加每天的通勤成本。而如果两个区域相距很近,那么大概率会有较大的通勤人流,因为人们通常都会倾向于选择距离工作单位比较近的地方居住,或者选择距离居住地比较近的单位上班。然而在提取得到的区域对特征中仅仅使用一维特征来表示距离不能够使其充分发挥自己的作用,本发明使用距离与其他特征交叉相乘的方法(cross

product)来增强距离特征的重要性,其计算过程如下:
[0091][0092]
其中,h
i&j
表示区域r
i
与区域r
j
经过图神经网络提取得到的属性特征的拼接,其与距离直接元素乘,得到新的二阶特征向量,新的二阶特征向量同样作为区域对特征,与之前的三部分区域对特征一同参与推测区域对之间的通勤流量大小。
[0093]
基于上述任一实施例,基于所述新的区域对特征进行自适应对抗训练后得到所述通勤数据生成模型,包括:
[0094]
基于所述新的区域对特征完成域分类和共性特征提取的对抗训练后,基于所述源城市通勤数据对通勤人数预测loss函数进行监督学习得到所述通勤数据生成模型。
[0095]
具体地,在通勤数据生成模型的训练过程中,本发明使用一个共性特征提取和一个域分类的对抗训练来提高共性特征提取的性能。模型的参数在训练过程中使用随机梯度下降(stochastic gradient descent)进行更新,需要设置的超参数包括学习率learning_rate,批处理的大小batch_size,图神经网络的层数num_layers,每轮特征提取梯度下降次数times_featextract与域分类梯度下降次数times_classifier等。
[0096]
基于上述任一实施例,基于所述新的区域对特征完成域分类和共性特征提取的对抗训练,包括:
[0097]
基于分类loss函数对所述新的区域对特征进行域分类得到源城市区域对特征和目标城市区域对特征,同时基于最大平均差异mmd loss函数提取源城市和目标城市的共性特征,以完成域分类和共性特征提取的对抗训练。
[0098]
具体地,通勤数据生成模型的训练过程中使用了更加先进的对抗训练策略,使得特征提取部分能够充分提取来自源城市和目标城市的区域静态属性共性特征,并使用该特征在源城市的真实通勤数据上进行模型训练,在目标城市生成通勤数据。其过程如图5所示。其中,域分类过程用于区分来自源城市的特征与来自目标城市的特征,而特征提取过程使用mmd(maximum mean discrepancy)loss函数来促使其提取来自源城市和目标城市的特征共性。经过域分类与共性特征提取的对抗训练,最终模型得以达到使用共性特征部分来生成通勤数据的目的,以使其也能够工作在没有真实的通勤数据的目标城市上。
[0099]
其中,mmd loss的计算公式为:
[0100][0101]
分类loss计算方式为:
[0102][0103]
通勤人数预测loss计算方式为:
[0104][0105]
本发明方法通过与已存在方法的对比试验,验证了本发明方案的先进性与有效性。实验是使用a国的人口普查数据,与a国的人口职住普查数据进行模型的验证,选取了6个城市,纽约、洛杉矶来做通勤数据生成的实验,使用一城市为源城市,在另一个目标城市生成通勤数据。使用均方根误差rmse(root mean square error)评价指标进行评测,最终提出的模型取得了优越的性能表现,如下表1所示。
[0106]
表1
[0107]
模型甲地

乙地乙地

甲地重力模型22.8512.62随机森林9.158.91图多任务表征学习机7.216.32本发明5.485.14
[0108]
其中,rmse的计算方式为:
[0109][0110]
下面对本发明提供的一种通勤数据生成系统进行描述,下文描述的与上文描述的一种通勤数据生成方法可相互对应参照。
[0111]
图6为本发明实施例提供的通勤数据生成系统的结构示意图,如图6所示,该系统
包括数据确定单元610和数据生成单元620;
[0112]
所述数据确定单元610,用于确定待生成通勤数据的目标城市人口普查数据;
[0113]
所述数据生成单元620,用于将所述待生成通勤数据的目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据;
[0114]
其中,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。
[0115]
本发明实施例提供的通勤数据生成系统,基于图神经网络的实现,能够充分建模城市中的拓扑结构信息,提高数据生成的可靠性;基于域自适应对抗训练的迁移方法,利用在数据充沛的源城市学到的人口移动知识,充分利用大数据带来的优势在数据匮乏的目标城市生成人口通勤信息。
[0116]
基于上述任一实施例,所述数据生成单元包括拓扑结构生成模块、区域属性生成模块和模型对抗训练模块;
[0117]
所述拓扑结构生成模块,用于输入所述分别划分为若干区域的源城市和目标城市的地图数据,输出包含区域邻接关系的源城市拓扑结构数据和目标城市拓扑结构数据;
[0118]
所述区域属性生成模块,用于基于所述源城市拓扑结构数据和目标城市拓扑结构数据构建所述图神经网络模型,输入所述历史保存的人口普查数据,输出包括源城市拓扑结构数据在内的源城市的区域静态属性数据和包括目标城市拓扑结构数据在内的目标城市的区域静态属性数据;
[0119]
所述模型对抗训练模块,用于输入所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据,并基于对所述图神经网络模型进行自适应对抗训练得到所述通勤数据生成模型。
[0120]
基于上述任一实施例,所述模型对抗训练模块包括特征拼接模块、新特征拼接模块和对抗训练模块;
[0121]
所述特征拼接模块,用于输入所述源城市通勤数据、源城市的区域静态属性数据和目标城市的区域静态属性数据,基于所述图神经网络模型输出起点区域特征、终点区域特征和起点终点区域连通性特征拼接的区域对特征;
[0122]
所述新特征拼接模块,用于输入所述起点区域特征、终点区域特征、起点终点区域连通性特征和所述区域对特征与距离直接元素相乘得到增强距离的二阶特征,输出新的区域对特征;
[0123]
所述对抗训练模块,用于输入所述新的区域对特征,并基于自适应对抗训练后得到所述通勤数据生成模型。
[0124]
基于上述任一实施例,所述图神经网络模型包括起点图注意力网络、终点图注意力网络和图同构网络;
[0125]
基于所述图神经网络模型输出起点区域特征、终点区域特征和起点终点区域连通性特征拼接的区域对特征,包括:
[0126]
所述起点图注意力网络,用于输入所述源城市的区域静态属性数据和目标城市的区域静态属性数据,输出所述起点区域特征;
[0127]
所述终点图注意力网络,用于输入所述源城市的区域静态属性数据和目标城市的
区域静态属性数据,输出所述终点区域特征;
[0128]
所述图同构网络,用于输入所述源城市的区域静态属性数据和目标城市的区域静态属性数据,输出所述起点终点区域连通性特征;
[0129]
将所述起点区域特征、所述终点区域特征和所述起点终点区域连通性特征拼接后得到所述区域对特征。
[0130]
基于上述任一实施例,将所述区域对特征与距离直接元素相乘得到增强距离的二阶特征,其计算公式如下:
[0131][0132]
其中,h
i&j
表示区域r
i
与区域r
j
经过所述图神经网络模型提取出的区域对特征,e
ijt
为距离直接元素。
[0133]
基于上述任一实施例,将所述新的区域对特征输入所述对抗训练模块,基于自适应对抗训练后得到所述通勤数据生成模型,包括:
[0134]
基于所述新的区域对特征完成域分类和共性特征提取的对抗训练后,基于所述源城市通勤数据对通勤人数预测loss函数进行监督学习得到所述通勤数据生成模型。
[0135]
基于上述任一实施例,基于所述新的区域对特征完成域分类和共性特征提取的对抗训练,包括:
[0136]
基于分类loss函数对所述新的区域对特征进行域分类得到源城市区域对特征和目标城市区域对特征,同时基于最大平均差异mmd loss函数提取源城市和目标城市的共性特征,以完成域分类和共性特征提取的对抗训练。
[0137]
图7为本发明实施例提供的电子设备的结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communications interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行通勤数据生成方法,该方法包括:确定待生成通勤数据的目标城市人口普查数据;将所述待生成通勤数据的目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据;其中,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。
[0138]
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0139]
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所
述程序指令被计算机执行时,计算机能够执行上述各方法所提供的通勤数据生成方法,该方法包括:确定待生成通勤数据的目标城市人口普查数据;将所述待生成通勤数据的目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据;其中,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。
[0140]
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的通勤数据生成方法,该方法包括:确定待生成通勤数据的目标城市人口普查数据;将所述待生成通勤数据的目标城市人口普查数据输入至通勤数据生成模型,得到所述通勤数据生成模型输出的目标城市通勤数据;其中,所述通勤数据生成模型是基于源城市通勤数据及历史保存的人口普查数据对分别划分为若干区域的源城市和目标城市的地图数据构建的图神经网络模型进行自适应对抗训练后得到的。
[0141]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0142]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0143]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1