一种基于区域功能增强特征的城市人群流量预测方法及系统

文档序号:31052359发布日期:2022-08-06 08:06阅读:97来源:国知局
一种基于区域功能增强特征的城市人群流量预测方法及系统

1.本发明涉及城市智能计算技术领域,具体涉及一种基于区域功能增强特征的城市人群流量预测方法及系统。


背景技术:

2.对城市区域内人群流量进行预测,可以为智慧城市的基础设施建设、突发情况和应急时间的管理,道路交通系统的规划等很多方面提供有力支撑。在城市的公共设施建设中,根据城市和各个区域的流量预测及分析,可以为城市规划者提供更加优化的设施分配和建设选址;在智能交通系统的服务管理中,预测公共交通站点的出入口流量,可以解决早高峰流量的分流问题,还可以改善城市的交通服务质量,提高对城市人群流量预测的准确性,提出相应措施,对城市出行的运营调度决策做出精准调整和限流,对城市的区域进行精准定位管控等。
3.已有研究已经在区域人群流量预测领域取得了很多有效成果,例如:2020年yongshungong等人
1.考虑了各种趋势模式和气候影响,以及不同站点之间的固有相似性,提出了三种时空模型,能够精确地解决基于在线潜在空间策略的全网流量分布预测问题;2020年 junbozhang等人
2.将不规则区域中的人群流量预测建模为时空图预测问题,通过扩展图卷积来处理空间信息,使用空间图卷积来构建用于人群流量预测模型;2017年runxing zhong等人
3.基于全市客流多种类型的异构数据提取不同类型的特征,提出了一种基于时空多任务学习的回归预测方法。
4.但是,以上研究由于多种潜在影响因素和现实世界的不确定性等,对城市人群流量的建模和预测仍存在一些关键的限制:首先,研究中主要根据移动轨迹的自身移动特性,进行轨迹特征的提取,却忽略了在动态世界中的周围环境因素的的影响;其次,在对整个城市的人群流量进行建模预测时,会因为各个区域不同功能分布的影响,导致不同区域的人群流量的存在不同的规律性变化;第三,在细粒度城市数据中观察到的区域间动态流量转移使预测变得更加复杂,需要在全局范围内捕获不同区域之间的空间依赖性和功能关联性对与人群流量的影响。


技术实现要素:

5.鉴于以上问题,本发明提出一种基于区域功能增强特征的城市人群流量预测方法及系统,用以解决现有技术对于城市人群流量预测准确性不高的问题。
6.根据本发明的一方面,提供一种基于区域功能增强特征的城市人群流量预测方法,该方法包括以下步骤:
7.步骤一、根据人群移动轨迹数据和城市兴趣点位置数据获取时空轨迹特征集和区域功能增强特征集;所述区域功能增强特征集包括基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集;
8.步骤二、将时空轨迹特征集和区域功能增强特征集结合输入预训练的基于机器学
习的预测模型中预测人群流量,获得预测结果。
9.进一步地,步骤一中所述基于兴趣点的区域功能增强特征集的获取过程包括:
10.步骤一一、根据城市地图数据获取城市兴趣点位置数据;
11.步骤一二、爬取城市道路交通网数据和城市地图数据,根据城市道路分布将城市地图上的城市划分为细粒度分布区域,并与兴趣点位置数据关联映射;
12.步骤一三、统计城市各个细粒度分布区域内部的不同功能类别的兴趣点的数量与分布情况,获取基于兴趣点的区域功能增强特征集,其中,兴趣点的功能类别有12个;具体获取过程包括:
13.步骤一三一、根据兴趣点的数量和功能类别计算获得每个细粒度分布区域内每个功能类别的兴趣点对应的tf-idf值:
[0014][0015]
式中,表示第j类兴趣点在区域zk中的个数;表示区域zk中所有兴趣点的个数;表示细粒度分布区域总数;表示包含第j类兴趣点对应的细粒度分布区域总数;
[0016]
步骤一三二、根据每个细粒度分布区域内所有功能类别的兴趣点对应的tf-idf值,获得该细粒度分布区域的12维tf-idf值;
[0017]
步骤一三三、对多个细粒度分布区域的多个12维tf-idf值进行区域聚类,聚类结果即为基于兴趣点的区域功能增强特征集。
[0018]
进一步地,所述兴趣点的功能类别为:旅游景区,教育,医疗,车站,政府机构,文化传媒,汽车服务,公司企业,休闲娱乐,生活服务,住宅区,写字楼。
[0019]
进一步地,步骤一中所述基于轨迹的区域功能增强特征集的获取过程包括:
[0020]
步骤一四、根据手机信令数据获取人群移动轨迹数据,所述人群移动轨迹数据包括每个用户的一个或多个停留区域及每个停留区域所对应的转移区域;所述转移区域为用户移动轨迹中某个停留区域相邻的一个或两个其他停留区域;
[0021]
步骤一五、将所述人群移动轨迹数据输入预训练的词嵌入word2vec模型中,获取各个细粒度分布区域的区域表征向量,所述区域表征向量z
ij
表示为:
[0022][0023]
其中,pi和pj分别表示停留区域和转移区域;
[0024]
步骤一六、将各个细粒度分布区域的区域表征向量z
ij
与时空影响因子t
ij
相乘得到r
ij
;所述时空影响因子t
ij
表示为:
[0025][0026]
其中,p
ij
表示转移区域pj到达停留区域pi的轨迹总数;dur
ij
表示转移事件,即由停留区域 pi到达转移区域pj时在停留区域pj的停留时长;dur
ik
表示由停留区域pi到达转移区域pk时在停留区域pk的停留时长;z表示城市总区域数;
[0027]
步骤一七、利用奇异值分解方法对由r
ij
组成的矩阵r进行分解,获得区域表征结果;
[0028]
步骤一八、将多个细粒度分布区域的区域表征结果进行聚类,获得各个细粒度分布区域的聚类类别即为基于轨迹的区域功能增强特征集。
[0029]
进一步地,步骤一中所述时空轨迹特征集的获取过程包括:
[0030]
根据时间和空间分布将人群移动轨迹数据进行划分,获得多个时段对应的人群移动轨迹数据;根据各个细粒度分布区域每天各个时段的流量情况计算获得各个细粒度分布区域对应的轨迹数量或访问频次的以下特征:标准差,方差,最小值,最大值,中位数,不对称度和平均值;将上述特征作为时空轨迹特征集。
[0031]
进一步地,步骤二中基于机器学习的预测模型是xgboost和lightgbm融合模型。
[0032]
根据本发明的另一方面,提供一种基于区域功能增强特征的城市人群流量预测系统,该系统包括:
[0033]
特征获取模块,其配置成根据人群移动轨迹数据和城市兴趣点位置数据获取时空轨迹特征集和区域功能增强特征集;包括区域功能增强特征获取子模块和时空轨迹特征获取子模块;
[0034]
人群流量预测模块,其配置成将时空轨迹特征集和区域功能增强特征集结合输入预训练的基于机器学习的预测模型中预测人群流量,获得预测结果;其中,基于机器学习的预测模型是xgboost和lightgbm融合模型。
[0035]
进一步地,所述区域功能增强特征获取子模块用于获取基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集;其中,所述基于兴趣点的区域功能增强特征集的获取过程包括:
[0036]
步骤一一、根据城市地图数据获取城市兴趣点位置数据;
[0037]
步骤一二、爬取城市道路交通网数据和城市地图数据,根据城市道路分布将城市地图上的城市划分为细粒度分布区域,并与兴趣点位置数据关联映射;
[0038]
步骤一三、统计城市各个细粒度分布区域内部的不同功能类别的兴趣点的数量与分布情况,获取基于兴趣点的区域功能增强特征集,其中,兴趣点的功能类别为:旅游景区,教育,医疗,车站,政府机构,文化传媒,汽车服务,公司企业,休闲娱乐,生活服务,住宅区,写字楼;具体获取过程包括:
[0039]
步骤一三一、根据兴趣点的数量和功能类别计算获得每个细粒度分布区域内每个功能类别的兴趣点对应的tf-idf值:
[0040][0041]
式中,表示第j类兴趣点在区域zk中的个数;表示区域zk中所有兴趣点的个数;表示细粒度分布区域总数;表示包含第j类兴趣点的细粒度分布区域总数;
[0042]
步骤一三二、根据每个细粒度分布区域内所有功能类别的兴趣点对应的tf-idf值,获得该细粒度分布区域的12维tf-idf值;
[0043]
步骤一三三、对多个细粒度分布区域的多个12维tf-idf值进行区域聚类,聚类结果即为基于兴趣点的区域功能增强特征集。
[0044]
进一步地,所述区域功能增强特征获取子模块中所述基于轨迹的区域功能增强特征集的获取过程包括:
[0045]
步骤一四、根据手机信令数据获取人群移动轨迹数据,所述人群移动轨迹数据包括每个用户的一个或多个停留区域及每个停留区域对应的转移区域;所述转移区域为用户移动轨迹中某个停留区域相邻的一个或两个其他停留区域;
[0046]
步骤一五、将所述人群移动轨迹数据输入预训练的词嵌入word2vec模型中,获取各个细粒度分布区域的区域表征向量,所述区域表征向量z
ij
表示为:
[0047][0048]
其中,pi和pj分别表示停留区域和转移区域;
[0049]
步骤一六、将各个细粒度分布区域的区域表征向量z
ij
与时空影响因子t
ij
相乘得到r
ij
;所述时空影响因子t
ij
表示为:
[0050][0051]
其中,p
ij
表示转移区域pj到达停留区域pi的轨迹总数;dur
ij
表示转移事件,即由停留区域 pi到达转移区域pj时在停留区域pj的停留时长;dur
ik
表示由停留区域pi到达转移区域pk时在停留区域pk的停留时长;z表示城市总区域数;
[0052]
步骤一七、利用奇异值分解方法对由r
ij
组成的矩阵r进行分解,获得区域表征结果;
[0053]
步骤一八、将多个细粒度分布区域的区域表征结果进行聚类,获得各个细粒度分布区域的聚类类别即为基于轨迹的区域功能增强特征集。
[0054]
进一步地,所述时空轨迹特征获取子模块用于获取所述时空轨迹特征集,获取过程包括:根据时间和空间分布将人群移动轨迹数据进行划分,获得多个时段对应的人群移动轨迹数据;根据各个细粒度分布区域每天各个时段的流量情况计算获得各个细粒度分布区域对应的轨迹数量或访问频次的以下特征:标准差,方差,最小值,最大值,中位数,不对称度和平均值;将上述特征作为时空轨迹特征集。
[0055]
本发明的有益技术效果是:
[0056]
本发明提供一种基于区域功能增强特征的城市人群流量预测方法及系统,根据人群移动轨迹数据和城市兴趣点位置数据提取时空轨迹特征集和区域功能增强特征集,并将时空轨迹特征集和区域功能增强特征集结合输入预训练的机器学习预测模型中预测人群流量,其中,区域功能增强特征集包括基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集;本发明的模型输入特征不仅考虑了轨迹特征,还考虑了兴趣点特征,即包含了基于城市各个区域功能影响的特征提取,进而可以有效地提高城市动态时空轨迹的流量预测结果的准确性。
附图说明
[0057]
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,所述附图
连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。
[0058]
图1是本发明实施例一种基于区域功能增强特征的城市人群流量预测方法的流程示意图;
[0059]
图2是本发明实施例一种基于区域功能增强特征的城市人群流量预测系统的结构示意图。
具体实施方式
[0060]
为了使本技术领域的人员更好地理解本发明方案,在下文中将结合附图对本发明的示范性实施方式或实施例进行描述。显然,所描述的实施方式或实施例仅仅是本发明一部分的实施方式或实施例,而不是全部的。基于本发明中的实施方式或实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式或实施例,都应当属于本发明保护的范围。
[0061]
本发明实施例提供一种基于区域功能增强特征的城市人群流量预测方法,该方法包括以下步骤:
[0062]
步骤一、根据人群移动轨迹数据和城市兴趣点位置数据获取时空轨迹特征集和区域功能增强特征集;区域功能增强特征集包括基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集;
[0063]
步骤二、将时空轨迹特征集和区域功能增强特征集结合输入预训练的基于机器学习的预测模型中预测人群流量,获得预测结果。
[0064]
本实施例中,可选地,步骤一中基于兴趣点的区域功能增强特征集的获取过程包括:
[0065]
步骤一一、根据城市地图数据获取城市兴趣点位置数据;
[0066]
步骤一二、爬取城市道路交通网数据和城市地图数据,根据城市道路分布将城市地图上的城市划分为细粒度分布区域,并与兴趣点位置数据关联映射;
[0067]
步骤一三、统计城市各个细粒度分布区域内部的不同功能类别的兴趣点的数量与分布情况,获取基于兴趣点的区域功能增强特征集,其中,兴趣点的功能类别有12个,为:旅游景区,教育,医疗,车站,政府机构,文化传媒,汽车服务,公司企业,休闲娱乐,生活服务,住宅区,写字楼;具体获取过程包括:
[0068]
步骤一三一、根据兴趣点的数量和功能类别计算获得每个细粒度分布区域内每个功能类别的兴趣点对应的tf-idf值:
[0069][0070]
式中,表示第j类兴趣点在区域zk中的个数;表示区域zk中所有兴趣点的个数;表示细粒度分布区域总数;表示包含第j类兴趣点对应的细粒度分布区域总数;
[0071]
步骤一三二、根据每个细粒度分布区域内所有功能类别的兴趣点对应的tf-idf
值,获得该细粒度分布区域的12维tf-idf值;
[0072]
步骤一三三、对多个细粒度分布区域的多个12维tf-idf值进行区域聚类,聚类结果即为基于兴趣点的区域功能增强特征集。
[0073]
本实施例中,可选地,步骤一中基于轨迹的区域功能增强特征集的获取过程包括:
[0074]
步骤一四、根据手机信令数据获取人群移动轨迹数据,人群移动轨迹数据包括每个用户的一个或多个停留区域及每个停留区域所对应的转移区域;转移区域为用户移动轨迹中某个停留区域相邻的一个或两个其他停留区域;
[0075]
步骤一五、将人群移动轨迹数据输入预训练的词嵌入word2vec模型中,获取各个细粒度分布区域的区域表征向量,区域表征向量z
ij
表示为:
[0076][0077]
其中,pi和pj分别表示停留区域和转移区域;
[0078]
步骤一六、将各个细粒度分布区域的区域表征向量z
ij
与时空影响因子t
ij
相乘得到r
ij
;时空影响因子t
ij
表示为:
[0079][0080]
其中,p
ij
表示转移区域pj到达停留区域pi的轨迹总数;dur
ij
表示转移事件,即由停留区域 pi到达转移区域pj时在停留区域pj的停留时长;dur
ik
表示由停留区域pi到达转移区域pk时在停留区域pk的停留时长;z表示城市总区域数;
[0081]
步骤一七、利用奇异值分解方法对由r
ij
组成的矩阵r进行分解,获得区域表征结果;
[0082]
步骤一八、将多个细粒度分布区域的区域表征结果进行聚类,获得各个细粒度分布区域的聚类类别即为基于轨迹的区域功能增强特征集。
[0083]
本实施例中,可选地,步骤一中时空轨迹特征集的获取过程包括:根据时间和空间分布将人群移动轨迹数据进行划分,获得多个时段对应的人群移动轨迹数据;根据各个细粒度分布区域每天各个时段的流量情况计算获得各个细粒度分布区域对应的轨迹数量或访问频次的以下特征:标准差,方差,最小值,最大值,中位数,不对称度和平均值;将上述特征作为时空轨迹特征集。
[0084]
本实施例中,可选地,基于机器学习的预测模型是xgboost和lightgbm融合模型。需要说明的是,基于机器学习的预测模型还可以是其他模型,例如,gradientboost,bagging, knn等经过预训练后同样可以实现人群流量预测。
[0085]
本发明另一实施例提供一种基于区域功能增强特征的城市人群流量预测方法,如图1所示,该方法包括以下步骤:
[0086]
步骤一、分析并处理手机信令数据,获取人群移动轨迹信息,即多个用户一天经过的所有停留区域为连续的移动轨迹数据;并从人群移动轨迹信息中提取每个用户的停留区域p。
[0087]
根据本发明实施例,手机信令数据即手机连接信号塔产生的记录数据;人群移动轨迹信息包括用户编号、经过信号塔的时间、基站编号。移动轨迹数据可以真实的反映出用户在一天中的流动状态和流动目的,展现区域之见的关联性和差异性,以更好的挖掘城市
区域的功能分布。
[0088]
进一步地,预设停留时间阈值,例如为15分钟,记录每个用户停留超过停留时间阈值所对应的区域为停留区域。
[0089]
步骤二、根据开源的城市地图数据,爬取城市的兴趣点(poi-point of interest)位置数据,并映射到城市地图上。
[0090]
根据本发明实施例,兴趣点poi,在地理信息系统中可以表示为任何一个建筑,大到一幢大楼、一个商场或者小至一家商店、一个公交站点等。每个poi包含名称、类别、坐标等方面信息,通过对城市的poi分布可以更好的了解不同区域的功能特性。在城市区域中,分布的poi类别数量可以反应出区域的功能分布情况和其发挥的功能属性。
[0091]
步骤三、爬取城市的道路交通网数据和城市地图数据,根据城市道路分布将城市地图上的城市划分为细粒度分布区域,并与兴趣点位置数据关联映射。
[0092]
根据本发明实施例,可以利用地图编辑工具arcmap将城市主干道路进行去重和延长修正,形成由路网分割的多个无重叠细粒度自然区域,根据城市主干道路和主要路段将城市分割成细粒度的空间子区域。
[0093]
步骤四、统计城市各个细粒度分布区域内部的不同功能类别的兴趣点的数量与分布情况,获得基于兴趣点的区域功能增强特征。
[0094]
根据本发明实施例,城市的区域功能类别和兴趣点类别相同,共有12类,分别为:旅游景区,教育,医疗,车站,政府机构,文化传媒,汽车服务,公司企业,休闲娱乐,生活服务,住宅区,写字楼。
[0095]
基于兴趣点自身具有功能属性的特点,将poi数据直接用作区域功能属性的划分特征。根据统计学方法tf-idf(词频-逆文本频率,term frequency-inverse document frequency)来测量不同poi类别对每一个基站区域的重要性(相当于不同词汇对于文档的重要性)。基于兴趣点的区域功能增强特征按照下述方式获取:对于在区域zk内的第j类poi:
[0096][0097]
其中,表示第j类poi在区域zk中的个数;表示区域zk中所有poi的个数;表示总区域数;表示包含第j类poi的总区域数。
[0098]
根据兴趣点的数量和类别获得每个区域内每个类别poi的tf-idf值,然后根据每个区域的所有poi类别的tf-idf值获得该区域的12维tf-idf值,然后对多个区域的多个12维 tf-idf值进行k-means区域聚类,聚类结果即为最终得到的基于兴趣点的区域功能增强特征。
[0099]
步骤五、根据各个区域轨迹数据,使用区域功能表征模型进行训练,获得基于轨迹的区域功能增强特征。
[0100]
根据本发明实施例,所述区域功能表征模型是基于词嵌入word2vec模型构建的。利用轨迹中的当前停留区域和转移区域分析区域功能之间的相关性,将其映射为对应区域表征表示并计算两者的关联;转移区域是指在轨迹中停留区域前后所经过的区域,即轨迹
经过的上一个停留区域或是即将经过的下一个停留区域。所以在目标空间中,各个区域功能的表征表示为:
[0101][0102]
其中,pi和pj分别表示停留区域和转移区域。
[0103]
因为区域表征具有强烈的时空特性,因此本发明提出了一种基于轨迹转移的区域的时空影响因子t
ii

[0104][0105]
其中,p
ij
表示转移区域pj到达停留区域pi的轨迹总数;dur
ij
表示转移事件,即轨迹由区域 pi到达区域pj在停留区域pj的停留时长;dur
ik
表示轨迹由区域pi到达区域pk在停留区域pk的停留时长;z表示城市总区域数。
[0106]
p
ij
都会受到转移事件dur
ij
的不同影响,所以移动轨迹对停留区域pi的区域功能关联结果表示为:
[0107]rij
=z
ij
·
t
ij
[0108]
然后,利用奇异值(svd)分解由r
ij
组成的矩阵r获得区域表征结果。
[0109]
然后,将多个区域的区域表征结果进行k-means聚类,聚类类别与兴趣点类别保持一致,得到各个区域的表征聚类类别,即为基于轨迹的区域功能增强特征。
[0110]
步骤六、根据人群移动轨迹信息获取时空轨迹特征集;
[0111]
根据本发明实施例,一方面,根据时间分布和空间分布将轨迹数据进行划分,将一周划分为工作日和周末,一天分为四个时段([0:00,6:00),[6:00,12:00),[12:00,18:00),[18:00,24:00));另一方面,统计每天各个区域各时段的流量情况,得到各个区域流量(即产生的轨迹数量,访问频次)的如下特征:标准差(std),方差(var),最小值(min),最大值(max),中位数(median),不对称度(skew),平均值(mean);上述特征即作为时空轨迹特征集。
[0112]
步骤七、将时空轨迹特征集、包含基于兴趣点的区域功能增强特征和基于轨迹的区域功能增强特征组成的区域功能增强特征集进行融合,并输入到预训练的xgboost(即极端梯度提升模型-extreme gradient boosting的简称)和lightgbm(light gradient boosting machine) 融合模型来预测人群流量。
[0113]
根据本发明实施例,lightgbm是微软开源的一个实现gradient boosting decision tree
ꢀ‑
gbdt算法的框架,支持高效率的并行训练。融合模型中两种模型的融合比例为1∶1。
[0114]
进一步通过实验验证本发明的技术效果。
[0115]
为了评估本发明提出的基于城市功能区域功能增强特征的人群流量预测方法的有效性,使用真实长春市市区信令数据集和兴趣点数据集进行实验验证。基线算法采用与未增加区域功能增强特征集的城市区域流量预测结果进行对比。预测结果中采用通用的评价指标:均方误差(mse),平均绝对误差(mae),可释方差值(evs),确定系数(r2),中值绝对误差 (medae)进行评估比较,其结果为表1所示。
[0116]
表1
[0117] msemaeevsr2medae特征集1840.17621.3410.999730.9997315.953特征集2940.51824.1670.999860.9998617.534特征集387.413*24.167*0.99992*0.99992*2.793*
[0118]
表1中特征集1为时空轨迹特征集;特征集2为区域功能增强特征集;特征集3为时空轨迹特征集+区域功能增强特征集;*表示最佳性能结果。通过各项验证指标对比,可以看出,本发明方法可以更准确的预测城市区域的人群流量情况。
[0119]
本发明另一实施例提供一种基于区域功能增强特征的城市人群流量预测系统,如图2所示,该系统包括:
[0120]
特征获取模块10,其配置成根据人群移动轨迹数据和城市兴趣点位置数据获取时空轨迹特征集和区域功能增强特征集;
[0121]
人群流量预测模块20,其配置成将时空轨迹特征集和区域功能增强特征集结合输入预训练的基于机器学习的预测模型中预测人群流量,获得预测结果;其中,基于机器学习的预测模型是xgboost和lightgbm融合模型。
[0122]
本实施例中,可选地,特征获取模块10包括区域功能增强特征获取子模块110和时空轨迹特征获取子模块120;区域功能增强特征获取子模块110用于获取基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集;其中,基于兴趣点的区域功能增强特征集的获取过程包括:
[0123]
步骤一一、根据城市地图数据获取城市兴趣点位置数据;
[0124]
步骤一二、爬取城市道路交通网数据和城市地图数据,根据城市道路分布将城市地图上的城市划分为细粒度分布区域,并与兴趣点位置数据关联映射;
[0125]
步骤一三、统计城市各个细粒度分布区域内部的不同功能类别的兴趣点的数量与分布情况,获取基于兴趣点的区域功能增强特征集,其中,兴趣点的功能类别为:旅游景区,教育,医疗,车站,政府机构,文化传媒,汽车服务,公司企业,休闲娱乐,生活服务,住宅区,写字楼;具体获取过程包括:
[0126]
步骤一三一、根据兴趣点的数量和功能类别计算获得每个细粒度分布区域内每个功能类别的兴趣点对应的tf-idf值:
[0127][0128]
式中,表示第j类兴趣点在区域zk中的个数;表示区域zk中所有兴趣点的个数;表示细粒度分布区域总数;表示包含第j类兴趣点的细粒度分布区域总数;
[0129]
步骤一三二、根据每个细粒度分布区域内所有功能类别的兴趣点对应的tf-idf值,获得该细粒度分布区域的12维tf-idf值;
[0130]
步骤一三三、对多个细粒度分布区域的多个12维tf-idf值进行区域聚类,聚类结果即为基于兴趣点的区域功能增强特征集。
[0131]
本实施例中,可选地,区域功能增强特征获取子模块110中基于轨迹的区域功能增
强特征集的获取过程包括:
[0132]
步骤一四、根据手机信令数据获取人群移动轨迹数据,人群移动轨迹数据包括每个用户的一个或多个停留区域及每个停留区域对应的转移区域;转移区域为用户移动轨迹中某个停留区域相邻的一个或两个其他停留区域;
[0133]
步骤一五、将人群移动轨迹数据输入预训练的词嵌入word2vec模型中,获取各个细粒度分布区域的区域表征向量,区域表征向量z
ij
表示为:
[0134][0135]
其中,pi和pj分别表示停留区域和转移区域;
[0136]
步骤一六、将各个细粒度分布区域的区域表征向量z
ij
与时空影响因子t
ij
相乘得到r
ij
;时空影响因子t
ij
表示为:
[0137][0138]
其中,p
ij
表示转移区域pj到达停留区域pi的轨迹总数;dur
ij
表示转移事件,即由停留区域 pi到达转移区域pj时在停留区域pj的停留时长;dur
ik
表示由停留区域pi到达转移区域pk时在停留区域pk的停留时长;z表示城市总区域数;
[0139]
步骤一七、利用奇异值分解方法对由r
ij
组成的矩阵r进行分解,获得区域表征结果;
[0140]
步骤一八、将多个细粒度分布区域的区域表征结果进行聚类,获得各个细粒度分布区域的聚类类别即为基于轨迹的区域功能增强特征集。
[0141]
本实施例中,可选地,时空轨迹特征获取子模块120用于获取时空轨迹特征集,获取过程包括:根据时间和空间分布将人群移动轨迹数据进行划分,获得多个时段对应的人群移动轨迹数据;根据各个细粒度分布区域每天各个时段的流量情况计算获得各个细粒度分布区域对应的轨迹数量或访问频次的以下特征:标准差,方差,最小值,最大值,中位数,不对称度和平均值;将上述特征作为时空轨迹特征集。
[0142]
本实施例所述一种基于区域功能增强特征的城市人群流量预测系统的功能可以由前述一种基于区域功能增强特征的城市人群流量预测方法说明,因此本实施例未详述部分,可参见以上方法实施例,在此不再赘述。
[0143]
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
[0144]
本发明所援引的文献如下:
[0145]
[1]yongshun gong,zhibin li,jian zhang,wei liu,jinfeng yi:potential passenger flow prediction:a novel study for urban transportation development.aaai 2020:4020-4027
[0146]
[2]junbo zhang,yu zheng,junkai sun,dekang qi:flow prediction in spatio-temporal networks based on multitask deep learning.ieee trans.knowl.data eng.32(3):468-478(2020)
[0147]
[3]runxing zhong,weifeng lv,bowen du,shuo lei,runhe huang:spatiotemporal multi-task learning for citywide passenger flow prediction.smartworld/scalcom/uic/atc/cbdcom/iop/sci 2017:1-8。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1