一种基于大数据的城市就业可达性测算方法及系统与流程

文档序号:18644037发布日期:2019-09-12 00:02阅读:467来源:国知局
一种基于大数据的城市就业可达性测算方法及系统与流程

本申请属于可达性技术领域,尤其是涉及一种基于大数据的城市就业可达性测算方法及系统。



背景技术:

传统单位制度解体以及快速城市化的推进,使工作地和居住地紧密的空间联系逐渐瓦解,进一步造成通勤距离和时间的延长,出现了职住失衡的情况。就业可达性作为衡量一个城市职住均衡的指标之一,是指城市内部通过某种特定的出行方式从某一地点到达潜在就业机会的便利程度。就业可达性的提高将会降低私家车的使用,从而抑制降低能源的消耗,实现城市绿色发展;除此之外还关系到社会公平问题,由于城市化的快速推进,低收入居民受制于房价,搬离至远郊地区,降低了就业的稳定性和就业机会选择的能动性,并且剥夺了他们未来的发展机会。

鉴于此,国内众多学者针对我国典型城市就业可达性展开了探讨,基于传统普查数据的研究已在各大城市展开,但受数据、资料和技术条件的限制,早期的就业可达性的测度主要以传统统计数据和调查问卷为主,随着大数据共享时代的到来,各种以手机信令数据、公交刷卡及gps数据等多源移动定位大数据为主的研究方兴未艾。大部分的城市就业可达性的研究数据来源多以普查数据和问卷调查数据为主,基于普查数据所进行的可达性测度的时效性不强,而以问卷调查数据为主的研究虽说时效性要比传统普查统计数据强,但由于居民所存在的主观能动性,其问卷结果不一定乐观,数据准确性存疑且需耗费大量的人力物力。

相比之下,应用手机信令数据、公交刷卡及gps数据虽然弥补了传统数据更新慢、调查问卷数据费时费力及真实性低的缺点,但也存在不同区域特别是中等及以下城市中数据存在的数据获取困难等问题。



技术实现要素:

本发明要解决的技术问题是:本发明用以解决现有就业可达性分析对于数据的采集耗费人力物力,数据准确性低,分析结果不够客观,且数据获取困难的问题。

为解决上述技术问题,本发明提供了一种基于大数据的城市就业可达性测算方法,本发明对于就业可达性分析所采集的数据均采用大数据,数据获取的准确性高,而且节省大量的人力物力,同时分析结果更加全面、客观。

本发明解决其技术问题所采用的技术方案是:一种基于大数据的城市就业可达性测算方法,所述测算方法包括以下步骤:

(1)获取所研究城市最新的城市规划土地利用现状图和交通规划图,并分别提取居住用地类型的面状数据和交通网络线状数据;

(2)将提取的居住用地类型的面状数据和交通网络线状数据转换成矢量格式数据,并进行可视化处理,得到所研究城市的住宅街区数量;

(3)采集所研究城市的就业岗位兴趣点数据,并进行坐标偏移校正,得到与居住用地类型的面状数据和交通网络线状数据相匹配的就业岗位矢量空间位置数据;

(4)利用核密度分析方法识别所研究城市的就业岗位兴趣点聚集区,利用类内差异最小、类间差异最大的jenks最佳自然断裂法将核密度值分为七类,并将前两类高值所形成的就业岗位兴趣点聚集区作为就业中心,同时获取就业中心的数量;

(5)获取就业中心与住宅街区质心间的基于交通网络的最短通勤时间;

(6)统计各住宅街区寻找就业机会的人群数量,并根据所述的最短通勤时间,计算各个就业中心对就业人群的需求潜力;

(7)建立shen供需势能模型,根据步骤(2)~(6)得到的数据参数,计算各住宅街区的就业可达性指标值,分析所研究城市的就业可达性。

进一步地,本发明所述的城市就业可达性测算方法,步骤(7)中,就业可达性指标值越大,其就业可达性越好。

进一步地,本发明所述的城市就业可达性测算方法,步骤(3)中:

首先,在电子地图上采集所研究城市的就业岗位兴趣点,并对各就业岗位兴趣点进行坐标偏移校正;然后,通过arcgis裁剪功能得到研究区范围内的就业岗位矢量空间位置数据。

进一步地,本发明所述的城市就业可达性测算方法,步骤(7)中,所述shen供需势能模型为:

其中,ai表示就业中心j对住宅街区i吸引力的累计值,即住宅街区i的就业可达性指标值;

n表示就业中心的数量;

oj表示在就业中心j的服务能力,用就业中心设定时间半径范围内所覆盖的就业岗位总数表示;

dj表示就业中心j的就业人群需求潜力;

dij表示从住宅街区i到就业中心j的基于交通网络的最短通勤时间;

β表示摩擦系数;

j=1,2,3,...,n;

i=1,2,3,...,l,l表示所研究城市的所有住宅街区的数量。

进一步地,本发明所述的城市就业可达性测算方法,步骤(6)中,所述各个就业中心对就业人群的需求潜力为:

其中,pk是居住在住宅街区k处寻找就业机会的人群数量;

dkj表示从住宅街区k到就业中心j的基于交通网络的最短通勤时间;

m表示就业中心j到住宅街区k设定时间半径范围内所覆盖的住宅街区的数量;

k=1,2,3,...,m。

进一步地,本发明所述的城市就业可达性测算方法,步骤(6)中,利用大数据计算住宅街区寻找就业机会的人群数量的方法为:

pk=hk·sk·per·r

其中:pk表示居住在住宅街区k处寻找就业机会的人群数量;

hk表示住宅街区k的楼层高度;

sk为住宅街区k的底面积;

per为所研究城市的市中心城区人均居住用地面积;

r为所研究城市的劳动力人口比值。

进一步地,本发明所述的城市就业可达性测算方法,步骤(5)中,采用电子地图的路径识别功能,输入住宅街区质心与就业中心的坐标,获得指定交通方式对应起点和终点的最优导航路径和最短交通时耗,选取最短交通时耗,生成各街区到就业中心的基于交通网络的通勤时间。

进一步地,本发明所述的城市就业可达性测算方法,核密度分析方法是采用核密度函数计算每个栅格内就业岗位兴趣点要素的核密度值,从而估计就业岗位兴趣点要素在其周围邻域中的密度,核密度值的具体计算方法如下:

式中,fp(x)是就业岗位兴趣点x处的核密度估计函数;

p为选取的就业岗位兴趣点的样本点个数;

(x-xr)表示就业岗位兴趣点x到样本点xr处的距离;

h是路径距离衰减阈值;

r=1,2,3,...,p。

进一步地,本发明所述的城市就业可达性测算方法,利用爬虫技术获取住宅街区的楼层高度信息。

本发明还提供了一种就业可达性测算系统,所述就业可达性测算系统包括:

路网提取模块,用于根据所研究城市的城市规划土地利用现状图和交通规划图,居住用地类型的面状数据和交通网络线状数据;

可视化处理模块,用于将提取的居住用地类型的面状数据和交通网络线状数据转换成矢量格式数据,并进行可视化处理,从而得到所研究城市的住宅街区数量;

就业岗位兴趣点采集模块,用于采集所研究城市的就业岗位兴趣点数据,并进行坐标偏移校正,获取就业岗位兴趣点的空间数据;

核密度分析模块,用于根据核密度分析方法识别所研究城市的就业岗位兴趣点聚集区;

就业中心识别模块,用于根据就业岗位兴趣点聚集区,确定就业中心;

通勤时间模块,用于获取住宅街区质心到就业中心的基于交通网络的最短通勤时间;

可达性分析模块,用于根据shen供需势能模型,计算各住宅街区的就业可达性指标值,分析所研究城市的就业可达性。

本发明的有益效果是:本发明将shen供需势能模型中所有涉及到的数据均用大数据替代,弥补了传统数据的不足,有利于更好的就业可达性的测算,并为不同等级规模的城市提供了新的研究思路,使其数据来源不仅仅拘泥于更新慢的传统数据、费时费力的问卷调查数据和难以获取的手机信令数据,具有普适性和借鉴意义。

本发明采用导航数据作为衡量居住地和就业中心通勤时间的标准,避免了普查数据缺失以及问卷调查数据居民对时间感知不精确的问题,且基于互联网地图的导航数据考虑高峰期、道路维修等状况,使其衡量结果更加全面客观。

附图说明

下面结合附图和实施例对本申请的技术方案进一步说明。

图1是本发明就业可达性测算方法流程图;

图2是本发明就业可达性测算系统的结构原理图。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

下面将参考附图并结合实施例来详细说明本申请的技术方案。

就业可达性作为衡量一个城市职住均衡的指标之一,是指城市内部通过某种特定的出行方式从某一地点到达潜在就业机会的便利程度。

可达性测算方法实施例:

如图1所示,本发明提供的城市就业可达性测算方法如下:

(1)获取所研究城市最新的城市规划土地利用现状图和交通规划图,并分别提取居住用地类型的面状数据和交通网络线状数据。

(2)将提取的居住用地类型的面状数据和交通网络线状数据转换成矢量格式数据,并进行可视化处理,得到所研究城市住宅街区的数量;

(3)采集所研究城市的就业岗位兴趣点数据,并进行坐标偏移校正,得到与居住用地类型的面状数据和交通网络线状数据相匹配的就业岗位空间位置数据;

(4)利用核密度分析方法识别所研究城市的就业岗位兴趣点聚集区,利用类内差异最小、类间差异最大的jenks最佳自然断裂法将核密度值分为七类,并将前两类高值所形成的就业岗位兴趣点聚集区作为就业中心,同时获取就业中心的数量;

(5)获取就业中心与住宅街区质心间的基于交通网络的最短通勤时间。

(6)统计各住宅街区寻找就业机会的人群数量,并根据所述的最短通勤时间,计算各个就业中心对就业人群的需求潜力;

(7)建立shen供需势能模型,根据步骤(2)~(6)得到的数据参数计算各住宅街区的就业可达性指标值,分析所研究城市的就业可达性。

以河南省郑州市为例,对本发明的城市就业可达性测算方法进行详细说明,具体如下:

(1)获取《郑州市城市规划(2010—2020)》土地利用图,并提取郑州市所有的路网、住宅街区。

(2)将提取的路网、住宅街区转换成矢量格式数据,并经过arcgis软件进行可视化处理,得到郑州市住宅街区的数量2494个。

(3)利用高德地图采集郑州市的就业岗位兴趣点,并对采集的就业岗位兴趣点进行坐标偏移校正;然后,通过arcgis裁剪功能得到研究区范围内的就业岗位矢量空间位置数据,获得的就业岗位兴趣点数量为13137个。

(4)利用核密度分析方法识别就业岗位兴趣点聚集区,利用类内差异最小、类间差异最大的jenks最佳自然断裂法将核密度值分为七类,并将前两类高值所形成的就业岗位兴趣点聚集区作为就业中心,同时获得就业中心的数量;

核密度分析方法是采用核密度函数计算每个栅格内就业岗位兴趣点要素的核密度值,从而估计就业岗位兴趣点要素在其周围邻域中的密度,核密度值的具体计算方法如下:

式中,fp(x)是就业岗位兴趣点x处的核密度估计函数;p为选取的就业岗位兴趣点的样本点个数;(x-xr)表示就业岗位兴趣点x到样本点xr处的距离;h是路径距离衰减阈值;r=1,2,3,...,p。

(5)采用高德地图的路径识别功能,输入住宅街区质心与就业中心的坐标,获得指定交通方式下,对应起点和终点的最优导航路径和最短交通时耗,选取最短交通时耗,生成各住宅街区到就业中心的基于交通网络的通勤时间。

(6)建立shen供需势能模型,根据shen供需势能模型计算各住宅街区的就业可达性指标值,分析就业可达性。

本实施例建立的shen供需势能模型为:

其中,ai表示研究区域内所有就业中心对住宅街区i吸引力的累计值,即住宅街区i的就业可达性指标值。

n表示就业中心的数量;

oj表示在就业中心j的服务能力,用就业中心设定时间半径范围内所覆盖的就业岗位总数表示;

dj表示就业中心j的就业人群需求潜力;

dij表示从住宅街区i到就业中心j的基于交通网络的最短通勤时间;

β表示摩擦系数,本实施例取值为1.5;

j=1,2,3,...,n;

i=1,2,3,...,l,l表示所研究城市的所有住宅街区的数量。

dj表示的是在距离衰减作用下,设定时间范围内所覆盖的住宅街区内寻找就业机会的人群数量总和,即就业中心j就业人群的需求潜力,具体为:

其中,pk是居住在住宅街区k处寻找就业机会的人群数量;

m表示住宅街区的数量;

β表示摩擦系数,本实施例取值为1.5。

住宅街区k寻找就业机会的人群数量pk为:

pk=hk·sk·per·r

其中:pk表示居住在住宅街区k处寻找就业机会的人群数量;

hk表示住宅街区k的楼层高度,主要是利用爬虫技术获取郑州四环内街区的楼层高度信息;

sk为住宅街区k的底面积,主要是利用arcgis软件中“计算几何”的功能计算得出;

per为郑州市中心城区人均居住用地面积,根据2017年郑州市政府网站公布《郑州市城市总体规划(2010—2020年)》得出人均居住用地28.2平方米;

r为郑州市的劳动力人口比值。

oj代表j处的服务能力或者服务范围,设定时间范围内所覆盖的就业岗位的总数,具体为:从公共交通及小汽车交通两个方面,搜寻一定的时间半径内所覆盖的所有就业岗位数之和,以此作为衡量就业中心的服务能力的标准。

时间半径根据百度地图所发布的《2018中国城市交通报告》中所统计的通勤数据选定,本实施例选的时间半径为:小汽车为38.1min,公共交通为53.9min。

可达性测算系统实施例:

如图2,本实施例提供的就业可达性测算系统,包括路网提取模块、可视化处理模块、就业岗位兴趣点采集模块、核密度分析模块、就业中心识别模块、通勤时间模块和可达性分析模块。

路网提取模块用于提取所研究城市的居住用地类型的面状数据和交通网络线状数据,并输出给可视化处理模块,由可视化处理模块进行可视化处理;

就业岗位兴趣点采集模块用于将获取的就业岗位兴趣点空间数据输出给核密度分析模块,由核密度分析模块识别就业岗位兴趣点聚集区;

核密度分析模块将核密度数据发送给就业中心识别模块,由就业中心识别模块通过将核密度值进行分类后,确定就业中心;

就业中心识别模块和可视化处理模块分别将就业中心数据、住宅街区数据输出给通勤时间模块,由通勤时间模块获取住宅街区质心到就业中心的有效导航时耗;

所述可视化处理模块、核密度分析模块以及通勤时间模块输出的数据均发送给可达性分析模块,可达性分析模块根据接收到的数据信息进行就业可达性分析处理。

本发明将shen供需势能模型中所有涉及到的数据用大数据替代,一定程度上弥补了传统数据的不足,有利于更好的就业可达性的测算,并为不同等级规模的城市提供了新的研究思路,使其数据来源不仅仅拘泥于更新慢的传统数据、费时费力的问卷调查数据和难以获取的手机信令数据,具有普适性和借鉴意义。

采用导航数据作为衡量居住地和就业中心通勤时间的标准,避免了普查数据缺失以及问卷调查数据居民对时间感知不精确的问题,且基于互联网地图的导航数据考虑高峰期、道路维修等状况,使其衡量结果更加全面客观。

通过上述的说明内容,相关工作人员完全可以在不偏离本项申请技术思想的范围内,进行多样的变更以及修改。本项申请的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1