一种城市群居住空间建成时间识别方法

文档序号:25108664发布日期:2021-05-19 00:09阅读:282来源:国知局
一种城市群居住空间建成时间识别方法

1.本发明涉及居住空间建成时间识别领域,特别是涉及一种城市群居住空间建成时间识别方法。


背景技术:

2.随着全球城镇化进程的不断加快,联合国《2018年世界城市化展望》指出到2050年全球城市人口总量将增加25亿,占世界总人口的66%,其中中国的城市人口总量将增加2.55亿,届时中国城镇化率将接近80%。在城镇化的高速发展阶段,随着经济的飞速发展,人口的急剧增长和城市快速扩张会导致城市居住用地的无序增长,加剧城市建设用地和生态用地的矛盾。及时的监测城市居住用地的时空动态对于城市更新、城市规划和城市管理具有重要的意义。
3.遥感技术凭借其高精度、大范围和重复性观测等优势,被广泛的应用于区域和全球的土地分类、森林扩张和城市土地利用制图等研究。然而单一的遥感数据受限于其物理特性提取地物信息,只能识别土地覆盖的自然过程,无法有效的感知地物的社会经济环境特征。社会感知数据包含了丰富的人群时空空间行为信息,可以作为遥感数据的有力补充。社会感知数据是多源的、海量的、动态的,包括手机信令数据、出租车轨迹数据、公共交通刷卡数据、社交媒体签到数据和poi兴趣点数据等。它们可以很好地捕捉社会经济环境特征,结合遥感数据的光谱和纹理信息和社会感知数据的社会经济特征的城市研究已经成为当下研究的热点。
4.先前大量的研究主要集中在城市建设用地的二维扩张,即研究城市建设用地水平扩张的时空演变格局,很少有研究者关注城市居住用地水平扩张和垂直扩张及其时空演变格局。其原因在于,城市建设用地是基于建筑的物理特征(可以直接从遥感影像中提取的形状、光谱和结构信息),其所需信息位于低语义层。而城市居住用地分类则要根据其社会经济属性(这些属性用于表达人们如何具体使用建筑斑块),这些信息位于高语义层。社会感知数据的出现使得“语义鸿沟”的消除成为可能。更为重要的是当前的研究缺乏对城市居住用地及其社会功能的动态研究,主要原因在于遥感数据和社会感知数据不仅存在“语义鸿沟”,还存在“时间鸿沟”。具体来说,遥感数据出现较早,有较多的历史存档,可以追溯到1970s左右;而社会感知数据出现时间较晚,大多数关于社会感知数据的研究只有一期。因此,亟待解决遥感数据和社会感知数据的“时间鸿沟”进行城市社会功能的研究。


技术实现要素:

5.本发明的目的是针对目前缺乏城市居住用地的时空动态研究,遥感数据和社会感知数据之间存在着“语义鸿沟”和“时间鸿沟”,且目前的研究缺乏关于“时间鸿沟”的研究等问题,提出一种城市群居住空间建成时间识别方法,通过融合遥感数据的光谱及纹理信息和社会感知数据的社会经济特征进行城市居住用地建成时间的识别。
6.为实现上述目的,本发明提供了一种城市群居住空间建成时间识别方法,包括:
7.步骤a、通过google earth engine平台收集landsat5/7/8数据,并计算ndvi、mndwi和swir三个指数时间序列数据;
8.步骤b、通过地图数据和爬虫分析获取城市居住用地边界矢量数据,并在arcgis中进行数据分析和空间连接;
9.步骤c、通过随机森林分类法将特定时间点前后的居住用地分类识别出来;
10.步骤d、通过时间序列分割法将特定时间段年间居住用地的建成时间加以识别,完成整体的居住用地建成时间的识别;
11.其中,所述时间序列分割法的步骤包括:根据ndvi、mndwi和swir时间序列数据从特定时间段年间的趋势变化,寻找到曲线的2个拐点,确定城市更新的开始年和城市更新的结束年,进而确定城市更新的年份。
12.优选地,将表征城市动态变化的ndvi、mndwi和swir时间序列数据根据公式2

1和公式2

2,并结合小区边界数据进行分区统计求取均值,再根据小区id进行数据整合,获取每个小区下ndvi、mndwi和swir时间序列数据,
13.ndvi=(p
nir

p
red
)/p
nir
+p
red
)
ꢀꢀꢀ
(2

1)
14.mndwi=(p
green

p
mir
)/p
green
+p
mir
)
ꢀꢀꢀ
(2

2)
15.swir=p
swir
ꢀꢀꢀ
(2

3)
16.其中,p
nir
表示landsat数据的近红外波段,p
red
表示landsat数据的红波段,p
green
表示landsat数据的绿波段,p
mir
表示landsat数据的中红外波段,p
swir
表示landsat数据的短红外波段。
17.优选地,所述确定城市更新的年份的步骤包括:
18.(1)首先对曲线进行线性拟合,如果曲线整体呈下降趋势,则时间序列上的点距离拟合线的最远负向距离对应的年份(p2)即是城市更新的结束年;在p2之前,距离拟合线最远的正向距离对应的年份(p1)即是城市更新的开始年;
19.(2)如果曲线整体呈上升趋势,则时间序列上的点距离拟合线的最远正向距离对应的年份(p2)即是城市更新的结束年;在p2之前,距离拟合线最远的负向距离对应的年份(p1)即是城市更新的开始年;
20.整个时间序列曲线经由p1和p2点被分割成三部分,分别做线性回归得到seg1、seg2和seg3三段以及斜率k1、k2和k3。
21.优选地,所述随机森林分类法包括:
22.(1)、根据ndvi、mndwi和swir时间序列数据,针对每种数据选择如下15种特征用于随机森林模型的构建:
23.[0024][0025]
(2)、利用上述特征值,通过随机森林分类器,将特定时间点前后的小区分类计算出来。
[0026]
基于上述技术方案,本发明的优点是:
[0027]
本发明通过融合遥感数据的光谱及纹理信息和社会感知数据进行城市居住用地建成时间的识别,解决了二者数据存在“语义鸿沟”和“时间鸿沟”的问题,有助于在宏观尺度把握城市发展方向、景观格局和土地利用等相互关系,为研究城市居住用地水平和垂直扩张有助于在微观尺度揭示城市人居环境、了解城市垂直增长动态和衡量城市不同社会功能绿地效益及其时空演变提供科学技术手段支撑。
[0028]
本发明的城市群居住空间建成时间识别方法可广泛用于城市群居住空间建成时间的识别,可应用于各个地区的城市群,为进一步研究城市群提供技术支撑。
附图说明
[0029]
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0030]
图1为居住用地内ndvi曲线变更情况示意图;
[0031]
图2为城市居住用地更新示例图;
[0032]
图3为城市群居住空间建成时间识别方法流程示意图;
[0033]
图4为时间序列分割法示意图;
[0034]
图5为时间序列分割法的结果精度与参考数据图;
[0035]
图6为安居客等房价网爬取结果与参考数据图;
[0036]
图7为京津冀城市群居住社区分布的时空变化示例图。
具体实施方式
[0037]
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
[0038]
本发明提出一种城市群居住空间建成时间识别方法,通过融合遥感数据的光谱及纹理信息和社会感知数据的社会经济特征进行城市居住用地建成时间的识别。如图1~图6所示,其中示出了本发明的一种优选实施方式。
[0039]
城市的发展过程中,尤其是小区建设的更新,大体上可以归结为4类演变:
[0040]
首先是城市的扩张占用了耕地/森林等植被,城市更新的土地利用类型由植被转为建筑的过程中,ndvi表现出强烈的由高到低再逐渐升高的变化。其次是城市的扩张可能会占用部分的河流湖泊等水体,城市更新的土地利用类型由水体转化为建筑的过程中,mndwi表现出强烈的由高到低再逐渐升高的变化。第三是城市的扩张占用了裸地,城市更新的土地利用变化类型由裸地转变为建筑物的过程中,swir表现出明显的由高到低的规律变化。第四种是城市的扩张表现为局部旧的建筑物更新为新的建筑小区,在此过程中ndvi、mndwi和swir均会呈现出不同程度的变化。
[0041]
而土地变化的更替顺序大概也可以分四种情况,如图1所示,以植被ndvi为例,第一种情况是原始的植被变更为居住用地,在此过程中ndvi曲线先升高再下降最后再升高;第二种情况是城市内部的更新,由原始的老旧小区更新为新的居住用地等,在此过程中ndvi曲线也会出现一个由低到高的走势;第三种情况是为永久的居住小区,在研究时间内没有经历改造和更新,小区绿化逐年变好,在此过程中ndvi曲线整体呈上升趋势;第四种情况ndvi曲线呈现一个多个波动的趋势,可能是由于城市土地经历了多种土地利用导致。
[0042]
图2是城市居住用地更新的示例图,图2a表示城市土地由植被转为建设用地的过程,ndvi曲线(a~c)先下降后增加,小区的建成时间为2010~2011年左右。图2b表示城市土地由原始的城中村转为居住小区的过程,ndvi曲线在e点经历了一个小幅下降然后再上升的过程,小区的建成时间为2012年左右。图2c表示城市土地为永久的居住小区,随着小区绿化的不断优化,ndvi曲线整体呈现上升趋势。
[0043]
本发明提供了一种城市群居住空间建成时间识别方法,如图3所示,具体包括如下步骤:
[0044]
步骤a、通过google earth engine平台收集landsat5/7/8数据,并计算ndvi、mndwi和swir三个指数时间序列数据;
[0045]
步骤b、通过地图数据和爬虫分析获取城市居住用地边界矢量数据,并在arcgis中进行数据分析和空间连接;
[0046]
步骤c、通过随机森林分类法将特定时间点前后的居住用地分类识别出来;
[0047]
步骤d、通过时间序列分割法将特定时间段年间居住用地的建成时间加以识别,完成整体的居住用地建成时间的识别;
[0048]
其中,所述时间序列分割法的步骤包括:根据ndvi、mndwi和swir时间序列数据从特定时间段年间的趋势变化,寻找到曲线的2个拐点,确定城市更新的开始年和城市更新的
结束年,进而确定城市更新的年份。
[0049]
本发明利用google earth engine平台,收集了2000~2020年的landsat5/7/8数据。考虑到在城镇化进程中,原始的植被、水体和裸地等会变成建设和小区居住用地。因此,通过ndvi指数提取反映植被变化的时间序列数据,通过mndwi指数提取反映水体变化的时间序列数据,通过swir指数提取反映裸地变化的时间序列数据;进而构建随机森林所需的关键特征指标,识别建设和小区居住用地的时间点。
[0050]
然后利用python编程等方法从地图数据(如百度地)图获取了2020年居民小区的边界矢量数据。利用python编程等方法从安居客、链家等房价网获取到了北京市2020年更新的小区的建设年代、经纬度坐标、名字等信息。这部分数据用于后期方法的精度验证和结果对比。
[0051]
最后借助google earth平台,采集了部分小区真实的建设年代信息,作为随机森林分类器的训练样本和验证样本。
[0052]
优选地,将表征城市动态变化的ndvi、mndwi和swir时间序列数据根据公式2

1和公式2

2,并结合小区边界数据进行分区统计求取均值,再根据小区id进行数据整合,获取每个小区下ndvi、mndwi和swir时间序列数据,
[0053]
ndvi=(p
nir

p
red
)/p
nir
+p
red
)
ꢀꢀꢀ
(2

1)
[0054]
mndwi=(p
green

p
mir
)/p
green
+p
mir
)
ꢀꢀꢀ
(2

2)
[0055]
swir=p
swir
ꢀꢀꢀ
(2

3)
[0056]
其中,p
nir
表示landsat数据的近红外波段,p
red
表示landsat数据的红波段,p
green
表示landsat数据的绿波段,p
mir
表示landsat数据的中红外波段,p
swir
表示landsat数据的短红外波段。
[0057]
时间分割方法是指根据ndvi、mndwi和swir时间序列数据从特定时间段年间的趋势变化(本实施例为2000年到2020年),寻找到曲线的2个拐点,进而确定城市更新的年份。优选地,如图4所示,所述确定城市更新的年份的步骤包括:
[0058]
(1)首先对曲线进行线性拟合,如果曲线整体呈下降趋势,则时间序列上的点距离拟合线的最远负向距离对应的年份(p2)即是城市更新的结束年;在p2之前,距离拟合线最远的正向距离对应的年份(p1)即是城市更新的开始年;
[0059]
(2)如果曲线整体呈上升趋势,则时间序列上的点距离拟合线的最远正向距离对应的年份(p2)即是城市更新的结束年;在p2之前,距离拟合线最远的负向距离对应的年份(p1)即是城市更新的开始年;
[0060]
整个时间序列曲线经由p1和p2点被分割成三部分,分别做线性回归得到seg1、seg2和seg3三段以及斜率k1、k2和k3。
[0061]
时间分割方法是指根据ndvi、mndwi和swir时间序列数据从特定时间段年间的趋势变化(本实施例为2000年到2020年),寻找到曲线的2个拐点,进而确定城市更新的年份。
[0062]
首先第一步根据曲线做线性回归,判断是上升曲线(图4a)还是下降曲线(图4d);
[0063]
第二步根据曲线类型,找到分段线性回归的拐点(p1和p2)(图4b和4e);
[0064]
第三步是根据识别出的曲线拐点进行分段线性回归,得到seg1、seg2和seg3三段以及斜率k1、k2和k3(图4c和4f)。
[0065]
其中,seg1、seg2和seg3是对于三个回归线段的命名,无实际意义,不参与后续计
算;斜率k1、k2和k3作为随机森林模型的特征变量参与后续的模型训练,用于识别居住区在2000年以前建立还是2000年之后建立。
[0066]
在本实施例中,由于研究是以2000年为起点,因此们将2000年以前已经建成小区的初始年份设置成2000年,不再参与后续的时间序列分割算法。2000年以前建成的小区在近20年中地表覆盖不会经历较大的变化。2000年以后的再建小区,由于城市更新,地表会发生明显的变化。基于此,本实施例构建了随机森林模型和训练特征用于识别小区是否在2000年以前建设。但是本领域普通技术人员应该知晓,也可以根据实际情况,选择其他年份作为起点,也可以采用本发明的方法进行建成时间识别。
[0067]
优选地,所述随机森林分类法的步骤包括:
[0068]
(1)、根据ndvi、mndwi和swir时间序列数据,针对每种数据选择如下15种特征用于随机森林模型的构建:
[0069][0070]
(2)、利用上述特征值,通过随机森林分类器,将特定时间点前后的小区分类计算出来。
[0071]
通过上述步骤,利用验证数据验证结果的可靠性在96.3%左右,证明选择的特征
值在分类中具有相当大的解释强度,适用于小区初始的年际分类。
[0072]
考虑到ndvi的时间序列数据在整体的城镇化过程中变化比mndwi更大也更普遍;因此,针对2000年之后的建设小区,本实施例利用时间分割算法,获取每个小区ndvi时间序列的拐点信息p1和p2,通过对拐点信息的统计判断,确认城市更新的具体年份。
[0073]
本发明利用google earth平台目视解译了部分居住小区的建成时间并和本研究得到的结果(图5)以及从安居客等爬取到的小区建成时间(图6)做了对比。结果表明本研究所采用的随机森林分类和时间序列分割法所得到的结果精度更高,与参考数据具有更高的一致性;而安居客爬取的小区建成时间和参考数据存在一定程度的差异。
[0074]
所以,本发明所采用的方法解决了安居客等在爬取小区建成时间过程中存在的两个主要问题:首先是安居客等房价网存在大量数据缺失的问题,小区年代记录不全,尤其在大多数中小城市基本没有记录;其次是与安居客等房价网记录的小区建成时间相比,本发明所得到的结果精度更高,建成时间更加准确。
[0075]
通过本发明的城市群居住空间建成时间识别方法,获得了京津冀城市群居住社区分布的时空变化示例图。如图7所示,其表明了京津冀城市群从2000年以来的居住小区的变化情况,整体趋势是持续增加的,其中增加显著的城市主要集中在北京、天津和石家庄等大城市,增加的方式主要是由一开始的“急剧向外扩张转向城市内部填充,其为进一步在宏观尺度把握城市发展方向、景观格局和土地利用等相互关系上提供技术支撑。
[0076]
本发明通过融合遥感数据的光谱及纹理信息和社会感知数据进行城市居住用地建成时间的识别,解决了二者数据存在“语义鸿沟”和“时间鸿沟”的问题,有助于在宏观尺度把握城市发展方向、景观格局和土地利用等相互关系,为研究城市居住用地水平和垂直扩张有助于在微观尺度揭示城市人居环境、了解城市垂直增长动态和衡量城市不同社会功能绿地效益及其时空演变提供科学技术手段支撑。
[0077]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1