基于城市建筑空间数据的建成区边界识别方法及设备与流程

文档序号:18466938发布日期:2019-08-17 02:34阅读:422来源:国知局
基于城市建筑空间数据的建成区边界识别方法及设备与流程
本发明涉及一种城市建成区边界识别方法及设备,特别是涉及一种基于城市建筑空间数据的建成区边界识别方法及设备。
背景技术
:城市建成区边界是指城市行政区范围内,由建设分布相对集中的建筑物、市内公共设施及城市道路等所构成的城市建成区的范围边界线,其范围表明了城市在不同发展阶段建设用地的使用情况。随着社会经济的快速发展,中国城镇化速度惊人。城市建设用地边界的划定对反应城市发展的规模与速度,判断土地利用效益与增长趋势具有重要作用。一方面,建成区范围与边界的变化反应了城市发展的方向与规模,其精确合理划定对研究城市扩张变化和城市驱动力分析起了关键性的作用。另一方面,建成区的范围数值信息是人口密度,卫生设施水平,单位面积产值和扩张系数等一系列指标的统计依据,对城市下一轮发展战略规划起到十分重要的作用。目前常用的城市建成区边界识别方法,一种是结合现状地形图,结合卫星影像,在cad或地理信息系统中进行人工绘制,这样的识别方法存在制图时间长,投入人力资源大,边界识别依赖人脑判断随意性大等问题。一种是结合地理信息系统软件平台,对高分辨遥感图像,采用目视破译图像或计算机监测方法实现不同土地利用类型边界的分类,这样的识别方法对算法与图像质量要求较高,且其对建筑与硬质地面的最大似然区分存在差异。技术实现要素:发明目的:本发明要解决的技术问题是提供一种基于城市建筑空间数据的建成区边界识别方法及设备,解决了现有识别方法耗时长、人力投入大、边界识别依赖人脑判断随意性大和对图像质量要求高等不足,通过数据的聚类分析和空间聚合实现对城市建成区边界进行高精度识别,高效、精准地满足城市发展建设现状评估和规划领域所需的各项指标数据和矢量分析需求。技术方案:本发明所述的基于城市建筑空间数据的建成区边界识别方法,其特征在于包括以下步骤:(1)将城市建筑空间矢量数据输入地理信息处理平台;(2)确定区分建筑连绵与否的临界值;(3)生成建筑连绵区面域;(4)筛选建筑面积值最高的一组建筑连绵区面域,导出其边界轮廓线。进一步的,所述城市建筑空间矢量数据的内容包括建筑和街区。进一步的,步骤(2)中确定临界值的方法为:计算得到城市建筑空间矢量数据中每个街区的几何中心点,对相邻街区的几何中心点最近距离进行聚类运算,生成相邻街区中心之间最小距离的平均值,作为区分建筑连绵与否的临界值。进一步的,所述计算得到所述几何中心点的公式为:其中n为每个街区的顶点数量,i为街区顶点编号,xi为编号为i的顶点的经度,yi为编号为i的顶点的纬度,xi+1为编号为i+1的顶点的经度,yi+1为编号为i+1的顶点的纬度,cx为该街区几何中心点的经度,cy为该街区几何中心点的纬度。进一步的,所述的聚类运算为averagenearestneighbor聚类算法,具体为:其中,i为街区编号,n为街区的数量,di为编号为i的街区的几何中心与最近邻街区几何中心之间的距离,为相邻街区中心之间最小距离的平均值。进一步的,步骤(3)中生成建筑连绵区面域的方法为:计算所有建筑之间的距离,将距离小于等于所述临界值的建筑进行空间聚合,将上述空间聚合的建筑与所述建筑之间的外部空间相连结,得到所述的建筑连绵区面域。进一步的,所述空间聚合的方法为:将所述建筑空间矢量数据转换为固定大小的栅格,将距离小于等于所述临界值的建筑的所有顶点进行连线,选取其中面积最大的一个多边形,将上述选取的所有多边形覆盖的栅格合并成一个完整面域。进一步的,所述栅格的边长为0.5米。进一步的,步骤(4)中的筛选方法为自然间断点分级法。进一步的,所述的自然间断点分级法具体步骤为:按照几何面积的大小将所有建筑连绵区面域采取自然间断点分级法分为若干个组,选取其中范围上限最高的数值区间作为筛选区间,选择这一区间内的建筑连绵区面域。进一步的,步骤(4)中导出边界轮廓线的方法为:将筛选出的建筑连绵区面域填充其内部的孔洞并去除孔洞边界,得到不含孔洞的建筑连绵区面域,其外部轮廓线即为所述的边界轮廓线。本发明所述的设备,包括计算机存储器和处理器,所述的存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得处理器执行上述的方法。有益效果:本发明具备以下优点:1、基于建筑空间矢量数据,通过高精度栅格化空间聚合方法将连绵的建筑数据进行闭合,最大程度提高所识别边界的准确性;2、通过无监督聚类生成街区几何中心的平均最近距离,以此作为建筑连绵与否的临界值,确保所识别边界的科学性及学理性,最大程度逼近人工识别城市建成区边界的常用方法;同时该方法普遍适用于各类城市,确保了本专利方法的普适性;3、所有步骤和方法阶基于矢量数据和矢量运算方法,所识别出的城市建成区边界矢量数据结果满足可编辑、可操作、可计算的实际需求,保证了该识别方法的实用性和可操作性;4、所自动提取的建成区边界能够快速高效地满足城市发展建设现状评估和规划领域所需的各项指标数据和矢量分析需求,以避免传统方法耗时长、人力投入大、边界识别依赖人脑判断随意性强的问题;实现了普遍适用于各类城市的高效、精准、自动化的建成区边界,快速高效地满足城市发展建设现状评估和规划领域所需的各项指标数据和矢量分析需求。附图说明图1为本发明实施例的整体方法流程图;图2为实施例的相邻街区的几何中心点最近距离计算图;图3为实施例的区分建筑连绵示意图;图4为实施例的建筑进行空间聚合原理图;图5为实施例的空间聚合后建筑连绵区面域图;图6为实施例的根据聚类结果筛选的建筑连绵区面域图;图7为实施例的去除孔洞的城市建成区边界图。具体实施方式如图1所示,本发明实施例公开了一种基于城市建筑空间数据的建成区边界识别方法,包括如下步骤步骤1):数据获取及输入:获取并储存给定范围内的城市建筑空间矢量数据,输入地理信息处理平台;其中,所述给定范围不得小于城市中心城区范围,城市中心城区范围即为对应城市的最新版城市总体规划中划定的中心城区范围;所述建筑空间矢量数据包含多边形街区面及多边形建筑面。所述空间矢量数据可以通过规划局等相关政府职能部门获得。其中,建筑空间矢量数据包含多边形街区面(也可以通过道路红线围合成面生成)、街区面内包含一个以上的多边形建筑面,以上数据可以为dwg格式或shp格式等。所述地理信息处理平台用于矢量数据处理,包括:arcgis、cad;步骤2):确定建筑连绵临界值:针对范围内的所有多边形街区面,通过几何计算得到每个街区的几何中心点,通过无监督聚类算法对相邻街区的几何中心点最近距离进行聚类运算,从而生成相邻街区中心之间最小距离的平均值,作为区分建筑连绵与否的临界值;所述针对范围内的所有多边形街区面,通过几何计算得到每个街区的几何中心点,其目的在于通过获取每个街区的几何中心(角平分线交点)来为下一步的几何中心距离聚类运算做准备。该步骤包含两种方法,方法一为在arcgis中运用要素转点(featuretopoint)指令,将多边形街区面转换为每个面的中心点,所述中心点包含坐标数据;方法二即通过软件代码编程(运用python编程工具),通过获取每个多边形街区面每个顶点的坐标数据,计算其几何中心点的坐标数据,其实现方式按照如下公式得到每个几何中心的矢量数据:其中n为每个街区的顶点数量,i为街区顶点编号,xi为编号为i的顶点的经度,yi为编号为i的顶点的纬度,xi+1为编号为i+1的顶点的经度,yi+1为编号为i+1的顶点的纬度,cx为该街区几何中心点的经度,cy为该街区几何中心点的纬度。在得到所有多边形街区面几何中心及其坐标数据之后,下一步需要通过无监督聚类算法,获取所有相邻街区的几何中心点最近距离的平均值,作为区分建筑连绵与否的临界值,几何中心点最近距离计算如图2所示。具体地,所述无监督算法包含基于中心点的k-means聚类算法、基于连接距离的分层聚类算法、基于点密度的dbscan聚类以及基于非线性降维的t-sne聚类算法,实施例需计算相邻街区之间最小距离的平均值,故优选分层聚类中的averagenearestneighbor聚类算法处理,具体为:其中,i为街区编号,n为街区的数量,di为编号为i的街区的几何中心与最近邻街区中心位置之间的距离,为街区的几何中心与最近邻街区中心位置之间的平均值(即建筑连绵的临界值)。将相邻街区中心之间最小距离的平均值作为区分建筑连绵与否的临界值,其原理为:相邻街区中心之间最小距离的平均值,即为城市平均街区边长与城市平均道路宽度之和。当两个建筑在同一街区,则彼此连绵;当两个建筑在相邻街区,则彼此连绵;当两个建筑之间的距离大于一个街区宽度与一条道路宽度的总和,则彼此不连绵。因此,如图3所示,当两个相邻建筑之间的最近距离小于生成街区几何中心的预测平均距离,则判定建筑连绵,反之则建筑不连绵。步骤3):建筑连绵区面域生成:计算所有建筑两两之间的距离并以建筑连绵临界值为界将其分为两个数据集,将其中建筑连绵临界值以内的数据集所包含建筑进行空间聚合,得到建筑连绵区面域;所述计算所有建筑两两之间的距离并根据建筑连绵临界值具体为,将其分为两个数据集,计算城市内所有建筑两两之间的距离(建筑中心点距离),每两个建筑及其距离形成一组数据元,n个建筑共形成组数据元。然后对每组数据元进行判定,将建筑距离在建筑连绵临界值以内的数据元归入数据集a、以外的归入数据集b,判定方法如下:数据集数据集其中为建筑连绵临界值(即街区的几何中心与最近邻街区中心位置之间的平均值),di为编号为i的数据元中两个建筑中心点距离。所述将其中建筑连绵临界值以内的数据集所包含建筑进行空间聚合,其方法如图4所示,将建筑空间矢量数据转换为宽度为0.5米的栅格,并对所有栅格赋值为0;将数据集a中每一组数据元都进行如下操作:将数据元中两个建筑的所有顶点进行依次连线,生成其中面积最大的一个不规则多边形,并将该不规则多边形所覆盖的栅格赋值为1;最后将所有值为1的栅格合并成一个完整的面域,所生成完整面域即建筑连绵区面域。所生成的建筑连绵区面域如图5所示,所述建筑连绵区面域为将间距平均最近距离以内的建筑及其之间的外部空间相连结所构造的面域。步骤4):建成区边界提取:计算所有建筑连绵区面域的几何面积,利用地理信息系统数据集中分类方法筛选出面积值最高的一组建筑连绵区面域,导出其边界轮廓线,得到城市建成区边界。地理信息系统数据集中分类方法可以采用等距离分级、分位数分级、等面积分级、标准差分级、自然间断点分级法(jenks)等多种分类方法。优选的采用自然间断点分级法(jenks),自然间断点分级法的聚类原理为将数据划分为数个组,保证组与组之间的数值方差最大、组内方差最小,其中分组的个数视不同城市规模情况而定,且组数不小于3组。因为城市建成区是对实际建设发展起来的非农业生产建设地段的统称,且具有一定的建设规模以保持基本完善的市政公用设施建设,因此需要筛选掉规模较小的非城市化区域以及无法满足市政公用设施建设需求的较小规模区域,本处需将所有建筑连绵区面域的几何面积根据其数值进行分组并保证组与组之间的数值差异最大。自然间断点分级法(jenks)能够模拟城市的建成特征,最逼近人工识别建成区边界的判定依据,基于所有建筑连绵区面域中固有的自然分组,对相似类进行最恰当分组,并在数据值的差异相对较大的位置处设置边界,即将数据划分为数个组,保证组与组之间的数值方差最大、组内方差最小。具体地,将所有建筑连绵区面域的几何面积按照其数值分布进行聚类并分为多个数值区间,选取其中范围上限最高的数值区间作为筛选区间,将这一区间内对应的建筑连绵区面域导出其边界轮廓线。导出其边界轮廓线的具体方法为,对每个筛选出的建筑连绵区面域填充其内部的孔洞并去除孔洞边界,得到不含孔洞的建筑连绵区面域,其外部轮廓线即为城市建成区边界。利用本发明实施例的建筑空间大数据的城市建成区边界高精度识别方法,能够对不同城市建成区进行科学快速的自动绘制识别,所自动提取的建成区边界能够满足城市发展建设现状评估和规划领域所需的各项指标数据和矢量分析需求,并避免传统方法耗时长、人力投入大、边界识别依赖人脑判断随意性强的问题;实现了普遍适用于各类城市的高效、精准、自动化识别建成区边界,高效精准地满足城市发展建设现状评估和规划领域所需的各项指标数据和矢量分析需求。以下将以天津市城市建成区边界高精度识别为例对本发明的技术方案进行详细说明。(1)以天津作为目标城市,获取城市建成区域内的空间矢量数据,其范围不得小于城市最新版总体规划划定的城市中心城区范围,并将空间数据录入空间矢量平台,具体包括:(1.1)通过天津市规划局或自然资源局获得天津的空间矢量数据,包含天津市域范围内的城市街区数据及建筑数据,以上数据均为cad文件或shp文件;(1.2)空间矢量数据中的现状闭合街区cad文件、现状闭合建筑cad文件或shp文件导入arcgis软件或其他空间矢量平台,并导出闭合面(polygon)的shp格式;(2)通过对范围内所有的多边形街区面,计算其几何中心点,并通过无监督类算法对相邻街区的几何中心点距离进行聚类运算,确定建筑连绵的临界值;(2.1)通过arcgis识别空间数据的地理坐标系统,来获取每个多边形街区每个顶点的坐标数据,以此来计算所有多边形街区面几何中心点的坐标,其实现方式按照上述的公式得到每个街区几何中心的矢量数据。(2.2)利用所得到的所有多边形街区面几何中心及其坐标数据,测量每个街区几何中心与其最邻近街区中心位置之间的距离。通过使用上述的averagenearestneighbor聚类算法,计算得出相邻街区中心之间最小距离的平均值(如图2),即建筑连绵的临界值。具体计算结果如表1所示:表1平均预测距离结果表天津建筑连绵的临界值147.6624米p值0.0047(3)计算天津所有建筑两两之间的距离并以建筑连绵临界值为界将其分为两个数据集,将其中建筑连绵临界值以内的数据集所包含建筑进行空间聚合,得到建筑连绵区面域;(3.1)计算所有建筑两两之间的距离(中心点距离)并根据建筑连绵临界值将其分为两个数据集,其计算中心点方法与(2.1)一致;天津共包含21万个建筑,因此形成210万组数据元,每组数据元中包含两两匹配的建筑及其中心点距离数据;然后对每组数据元进行判定,将建筑中心点距离在建筑连绵临界值147.6624米以内的数据元归入数据集a、以外的归入数据集b,如表2:表2数据集统计表数据集判定条件数据元组数数据集adi≤147.6624米79万组数据集bdi>147.6624米131万组其中di为编号为i的数据元中两个建筑中心点距离;(3.2)将天津建筑空间数据栅格化,将建筑空间矢量数据以及外部空间转换为宽度为0.5米的栅格,并对所有栅格赋值为0;(3.3)将数据集a中每一组数据元都进行如下操作:将数据元中两个建筑的所有顶点进行依次连线,生成其中面积最大的一个不规则多边形,并将该不规则多边形所覆盖的栅格赋值为1;最后将所有值为1的栅格合并成一个完整的面域,所生成完整面域即建筑连绵区面域,如图5所示;(4)计算所有建筑连绵区面域的几何面积,利用自然间断点分级法(jenks)筛选出面积值最高的一组建筑连绵区面域,导出其边界轮廓线,得到城市建成区边界;(4.1)对步骤(3.3)中生成的建筑连绵区面域按用自然间断点分级法进行根据面积大小分为5类进行数值分布聚类,生成根据面积大小排序的建筑连绵区汇总表:表3建筑连绵区汇总表自然裂点类别建筑面积区间(㎡)连绵面域个数114339889.1-494656450.3125936354.3-14339889.1432245590.5-5936354.317472488.5-2245590.538548.89-72488.5370(4.2)从上表中筛选出自然裂点类别中范围上限最高的一组建筑连绵区面域如图6所示,将筛选出的面域填补其内部孔洞,只保留其外部轮廓边界及内部完整的不含孔洞的闭合面;(4.3)如图7所示,将不含孔洞的建筑连绵区面域导出shp或cad格式文件,其外部轮廓线即为识别出的城市建成区边界。本发明的实施例还提供了一种设备,设备包括存储器和至少一个处理器、存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序、至少一条通讯总线。所述至少一个处理器执行所述计算机程序时实现上述基于城市建筑空间数据的建成区边界识别方法。本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1