本申请涉及大数据处理技术领域,尤其涉及一种基于大数据的城市建设用地分类识别方法及系统。
背景技术:
随着我国城镇化进程的推进,城市建设用地得以快速扩张,对城市的社会、经济和环境等方面产生了重要的影响,如何准确高效地识别城市建设用地的类别对于城市相关研究来说是至关重要的。
城市建设用地指城市和县人民政府所在地镇内的居住用地、公共管理与公共服务用地、商业服务业设施用地、工业用地、物流仓储用地、交通设施用地、公用设施用地、绿地。
现有的,城市建设用地识别方法包括人工测绘和遥感影像,这两种识别方法的识别速度较低,识别准确度较低。
技术实现要素:
本申请的目的在于提供一种基于大数据的城市建设用地分类识别方法及系统,该方法用于对城市建设用地进行分类和对城市建设用地类型进行识别,提高了城市建设用地分类识别的效率和城市建设用地的分类精度以及城市建设用地的类型识别准确度。
为达到上述目的,本申请提供一种基于大数据的城市建设用地分类识别方法,该方法包括:
将待分类识别的城市建设用地以道路为边界划分为多个网格;
获取每个网格的网络特征数据;
依据网络特征数据不断计算相邻两个网格的特征相似度值,将特征相似度值超过预设阈值的相邻两个网格进行合并,直至无法合并,形成新地块网格;
根据新地块网格的地表覆盖物数据和人口数据计算分类数据;
依据计算的分类数据和预先构建的城市建设用地分类标准对待分类识别的新地块网格进行分类,识别新地块网格的类别。
如上的,其中,获取每个网格内的网络特征数据包括:获取地表覆盖物数据和人口数据。
如上的,其中,相邻两个网格的特征相似度值的计算公式为:
其中,
如上的,其中,分类数据包括人口密度值和不同类别地表覆盖物占据的比重值。
如上的,其中,计算新地块网格中每一种类的地表覆盖物占据的比重值
如上的,其中,识别新地块网格的类别的方法包括:
依据人口密度值进行第一层级分类,将新地块网格分类为人口活动区和非人口活动区;其中,人口密度值超过预设的人口活动区阈值的分类为人口活动区,否则,分类为非人口活动区;
依据每一种地表覆盖物的比重值对被分类到人口活动区或非人口活动区的新地块网格进行二级分类,识别新地块网格的类别。
如上的,其中,二级分类中识别新地块网格类别的方法为:
计算新地块网格与各类别城市建设用地的隶属度值;
将获取的新地块网格与各类别城市建设用地的隶属度值按从大到小排序;
将最大隶属度值对应的城市建设用地的类别作为新地块网格的类别。
如上的,其中,二级分类中识别新地块网格类别的方法为:
计算新地块网格与各类别城市建设用地的隶属度值;
将获取的新地块网格与各类别城市建设用地的隶属度值按从大到小排序;
计算最大隶属度值与第二大隶属度值之间的差值,判断该差值是否在混合用地阈值范围内,若是,则将最大隶属度值和第二大隶属度值对应的城市建设用地的类别作为新地块网格的混合用地类别,否则,将最大隶属度值对应的城市建设用地的类别作为新地块网格的类别。
如上的,其中,计算新地块网格与各类别城市建设用地的隶属度值,具体的,计算公式如下:
其中,
本申请还提供一种基于大数据的城市建设用地分类识别系统,该系统包括:
网格划分模块,用于将待分类识别的城市建设用地以道路为边界划分为多个网格;
获取模块,用于获取每个网格的网络特征数据;
相似网格合并模块,用于依据网络特征数据不断计算相邻两个网格的特征相似度值,将特征相似度值超过预设阈值的相邻两个网格进行合并,直至无法合并,形成新地块网格;
计算模块,用于根据新地块网格的地表覆盖物数据和人口数据计算分类数据;
识别类别模块,用于依据计算的分类数据和预先构建的城市建设用地分类标准对待分类识别的新地块网格进行分类,识别新地块网格的类别。
本申请实现的有益效果如下:
(1)本申请将特征相似度值超过预设阈值的相邻两个网格进行合并,对合并后的新地块网格进行分类识别,减少了分类识别过程中的数据计算量,缩短了城市建设用地的分类识别时间,提高了城市建设用地的分类识别效率。
(2)本申请通过计算最大隶属度值与第二大隶属度值之间的差值,判断该差值是否在混合用地阈值范围内,若是,则将最大隶属度值和第二大隶属度值对应的城市建设用地的类别作为新地块网格的混合用地类别,否则,将最大隶属度值对应的城市建设用地的类别作为新地块网格的类别,提高了城市建设用地的分类识别精确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例的一种基于大数据的城市建设用地分类识别方法的流程图。
图2为本申请实施例的识别新地块网格的类别的方法流程图。
图3为本申请实施例的二级分类中识别新地块网格类别的方法的流程图。
图4为本申请实施例的一种基于大数据的城市建设用地分类识别系统的结构示意图。
附图标记:10-网格划分模块;20-获取模块;30-相似网格合并模块;40-计算模块;50-识别类别模块;100-城市建设用地分类识别系统。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
如图1所示,本申请提供一种基于大数据的城市建设用地分类识别方法,该方法包括如下步骤:
步骤s1,将待分类识别的城市建设用地以道路为边界划分为多个网格。
步骤s2,获取每个网格的网络特征数据。
获取每个网格内的网络特征数据包括:获取地表覆盖物数据和人口数据。
根据gis地理信息系统获取网格内的地表覆盖物数据或根据关键词的提取方式从百度开放平台上提取地表覆盖物数据,根据常驻人口和流动人口登记地址获取网格内的人口数据。
其中,地表覆盖物数据包括地表覆盖物类型和每种地表覆盖物对应的数量及占地面积。
其中,每一类别的城市建设用地对应多种地表覆盖物,居民用地包括房屋建筑物、停车场、城市道路和绿化草地等。绿地包括乔木林、灌木林、林地、草坪、广场和水面等。工业用地包括工业设施、多层房屋建筑区、城市道路和绿化带等。商业服务业设施用地包括商场、停车场、城市道路等。公共设施用地包括公共设施、公共建筑场所、城市道路和绿化带等。物流仓储用地包括仓储堆放场所、房屋建筑、城市道路和停车场等。交通设施用地包括铁路、公路和城市道路等。
步骤s3,依据网络特征数据不断计算相邻两个网格的特征相似度值,将特征相似度值超过预设阈值的相邻两个网格进行合并,直至无法合并,形成新地块网格。
其中,将相邻两个网格的共同的边界线删除,合并为一个网格,并且合并后的网格的网络特征数据为被合并的网格的网络特征数据之和。
根据本发明的一个具体实施例,将多个网格无重复的划分为相邻的成对网格,依据网络特征数据计算相邻的成对网格的特征相似度值,将特征相似度值超过预设阈值的相邻两个网格进行合并,继续按照上述方法对合并后的网格进行合并,直至无法合并为止,形成新地块网格。
根据本发明的另一个具体实施例,以多个网格的中心网格为中心,依据网络特征数据依次计算与其相邻的网格的特征相似度值,将特征相似度值超过预设阈值且与其相邻的网格进行合并,进一步,计算合并后网格与其相邻的网格特征相似度值,将特征相似度值超过预设阈值且与其相邻的网格进行合并,按照上述规则,依次将中心网格外围的网格进行合并,直至无法合并为止,形成新地块网格。
具体的,根据相邻两个网格地表覆盖物数据和人口数据计算相邻两个网格的特征相似度值,将特征相似度值超过预设阈值的网络进行合并,合并后的网格再与其相邻的网格进行特征相似度值计算,若计算的特征相似度值超过预设的阈值,则继续将这两个网格进行合并,直至相邻两个网格的特征相似度值小于预设的阈值,无法再合并为止,最终形成新的地块网。
根据本发明的一个具体实施例,相邻两个网格的特征相似度值的计算公式为:
其中,
步骤s4,根据新地块网格的地表覆盖物数据和人口数据计算分类数据。
根据本发明的一个具体实施例,分类数据包括人口密度值和不同类别地表覆盖物占据的比重值。
根据本发明的一个具体实施例,根据获取的人口数据,计算新地块网格的人口密度值。
具体的,人口密度值的计算公式为:
其中,m表示人口密度值;
根据本发明的一个具体实施例,根据获取的地表覆盖物数据,计算每一种地表覆盖物占据的比重值。其中,多种地表覆盖物占据的比重值进行并行计算。
根据本发明的一个具体实施例,计算新地块网格中每一种类的地表覆盖物占据的比重值
步骤s5,依据计算的分类数据和预先构建的城市建设用地分类标准对待分类识别的新地块网格进行分类,识别新地块网格的类别。
如图2所示,步骤s5包括如下子步骤:
步骤s510,依据人口密度值进行第一层级分类,将新地块网格分类为人口活动区和非人口活动区。
其中,人口密度值为单位面积的人口数量,人口活动区包括居住用地、公共管理与公共服务用地、商业服务业设施用地、工业用地、交通设施用地、公用设施用地,非人口活动区包括物流仓储用地、绿地。
具体的,人口密度值超过预设的人口活动区阈值的分类为人口活动区,否则,分类为非人口活动区。
步骤s520,依据每一种地表覆盖物的比重值对被分类到人口活动区或非人口活动区的新地块网格进行二级分类,识别新地块网格的类别。
其中,预先构建的城市建设用地分类规则中预存有各类别城市建设用地对应的每一种地表覆盖物占据的比重范围值。
如图3所示,二级分类中识别新地块网格类别的方法为:
步骤s521,计算新地块网格与各类别城市建设用地的隶属度值,具体的,计算公式如下:
其中,
步骤s522,将获取的新地块网格与各类别城市建设用地的隶属度值按从大到小排序。
步骤s523,将最大隶属度值对应的城市建设用地的类别作为新地块网格的类别。
根据本发明的另一个具体实施例,计算最大隶属度值与第二大隶属度值之间的差值,判断该差值是否在混合用地阈值范围内,若是,则将最大隶属度值和第二大隶属度值对应的城市建设用地的类别作为新地块网格的混合用地类别,否则,将最大隶属度值对应的城市建设用地的类别作为新地块网格的类别。
根据本发明的一个具体实施例,混合用地类型包括商业用地和公共设施混合用地,公共设施与道路交通设施混合用地,工业用地和物流仓储混合用地。
实施例二
如图4所示,本申请还提供一种基于大数据的城市建设用地分类识别系统100,该系统包括:
网格划分模块10,用于将待分类识别的城市建设用地以道路为边界划分为多个网格;
获取模块20,用于获取每个网格的网络特征数据;
相似网格合并模块30,用于依据网络特征数据不断计算相邻两个网格的特征相似度值,将特征相似度值超过预设阈值的相邻两个网格进行合并,直至无法合并,形成新地块网格;
计算模块40,用于根据新地块网格的地表覆盖物数据和人口数据计算分类数据;
识别类别模块50,用于依据计算的分类数据和预先构建的城市建设用地分类标准对待分类识别的新地块网格进行分类,识别新地块网格的类别。
本申请实现的有益效果如下:
(1)本申请将特征相似度值超过预设阈值的相邻两个网格进行合并,对合并后的新地块网格进行分类识别,减少了分类识别过程中的数据计算量,缩短了城市建设用地的分类识别时间,提高了城市建设用地的分类识别效率。
(2)本申请通过计算最大隶属度值与第二大隶属度值之间的差值,判断该差值是否在混合用地阈值范围内,若是,则将最大隶属度值和第二大隶属度值对应的城市建设用地的类别作为新地块网格的混合用地类别,否则,将最大隶属度值对应的城市建设用地的类别作为新地块网格的类别,提高了城市建设用地的分类识别精确度。