一种多尺度城市扩张关联规则提取方法

文档序号：9375973阅读：590来源：国知局

一种多尺度城市扩张关联规则提取方法
【技术领域】
[0001] 本发明属于城市规划技术领域，具体涉及一种多尺度城市扩张关联规则提取方法。
【背景技术】
[0002] 城市扩张及其驱动力分析是一个复杂动力学过程。关联规则挖掘通过挖掘城市扩张速度与驱动力之间的关联规则，以此来探索城市扩张模式。关联规则挖掘最重要的是建立空间事务集数据库。关联规则最初是用于挖掘超市货物销售活动中，货物与货物之间同时售出的关联关系。将关联规则挖掘用于空间模式的发现，需要解决连续空间分割和连续属性分割两个重要问题，才能形成空间事物数据库。其过程是：整个研究空间分割成若干密集规则分布的格网，每个格网构成一个事务单元；针对每个事务单元中连续的属性进行连续属性分割，转换成为分类属性。对于如何有效的进行连续属性分割，目前已经有很多有效的方法。比如等宽分割法、等深分割法、自然断裂发以及基于聚类算法的分割方法。但是如何对空间进行有效分割的方法很少。如何选择合适的事务单元尺度进而挖掘空间关联规贝1J，是关联规则挖掘用于城市扩张驱动力分析的一个难题。如果事务单元过大会造成信息过于粗糙，使得发现的规则可用性降低。如果事务单元过小，关联规则模型过度拟合其结果是规则的针对性过强而普适性过低。因此迫切需要一种方法来解决关联规则挖掘事务单元尺度选取的问题。

【发明内容】

[0003] 为了解决上述的技术问题，本发明提供了一种多尺度城市扩张关联规则提取方法。
[0004] 本发明所采用的技术方案是：一种多尺度城市扩张关联规则提取方法，其特征在于，包括以下步骤：
[0005] 步骤1 :收集研究区域数据，包括数据集A、数据集B和数据集C ;
[0006] 所述的数据集A包括Yl年土地利用分类图、Y2年土地利用分类图；
[0007] 所述的数据集B包括Yl年数字高程模型图。
[0008] 所述的数据集C包括城市主干道、次干道、高速公路、铁路、城市中心（市政府所在地）、区县中心（区县政府所在地）以及区县级行政区划图；
[0009] 步骤2 :针对行政区划范围以M米单位距离为尺度间隔，生成2M米至IOM米九级规则格网，分别即为Zl至Z9,格网单元采用方形格网，同时生成格网中心点；
[0010] 步骤3 :对研究区域中的城市进行初步分析确定城市扩张挖掘变量，即城市扩张驱动因子与城市扩张强度因子；
[0011] 步骤4 :针对步骤3中所述的挖掘变量，利用地理信息系统空间分析方法提取挖掘变量数据集；
[0012] 步骤5 :利用地理信息系统空间分析方法，使用Zl至Z9格网对步骤3中所述的挖掘变量进行空间统计
[0013] 步骤6 :分别针对Zl至Z9各级格网中的各个挖掘变量进行离散化处理；
[0014] 步骤7 :利用关联规则分析方法，分别对Zl至Z9各级格网中离散化后的挖掘变量进行分析，提取城市扩张关联规则；
[0015] 步骤8 :利用将步骤7中提取的关联规则与对应级别的格网进行空间匹配；
[0016] 步骤9 :计算关联规则空间尺度匹配系数，获得最适合空间尺度值；
[0017] 步骤10 :绘制关联规则空间分布图。
[0018] 作为优选，步骤3中所述的城市扩张驱动因子包括格网单元至城市中心距离、格网单元至区县中心距离、格网单元至主干道距离、格网单元至次干道距离、格网单元至铁路距离、格网单元至高速公路距离、格网单元至河流与湖泊距离、格网单元内平均高程、格网单元内平均坡度、格网单元内建设用地强度、格网单元内未开发用地强度；所述的城市扩张强度因子是指格网单元内新增建设用地强度。
[0019] 作为优选，步骤4的具体实现包括以下子步骤：
[0020] 步骤4. 1 :格网单元至城市中心距离、格网单元至区县中心距离、格网单元至主干道距离、格网单元至次干道距离、格网单元至铁路距离、格网单元至高速公路距离、格网单元至河流与湖泊距离的提取，分别以城市中心、区县中心、主干道、次干道、铁路、高速公路、河流与湖泊要素为源生成对应要素的覆盖整个城市范围距离缓冲区栅格数据集；
[0021] 步骤4. 2 :数字高程模型图即为栅格化的高程图，直接作为高程数据使用；
[0022] 步骤4. 3 :以数字高程模型图为基础提取坡度数据；
[0023] 步骤4. 4 :计算格网单元内建设用地强度和格网单元内未开发用地强度所需的数据建设用地图层和未开发用地图层，是通过Yl和Y2年土地利用数据分别进行重分类为建设用地与未开发用地获得；
[0024] 步骤4. 5 :计算城市扩展强度因子其所需的数据新增建设用地图层，是通过Yl年与Y2年建设用地图层进行空间叠置分析后获取；
[0025] 步骤4. 6:计算网单元内建设用地强度、格网单元内未开发用地强度和城市扩展强度因子所需的数据格网单元面积，是通过对Zl至Z9各级格网中网格单元分别进行几何面积计算获得，其值存储在Zl至Z9各级格网数据中，无需另行存储。
[0026] 作为优选，步骤5中所述的使用Zl至Z9格网对步骤3中所述的挖掘变量进行空间统计，实现过程是将城市扩张驱动因子和城市扩张强度因子采样值以分区统计的形式关联到格网中，分区统计方法包括平均值统计、总量统计；
[0027] 其中：
[0028] 格网单元至城市中心距离、格网单元至区县中心距离、格网单元至主干道距离、格网单元至次干道距离、格网单元至铁路距离、格网单元至高速公路距离、格网单元至河流与湖泊距离，以格网单元所覆盖范围的对应要素生成距离缓冲区栅格数据的平均距离值作为格网的米样值；
[0029] 格网单元内平均高程、格网单元内平均坡度：以格网单元所覆盖范围的平均高程和平均坡度作为格网的采样值；
[0030] 格网单元内建设用地用开发强度，以格网单元所覆盖范围内建设用地面积与格网单元面积的比值作为格网的采样值；
[0031] 格网单元内未开发用地强度，以格网单元所覆盖范围内未开发的用地面积与格网单元面积的比值作为格网的采样值；
[0032] 格网单元内城市扩张强度，以格网单元所覆盖范围新增建设用地面积与格网单元面积的比值作为格网的采样值。
[0033] 作为优选，步骤6中所述的分别针对Zl至Z9各级格网中的各个挖掘变量进行离散化处理，离散化方法包括等深法、等宽法、自然断裂法和基于聚类法。
[0034] 作为优选，步骤7中所述的关联规则分析方法，包括Apriori关联规则挖掘方法和 FP-Growth关联规则挖掘方法。
[0035] 作为优选，步骤7所述的FP-Growth关联规则挖掘方法使用一种频繁模式树的数据结构；
[0036] 频繁模式树由频繁项头表和项前缀树构成，频繁模式树的构建流程包括以下子步骤：
[0037] 步骤Al :选取步骤6所提含有挖掘变量离散化结果的格网作为输入数据，每个格网单元为一个事务单元，单元内由步骤6中所提离散化的挖掘变量构成的集合为一条事务，集合中元素称为事务项；输入一个最小支持度阈值；
[0038] 步骤A2 :遍历步骤Al输入格网的各事务单元，统计事务项出现的频率并记录，生成事务项频率降序表Tb ;
[0039] 步骤A3 :仓Il建FP-tree的根节点T，然后再次遍历输入的格网数据；
[0040] 步骤A4 :检测是否完成遍历，若是执行步骤A6,若否选取一条事务t，按照步骤A2 事务项频率降序表Tb中事务项的排序，对事务t包含的事务项进行排序；
[0041] 步骤A5 :按照步骤A4中的事务项排序，依次将其插入到T中，每插入一个事务项更新Tb中通名项与该项的连接索引

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：解鹏;刘耀林;刘殿峰;赵翔;刘艳芳;
技术所有人：武汉大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。