一种土地利用变化驱动力的识别方法、系统和装置与流程

文档序号:15230385发布日期:2018-08-21 19:21阅读:284来源:国知局

本发明涉及环境建模技术领域,尤其是一种土地利用变化驱动力的识别方法、系统和装置。



背景技术:

土地利用变化建模是土地科学研究的重点,针对土地利用变化机制的研究是土地利用变化模型的基础,是土地变化问题的研究核心。因而土地利用变化归因极为重要,是探讨土地利用驱动机制、支持城市规划与政策制定以及评估土地利用对生态环境影响的重要工具。

土地利用变化归因模型是通过分析土地利用时间和空间格局的变化,以及各种影响土地利用变化的因素及其作用方式,揭示土地利用变化的特征并阐明土地利用变化的过程。目前土地利用变化归因模型主要采用经验统计模型,该模型利用线性相关表明变量之间关系的数学方程式,以土地利用变化类别值作为因变量,驱动力因子组成自变量,通过回归方程系数值来反映土地利用变化的关系,该方法简单实用,扩展性强,可进行单一模拟。然而在复杂的人地关系地域系统中,众多的社会、经济、技术与自然环境条件之间的相互作用并非是一种简单的线性关系。线性模型得到的因果范式难以表达区域土地属性受临界值域、突变或随机因素影响的非线性变化现象,因此模型的模拟精度较低。



技术实现要素:

为解决上述技术问题,本发明的目的在于:提供一种模拟精度高的土地利用变化驱动力的识别方法、系统和装置。

本发明所采取的第一种技术方案是:

一种土地利用变化驱动力的识别方法,包括以下步骤:

获取研究区域内的驱动因子的数据;

根据获取的驱动因子的数据,使用随机梯度提升法对预测模型进行m次迭代优化,得到驱动力识别模型;

根据驱动力识别模型计算不同土地利用变化的驱动因子的贡献率。

进一步,所述驱动力识别模型的表达式为:

其中,fm(x)代表经过m次迭代优化后的预测模型,即驱动力识别模型,m代表迭代的次数,j代表叶节点的数量,rjm代表第m棵树的叶节点区域,cjm代表使预测模型的损失函数最小化的叶节点对应的输出值,i代表样本。

进一步,还包括以下步骤:

对获取到的驱动因子的数据进行分辨率均一化处理。

进一步,还包括以下步骤:

利用偏相关分析土地利用变化与单一驱动因子间的相关关系。

进一步,还包括以下步骤:

验证驱动力识别模型的拟合度,以及使用十折交叉检验法验证驱动力识别模型的精度。

进一步,所述驱动因子的数据包括自然地理数据和社会经济数据,其中:

所述自然地理数据包括地形、水文和气象数据中的至少一种;

所述社会经济数据包括土地利用类型图、土地利用规划图、区位信息、土地政策、国民生产总值、人均国民生产总值、社会零售品销售总额、第一产业国民生产总值、第二产业国民生产总值、第三产业国民生产总值、人均粮食产量、人均肉类产量、固定资产投资总额、恩格尔系数、基尼指数、城镇居民人均工资、乡村居民人均工资、总人口密度和城镇人口密度中的至少一种。

进一步,所述根据驱动力识别模型计算不同土地利用变化的驱动因子的贡献率,这一步骤具体为:

根据驱动力识别模型进行权重计算,提取驱动因子的权重得分,从而获取驱动因子的贡献率。

本发明所采取的第二种技术方案是:

一种土地利用变化驱动力的识别系统,包括:

获取模块,用于获取研究区域内的驱动因子的数据;

迭代模块,用于根据获取的驱动因子的数据,使用随机梯度提升法对预测模型进行m次迭代优化,得到驱动力识别模型;

计算模块,用于根据驱动力识别模型计算不同土地利用变化的驱动因子的贡献率。

进一步,所述驱动力识别模型的表达式为:

其中,m代表迭代的次数,j代表叶节点的数量,rjm代表第m棵树的叶节点区域,cjm代表使预测模型的损失函数最小化的叶节点对应的输出值,i代表样本。

本发明所采取的第三种技术方案是:

一种土地利用变化驱动力的识别装置,包括:

存储器,用于存储程序;

处理器,用于加载所述程序以执行土地利用变化驱动力的方法。

本发明的有益效果是:本发明采用随机梯度提升法来对预测模型进行迭代优化,而随机梯度提升法集成分类树和提升法,其够通过迭代不断地减小预测模型的偏差,从而获得高精度的驱动力识别模型。

附图说明

图1为本发明一种土地利用变化驱动力的识别方法的流程图;

图2为本发明一种具体实施例的土地利用变化驱动力的识别方法的流程图;

图3为本发明一种具体实施例中某省农田变化与其驱动因子贡献率的统计图;

图4为本发明一种具体实施例中某省建设用地的主要驱动因子贡献率的统计图。

具体实施方式

参照图1,一种土地利用变化驱动力的识别方法,包括以下步骤:

获取研究区域内的驱动因子的数据;

根据获取的驱动因子的数据,使用随机梯度提升法对预测模型进行m次迭代优化,得到驱动力识别模型;

根据驱动力识别模型计算不同土地利用变化的驱动因子的贡献率。

进一步,所述驱动力识别模型的表达式为:

其中,fm(x)代表经过m次迭代优化后的预测模型,即驱动力识别模型,m代表迭代的次数,j代表叶节点的数量,rjm代表第m棵树的叶节点区域,cjm代表使预测模型的损失函数最小化的叶节点对应的输出值,i代表样本。其中,预测模型以f(x),f(x)的具体表达式,本领域技术人员可以根据实际需要灵活设置。如f(x)=a1x+a2x+a3x+……+anx;f(x)=w0+w1x1+w2x2+…+wnxn。

进一步作为优选的实施方式,还包括以下步骤:

对获取到的驱动因子的数据进行分辨率均一化处理。

进一步作为优选的实施方式,还包括以下步骤:

利用偏相关分析土地利用变化与单一驱动因子间的相关关系。

进一步作为优选的实施方式,还包括以下步骤:

验证驱动力识别模型的拟合度,以及使用十折交叉检验法验证驱动力识别模型的精度。

进一步作为优选的实施方式,所述驱动因子的数据包括自然地理数据和社会经济数据,其中:

所述自然地理数据包括地形、水文和气象数据中的至少一种;

所述社会经济数据包括土地利用类型图、土地利用规划图、区位信息、土地政策、国民生产总值、人均国民生产总值、社会零售品销售总额、第一产业国民生产总值、第二产业国民生产总值、第三产业国民生产总值、人均粮食产量、人均肉类产量、固定资产投资总额、恩格尔系数、基尼指数、城镇居民人均工资、乡村居民人均工资、总人口密度和城镇人口密度中的至少一种。

进一步作为优选的实施方式,所述根据驱动力识别模型计算不同土地利用变化的驱动因子的贡献率,这一步骤具体为:

根据驱动力识别模型进行权重计算,提取驱动因子的权重得分,从而获取驱动因子的贡献率。

一种与图1中的方法所对应的土地利用变化驱动力的识别系统,包括:

获取模块,用于获取研究区域内的驱动因子的数据;

迭代模块,用于根据获取的驱动因子的数据,使用随机梯度提升法对预测模型进行m次迭代优化,得到驱动力识别模型;

计算模块,用于根据驱动力识别模型计算不同土地利用变化的驱动因子的贡献率。

进一步作为优选的实施方式,所述驱动力识别模型的表达式为:

其中,m代表迭代的次数,j代表叶节点的数量,rjm代表第m棵树的叶节点区域,cjm代表使预测模型的损失函数最小化的叶节点对应的输出值,i代表样本。

一种与图1中的方法所对应的土地利用变化驱动力的识别装置,包括:

存储器,用于存储程序;

处理器,用于加载所述程序以执行土地利用变化驱动力的方法。

下面结合说明书附图和具体的实施例对本发明进行进一步的说明。

参照图2,本实施例公开了一种土地利用变化驱动力的识别方法,该方法包括以下步骤:

s1、获取研究区域内的驱动因子的数据。

首先确定研究区域,搜集研究区内历史土地利用变化、政治、经济、人口、自然等方面统计及空间要素数据,建立研究区域内土地利用地理信息数据集,所述地理信息数据集包括自然地理和社会经济二类数据:自然地理数据包括:地形、水文、气象数据;社会经济数据包括土地利用类型图、土地利用规划图、区位信息、土地政策、国民生产总值、人均国民生产总值、社会零售品销售总额、第一产业国民生产总值、第二产业国民生产总值、第三产业国民生产总值、人均粮食产量、人均肉类产量、固定资产投资总额、恩格尔系数、基尼指数、城镇居民人均工资、乡村居民人均工资、总人口密度、城镇人口密度等数据。

s2、对获取到的驱动因子的数据进行分辨率均一化处理。例如,气象因子中的气温和降雨数据一般是栅格数据或者基于气象站点的测量值,土地利用数据可能是基于栅格的或者地块的,国民生产总值,人均国民生产总值和社会零售品销售总额数据可能是基于镇、县、市或者更大区域尺度的,总人口密度和城镇人口密度一般是基于栅格的数据,固定资产投资总额、恩格尔系数、基尼指数和城镇居民人均工资一般来自基于县域的年鉴数据,这些数据分辨率存在很大差异:基于气象站点、基于栅格、地块、或基于县和市的数据需要进行时间和空间尺度统一再进行土地利用变化归因分析。数据预处理即是实现分辨率均一化,一般对基于气象站点的数据采用空间插值方法;对基于栅格、地块、或基于县和市的数据采用以最大区域为标准区域计算区域平均的方法(比如:市>县>镇>地块,以市为标准区域计算一个市内所有县的平均值)。不同分辨率时间尺度数据也是采用以最大时间尺度为标准时间计算该时间段内平均的方法,比如年>季节>月>天,以年为标准时间计算一年内所有季节的平均值。这样就得到了时间和空间分辨率均一化的驱动因子数据。由于异常值的存在会对空间变异函数具有显著的影响,本研究采用域法识别异常值,即样本平均值加减3倍标准差,在此区间以外的数据均定为异常值,然后分别用正常的最大和最小值代替异常值从而控制数据的质量。通过本步骤,能够提升模型的精度以及模型的生成效率。

s3、根据获取的驱动因子的数据,使用随机梯度提升法对预测模型进行m次迭代优化,得到驱动力识别模型。其中该步骤具体如下:

在本实施例中,以f(x)表示预测模型,然后计算样本点在f(x)下的最小的损失函数,算法每次迭代生成一棵新的回归树,对于n个样本点可导损失函数的表达式为:l(yi,f(xi)),用m表示迭代的次数,m={1,2,3,……,m},经过m次迭代后得到的回归预测函数以fm(x)表示,即驱动力识别模型。

首先,初始化回归树估计一个使损失函数极小化的长数值,此时该回归树是只有一个点的树,接着迭代建立m棵回归树:残差的估算值,见下面表达式。

从m=1到m(即第一层循环),i=1到n(即第二层循环),计算损失函数在负梯度在当前模型的值,并将它作为残差的估算值:所述残差的估算值表达式为:

其中,γim表示残差估算值,l(yi,f(xi))表示损失函数,f(x)表示预测函数,经过m-1次迭代后得到的回归预测函数以fm-1(x)表示。由梯度下降法得知,损失函数l的负梯度在当前模型f(xi)的值时,l将最快下降,也就是最优化模型的过程。

对于γim拟合的回归树,得到第m棵树的叶节点区域rjm,其中j为叶节点的数量,j=1,2,3,……,j。

j=1到j(二层循环),计算:

其中,cjm代表使预测模型的损失函数最小化的叶节点对应的输出值,对j=1,2,…j,即对该树上的每个叶节点,利用线性搜索,估算每个叶节点对应类的输出值,使损失函数最小化,并且更新fm(x);

得到

最终的模型可以表达为:

其中,m代表迭代的次数,j代表叶节点的数量,rjm代表第m棵树的叶节点区域,i代表样本。

s4、根据驱动力识别模型进行权重计算,提取驱动因子的权重得分,从而获取驱动因子的贡献率。

在步骤s4中,通过在残差减少的梯度方向上建立一个个新的模型,根据损失函数最小的最终模型的权重计算,提取权重得分,获得不同土地利用类别变化的驱动因子贡献率;利用建立好的最优精度模型精确地筛选和识别不同土地利用类别变化的关键驱动因子;然后根据特征土地利用类别及其关键驱动因子的贡献率,确定该特征土地利用类别的关键驱动因子类型及其影响程度。

s5、利用偏相关分析土地利用变化与单一驱动因子间的相关关系。偏相关是在排除了其他变量的影响下分析土地利用变化与单一驱动因子间的相关关系,利用迭代法分析每个驱动因子与特征土地利用类别变化的非线性关系,最显著相关的一组驱动因子与特征土地利用类别变化间的交互作用。

s6、验证驱动力识别模型的拟合度,以及使用十折交叉检验法验证驱动力识别模型的精度。在本步骤中,为了得到可靠稳定的模型,应用十折交叉检验估计随机梯度提升模型的算法精度。模型拟合优度用pesudor平方度量。pesudor平方的值越接近1,说明模型的拟合程度越好;反之,pesudor平方的值越小,说明模型的拟合程度越差。

本实施例结合谋生的土地利用变化进行研究。

数据来源:1.土地利用数据使用12景覆盖某省landsat卫星的遥感数据(分辨率为30m),1995年和2005年二期共24景遥感图像,经过图像预处理、地理配准、辐射校正、图像拼接等遥感图像处理过程后,进行监督分类,解译获得六类土地利用类型:农田、森林、草地、水体、裸地和建设用地。因此,获得了1995年和2005年土地利用现状数据。2.土地利用变化驱动因子数据:1995年和2005年,自然地理因子数据包括:气温(sat)和海拔(ele)。社会经济因子数据包括:土地利用规划、土地政策(policy)、国民生产总值(gdp),人均国民生产总值(gdpc)、社会零售品销售总额(trscg)、第一产业国民生产总值(gdpp)、第二产业国民生产总值(gdps)、第三产业国民生产总值(gdpt)、恩格尔系数(ec)、乡村居民人均收入(tiri)、总人口密度(tpop)。

然后根据土地利用和驱动因子数据,计算土地利用变化转移率和驱动因子变化率。土地利用变化转移率作为随机梯度提升模型的因变量,驱动因子变化率为自变量。其中土地利用变化转移率和驱动因子变化率计算借助excel,随机梯度提升模型模拟借助r语言编辑的程序完成。

本实施例的分析结果如下:

图3表明某省1995至2005年间农田变化的主要驱动因子是土地政策(policy)和乡村人均收入(tiri),贡献率分别为42.9%和39.7%,累计贡献率达到82.6%。其它自然地理和社会经济因子贡献率较低。社会经济因子是江西省农田变化的关键驱动因子。偏相关分析表明,农田变化与土地政策、乡村人均收入、人口密度和第一产业国民生产总值呈正相关,随着土地政策、乡村人均收入、人口密度和第一产业国民生产总值的增加,农田变化呈现先不变再增加最后保持恒定。

图4表明某省1995至2005年间建设用地变化的主要驱动因子是恩格尔系数(ec)、第三产业国民生产总值(gdpt)、国民生产总值(gdp)和乡村人均收入(tiri),贡献率分别为40.1%、10.9%、10.5%和7.7%,累计贡献率达到69.2%。其它自然地理和社会经济因子贡献率较低。社会经济因子是江西省建设用地变化的关键驱动因子。偏相关分析表明,建设用地变化与恩格尔系数和第二产业国民生产总值呈负相关,随着恩格尔系数和第二产业国民生产总值的增加,建设用地变化呈现先不变再下降最后保持恒定;建设用地变化与国民生产总值和乡村人均收入呈正相关,随着国民生产总值和乡村人均收入的增加,农田变化呈现先不变再增加最后保持恒定。

最后对模型进行检验,检验表明农田和建设用地随机梯度提升回归模型的拟合精度均较高,pseudor平方分别为0.82和0.89。

综上所述,本发明具有以下优点:

(1)对多元共线性不敏感,结果对缺失数据和离群值比较稳健,可以高效地处理不同类型的土地利用变化驱动因子和多达几千个潜在驱动因子的作用。

(2)不需要复杂的模型假设就可以很好的拟合土地利用变化与其驱动因子的关系。

(3)具备分析土地利用变化与其驱动因子交互作用的能力,克服了传统土地利用变化归因方法因交互作用的复杂性在其他模型中经常被忽略的缺陷。

(4)不易产生对数据的过度拟合。

因此,可应用随机梯度提升模型识别土地利用变化的驱动因子及其影响程度,精确地筛选土地利用变化的关键驱动因子并定量计算其贡献率,并分析因子间的交互作用。基于随机梯度提升算法的模型方法为土地利用变化归因研究开启了全新视角。

对于实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1