基于时序、PCA、聚类的土地评价方法与流程

文档序号:17729044发布日期:2019-05-22 02:43阅读:307来源:国知局
基于时序、PCA、聚类的土地评价方法与流程

本发明涉及土地综合评价领域,尤其涉及一种基于时序、pca、聚类的土地评价方法。



背景技术:

目前中国正处经济增长、转型升级的关键时期,伴随着城镇化、工业化的快速发展,土地利用压力和利用强度增大;建设用地占用农用地,土地后备资源不足,土地利用结构不合理;生态修复和环境保护进程相对缓慢,土地与经济发展之间的矛盾显著,问题严重,土地安全问题成为我国可持续发展面临的新挑战。

在土地安全愈发成为全社会热点的大背景影响下,2006年后又逐渐兴起了土地生态安全这一概念。充分了解认识某一区域内土地生态安全现状和趋势迫在眉睫,这对辅助发改、国土、环保等部门决策以促进土地的可持续发展,推动社会系统的良性运行,有着重要的意义。

现有土地生态安全评价存在的缺陷如下:

1、评价指标体系不全面且不统一。

土地生态安全作为一个新兴的研究领域,2006年刚刚起步,因此政府部门针对某一区域土地生态安全的评价仅单一理解为绿化水平、植被覆盖率等环境指标,尚未形成完整而全面的综合评价指标体系,因此在政府利用其辅助决策之时,也无法提出多角度考虑问题,大多仅仅从环境角度决策。

2、缺乏时序动态评价。

由于没有标准的评价指标体系,目前针对土地生态安全评价大多利用截面数据来静态评价某一区域固定时间的生态安全,忽略了其在时间序列评价中所体现出的诸多问题。

3、缺乏区域内部差异化分类评价。

区域土地生态安全评价并未细化,没有对区域内部现状进行分类以进行差异化管理。

4、缺乏空间三维评价。

缺乏图示区域土地生态安全现状,因此无法从空间上观察其规律性。

5、缺乏定量评价。

目前土地生态安全评价大多只是给予模糊的文字性评价,而没有利用大数据,将区域土地生态安全评价量化,更加清晰、直观、有依据的分析、评价和建议。



技术实现要素:

本发明公开了一种基于时序、pca、聚类的土地评价方法,方法包括步骤:

以环境、经济、社会模型为基础收集数据,建立土地生态安全数据池;

构建土地生态安全评价指标体系,包括步骤:

对所述土地生态安全数据池中的数据进行正向化处理,得到第一土地生态安全数据池;

对所述第一土地生态安全数据池中的数据进行标准化处理,得到第二土地生态安全数据池;

通过kmo检验和巴特利特球形检验对所述第二土地生态安全数据池中的数据进行相关性检验;

去掉所述第二土地生态安全数据池中不具备相关性的数据,得到第三土地生态安全数据池;

所述第三土地生态安全数据池即为所述土地生态安全评价指标体系;

采用主成分分析pca方法,从所述土地生态安全评价指标体系中提炼关键主成分,步骤包括:

计算所述土地生态安全评价指标体系中每个指标的贡献率;

将所述每个指标的贡献率按从大到小的顺序进行排序,为d1、d2、……、dn,与之对应的指标为x1、x2、……、xn;

对所述每个指标的贡献率按从大到小的顺序进行累积加和,求得所述每个指标的累积贡献率d1、d2、……、dn;

当累积贡献率dx达到85%以上时,此时所累积加和的贡献率d1、d2、……、dx所对应的指标x1、x2、……、xx即为最终提炼出来的所述关键主成分;

计算所述关键主成分上每个指标的载荷量;

根据所述关键主成分上每个指标的载荷量和对应的所述每个指标值,计算出所述关键主成分的得分;

根据所述关键主成分的得分和所述关键主成分的累积贡献率,计算土地生态安全综合得分;

根据所述土地生态安全综合得分,对区域的土地生态安全情况按时间序列进行分析,得到时间序列分析结果;

将所述土地生态安全综合得分作为聚类分析的输入,对区域内部土地生态安全情况进行聚类分析,得到聚类分析结果;

将所述时间序列分析结果和所述聚类分析结果作为土地评价结果。

优选地,所述标准化处理,按以下方法进行计算:

其中,zii为标准化处理后的数据值,xii为所述第一土地生态安全数据池中的数据值,xi为所述第一土地生态安全数据池中数据的算术平均值,si为所述第一土地生态安全数据池中数据的标准差。

优选地,所述关键主成分的得分,按以下方法进行计算:

fn=∑kn×zxn,

其中,fn为所述关键主成分的得分,kn为所述关键主成分上每个指标的载荷量,zxn为所述第一土地生态安全数据池中的数据进行标准化处理后的指标值。

优选地,所述土地生态安全综合得分,按以下方法进行计算:

f=∑dn×fn,

其中,f为所述土地生态安全综合得分,dn为所述关键主成分的累积贡献率,fn为所述关键主成分的得分。

优选地,根据所述聚类分析结果对所述区域内部土地生态安全划分风险等级,所述风险等级包括低度风险、中低度风险、中高度风险、以及高度风险。

优选地,将所述土地评价结果生成土地生态安全分析报告,所述土地生态安全分析报告包括:土地环境生态安全分析报告、土地经济生态安全分析报告、以及土地社会生态安全分析报告。

优选地,所述报告包括图表信息和文字信息。

优选地,所述土地生态安全数据池中的数据类型包括:国民经济核算、人口、固定资产投资、对外经济和旅游、能源、财政和金融、城市建设、资源和环境、农业、工业、建筑业、服务业、公共管理、以及社会服务。

本发明还可推及到其他土地综合评价的应用中,例如土地效益评价、潜力评价等。

与现有技术相比,本发明提供的基于时序、pca、聚类的土地评价方法,达到如下有益效果:

第一,本发明的数据范围更全面,不仅从生态环境角度收集数据信息,而是以环境、经济、社会模型为基础从多方面收集数据信息,形成土地生态安全数据池,为评价提供有力的数据支撑。

第二,本发明将土地生态安全评价进行量化分析,基于指标选取科学性、全面性、代表性、可操作性、可比性、平民化等原则,以及人地关系理论、可持续发展理论、系统理论,选取能够体现土地生态安全状况的多项指标因子,构建了土地生态安全的评价指标体系,弥补了土地生态安全评价大多只是给予模糊的文字性评价的主观弊端,利用大数据计算,将区域土地生态安全评价量化。

第三,本发明的土地评价方式多,利用时序、pca、聚类的方式,既可从时间序列的角度对区域的土地生态安全综合得分的演化进行分析,又可从三维空间角度对区域内部的分区进行聚类分析,分类管理,可全面了解土地生态安全情况。

第四、本发明利用pca法得到的数据直接组成聚类分析的样本矩阵进行聚类分析,排除了没有明显分异作用的指标影响,较少了数据的冗余,得到的聚类分析结果更加客观。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本发明实施例1中基于时序、pca、聚类的土地评价方法的流程图;

图2为本发明实施例3中基于关键主成分聚类分析的山东省土地生态安全谱系图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。应注意到,所描述的实施例实际上仅仅是本发明一部分实施例,而不是全部的实施例,且实际上仅是说明性的,决不作为对本发明及其应用或使用的任何限制。本申请的保护范围当视所附权利要求所界定者为准。

实施例1:

参见图1所示为本申请所述基于时序、pca、聚类的土地评价方法的具体实施例,该方法包括步骤:

步骤101、以环境、经济、社会模型为基础收集数据,建立土地生态安全数据池;其中,环境-经济-社会(ees)模型是一个框架提纲,从这三个维度把繁多的指标按其性质分类归档;

步骤102、构建土地生态安全评价指标体系,包括步骤:

对所述土地生态安全数据池中的数据进行正向化处理,得到第一土地生态安全数据池;

对所述第一土地生态安全数据池中的数据进行标准化处理,得到第二土地生态安全数据池;

通过kmo检验和巴特利特球形检验对所述第二土地生态安全数据池中的数据进行相关性检验;

去掉所述第二土地生态安全数据池中不具备相关性的数据,得到第三土地生态安全数据池;

所述第三土地生态安全数据池即为所述土地生态安全评价指标体系;

步骤103、采用主成分分析pca方法,从所述土地生态安全评价指标体系中提炼关键主成分,步骤包括:

计算所述土地生态安全评价指标体系中每个指标的贡献率;

将所述每个指标的贡献率按从大到小的顺序进行排序,为d1、d2、……、dn,与之对应的指标为x1、x2、……、xn;

对所述每个指标的贡献率按从大到小的顺序进行累积加和,求得所述每个指标的累积贡献率d1、d2、……、dn;

当累积贡献率dx达到85%以上时,此时所累积加和的贡献率d1、d2、……、dx所对应的指标x1、x2、……、xx即为最终提炼出来的所述关键主成分;

计算所述关键主成分上每个指标的载荷量;

步骤104、根据所述关键主成分上每个指标的载荷量和对应的所述每个指标值,计算出所述关键主成分的得分;

步骤105、根据所述关键主成分的得分和所述关键主成分的累积贡献率,计算土地生态安全综合得分;

步骤106、根据所述土地生态安全综合得分,对区域的土地生态安全情况按时间序列进行分析,得到时间序列分析结果;

步骤107、将所述土地生态安全综合得分作为聚类分析的输入,对区域内部土地生态安全情况进行聚类分析,得到聚类分析结果;

步骤108、将所述时间序列分析结果和所述聚类分析结果作为土地评价结果。

其中,时序-pca-聚类三者合起来是一个综合方法。

实施例2:

本申请提供了基于时序、pca、聚类的土地评价方法的另一个实施例,方法包括步骤:

步骤201、以环境、经济、社会模型为基础收集数据,建立土地生态安全数据池;

步骤202、构建土地生态安全评价指标体系,包括步骤:

对所述土地生态安全数据池中的数据进行正向化处理,得到第一土地生态安全数据池;

对所述第一土地生态安全数据池中的数据进行标准化处理,得到第二土地生态安全数据池;

通过kmo检验和巴特利特球形检验对所述第二土地生态安全数据池中的数据进行相关性检验;

去掉所述第二土地生态安全数据池中不具备相关性的数据,得到第三土地生态安全数据池;

所述第三土地生态安全数据池即为所述土地生态安全评价指标体系;

步骤203、采用主成分分析pca方法,从所述土地生态安全评价指标体系中提炼关键主成分,步骤包括:

计算所述土地生态安全评价指标体系中每个指标的贡献率;

将所述每个指标的贡献率按从大到小的顺序进行排序,为d1、d2、……、dn,与之对应的指标为x1、x2、……、xn;

对所述每个指标的贡献率按从大到小的顺序进行累积加和,求得所述每个指标的累积贡献率d1、d2、……、dn;

当累积贡献率dx达到85%以上时,此时所累积加和的贡献率d1、d2、……、dx所对应的指标x1、x2、……、xx即为最终提炼出来的所述关键主成分;

计算所述关键主成分上每个指标的载荷量;

步骤204、根据所述关键主成分上每个指标的载荷量和对应的所述每个指标值,计算出所述关键主成分的得分;

步骤205、根据所述关键主成分的得分和所述关键主成分的累积贡献率,计算土地生态安全综合得分;

步骤206、根据所述土地生态安全综合得分,对区域的土地生态安全情况按时间序列进行分析,得到时间序列分析结果;

步骤207、将所述土地生态安全综合得分作为聚类分析的输入,对区域内部土地生态安全情况进行聚类分析,得到聚类分析结果;

步骤208、将所述时间序列分析结果和所述聚类分析结果作为土地评价结果。

上述步骤201中,所述土地生态安全数据池中的数据类型包括:国民经济核算、人口、固定资产投资、对外经济和旅游、能源、财政和金融、城市建设、资源和环境、农业、工业、建筑业、服务业、公共管理、以及社会服务。

上述步骤202中,所述标准化处理,按以下方法进行计算:

其中,zii为标准化处理后的数据值,xii为所述第一土地生态安全数据池中的数据值,xi为所述第一土地生态安全数据池中数据的算术平均值,si为所述第一土地生态安全数据池中数据的标准差。

上述步骤204中,所述关键主成分的得分,按以下方法进行计算:

fn=∑kn×zxn,

其中,fn为所述关键主成分的得分,kn为所述关键主成分上每个指标的载荷量,zxn为所述第一土地生态安全数据池中的数据进行标准化处理后的指标值。

上述步骤205中,所述土地生态安全综合得分,按以下方法进行计算:

f=∑dn×fn,

其中,f为所述土地生态安全综合得分,dn为所述关键主成分的累积贡献率,fn为所述关键主成分的得分。

上述步骤207中,根据所述聚类分析结果对所述区域内部土地生态安全划分风险等级,所述风险等级包括低度风险、中低度风险、中高度风险、以及高度风险。

上述步骤208中,将所述土地评价结果生成土地生态安全分析报告,所述土地生态安全分析报告包括:土地环境生态安全分析报告、土地经济生态安全分析报告、以及土地社会生态安全分析报告。所述报告包括图表信息和文字信息。

本实施例的数据范围更全面,不仅从生态环境角度收集数据信息,而是以环境、经济、社会模型为基础从多方面收集数据信息,形成土地生态安全数据池,为评价提供有力的数据支撑。将土地生态安全评价进行量化分析,基于指标选取科学性、全面性、代表性、可操作性、可比性、平民化等原则,以及人地关系理论、可持续发展理论、系统理论,选取能够体现土地生态安全状况的多项指标因子,构建了土地生态安全的评价指标体系,弥补了土地生态安全评价大多只是给予模糊的文字性评价的主观弊端,利用大数据计算,将区域土地生态安全评价量化。本实施例的土地评价方式多,利用时序、pca、聚类的方式,既可从时间序列的角度对区域的土地生态安全综合得分的演化进行分析,又可从三维空间角度对区域内部的分区进行聚类分析,分类管理,可全面了解土地生态安全情况。

实施例3:

本申请提供了基于时序、pca、聚类的土地评价方法的一个实用型实施例,方法包括步骤:

1、收集整合现有数据,以环境-经济-社会(ees)为分类整合形成土地生态安全数据池,可查看地区历史数据记录和区域内部分区数据,同时该数据池可供其他土地相关评价工作查询使用。数据分类包括:国民经济核算、人口、固定资产投资、对外经济和旅游、能源、财政和金融、城市建设、资源和环境、农业、工业、建筑业、服务业、公共管理和社会服务等。

2、开发数据分析系统,可从数据仓库中提取数据,以ees模型为根基分布选取指标,构建土地生态安全评价指标体系,通过数据分析系统自动进行标准化处理、kmo检验与巴特利特球形检验,筛选不和相关性检验因子,构建一个相关性高且指标充足的评价指标体系。

考虑不同指标是从不同维度对区域内土地生态安全进行刻画,彼此间存在着量纲和数量级影响,因此需要事先对原始数据进行正向化处理(将成本型指标变为负数使其成为效益型指标)后再实施标准化处理,以消除量纲差异和数量级影响,需要说明的是标准化处理后相关指标值变为负数,表明该样本的指标值低于全区域内该指标的平均水平。数据的标准化无量纲选取z-score标准化方法,可通过既定模板设定处理,具体原理步骤如下:

(1)求出各变量(指标)的算术平均值(数学期望)xi和标准差si。

(2)进行标准化处理:

其中:zii为标准化后的变量值;xii为实际变量值。

(3)将逆指标前的正负号对调;

标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。

通过kmo检验和巴特利特球形检验方法检验数据的相关性。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,kmo值接近1。kmo值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,kmo值接近0。kmo值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。

巴特利特球形检验法是以相关系数矩阵为基础的。它的零假设相关系数矩阵是一个单位阵,即相关系数矩阵对角线的所有元素均为1,所有非对角线上的元素均为零。巴特利特球形检验法的统计量是根据相关系数矩阵的行列式得到的。如果该值较大,且其对应的相关概率值小于指定的显著水平时,拒绝零假设,表明相关系数矩阵不是单位阵,原有变量之间存在相关性,适合进行主成分分析;反之,零假设成立,原有变量之间不存在相关性,数据不适合进行主成分分析。

3、采用pca方法,利用spss软件,获取矩阵特征值与累计贡献率,以累积贡献率85%以上为界,提炼关键主成分,并根据不同指标在不同主成分上载荷量的高低为其命名,总结影响区域土地生态安全水平的因素。

4、根据不同关键主成分上指标因子的载荷值,加权计算土地生态安全综合得分,可对区域不同年份或区域内部分区进行排名和聚类,并将结果通过系统设定以图表的形式表达出来。

5、系统按照设定模板生成土地生态安全分析报告,包括土地环境生态安全分析报告、土地经济生态安全分析报告、土地社会生态安全分析报告。

以ees模型为基础构建生态安全评价指标体系(以山东省为例),包含15项指标因子,具体指标公式、单位、性质如表1所示:

土地环境生态安全系统:人均公园绿地面积(x1)、建成区绿化覆盖率(x2)、林地面积比重(x3)、人均耕地面积(x4);

土地社会生态安全系统:城市化率(x5)、城市人口密度(x6);

土地经济生态安全系统:第三产业增加值(x7)、地均gdp(x8)、第三产业比重(x9)、建筑业总产值(x10)、万元gdp能耗(x11)、单位耕地产值(x12)、污水处理总量(x13)、生活垃圾无害化处理量(x14)、单位耕地农药施用量(x15)。

表1土地生态安全评价指标体系

土地生态安全评价采用的是pca法,指标经无量纲标准化处理后,用标准化后的数据和因子载荷量直接计算得出每个关键主成分的得分,根据累积贡献率的不同进行运算,得出某区域土地生态安全的综合得分,给出排序结果。具体计算方法如下:

关键主成分得分计算公式:

fn=∑kn×zxn,

其中,kn为关键主成分上每个指标的载荷量,zxn为标准化后的每个指标值。

土地生态安全综合得分计算公式:

f=∑dn×fn,

其中,f为所述土地生态安全综合得分,dn为所述关键主成分的累积贡献率,fn为所述关键主成分的得分。

传统的聚类分析由于无法消除评价指标之间的相关性而导致聚类结果误差较大,为消除这一缺陷,本研究将提炼的关键主成分的分析结果作为聚类分析的输入,排除了没有明显分异作用的指标影响,较少了数据的冗余,得到的聚类分析结果更加客观,对区域内部土地生态安全情况进行聚类分析,得到各地市土地生态安全聚类分析的谱系图,以山东省为例,参见图2所示。以此为依据可划分土地生态安全风险区类别,在图2中以15距离为基准划线,共获得四个交点,从右至左,交点左侧不想交城市聚为一类。总结每一类特点,以山东省为例,如表2所示。

本实施例的显著效果在于,建立一个综合的系统平台,形成标准的土地生态安全评价指标体系,利用pca方法使土地生态安全评价可量化,通过进行时间序列分析和内部空间聚类,为解决土地问题提供参考。

通过以上各实施例可知,本申请存在的有益效果是:

第一,本发明的数据范围更全面,不仅从生态环境角度收集数据信息,而是以环境、经济、社会模型为基础从多方面收集数据信息,形成土地生态安全数据池,为评价提供有力的数据支撑。

第二,本发明将土地生态安全评价进行量化分析,基于指标选取科学性、全面性、代表性、可操作性、可比性、平民化等原则,以及人地关系理论、可持续发展理论、系统理论,选取能够体现土地生态安全状况的多项指标因子,构建了土地生态安全的评价指标体系,弥补了土地生态安全评价大多只是给予模糊的文字性评价的主观弊端,利用大数据计算,将区域土地生态安全评价量化。

第三,本发明的土地评价方式多,利用时序、pca、聚类的方式,既可从时间序列的角度对区域的土地生态安全综合得分的演化进行分析,又可从三维空间角度对区域内部的分区进行聚类分析,分类管理,可全面了解土地生态安全情况。

第四、本发明利用pca法得到的数据直接组成聚类分析的样本矩阵进行聚类分析,排除了没有明显分异作用的指标影响,较少了数据的冗余,得到的聚类分析结果更加客观。

表2山东省生态安全风险区特点表

上面通过附图和实施例,对本发明的技术方案做虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1