农业大数据基于GIS的农业适宜性评价分析方法与流程

文档序号:11515501阅读:3577来源:国知局
农业大数据基于GIS的农业适宜性评价分析方法与流程

本发明涉及大数据及海量数据处理技术领域,具体而言,涉及一种农业大数据基于gis的农业土地适宜性评价分析方法。



背景技术:

农业大数据是大数据技术和方法在农业领域的实践,从微观层面讲涉及到耕地、育种、播种、饲养、施肥、植保、收获、储运、农产品加工、销售、畜牧业生产等各环节,从宏观层面讲涉及到结构调整、农业增效、农村增绿、农民增收等板块,呈现出跨行业、跨专业的产业格局,用农业大数据来指导生产、经营、产业,将为现代农业发展和政府决策提供科学、准确的依据。

农业土地适宜性评价就是对某块土地是否适宜发展特定农业种植及其适宜程度如何进行综合评定,通过采集不同时间维度上的土地环境资源数据并进行大数据并行处理,得出反映土地适宜性的综合指标,再结合地理信息系统(gis)将土地评价指标直观得展现在地图中供监管门户进行决策分析。另外,当前我国部分土壤污染极为严重,各类耕地土壤质量严重下降,土壤污染严重超标,“土十条”己获国务院审核通过。通过农业大数据分析将影响土地种植适宜性的基本因子如气候、地质、地形、水文、土壤、土壤污染源以及反映宏观指标的产量、价格等数据进行汇集、加工和处理,且这些因子都具有较强的区域差异性,表现为空间数据,地理信息系统(gis)可以使土地适宜性评价的空间信息与属性信息通过“大数据+gis”整合展示,使土地适宜性评价更加定量化、规范化、综合化,一是能够为农业生产进行指导,二是对土壤的环境质量,尤其污染土壤的风险管控和土壤修复问题提供依据。



技术实现要素:

本发明提供一种农业大数据基于gis的农业土地适宜性评价分析方法,对适宜农作物生产的农业基础资源类型进行评价和排行,为生产决策提供可靠依据。

本发明所采用的技术方案为:

一种农业大数据基于gis的农业土地适宜性评价分析方法,具体步骤如下:

第一步是选取评价指标:对农业大数据中心数据库中的农业生产基础资源数据进行选取,选取的评价指标有:气象数据、土壤数据、地质数据、地形数据、水文数据、病虫害数据、价格数据、产量数据;

第二步对所述评价指标进行数据采集和抽取:评价指标进行单因子量化分级、评价数据积累;

第三步运用大数据并行计算对单因子适宜性评价指数进行计算;

第四步检验单因子适应性评价指数的选取精度;

第五步结合层次分析法ahp对单因子相对权重进行计算;

第六步建立综合评价模型:在第五步的基础上按照多因子采样抽取,使得每个评价单因子都有相应的权重指数分配,再通过二维矩阵模型建立向量表,计算每一个评价单因子的土地适宜度,即通过权重调整后的土地适宜性评价指数;该土地适宜性综合评价指数采用线性回归中的向量计算公式计算,同时采用线性函数建立最适宜函数、一般适宜函数及不适宜函数三级函数模型;

第七步对第六步的结果进行综合评价模型定量测试校验;如果校验结果通过,则进度到下一步对综合评价指数进行多维分析。反之检验结果偏差较大,则需要重新划分基础数据指标采集范围,并重复第二、三、四、五、六步的计算过程;

第八步对土地适宜度综合评价模型进行大数据多维分析,主要分析指标包括:产量价格组合分析、评价指数分布范围,土地覆盖率、农作物适宜度分类几个维度;找出最适宜种植的农作物种类,并输出为土地资源空间数据库,形成数据源。

农业土地适宜性就是对某块土地是否适宜发展农业生产及其适宜程度如何进行综合评定,是土地评价最基本的工作。从微观层面上来讲,它通过采集大量关于气候、地质、地形、水文、土壤、病虫害发生率、周边建筑地形地貌、资金投入比重、交通条件等主要影响农业土地适宜性的因子样本和历史数据,整合为空间大数据库,以便直观清晰的量化和反映土地的“四情”;从宏观层面上来讲,将这些空间数据通过复杂的大数据分析计算后得出反映土地适宜性的综合指标,将每种影响因子的贡献比例进行延伸和筛选,突出影响较大的因素,抑制干扰较深的条件,最终形成适宜性评价指标体系单元及其最优因子的覆盖程度,再与地理信息系统(gis)相结合进行数字分析处理,通过多图层技术将评价指标因子进行层级划分,对适宜农业生产的类型(宜农、宜林、宜牧)进行排行,为生产决策提供可靠依据。

附图说明

图1为本发明流程图;

图2为本发明在农业大数据平台实现效果图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

如图1所示,一种农业大数据基于gis的农业土地适宜性评价分析方法第一步是选取评价指标,对农业大数据数据中心中的土地资源基础数据进行选取,选取的评价指标有:气象数据、土壤数据、地质数据、地形数据、水文数据、病虫害数据、价格数据、产量数据。

第二步,主要对评价指标进行数据采集和抽取,评价指标进行单因子量化分级、评价数据积累,其中气象数据单因子量化分级采集指标包括:空气温度、气压、空气湿度、蒸发量、光照、风向、风速;土壤数据包括:土壤类型、土壤温度、土壤湿度、有机质、氮磷钾含量、土壤容量;地质数据包括:地质形态、岩石构造、倾斜程度、矿物成分、岩层厚度;地形数据包括:山丘、平原、高原、盆地、邱原、山地;水文数据包括:径流、泥沙含量、水质、水位、岩层土壤含水量;病虫害数据包括:粮食作物病虫害、蔬菜作物病虫害、经济作物病虫害、果树作物病虫害、病虫害类型、病虫害防治方法;价格数据包括:地头价格、批发价格、同比价格、环比价格;产量数据包括:亩产量、年产量。以上采集指标作为评价指标的单因子,进行后续计算。

第三步运用大数据并行计算对单因子适宜性评价指数进行计算。由于各种影响土地适宜性评价的单因子都会产生和吸收海量的底层数据,且单因子适宜性评价指数的分析也会涉及到大量的矩阵计算,传统的线性计算方式已不能满足整体指标的分析,因此本发明采用目前业界流行的大数据并行计算技术来充分发挥硬件计算资源的使用效率,这将会大大减少矩阵计算的误差和耗费时间。本专利所采用的大数据并行计算技术采用目前业界流行的hadoop计算架构体系进行,其分布式、并行性、多线程性能,满足综合评价指数的计算需求。

第四步检验单因子适应性评价指数的选取精度,如果对某一项被选取的因子适宜度发生偏差的话,则应该在下一次计算中剔除出去,例如土壤湿度和土壤水含量两个因子的适宜度计算产生相互干扰的话,则只保证其中一项因子作为备选。

第五步结合层次分析法(ahp)对单因子相对权重进行计算。层次分析法建立的步骤。第一,建立递阶层次结构,确定权重的目标层、准则层、措施层;第二,采用特尔菲法构造判断矩阵,确定各个评价单因子的相对重要性;第三,层次单排序与检验,对于构造的判断矩阵,利用特定数学方法进行层次排序。单排序是指每一个判断矩阵各因素针对其准则的相对权重。在实际中要求判断矩阵满足大体上的一致性,需进行一致性检验。只有通过检验,才能说明判断矩阵在逻辑上是合理的,才能继续对结果进行分析;第四,层次总排序与检验,总排序是指每一个判断矩阵各因素针对目标层(最上层)的相对权重。这一权重的计算采用从上而下的方法,逐层合成。

第六步建立综合评价模型,在第五步的基础上按照多因子采样抽取,使得每个评价因子都有相应的权重指数分配,再通过二维矩阵模型建立向量表,计算每一个评价因子的土地适宜度(通过权重调整后的土地适宜性评价指数)。本发明采用线性回归中的向量计算公式计算土地适宜性综合评价指数,在以下公式中:

s为土地适宜性综合评价指数,wi为第i个评价因子的相对权重,si为第i个评价因子的适宜性评价指数。

同时建立函数模型时采用线性函数。其中最适宜函数可描述为:

一般适宜函数可描述为:

不适宜函数可描述为:

以上各式中,ui、uj、uk分别为最适宜、一般适宜和不适宜3级函数模型,xi为评价单元第i个影响因子的扰动因素,sij为第i个影响因子j的指标。

本发明将等级划分标准的间断点作为指标对应最适宜、适宜、不适宜三个等级模糊子集的代表值,根据上述函数模型通式构造各自的线性回归函数,计算出各单因素指标值分别隶属于最适宜、中、低三个级别的程度,形成单要素评价矩阵r。在建立综合评价模型中,为减少因为历史评价经验而产生的数据差异性并最终消除扰动因素,每一个评价单因子都应该在一致性满意度的正态分布区间中进行权重计算。

第七步对第六步的结果进行综合评价模型定量测试校验。如果校验结果通过,则进度到下一步对综合评价指数进行多维分析。反之检验结果偏差较大,则需要重新划分基础数据指标采集范围,并重复第二、三、四、五、六步的计算过程。

第八步对土地适宜度综合评价模型进行大数据多维分析,主要分析指标包括:产量价格组合分析、评价指数分布范围,土地覆盖率、农作物适宜度分类等几个维度,例如当适宜度综合评价指数介于一定的区间范围时,对此条件下的土壤、气象、水文、产量和价格等多重因子进行综合分析,找出最适宜种植的农作物种类,并输出为土地资源空间数据库,形成数据源。

第九步中整合第八步中的数据结果,对当前综合适宜度评价指数进行多因子组合,并使用gis多图层技术进行逐个输出,通过抽取不同的指数区间,地图图层会联动显示不同的影响因子分布情况。

下面以天津市武清区天鹰椒种植区域适宜性评价分析举例说明

1、选取评价指标

评价指标对评价的影响主要表现在两个方面:其一,对不同的评价目标(例如不同的土地利用方式)要选用不同的评价因子,根据特定区域的不同状况适当增加或减少评价因子的个数;其二,各评价因子对评价目标的影响大小不是完全一致的,对于不同的评价目标,各评价因子的权重可能不同。

根据当地实际情况,天鹰椒种植用地的评价因子包括:年平均气温(t年)、≥10℃活动积温(∑t≥10℃)、年极端最低气温≤-18℃出现的频率(ftmin≤-18℃)、3-10月平均相对湿度(u3-10)、海拔高度、坡度、坡向、土壤质地、土壤类型等9个指标作为备选评价因子。

2、评价指标数据采集和抽取

通过采集和抽取农业大数据中心的相关评价指标数据,整合成基础因子数据集合作为备选数据库表。每一个评价因子都对农作物种植起着至关重要的作用,在综合评价作物土地适宜性之前,必须研究作物种植每一个影响因子的等级。根据当地实际情况及天鹰椒对各项指标的要求,对评价因子进行分级(表1)。

表1、天鹰椒土地适宜性评价因子分级

3、单因子适宜性评价指数计算

采用大数据并行计算对天鹰椒种植的气候、地形、土壤数据进行计算,确定影响天鹰椒生长的主要单因子属性。

4、检验单因子适应性评价指数

由于各个因子对作物用地适宜性的影响程度各不相同,只有对各评价因子的重要性大小做出正确判断,才能保证评价结果的真实性。

5、单因子相对权重计算

经过层次分析法(ahp)确定各评价因子及权重,很明显,第二层的单排序结果就是总排序结果,同样,对总排序结果进行一致性检验。如果通过,则可以认为判断矩阵的整体一致性是可以接受的。

最后,在参考已有研究成果和实地调查的基础上,确定了天鹰椒用地适宜性各评价因子的相对重要性,采用大数据并行计算技术进行层次分析法的演绎,并通过一致性检验(o≤cr≤0.05.小于0.1),得出武清区天鹰椒特色经济作物土地适宜性评价因子的权重(表2)

表2、武清区天鹰椒适宜性评价因子权重

6、构建天鹰椒种植适宜性评价综合模型

在评价因子的适宜度量化分级里,有些指标是定量描述的,如年平均气温,年降水量,年日照时数等,而有些指标只能做定性描述,如坡向,土壤类型,土壤质地等。为了方便分析问题,应使这些定量或定性的指标有一个统一的衡量标准,以便采用构造隶属函数的方式进行描述。对定量指标可进行归一化处理,对定性指标可根据该目标的适宜度等级综合考虑。

本专利采用分段函数来确定天鹰椒土地适宜度综合评价等级的回归函数模型。对于定性指标(坡向、土壤类型、土壤质地),本发明拟根据适宜度的三个分级程度分别赋值为1、2、3。

回归函数建立后,利用gis软件的spatialanalyst模块中的“con”条件函数对指标图层进行运算,进而得到各指标相对于评价等级的适宜度,最后得到相应的适宜度矩阵r图层运算的范围是武清区,基本评价单元为栅格单元,每个单因素指标的空间模糊评价结果是生成3个适宜度图层。

7、综合评价模型定量测试校验

在确定各评价因子权重和单因子模糊评价之后,得到评价因子权重集a和模糊关系矩阵r。要考虑所有因素的影响,得出科学的结论,仍必须进行综合评价模型定量测试校验,校验采用模糊综合评价。进行模糊综合评价,还需要进行模糊变换,通过选择模糊合成算子进行综合评价。模糊变换的模型为

式中,b=(b1,b2,……,bn)为模糊综合评价结果向量,a为评价因素的权向量,符号“o”为模糊合成算子,本文采用m(•,+)是一种较为广泛应用的加权平均型算子模型。其特点是既充分运用评价因子数据,又能明显地体现各评价因子的权重差异,且具有较强的综合作用。

上式的模糊变换分两部分完成:第一步是权重向量与单因素评价模糊矩阵进行乘法运算,对于空间图像,其运算过程是权重向量与每一个等级的所有因子图层进行加权平均运算,生成相对于一个评语等级的隶属度图层。第二步为求解出各指标对三个评价等级的隶属度之后,根据最大隶属度原则,来判断最终的评价结果等级。

8、天鹰椒适宜性综合评价结果大数据多维分析

武清区天鹰椒适宜性评价结果表明全区最适宜、适宜和不适宜土地面积分别为1355.48亩、3312.74亩和1440.59亩,分别占全区参评土地总面积的2.23%、5.45%和2.37%。

9、天鹰椒适宜性综合评价结果gis多图层输出

天鹰椒最适宜区主要集中在武清南部地区。这些地区主要是海拔0-50m的平原,湿度适宜,在天鹰椒生长旺季4-6月的湿度都稳定在75-90%之间,热量充足,年平均气温均大于15℃,大于10℃的年积温也是处在4500℃以上,冬季极端最低温度≤-18℃的频率都小于20%,土壤为砂壤质红壤和黄壤,正常情况下天鹰椒生产能获得优质高产。

天鹰椒适宜区,主要分布在武清区东部,土壤主要是水稻土、红、黄壤,冬季极端最低温度≤-18℃的频率大于20%以上,天鹰椒产量不稳定,这些地区可作为武清蔬菜的生态效益而发展。

天鹰椒不适宜区,主要在武清区西北部,冬季极端最低温度≤-18℃的频率大于50%以上,此区域天鹰椒容易受到冻害,因此这些地区不宜盲目发展天鹰椒生产。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1