在作物识别和面积估算中选择遥感数据和分类算法的方法

文档序号:6542625阅读:489来源:国知局
在作物识别和面积估算中选择遥感数据和分类算法的方法
【专利摘要】本发明公开在作物识别和面积估算中选择遥感数据和分类算法的方法,包括如下步骤:(1)获取目标区的遥感数据,并对获取的遥感数据进行预处理;(2)地面调查数据:进行目标区实际作物分布地面调查,获得样本作物分布图;利用地面调查数据,确定作物分类的训练样本与检验样本;(3)对预处理后的遥感数据进行尺度扩展,模拟生成多分辨率影像序列;(4)利用分类算法对作物进行分类,并估算不同作物的种植面积;(5)分析空间分辨率对作物识别和面积估算精度的影响,分析种植成数和聚集度对作物种植面积估算精度的影响;(6)选择适宜的遥感数据和分类方法。本发明为不同作物种植结构区进行遥感数据和分类方法选择提供了理论依据和实验基础。
【专利说明】在作物识别和面积估算中选择遥感数据和分类算法的方法

【技术领域】
[0001] 本发明涉及作物遥感识别方法,特别涉及一种在作物识别和面积估算中选择遥感 数据和分类算法的方法。

【背景技术】
[0002] 随着遥感技术的快速发展,目前已经能够提供从局部、区域到全球范围的连续地 表采样,并可以提供从〇. 61米到数十公里空间分辨率的遥感数据,实现从多个空间尺度进 行对地遥感观测。尺度变异和敏感性在使用遥感数据的分析中逐渐起到重要的作用。近年 来,多尺度的遥感数据广泛用于区域乃至全球尺度的土地覆被制图,人们越来越重视遥感 数据分类精度尺度效应方面的研究。随着空间分辨率的提高,遥感往往具有更高的地面目 标识别和面积估算精度。Moody和Woodcock研究了将高分辨率的土地覆盖数据聚合到低分 辨率过程中土地覆盖类型面积随分辨率的变化,结果表明当分辨率大于90米时,面积估计 误差显著增大。虽然选择高分辨率遥感数据有助于提高作物识别和面积估算的区域精度, 但是高分辨率遥感数据的价格较为昂贵,而实践中对区域精度要求是不一样的;在区域精 度要求比较低的情况下购买高分辨率遥感数据,会使得作物识别和面积估算的成本很高, 造成不必要的浪费。
[0003] 利用遥感数据识别不同农作物并估算其种植面积,是农作物产量估测的基础。在 农作物遥感识别过程中,作物种植面积测量精度除了受到影像空间分辨率的影响,还与分 类器类型、研究区的作物种植结构、聚集程度等因素密切相关。针对具体的研究区,要满足 一定的分类精度需要多少分辨率的数据;不同的分类器对同一分辨率有何不同响应;不同 分辨率下同种分类器的精度有何变化;不同分辨率下作物种植成数、聚集度等因素对精度 结果的影响如何等;现有技术中均没有给出针对不同作物种植结构区进行遥感数据和分类 方法选择的理论依据和实验基础。


【发明内容】

[0004] 针对现有技术中存在的不足,本发明的目的在于提供一种在作物识别和面积估算 中选择遥感数据和分类算法的方法,能够降低作物识别和面积估算时遥感数据的购买成 本,为农作物产量估测奠定坚实的基础。
[0005] 本发明的技术方案是这样实现的:在作物识别和面积估算中选择遥感数据和分类 算法的方法,包括如下步骤:
[0006] (1)获取目标区的遥感数据,并对获取的遥感数据进行预处理;
[0007] (2)地面调查数据:进行目标区实际作物分布地面调查,获得样本作物分布图;利 用地面调查数据,确定作物分类的训练样本与检验样本;
[0008] (3)对预处理后的遥感数据进行尺度扩展,模拟生成多分辨率影像序列;
[0009] (4)利用分类算法对作物进行分类,并估算不同作物的种植面积;
[0010] (5)分析空间分辨率对作物识别和面积估算精度的影响,同时分析种植成数和聚 集度对作物种植面积估算精度的影响;
[0011] (6)针对作物识别和面积估算的具体情况及精度要求,选择适宜的遥感数据和分 类方法。
[0012] 上述在作物识别和面积估算中选择遥感数据和分类算法的方法,在步骤(1)中: 获取影像空间分辨率为20m的卫星的目标区遥感数据,对获取的目标区遥感数据进行辐射 定标和几何纠正处理;辐射定标处理方法:将影像的DN值转化为大气顶归一化光谱反射 率,大气纠正采用FLAASH模型;几何纠正处理方法:以目标区的历史SP0T5影像数据作为 参考影像,采用二次多项式方法对数据进行几何精纠正,采用40个控制点,纠正误差控制 在0.5个象元内。
[0013] 上述在作物识别和面积估算中选择遥感数据和分类算法的方法,在步骤(2)中: 首先根据耕作信息,参考SP0T5影像勾绘出每个种植地块的边界,并进行唯一性编号,借助 地理信息系统整理形成目标区内作物田块矢量数据集,开展野外实地调查,实地确认地块 边界的正确性,并逐地块填写作物类型,在室内编辑整理,得到目标区的样本作物分布图; 然后根据目标区地物物候及分布特征,确定最终分类类别;最后根据SP0T5数据的野外实 地调查得到的样本作物分布图,并结合目视判图经验解译方式,按照最终分类类别对每个 类别分别选取样本,从所选取的样本中随机抽取一半作为训练样本,另一半为用于精度评 价的检验样本,训练样本和检验样本没有重合。
[0014] 上述在作物识别和面积估算中选择遥感数据和分类算法的方法,在步骤(3)中: 采用简单平均法对预处理后的遥感数据进行尺度扩展:将遥感影像n*n窗口内的像元平均 值作为转换后对应的分辨率为40m、60m、80m和100m的遥感影像的像元值。
[0015] 上述在作物识别和面积估算中选择遥感数据和分类算法的方法,在步骤(6)中: 对于区域精度要求达到90%以上且待估算作物种植面积很小但待估算作物分布又比较密 集的地区,待估算作物种植面积很小是指待估算作物的种植成数不足5%,分布又比较密集 是指待估算作物的聚集度低于〇. 2的情况;选用60m分辨率的数据;分类算法采用最大似 然分类算法或支持向量机分类算法;最大似然分类算法:通过统计方法计算各个象元属于 每个类的概率,将该象元归属于概率最大的类;支持向量机分类算法:选择径向基函数RBF 为核函数,核参数Y设置为〇. 25,惩罚因子C设置为100。
[0016] 上述在作物识别和面积估算中选择遥感数据和分类算法的方法,在步骤(6)中: 对于区域精度要求达到90%以上且待估算作物种植面积较小且待估算作物分布比较零散 的地区,待估算作物种植面积较小是指待估算作物的种植成数不足30%而大于或等于5%, 待估算作物分布比较零散是指待估算作物的聚集度高于〇. 4的情况,选用20m-40m分辨率 的数据;分类算法采用支持向量机分类算法或最大似然分类算法。
[0017] 上述在作物识别和面积估算中选择遥感数据和分类算法的方法,在步骤(6)中: 对于区域精度要求达到90%以上且待估算作物种植较密集且待估算作物种植面积占优势 的地区,待估算作物种植较密集是指待估算作物的聚集度小于或等于0. 4且大于或等于 〇. 2,所述待估算作物种植面积占优势是指待估算作物的种植成数大于30%的情况,选用 100m分辨率遥感数据;分类算法采用人工神经网络分类算法:选用三层神经网络反向传播 算法,遥感数据的5个波段对应于网络的5个输入节点,隐含层设置8个节点,6个分类类别 对应输出层的6个输出节点,激发函数选用Logistic函数,最大迭代次数设为1000,结束迭 代的误差阈值设为0. 1。
[0018] 上述在作物识别和面积估算中选择遥感数据和分类算法的方法,种植成数F即某 一种作物种植面积fraction占总种植面积A。的百分比,即:F=fraction/A Q ;聚集度即同一 种作物空间分布的集中程度,聚集度值越高,作物分布越零散,相反,聚集度值越低,作物分 布越集中,聚集度计算方法如下:(a)设定目标区内各作物类型象元个数的50%作为计算作 物聚集度的标准,(b)把15km*10km的目标区均分成100个1. 5km*lkm的小区域,统计各小 区域内各个作物类型的象元个数,并将象元个数由大到小排列,(c)把小区域内各作物类型 的象元个数由大到小相加,直到达到总象元个数的50%,(d)计算参与相加的小区域个数占 总小区域数的百分比,这个值即为该作物的聚集度。
[0019] 本发明的有益效果是:本发明开展了尺度变化对农作物识别和种植面积估算精度 的影响研究,探讨不同空间分辨率的遥感数据对作物分类和面积估算精度的影响规律,并 分析了作物种植成数和聚集度在不同尺度水平下对作物面积估算精度的影响,为不同作物 种植结构区遥感数据和分类方法的选择提供理论依据和实验基础;本发明可以用于针对特 定遥感应用中遥感数据和分类方法的选择,降低作物识别和面积估算时遥感数据的购买成 本。

【专利附图】

【附图说明】
[0020] 图1实验区地理位置,CBERS-02B CCD影像及SP0T5影像。
[0021] 图2样区样本作物分布图。
[0022] 图3本发明在作物识别和面积估算中选择遥感数据和分类算法的方法的技术路 线图。
[0023] 图4A总体精度随不同分辨率的变化图(标有实心方块的线代表MLC,标有实心圆 形的线代表SVM,表有实心菱形的线代表ANN)。
[0024] 图4B Kappa系数随不同分辨率的变化图(标有实心方块的线代表MLC,标有实心 圆形的线代表SVM,表有实心菱形的线代表ANN)。
[0025] 图5A玉米的区域精度随分辨率的变化图(标有实心方块的线代表MLC,标有实心 圆形的线代表SVM,表有实心菱形的线代表ANN)。
[0026] 图5B大豆的区域精度随分辨率的变化图(标有实心方块的线代表MLC,标有实心 圆形的线代表SVM,表有实心菱形的线代表ANN ;纵坐标表示区域精度%)。
[0027] 图5C金银花的区域精度随分辨率的变化图(标有实心方块的线代表MLC,标有实 心圆形的线代表SVM,表有实心菱形的线代表ANN)。
[0028] 图5D棉花的区域精度随分辨率的变化图(标有实心方块的线代表MLC,标有实心 圆形的线代表SVM,表有实心菱形的线代表ANN ;纵坐标表示区域精度%)。

【具体实施方式】
[0029] 结合附图对本发明做进一步的说明:
[0030] 本实施例的实验区位于河南省新乡市封丘县,中心地理坐标114° 30' E和 35° 03' N,大小15km*10km (图1)。该地区属于暖温带大陆性季风气候区,多年平均气温 13. 9°C,降雨量615. 1_,雨热同期,光热水资源丰富,土壤肥沃,属典型的一年两熟制,秋粮 作物主要为冬小麦,夏粮作物主要包括夏玉米、大豆、花生等,此外该地区还广泛种植了经 济作物棉花及一种特有的药材金银花,作物种植结构相对复杂,对华北地区的农作物种植 制度具有典型代表性。实验区夏玉米和大豆一般6月中旬种植,9月份收获;棉花4月中旬 种植,10月初收获;金银花属多年生作物,一般在6、7、8、9四个月份分别采摘第1、2、3、4茬 花。
[0031] (1)获取实验区的遥感数据,并对获取的遥感数据进行预处理。
[0032] 订购实验区内中巴地球资源卫星02B(CBERS-02B)CCD影像1景,接收时间为2008 年8月22日,影像清晰度好,虽然有少量的云,但基本都分布在居民区上方,不影响研究中 作物的识别(图1)。影像空间分辨率20m,幅宽113km,包括5个波段,前4个波段在谱段设 置上与Landsat7TM相当,波谱范围分别是0· 45?0· 52um,0· 52?0· 59um,0· 63?0· 69um, 0· 77?0· 89um,第5波段是全色波段,范围是0· 51?0· 73um。
[0033] 影像获取后对其进行了辐射定标和几何纠正处理。辐射定标是将影像的DN值 转化为大气顶归一化光谱反射率,大气纠正采用FLAASH模型。几何纠正以实验区的历史 SP0T5影像数据作为参考影像,采用二次多项式方法对数据进行几何精纠正,采用40个控 制点,纠正误差控制在〇. 5个象元内。
[0034] (2)地面调查数据:进行实际作物分布调查,获得样本作物分布图;利用地面调查 数据,确定作物分类的训练样本与检验样本。
[0035] 为了获得实验区内实际的农作物分布特征信息,本实施例借助SP0T5全色影像 (成像时间为2008年4月16日,空间分辨率2. 5米),选择了 1个具有代表性的5Km*5Km样 区(图1),进行实际作物分布调查,获得了样区内准确的2008年秋季作物分布图(图2)。具 体调查方法如下:首先根据耕作信息,参考SPOT影像勾绘出每个种植地块的边界,并进行 唯一性编号;借助地理信息系统整理形成实验样区内作物田块矢量数据集;在2008年8月 19日,开展野外实地调查,实地确认地块边界的正确性,并逐地块填写作物类型;最后在室 内编辑整理,得到实验样区的样本作物分布图。
[0036] (3)对预处理后的遥感数据进行尺度扩展,模拟生成多分辨率影像序列。
[0037] 首先以CBERS-02B20米分辨率数据为基准,对其进行尺度扩展,模拟生成多分辨 率影像序列(40m,60m,80m,100m)。同时,利用地面调查数据,确定作物分类的训练样本与检 验样本。
[0038] 多分辨率影像序列获取:在遥感中常用的尺度扩展方法主要有简单平均法、中心 像元法、最近邻法、双线性内插和立方卷积。本实施例采用简单平均法进行影像的尺度扩 展:将遥感影像n*n窗口内的像元平均值作为转换后对应的低分辨率(40m,60m,80m,100m) 的遥感影像的像元值。中心像元法是取n*n窗口内中心像元值作为转换后对应的低分辨率 的遥感影像的像元值,该方法常用于水文学中。最近邻法,双线性内插和立方卷积在尺度转 换因子大于5时,不适合将遥感图像从高分辨率转换到低分辨率。
[0039] (4)利用分类算法开展农作物分类试验,估算不同作物的种植面积。
[0040] 样本数据集确定及分类方法:根据实验区地物物候及分布特征,将玉米、棉花、金 银花、大豆、林地和非耕地作为最终分类类别,其中林地包括树木和苗圃,非耕地包括城镇 居民区、道路和水渠等。根据SP0T5数据的野外地面调查得到的样本作物分布图,并结合目 视判图经验解译方式,基于20m分辨率的CBERS-02B影像,选取非耕地样本1518个象元,林 地样本860个象元,玉米样本1520个象元,棉花样本789个象元,金银花样本851个象元, 大豆样本749个象兀,从所选取的样本中随机抽取一半作为训练样本,另一半为用于精度 评价的检验样本,训练样本和检验样本没有重合。
[0041] 本实施例采用最大似然分类算法(MLC)、支持向量机分类算法(SVM)和人工神经 网络分类算法(ANN) 3种分类算法开展农作物分类实验,估算不同作物的种植面积,并分别 从象元尺度和区域尺度进行分类精度和种植面积估算精度评价。在分析空间分辨率对面积 估算精度影响的同时,还进行了作物种植成数和聚集度的影响分析。总体技术路线见图3。
[0042] MLC是通过统计方法计算各个象元属于每个类的概率,将该象元归属于概率最 大的类;SVM选择了径向基函数(RBF)为核函数,核参数γ设置为0. 25,惩罚因子C设置 为100 ;ANN选用了三层神经网络反向传播算法,遥感数据的5个波段对应于网络的5个 输入节点,隐含层设置8个节点,6个分类类别对应输出层的6个输出节点,激发函数选用 Logistic函数,最大迭代次数设为1000,结束迭代的误差阈值设为0. 1。
[0043] 为了使分类结果具有可比性,对不同分辨率的影像和不同分类方法都采用了相同 的训练样本和检验样本,对不同数据采用了相同的分类器参数设置。
[0044] 种植成数和聚集度的计算:对于不同的实验区,各作物所占的面积百分比和聚集 程度是不同的,这些都会对区域精度产生影响。因此,本实施例在分析空间分辨率对面积估 算精度影响的同时,还进行了作物种植成数和聚集度的影响分析。
[0045] 种植成数(F)即某一种作物种植面积(fraction)占总种植面积(心)的百分比,即: F=fraction/A0〇
[0046] 聚集度即同一种作物空间分布的集中程度,聚集度值越高,作物分布越零散,相 反,聚集度值越低,作物分布越集中。计算方法如下:(a)设定实验区内各作物类型象元个 数的50%作为计算作物聚集度的标准。(b)把15km*10km的实验区均分成100个1. 5km*lkm 的小区域,统计各小区域内各个作物类型的象元个数,并将象元个数由大到小排列。(c)把 小区域内各作物类型的象元个数由大到小相加,直到达到总象元个数的50%。(d)计算参与 相加的小区域个数占总小区域数的百分比,这个值即为该作物的聚集度。
[0047] (5)分析空间分辨率对作物识别和面积估算精度的影响,同时分析种植成数和聚 集度对作物种植面积估算精度的影响。
[0048] (5· 1)精度评价指标
[0049] 为全面分析空间分辨率对作物识别和面积估算的影响,分别从象元尺度和区域尺 度对不同空间分辨率、不同分类方法的结果进行了比较和分析。
[0050] (a)象元尺度上,主要是基于上述随机选取的检验样本,得到分类混淆矩阵,计算 出总体象元精度和Kappa系数作为检验分类效果的指标。
[0051] (b)区域尺度上,文中采用了用来比较相对精度的区域精度。
[0052] 以地面填图数据得到的各类别的面积总量(V为基准值,将由尺度扩展得到的较 低分辨率(i)下提取的各类别的面积总量化与^进行对比,获取区域内各类别的总体面积 估算精度1,计算公式:
[0053]

【权利要求】
1. 在作物识别和面积估算中选择遥感数据和分类算法的方法,其特征在于,包括如下 步骤: (1) 获取目标区的遥感数据,并对获取的遥感数据进行预处理; (2) 进行目标区实际作物分布地面调查,获得样本作物分布图;利用地面调查数据,确 定作物分类的训练样本与检验样本; (3) 对预处理后的遥感数据进行尺度扩展,模拟生成多分辨率影像序列; (4) 利用分类算法对作物进行分类,并估算不同作物的种植面积; (5) 分析空间分辨率对作物识别和面积估算精度的影响,同时分析种植成数和聚集度 对作物种植面积估算精度的影响; (6) 针对作物识别和面积估算区的具体情况及精度要求,选择适宜的遥感数据和分类 方法。
2. 根据权利要求1所述的在作物识别和面积估算中选择遥感数据和分类算法的方法, 其特征在于,在步骤(1)中:获取影像空间分辨率为20m的卫星的目标区遥感数据,对获取 的目标区遥感数据进行辐射定标和几何纠正处理;辐射定标处理方法:将影像的DN值转化 为大气顶归一化光谱反射率,大气纠正采用FLAASH模型;几何纠正处理方法:以目标区的 历史SPOT5影像数据作为参考影像,采用二次多项式方法对数据进行几何精纠正,采用40 个控制点,纠正误差控制在0. 5个象元内。
3. 根据权利要求2所述的在作物识别和面积估算中选择遥感数据和分类算法的方法, 其特征在于,在步骤(2)中:首先根据耕作信息,参考SPOT5影像勾绘出每个种植地块的边 界,并进行唯一性编号,借助地理信息系统整理形成目标区内作物田块矢量数据集,开展 野外实地调查,实地确认地块边界的正确性,并逐地块填写作物类型,在室内编辑整理,得 到目标区的样本作物分布图;然后根据目标区地物物候及分布特征,确定最终分类类别; 最后根据SPOT5数据的野外实地调查得到的样本作物分布图,并结合目视判图经验解译方 式,按照最终分类类别对每个类别分别选取样本,从所选取的样本中随机抽取一半作为训 练样本,另一半为用于精度评价的检验样本,训练样本和检验样本没有重合。
4. 根据权利要求3所述的在作物识别和面积估算中选择遥感数据和分类算法的方法, 其特征在于,在步骤(3)中:采用简单平均法对预处理后的遥感数据进行尺度扩展:将遥感 影像n*n窗口内的像元平均值作为转换后对应的分辨率为40m、60m、80m和100m的遥感影 像的像元值。
5. 根据权利要求4所述的在作物识别和面积估算中选择遥感数据和分类算法的方法, 其特征在于,在步骤(6)中:对于区域精度要求达到90%以上且待估算作物种植面积很小但 待估算作物分布又比较密集的地区,待估算作物种植面积很小是指待估算作物的种植成数 不足5%,待估算作物分布又比较密集是指待估算作物的聚集度低于0. 2的情况;选用60m 分辨率的数据;分类算法采用最大似然分类算法或支持向量机分类算法;最大似然分类算 法:通过统计方法计算各个象元属于每个类的概率,将该象元归属于概率最大的类;支持 向量机分类算法:选择径向基函数RBF为核函数,核参数γ设置为0.25,惩罚因子C设置 为 100。
6. 根据权利要求4所述的在作物识别和面积估算中选择遥感数据和分类算法的方法, 其特征在于,在步骤(6)中:对于区域精度要求达到90%以上且待估算作物种植面积较小且 待估算作物分布比较零散的地区,待估算作物种植面积较小是指待估算作物的种植成数不 足30%而大于或等于5%,待估算作物分布比较零散是指待估算作物的聚集度高于0. 4的情 况,选用20m-40m分辨率的数据;分类算法采用支持向量机分类算法或最大似然分类算法。
7. 根据权利要求4所述的在作物识别和面积估算中选择遥感数据和分类算法的方法, 其特征在于,在步骤(6)中:对于区域精度要求达到90%以上且待估算作物种植较密集且待 估算作物种植面积占优势的地区,待估算作物种植较密集是指待估算作物的作物聚集度小 于或等于0. 4且大于或等于0. 2,待估算作物种植面积占优势是指待估算作物的种植成数 大于30%的情况,选用100m分辨率数据;分类算法采用人工神经网络分类算法:选用三层 神经网络反向传播算法,遥感数据的5个波段对应于网络的5个输入节点,隐含层设置8个 节点,6个分类类别对应输出层的6个输出节点,激发函数选用Logistic函数,最大迭代次 数设为1000,结束迭代的误差阈值设为0. 1。
8. 根据权利要求5-7任一所述的在作物识别和面积估算中选择遥感数据和分类算法 的方法,其特征在于,种植成数F即某一种作物种植面积fraction占总种植面积怂的百分 比,S卩:Fifraction/X;聚集度即同一种作物空间分布的集中程度,聚集度值越高,作物分 布越零散,相反,聚集度值越低,作物分布越集中,聚集度计算方法如下:(a)设定目标区内 各作物类型象元个数的50%作为计算作物聚集度的标准,(b)把15km*10km的目标区均分 成100个1. 5km*lkm的小区域,统计各小区域内各个作物类型的象元个数,并将象元个数由 大到小排列,(c)把小区域内各作物类型的象元个数由大到小相加,直到达到总象元个数的 50%,(d)计算参与相加的小区域个数占总小区域数的百分比,这个值即为该作物的聚集度。
【文档编号】G06Q50/02GK104063718SQ201410129471
【公开日】2014年9月24日 申请日期:2014年4月1日 优先权日:2014年4月1日
【发明者】李强子, 张焕雪, 杜鑫, 王红岩, 刘吉磊 申请人:中国科学院遥感与数字地球研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1