土地覆被分类方法、装置、设备及计算机存储介质

文档序号:33713505发布日期:2023-04-01 02:08阅读:55来源:国知局
土地覆被分类方法、装置、设备及计算机存储介质

1.本发明涉及遥感地理信息和计算机技术交叉技术领域,尤指一种土地覆被分类方法、装置、设备及计算机存储介质。


背景技术:

2.土地覆被分类是基于遥感大数据并按照拟定的分类标准对土地利用/土地覆被进行分类的过程。
3.对于国家、洲际以及全球尺度范围的土地利用/土地覆被遥感分类,或是基于google earth engine(gee)云平台或是pixel image engine(pie)的相关分类研究,通常的分类思想是先将整个研究区域进行分块,然后对每个分块单独进行模型训练及其分类,最后将各分块的分类精度进行平均作为整个研究区域的分类精度。在国家、洲际、全球尺度角度上讲,土地覆被分类采用每个分块单独训练模型与分类的处理方法是合理且可行有效的。
4.但当研究区域是在国家尺度以下的如流域或区域尺度时,由于边缘效应的存在,在区域边缘会存在着分类的较大误差,如果在区域或流域尺度上采用分块独立训练模型分类处理思路,每个分块就会产生各自的训练模型,虽然使用同一分类器,但各个分类器的参数设置不同,如随机森林内部结构不同,树的叶子节点和树的深度就会不同,加之边缘效应的误差,将各个分块的分类精度进行平均作为整个研究区最终所获得的精度是不合理的,导致分类结果不准确,难以适用于复杂地形区区域土地覆被分类。
5.而目前的土地覆被分类方法大部分基于gee云平台,在数据涉密、区域尺度较小、分类精度要求高的情况下,还缺少一种能够应用到个人计算机上的土地覆被分类方法。


技术实现要素:

6.本发明实施例提供一种土地覆被分类方法、装置、设备及计算机存储介质,用以解决现有技术中在对区域尺度土地覆被进行分类时,分类不合理且分类精度不准确的技术问题。
7.本发明实施例提供了一种土地覆被分类方法,包括:
8.对待分类区进行采样,获取采样点的采样数据,所述采样数据包括地理坐标数据和土地覆被类型数据;
9.对所述待分类区的影像进行分块,获取每个块区的样本数据,所述待分类区的所有样本数据形成样本数据集;
10.利用所述样本数据集对所述待分类区的土地覆被分类模型进行训练;
11.利用训练后的土地覆被分类模型,对每个块区进行分类,最终完成所述待分类区的土地覆被分类。
12.可选地,所述待分类区的数据为多时相卫星遥感影像;
13.对所述卫星遥感影像进行预处理,所述预处理包括几何校正、辐射校正、去云处
理、影像拼接及影像裁剪。
14.可选地,所述采样包括野外采样和室内采样;
15.所述野外采样为在野外利用gps进行土地覆被类型采样,获得采样数据;
16.所述室内采样为对所述待分类区的高空间分辨率影像进行解译并采样,获得采样数据。
17.可选地,所述分块为:对所述待分类区的影像进行平均分块。
18.可选地,所述样本数据集包括训练样本和验证样本;
19.所述样本数据集的获取,包括:
20.利用所述采样点的地理坐标数据,匹配所述采样点在所述块区中的位置;
21.在所述地理坐标数据的地理坐标上标记所述土地覆被类型。
22.可选地,所述土地覆被分类模型:
23.损失函数为:
[0024][0025]
其中,h表示所述样本数据集中的训练样本,h表示所述样本数据集中的全部训练样本,x表示输入模型的训练样本的特征向量,少表示输入模型的训练样本的特征向量的真实标签,t表示迭代次数,f
t-1
(x)表示第t-1次训练时得到的学习器;h
t
(x)表示第t次训练时得到的弱学习器;
[0026]
第t次训练得到的学习器f
t
(x)为:
[0027]ft
(x)=h
t
(x)+f
t-1
(x)
ꢀꢀ
(2);
[0028]
分类目标函数f(x)为:
[0029]
min:z=f
i-yj[0030][0031]fi
表示土地覆被分类模型的分类结果,i表示所述分类结果的第i类土地覆被类型,yj表示真实的土地覆被分类结果,j表示所述真实的土地覆被分类结果的第j类土地覆被类型,n表示每一类土地覆被类型对应的像元数像元。
[0032]
可选地,所述土地覆被分类模型中,获得所述第t次训练得到的学习器f
t
(x),还包括:
[0033]
计算所述损失函数h
t
(x)的负梯度r
ti

[0034][0035]
利用平方差对所述损失函数h
t
(x)进行拟合:
[0036][0037]
本发明另一种实施例,提供了一种土地覆被分类装置,包括:
[0038]
采样模块,用于对待分类区进行采样,获取采样点的采样数据,所述采样数据包括地理坐标数据和土地覆被类型数据;
[0039]
样本数据集获取模块,获取每个块区的样本数据,所述待分类区的所有样本数据形成样本数据集;
[0040]
模型训练模块,利用所述样本数据集对所述待分类区的土地覆被分类模型进行训练;
[0041]
分类模块,用于利用训练后的土地覆被分类模型,对每个块区进行分类,完成待分类区的土地覆被分类。
[0042]
本发明另一种实施例,提供了一种土地覆被分类设备,包括:处理器和用于存储所述处理器可执行指令的存储器;
[0043]
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-7任一项所述的土地覆被分类方法。
[0044]
本发明另一种实施例,提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被用于实现如权利要求1-8任一项所述的土地覆被分类方法。
[0045]
本发明有益效果如下:
[0046]
本发明实施例提供的土地覆被分类方法、装置、设备及计算机存储介质,通过对待分类区的遥感影像进行分块读取,然后整体训练土地覆被分类模型,再进行分块分类的分总分技术,能够确保待分类区的分类结果一致性好;该土地覆被分类方法可应用于个人计算机,分类精度准确合理且更高。
附图说明
[0047]
图1为本发明实施例提供的土地覆被分类方法的流程图;
[0048]
图2为本发明实施例提供的湟水流域和分块区域位置图;
[0049]
图3为本发明实施例提供的rf分类模型的分类结果;
[0050]
图4为本发明实施例提供的土地覆被分类模型的分类结果;
[0051]
图5为本发明实施例提供的stacking分类模型的分类结果;
[0052]
图6为本发明实施例提供的土地覆被分类装置的结构示意图;
[0053]
图7为本发明实施例提供的土地覆被分类设备的结构示意图。
具体实施方式
[0054]
为使本发明的上述目的、特征和优点能够更为明显易懂,下面将结合附图和实施例对本发明做进一步说明。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明更全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。本发明中所描述的表达位置与方向的词,均是以附图为例进行的说明,但根据需要也可以做出改变,所做改变均包含在本发明保护范围内。本发明的附图仅用于示意相对位置关系不代表真实比例。
[0055]
需要说明的是,在以下描述中阐述了具体细节以便于充分理解本发明。但是本发明能够以多种不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广。因此本发明不受下面公开的具体实施方式的限制。说明书后续描述为实施本技术的较佳实施方式,然所述描述乃以说明本技术的一般原则为目的,并非用
以限定本技术的范围。本技术的保护范围当视所附权利要求所界定者为准。
[0056]
下面结合附图,对本发明实施例提供的一种土地覆被分类方法、装置、设备及计算机存储介质进行具体说明。
[0057]
本发明实施例提供了一种土地覆被分类方法,如图1所示,所述分类方法包括:
[0058]
s1:对待分类区进行采样,获取采样点的采样数据,所述采样数据包括地理坐标数据和土地覆被类型数据;
[0059]
s2:对所述待分类区的影像进行分块,获取每个块区的样本数据,所述待分类区的所有样本数据形成样本数据集;
[0060]
s3:利用所述样本数据集对所述待分类区的土地覆被分类模型进行训练;
[0061]
s4:利用训练后的土地覆被分类模型,对每个块区进行分类,最终完成待分类区的土地覆被分类。
[0062]
通过对待分类区的遥感影像进行分块读取,然后整体训练土地覆被分类模型,再进行分块分类的分总分技术,能够确保待分类区的分类结果一致性好;该土地覆被分类方法可应用于个人计算机,分类精度更高。
[0063]
可选地,所述步骤s1中的所述待分类区的影像为多时相卫星遥感影像,在具体选择时,可选择年内的sentinel-2a/b卫星影像数据,进行合成;再对所述卫星遥感影像进行预处理,所述预处理包括几何校正、辐射校正、去云处理、影像拼接及影像裁剪。
[0064]
这样获得的卫星遥感影像,具有空间信息丰富、地物细节清晰的特点,能够利用地物在影像上年内变化特征,更易区分土地覆被类型。
[0065]
所述步骤s1中,所述采样包括野外采样和室内采样;
[0066]
所述野外采样为在野外利用gps进行土地覆被类型采样,获取采样数据,所述采样为人工在野外选取某地物类型或土地覆被类型的采样点,通过gps定位获得该采样点的经纬度信息,同时利用数码相机拍摄相应的地物类型照片,在室内,结合分类系统、影像建立样本库,在影像上通过人工标记该采样点的土地覆被类型;
[0067]
所述室内采样为对所述待分类区的高空间分辨率影像进行解译,获得土地覆被类型数据,所述高空间分辨率影像可从国家相关部门购买或可通过现有的商业地图软件获得,对所述高空间分辨率影像进行人工目视解译,即可获得室内样本点的地理坐标数据和相应的土地覆被类型数据。
[0068]
可选地,所述步骤s2中,对所述待分类区的影像进行平均分块即可,基于个人计算机,可对待分类区的外接矩形(包括背景区域),按照1000行
×
1000列进行读入,将待分类区分成若干小区域。
[0069]
所述样本数据集包括训练样本和验证样本,所述训练样本用于对土地覆被分类模型进行训练,所述验证样本用于验证所述土地覆被分类模型,所述训练样本一般占样本数据集的70%,所述验证样本一般占所述样本数据集的30%;
[0070]
所述样本数据集的获取,包括:
[0071]
利用所述采样点的地理坐标数据,匹配所述采样点在所述块区中的地理坐标,在所述地理坐标上标记所述土地覆被类型;即块区中按地理坐标标记对应样本点的土地覆被类型,完成样本数据集的获取。
[0072]
可选地,所述土地覆被分类模型基于集成学习方法,可选地集成学习分类器包括
bagging集成方法中的rf(随机森林)、boosting集成中的lightgbm、以及stacking集成方法等,本实施例采用的分类模型基于lightgbm,所述土地覆被分类模型的损失函数为:
[0073][0074]
其中,h表示所述样本数据集中的训练样本,h表示所述样本数据集中的全部训练样本,x表示输入模型的训练样本的特征向量,y表示输入模型的训练样本的特征向量的真实标签,t表示迭代次数,f
t-1
(x)表示第t-1次训练时得到的学习器;h
t
(x)表示第t次训练时得到的弱学习器;
[0075]
第t次训练得到的学习器f
t
(x)为:
[0076]ft
(x)=h
t
(x)+f
t-1
(x)
ꢀꢀ
(7);
[0077]
min:z=f
i-yj[0078][0079]fi
表示土地覆被分类模型的分类结果,i表示所述分类结果的第i类土地覆被类型,yj表示真实的土地覆被分类结果,j表示所述真实的土地覆被分类结果的第j类土地覆被类型,n表示每一类土地覆被类型对应的像元数像元,土地覆被分类结果和对应的像元数相乘等于实际的土地覆被结果和对应的像元数相乘,即面积相等约束。
[0080]
在实际分类中,所述土地覆被分类模型中,获得所述第t次训练得到的学习器f
t
(x),还包括:
[0081]
计算所述损失函数h
t
(x)的负梯度r
ti

[0082][0083]
利用平方差对所述损失函数h
t
(x)进行拟合:
[0084][0085]
本实施例的土地覆被分类模型改进了现有区域尺度分类存在的问题,提出了流域尺度的分类模型。该模型具有分类精度高、占用计算机内存小、计算速度快、计算结果准确的优势,有可复制性和可迁移性的特点。
[0086]
本发明实施例以青海省湟水流域作为待分类区,如图2所示,对本发明的土地覆被分类方法进行进一步的说明和验证。
[0087]
s21,获取湟水流域2020-2021年的sentinel-2a/b msi影像和dem(digital elevation model)数据,优选并构建湟水流域2021年内多时相卫星遥感影像集,并对该影像集进行几何校正、辐射校正、去云处理等预处理,通过建立数据集影像金字塔基于中值进行影像镶嵌;后借助影像裁切、影像波段合成方法得到2021年内无云多时相卫星遥感影像。
[0088]
对湟水流域进行野外实地考察采样并结合《全国遥感监测土地利用/覆被分类体系》,将土地覆被分类体系确认为12类,分别是耕地、有林地、灌木林地、疏林地、其他林地、高覆盖草地、中覆盖草地、低覆盖草地、水域(河流、水库坑塘)、永久性积雪、城乡工矿居住建设用地和未利用土地。
[0089]
基于野外采样和室内采样,对湟水流域进行地物样本选取,整个流域共选取样本点12160个。
[0090]
s22,为便于对本发明进行验证说明,本实施例仅将湟水流域的影像分为两个块区,即区域a和区域b;但由于区域a和区域b数据量大,因此可将区域a和区域b进一步分为小块区进行读取,共分为了341个小块区,读取每个小块区的地理坐标数据和对应的土地覆被类型,将读取的值存放在列表中,随后循环依次读取每个小块区,直到完成所有小块区的读取;区域a样本点为5389个,其中训练样本3768个,验证样本1621个,区域b样本点为6771个,其中训练样本4743个,验证样本2028个。
[0091]
s23,利用样本数据集对rf(随机森林)、本发明土地覆被分类模型和stacking进行整体训练,并利用训练好的分类模型进行分块分类,输出分类结果,rf(随机森林)分类结果如图3所示,本发明土地覆被分类模型分类结果如图4所示,stacking分类结果如图5所示;再次分别对区域a和区域b进行相同算法的分类。
[0092]
s24,输出混淆矩阵,在此基础上计算分类精度、kappa系数和f1-score,均为现有的精度评价参数,整个流域分类精度如表1所示:
[0093]
表1三种算法在湟水流域的精度评价结果
[0094][0095][0096]
区域a和区域b的分类精度如表2、3、4所示:
[0097]
表2 rf分类模型分块分类的精度评价结果
[0098][0099]
表3本发明土地覆被分类模型的精度评价结果
[0100]
[0101][0102]
表4 stacking分类模型分块分类的精度评价结果
[0103]
[0104][0105]
通过分类精度评价,rf模型在区域a和区域b分类总体精度分别为89.51%和89.94%,区域a和区域b平均总体精度为89.73%,不等于整个流域总体精度88.76%,在a区域树的深度为10,叶子结点为50,在b区域树的深度为14,叶子结点为80,而在整个流域的树的深度为12,叶子结点为200;本发明提供的土地覆被分类模型在区域a和区域b总体精度分别为89.64%和91.62%,区域a和区域b平均总体精度为90.63%,不等于整个流域总体精度91.47%,在a区域树的深度为8,叶子结点为40,在b区域树的深度为10,叶子结点为60,但在整个流域的树的深度为7,叶子结点为127;stacking集成算法在区域a和区域b总体精度分别为89.02%和90.78%,区域a和区域b平均总体精度为89.90%,不等于整个流域总体精度89.39%,在a区域树的深度为10,叶子结点为130,在b区域树的深度为12,叶子结点为150,而在整个流域的树的深度为8,叶子结点为250;可见,分块区域分类结果不等于整个区域的分类结果,且算法中树的个数和深度明显不同。
[0106]
所以,本发明提出了适用区域土地利用/土地覆被分类技术方案,解决了分区域分类拼接的不合理和结果的不正确性,较其他机器学习分类模型具有更高的分类精度。
[0107]
基于同一发明构思,本发明实施例还提供了一种土地覆被分类装置,如图6所示,包括采样模块m11,用于对待分类区进行采样,获取采样点的采样数据,所述采样数据包括地理坐标数据和土地覆被类型数据;
[0108]
样本数据集获取模块m12,获取每个块区的样本数据,所述待分类区的所有样本数据形成样本数据集;
[0109]
模型训练模块m13,利用所述样本数据集对所述待分类区的土地覆被分类模型进行训练;
[0110]
分类模块m14,用于利用训练后的土地覆被分类模型,对每个块区进行分类,最终完成待分类区的土地覆被分类。
[0111]
基于同一发明构思,本发明实施例还提供了一种土地覆被分类设备,如图7所示,包括:处理器110和用于存储所述处理器110可执行指令的存储器120;
[0112]
其中,所述处理器被配置为执行所述指令,以实现所述的土地覆被分类方法。
[0113]
在具体实施过程中,所述设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器110和存储器120,一个或一个以上存储应用程序131或数据132的存储介质130。其中,存储器120和存储介质130可以是短暂存储或持久存储。存储在存储介质130的应用程序131可以包括一个或一个以上所述单元(图7中未示出),每个模块可以包
括对信息处理装置中的一系列指令操作。更进一步地,处理器110可以设置为与存储介质130通信,在所述设备上执行存储介质130中的一系列指令操作。所述设备还可以包括一个或一个以上电源(图7中未示出);一个或一个以上收发器140,所述收发器140包括有线或无线网络接口141,一个或一个以上输入输出接口142;和/或,一个或一个以上操作系统133,例如windows、mac os、linux、ios、android、unix、freebsd等。
[0114]
基于同一发明构思,本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被用于实现所述的土地覆被分类方法。
[0115]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0116]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0117]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0118]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0119]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1