一种基于高分辨率遥感数据的早期作物识别方法和系统与流程

文档序号:15164488发布日期:2018-08-14 17:18阅读:351来源:国知局

本发明涉及遥感技术,更具体地的,涉及基于高分辨率遥感数据对早期作物进行识别的技术。



背景技术:

在过去的数十年中,世界人口增速较快,据联合国预测,世界人口将在2030年突破87亿,这将给世界粮食安全带来巨大挑战。由于作物种植遥感监测业务可以支持世界粮食种植管理、推动资源的可持续发展,全球粮食安全的重要保障;而作物种植面积是作物种植遥感监测重要组成部分,是作物生长监测的输入数据;所以,目前急需及时、准确的高空间分辨率作物种植分布数据,尤其是小麦、玉米、水稻和大豆等几种主要的粮食作物的种植分布。

为了对作物的生长过程和收获进行更有效地管理,进而更好的保障粮食生产,目前急需尽可能早的获得作物分布图。但是,目前大部分作物识别方法需要使用整年的遥感数据进行作物识别,因而只能在每年年底或第二年才能获得作物分布图,这些作物识别结果难以支持作物生长监测和作物管理。

为了实现作物的提早识别,通常需要使用多时相遥感数据(一般情况下数据的时间分辨率应高于15天/期);而大多数高时间分辨率的遥感数据空间分辨率较低,例如,noaaavhrr数据和modis数据的时间间分辨率数据均为每天观测,但其空间分辨率分别为1km和250m。由于我国农田普遍地块破碎,如果使用这些数据进行作物提取,往往会出现大量“混合像元”,影响作物提取精度。另一方面,高空间分辨率的遥感数据适用于我国较破碎农田的提取,但这些数据通常时间分辨率较低,例如美国的landsat数据,虽然其空间分辨率为30m,但其时间分辨率为16天。而这些卫星使用可见光、近红外和短波红外等波段观测地表,观测时由于云的影响,常常不能获得有效的观测数据。所以,使用landsat数据实际获得的影像不能保证每16天获得1期。这种“无效观测”进一步降低了遥感数据的时间分辨率,给提早识别作物带来困难,但是,目前大多数遥感分类算法(例如最大似然法、决策树法、支持向量机法、随机森林法等)不能处理影像中的“无效观测”的情况。所以,目前在我国需要使用多时相高分辨率(空间分辨率优于30m)数据进行作物提取;并针对其中普遍存在的“无效观测”的问题提出相应的解决方法。

在进行作物分类时,有大量分类特征可用于作物的识别,例如可见光-近红外波段(红光、绿光、蓝光等)、几何特征(高度、孔隙率、覆盖度等)、物候特征(生长期开始时间、生长期结束时间等)。有研究表明,较少的时相和较少的波段都可以实现准确的分类,但有一些时相和波段对准确分类有较大贡献。所以,从大量的特征中筛选出对分类贡献最大的特征,并论证使用这些特征进行作物分类的可行性,从而仅使用最优特征提取作物,可以显著提高作物分类的效率。但是,目前在提早识别特定作物的工作中,贡献较大的遥感分类特征尚不明确。



技术实现要素:

本发明的目的是使用遥感数据提早识别作物类型(例如棉花、春玉米),本发明提出一中使用高分辨率遥感数据进行作物提早识别的方法来,实现高分辨率的作物识别,所述方法包括:

一种基于高分辨率遥感数据的早期作物识别方法,其特征在于,包括:

s1,收集遥感数据和作物所在地的地面数据,所述遥感数据为遥感数据为sentinel-1数据和sentinel-2数据,所述地面数据包括作物地理位置和类型;

s2,通过数据合成法获得t时间长度的合成sentinel-1和sentinel-2时间序列,作为合成数据;

s3,根据s1中获得的训练样本和s2中获得的合成数据提取每种作物对应的分类特征;

s4、针对s3中获得的每种作物对应的特征,评价每个分类特征对作物识别的贡献和作物的可分性,获得识别作物的优选特征;

s5、使用s4中获得的优选特征时间序列和影像的优选特征波段,基于免疫系统网络算法,根据不同作物的需要,使用时间序列长度较短的优选特征时间序列进行作物识别。

本发明还提出一种基于高分辨率遥感数据的早期作物识别系统,其特征在于,包括处理器和存储器,其中存储器上存储有所述处理器能够执行的程序,所述程序被执行时实现如下步骤:计算机程序

s1,收集遥感数据和作物所在地的地面数据,所述遥感数据为遥感数据为sentinel-1数据和sentinel-2数据,所述地面数据包括作物地理位置和类型;

s2,通过数据合成法获得t时间长度的合成sentinel-1和sentinel-2时间序列,作为合成数据;

s3,根据s1中获得的训练样本和s2中获得的合成数据提取每种作物对应的分类特征;

s4、针对s3中获得的每种作物对应的特征,评价每个分类特征对作物识别的贡献和作物的可分性,获得识别作物的优选特征;

s5、使用s4中获得的优选特征时间序列和影像的优选特征波段,基于免疫系统网络算法,根据不同作物的需要,使用时间序列长度较短的优选特征时间序列进行作物识别。

本发明的有益效果包括:

1、本发明使用多时相高分辨率数据进行作物识别,在我国农田地块相对破碎的实际条件下,该方法具有更强的适用性。

2、本发明解决了“数据缺失”条件下基于多时相数据的作物识别。

3、本发明在提取作物时,进行了特征重要性评估,并优选了对识别冬小麦、棉花和玉米贡献较大的特征记性作物识别,进而提高了作物识别的效率。

附图说明

图1为本发明的方法的流程图。

图2为根据本发明的方法获得的每种作物对应的特征的样例。

图3为根据本发明的方法获得的训练样本的优选特征时间序列的样例。

图4为本发明的方法的一个实施方式的流程图。

图5为改进的免疫系统网络(iain)算法中的“分类”过程。

图6为使用4~5月数据获得的衡水市冬小麦分布图。

图7为使用4~8月数据获得的衡水市棉花、春玉米和夏玉米分布图。

图8为部分“数据缺失”区域分类结果图。

具体实施方式

下面参照附图描述本发明的实施方式,其中相同的部件用相同的附图标记表示。在不冲突的情况下,下述的实施例及实施例中的技术特征可以相互组合。

作物提早识别的主要流程为:

s1、收集遥感数据和地面数据。

在使用遥感数据识别作物时,需要进行野外调查,具体方法是到作物所在农田里,使用gps定位,并且记录定位点所种植的作物类型。这些gps位置数据和作物类型数据是地面数据,地面数据可以作为训练样本和验证样本。地面数据的构成,如[记录1,经纬度:116.45e,38.48n,该位置的作物:棉花]。另外,将地面数据平均分为两部分,一部分作为训练样本、一部分作为验证样本。

本发明收集的遥感数据为sentinel-1数据和sentinel-2数据,例如2017年4月1日至8月31日所有的sentinel-1数据和sentinel-2数据。sentinel-1数据包括的波段为“vv极化”波段和“vh极化”波段;sentinel-2数据包括的波段为“蓝光”、“绿光”、“红光”和“近红外”四个波段。之后,根据“红光”和“近红外”两个波段计算“ndvi”。

ndvi=(nir-red)/(nir+red)(1)

公式(1)为ndvi的计算公式,其中,nir代表近红外波段、red代表红光波段。

s2、对于s1中的遥感数据,通过数据合成法获得t时间长度(例如15天)的合成sentinel-1和sentinel-2时间序列,作为合成数据。

具体地,通过数据合成法对步骤s1中的sentinel-1数据和sentinel-2数据进行合成,同时选择的时间长度例如为t=15天,获得t天合成的sentinel-1和sentinel-2时间序列。

例如在t时间内共获得了n期数据,则合成过程如公式(2)所示:

xcomposition=median(x1,x2,...xn)(2)

median()函数为取中值函数。

例如,用8月1日至8月15日的数据合成出8月1~15日合成数据,即,获得t时间长度的合成数据。如果采用4-8月数据,t=15,则4-8月的数据为10期15天时间长度的数据,通过如上公式(2)活动15天时间的合成sentinel-1和sentinel-2时间序列。

不同时间序列长度的时间序列数据均可进行t天合成。参照图4,本专利中4~5月、4~8月和完整时间序列数据均采用15天合成方案。

由于影像受云的影响,存在数据缺失的情况,通过多期影像的合成,在合成的影像中,“数据缺失”的象元将减少。合成过程中,需要着重考虑t的长度的设置,如果t的长度较长,例如30天或60天,在这一期间内获得的用于数据合成的数据较多,去除“数据缺失”象元的效果较高;但缺点是合成结果的时间分辨率较低,例如t为60天,一年仅能获得6次合成结果,不利于作物识别工作。所以,优选使用15天合成,在保证合成数据时间分辨率的同时,有尽可能的保证去除“数据缺失”现象的效果。

s3、提取每种作物对应的分类特征。

根据s1中获得的训练样本和s2中获得的合成数据,获取每种作物对应的分类特征,该步骤获得的结果如图2所示。

在本发明中,分类特征指的是t时间长度(例如15天)的合成sentinel-1和sentinel-2时间序列里7个波段的数据,所述7个波段指的是:“vv极化”、“vh极化”、“红光”、“绿光”、“蓝光”、“近红外”和“ndvi”波段。

例如,如果采用2017年4月1日~8月31日所有的sentinel-1数据和sentinel-2数据。通过数据合成,可以获得2017年4月1日~8月31日每15天的合成数据(共10期),每期数据包括“vv极化”、“vh极化”、“红光”、“绿光”、“蓝光”、“近红外”和“ndvi”波段。所有这些波段就是作物对应的“分类特征”,例如4月第一期的ndvi,就是一个特征。所以,这里共有70个分类特征。

s4、针对s3中获得的每种作物对应的特征,使用随机森林法和jm距离法评价每个分类特征对作物识别的贡献(重要性评分)和作物的可分性,获得识别作物的优选特征。

具体地,识别作物时,对每个分类特征进行重要性评分和计算jm距离,据此选出作物识别的最佳特征。

从本发明涉及的“vv极化”、“vh极化”、“红光”、“绿光”、“蓝光”、“近红外”和“ndvi”波段的7个特征中,通过计算随机森林的gini评分和jm距离,选择2个gini评分较高而且jm距离较大的特征作为优选特征。

例如,第10期“ndvi”的gini评分总和jm距离总和最高,“近红外”第二高,则选用“ndvi”和“近红外”作为优选特征。最终获得的训练样本的优选特征时间序列(如图3所示)和影像中由这些优选特征的波段。

s5、使用s4中获得的训练样本的优选特征时间序列和影像的优选特征波段,基于改进的免疫系统网络算法(例如iain),根据不同作物的需要,使用时间序列长度较短的优选特征时间序列进行作物识别。此处,时间序列长度,指的是用于识别作物的时间序列数据的长度,例如用4月~6月数据识别作物。

例如,冬小麦在6月收获,使用4~5月时间序列数据(4期)识别冬小麦;棉花在9~10月收获、春玉米在8月下旬收获、夏玉米在9月下旬~10月收获,使用4~8月数据(10期),识别春玉米、棉花和夏玉米。最后获得:在冬小麦、春玉米、棉花和夏玉米收获之前获得这几种作物的10m分辨率空间分布图,具体实验结果在下文参照图6-8描述。

分类器通过运算获得。具体地,识别冬小麦时,首先将训练样本的优选特征序列(4~5月部分)输入分类器(iain);使用免疫系统网络方法的“分类器训练”过程,获得分类需要使用的“抗体”,在这里使用改进的免疫系统网络(iain)法进行作物识别。本发明的创新是改进了该算法的“分类”过程,改进思路如图4所示。具体原理如下:

该分类影像中的每个象元为“抗原”(见图5),理想情况下,抗原与抗体的特征维数相同,因而使用抗体识别抗原,即计算抗原的特征序列到每个抗体的特征序列的距离,并将距离最小的抗体的作物类型,作为象元(抗原)的分类结果。但是,当影像中出现“数据缺失”现象时,抗原和抗体的维数不同,因而抗体不能识别抗原。在这种情况下,定位“抗原”中“有效数据”的位置,并且针对所有“抗体”,根据“有效数据”位置筛选出与“抗原”对应的有效序列作为“新抗体”,计算“抗原”的特征序列到所有“新抗体”的距离,并将距离最小的抗体的作物类型,作为象元(抗原)的分类结果。这种方法可以自适应的从“抗体”中选择与遥感影像中“有效数据”对应的特征进行分类,从而排除“数据缺失”现象对分类的影响。

具体地,步骤s5包括:

s51,使用免疫系统网络方法的“分类器训练”过程,输入s4中获得的训练样本的优选特征时间序列,获得分类需要使用的“抗体”。

具体方法,请参看“anadaptiveartificialimmunenetworkforsupervisedclassificationofmulti-/hyperspectralremotesensingimagery”(yanfeizhong,member,ieee,andliangpeizhang,ieeetransactionsongeoscienceandremotesensing,vol.50,no.3,march2012)

s52,将分类影像中的每个象元做为“抗原”,定位“抗原”中“有效数据”的位置。

例如“抗原”中的序列为a(a1、a2、a3……an),其中a2为“数据缺失值”,可以使用matlab工具中的find函数或idl软件中的where函数,输入序列a,这些函数将自动返回有效数据位置的序列(1、3……n)。

s53,对所有“抗体”,根据“有效数据”位置筛选出与“抗原”对应的有效序列作为“新抗体”。

例如抗体的序列为b(b1、b2、b3……bn),而有效数据位置的序列为(1、3……n),那么“新抗体”为b(b1、b3……bn),这样实现了“新抗体”的自动生成。

s54,计算“抗原”的特征序列到所有“新抗体”的距离,并将距离最小的抗体的作物类型,作为每个象元(“抗原”)的分类结果。

在河北衡水市就本发明提出的方法进行了实验,实验结果表明,nir(近红外)波段和ndvi(归一化植被指数)是提取冬小麦、棉花、春玉米和夏玉米的最佳特征。经地面实地调查样本验证,使用4~5月的数据提取冬小麦时,冬小麦的制图精度和用户精度分别为99.28%和95.42%,衡水市冬小麦的空间分布如图6所示。使用4~8月的数据提取棉花、春玉米和夏玉米时,棉花的用户精度和制图精度分别为95.42%和99.30%;春玉米的制图精度和用户精度分别为97.92%和98.95,;夏玉米的制图精度和用户精度分别为95.81%和99.88%。这三种作物的空间分布如图7所示。另外,本发明中的iain方法可以有效解决“数据缺失”对作物识别造成的影响。图8中,红线以内的区域为数据缺失,在享用的分类结果中,作物识别并未收到数据缺失的影响。

以上所述的实施例,只是本发明较优选的具体实施方式,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1