一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法

文档序号:6540288阅读:206来源:国知局
一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法
【专利摘要】本发明是一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法,该方法不受样本统计分布的局限,可通过对n个观察值的重复采样模拟得到接近真实的样本分布特征,该方法采样效率将远大于传统统计和自助采样效率,而且实际应用范围将更广,不需要传统统计和分层采样中数据独立和正态分布的前提要求,不需要试验区域的部分先验数据和资料对其进行分层,也不需要地统计采样的半方差函数信息,能够适用于大范围多尺度卫星遥感数据反演生态环境参数的地面采样,并实现了快速高精度地面采样。
【专利说明】-种适用于大范围多尺度卫星遥感数据反演的生态环境参 数地面采样方法

【技术领域】
[0001] 本发明属于卫星遥感数据地表参数反演领域,特别是涉及针对大范围多尺度卫星 遥感数据反演的生态环境参数地面采样方法。

【背景技术】
[0002] 迄今为止,已有众多学者探讨过地面采样设计的策略问题。一个准确的样本设计 方案应保证样本点的均值是对样本总量均值的一个很好的估计。地面采样设计主要考虑两 个方面,一是决定最佳的采集样本的数目,二是决定这些将要布置样本点的空间位置。合理 取样数目取决于采样设计的目标、样本总量的变异性、估计样本总量均值所要求的精度水 平、估计样本总量均值所需的置信区间、采样的费用等。在过去的几十年里,已建立了多种 取样模式方法,主要包括传统统计采样,地质统计采样,分层采样和自助法采样等。
[0003] 目前确定合理取样数目应用最多的是传统统计方法。在一定精度水平下,传统统 计计算的合理取样数目与变异系数的平方成正此,但传统统计方法具有局限性,必须满足 样本数据的正态分布及样点之间的空间独立。当违背这一条件时,传统方法得到的合理取 样数目与实际需要不符,其结果必然令人无法信服。
[0004] 研究表明,土壤特性在一定范围内存在空间自相关性。地统计采样克服了样点 独立的局限性,考虑了生态系统中随机变量的变异结构对实际采样的影响。Mcbratney和 Webster (1983)较早讨论了应用地统计学理论确定土壤pH值合理取样数目的方法,此后 许多研究者也用该方法研究了不同土壤参数的空间变异及采样设计,其结果均认为地统计 学方法比传统统计方法在设计采样方案时更有效,能用较少数目的样品获得同样精度的估 值。但是,地统计采样过程中必须要准确获取土壤特性的变异函数,需要先验资料或者进行 预采样获取较准确的变异函数。
[0005] 0rl0ci在1988年提出,一个生态系统的表征必须考虑其内部的变异特征。而分层 采样正好能达到这个目的。分层采样可以有效地提高总体估计值的精确度,是最精确的取 样策略方法之一。分层抽样研究已用于人口普查、环境分析、产品测试以及土壤科学等不 同领域。虽然分层采样精度较高,能有效的减少取样时间和降低取样成本,但也受到一些条 件的限制,例如一方面精度的高低受分层方式的影响,另一方面是必须有进行区域分层的 先验资料支持,如按土壤类型对研究区进行分区,首先必备土壤质地分类图,如按土地利用 类型进行分区,必须要有试验区域详细的土地利用分类图。总之,在分层取样之前,需要试 验区域的部分先验数据和资料对其进行分层,这在实际调查中也是不小的工作量。
[0006] 近二十年来,一种新的方法--自助法,逐渐用于土壤的采样设计。这种方法是当 今流行的数据重采样方法,不受数据分布特征的限制。其基本原理是从η个样本数据中随 机选择m个样本(m = 1,2, ...,η),每个m样本需要进行B次随机重复来估算数据统计的 分布特征。Manly(1997)建议实际应用中的B应不少于1000次,有时甚至需要设置10000 次。然而,为了避免冗长的计算时间,很多研究者在实际应用中尽量选择小的样本数目(η) 或者少的重复数(B)。但即使样本数目η很小,1000次甚至10000次的重复数B也很难覆盖 所有的组合数,如当η = 20和m = 10时,从η个数据中随机选择m个数据共存在的组合数 有0以=184;756,此时设置较小的B(〈184,756)势必会导致样本数目置信水平的不稳定。 此外,自助法的采样效率并不高于传统统计,这也是限制自助采样方法应用的关键原因,尤 其对于随时空变化较快的生态环境参量,自助采样方法应用受到限制。
[0007] 考虑到以上采样方法的前提条件和应用限制,本方法针对现有方法存在的精度不 稳定问题,提出一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法 (文中简称"大范围采样方法")。该方法采样效率将远大于传统统计和自助采样效率,而且 实际应用范围将更广,不需要传统统计和分层采样中数据独立和正态分布的前提要求,不 需要试验区域的部分先验数据和资料对其进行分层,也不需要地统计采样的半方差函数信 息,能够适用于大范围多尺度卫星遥感数据反演生态环境参数的地面采样。


【发明内容】

[0008] 针对现有技术中存在的问题,本发明的目的在于提出一种应用范围广且不受数据 正态分布、空间变异结构、先验观测数据条件的限制,实现了快速高精度地面采样。
[0009] 为了实现上述目的,本发明建立了一种适用于大范围多尺度卫星遥感数据反演 的生态环境参数地面采样方法,该方法不受样本统计分布的局限,可通过对η个观察值的 重复采样模拟得到接近真实的样本分布特征,具体包括如下步骤:
[0010] 步骤1)根据所选择的卫星遥感数据确定采样研究小区,在研究小区内设置η个生 态环境参数观测值Θ i采样点,其中i = 1,2,......,η,根据采样获取的η个Θ 1来确定平 均值歹;
[0011] 步骤2)从η个生态环境参数实测数据中随机选出m个数据,其中,m= 1,2, 3,......,n,每次的选择需要随机重复s次,其中,S=C ;
[0012] 步骤3)计算每次选择得到的m个样本均值,共获得s个样本均值,s个平均值中 与全部η个实测样点均值之间的相对误差小于5%的所占此例就是置信水平CL ;
[0013] 步骤4)分别计算s个均值与全部η个实测样点均值之间的相对误差,分析相对误 差在5 %或10 %内的置信水平CL;
[0014] 步骤5)绘制置信水平CL与样本数目m的回归关系图,从而确定不同CL下对应的 地面采样数目NSS ;
[0015] 步骤6)在置信水平CL = 90 %或95 %和误差RE = 10 %或5 %误差下,构建地面 采样数目NSS和变异系数CV之间的数学模型,根据数学模型求取相应变异系数CV的地面 采样数目NSS。
[0016] 进一步,所述卫星遥感数据为低分辨率遥感影像MODIS数据、中分辨率遥感影像 TM或HJ-CCD数据。
[0017] 进一步,所述生态环境参数为叶面积指数、表层土壤含水量、地表温度。

【专利附图】

【附图说明】
[0018] 图1是随机组合采样与其他方法确定的表层土壤水分取样数目与其相应标准误 差的关系
[0019] 图2是随机组合采样与其他方法估计表层土壤水分相对误差(RE)的空间分布图
[0020] 图3是一定相对误差下不同尺度随机组合方法的样本数目和置信水平之间的关 系图
[0021] 图4是不同尺度表层土壤水分估计相对误差的空间分布图
[0022] 图5是一定误差下不同米样方法NSS和相应CV之间的关系图
[0023] 图6是RE = 5%和10%误差条件下,简化随机组合方法估计的置信水平和取样数 目之间的关系

【具体实施方式】
[0024] 下面结合附图对本发明多尺度土壤含水量的地面采样方法作进一步说明。
[0025] 首先,不同采样方法的合理取样数目估算此较。针对55m研究尺度,应用不同采样 方法得到的样本数目与相应标准差的关系见图1,从图1看出,采样数目的增大导致标准差 急剧减小。当标准差等于〇.〇〇76cm 3CnT3(相当5%的相对误差和95%的置信水平)时,传 统统计和地统计采样的估算NSS分别是55和35。说明在一定的标准差下,地统计采样估算 的NSS比传统统计的结果要小,这与前人的研究结果是一致的。从图1上看出,分层采样中 标准差随样本数目的变化趋势与传统统计和地统计方法的结果基本相似,在0. 〇〇76cm3CnT3 的标准差下,分层采样估算的NSS仅26个。
[0026] 自助采样中标准差与样本数目的变化关系几乎接近于传统统计的结果(图1), Hupet和Vanclooster(2002)也曾有类似的结论。但随着样本数目的增加,自助采样的标准 差出现一些起伏变化,这应该与不足的重复次数有关(Kamgar等,1993)。在0. 0076cm3cnT3 的标准差下,自助法估算的NSS是52。
[0027] 利用 SPSS (Statistical Product and Service Solutions,SPSS Inc. , USA)中 的i检验来评价不同标准差下大范围采样方法与其他采样方法的NSS估算结果的显著性 差异。当显著水平P〈〇.l时,认为有显著性差别。从图1看出,与自助法相此,大范围采 样方法覆盖了所有的样本组合,因此一定标准差下的样本数目相对较小。当标准差大于 0. 015cm3Cm_3 (相当于5%的相对误差和69%的置信水平),大范围采样方法估算的NSS与传 统统计(P = 〇. 477)和地统计(p = 0. 543)的计算结果相近,但明显大于分层采样估算的 呢5(? = 0.086)。如果标准差介于0.015和0.00561113〇^3(相当于5%的相对误差和99%的 置信水平)之间,大范围采样方法估算的NSS仍显著大于分层采样的结果(p = 0. 078),但 与地统计的估算结果相近(P = 0. 68)。当标准差更小时,大范围采样方法估算的NSS比其 他方法的NSS都要小。在5%相对误差和95%置信水平下,大范围采样方法估算的NSS是 38 〇
[0028] 在采样策略中,除了样本数目的确定,还有一个重要的问题就是估计误差的空间 分布。在5%相对误差和95%置信水平下,传统统计、自助法、大范围采样方法、地统计和 分层采样方法估算的NSS分别是55、52、38、35和26。利用估算的NSS (分别从121个观测数 据中随机选择55、52、38、35和26个样本)和克里金插值,分别得到不同采样方法在5%相 对误差和95%置信水平下,估计误差的空间分布图2。如图2所示,不同方法估算的相对误 差大部分在15%以内。传统统计、自助法、大范围采样方法、地统计和分层采样的估算值与 观测值之间的平均相对误差分别是7. 5、8. O、8. 9、9. 5和9. 5%,与传统统计和自助法相比, 大范围采样方法估算的NSS虽然较少,但仍能较好地表达表层土壤水分的空间分布特征。
[0029] 所有采样方法中,地统计、分层和大范围采样方法的采样效率明显高于传统统计 和自助法。其中分层方法的采样效率最高,但需要依赖每次土壤水分采样的空间分布和每 层的采样配置,这在土壤水分的实际观测中难以短时间内完成;地统计采样基于土壤水分 的半方差函数,在很多情况下也难以获得准确的半方差函数。因此,通过综合此较,利用大 范围采样方法估算表层土壤水分的NSS是一种简便、有效的方法。
[0030] 第二是将该采样方法应用于不同尺度土壤水分的地面采样中。
[0031] 选取10m、20m、40m、80m和160m5个不同尺度,然后应用大范围采样方法方法估算 不同尺度表层土壤水分的NSS。相对误差分别为10%、5%时,不同尺度表层土壤水分的采 样数目与置信度水平之间的关系如图3所示。随着取样数目的增加,不同尺度对应的置信 度均表现出逐步渐近趋近线100%的规律,这正好说明不同尺度的100个观测数据足以表 征土壤水分的真实分布规律。在相同置信水平下,精度的提高(即相对误差的减小)和尺 度的增大则意味着取样数目的增多。在较为干旱的时期(平均含水量较小的时期),若以 RE = 5%和CL = 95%作为各尺度确定采样数目的标准,1〇111、2〇111、4〇111、8〇111和16〇111尺度需 要的NSS分别应为12、18、29、34和41。
[0032] 根据图3估算的NSS,进一步分析可获得160m、80m、40m、20m和IOm尺度在RE = 5%和CL = 95%下相对误差的空间分布(图4)。从分布图上看到,大部分区域的相对误 差在15%以内。在克里金插值中,较小的采样密度和采样数目都会带来较大的误差,因此, 160m尺度(采样密度最小,为0· 0016 / m2)和IOm尺度(采样数目最少,为12个)的平均 相对误差明显稍大于其他尺度的结果,但不同尺度的平均相对误差均在15%范围内。
[0033] 第三是利用多尺度观测数据和采样结果,分析不同尺度大范围采样方法合理采样 数目与对应CV之间的数学关系。
[0034] 通常采样的多少主要取决于测定参数在空间上的变异程度,变异程度越高,需要 的采样数目越多。变异程度常通过变异系数CV来表征。按照传统统计学原理,当数据呈正 态分布且样本相互独立时,在一定的置信度水平和误差条件下,NSS和CV的平方成正此。然 而,实际中的采样数据通常表现出较好的空间相关性。CV通常与采样区域大小有关,较大的 尺度(采样区域)常对应较高的变异程度(大的CV)。
[0035] 基于随机组合地面采样方法获取的合理取样数目随变异系数的增大逐步增加,二 者表现出较好的线性关系,95、90%置信水平和10、5%相对误差下的线性拟合方程达到极 限著水平,决定系数R 2 >0. 98。为了检验模型关系的可靠性,利用线性方程间接估算55m尺 度的NSS,并将结果与大范围采样方法的估算值进行此较。在95%置信水平下,相对误差为 10%和5%时大范围采样方法估算的NSS分别是12和38,相同精度下拟合方程的计算结果 则是13和35。同样,在90%置信水平下,相对误差为10%和5%时大范围采样方法和拟合 方程估算的NSS -样,分别是10和28。这说明构建的数学方程估算大范围采样方法的NSS 是可靠的。
[0036] 表ICL = 90%、95%和RE = 10%、5%误差下,NSS和CV之间的拟合关系
[0037]

【权利要求】
1. 一种适用于大范围多尺度卫星遥感数据反演的生态环境参数地面采样方法,其特征 在于,该方法不受样本统计分布的局限,可通过对η个观察值的重复采样模拟得到接近真 实的样本分布特征,具体包括如下步骤: 步骤1)根据所选择的卫星遥感数据确定采样研究小区,在研究小区内设置η个生态环 境参数观测值Θi采样点,其中i= 1,2,……,n,根据采样获取的η个Θi来确定平均值 Θ; 步骤2)从η个生态环境参数实测数据中随机选出m个数据,其中,m= 1,2, 3,......, n,每次的选择需要随机重复s次,其中,S=C,?'; 步骤3)计算每次选择得到的m个样本均值,共获得s个样本均值,s个平均值中与全 部η个实测样点均值之间的相对误差小于5%的所占此例就是置信水平CL; 步骤4)分别计算s个均值与全部η个实测样点均值之间的相对误差,分析相对误差在 5 %或10%内的置信水平CL; 步骤5)绘制置信水平CL与样本数目m的回归关系图,从而确定不同CL下对应的地面 采样数目NSS; 步骤6)在置信水平CL= 90 %或95 %和误差RE= 10 %或5 %误差下,构建地面采样 数目NSS和变异系数CV之间的数学模型,根据数学模型求取相应变异系数CV的地面采样 数目NSS。
2. 如权利要求1所述的方法,其特征在于,所述卫星遥感数据为低分辨率遥感影像 MODIS数据、中分辨率遥感影像TM或HJ-CXD数据。
3. 如权利要求1所述的方法,其特征在于,所述生态环境参数为叶面积指数、表层土壤 含水量、地表温度。
【文档编号】G06F19/00GK104462739SQ201410091494
【公开日】2015年3月25日 申请日期:2014年3月13日 优先权日:2014年3月13日
【发明者】王春梅, 孟庆岩, 占玉林, 杨健, 吴俊 , 刘苗 申请人:中国科学院遥感与数字地球研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1