双条件质量约束的对象级地物样本自适应生成方法及系统与流程

文档序号:36237044发布日期:2023-12-01 18:20阅读:44来源:国知局
双条件质量约束的对象级地物样本自适应生成方法及系统与流程

本发明属于遥感与机器学习相关,具体涉及一种双条件质量约束的对象级地物样本自适应生成方法及系统。


背景技术:

1、随着卫星传感器类型的增多及计算机技术的快速发展,加上计算和数据存储能力的提高,使得大量卫星数据和复杂的机器学习大框架模型用于大面积土地覆盖制图以及目标提取变为了一种常态。随着机器学习和深度学习的发展,遥感影像目标提取及分类精度得到了较为明显的提高。但往往高质量分类精度的前提条件是需要充足且高质量的训练样本数据,故训练样本数据的准备是首要任务,更是直接影响了分类结果。

2、为此,国内外大量学者对如何高效且准确的获取地物训练样本做了大量的研究。其中,用最为广泛的一种样本选择方式便是结合遥感影像的人工目视解译方法,例如结合野外调查数据使用人工目视解译的方式得到了分类样本集,并计算了样本可分离度,结果显示样本间可分离性较好。但该方法在一定程度上具有局限性,该种方式需要人工对每一个样本数据进行判断与选择,大范围区域的样本选择不仅费时费力,同时也增加了人为主观性因素的影响。


技术实现思路

1、本发明的目的就是为了解决上述背景技术存在的不足,提供一种双条件质量约束的对象级地物样本自适应生成方法及系统,自动生成对象级地物样本集,较大程度上节省了计算成本,在保证样本质量的基础上提高了样本生成效率。

2、本发明采用的技术方案是:一种双条件质量约束的对象级地物样本自适应生成方法,包括以下步骤:

3、基于土地利用数据产品,获取设定时间段内地物类型未发生变化的地类像素,形成土地利用类型像素图;

4、基于土地利用类型像素图,获取各类地类样本的中心像素;

5、以各类地物的中心像素作为其相应的代表样本点,结合样本尺寸,得到各类地物的样本区块;

6、获取各样本区块的多源特征作为其对应的标签,形成各类地物的特征集;

7、以样本可分离性和植被指数相关性值作为指标,评估样本集;如果不达标,重新获取各类地物的中心像素和样本区块,以生成新的样本集直至达标。

8、上述技术方案中,获取设定时间段内未发生变化的若干地类像素的过程包括:在线调用若干年份土地利用数据产品,对其重分类至特定的分类体系;筛选出在设定年数内地物类型未发生变化像素。

9、上述技术方案中,判定待评估样本集的样本可分离性符合设定标准后,再评估其植被指数相关性值是否达标。

10、上述技术方案中,获取任一地类的代表样本点的过程包括:针对土地利用类型像素图,采用设定的邻域尺寸的单位核函数对其进行滤波处理;基于设定的邻域尺寸,选择邻域均为同一种地物类型的中心像素位置作为该地物类型的代表样本点。

11、上述技术方案中,获取任一类地物样本区块的过程包括:基于设定的邻域尺寸,获取以中心像素为基准的四个斜角点像素;单向连接四个斜角点像素构成样本的边界线,形成样本区块。

12、上述技术方案中,针对不达标的样本集,重新设定邻域尺寸,再次执行获取各类地物的中心像素、样本区块和样本集的过程。

13、上述技术方案中,所述多源特征包括:波段特征、植被指数特征、纹理特征、极化特征和地形因子。

14、上述技术方案中,任意两种地物类型样本集之间,在任一种特征上的样本可分离性j-m的计算公式如下:

15、;

16、上式中,b为待计算的两种地物类型样本之间的巴氏距离;

17、所述巴氏距离b的计算公式如下所示:

18、;

19、上式中,i和j表示两种地物类型ci和cj的编号,mi表示地物类型ci的样本集中各样本在该特征上的平均值,δi表示地物类型ci的样本集中各样本在该特征上的方差;mj表示地物类型cj的样本集中各样本在该特征上的平均值,δj表示地物类型cj的样本集中各样本在该特征上的方差;

20、针对每两种地物类型的样本集间在所有维度特征上的j-m值取均值,以得到所有地物类型的样本集在多维特征上的j-m值。

21、上述技术方案中,任意两种地物类型的样本集,其植被指数相关性值pxy的计算公式如下:

22、;

23、其中,x和y分别指由任意两种地物类型的样本计算而构成的植被指数数据集合;cov(x ,y)为x和y的协方差;σxσy是x和y的标准差乘积;e(x)和e(y)分别是x和y的数学期望;

24、针对不同地物类型的样本集,获取每两种地物间植被指数相关性值,并进行均值处理,得到所有地物类型的样本集的植被指数相关性值。

25、本发明还提供了一种双条件质量约束的对象级地物样本自适应生成系统,其特征在于:该系统用于上述技术方案所述的一种双条件质量约束的对象级地物样本自适应生成方法。

26、本发明提出了双条件质量约束的对象级地物样本自适应生成方法及系统,其有益效果在于:本发明建立了一个根据样本质量进行自适应调整样本尺寸,进而自动生成样本集的整体框架,其可扩展性较强。对于需要大量对象级样本数据的实验场景中具有较强的应用价值,一方面该方法在现有的常用土地利用数据产品数据上,获取较为集中分布且长时间未变化的不同地类块,将其作为样本提取的基础数据,有效反映地物特征。另一方面使用多源遥感数据构建特征空间,采用样本可分离度为主,地类间样本植被指数相关性指标为辅来评价样本质量,通过样本质量反馈的方式自动调整样本尺寸,以实现反复优化样本质量的目的。

27、进一步地,本发明在现有土地利用数据产品基础上,采用多年份产品叠加生成地类像素图像,可有效提高各个像素的地类代表性,有利于后文高质量样本生成。

28、进一步地,本发明先后采用样本可分离性以及植被指数相关性值作为指标对样本集进行评价,可有效提高指标评价过程的稳健性的同时,提高评价过程的效率,当判定数据集的样本可分离性不达标后,直接返回样本选择环节重新设定邻域尺寸。

29、进一步地,本发明通过使用样本点结合邻域尺寸的空间卷积滤波器处理,可以得到同类像素较为集中分布的区域块,有效提取出具有代表性的样本点以表征特定类型的地物特征,提高样本集的有效性。

30、进一步地,本发明以中心像素结合周围斜角像素点的方式生成样本对象块,有利于调整样本位置,加快样本生成速率。

31、进一步地,本发明针对不达标的样本集,返回重新设定空间卷积滤波器的邻域尺寸,进而调整样本选取的范围和位置,该循环机制自动化程度高且易于执行,有效节约了计算成本的同时保证了调整的有效性。

32、进一步地,本发明通过构建多维特征空间,以计算各个样本的训练标签,有效反映出样本的特性,提高样本集的利用价值。

33、进一步地,本发明通过构建多维特征空间,提出不同地物间jm距离均值和植被指数相关性值的计算方法,有效评估样本集的有效性,从而提高了后续模型训练结果的精度。

34、进一步地,本发明施加双阈值的方法,有效地提高了整个系统自动循环进程质量,以生成高质量样本对象块。该方法和系统对于一些需要大量对象级样本数据的实验场景中具有较强的应用价值。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1