本技术涉及遥感样本生成,具体而言,涉及一种样本生成方法、装置、设备及存储介质。
背景技术:
1、随着对地观测技术的发展,越来越多的遥感数据被用于地表信息提取、资源与生态环境变化监测等诸多领域,发挥了巨大作用。随着深度学习技术的不断发展,通过构建大量样本数据训练深度学习网络,显著提高了遥感影像特征提取的成效。
2、现有的遥感解译样本库建设依托于独立标签体系。以现有的标签体系为参考依据,结合影像特征与实际业务需求制定标签集,并基于标签集进行样本库的生成。
3、但是,目前的独立标签体系下的样本标签存在语义不准确的问题,并且不同标签体系下相同地物图像的标签也不统一,因此生成的样本在应用到模型训练中时,会存在样本难以真正达到复用、模型泛化指标难以提升的问题。
技术实现思路
1、本技术的目的在于,针对上述现有技术中的不足,提供一种样本生成方法、装置、设备及存储介质,以解决现有技术中独立标签体系下的样本标签存在语义不准确的问题,不同标签体系下相同地物图像的标签不统一的问题。
2、为实现上述目的,本技术采用的技术方案如下:
3、第一方面,本技术提供了一种样本生成方法,所述方法包括:
4、将原始样本映射到第一标签体系中,得到所述原始样本的样本标签;
5、根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,所述业务标签组包括多个业务标签,所述多个业务标签之间为平等层级关系;
6、根据所述业务标签和所述样本标签确定所述原始样本的样本类型,所述样本类型包括:完全映射、非完全映射;
7、根据所述样本类型对所述原始样本进行切片,得到目标样本,并将所述业务标签作为所述目标样本的样本标签。
8、可选的,所述根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,包括:
9、基于业务标签与样本标签之间映射关系,获取所述业务标签组中与所述样本标签具有映射关系的业务标签;
10、将所述与所述样本标签具有映射关系的业务标签作为所述原始样本的业务标签。
11、可选的,所述根据所述业务标签和所述样本标签确定所述原始样本的样本类型,包括:
12、比对所述原始样本的业务标签的标识与样本标签的标识,得到比对结果;
13、根据所述比对结果,确定所述原始样本的样本类型。
14、可选的,所述根据所述比对结果,确定所述原始样本的样本类型,包括:
15、若所述比对结果指示所述业务标签的标识与样本标签的标识相同,则确定所述原始样本的样本类型为完全映射;
16、若所述比对结果指示所述业务标签的标识与样本标签的标识不同,则确定所述原始样本的样本类型为非完全映射。
17、可选的,所述根据所述样本类型对所述原始样本进行切片,得到目标样本,包括:
18、若所述样本类型为完全映射,则采用滑动窗口对所述原始样本进行切片,得到所述目标样本;
19、
20、若所述样本类型为非完全映射,则对所述原始样本进行图斑中置切片,并根据原始样本的应用场景对所述原始样本进行背景填充,得到目标样本。
21、可选的,所述根据原始样本的应用场景对所述原始样本进行背景填充,得到目标样本,包括:
22、若所述原始样本为初始模型训练样本,则对切片后的原始样本进行掩膜填充,得到目标样本;
23、若所述原始样本为模型泛化训练样本,则采用生成对抗网络对切片后的原始样本进行填充,得到目标样本。
24、可选的,所述原始样本包括影像数据和矢量数据;
25、所述将原始样本映射到第一标签体系中,得到所述原始样本的样本标签,包括:
26、读取所述原始样本的矢量数据;
27、根据所述矢量数据的字段信息将原始样本映射到第一标签体系中,得到所述原始样本的样本标签。
28、第二方面,本技术提供了一种样本生成装置,所述装置包括:
29、第一映射模块,用于将原始样本映射到第一标签体系中,得到所述原始样本的样本标签;
30、第二映射模块,用于根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,所述业务标签组包括多个业务标签,所述多个业务标签之间为平等层级关系;
31、确定模块,用于根据所述业务标签和所述样本标签确定所述原始样本的样本类型,所述样本类型包括:完全映射、非完全映射;
32、切片模块,用于根据所述样本类型对所述原始样本进行切片,得到目标样本,并将所述业务标签作为所述目标样本的样本标签。
33、可选的,所述第二映射模块具体用于:
34、基于业务标签与样本标签之间映射关系,获取所述业务标签组中与所述样本标签具有映射关系的业务标签;
35、将所述与所述样本标签具有映射关系的业务标签作为所述原始样本的业务标签。
36、可选的,所述确定模块具体用于:
37、比对所述原始样本的业务标签的标识与样本标签的标识,得到比对结果;
38、根据所述比对结果,确定所述原始样本的样本类型。
39、可选的,所述确定模块还具体用于:
40、若所述比对结果指示所述业务标签的标识与样本标签的标识相同,则确定所述原始样本的样本类型为完全映射;
41、若所述比对结果指示所述业务标签的标识与样本标签的标识不同,则确定所述原始样本的样本类型为非完全映射。
42、可选的,所述切片模块具体用于:
43、若所述样本类型为完全映射,则采用滑动窗口对所述原始样本进行切片,得到所述目标样本;
44、若所述样本类型为非完全映射,则对所述原始样本进行图斑中置切片,并根据原始样本的应用场景对所述原始样本进行背景填充,得到目标样本。
45、可选的,所述切片模块还具体用于:
46、若所述原始样本为初始模型训练样本,则对切片后的原始样本进行掩膜填充,得到目标样本;
47、若所述原始样本为模型泛化训练样本,则采用生成对抗网络对切片后的原始样本进行填充,得到目标样本。
48、可选的,所述原始样本包括影像数据和矢量数据;
49、所述第一映射模块还具体用于:
50、读取所述原始样本的矢量数据;
51、根据所述矢量数据的字段信息将原始样本映射到第一标签体系中,得到所述原始样本的样本标签。
52、第三方面,本技术提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述样本生成方法的步骤。
53、第四方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述样本生成方法的步骤。
54、本技术的有益效果是:基于样本标签和业务标签构建的双标签体系进行样本生成,可以通过样本标签对不同标签体系的样本进行精准的分类,并通过业务标签对不同样本类型的样本进行切片,由于各业务标签之间为平等层级,因此对于相同标签体系下的标签也可以实现准确的语义表达,并且对于不同的标签体系,也可以通过业务标签实现标签统一。