一种用于遥感图像时间序列标记样本自动增新的方法、装置和系统与流程

文档序号:11276805阅读:472来源:国知局
一种用于遥感图像时间序列标记样本自动增新的方法、装置和系统与流程

本发明涉及遥感图像处理技术领域,特别涉及主动学习技术与遥感图像分类技术。更具体地,本发明描述了一种自动样本标记技术,由少量已标记样本牵引出更多相应类别样本,以实现标记样本的自动增新。



背景技术:

在遥感行业,图像分类一直都是最基础也最重要的任务之一,无论是中低分辨率的地表覆盖分类,还是高分辨率的场景分类,都是相关应用得以展开的起点。而基于遥感图像时间序列的分类,更是可以同时利用多幅影像中的信息,有效提升分类精度。在当今的大数据时代,遥感图像传感器平台源极大丰富,时间序列的数据来源已经能够满足大规模应用的需求,但还有一个长期掣肘遥感图像时间序列分类技术发展的顽疾没能解决,那就是带有类别标记数据的获取十分困难。

分类算法都需要足够多的带有类别标记的数据作为训练集。在遥感图像处理领域,挑选典型数据并赋予类别标记一直都是一件费时费力的工作,而且高度依赖标注人员的知识与技术,稳定度不高。更为棘手的是,随着大数据技术的不断发展,尤其是深度学习算法的成熟,对训练样本的数量与质量提出了更高的要求。深度学习网络的训练过程本质上就是一种见多识广的过程,需要大量且多样性好的训练样本。数据标记的困难一直阻碍着大数据技术与深度学习在遥感领域的应用。时间序列的影像数据的标注相比单独一幅影像的标注更有挑战性,需要同时兼顾一个像素位置在不同影像上的表现,而且更容易受到噪声数据的影响。



技术实现要素:

遥感数据的数量其实是海量的,只不过都是未分类标记的数据,因此由少量的已分类标记的数据出发,自动挑选未分类标记的数据进行标记是一个适合的解决方案。与这一思路密切相关的一类方法在机器学习中叫做主动学习,但主动学习更关注的是挑选数据,并不解决自动标注,而且没有针对遥感图像时间序列构建挑选的准则。本发明在这一思路的基础上提出的方案,既解决时间序列数据的自动挑选问题,又解决自动标注问题,形成一套全自动的分类标记样本增新的方法。

本发明提出一种用于遥感图像时间序列分类标记样本的自动增新的方法、装置、系统和存储设备,以解决在遥感图像时间序列大数据分析中已分类标记样本严重不足的问题。本发明通过少量已分类标记样本精确来标注其它未分类标记的样本另外,本发明的标注过程是自动完成,无需人工干预,可以解决人工标注质量不稳定,依赖操作人员水平的问题。

为实现上述目的,本发明提出一种用于遥感图像时间序列分类标记样本的自动增新的方法,包括:

a)接收遥感图像时间序列样本,所述遥感图像时间序列样本包括已分类标记的样本集和未分类标记的样本集;

b)针对所述已分类标记的样本集,分别计算所述已分类标记的样本集的各类别的中心;

c)针对所述未分类标记的样本集中的每一个样本,分别计算其与所述各类别的中心之间的距离;

d)针对所述未分类标记的样本集中的每一个样本,确定其与哪个类别的中心之间的距离最近,并将其归入所确定的类别的候选样本集;;

e)在每一种类别的候选样本集中,选择与该类别区别最大的候选样本,将所述区别最大的候选样本转移到该类别中。

可选地,所述选择与该类别区别最大的候选样本包括:选择满足以下条件的候选样本::

在该类别的候选样本集中,该候选样本与该类别的中心之间的动态时间规整距离与平均规整偏移的乘积最大;其中该候选样本与该类别的中心之间的平均归整偏移定义为该候选样本与该类别的中心之间的动态时间规整的所有连接的规整偏移的平均值,其中每一个连接的规整偏移为所述连接的两个数据点的时间轴坐标之差。

可选地,计算未分类标记的样本集中的样本与各类别的中心之间的距离包括:计算所述未分类标记的样本与所述各类别的中心之间的动态时间规整距离;确定所述未分类标记的样本与哪个类别的中心之间的距离最近包括确定所述未分类标记的样本与哪个类别的中心之间的动态时间规整距离最近。

可选地,本发明的方法还包括:在所述b)之前对所接收的遥感图像时间序列样本进行savitzky-golay滤波。

可选地,本发明的方法还包括:如果已分类标记的样本的数量已经达到预定的已分类标记的样本的数量,则处理结束,否则返回b)继续处理。

本发明提出一种用于遥感图像时间序列分类标记样本的自动增新的装置,包括:数据输入模块、类别中心计算模块、距离计算模块、候选样本集确定模块和分类标记样本增新选择模块迭,其中

数据输入模块设置成:接收遥感图像时间序列样本,所述遥感图像时间序列样本包括已分类标记的样本集和未分类标记的样本集;

类别中心计算模块设置成:针对所述已分类标记的样本集,分别计算所述已分类标记的样本集的各类别的中心;

距离计算模块设置成:针对所述未分类标记的样本集中的每一个样本,分别计算其与所述各类别的中心之间的距离;

候选样本集确定模块设置成:针对所述未分类标记的样本集中的每一个样本,确定其与哪个类别的中心之间的距离最近,并将其归入所确定的类别的候选样本集;

分类标记样本增新选择模块设置成:在每一种类别的候选样本集中,选择与该类别区别最大的候选样本,将所述区别最大的候选样本转移到该类别中。

本发明的装置还包括迭代处理判定模块,所述迭代处理判定模块设置成:当已分类标记的样本的数量已经达到预定的已分类标记的样本的数量时,则处理结束,否则返回类别中心计算模块处继续处理。

可选地,所述分类标记样本增新选择模块设置成通过下述方式选择与该类别的已分类标记的样本的区别最大的候选样本:在该类别的候选样本集中,选择满足以下条件的候选样本:

该候选样本与该类别的中心之间的动态时间规整距离与平均规整偏移的乘积最大;其中该候选样本与该类别的中心之间的平均归整偏移定义为该候选样本与该类别的中心之间的动态时间规整的所有连接的规整偏移的平均值,其中每一个连接的规整偏移为所述连接的两个数据点的时间轴坐标之差。

本发明提供一种用于遥感图像时间序列分类标记样本的自动增新的系统,包括:

处理器;以及

存储设备,配置成存储计算机可读指令;

其中,所述处理器配置成执行从所述存储设备加载的所述计算机可读指令以执行:

a)接收遥感图像时间序列样本,所述遥感图像时间序列样本包括已分类标记的样本集和未分类标记的样本集;

b)针对所述已分类标记的样本集,分别计算所述已分类标记的样本集的各类别的中心;

c)针对所述未分类标记的样本集中的每一个样本,分别计算其与所述各类别的中心之间的距离;

d)针对所述未分类标记的样本集中的每一个样本,确定其与哪个类别的中心之间的距离最近,并将其归入所确定的类别的候选样本集;

e)在每一种类别的候选样本集中,选择与该类别区别最大的候选样本,将所述区别最大的候选样本转移到该类别中。

可选地,在每一种类别的候选样本集中,确定与该类别的已分类标记的样本的区别最大的候选样本包括选择满足以下条件的候选样本:在该类别的候选样本集中,该候选样本与该类别的中心之间的动态时间规整距离与平均规整偏移的乘积最大;其中该候选样本与该类别的中心之间的平均归整偏移定义为该候选样本与该类别的中心之间的动态时间规整的所有连接的规整偏移的平均值,其中每一个连接的规整偏移为所述连接的两个数据点的时间轴坐标之差。

本发明提供一种用于遥感图像时间序列分类标记样本的自动增新的存储设备,其中存储有计算机可读指令,所述计算机可读指令适于由处理器加载并执行以下操作:

a)接收遥感图像时间序列样本,所述遥感图像时间序列样本包括已分类标记的样本集和未分类标记的样本集;

b)针对所述已分类标记的样本集,分别计算所述已分类标记的样本集的各类别的中心;

c)针对所述未分类标记的样本集中的每一个样本,分别计算其与所述各类别的中心之间的距离;

d)针对所述未分类标记的样本集中的每一个样本,确定其与哪个类别的中心之间的距离最近,并将其归入所确定的类别的候选样本集;

e)在每一种类别的候选样本集中,选择与该类别区别最大的候选样本,将所述区别最大的候选样本转移到该类别中。

可选地,在每一种类别的候选样本集中,选择与该类别的已分类标记的样本的区别最大的候选样本包括选择满足以下条件的候选样本:

在该类别的候选样本集中,该候选样本与该类别的中心之间的动态时间规整距离与平均规整偏移的乘积最大;其中该候选样本与该类别的中心之间的平均归整偏移定义为该候选样本与该类别的中心之间的动态时间规整的所有连接的规整偏移的平均值,其中每一个连接的规整偏移为所述连接的两个数据点的时间轴坐标之差。

本发明与现有技术相比所具有以下优点:首先本发明采用了动态时间规整距离作为时间序列之间的相似性度量,相比一般的欧氏距离,更加准确。其次,本发明提出了平均规整偏移的概念,用以衡量候选样本与类别中心随时间变化趋势的相似程度,使新选择的样本与原有样本趋势尽量不同,维持样本集的多样性,以涵盖尽可能多的情况,这也是本发明的最大特点所在。最后,本发明可以实现对各类别样本的同步扩张,即每一轮迭代都为各类别增加同样数量的样本,以便保持样本数量的平衡。

本发明充分利用了遥感数据集中存在的海量未标记数据,解决了遥感领域样本数量众多但标记困难的矛盾,能够为遥感大数据分析,尤其针对深度神经网络的训练,提供充足的训练样本,具有广阔的应用价值与市场前景。

附图说明

图1描述了根据本发明实施方式的用于遥感图像时间序列分类标记样本的自动增新的方法的示例流程图。

图2描述了动态时间规整与规整偏移示意图。

图3描述了根据本发明实施方式的用于遥感图像时间序列分类标记样本的自动增新的装置的示意图。

图4描述了根据本发明实施方式的用于遥感图像时间序列分类标记样本的自动增新的系统的示意图

具体实施方式

为了更好地理解本发明的技术方案,下面结合附图,描述本发明的具体实施方式。

图1描述了根据本发明实施方式的用于遥感图像时间序列分类标记样本的自动增新的方法方法的示例流程图。图1中的示例方法100可以包括如步骤110、120、130、140、150、160和170中的一个或多个步骤所示的一个或多个操作、功能或动作。在步骤110至170中所描述的操作还可以存储为存储设备中的计算机可执行指令。

现将各步骤及其具体实现描述如下:

步骤110:接收遥感图像时间序列样本,所接收的遥感图像时间序列样本包括未分类标记的样本集和已分类标记的样本集。所述已分类标记例如包括绿地(a类)、建筑物(b类)、公路(c类)。所述未分类标记的样本集例如包括样本a、b、c、d、e、f、g、h、i、j、k。

步骤120:对所接收的遥感图像时间序列样本进行滤波。

在遥感图像时间序列中既存在内在的噪声,例如受云和云阴影污染的像元,也存在外在的噪声,例如成像过程中由于传感器问题引入的异常值。这些噪声对于后续的处理,比如动态时间规整距离与平均规整偏移的计算,可能会产生影响,因此优选的,可以对遥感图像时间序列数据进行滤波,以尽量去除噪声的影响。

本发明可以采用任何具有降噪性能的滤波方法对遥感图像时间序列样本进行滤波。由于savitzky-golay滤波是经典滤波方法,并且对于尖峰噪声有较好的抑制效果,因此,优选地,本发明可以选择savitzky-golay滤波器对遥感图像时间序列样本的所有数据进行滤波。

步骤130:计算已分类标记的样本集中的各类别的中心。

根据本发明的一个优选实施例,可以使用一个类别中所有数据的平均值,作为该类别的中心。例如对于绿地类别a,可以使用绿地类别a中所有数据的平均值作为绿地类别a的中心。在已分类标记的样本集中包括多种类别的已分类标记的样本。对于每一种类别的已分类标记的样本,计算所有标记为该类别的已分类标记的样本的平均值序列,作为该类别的中心,由此得到多种类别中的各个类别的中心。这里的平均值可以是欧式距离定义下的平均值,即对待平均的样本中的每一个时间点,求这些待平均的样本在该时间点上的数值的总和,再除以待平均的样本的总数,就得到了平均值序列在该点的值。

步骤140:针对未分类标记的样本集中的每一个未分类标记的样本,分别计算该未分类标记的样本与已分类标记的样本集中的各类别的中心的距离。

借助主动学习的思路,本发明旨在选择那些确实属于某个类别,但与该类别现有的已分类标记的样本的区别最大的样本,加入该类别的已分类标记的样本中。因此首先要判断未分类标记的样本属于哪一个类别。本发明的示例方法可基于最小距离法来判断未分类标记的样本属于哪一个类别,也就是,要计算未分类标记的样本与各类别中心的距离。

在时间序列的距离度量方法中,动态时间规整距离是最被广泛认可的一种,它可以捕捉在时间畸变下的距离,而时间畸变恰恰是在遥感图像时间序列中广泛存在的,因此本发明优选地使用动态时间规整距离来衡量每一个未分类标记的样本与已分类标记的样本集中的各类别的中心的距离。动态时间规整有很多变种或路径约束,本发明使用不带任何路径约束的原始动态时间规整,这样就不会对任何先验知识有任何依赖,可以实现完全自动化并能够增强方法的普适性。

步骤150:针对所述未分类标记的样本集中的每一个所述未分类标记的样本,确定所述未分类标记的样本与哪个类别的中心之间的距离最近,并将所述未分类标记的样本归入所确定的类别的候选样本集。

例如,分别计算样本a与类别a、b、c的中心的距离,确定与哪个类别的中心之间的距离最近,例如与类别a的中心距离最近。则将样本a归入类别a的候选样本集。注意,此处并非是将样本a直接归入类别a,而是归入类别a的候选样本集。

同样的,计算样本b至k与类别a、b、c的中心的距离,将其分别归入各个类别的候选样本集。例如样本a、b、c归入类别a的候选样本集,样本d、e、f归入类别b的候选样本集,样本g、h、i、j、k归入类别c的候选样本集。

遥感数据的特点是具有海量的未分类标记的样本,而已分类标记的样本即使是充分扩张之后,其数量与未分类标记的样本相比依然只是少数,因此在样本选择时有广阔的空间,不必过分追求精度。而另一方面海量的未分类标记的样本对计算速度提出了要求。综合考虑之下,本发明的示例方法采用最小距离法来判断未分类标记的样本的类别归属,即对于每一个未标记样本,其到哪个类别中心的距离最近,就将其归入这个类别的候选样本集。

步骤160:在每一种类别的候选样本集中,选择与该类别的已分类标记的样本的区别最大的候选样本;将所选择的候选样本正式归入该类别,并将所选择的候选样本从未分类标记的样本集转移到已分类标记的样本集。

具体地,遍历每个类别的候选样本集,找出该候选样本集中与该类别区别最大的候选样本。

例如在类别a的候选样本集中的样本a、b、c中,确定与类别a的样本中心差别最大的样本,例如样本a转移到已分类标记的样本集a中,并从未分类标记的样本集中删除样本a。接下来,在类别b和c的候选样本集中,分别计算离中心差别最大的样本,转移到已分类标记的样本集b、c中,从未分类标记的样本集中删除选中的样本。

在分类标记样本增新过程中最关键的问题是哪些样本是最应当加入已分类标记的样本集的。从已分类标记的样本集的用途来看,一般都是作为分类器的训练集。因此为了训练出更强的分类器,通常需要使训练集尽可能的全面,能够涵盖类别中可能出现的所有数据形式。基于以上分析,选择某一类别新增样本的标准首先要确定被选样本确实是属于该类别的,其次被选样本还要与该类的已有样本尽量不同。在步骤150中,各类别的候选样本集中的样本已经被判定是属于相应类别,因此,只要在候选集中进行选择,第一个标准(即被选样本确实是属于该类别的)就已经满足。至于第二个标准(即被选样本还要与该类的已有样本尽量不同),需要将每一种类别的候选样本集中的每一个样本与相应类的已有的已分类标记的样本的差别程度进行量化。

通常,每一种类别的候选样本与其所属类别的中心的距离越大,表明该候选样本与已有的已分类标记的样本的区别越大,但是这种衡量差别的方式对时间序列数据来说还不够,因为时间序列数据除了数值,序列的趋势,即随时间的走向也需要考虑,有些时间序列之间距离很远,但时间序列的趋势可能是很类似的,这种情况下距离就不能反映两者之间的差别,所以本发明的示例方法提出了平均规整偏移的概念,来量化序列的趋势之间的不同。

平均规整偏移的计算是基于动态时间规整的,如图2所示,动态时间规整建立了两条时间序列之间的对应关系,在图中表现为数据点之间的连线。对于两条时间序列之间的每一对有连接的数据点,定义规整偏移为这两个数据点的时间轴坐标之差,例如图2中第一条序列的时间序号为6的数据点和第二条序列的时间序号为5的数据点建立了连接,则该连接的规整偏移为6-5=1。相应地,两条时间序列之间的平均归整偏移定义为这两条时间序列之间的动态规整的所有连接的规整偏移的平均值。本发明的示例方法基于两条时间序列的动态时间规整距离与平均规整偏移的乘积,来综合反映这两条时间序列在数值与趋势上的不同。

基于上述定义的平均归整偏移,本发明的示例方法提出衡量一个候选样本与其所属类别的已分类标记样本的差别程度的指标是该候选样本与其所属类别的中心的动态规整距离与平均规整偏移的乘积,该乘积越大,表明该优选样本与其所属类别的已分类标记样本的差别越大,因此越优先选择该候选样本归入该类别的已经分类标记样本集中,并相应地将该候选样本从未分类标记的样本集转移到已分类标记的样本集。

步骤170:判断是否继续进行类别标记。

在步骤160完成后,新的已分类标记的样本被加入到了已分类标记的样本集中。如果只对一部分未分类标记的样本进行分类标记,则在步骤170中判断已分类标记样本数量是否已达到所需的已分裂标记的样本的数量,如果判断为否,则返回步骤130,继续选择新的未分类标记样本进行类别标记,如果判断为是,则结束处理过程。

可选地,如果需要对所有的未分类标记的样本进行分类标记,则在步骤160中判断所有的未分类标记的样本是否已经被分类标记,如果判断为否,则返回步骤130继续选择新的未分类标记的样本进行标记,如果判断为是,则结束处理过程。

应注意的是,如果返回步骤130继续选择新的未分类标记的样本进行标记,此时新的已分类标记样本已经被添加到已分类标记的样本集中,因此步骤130中的平均值序列和步骤140中计算的距离都会被更新。

上述技术方案中基于候选样本与其所属的类别的中心的动态规整距离与平均规整偏移的乘积来确定候选样本集中的每一个样本与相应类的已有的已分类标记的样本的区别程度,既考虑了时间序列数值上的差别,同时进一步也考虑到了时间序列趋势上的不同,在反复循环的样本增新过程中,保证了样本集的多样性,能够为遥感大数据监测与场景识别等应用场景提供高质量的已分类标记数据。本发明的实施过程完全是自动实现的,不需要人工干预,能够避免人工标注质量不稳定,依赖操作人员水平的问题。

可选的,本发明的方法还包括,检测未分类标记的样本集中,如果其中仍然包括未分类标记的样本,则返回到步骤130,继续处理。由于在之前的分类过程中,可能对于各个类别的样本集进行了更新,例如插入了新的样本,所以各个类别的样本集的中心可能发生了变化或者偏移。在此基础上重新计算各个类别的中心,有助于提高分类的精度。

本发明还提供一种用于遥感图像时间序列分类标记样本的自动增新的装置,如图3所示。所述装置包括数据输入模块、类别中心计算模块、距离计算模块、候选样本集确定模块、分类标记样本增新选择模块和迭代处理判定模块。

数据输入模块设置成:接收遥感图像时间序列样本,所述遥感图像时间序列样本包括已分类标记的样本集和未分类标记的样本集。

类别中心计算模块设置成:针对所述已分类标记的样本集中的各类别的已分类标记的样本,分别计算所述各类别的已分类标记的样本的平均值序列,作为所述各类别的中心。

距离计算模块设置成:针对所述未分类标记的样本集中的每一个未分类标记的样本,分别计算所述未分类标记的样本与所述各类别的中心之间的距离。

候选样本集确定模块设置成:针对所述未分类标记的样本集中的每一个所述未分类标记的样本,确定所述未分类标记的样本与哪个类别的中心之间的距离最近,并将所述未分类标记的样本归入所确定的类别的候选样本集。

分类标记样本增新选择模块设置成:在每一种类别的候选样本集中,选择与该类别的已分类标记的样本的区别最大的候选样本,将所选择的候选样本正式归入该类别,并将所选择的候选样本从所述未分类标记的样本集转移到所述已分类标记的样本集;

迭代处理判定模块设置成:当已分类标记的样本的数量已经达到预定的已分类标记的样本的数量时,则处理结束,否则返回到类别中心计算模块继续处理。可替换地,迭代处理判定模块设置成:当所有的未分类标记的样本已经被分类标记时,则处理结束,否则回到类别中心计算模块处继续处理。

可选地,分类标记样本增新选择模块设置成通过下述方式确定与该类别的已分类标记的样本的区别最大的候选样本:

在所述每一种类别的候选样本集中,选择与该类别的已分类标记的样本的区别最大的候选样本包括选择满足以下条件的候选样本:在该种类别的候选样本集中,该候选样本与该类别的中心之间的动态时间规整距离与平均规整偏移的乘积最大;

其中该候选样本与该类别的中心之间的平均归整偏移定义为该候选样本与该类别的中心之间的动态时间规整的所有连接的规整偏移的平均值,其中每一个连接的规整偏移为所述连接的两个数据点的时间轴坐标之差。

可选的,计算所述未分类标记的样本与所述各类别的中心之间的距离包括计算所述未分类标记的样本与所述各类别的中心之间的动态时间规整距离;确定所述未分类标记的样本与哪个类别的中心之间的距离最近包括确定所述未分类标记的样本与哪个类别的中心之间的动态时间规整距离最近。

可选地,本发明的装置还包括滤波模块,所述滤波模块设置成对所接收的遥感图像的样本进行savitzky-golay滤波。

本发明还提供一种用于遥感图像时间序列分类标记样本的自动增新的系统,如图4所示。所述系统包括:

处理器;以及

存储设备,配置成存储计算机可读指令;

其中,所述处理器配置成执行从所述存储设备加载所述计算机可读指令以执行以下操作:

步骤一,接收遥感图像时间序列样本,所述遥感图像时间序列样本包括已分类标记的样本集和未分类标记的样本集;

步骤二,针对所述已分类标记的样本集中的各类别的已分类标记的样本,分别计算所述各类别的已分类标记的样本的平均值序列,作为所述各类别的中心;

步骤三,针对所述未分类标记的样本集中的每一个未分类标记的样本,分别计算所述未分类标记的样本与所述各类别的中心之间的距离;

步骤四,针对所述未分类标记的样本集中的每一个所述未分类标记的样本,确定所述未分类标记的样本与哪个类别的中心之间的距离最近,并将所述未分类标记的样本归入所确定的类别的候选样本集,以得到所述多种类别中的每一种类别的候选样本集;

步骤五,在所述每一种类别的候选样本集中,选择与该类别的已分类标记的样本的区别最大的候选样本,将所选择的候选样本正式归入该类别,并将所选择的候选样本从所述未分类标记的样本集转移到所述已分类标记的样本集;

步骤六,如果已分类标记的样本的数量已经达到预定的已分类标记的样本的数量,则处理结束,否则返回步骤二继续处理。

可选地,在每一种类别的候选样本集中,确定与该类别的已分类标记的样本的区别最大的候选样本包括确定满足以下条件的候选样本:在该列别的候选样本集中,该候选样本与该类别的中心之间的动态时间规整距离与平均规整偏移的乘积最大;其中该候选样本与该类别的中心之间的平均归整偏移定义为该候选样本与该类别的中心之间的动态时间规整的所有连接的规整偏移的平均值,其中每一个连接的规整偏移为所述连接的两个数据点的时间轴坐标之差。

可选地,计算所述未分类标记的样本与所述各类别的中心之间的距离包括计算所述未分类标记的样本与所述各类别的中心之间的动态时间规整距离;确定所述未分类标记的样本与哪个类别的中心之间的距离最近包括确定所述未分类标记的样本与哪个类别的中心之间的动态时间规整距离最近。

可选地,所述操作还包括:在所述步骤二之前对所接收的遥感图像时间序列样本进行savitzky-golay滤波。

本发明还提供一种存储设备,其中存储有计算机可读指令,所述计算机可读指令适于由处理器加载并执行以下操作:

步骤一,接收遥感图像时间序列样本,所述遥感图像时间序列样本包括已分类标记的样本集和未分类标记的样本集;

步骤二,针对所述已分类标记的样本集中的各类别的已分类标记的样本,分别计算所述各类别的已分类标记的样本的平均值序列,作为所述各类别的中心;

步骤三,针对所述未分类标记的样本集中的每一个未分类标记的样本,分别计算所述未分类标记的样本与所述各类别的中心之间的距离;

步骤四,针对所述未分类标记的样本集中的每一个所述未分类标记的样本,确定所述未分类标记的样本与哪个类别的中心之间的距离最近,并将所述未分类标记的样本归入所确定的类别的候选样本集;

步骤五,在所述每一种类别的候选样本集中,选择与该类别的已分类标记的样本的区别最大的候选样本,将所选择的候选样本正式归入该类别,并将所选择的候选样本从所述未分类标记的样本集转移到所述已分类标记的样本集;

步骤六,如果已分类标记的样本的数量已经达到预定的已分类标记的样本的数量,则处理结束,否则返回步骤二继续处理。

可选地,在所述每一种类别的候选样本集中,确定与该类别的已分类标记的样本的区别最大的候选样本包括确定满足以下条件的候选样本:在该类别的候选样本集中,该候选样本与该类别的中心之间的动态时间规整距离与平均规整偏移的乘积最大;其中该候选样本与该类别的中心之间的平均归整偏移定义为该候选样本与该类别的中心之间的动态时间规整的所有连接的规整偏移的平均值,其中每一个连接的规整偏移为所述连接的两个数据点的时间轴坐标之差。

可选地,计算所述未分类标记的样本与所述各类别的中心之间的距离包括计算所述未分类标记的样本与所述各类别的中心之间的动态时间规整距离;确定所述未分类标记的样本与哪个类别的中心之间的距离最近包括确定所述未分类标记的样本与哪个类别的中心之间的动态时间规整距离最近。

可选地,所述操作还包括:在所述步骤二之前对所接收的遥感图像时间序列样本进行savitzky-golay滤波。

本领域技术人员可以理解上述方法和操作中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于存储设备中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或者部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块或单元可以采用硬件的形式实现,也可以采用软件模块的形式实现。本发明不限于任何特定形式的硬件或软件的结合。

应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明,但不以任何方式限制本发明。因此,本领域技术人员应当理解,仍然可以对本发明进行修改或者等同替换;而一切不脱离本发明的精神和技术实质的技术方案及其改进,其均应涵盖在本发明专利的保护范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1