共性知识约束的遥感样本迁移方法与流程

文档序号:32998772发布日期:2023-01-18 00:41阅读:21来源:国知局
共性知识约束的遥感样本迁移方法与流程

1.本发明涉及遥感影像处理领域,具体涉及一种共性知识约束的遥感样本迁移方法。


背景技术:

2.近年来,遥感技术的飞速发展推动了遥感技术在各个领域的广泛应用。其中,多颗卫星的对地实时监测为整个遥感领域的发展提供了海量多元遥感影像数据支持,奠定了遥感技术飞速发展的基础。有效的利用海量遥感影像数据是遥感领域发展的重要方向之一。
3.人工智能技术作为当今最热门的高新技术之一,有着巨大的发展前景。事实上,人工智能技术的可实施性很大程度上是依托着海量数据、大数据的支持,因而人工智能技术也能够有效的利用海量数据实现各种功能。
4.将人工智能技术用于遥感领域能够大大提高对海量遥感影像数据的利用率。但是,目前大部分遥感方向的人工智能应用均采用监督学习或半监督学习的方式,无法直接使用海量遥感影像数据,需要依赖标注的遥感样本。标注的遥感样本获取难度大,目前除精度高但是人力成本高并且效率低下的人工样本标注的方法外,也有对使用机器学习的方法进行样本标注的研究,但仍没有达到大规模工程实施级别的标准。因此,如何最大化有效利用现有的遥感标注样本是目前的研究方向之一。
5.遥感样本中的迁移学习方法能够有效提升现有样本的利用率。迁移学习的目的是将源域中充足的标注样本用于少量样本或无样本的目标域,源域与目标域之间的样本特征存在部分相关性或不相关。现有的一种迁移方法,如tradaboost,将相关性高的源域样本数据优选出来用于迁移学习,实现了迁移学习性能的提升。但是,对于这种优选源域样本的方法,主要有以下问题:即使是对于优选的样本,样本中也不是所有特征都对迁移学习有益,部分相关性低的特征会对迁移学习产生负面影响,甚至导致负迁移,需要保证源域与目标域充分相关。


技术实现要素:

6.本发明提出一种共性知识约束的遥感样本迁移方法,能够解决上述现有技术的问题,在不影响源域样本数据分布的同时,通过直接将源域样本数据与目标域样本数据的共性特征输入构建好的生成器,基于目标函数对生成器进行训练,获得共性知识约束下的生成器。将源域样本数据输入该共性知识约束下的生成器,生成拟合目标域的样本数据,实现了共性知识约束下的样本迁移,有效避免了负迁移。同时,整个样本迁移流程为端到端,能够实现模型的自动调整。
7.为实现上述技术目的,本发明的技术方案如下:
8.一种共性知识约束的遥感样本迁移方法,该方法包括以下步骤:
9.s1将源域样本数据与目标域样本数据输入特征提取模型,得到所述源域样本数据与所述目标域样本数据的特征数据和公共特征空间;
10.s2将所述源域样本数据与所述目标域样本数据的特征数据输入特征聚类器,确定共性特征空间和非共性特征空间,提取共性特征和源域非共性特征,其中,所述共性特征空间和所述非共性特征空间为所述公共特征空间的子空间;
11.s3将所述共性特征和加入随机噪声的源域非共性特征输入生成器,生成伪样本;
12.s4将所述伪样本和目标域样本数据输入所述判别器,根据所述目标域样本数据对所述伪样本进行判别,根据判别结果和目标函数优化生成器;
13.s5迭代s3至s4的训练过程,直至所述目标函数收敛;
14.s6将所述源域样本数据输入训练好的生成器,生成迁移样本。
15.可选地,步骤s2中,将所述源域样本数据与所述目标域样本数据的特征数据输入特征聚类器,确定共性特征空间和非共性特征空间,包括:
16.在所述公共特征空间上,对所述源域样本数据和所述目标域样本数据进行聚类,获得k组混合样本数据xi,i=1,...,k,其中,每组混合样本数据内包含特征相关性;
17.将所述混合样本数据xi映射到所述公共特征空间的多个特征子空间fj上,得到样本-特征集合(xi,fj);
18.分析(xi,fj)的分布:
19.若分布具有相关性,则将所述特征子空间fj划分入共性特征空间;若分布不具有相关性,则将所述特征子空间fj划分入非共性特征空间。
20.可选地,所述分布具有相关性的判别方式为:
21.使用概率分布距离度量算法计算同一特征子空间fj中各组混合样本与其他组混合样本特征分布的拟合程度;
22.根据所述拟合程度,得到同一特征子空间fj中每组混合样本特征(xi,fj)的总体拟合程度;
23.统计总体拟合程度大于第一预设阈值的混合样本的数量m,在m大于等于第二预设阈值时,判定所述特征子空间为分布具有相关性。
24.可选地,所述拟合程度根据概率分布距离度量算法进行计算得到。
25.可选地,所述特征提取模型为:
26.采用特征提取算子的机器学习模型;
27.或卷积神经网络构建的模型;
28.或所述机器学习模型与卷积神经网络构建的模型的组合模型。
29.可选地,所述特征提取模型为卷积神经网络构建的卷积自编码器的编码器部分;
30.相应的,所述生成器为所述卷积自编码器的解码器部分。
31.可选地,所述特征提取模型与所述生成器的结构对称。
32.可选地,所述生成器和所述判别器构成生成对抗网络,所述目标函数为所述生成对抗网络的目标函数,所述目标函数为:
[0033][0034]
其中g为生成器,d为判别器,e为期望函数,x为生成器生成的伪样本数据,p
data
为x来自真实数据分布的概率,pg为x来自生成器输出样本的概率。
[0035]
本发明提出了一种共性知识约束的遥感样本迁移方法,通过对源域和目标域样本
数据进行特征提取,得到样本数据对应的特征数据,通过对特征数据进行聚类分析,得到源域和目标域样本的共性特征和非共性特征,通过将共性特征和源域带噪非共性特征输入生成器,生成共性特征约束下的伪样本,通过将伪样本和目标域样本输入判别器,根据判别结果和目标函数迭代训练优化生成器,得到能将源域特征迁移到目标域的生成器,最后将源域样本输入生成器,能够直接得到拟合目标域的迁移样本。本发明的有益效果为:
[0036]
(1)在本发明的技术支持下,能够实现在不影响源域样本数据分布的同时,将源域样本数据输入共性知识约束下的生成器,生成拟合目标域的样本数据,实现了共性知识约束下的样本迁移,有效避免了负迁移。
[0037]
(2)本发明构建的样本迁移框架,支持模型的全自动训练和调整,实现了端到端的样本迁移流程。
附图说明
[0038]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]
图1为本发明共性知识约束的遥感样本迁移方法一实施例的流程示意图;
[0040]
图2为本发明共性知识约束的遥感样本迁移方法一实施例中样本迁移模型数据传输的示意图;
[0041]
图3为本发明共性知识约束的遥感样本迁移方法一实施例中使用训练好的自编码器对源域样本进行样本迁移的示意图。
具体实施方式
[0042]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0043]
请参照图1,图1是本发明所述的一种共性知识约束的遥感样本迁移方法实施例的流程示意图,相对于传统的迁移学习模式,该方法实现了通过输入源域样本生成拟合目标域的样本,实现了共性知识约束下的样本迁移,有效避免了负迁移,该方法包括以下步骤:
[0044]
s1将源域样本数据与目标域样本数据输入特征提取模型,得到源域样本数据与目标域样本数据的特征数据和公共特征空间。
[0045]
需要说明的是,本发明实施例针对的是遥感样本的迁移任务,属于同构迁移学习的范畴,源域和目标域样本数据处于同一特征空间上,即所述的公共特征空间。
[0046]
可选地,所述特征提取模型为:采用特征提取算子的机器学习模型,或卷积神经网络模型,或上述模型的组合模型。
[0047]
本实施例中使用卷积神经网络构建的卷积自编码器的编码器部分作为特征提取模型,自编码器作为强大的特征检测器,可通过无监督学习将学习到的输入数据高效表示为特征。卷积自编码器的编码器采用三层卷积神经网络结构,第一层卷积核数目为16,卷积
核大小为3
×
3,步长为1;第二层卷积核数目为8,卷积核大小为3
×
3,步长为1;第三层卷积核数目为8,卷积核大小为3
×
3,步长为1。每层卷积层后连接一个2
×
2的最大池化层用于降维,对特征进行压缩。
[0048]
s2将所述源域样本数据与所述目标域样本数据的特征数据输入特征聚类器,确定共性特征空间和非共性特征空间,提取共性特征和源域非共性特征,其中,所述共性特征空间和所述非共性特征空间为所述公共特征空间的子空间。
[0049]
需要说明的是,源域和目标域样本数据均处于公共特征空间上,但是具体的分布情况有所不同,可以根据数据分布将特征数据划分为共性特征和非共性特征,共性特征所在的子空间为共性特征空间,非共性特征所在的子空间则为非共性特征空间。
[0050]
本实施例中,在所述公共特征空间上,将源域样本数据和目标域样本数据通过协同聚类处理划分为k组,获得k组混合样本数据xi,i=1,...,k。每组混合样本数据内具有特征相关性。将样本特征值归一化处理,便于后续分析和输入生成对抗网络。将混合样本数据xi映射到多个特征子空间fj上,得到样本-特征集合(xi,fj)。分析(x1,fj),(x2,fj),...,(xk,fj)的分布。若分布具有相关性,则将所述特征子空间fj划分入共性特征空间;若分布不具有相关性,则将所述特征子空间fj划分入非共性特征空间。
[0051]
其中,分布具有相关性的判别方式为:
[0052]
计算同一特征子空间fj中各组混合样本与其他组混合样本特征分布的拟合程度;
[0053]
根据所述拟合程度,得到同一特征子空间fj中每组混合样本特征(xi,fj)的总体拟合程度;
[0054]
统计总体拟合程度大于第一预设阈值的混合样本的数量m,在m大于等于第二预设阈值时,判定所述特征子空间为分布具有相关性。
[0055]
具体地,对f1中混合样本的特征分布进行相关性分析的步骤如下:使用概率分布距离度量算法计算同一特征子空间fj中各组混合样本与其他组混合样本特征分布的拟合程度,根据所述拟合程度,得到同一特征子空间fj中每组混合样本特征(xi,fj)的总体拟合程度,统计总体拟合程度大于第一预设阈值的混合样本的数量m,在m大于等于第二预设阈值时,判定所述特征子空间为分布具有相关性。其中,拟合程度可通过kl散度表示,kl散度越小,拟合程度越高,总体拟合程度为kl散度的集合。第二预设阈值可为占总数量的80%,还可为其他参数,本实施例对此不做限制,例如对(xi,f1)每两组混合样本数据计算kl散度,得到个kl散度值,将这个kl散度值与预设阈值进行比较,若超过80%的kl散度值对应的总体拟合程度大于第一预设阈值,则判定该特征子空间f1分布具有相关性。若分布具有相关性,则将特征子空间f1划分入共性特征空间,若分布不具有相关性,则将特征子空间f1划分入非共性特征空间,根据所述方法将所有特征子空间fj划分入共性特征空间或非共性特征空间。
[0056]
可以理解的是,源域和目标域样本数据在同一特征空间上具有相关特征和不相关特征,使用协同聚类方法实现了同时对样本数据和特征数据在同一特征空间上的聚类,能够直观地体现源域和目标域样本数据与特征之间的关系。本发明旨在将相关特征和不相关特征区分开来,分别划分到共性特征空间和非共性特征空间上。样本提取出的归一化特征值在同一特征子空间上的分布体现了样本在该特征子空间的特性,在同一共性特征子空间上,源域样本数据和目标域样本数据应具有分布一致性,对于不同组数据也应具有相似的
分布,因此通过对同一特征子空间中不同组数据特征分布之间的相关性分析,可以将特征子空间划分入共性特征空间和非共性特征空间。
[0057]
在本发明的技术支持下,能够实现在不影响源域样本数据分布的同时,实现了共性知识约束下的样本迁移,有效避免了负迁移。
[0058]
s3将所述共性特征和加入随机噪声的源域非共性特征输入生成器,生成伪样本。
[0059]
s4将所述伪样本和目标域样本数据输入所述判别器,根据所述目标域样本数据对所述伪样本进行判别,根据判别结果和目标函数优化生成器。
[0060]
s5重复迭代s3至s4的训练过程,直至所述目标函数收敛。
[0061]
需要说明的是,本发明中所使用的生成器与用于特征提取的特征提取模型结构对称,目的是能够直接将提取的共性特征输入生成器,经过最小的损失生成样本,本发明一实施例的整个迁移学习模型和数据传输如图2所示。直接输入共性特征至生成器生成样本,可以有效地实现对共性特征的约束,确保生成的样本在共性特征不变的前提下尽可能地拟合目标域样本。
[0062]
本实施例中,使用卷积自编码器的解码器部分作为生成器,采用与编码器结构对称的解码器结构,解码器采用三层反卷积神经网络结构,第一层卷积核数目为8,卷积核大小为3
×
3,步长为1;第二层卷积核数目为8,卷积核大小为3
×
3,步长为1;第三层卷积核数目为16,卷积核大小为3
×
3,步长为1。每个反卷积层后连接一个2
×
2的上采样层来还原图像大小。
[0063]
本实施例中使用同一个自编码器,提升了模型的复用性,降低了模型构建的成本。生成器和判别器构成了一个输入为特征的非传统生成对抗网络,生成对抗网络的目标函数为为其中g为生成器,d为判别器,e为期望函数,x为生成器生成的伪样本数据,p
data
为x来自真实数据分布的概率,pg为x来自生成器输出样本的概率。将共性特征和加入随机噪声的源域非共性特征归一化后输入卷积自编码器的解码器部分,生成伪样本。将伪样本和目标域样本数据输入判别器,根据目标域样本数据对伪样本进行判别,根据判别结果和目标函数优化整个生成对抗网络。重复迭代上述训练过程,直至目标函数收敛。
[0064]
s6将所述源域样本数据输入训练好的生成器,生成迁移样本。
[0065]
可以理解的是,训练好的生成器能够通过接收源域样本数据来生成拟合目标域的样本数据,实现样本的迁移,本实施例中实现样本迁移的流程如图3所示,源域样本经过自编码器后能够生成拟合目标域的迁移样本。
[0066]
本发明构建的样本迁移框架,支持模型的全自动训练和调整,实现了端到端的样本迁移流程。实现输入源域样本后自动生成拟合目标域的样本。
[0067]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0068]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1