一种领域自适应迁移特征方法及系统与流程

文档序号:18902238发布日期:2019-10-18 22:06阅读:942来源:国知局
一种领域自适应迁移特征方法及系统与流程

本发明涉及图像处理领域,具体涉及一种领域自适应迁移特征方法及系统。



背景技术:

目前,对齐源域和目标域的域分布和类分布,进而进行目标域识别技术,是通过引进目标域伪标签,进行域之间的类分布匹配,同时进行了域分布匹配,通过寻求两个域的域分布适应和类分布适应达到提高目标识别表现的效果。

以jda为例,jda通过源分类器预测目标域伪标签,通过最小化表征源域和目标域分布差异的距离度量mmd,同时匹配源域和目标域之间的域分布和类分布后进行目标域识别。但jda通过最小化mmd学习到的特征已经被扭曲,很有可能会出现失真的现象,而特征失真可能会较大地损失从源域转移到目标域的内在类别结构信息,从而降低目标域识别的准确率。同时目标域伪标签仅由训练出的源分类器预测,而以这种方式训练出的源分类器可能过度拟合源域分布。由于存在不可避免的域移位,导致与源域不相似的目标数据将被错误地推断,因而,错误的伪标签可能会降低类分布的对齐程度,并导致负转移。

以lsc为例,lsc利用目标域伪标签,通过对齐源域和目标域之间的域分布和类分布,学习到域不变特征,在整个特征提取过程结束后使用经典标签传播技术{lp}来精确化目标伪标签,在一个框架中同时优化特征学习和精细化目标伪标签,实现迭代学习过程中相互促进提高最终性能的目的。但与jda一样,因为通过最小化表征源域和目标域分布差异的距离度量学习到的特征已经被扭曲,从而降低目标识别的准确率;并且目标伪标签信息仅考虑了目标域的结构一致性,忽视了源域与目标域之间的标签一致性信息。



技术实现要素:

为了解决现有技术中所存在的上述不足,本发明提供一种领域自适应迁移特征方法及系统。

本发明提供的技术方案是:一种领域自适应迁移特征方法,包括:

步骤s1、基于源域和目标域为mmd矩阵和类内/类间离散度设初值,并设置最大迭代次数;

步骤s2、基于所述mmd矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;

步骤s3、基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;

步骤s4、根据细化后的伪标签更新mmd矩阵和类内/类间离散度,重复执行步骤s2和步骤s3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;

其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;

所述目标域包括多个目标数据,所述目标数据包括图像。

优选的,所述基于所述mmd矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签,包括:

基于所述mmd矩阵和类内/类间离散度构建所述源域和目标域在转移特征学习过程中的损失项;

对所述损失项求最优解,获得线性域不变投影;

基于所述线性域不变投影获得源数据和目标数据的投影;

基于源数据的投影和所述源数据对应的标签训练得到源数据分类器;

基于所述目标数据的投影和所述源数据分类器确定目标数据对应的伪标签。

优选的,所述损失项,如下式所示:

式中:j:损失项;jmmd:mmd损失;jdistance:源域和目标域的整体距离损失项;p:线性域不变投影;α:第一权衡参数,β:第二权衡参数;f:frobenius范数。

优选的,所述损失项的最优解,如下式所示:

式中:w:mmd矩阵;m:类内/类间离散度;x:源域和目标域样本的特征矩阵;xt:x的转置矩阵;im:m阶单位矩阵;h:中心矩;对角矩阵;p:线性域不变投影;α:第一权衡参数,β:第二权衡参数;

其中:所述mmd矩阵w,如下式所示:

式中:wc:第c类的类条件mmd矩阵;c:源域的类数量;所有第c类源数据的个数;所有伪第c类目标数据的个数;长度为ns的列向量,若源域第i个样本标签为c,则第i个元素为1,否则为0;长度为nt的列向量,若目标域第i个样本伪标签为c,则第i个元素为1,否则为0;

所述类内/类间离散度m,如下式所示:

m=msame-mdiff=diag(ms,same,mt,same)-diag(ms,diff,mt,diff)

式中:msame:源域和目标域中同类最远样本对之间的距离矩阵;mdiff:源域和目标域中不同类最近样本对之间的距离矩阵;ms,same:源域中同类最远样本对之间的距离矩阵;mt,same:目标域中同类最远样本对之间的距离矩阵;ms,diff:源域中不同类最近样本对之间的距离矩阵;mt,diff:目标域中不同类最近样本对之间的距离矩阵。

优选的,所述基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,包括:

分别基于源域的标签和目标域的伪标签之间一致性,以及目标域内伪标签的一致性构建权重矩阵和图拉普拉斯矩阵;

基于所述权重矩阵和图拉普拉斯矩阵,构建细化标签方程;

对所述细化标签方程求解获得细化标签的最优解,并基于细化标签的最优解获得目标域分类器。

优选的,所述细化标签方程,如下式所示:

式中:ft:各目标数据的实际标签;fs:源分类器对各目标数据预测的伪标签;λ:权重矩阵;ρ:第四权衡参数;l:目标数据的图拉普拉斯矩阵;ft的转置矩阵。

优选的,所述细化标签的最优解,如下式所示:

式中:w*:细化标签的最优解;λ:权重矩阵;ρ:第四权衡参数;l:目标数据的图拉普拉斯矩阵:zt:目标数据的投影;fs:源分类器对各目标数据预测的伪标签;zt的转置矩阵。

优选的,所述目标域分类器,如下式所示:

ft(zti)=(w*)tzti

式中:ft(zti):目标域分类器对目标数据zti的标签进行预测;w*:细化标签的最优解。

基于同一发明构思,本发明还提供了一种领域自适应迁移特征系统,包括:

初始模块,用于基于源域和目标域为mmd矩阵和类内/类间离散度设初值,并设置最大迭代次数;

判别转移特征学习模块,用于基于所述mmd矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;

标签一致性模块,用于基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;

迭代求解模块,用于根据细化后的伪标签更新mmd矩阵和类内/类间离散度,重复执行步骤s2和步骤s3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;

其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;

所述目标域包括多个目标数据,所述目标数据包括图像。

优选的,所述判别转移特征学习模块,包括:

构建损失项单元,用于基于所述mmd矩阵和类内/类间离散度构建所述源域和目标域在转移特征学习过程中的损失项;

求解损失项单元,用于对所述损失项求最优解,获得线性域不变投影;

投影单元,用于基于所述线性域不变投影获得源数据和目标数据的投影;

训练单元,用于基于源数据的投影和所述源数据对应的标签训练得到源数据分类器;

确定伪标签单元,用于基于所述目标数据的投影和所述源数据分类器确定目标数据对应的伪标签。

与最接近的现有技术相比,本发明提供的技术方案具有以下有益效果:

本发明提供的技术方案,基于源域和目标域为mmd矩阵和类内/类间离散度设初值,并设置最大迭代次数;在每次迭代过程中,基于所述mmd矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签,同时利用所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,最后根据细化后的伪标签更新mmd矩阵和类内/类间离散度,将所述目标数据对应的伪标签设定为目标数据对应的标签,使更加精确的目标标签将在下一次迭代过程中反馈到转移特征学习中,整个框架以正反馈方式迭代进行,提高了目标域识别的准确率。

本发明提供的技术方案,判别性转移特征学习和目标标签细化将在正反馈循环中相互补充促进,进而促进类分布的对齐,同时获得优越的性能。

附图说明

图1为本发明构思的结构示意图;

图2为本发明的判别信息优化原理示意图;

图3为本发明的流程图;

图4为本发明实施例中amazon,caltech,dslr,webcam,cmu-pie,imagenetandvoc2007的图像样本示意图;

图5为本发明实施例中实验所使用的跨域数据集的描述示意图;

图6为本发明实施例中在cmu-pie数据集上的分类准确率(%)示意图;

图7为本发明实施例中在office-31数据集decaf7特征上的分类准确率(%)示意图;

图8为本发明实施例中在office+caltech10数据集decaf6特征上的分类准确率(%)示意图;

图9为本发明实施例中在office+caltech10数据集surf特征上的分类准确率(%)示意图;

图10为本发明实施例中在imagetnet+voc2007数据集上的分类准确率(%)示意图;

图11为本发明实施例中在office-31数据集decaf7特征上的分类准确率(%)示意图;

图12为本发明实施例中在office+caltech10数据集decaf6特征上的分类准确率(%)示意图。

具体实施方式

为了更好地理解本发明,下面结合说明书附图和实例对本发明的内容做进一步的说明。

本实施例中为了更清楚了阐述本发明构思,下面对迁移学习发展进行简述:

1、迁移学习的挑战

过去几十年见证了监督学习方法在众多现实应用中的巨大成功,例如计算机视觉和自然语言处理。然而,由于监督学习过分依赖丰富标注的训练数据和训练,测试数据服从同一分布的一般假设,标准监督学习方法对大规模计算机视觉任务的理想泛化能力不可避免地具有一定的局限性。因此,当目标域服从与源域不同但相关的分布时,根据充分标记的源域设计出有效的转移模型是至关重要的。为此,大量研究发现,挖掘潜在的域不变信息实现域自适应可以有效地减少分布差异,目前的研究工作已经证明上述方法能够有效地解决部分域不匹配问题。

2、域分布适应

对于跨域所面临的挑战,减少不同域之间的差异至关重要。最近大多数域适应工作致力于:

1)重加权源样本生成加权分类器用于目标域的判别,例如:kmm,prda。

2)提取域不变特征以减少源域和目标域之间的差异,这样源域上有价值的信息可以被有效地转移到目标域中。虽然特征提取策略被广泛使用并且已经取得了引人注目的表现,但是通过最小化表征源域和目标域分布差异的距离度量(例如最大平均差异mmd)学习到的特征已经被扭曲,很有可能会出现失真的现象。特征失真可能会较大地损失从源域转移到目标域的内在类别结构信息,从而降低目标域识别的准确率。

上述现象说明了:

1)域不变性确保两个域的准确分布对齐并揭示潜在的因素;

2)类判别性有利于实现较高的目标分类准确率并弥补特征失真的副作用。

因此,不难发现,学习到的特征应该不仅仅具有域不变性,还应该具有类判别性。

3、类分布适应

此外,近些年来,许多现有基于特征提取的方法使用了目标域上的伪标签。这些方法中的大多数仅使用源分类器预测目标域伪标签以进一步减少两个域的类分布差异。这种策略确实通过寻求两个域的类适应达到了提升目标识别表现的目的。然而,用于跨域类分布对齐的目标伪标签无疑是一把双刃剑,但这个问题一直被忽视,一方面,当伪标签高度准确时,跨域的边缘和条件分布完美匹配,此时,转移特征学习过程和目标标签预测将以正反馈的形式相互促进;另一方面,目标伪标签通常由源分类器预测,而源分类器的训练集来源于投影后的源样本,这种方式可能会导致训练出的分类器过度拟合源数据,导致生成的分类器对许多目标域样本做出不正确的预测。这些错误预测的目标伪标签将影响源域和目标域的类分布对齐,并相应地导致分类器在目标域上的性能下降。因此,保证目标伪标签的正确性对于学习理想的域不变特征至关重要。大多数现有方法忽略了在一个框架中同时优化特征学习和细化目标伪标签,因此它们不太可能实现两者在迭代学习过程中相互促进以提高最终性能的效果。

实施例1

在目前迁移学习的现状中,如何有效降低源域和目标域的分布差异是域自适应的主要挑战,因此本发明提出一种基于领域自适应迁移特征学习与标签一致性的方法,旨在通过实现两个关键点达到有效域适应的目的:

1)在迁移学习过程中所学到的特征不仅具有域不变性,还具有类判别性;

2)有效利用目标域的伪标签,使之为域分布对齐服务。

如图1所示,本发明提出的方法将类判别信息的域不变特征学习和具有标签一致性的目标标签细化融入到一个通用框架中,这两个步骤可以自适应地互相促进,有利于有效信息转移,在图1中不同形状代表不同类。

如图3所示,根据图1中的框架本实施例对发明构思进行详细说明,本发明提供的一种领域自适应迁移特征方法,包括:

步骤s1、基于源域和目标域为mmd矩阵和类内/类间离散度设初值,并设置最大迭代次数;

步骤s2、基于所述mmd矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;

步骤s3、基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;

步骤s4、根据细化后的伪标签更新mmd矩阵和类内/类间离散度,重复执行步骤s2和步骤s3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;

其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;

所述目标域包括多个目标数据,所述目标数据包括图像。

a、问题定义

在无监督域适应中,给出标记的源域和未标记的目标域其中ns,nt分别是源样本和目标样本的数量。

假设xsi,xtj∈x,并且是特征空间。相应地,是xsi的标签,并且是标签空间,由于域移位,使得边缘分布ps(xs)≠pt(xt),条件分布qs(ys|xs)≠qt(yt|xt)。

因此首先寻找一个有效的转换∮(·)使域差异最小化,即ps(∮(xs))≈pt(∮(xt))且qs(ys|∮(xs))≈qt(yt|∮(xt)),同时尽可能保留类判别信息。为了进一步准确对齐跨域的类分布,应通过探索域间和域内的内在标签一致性来同时细化目标伪标签。

为了实现上述目的,将判别转移特征学习和标签一致性目标标签细化整合到一个通用框架中。转移特征学习步骤将明确最小化跨域的边缘和条件分布mmd距离,并通过最小化类内散度和最大化类间散度保留数据类判别信息。同时,在学习到的嵌入子空间中,将根据源域和目标域之间和域内的标签一致性来细化目标伪标签,进而有效地促进转移特征学习。

b、判别转移特征学习,即为步骤s2、基于所述mmd矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签,包括:

1)域/类判别对齐

本方法期望学习到的特征表示具有域不变性,进而使得有用信息可以被有效地从源域转移到目标域。mmd度量被广泛用于测量两个分布之间的距离。本发明为了减少源域和目标域的边缘分布和条件分布之间的距离,对域分布适应和类分布适应,尝试寻找一个结合xs和xt的线性域不变投影p,即源域和目标域的投影分别表示为zs=ptxs,zt=ptxt。

首先,域分布适应使用经验mmd最小化在d维嵌入子空间中源数据和目标数据的样本均值之间的距离;

其次,类分布对齐最小化源域和目标域的条件分布之间的距离,使用源分类器预测的目标伪标签定义类分布适应损失项。

按照之前jda的工作,将整个mmd损失表示为:

其中并且c=0表示数据来自全部域,即

式中,表示所有第c类真实标签的源样本,表示所有第c类伪标签的目标样本,是所有第c类源样本的样本个数,是所有伪第c类目标样本的样本个数。

wc是第c类的类条件mmd矩阵,通过计算表示为:

式中:wc:第c类的类条件mmd矩阵;c:源域的类数量;所有第c类源数据的个数;所有伪第c类目标数据的个数;长度为ns的列向量,若源域第i个样本标签为c,则第i个元素为1,否则为0;长度为nt的列向量,若目标域第i个样本伪标签为c,则第i个元素为1,否则为0;

这里的维数分别是ns和nt。的每个元素被定义为:

显然,如果最小化经验mmd损失jmmd,源域和目标域的差异能够被有效地降低,使得在源域和目标域中学习到的低维表示将具有域不变性。

2)类判别信息保留

最小化(1)可以在学习到的特征空间中对齐源域和目标域之间的分布,但不能保证所学到的表示对于分类任务具有足够辨别力。为了避免由分布对齐引起的特征失真并有效地将判别性信息从源域转移至目标域,我们期望当转换后的数据属于同一类时尽可能接近,当它们属于不同类时,尽可能远离。

如图2所示,选择具有相同标签的最不相似的样本对,最小化它们的差异,并选择具有不同标签的最相似的样本对,最大化它们的距离。因此,对于源样本和目标样本中的每个数据,仅关注与之相关的两个样本对,更为直观有效。

具体而言,对于源域中的每个样本,可以找到相应的一个具有相同标签的最远样本,以及一个具有不同标签的最近样本。

然后,所有源样本的距离损失项及其矩阵公式可表示为:

在矩阵和矩阵的第i行第j列的元素通过计算分别表示为:

其中i(·)是一个示性函数。

若定义则对于所有源样本的距离损失项可重写为:

类似的推导和定义通过伪标签同样可以应用于目标样本中。

因此,目标域的距离损失项可以表示为:

定义msame=diag(ms,same,mt,same),mdiff=diag(ms,diff,mt,diff),进而可以得到两个域的整体距离损失项:

jdistance=js,distance+jt,distance

=tr(ptx(msame-mdiff)xtp)=tr(ptxmxtp)(9)

式(9)的最小化增大了类内紧凑性和类间散度,从而增强了学习到的特征表示的辨别力。

3)转移特征学习的整体方案

结合(1)和(9),转移特征学习过程的损失项表示为:

式中:j:损失项;jmmd:mmd损失;jdistance:源域和目标域的整体距离损失项;p:线性域不变投影;α:第一权衡参数,β:第二权衡参数;f:frobenius范数。其中超参数α是为了平衡域不变性和所学特征的类判别性,β是为了避免数值不稳定问题。

(10)整体判别转移特征学习优化问题规范表示为:

其中id是d维的单位矩阵,并且是中心矩阵。

(11)的约束旨在最大化嵌入源和目标数据的方差,显然,带有约束的非线性优化问题(11)可以作为广义特征分解问题解决。

关于p∈rm×d且满足(11)的最优解可以被有效地得到:

式中:w:mmd矩阵;m:类内/类间离散度;x:源域和目标域样本的特征矩阵;xt:x的转置矩阵;im:m阶单位矩阵;h:中心矩其中是(ns+nt)阶单位矩阵,是(ns+nt)阶全1矩阵;对角矩阵;p:线性域不变投影;α:第一权衡参数,β:第二权衡参数;

其中是一个带有拉格朗日乘子的对角矩阵,并且(12)对应d维最小特征值的广义特征向量是最优解。

所述类内/类间离散度m,如下式所示:

m=msame-mdiff=diag(ms,same,mt,same)-diag(ms,diff,mt,diff)

式中:msame:源域和目标域中同类最远样本对之间的距离矩阵msame=diag(ms,same,mt,same);mdiff:源域和目标域中不同类最近样本对之间的距离矩阵mdiff=diag(ms,diff,mt,diff);ms,same:源域中同类最远样本对之间的距离矩阵;mt,same:目标域中同类最远样本对之间的距离矩阵;ms,diff:源域中不同类最近样本对之间的距离矩阵;mt,diff:目标域中不同类最近样本对之间的距离矩阵。

毫无疑问,本发明提供的判别转移特征学习可以通过核化应用于非线性场景。将转换φ视为一个核映射:x→φ(x)以提高技术的适应能力并且定义源和目标数据的核矩阵为

通过应用表示定理,(11)相应的非线性规范表示为:

与(11)相似,(13)可以通过使用广义特征分解方法解出。

c、标签一致性,即为步骤s3、基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签,包括:

考虑到伪标签推断步骤中域间和域内数据之间的标签一致性,本发明提出一种有效的标签细化方法,以提高目标数据预测的准确性,进而使得源域和目标域的类分布对齐更加准确。

1)源域和目标域之间的标签一致性

在变换后的特征空间中,源分类器将更准确地预测更接近源域的目标样本。换句话说,与源域非常相似的源数据和目标数据的标签应该具有一致性。因此,为这些靠近源域的目标数据分配更大的权重,为远离源域的这些目标样本赋予更小的权重。权重意味着每个目标样本与源域之间的一致性程度,也就是描述了对源分类器给出的目标伪标签的置信度。

本发明利用该目标样本到域分类器的欧几里德距离,有效地测量每个目标样本和源域的接近程度,基于测量出的距离,可以相应地计算所有目标数据的权重。

实际上,在许多场景中,简单的线性函数不能很好地区分源域和目标域,所以可以训练多个类域分类器来分出源域的单类和整个目标域,因为这种方式可以使目标数据的权重更加可区分。在学习到的特征空间中,将分出源域的第c类和目标域的域分类器表示为则伪第c类目标数据之间的距离为然后使用单调递减函数计算的权重:

其中η是一个比例参数,且是一个用于平衡不同类别所产生的影响的系数。因此,源域和目标域之间标签一致性的表述可以表示为:

其中fs(zti)是源分类器对zti的预测,ft(zti)是预期的实际目标标签。显然,(15)的解决方案考虑不全面,还应该考虑目标域的结构信息。

2)目标域内的标签一致性

为了充分探索嵌入空间中目标数据的几何信息,本发明期望在目标域内相近的目标数据的标签是一致的。

借助流形正则化定理,可以将其引入标签一致性损失函数中:

其中bij用于衡量zti和ztj之间相似度。本发明中采用二元权重策略来定义bij,如果zti是ztj的p近邻邻居,则权重为1。

将(15)和(16)结合为一个损失函数,如下式所示:

其中ρ是一个权衡参数,用于平衡域间和域内标签一致性的影响。

值得注意的是,当权重很大时,(17)中的第一项期望zti的最终预测ft(zti)接近fs(zti)。但是如果很小,ft(zti)可能会与fs(zti)不同。(17)中的第二项是经典的流形正则化,旨在探索目标数据的内在几何结构。引入流形正则化使得本发明提供的方法能够将具有较大权重的数据的目标标签平滑地传播到具有较小权重的数据。

3)标签一致性优化

为简单起见,我们定义:

式中,l是目标域内构建的拉普拉斯矩阵,定义为l=d-b,其中d是的对角矩阵。

基于上述定义将(17)重写为:

式中:ft:各目标数据的实际标签;fs:源分类器对各目标数据预测的伪标签;λ:权重矩阵;ρ:第四权衡参数;l:目标数据的图拉普拉斯矩阵;ft的转置矩阵。

假设预期目标域分类器为ft(z)=wtz,,并设置(18)关于w的导数置为0,则可以得到(18)的最优解:

式中:w*:细化标签的最优解;λ:权重矩阵;ρ:第四权衡参数;l:目标数据的图拉普拉斯矩阵:zt:目标数据的投影;fs:源分类器对各目标数据预测的伪标签;zt的转置矩阵。

然后,zti的细化标签通过标签一致性导出:ft(zt1)=(w*)tzti。

显然,参数ρ对于平衡(18)中的两个部分非常重要。一旦获得ft(z),根据目标域分类器ft(z)在已标注的源数据上的表现,可以从[10(-5),10(-4),…,104,105]的序列中自动获取ρ。

实际上,在本发明中,投影特征空间的使用不仅消除了保留判别信息的域移位,同时更好地利用域间和域内数据的标签一致性,进而有效地细化目标伪标签。更加精确的目标标签提供给下一轮转移特征学习,整个框架以正反馈方式迭代进行。

实施例2

在迁移学习中,提取域不变特征以减少源域和目标域之间的差异是比较常见的做法,这样源域上有价值的信息可以被有效地转移到目标域中。但是通过最小化表征源域和目标域分布差异的距离度量(例如最大平均差异mmd)学习到的特征已经被扭曲,很有可能会出现失真的现象。特征失真可能会较大地损失从源域转移到目标域的内在类别结构信息,从而降低目标识别的准确率。因此,学习到的特征应该不仅仅具有域不变性,还应该具有类判别性。

为了实现这一目标,本发明提出了损失项,对于源域和目标域的每个样本,该损失项惩罚其同类最远的数据对和异类最近的数据对。该方案旨在发现并优化两个域中每个样本的同类最远和异类最近数据对,从而达到在学习到的特征空间中聚集同类,分散异类的目的。损失项的提出是本发明与上述方法在特征提取阶段最大的不同之处。

此外,近些年来,许多现有基于特征提取的方法使用了目标域上的伪标签。这些方法中的大多数仅使用源分类器预测目标域伪标签以进一步减少两个域的类分布差异。然而,用于跨域类分布对齐的目标伪标签无疑是一把双刃剑,保证目标伪标签的正确性对于学习理想的域不变特征至关重要。大多数现有方法忽略了在一个框架中同时优化转移特征学习和细化目标伪标签,因此它们不太可能实现两者在迭代学习过程中相互促进以提高最终性能的效果。

为了减轻不准确的目标伪标签所带来的副作用,本发明提供的方法在每次迭代过程中,同时利用源和目标域之间和域内的标签一致性来细化目标伪标签。更加精确的目标标签将在下一次迭代过程中反馈到转移特征学习步骤中,整个框架以正反馈方式迭代进行。

综上,判别性转移特征学习和目标标签细化将在正反馈循环中相互补充促进,进而促进类分布的对齐,同时获得优越的性能。本发明将判别性转移特征学习和目标标签细化结合为一个框架的最先进方法之一。

基于上述思路,本实施例提供了下列具体实施例:

输入:源数据及对应的标签:{xs,ys};目标数据:{xt};

子空间的维数:d;

迭代次数:t;

权衡参数:α,β,η

输出:目标域分类器ft。

步骤1:通过式(2)构建mmd矩阵;

步骤2:初始化

步骤3:通过解决(12)中广义特征分解问题得到投影矩阵p;

步骤4:[zs,zt]=[ptxs,ptxt];

步骤5:使用{zs,ys}训练一个标准1-nn源分类器fs并预测目标伪标签

步骤6:通过式(15)训练c个类域分类器计算权重矩阵λ并构造目标数据的图

拉普拉斯矩阵l;

步骤7:根据式(19)获得细化后的目标域分类器ft;

步骤8:更新w,m;

步骤9:判断是否达到最大迭代次数,如果达到最大迭代次数,则输出当前目标域分类器,否则返回步骤3。

如图4所示为现有的图像样本集,包括:亚马逊amazon、网络摄像机webcam、加州理工学院caletch、生命科技与生命起源dslr、人脸数据集cmu-pie、可视化数据库imagenet和voc2007等,在图4中仅展示了亚马逊amazon、网络摄像机webcam、加州理工学院caletch以及生命科技与生命起源dslr中的耳机类、台式电脑类、水杯类和书包类。在人脸数据集cmu-pie展示测试者在不同姿势下的人脸图像,其中c05、c07、c09、c27和c29表示不同类;在可视化数据库imagenet和voc2007中也展示了6中不同的类。

图5中具体例举了本实施例中采用的数据集dataset包括:办公软件office-10(surf/decaf6)、caltech-10(surf/decaf6)、office-31、可视化数据库imagenet、人脸数据集cmu-pie和voc2007,其中surf表示在数据集上的surf特征提取,decaf6表示在数据集上的decaf6特征提取,并例举了上述数据集中对应的特征feature、类class、领域domain和样本数sample;其中在领域domain中a=amazon,c=caltech,d=dslr,w=webcam,i=imagetnet,v=voc2007。

如图6-图12所示,本实施例在通用的数据集上进行跨域基准实验,包括:cmu-pie、office-31(decaf7)、office-10+caltech-10(surf和decaf6)和imagetnet+voc2007上运行的结果(decaf7表示在数据集上的decaf7特征提取),其中:任务\方法(task\method),首先在上述数据集中选择不同的源域和目标域,其次采用现有的迁移学习方法为目标域中的样本数据进行分类,然后获得每种迁移学习方法对样本数据进行分类的准确率,最后获得每种迁移学习方法准确率的平均值average,通过对比各迁移学习方法分类的准确率可以得到,通过本发明提供的迁移方法提高了目标域识别的准确率。

本发明提出了一种新颖的领域自适应迁移特征学习与标签一致性技术来解决视觉域适应问题,该方法将保留了类判别信息的域不变特征学习和具有标签一致性的目标标签细化结合到一个通用框架中,这两个步骤可以自适应地互相补充促进,有利于有效信息转移,具体包括:

1)本方法同时解决视觉域适应的两个关键问题:首先,学习到的域不变特征表示应该具备类判别信息来弥补特征失真的副作用;其次,目标伪标签应该被精确化,用以探索目标数据背后的有价值的信息。

2)对于判别转移特征学习,本发明提出了一种直观有效的损失项来优化两个域中同类数据对的最近距离和异类数据对的最远距离,这将最大化类内紧凑性和类间散度,每次迭代过程中的最优投影可以通过广义特征值问题求解。

3)对于目标伪标签细化,利用所提出的域分类器和目标域的几何信息,从域间/域内角度探索源和目标数据的标签一致性信息。

4)在五个前沿通用的跨域基准(包括cmu-pie,office-31(decaf7),office+caltech10(surf和decaf6)和imagetnet+voc2007)上进行的大量实验结果证明了本发明所提出的技术相对于其他先进的域适应方法的优越性。值得注意的是,对于cmu-pie数据集而言,本方法的平均准确率领先最佳基线dicd12.7%。而且,当使用深度特征时,领域自适应迁移特征学习与标签一致性技术甚至可以与最先进的深度方法相媲美。

实施例3

基于同一发明构思,本实施例还提供了一种领域自适应迁移特征系统,包括:

初始模块,用于基于源域和目标域为mmd矩阵和类内/类间离散度设初值,并设置最大迭代次数;

判别转移特征学习模块,用于基于所述mmd矩阵和类内/类间离散度优化源分类器,并基于优化后的源分类器确定目标数据对应的伪标签;

标签一致性模块,用于基于所述源域、目标域以及目标数据对应的伪标签,获得目标分类器,并基于所述目标分类器细化目标数据对应的伪标签;

迭代求解模块,用于根据细化后的伪标签更新mmd矩阵和类内/类间离散度,重复执行步骤s2和步骤s3直到达到所述最大迭代次数,将所述目标数据对应的伪标签设定为目标数据对应的标签;

其中,所述源域包括多个源数据,所述源数据包括图像和图像对应的标签;

所述目标域包括多个目标数据,所述目标数据包括图像。

优选的,所述判别转移特征学习模块,包括:

构建损失项单元,用于基于所述mmd矩阵和类内/类间离散度构建所述源域和目标域在转移特征学习过程中的损失项;

求解损失项单元,用于对所述损失项求最优解,获得线性域不变投影;

投影单元,用于基于所述线性域不变投影获得源数据和目标数据的投影;

训练单元,用于基于源数据的投影和所述源数据对应的标签训练得到源数据分类器;

确定伪标签单元,用于基于所述目标数据的投影和所述源数据分类器确定目标数据对应的伪标签。

本实施例中缩略语和关键术语定义:

da:domainadaptation域自适应;

mmd:maximunmeandiscrepancy最大平均差异,用于度量两个分布之间的相似性;

cmu-pie,office-31(decaf7),office+caltech10(surf和decaf6)和imagetnet+voc2007:是本实施例中实验所采用的现有的数据集;

kmm:kernelmeanmatching核均值匹配方法,旨在使加权后的源域和目标域的概率分布尽可能相近;

rkhs:reproducingkernelhilbertspace再生核希尔伯特空间;

1-nn:最近邻分类器,它将点x分配给特征空间中其最近邻居的类;

pca:principalcomponentanalysis主成分分析方法;

gfk:geodesicflowkernelforunsuperviseddomainadaptation用于无监督域应的测地线流核方法;

tca:domainadaptationviatransfercomponentanalysis迁移成分分析的域适应方法;

jda:transferfeaturelearningwithjointdistributionadaptation联合分布匹配的转移特征学习方法;

sa:unsupervisedvisualdomainadaptationusingsubspacealignment使用子空间对齐的无监督视觉域适应方法;

lsc:unsuperviseddomainadaptationwithlabelandstructuralconsistency利用标签结构一致性的无监督域适应方法;

dip:unsuperviseddomainadaptationbydomaininvariantprojection利用域不变投影的无监督域适应方法;

ot-gl:optimaltransportfordomainadaptation域适应的最佳传递方法;

dtsl:discriminativetransfersubspacelearningvialow-rankandsparserepresentation通过低秩和稀疏表示的判别性转移子空间学习方法;

rtml:robusttransfermetriclearningforimageclassification用于图像分类的具有鲁棒性的传递度量学习方法;

dicd:域不变性和类判别性特征提取方法;

jgsa:jointgeometricalandstatisticalalignmentforvisualdomainadaptation用于视觉域适应的联合几何和统计对齐方法;

ldada:anembarrassinglysimpleapproachtovisualdomainadaptation用于视觉域适应的简单方法;

dtlc:discriminativetransferfeaturelearningandlabelconsistencyforvisualdomainadaptation用于视觉域适应上的判别性转移特征学习和标签一致性方法;

tjm:transferjointmatchingforunsuperviseddomainadaptation用于无监督域适应的转移联合匹配方法;

ducda:deepunsupervisedconvolutionaldomainadaptation深度无监督卷积域适应方法;

dcoral:deepcoral:correlationalignmentfordeepdomainadaptation深度域适应的相关性对齐方法;

rtn:unsuperviseddomainadaptationwithresidualtransfernetworks残差网络的无监督域自适应方法;

ddc:deepdomainconfusion:maximizingfordomaininvariance通过最大化域不变性实现的深度域混淆方法;

dan:learningtransferablefeatureswithdeepadaptationnetworks利用深度适应网络的可转移特征学习方法;

prda:predictionreweightingfordomainadaptation用于域适应的期望重加权方法。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1