可迁移的图像识别方法及装置与流程

文档序号:29403942发布日期:2022-03-26 10:09阅读:102来源:国知局
可迁移的图像识别方法及装置与流程

1.本发明涉及图像识别技术领域,尤其涉及一种可迁移的图像识别方法及装置。


背景技术:

2.可迁移的图像识别是指在进行图像识别时,利用分布相似但不同的已标注图像来指导当前无标签的图像进行准确识别的技术。大数据时代下,分析数据中隐含的价值信息来指导人们的生活和生产已成为一个良性的发展趋势。但在现实场景下,收集到大量无标签的数据非常容易,而在某些任务上进行准确的人工标注是非常耗时耗力的,比如对大规模的传感器图像的准确标注。在这种限制下,可以借助已有标注图像,利用标注图像和欲识别图像分布之间的相似性,指导当前图像识别的任务。例如,传感器a和b采集的是相同任务的图像,且传感器a的图像(一般称为源域图像)已被标注,由于传感器a和b中采集的图像类别相同,传感器b可以借助传感器a已经标注数据进行有效的图像识别,而不用为传感器b得到的数据进行大规模的标注。但是由于传感器a和b设备内部构造等的不同,两者收集到的图像数据存在着分布差异,那么如何在图像分布差异存在的情况下,实现对传感器b收集到的图像(一般称为目标域图像)进行准确识别是当前可迁移图像识别问题中的一个难点。
3.传统方法:在传感器收集的数据上进行准确的标注,重新训练一个模型,将模型用以图像识别任务,但是此过程产生昂贵人力浪费,且在大数据背景下,对所有收集到的数据进行准确的人工标注极其不现实。


技术实现要素:

4.为克服相关技术中存在的问题,本发明提供一种可迁移的图像识别方法及装置。
5.根据本发明实施例的第一方面,提供一种可迁移的图像识别方法,方法包括:确定输入图像识别模型的图像类型,其中,所述图像类型包括有标签的源域图像和无标签的目标域图像,所述图像识别模型包括特征提取器、类别预测器和域判别器;当输入的图像为有标签的源域图像时,使所述有标签的源域图像通过所述特征提取器和类别预测器,并确定交叉熵损失;当输入的图像为无标签的目标域图像时,使所述目标域图像通过所述特征提取器和域判别器,同时通过所述特征提取器和类别预测器;根据所述域判别器的输出结果和所述目标域图像与每一个源域图像的中心点的相似度确定对抗损失;根据所述类别预测器的输出结果确定信息最大化损失;根据所述交叉熵损失、所述对抗损失和所述信息最大化损失优化所述图像识别模型。
6.在一个实施例中,优选地,所述方法还包括:获取欲识别的目标图像;根据所述图像识别模型对所述目标图像进行识别,以确定所述目标图像的所属类
别。
7.在一个实施例中,优选地,采用以下第一公式计算所述交叉熵损失:其中,ds表示所有源域图像,l
ce
(ds)表示所有源域图像的交叉熵损失,e表示期望,xs表示源域图像的特征,ys表示源域图像的标签类别,表示指示函数,σ表示softmax函数,log表示log函数,表示源域图像的特征通过所述特征提取器和类别预测器后的输出结果,k表示图像总类别数。
8.在一个实施例中,优选地,根据所述域判别器的输出结果和所述目标域图像与每一个源域图像的中心点的相似度确定对抗损失,包括:根据所述域判别器的输出结果确定最初的对抗损失,其中,采用以下第二计算公式计算所述最初的对抗损失:其中,l
d_initial
(di)表示第i个目标域图像的最初的对抗损失,di表示第i个目标域图像,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经过域判别器的输出结果,该域判别器输出结果相当于是一个二元分类问题,di表示第i个目标域图像的二元标签,用来表示这个目标域图像属于源域还是目标域,最大化l
d_initial
(di),使得域判别器进行特征级别的对齐;通过特征提取器输出的所有源域图像的特征确定每个类别的图像的聚类中心,其中,采用以下第三计算公式计算所述聚类中心;其中,ck表示第k个类别的图像的聚类中心,xs表示源域图像s的特征,ys表示源域图像s的标签类别,ds表示所有源域图像,表示指示函数,g(xs)表示源域图像s的特征经过特征提取器之后输出的特征;计算每个目标域图像和与其距离最近的聚类中心之间的相似度,将所述相似度作为所述目标域图像的最初的对抗损失的权重,其中,采用以下第四计算公式计算所述权重;其中,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,d
f 表示cosine相似
度,ck表示第k个类别的图像的聚类中心,x
t
表示第i个目标域图像的特征;根据所述最初的对抗损失和与其对应的权重,计算所述目标域图像对应的对抗损失,其中,采用以下第五计算公式计算所述对抗损失:其中,ld(di)表示第i个目标域图像的对抗损失,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经过域判别器的输出结果,di表示第i个目标域图像的二元标签。
9.在一个实施例中,优选地,根据所述类别预测器的输出结果确定信息最大化损失,包括:根据所述类别预测器的输出结果计算目标域图像的熵最小化损失和类平均熵最大化损失;根据所述熵最小化损失和类平均熵最大化损失计算所述信息最大化损失;其中,采用以下第六计算公式计算所述熵最小化损失:其中,l
ent (d
t
)表示所述熵最小化损失,d
t
表示所有目标域图像,σ表示softmax函数,h(g(x
t
))表示目标域图像经过特征提取器,再经过标签预测器之后的输出结果,k表示图像总类别数,e表示期望,x
t
表示目标域图像;采用以下第七计算公式计算所述类平均熵最大化损失:其中,l
div
(d
t
)表示所述类平均熵最大化损失,表示所有类别为k的样本经softmax之后的平均概率向量;其中,采用以下第八计算公式计算所述信息最大化损失:l
im = l
ent + l
div
l
im
表示所述信息最大化损失,l
ent (d
t
)表示所述熵最小化损失,l
div
(d
t
)表示所述类平均熵最大化损失。
10.在一个实施例中,优选地,根据所述交叉熵损失、所述对抗损失和所述信息最大化损失优化所述图像识别模型,包括:根据所述交叉熵损失、所述对抗损失和所述信息最大化损失确定模型最终损失,其中,采用以下第九计算公式计算所述模型最终损失:
l = l
ce (ds)
ꢀ‑ꢀ
ld(d
t
) + βl
im
l表示所述模型最终损失,l
ce (ds)表示所述交叉熵损失,ld(d
t
)表示所述对抗损失,l
im
表示所述信息最大化损失,β表示均衡参数。
11.根据本发明实施例的第二方面,提供一种可迁移的图像识别装置,包括:第一确定模块,用于确定输入图像识别模型的图像类型,其中,所述图像类型包括有标签的源域图像和无标签的目标域图像,所述图像识别模型包括特征提取器、类别预测器和域判别器;第一处理模块,用于当输入的图像为有标签的源域图像时,使所述有标签的源域图像通过所述特征提取器和类别预测器,并确定交叉熵损失;第二处理模块,用于当输入的图像为无标签的目标域图像时,使所述目标域图像通过所述特征提取器和域判别器,同时通过所述特征提取器和类别预测器;第二确定模块,用于根据所述域判别器的输出结果和所述目标域图像与每一个源域图像的中心点的相似度确定对抗损失;第三确定模块,用于根据所述类别预测器的输出结果确定信息最大化损失;优化模块,用于根据所述交叉熵损失、所述对抗损失和所述信息最大化损失优化所述图像识别模型。
12.在一个实施例中,优选地,所述装置还包括:获取模块,用于获取欲识别的目标图像;识别模块,用于根据所述图像识别模型对所述目标图像进行识别,以确定所述目标图像的所属类别。
13.在一个实施例中,优选地,采用以下第一公式计算所述交叉熵损失:其中,ds表示所有源域图像,l
ce
(ds)表示所有源域图像的交叉熵损失,e表示期望,xs表示源域图像的特征,ys表示源域图像的标签类别,表示指示函数,σ表示softmax函数,log表示log函数,表示源域图像的特征通过所述特征提取器和类别预测器后的输出结果,k表示图像总类别数。
14.在一个实施例中,优选地,所述第二确定模块用于:根据所述域判别器的输出结果确定最初的对抗损失,其中,采用以下第二计算公式计算所述最初的对抗损失:其中,l
d_initial
(di)表示第i个目标域图像的最初的对抗损失,di表示第i个目标域图像,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经
过域判别器的输出结果,该域判别器输出结果相当于是一个二元分类问题,di表示第i个目标域图像的二元标签,用来表示这个目标域图像属于源域还是目标域,最大化l
d_initial
(di),使得域判别器进行特征级别的对齐;通过特征提取器输出的所有源域图像的特征确定每个类别的图像的聚类中心,其中,采用以下第三计算公式计算所述聚类中心;其中,ck表示第k个类别的图像的聚类中心,xs表示源域图像s的特征,ys表示源域图像s的标签类别,ds表示所有源域图像,表示指示函数,g(xs)表示源域图像s的特征经过特征提取器之后输出的特征;计算每个目标域图像和与其距离最近的聚类中心之间的相似度,将所述相似度作为所述目标域图像的最初的对抗损失的权重,其中,采用以下第四计算公式计算所述权重;其中,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,d
f 表示cosine相似度,ck表示第k个类别的图像的聚类中心,x
t
表示第i个目标域图像的特征;根据所述最初的对抗损失和与其对应的权重,计算所述目标域图像对应的对抗损失,其中,采用以下第五计算公式计算所述对抗损失:其中,ld(di)表示第i个目标域图像的对抗损失,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经过域判别器的输出结果,di表示第i个目标域图像的二元标签;所述第三确定模块用于:根据所述类别预测器的输出结果计算目标域图像的熵最小化损失和类平均熵最大化损失;根据所述熵最小化损失和类平均熵最大化损失计算所述信息最大化损失;其中,采用以下第六计算公式计算所述熵最小化损失:其中,l
ent (d
t
)表示所述熵最小化损失,d
t
表示所有目标域图像,σ表示softmax函数,h(g(x
t
))表示目标域图像经过特征提取器,再经过标签预测器之后的输出结果,k表示图像总类别数,e表示期望,x
t
表示目标域图像;
采用以下第七计算公式计算所述类平均熵最大化损失:其中,l
div
(d
t
)表示所述类平均熵最大化损失,表示所有类别为k的样本经softmax之后的平均概率向量;其中,采用以下第八计算公式计算所述信息最大化损失:l
im = l
ent + l
div
l
im
表示所述信息最大化损失,l
ent (d
t
)表示所述熵最小化损失,l
div
(d
t
)表示所述类平均熵最大化损失;所述优化模块用于:根据所述交叉熵损失、所述对抗损失和所述信息最大化损失确定模型最终损失,其中,采用以下第九计算公式计算所述模型最终损失:l = l
ce (ds)
ꢀ‑ꢀ
ld(d
t
) + βl
im
l表示所述模型最终损失,l
ce (ds)表示所述交叉熵损失,ld(d
t
)表示所述对抗损失,l
im
表示所述信息最大化损失,β表示均衡参数。
15.根据本发明实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面中任一项方法的步骤。
16.本发明的实施例提供的技术方案可以包括以下有益效果:本发明提出了一种基于加权对抗和信息最大化的可迁移图像识别方法,本发明的技术方案和以往的方法相比,不仅利用加权对抗损失来优化特征提取器模块,而且也利用交叉熵损失和信息最大化损失来优化标签预测器模块,可以有效地提高目标图像识别的性能,并有效减少对于目标图像识别的标注,大量减少人力物力。
17.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
18.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
19.图1是根据一示例性实施例示出的一种可迁移的图像识别方法的流程图。
20.图2是根据一示例性实施例示出的可迁移的图像识别方法的示意图。
21.图3是根据一示例性实施例示出的另一种可迁移的图像识别方法的流程图。
22.图4是根据一示例性实施例示出的一种可迁移的图像识别装置的框图。
23.图5是根据一示例性实施例示出的一种可迁移的图像识别装置的框图。
具体实施方式
24.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及
附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
25.图1是根据一示例性实施例示出的一种可迁移的图像识别方法的流程图,如图1所示,该方法包括:步骤s101,确定输入图像识别模型的图像类型,其中,所述图像类型包括有标签的源域图像和无标签的目标域图像,所述图像识别模型如图2所示,包括特征提取器、类别预测器和域判别器;步骤s102,当输入的图像为有标签的源域图像时,使所述有标签的源域图像通过所述特征提取器和类别预测器,并确定交叉熵损失;步骤s103,当输入的图像为无标签的目标域图像时,使所述目标域图像通过所述特征提取器和域判别器,同时通过所述特征提取器和类别预测器;步骤s104,根据所述域判别器的输出结果和所述目标域图像与每一个源域图像的中心点的相似度确定对抗损失;步骤s105,根据所述类别预测器的输出结果确定信息最大化损失;步骤s106,根据所述交叉熵损失、所述对抗损失和所述信息最大化损失优化所述图像识别模型。
26.本发明提出了一种基于加权对抗和信息最大化的可迁移图像识别方法,本发明的技术方案和以往的方法相比,不仅利用加权对抗损失来优化特征提取器模块,而且也利用交叉熵损失和信息最大化损失来优化标签预测器模块,可以有效地提高目标图像识别的性能,并有效减少对于目标图像识别的标注,大量减少人力物力。
27.图3是根据一示例性实施例示出的另一种可迁移的图像识别方法的流程图。
28.如图3所示,在一个实施例中,优选地,所述方法还包括:步骤s301,获取欲识别的目标图像;步骤s302,根据所述图像识别模型对所述目标图像进行识别,以确定所述目标图像的所属类别。
29.在一个实施例中,优选地,采用以下第一公式计算所述交叉熵损失:其中,ds表示所有源域图像,l
ce
(ds)表示所有源域图像的交叉熵损失,e表示期望,xs表示源域图像的特征,ys表示源域图像的标签类别,表示指示函数,σ表示softmax函数,log表示log函数,表示源域图像的特征通过所述特征提取器和类别预测器后的输出结果,k表示图像总类别数。
30.在一个实施例中,优选地,根据所述域判别器的输出结果和所述目标域图像与每一个源域图像的中心点的相似度确定对抗损失,包括:
根据所述域判别器的输出结果确定最初的对抗损失,其中,采用以下第二计算公式计算所述最初的对抗损失:其中,l
d_initial
(di)表示第i个目标域图像的最初的对抗损失,di表示第i个目标域图像,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经过域判别器的输出结果,该域判别器输出结果相当于是一个二元分类问题,di表示第i个目标域图像的二元标签,用来表示这个目标域图像属于源域还是目标域,最大化l
d_initial
(di),使得域判别器进行特征级别的对齐;通过特征提取器输出的所有源域图像的特征确定每个类别的图像的聚类中心,其中,采用以下第三计算公式计算所述聚类中心;其中,ck表示第k个类别的图像的聚类中心,xs表示源域图像s的特征,ys表示源域图像s的标签类别,ds表示所有源域图像,表示指示函数,g(xs)表示源域图像s的特征经过特征提取器之后输出的特征;计算每个目标域图像和与其距离最近的聚类中心之间的相似度,将所述相似度作为所述目标域图像的最初的对抗损失的权重,其中,采用以下第四计算公式计算所述权重;其中,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,d
f 表示cosine相似度,ck表示第k个类别的图像的聚类中心,x
t
表示第i个目标域图像的特征;根据所述最初的对抗损失和与其对应的权重,计算所述目标域图像对应的对抗损失,其中,采用以下第五计算公式计算所述对抗损失:其中,ld(di)表示第i个目标域图像的对抗损失,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经过域判别器的输出结果,di表示第i个目标域图像的二元标签。
31.在一个实施例中,优选地,根据所述类别预测器的输出结果确定信息最大化损失,包括:根据所述类别预测器的输出结果计算目标域图像的熵最小化损失和类平均熵最大化损失;根据所述熵最小化损失和类平均熵最大化损失计算所述信息最大化损失;
其中,采用以下第六计算公式计算所述熵最小化损失:其中,l
ent (d
t
)表示所述熵最小化损失,d
t
表示所有目标域图像,σ表示softmax函数,h(g(x
t
))表示目标域图像经过特征提取器,再经过标签预测器之后的输出结果,k表示图像总类别数,e表示期望,x
t
表示目标域图像;采用以下第七计算公式计算所述类平均熵最大化损失:其中,l
div
(d
t
)表示所述类平均熵最大化损失,表示所有类别为k的样本经softmax之后的平均概率向量;其中,采用以下第八计算公式计算所述信息最大化损失:l
im = l
ent + l
div
l
im
表示所述信息最大化损失,l
ent (d
t
)表示所述熵最小化损失,l
div
(d
t
)表示所述类平均熵最大化损失。
32.在一个实施例中,优选地,根据所述交叉熵损失、所述对抗损失和所述信息最大化损失优化所述图像识别模型,包括:根据所述交叉熵损失、所述对抗损失和所述信息最大化损失确定模型最终损失,其中,采用以下第九计算公式计算所述模型最终损失:l = l
ce (ds)
ꢀ‑ꢀ
ld(d
t
) + βl
im
l表示所述模型最终损失,l
ce (ds)表示所述交叉熵损失,ld(d
t
)表示所述对抗损失,l
im
表示所述信息最大化损失,β表示均衡参数。
33.图4是根据一示例性实施例示出的一种可迁移的图像识别装置的框图。
34.如图4所示,根据本发明实施例的第二方面,提供一种可迁移的图像识别装置,包括:第一确定模块41,用于确定输入图像识别模型的图像类型,其中,所述图像类型包括有标签的源域图像和无标签的目标域图像,所述图像识别模型包括特征提取器、类别预测器和域判别器;第一处理模块42,用于当输入的图像为有标签的源域图像时,使所述有标签的源域图像通过所述特征提取器和类别预测器,并确定交叉熵损失;第二处理模块43,用于当输入的图像为无标签的目标域图像时,使所述目标域图像通过所述特征提取器和域判别器,同时通过所述特征提取器和类别预测器;
第二确定模块44,用于根据所述域判别器的输出结果和所述目标域图像与每一个源域图像的中心点的相似度确定对抗损失;第三确定模块45,用于根据所述类别预测器的输出结果确定信息最大化损失;优化模块46,用于根据所述交叉熵损失、所述对抗损失和所述信息最大化损失优化所述图像识别模型。
35.图5是根据一示例性实施例示出的一种可迁移的图像识别装置的框图。
36.如图5所示,在一个实施例中,优选地,所述装置还包括:获取模块51,用于获取欲识别的目标图像;识别模块52,用于根据所述图像识别模型对所述目标图像进行识别,以确定所述目标图像的所属类别。
37.在一个实施例中,优选地,采用以下第一公式计算所述交叉熵损失:其中,ds表示所有源域图像,l
ce
(ds)表示所有源域图像的交叉熵损失,e表示期望,xs表示源域图像的特征,ys表示源域图像的标签类别,表示指示函数,σ表示softmax函数,log表示log函数,表示源域图像的特征通过所述特征提取器和类别预测器后的输出结果,k表示图像总类别数。
38.在一个实施例中,优选地,所述第二确定模块用于:根据所述域判别器的输出结果确定最初的对抗损失,其中,采用以下第二计算公式计算所述最初的对抗损失:其中,l
d_initial
(di)表示第i个目标域图像的最初的对抗损失,di表示第i个目标域图像,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经过域判别器的输出结果,该域判别器输出结果相当于是一个二元分类问题,di表示第i个目标域图像的二元标签,用来表示这个目标域图像属于源域还是目标域,最大化l
d_initial
(di),使得域判别器进行特征级别的对齐;通过特征提取器输出的所有源域图像的特征确定每个类别的图像的聚类中心,其中,采用以下第三计算公式计算所述聚类中心;其中,ck表示第k个类别的图像的聚类中心,xs表示源域图像s的特征,ys表示源域图像s的标签类别,ds表示所有源域图像,表示指示函数,g(xs)表示源域图像s的特征经过
特征提取器之后输出的特征;计算每个目标域图像和与其距离最近的聚类中心之间的相似度,将所述相似度作为所述目标域图像的最初的对抗损失的权重,其中,采用以下第四计算公式计算所述权重;其中,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,d
f 表示cosine相似度,ck表示第k个类别的图像的聚类中心,x
t
表示第i个目标域图像的特征;根据所述最初的对抗损失和与其对应的权重,计算所述目标域图像对应的对抗损失,其中,采用以下第五计算公式计算所述对抗损失:其中,ld(di)表示第i个目标域图像的对抗损失,w
t
表示第i个目标域图像的最初的对抗损失对应的权重,x
t
表示第i个目标域图像的特征,d(g(x
t
))表示第i个目标域图像经过特征提取器再经过域判别器的输出结果,di表示第i个目标域图像的二元标签;所述第三确定模块用于:根据所述类别预测器的输出结果计算目标域图像的熵最小化损失和类平均熵最大化损失;根据所述熵最小化损失和类平均熵最大化损失计算所述信息最大化损失;其中,采用以下第六计算公式计算所述熵最小化损失:其中,l
ent (d
t
)表示所述熵最小化损失,d
t
表示所有目标域图像,σ表示softmax函数,h(g(x
t
))表示目标域图像经过特征提取器,再经过标签预测器之后的输出结果,k表示图像总类别数,e表示期望,x
t
表示目标域图像;采用以下第七计算公式计算所述类平均熵最大化损失:其中,l
div
(d
t
)表示所述类平均熵最大化损失,表示所有类别为k的样本经softmax之后的平均概率向量;其中,采用以下第八计算公式计算所述信息最大化损失:
l
im = l
ent + l
div
l
im
表示所述信息最大化损失,l
ent (d
t
)表示所述熵最小化损失,l
div
(d
t
)表示所述类平均熵最大化损失;所述优化模块用于:根据所述交叉熵损失、所述对抗损失和所述信息最大化损失确定模型最终损失,其中,采用以下第九计算公式计算所述模型最终损失:l = l
ce (ds)
ꢀ‑ꢀ
ld(d
t
) + βl
im
l表示所述模型最终损失,l
ce (ds)表示所述交叉熵损失,ld(d
t
)表示所述对抗损失,l
im
表示所述信息最大化损失,β表示均衡参数。
39.根据本发明实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面中任一项方法的步骤。
40.根据本发明实施例的第四方面,提供一种可迁移的图像识别系统,系统包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为:确定输入图像识别模型的图像类型,其中,所述图像类型包括有标签的源域图像和无标签的目标域图像,所述图像识别模型包括特征提取器、类别预测器和域判别器;当输入的图像为有标签的源域图像时,使所述有标签的源域图像通过所述特征提取器和类别预测器,并确定交叉熵损失;当输入的图像为无标签的目标域图像时,使所述目标域图像通过所述特征提取器和域判别器,同时通过所述特征提取器和类别预测器;根据所述域判别器的输出结果和所述目标域图像与每一个源域图像的中心点的相似度确定对抗损失;根据所述类别预测器的输出结果确定信息最大化损失;根据所述交叉熵损失、所述对抗损失和所述信息最大化损失优化所述图像识别模型。
41.进一步可以理解的是,本发明中“多个”是指两个或两个以上,其它量词与之类似。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、
“”
和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
42.进一步可以理解的是,术语“第一”、“第二”等用于描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开,并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
43.进一步可以理解的是,本发明实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。
44.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其
它实施方案。本技术旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
45.应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1