信息处理装置和信息处理方法与流程

文档序号:32564482发布日期:2022-12-16 16:49阅读:39来源:国知局
信息处理装置和信息处理方法与流程

1.本文公开的实施方式涉及信息处理的技术领域。特别地,本公开内容的实施方式涉及用于不同的域之间的迁移学习的信息处理装置和信息处理方法以及使用所述信息处理方法训练的分类模型。


背景技术:

2.近些年,深度学习在许多机器学习任务及应用中取得了很大的进步。随着越来越多的机器学习应用场景的出现,尽管有监督的机器学习呈现出较好的性能,但是训练需要大量的带标签的样本,然而给样本加标签,即标注样本,是一项耗时费力的工作,所以能够将在某个域(以下称为源域(source domain))中学习到的知识应用到不同但相关的另一域(以下称为目标域(target domain))中的迁移学习(transfer learning)受到越来越多的关注。
3.此外,许多跨域的机器学习任务基于训练样本集合(即源域的带标签的样本的集合)和测试集合(即目标域的无标签的样本的集合)共享相同类别的假设。然而,由于在实际应用中通常存在目标域的样本的类别与源域的样本的类别之间的差异,即存在域间的类别间隙,因此该假设在许多应用场景中并不成立。
4.图1a至图1d示出了关于源域和目标域的类别间隙的各种情况的示意图。在图1a至图1d中,源域可以是照片图像的域,而目标域可以是卡通图像的域。此外,如图1a至图1d中所示,例如,源域和目标域中的图像可以具有四种标签,即四个类别:床(bed)、椅子(chair)、自行车(bike)和叉子(fork)。具体地,图1a示出了被称为闭集域自适应(closed-set domain adaptation:cda)的应用场景,其中目标域的类别与源域的类别完全相同,即目标域的类别是源域的类别的全集,因此不存在类别间隙。图1b示出了部分域自适应(partial domain adaptation:pda)的应用场景,其中目标域的类别是源域的类别的一部分,即目标域的类别是源域的类别的子集,因此在目标域中存在未知的类别(unknown)的样本,即在源域和目标域之间存在类别间隙。图1c示出了开集域自适应(open-set domain adaptation:osda)的应用场景,其中源域的类别是目标域的类别的一部分,即源域的类别是目标域的类别的子集,因此存在在源域和目标域之间类别间隙。图1d示出了开放部分域自适应(open partial domain adaptation:opda)的应用场景,其中目标域的部分类别与源域的部分类别相同,即源域的类别与目标域的类别之间存在交集,因此存在在源域和目标域之间类别间隙。如图1a至图1d中所示,对于适用于迁移学习的应用场景,即使在存在类别间隙的情况下,在源域的类别和目标域的类别之间也应至少存在交集,即相同的共享类别。
5.因此,在现有技术中,仍需要提供一种通用化的用于域间的迁移学习的信息处理技术,其能够针对例如图1a至图1d所示的各种应用场景实现良好的迁移学习性能。


技术实现要素:

6.在下文中将给出关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,这个概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
7.对于上文指出的现有技术中存在的问题,有必要提供一种适用于各种应用场景的通用化的能够实现域间的迁移学习的信息处理技术,用于准确和快速地实现无标签样本的检测。
8.为了实现本公开内容的目的,根据本公开内容的一个方面,提供了一种信息处理装置,用于对分类模型进行训练,该分类模型能够基于第一域的具有标签的第一样本对不同于第一域的第二域的不具有标签的第二样本进行分类,在第二样本的类别与第一样本的类别之间存在相同的共享类别,该信息处理装置包括:聚簇单元,被配置成使第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;多个第一分类单元,每个第一分类单元被配置成基于第一样本的部分类别对经聚簇的第二样本进行分类;以及识别单元,被配置成基于多个第一分类单元的分类结果识别不具有共享类别的第二样本,其中分类模型使用聚簇单元的聚簇结果和识别单元的识别结果进行训练。
9.根据本公开内容的另一方面,提供了一种信息处理方法,用于对分类模型进行训练,该分类模型能够基于第一域的具有标签的第一样本对不同于第一域的第二域的不具有标签的第二样本进行分类,在第二样本的类别与第一样本的类别之间存在相同的共享类别,该信息处理方法包括:使第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;基于第一样本的部分类别对经聚簇的第二样本进行分类;基于分类结果识别不具有共享类别的第二样本;以及使用聚簇结果和识别结果训练分类模型。
10.根据本公开内容的又一方面,还提供了一种使用上文所述的信息处理方法训练的分类模型。
11.根据本公开内容的再一方面,还提供了能够实现上述的信息处理方法的计算机程序。
12.此外,还提供了具有至少计算机可读存储介质形式的计算机程序产品,其上记录有用于实现上述的信息处理方法的计算机程序代码。
13.本公开内容提出了一种新型的用于训练实现迁移学习的分类模型的信息处理技术,通过该信息处理技术训练的分类模型能够针对各种应用场景(具有域间类别间隙或不具有域间类别间隙)实现良好的迁移学习性能,而且较之传统的实现迁移学习的分类模型能够显著提高检测精度。
附图说明
14.参照下面结合附图对本公开内容实施方式的说明,会更加容易地理解本公开内容的以上和其它目的、特点和优点,在附图中:
15.图1a至图1d示出了关于源域和目标域的类别间隙的各种情况的示意图
16.图2示出了根据本公开内容的实施方式的信息处理装置的框图;
17.图3示出了根据本公开内容的实施方式的信息处理装置的结构的示意图;
18.图4示出了根据本公开内容的实施方式的信息处理装置的训练效果的示意图;
19.图5示出了根据本公开内容的实施方式的信息处理装置的训练效果的示意图;
20.图6示出了根据本公开内容的实施方式的信息处理方法的流程图;以及
21.图7示出了用于实现根据本公开内容的实施方式的信息处理方法的通用机器的结构简图。
具体实施方式
22.在下文中,将参照所附的说明性示图详细描述本公开内容的一些实施方式。在用附图标记指示附图的元件时,尽管相同的元件在不同的附图中示出,但相同的元件将由相同的附图标记表示。此外,在本公开内容的以下描述中,在有可能使本公开内容的主题不清楚的情况下,将省略对并入于本文中的已知功能和配置的详细描述。
23.本文中使用的术语仅用于描述特定实施方式的目的,而非旨在限制本公开内容。如本文所使用的,除非上下文另外指出,否则单数形式旨在也包括复数形式。还将理解的是,说明书中使用的术语“包括”、“包含”和“具有”旨在具体说明所陈述的特征、实体、操作和/或部件的存在,但是并不排除一个或更多个其他的特征、实体、操作和/或部件的存在或添加。
24.除非另有定义,否则本文中使用的包括技术术语和科学术语的所有术语具有与本公开内容的发明构思所属领域技术人员通常理解的含义相同的含义。将进一步理解的是,诸如在常用词典中定义的那些术语应该被解释为具有与其在相关领域的上下文中的含义一致的含义,除非在此明确定义否则不应以理想化或过于正式的意义来解释。
25.在下面的描述中,阐述了许多具体细节以提供对本公开内容的全面理解。本公开内容可以在没有这些具体细节中的一些或所有具体细节的情况下实施。在其他示例中,为了避免因不必要的细节而模糊了本公开内容,在附图中仅仅示出了与根据本公开内容的方案密切相关的部件,而省略了与本公开内容关系不大的其他细节。
26.本公开内容所要解决的问题是关于迁移学习的跨域自适应问题,可被称为通用域自适应(universal domain adaptation:unida)问题。在本文中,限定源域(在下文中还可被称为第一域)具有带标签的样本(在下文中还可被称为第一样本),而目标域(在下文中还可被称为第二域)具有无标签的样本(在下文中还可被称为第二样本)。此外,如上文所述,在适用于迁移学习的应用场景中,第二样本的类别与第一样本的类别之间存在共享类别,也就是说,限定目标域中的第二样本的类别中的至少一部分类别与源域中的第一样本的类别中的至少一部分类别相同。此外,在本文中,将目标域中的具有共享类别的第二样本称为已知类别第二样本,而将目标域中的不具有共享类别的第二样本称为未知类别第二样本。
27.为了解决上文所述的现有技术中存在的问题,本文提出了一种用于训练实现迁移学习的分类模型的信息处理技术,通过该信息处理技术训练的分类模型能够针对各种应用场景(具有域间类别间隙或不具有域间类别间隙)实现良好的迁移学习性能,而且较之传统的实现迁移学习的分类模型能够显著提高检测精度。
28.下面结合图2至图5对根据本公开内容的实施方式的信息处理装置200进行详细描述。
29.图2示出了根据本公开内容的实施方式的信息处理装置200的框图。图3示出了根
据本公开内容的实施方式的信息处理装置200的结构的示意图。图4和图5示出了根据本公开内容的实施方式的信息处理装置200的原理的示意图。
30.根据本公开内容的实施方式的信息处理装置200用于对分类模型210进行训练。分类模型210能够基于第一域的具有标签的第一样本对不同于第一域的第二域的不具有标签的第二样本进行分类,在第二样本的类别与第一样本的类别之间存在相同的共享类别。信息处理装置200可以包括:聚簇单元201,被配置成使第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;多个第一分类单元202,每个第一分类单元202被配置成基于第一样本的部分类别对经聚簇的第二样本进行分类;以及识别单元203,被配置成基于多个第一分类单元的分类结果识别不具有共享类别的第二样本。根据本公开内容的实施方式,分类模型210可以使用识别单元203的识别结果进行训练。
31.根据本公开内容的实施方式,第一样本和第二样本可以是图像。也就是说,源域的样本(第一样本)是带标签的图像,而目标域的样本(第二样本)是无标签的图像。本领域技术人员应认识到,尽管本文以图像作为样本的示例描述了本公开内容的示例实施方式,但是本公开内容的范围不限于此。根据本公开内容的教导,本领域技术人员可以设想根据本公开内容的信息处理装置同样可以应用于除了图像处理之外的其他机器学习的应用领域,诸如语音分析、自然语言处理、天气预报等。
32.如上文所述,在unipda问题中,第二样本的具体类别是未知的,需要分类模型210识别第二样本是已知类别第二样本还是未知类别第二样本,并且在第二样本是已知类别第二样本的情况下识别第二样本的具体类别。根据本公开内容的实施方式的信息处理装置200可以对分类模型210进行训练以实现上述功能。
33.根据本公开内容的实施方式,分类模型210可以通过卷积神经网络模型(cnn)实现。鉴于卷积神经网络(cnn)模型对于本领域技术人员而言是已知的,因此为了简洁起见,本文不对其细节进行更详细的描述。
34.具体地,根据本公开内容的实施方式,分类模型210可以包括特征提取单元211和第二分类单元212。特征提取单元211可以提取第一样本和第二样本的特征量。第二分类单元212可以基于第一样本的全部类别对第一样本和第二样本进行分类。
35.作为示例而非限制,如图3所示,特征提取单元211可以使用基于imagenet图像数据库预先训练的resnet-50模型作为主干网来实现。例如,如图3所示,特征提取单元211的输入可以是256
×
256像素的图像,特征提取单元211可以提取表征该图像的特征量,该特征量可以由2048维的向量表示。特别地,根据本公开内容的实施方式,特征提取单元211可以对第二样本进行归一化以便于进行后续处理。鉴于归一化对于本领域技术人员而言是已知的,因此为了简洁起见,本文不对其细节进行更详细的描述。
36.鉴于基于cnn模型实现的分类模型210(包括特征提取单元211和第二分类单元212)的结构对于本领域技术人员而言是已知的,因此为了简洁起见,本文不对其细节进行更详细的描述。
37.根据本公开内容的实施方式,聚簇单元201可以基于特征提取单元211提取的第一样本和第二样本的特征量执行聚簇。根据本公开内容,如图4所示,聚簇单元201执行的聚簇的目的在于使目标域的样本(第二样本)朝向其相邻样本聚集。应注意,在特征空间中,目标域的样本的相邻样本可以是源域的样本(第一样本),也可以是目标域的其他样本(其他第
二样本)。
38.具体地,图4中的(a)示出了聚簇之前的第一样本和第二样本在特征空间中的分布的示意图,而图4中的(b)示出了聚簇之后的第一样本和第二样本在特征空间中的分布的示意图。在图4中,三角形表示源域中的样本(第一样本),而圆形表示目标域中的样本(第二样本)。此外,中空的三角形表示具有共享类别的第一样本,而中空的圆形表示具有共享类别的第二样本。相应地,实心的三角形表示不具有共享类别的第一样本,而实心的圆形表示不具有共享类别的第二样本。
39.如图4中的(b)所示,聚簇单元201的聚簇处理可以使得第二样本中的每个朝向其相邻的第一样本或第二样本聚集以提高区分度。
40.根据本公开内容的实施方式,对于第二样本中的每个,聚簇单元可以基于该样本与其相邻的第一样本或第二样本之间的距离进行聚簇。特别地,根据本公开内容的实施方式,对于第二样本中的每个,聚簇单元可以通过比较该样本与全部第一样本和第二样本之间的距离来确定该样本的相邻样本。
41.例如,假设是特征提取单元211所提取的源域的样本(第一样本)的特征量,其中d是特征向量的维度,ms是源域的样本的数目。相应地,假设是特征提取单元211所提取的目标域的样本(第二样本)的特征量,其中m
t
是目标域的样本的数目。如上文所述,特征量vs和v
t
可以被归一化。特征量vs和v
t
可以被一起表示为对于第i个归一化的目标域的样本的特征第j个特征vj与相邻的概率可以由γ
i,j
表示,其中vj∈v,j≠i。根据本公内容的实施方式,概率γ
i,j
可以通过下式(1)限定:
[0042][0043]
在式(1)中,φ表示特征向量在特征空间中的距离。根据本公开内容的实施方式,该距离可以是余弦距离或欧氏距离。
[0044]
例如,聚簇的损失可以由下式(2)表示。
[0045][0046]
随后,多个第一分类单元202中的每个可以基于第一样本的部分类别对经聚簇的第二样本进行分类。应注意,第一分类单元202与第二分类单元212的区别在于,第一分类单元202仅基于源域的样本的部分类别进行分类,而第二分类单元212基于源域的样本的全部类别进行分类。
[0047]
根据本公开内容的实施方式,多个第一分类单元202的部分类别的数目彼此相同。根据本公开内容的实施方式,多个第一分类单元202的数目等于第一样本的全部类别的数目除以每个第一分类单元202的部分类别的数目。此外,根据本公开内容的实施方式,多个第一分类单元202的部分类别的合集是第一样本的全部类别的全集。
[0048]
例如,假设j是多个第一分类单元202的数目,这样可以将多个第一分类单元202的集合表示为{h1,h2,...,hj}。此外,假设k是源域的样本的类别的数目,即第一样本的标签的数目。这样,对于每个第一分类单元202,可以依次丢弃k/j个类别。此外,假设h表示基于源
域的样本的全部类别进行分类的第二分类单元212。例如,假设第一样本具有6个类别1至类别6,并且存在3个第一分类单元202,这样第一个第一分类单元202可以丢弃类别1和类别2,仅基于类别3至类别6进行分类。此外,第二个第一分类单元202可以丢弃类别3和类别4,仅基于类别1和类别2以及类别5和类别6进行分类。此外,第三个第一分类单元202可以丢弃类别5和类别6,仅基于类别1至类别4进行分类。
[0049]
根据本公开内容的实施方式,识别单元203可以基于多个第一分类单元202的分类结果与第二分类单元212的分类结果之间的差异来识别不具有共享类别的第二样本。
[0050]
根据本公开内容的实施方式,识别单元203可以针对第二样本中的每个样本,对多个第一分类单元202中的、分类结果与第二分类单元212的分类结果不同的第一分类单元202的数目进行计数,以及当所计数的数目大于预设阈值时,确定该第二样本不具有共享类别。
[0051]
例如,可以设定指示函数i(h(g(x)),hj(g(x))),其中x表示第二样本,g(x)表示第二样本的经聚簇的特征量,h(g(x))表示第二分类单元212的分类结果,hj(g(x))表示第j个第一分类单元202的分类结果,其中1≤j≤j。对于每个第二样本x,指示函数i在h(g(x))与hj(g(x))不同时取值为1,否则取值为0。
[0052]
对于第二样本xi,其中1≤xi≤m
t
,可以使用ωi表示该第二样本xi是否是不具有共享类别的第二样本,即未知类别第二样本。具体地,ωi可以由下式(3)限定。如式(3)所示,如果ωi取值为1,则可以认为相应的第二样本xi是不具有共享类别的第二样本。
[0053][0054]
其中β是预设阈值,其取值范围为1/j至1。根据本公开内容的实施方式,预设阈值β可以根据应用场景确定。在这一点上,预设阈值β越大,则说明将第二样本检测为未知类别第二样本的约束就越严格。例如,在涉及金融的领域中,希望对不具有共享类别的第二样本的检测精度尽量高以避免财务损失,则可以将预设阈值β设置为较大。
[0055]
根据本公开内容的实施方式,识别单元203可以如下式(4)所示计算识别的损失
[0056][0057]
其中ρ
i,k
表示第二样本xi被第二分类单元h预测为第k类的概率,其由第二分类单元h输出。通过在分类模型210的训练过程中引入上述聚簇的损失和识别的损失可以提高分类模型210对不具有共享类别的第二样本的识别能力。在这一点上,使用多个第一分类单元201的目的在于识别不具有共享类别的第二样本。
[0058]
具体地,图5中的(a)示出了基于第一样本的全部类别的第二分类单元212的基于熵的分布。如本领域技术人员已知的,分类结果的确定性越高,则熵越小,反之则越大。例如,熵可以由下式(5)表示。
[0059]
[0060]
在理想情况下,希望不具有共享类别的第二样本处于熵最大的位置处,即不属于第一样本的任何类别。然而,由于初值的设置等原因,如图5中的(a)所示,某些不具有共享类别的第二样本可能没有处于熵最大的位置处。根据本公开内容,通过引入多个第一分类单元202去除部分第一样本的部分类别以引入新的约束条件,可以调整不具有共享类别的第二样本的熵分布,从而能够更准确地检测不具有共享类别的第二样本。例如,如图5的(b)所示,通过去除左下角处的第一样本的类别,可以使得右上角处的不具有共享类别的第二样本处于熵最大的位置处,从而提高分类精度。
[0061]
根据本公开内容的信息处理技术训练的分类模型能够针对各种应用场景(具有域间类别间隙或不具有域间类别间隙)实现良好的迁移学习性能,而且较之传统的实现迁移学习的分类模型能够显著提高检测精度。
[0062]
例如,实验基于现有技术通常使用的office-home图像数据库,据此使用根据本公内容的信息处理装置200对分类模型210进行训练。
[0063]
实验结果表明,根据本公内容的信息处理装置200训练的分类模型210对目标域的样本的平均检测精度最高可以达到82.7%(在使用三个第二分类单元202进行训练的情况下),较之现有技术的方法至少提升2.4%。
[0064]
相应地,本公开内容还提出了一种用于训练实现迁移学习的分类模型的信息处理方法。该分类模型能够基于第一域的具有标签的第一样本对不同于第一域的第二域的不具有标签的第二样本进行分类,在第二样本的类别与第一样本的类别之间存在相同的共享类别。
[0065]
图6是示出根据本公开内容的实施方式的信息处理方法600的流程图。
[0066]
信息处理方法600开始于步骤s601。随后,在步骤s602中,使第二样本中的每个朝向其相邻的第一样本或第二样本聚簇。根据本公开内容的实施方式,步骤s602中的处理可以例如通过根据上文参照图2至5描述的聚簇单元201来实现,因而这里不再赘述其细节。
[0067]
随后,在步骤s603中,基于第一样本的部分类别对经聚簇的第二样本进行分类。根据本公开内容的实施方式,步骤s603中的处理可以例如通过根据上文参照图2至5描述的第一分类单元202来实现,因而这里不再赘述其细节。
[0068]
随后,在步骤s604中,基于分类结果识别不具有共享类别的第二样本。根据本公开内容的实施方式,步骤s604中的处理可以例如通过根据上文参照图2至5描述的识别单元203实现,因而这里不再赘述其细节。
[0069]
随后,在步骤s605中,使用聚簇结果和识别结果训练分类模型。根据本公开内容的实施方式,步骤s604中的处理可以例如通过根据上文参照图2至5描述的聚簇单元201、第一分类单元202和识别单元203与分类模型210的交互来实现。
[0070]
最后,信息处理方法600结束于步骤s606。
[0071]
根据本公开内容的信息处理技术,能够显著改善迁移学习的学习效果。
[0072]
图7是示出可用来实现根据本公开内容的实施方式的信息处理方法和信息处理装置的通用机器700的结构简图。通用机器700可以是例如计算机系统。应注意,通用机器700只是一个示例,并非暗示对本公开内容的信息处理方法和信息处理装置的使用范围或者功能的局限。也不应将通用机器700解释为对上述信息处理方法或信息处理装置中示出的任一组件或其组合具有依赖或需求。
[0073]
在图7中,中央处理单元(cpu)701根据只读存储器(rom)702中存储的程序或从存储部分708加载到随机存取存储器(ram)703的程序执行各种处理。在ram 703中,还根据需要存储当cpu 701执行各种处理等等时所需的图像。cpu 701、rom 702和ram 703经由总线704彼此连接。输入/输出接口705也连接到总线704。
[0074]
下述部件也连接到输入/输出接口705:输入部分706(包括键盘、鼠标等等)、输出部分707(包括显示器,例如阴极射线管(crt)、液晶显示器(lcd)等,和扬声器等)、存储部分708(包括硬盘等)、通信部分709(包括网络接口卡例如lan卡、调制解调器等)。通信部分709经由网络例如因特网执行通信处理。根据需要,驱动器710也可连接到输入/输出接口705。可拆卸介质711例如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器710上,使得从中读出的计算机程序可根据需要被安装到存储部分708中。
[0075]
在通过软件实现上述系列处理的情况下,可以从网络例如因特网或从存储介质例如可拆卸介质711安装构成软件的程序。
[0076]
本领域的技术人员应当理解,这种存储介质不局限于图7所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质711。可拆卸介质711的例子包含磁盘(包含软盘)、光盘(包含光盘只读存储器(cd-rom)和数字通用盘(dvd))、磁光盘(包含迷你盘(md)(注册商标))和半导体存储器。或者,存储介质可以是rom 702、存储部分708中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
[0077]
此外,本公开内容还提出了一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本公开内容的信息处理方法。相应地,用于承载这种程序产品的上面列举的各种存储介质也包括在本公开内容的范围内。
[0078]
上面已通过框图、流程图和/或实施方式进行了详细描述,阐明了根据本公开内容的实施方式的装置和/或方法的具体实施方式。当这些框图、流程图和/或实施方式包含一个或多个功能和/或操作时,本领域的技术人员明白,这些框图、流程图和/或实施方式中的各功能和/或操作可以通过各种硬件、软件、固件或实质上它们的任意组合而单独地和/或共同地实施。在一种实施方式中,本说明书中描述的主题的几个部分可通过特定用途集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)或其他集成形式实现。然而,本领域的技术人员会认识到,本说明书中描述的实施方式的一些方面能够全部或部分地以在一个或多个计算机上运行的一个或多个计算机程序的形式(例如,以在一个或多个计算机系统上运行的一个或多个计算机程序的形式)、以在一个或多个处理器上运行的一个或多个程序的形式(例如,以在一个或多个微处理器上运行的一个或多个程序的形式)、以固件的形式、或以实质上它们的任意组合的形式等效地实施,并且,根据本说明书中公开的内容,设计用于本公开内容的电路和/或编写用于本公开内容的软件和/或固件的代码完全是在本领域技术人员的能力范围之内。
[0079]
综上,在根据本公开内容的实施方式中提供了如下技术方案,但不限于这些技术方案:
[0080]
方案1.一种信息处理装置,用于对分类模型进行训练,所述分类模型能够基于第一域的具有标签的第一样本对不同于所述第一域的第二域的不具有标签的第二样本进行分类,在所述第二样本的类别与所述第一样本的类别之间存在相同的共享类别,所述信息处理装置包括:
[0081]
聚簇单元,被配置成使所述第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;
[0082]
多个第一分类单元,每个第一分类单元被配置成基于所述第一样本的部分类别对经聚簇的第二样本进行分类;以及
[0083]
识别单元,被配置成基于所述多个第一分类单元的分类结果识别不具有所述共享类别的第二样本,
[0084]
其中,所述分类模型使用所述聚簇单元的聚簇结果和所述识别单元的识别结果进行训练。
[0085]
方案2.根据方案1所述的信息处理装置,其中,
[0086]
所述分类模型通过卷积神经网络模型实现。
[0087]
方案3.根据方案2所述的信息处理装置,其中,
[0088]
所述分类模型包括特征提取单元和第二分类单元,
[0089]
所述特征提取单元被配置成提取所述第一样本和所述第二样本的特征量,以及
[0090]
所述第二分类单元被配置成基于所述第一样本的全部类别对所述第一样本和所述第二样本进行分类。
[0091]
方案4.根据方案3所述的信息处理装置,其中,
[0092]
所述特征提取单元被配置成对所述第一样本和所述第二样本进行归一化。
[0093]
方案5.根据方案3所述的信息处理装置,其中,
[0094]
所述聚簇单元被配置成基于所述特征提取单元提取的所述第一样本和所述第二样本的特征量执行聚簇。
[0095]
方案6.根据方案1所述的信息处理装置,其中,
[0096]
对于所述第二样本中的每个,所述聚簇单元被配置成基于该样本与其相邻样本之间的距离进行聚簇。
[0097]
方案7.根据方案6所述的信息处理装置,其中,
[0098]
所述距离是余弦距离或欧氏距离。
[0099]
方案8.根据方案1所述的信息处理装置,其中,
[0100]
对于所述第二样本中的每个,所述聚簇单元被配置成通过比较该样本与全部所述第一样本和所述第二样本之间的距离来确定该样本的相邻样本。
[0101]
方案9.根据方案1所述的信息处理装置,其中,
[0102]
所述多个第一分类单元的部分类别的数目彼此相同。
[0103]
方案10.根据方案9所述的信息处理装置,其中,
[0104]
所述多个第一分类单元的数目等于所述第一样本的全部类别的数目除以每个第一分类单元的部分类别的数目。
[0105]
方案11.根据方案1所述的信息处理装置,其中,
[0106]
所述多个第一分类单元的部分类别的合集是所述第一样本的全部类别的全集。
[0107]
方案12.根据方案3所述的信息处理装置,其中,
[0108]
所述识别单元被配置成基于所述多个第一分类单元的分类结果与所述第二分类单元的分类结果之间的差异来识别不具有所述共享类别的第二样本。
[0109]
方案13.根据方案12所述的信息处理装置,其中,所述识别单元被配置成:
[0110]
对于所述第二样本中的每个样本,对所述多个第一分类单元中的、分类结果与所述第二分类单元的分类结果不同的第一分类单元的数目进行计数,以及当所计数的数目大于预设阈值时,确定该第二样本不具有所述共享类别。
[0111]
方案14.根据方案13所述的信息处理装置,其中,所述预设阈值是根据应用场景确定的。
[0112]
方案15.根据方案1至14中任一项所述的信息处理装置,其中,所述第一样本和所述第二样本是图像。
[0113]
方案16.一种信息处理方法,用于对分类模型进行训练,所述分类模型能够基于第一域的具有标签的第一样本对不同于所述第一域的第二域的不具有标签的第二样本进行分类,在所述第二样本的类别与所述第一样本的类别之间存在相同的共享类别,所述信息处理方法包括:
[0114]
使所述第二样本中的每个朝向其相邻的第一样本或第二样本聚簇;
[0115]
基于所述第一样本的部分类别对经聚簇的第二样本进行分类;
[0116]
基于分类结果识别不具有所述共享类别的第二样本;以及
[0117]
使用聚簇结果和识别结果训练所述分类模型。
[0118]
方案17.一种分类模型,用于基于第一域的具有标签的第一样本对不同于所述第一域的第二域的不具有标签的第二样本进行分类,在所述第二样本的类别与所述第一样本的类别之间存在相同的共享类别,所述分类模型是根据权利要求16所述的信息处理方法进行训练的。
[0119]
尽管上面已经通过对本公开内容的具体实施方式的描述对本公开内容进行了披露,但是,应该理解,本领域的技术人员可在所附权利要求的精神和范围内设计对本公开内容的实施方式的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本公开内容的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1