本发明涉及计算机应用,特别是指一种基于联合学习框架的wasserstein偏多标记学习方法及装置。
背景技术:
1、偏多标记学习是一种典型弱监督学习范式,是弱监督学习社区的一个基本任务。多标签学习(multi-label learning,mll)的目标是从训练数据中学习目标的分类模型,每个实例与对应的标签相关联。在实际应用中,由于精准注释存在困难并且成本很高,人工智能领域逐渐关注于偏多标记学习。
2、现阶段解决偏多标记学习问题的方法主要分为统一框架方法和两阶段方法。统一框架方法旨在将标签置信度学习和预测多分类模型整合到联合框架中,进一步通过迭代对联合框架进行优化。两阶段方法在第一阶段恢复真实标签分布或者学习一个标签置信度矩阵,在第二阶段根据恢复的标签分布或者是标签置信度矩阵建立多分类预测模型。但是,上述方法在给定有噪声标签的情况下恢复多分类器的能力是不够的。
3、解决多标签学习问题的方法主要是利用消歧策略以期望在候选标签集中恢复真实标签分布。但在利用消歧策略恢复真是标签分布时存在困难。现有方法中没有考虑候选集中噪声标签产生的原因,导致在消歧的过程中缺少可以利用的相关信息。通过经典的欧氏距离刻画真实标签矩阵和预测标签矩阵之间的距离,但欧式距离的固有限制导致这些方法无法有效的利用标签相关性。
4、在现有技术中,缺乏一种基于噪声标签的产生原因和改进欧氏距离的准确、高效的偏多标记学习方法。
技术实现思路
1、本发明实施例提供了一种基于联合学习框架的wasserstein偏多标记学习方法及装置。所述技术方案如下:
2、一方面,提供了一种基于联合学习框架的wasserstein偏多标记学习方法,该方法由电子设备实现,该方法包括:
3、根据不可靠众包的标记图像,获得带有噪声图像;将所述带有噪声图像进行数据转换,获得矩阵数据;
4、对所述矩阵数据进行预处理,获得处理后矩阵数据;
5、基于联合学习框架以及wasserstein距离进行模型构建,获得多标签分类模型;
6、使用所述处理后矩阵数据,对所述多标签分类模型进行训练,获得最优多标签分类模型;
7、获取待标记图像;将所述待标记图像输入所述最优多标签分类模型,获得标注图像。
8、其中,所述矩阵数据包括特征矩阵数据以及噪声标记的标签矩阵数据。
9、可选地,所述对所述矩阵数据进行预处理,获得处理后矩阵数据,包括:
10、将所述处理后矩阵数据进行降维处理,获得降维后矩阵数据;
11、将所述降维后矩阵数据进行归一化处理,获得处理后矩阵数据。
12、其中,所述多标签分类模型是一种基于联合学习框架的wasserstein偏多标记学习分类模型;
13、所述多标签分类模型的目标模型包括多标签分类器以及噪声标签识别器;
14、所述多标签分类模型采用正则化子对模型的复杂度进行约束。
15、可选地,所述将所述待标记图像输入所述最优多标签分类模型,获得标注图像,包括:
16、将所述待标记图像进行预处理,获得处理后待标记图像;
17、根据所述处理后待标记图像,获得待标记图像特征矩阵;
18、将所述待标记图像特征矩阵输入所述最优多标签分类模型进行标注,获得标注图像。
19、另一方面,提供了一种基于联合学习框架的wasserstein偏多标记学习装置,该装置应用于一种基于联合学习框架的wasserstein偏多标记学习方法,该装置包括:
20、矩阵数据获取模块,用于根据不可靠众包的标记图像,获得带有噪声图像;将所述带有噪声图像进行数据转换,获得矩阵数据;
21、数据预处理模块,用于对所述矩阵数据进行预处理,获得处理后矩阵数据;
22、模型构建模块,用于基于联合学习框架以及wasserstein距离进行模型构建,获得多标签分类模型;
23、模型训练模块,用于使用所述处理后矩阵数据,对所述多标签分类模型进行训练,获得最优多标签分类模型;
24、图像标注模块,用于获取待标记图像;将所述待标记图像输入所述最优多标签分类模型,获得标注图像。
25、其中,所述矩阵数据包括特征矩阵数据以及噪声标记的标签矩阵数据。
26、可选地,所述数据预处理模块,进一步用于:
27、将所述处理后矩阵数据进行降维处理,获得降维后矩阵数据;
28、将所述降维后矩阵数据进行归一化处理,获得处理后矩阵数据。
29、其中,所述多标签分类模型是一种基于联合学习框架的wasserstein偏多标记学习分类模型;
30、所述多标签分类模型的目标模型包括多标签分类器以及噪声标签识别器;
31、所述多标签分类模型采用正则化子对模型的复杂度进行约束。
32、可选地,所述图像标注模块,进一步用于:
33、将所述待标记图像进行预处理,获得处理后待标记图像;
34、根据所述处理后待标记图像,获得待标记图像特征矩阵;
35、将所述待标记图像特征矩阵输入所述最优多标签分类模型进行标注,获得标注图像。
36、另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述一种基于联合学习框架的wasserstein偏多标记学习方法。
37、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述一种基于联合学习框架的wasserstein偏多标记学习方法。
38、本发明实施例提供的技术方案带来的有益效果至少包括:
39、本发明提出了一种联合学习框架的wasserstein偏多标记学习方法,采用wasserstein距离应用于偏多标记学习领域,保证标签矩阵和预测标签矩阵之间的距离的真实性和有效性;通过联合学习框架同时兼顾标签分类和噪声识别,充分考虑了噪声标签产生的原因,大大提升了图像标注的准确程度。本发明是一种基于噪声标签的产生原因和改进欧氏距离的准确、高效的偏多标记学习方法。
1.一种基于联合学习框架的wasserstein偏多标记学习方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于联合学习框架的wasserstein偏多标记学习方法,其特征在于,所述矩阵数据包括特征矩阵数据以及噪声标记的标签矩阵数据。
3.根据权利要求1所述的一种基于联合学习框架的wasserstein偏多标记学习方法,其特征在于,所述对所述矩阵数据进行预处理,获得处理后矩阵数据,包括:
4.根据权利要求1所述的一种基于联合学习框架的wasserstein偏多标记学习方法,其特征在于,所述多标签分类模型是一种基于联合学习框架的wasserstein偏多标记学习分类模型;
5.根据权利要求1所述的一种基于联合学习框架的wasserstein偏多标记学习方法,其特征在于,所述将所述待标记图像输入所述最优多标签分类模型,获得标注图像,包括:
6.一种基于联合学习框架的wasserstein偏多标记学习装置,其特征在于,所述装置包括:
7.根据权利要求6所述的一种基于联合学习框架的wasserstein偏多标记学习装置,其特征在于,所述矩阵数据包括特征矩阵数据以及噪声标记的标签矩阵数据。
8.根据权利要求6所述的一种基于联合学习框架的wasserstein偏多标记学习装置,其特征在于,所述数据预处理模块,进一步用于:
9.根据权利要求6所述的一种基于联合学习框架的wasserstein偏多标记学习装置,其特征在于,所述多标签分类模型是一种基于联合学习框架的wasserstein偏多标记学习分类模型;
10.根据权利要求6所述的一种基于联合学习框架的wasserstein偏多标记学习装置,其特征在于,所述图像标注模块,进一步用于: