本发明涉及图像分类,尤其涉及一种图像分类模型的训练方法、装置、计算机设备及介质。
背景技术:
1、近年来,机器学习算法依赖质量高且容量大的有监督图像数据集,在图像分类领域取得了显著的成果。但是在实际图像分类场景中,由于图像数据集广泛存在标记噪声问题,图像分类模型在进行模型训练时,倾向于首先学习干净的图像样本,然后学习噪声图像样本,随着迭代次数的增加,图像分类模型在训练过程中逐渐学习到越来越多的噪声信息,导致图像分类模型无法在低质量图像数据集上获得准确度较高的分类效果。
2、现有图像分类模型可以基于正则化处理防止图像分类模型在训练过程中对噪声信息的记忆,来提高图像分类模型的分类准确度。但是,上述方法只适用于图像数据均衡分布的情况,当图像数据集同时存在标签分布不均衡的问题时,会导致正则化处理阻碍图像分类模型对待分类图像的有效学习,无法防止图像分类模型在训练过程中对噪声信息的记忆,从而降低了图像分类模型的分类准确度。
3、因此,如何在不均衡带噪图像数据集的基础上提高图像分类模型的分类准确率成为亟待解决的问题。
技术实现思路
1、有鉴于此,本发明实施例提供了一种图像分类模型的训练方法、装置、计算机设备及介质,以解决现有图像分类模型的训练方法在面对不均衡带噪图像数据集时,图像分类模型的分类准确率较低的问题。
2、第一方面,本发明实施例一提供一种图像分类模型的训练方法,所述图像分类模型的训练方法包括:
3、获取训练集中的待分类图像,将所述待分类图像输入至图像分类模型中,确定每个所述待分类图像的类别概率估计向量和类别概率预测向量;
4、根据所述类别概率预测向量,确定每个所述待分类图像的预测图像类别,根据每个所述待分类图像的预测图像类别,确定每个所述图像类别的图像数量,根据每个所述图像类别的图像数量和预设图像数量阈值,确定每个所述待分类图像的第一损失权重参数;
5、根据每个所述待分类图像的预测图像类别、所述第一损失权重参数、所述类别概率估计向量和所述类别概率预测向量,确定所述图像分类模型的模型损失;
6、根据所述模型损失对所述图像分类模型进行训练,得到训练好的图像分类模型。
7、第二方面,本发明实施例二提供一种图像分类模型的训练方法,所述图像分类模型的训练方法包括:
8、获取训练集中的待分类图像,将待分类图像输入至图像分类模型中,确定每个待分类图像的类别概率估计向量和类别概率预测向量;
9、根据类别概率预测向量,确定每个待分类图像的预测图像类别,根据每个待分类图像的预测图像类别,确定每个图像类别的图像数量,根据每个图像类别的图像数量和预设图像数量阈值,确定每个待分类图像的第一损失权重参数。
10、获取每个待分类图像的原始图像类别,根据待分类图像和原始图像类别,确定每个原始图像类别的图像数量。
11、根据每个原始图像类别的图像数量和预设图像数量阈值,确定每个待分类图像的第二损失权重参数。
12、根据每个待分类图像的预测图像类别、第一损失权重参数、第二损失权重参数、类别概率估计向量和类别概率预测向量,确定图像分类模型的模型损失。
13、根据模型损失对图像分类模型进行训练,得到训练好的图像分类模型。
14、第三方面,本发明实施例三提供一种图像分类模型的训练装置,所述图像分类模型的训练装置包括:
15、概率预测模块,用于获取训练集中的待分类图像,将所述待分类图像输入至图像分类模型中,确定每个所述待分类图像的类别概率估计向量和类别概率预测向量;
16、参数确定模块,用于根据所述类别概率预测向量,确定每个所述待分类图像的预测图像类别,根据每个所述待分类图像的预测图像类别,确定每个所述图像类别的图像数量,根据每个所述图像类别的图像数量和预设图像数量阈值,确定每个所述待分类图像的第一损失权重参数;
17、损失计算模块,用于根据每个所述待分类图像的预测图像类别、所述第一损失权重参数、所述类别概率估计向量和所述类别概率预测向量,确定所述图像分类模型的模型损失;
18、模型训练模块,用于根据所述模型损失对所述图像分类模型进行训练,得到训练好的图像分类模型。
19、可选的是,所述图像分类模型的训练装置还包括:
20、图像数量确定模块,用于获取每个所述待分类图像的原始图像类别,根据所述待分类图像和所述原始图像类别,确定每个所述原始图像类别的图像数量;
21、第二损失权重参数确定模块,用于根据每个所述原始图像类别的图像数量和所述预设图像数量阈值,确定每个所述待分类图像的第二损失权重参数。
22、对应地,所述损失计算模块,用于根据每个所述待分类图像的所述预测图像类别、所述第一损失权重参数、所述第二损失权重参数、所述类别概率估计向量和所述类别概率预测向量,确定所述图像分类模型的模型损失。
23、第四方面,本发明实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面或者第二方面所述的图像分类模型的训练方法。
24、第五方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或者第二方面所述的图像分类模型的训练方法。
25、本发明实施例一与现有技术相比存在的有益效果是:通过将待分类图像输入至图像分类模型中,确定每个待分类图像的类别概率估计向量和类别概率预测向量,根据类别概率预测向量,确定每个待分类图像的预测图像类别,根据每个待分类图像的预测图像类别,确定每个图像类别的图像数量,根据每个图像类别的图像数量和预设图像数量阈值,确定每个待分类图像的第一损失权重参数,通过将预设图像数量阈值作为图像类别的图像数量分布的衡量基准,提高了第一损失权重参数的可靠性和准确性;根据每个待分类图像的预测图像类别、第一损失权重参数、类别概率估计向量和类别概率预测向量,确定图像分类模型的模型损失,根据模型损失对图像分类模型进行训练,得到训练好的图像分类模型,将第一损失权重参数作为类别概率估计向量和类别概率预测向量之间的相似性的权重基础,以降低标签不均衡问题对图像分类模型的训练影响,提高了图像分类模型的准确度。
26、本发明实施例二与现有技术相比存在的有益效果是:通过将待分类图像输入至图像分类模型中,确定每个待分类图像的类别概率估计向量和类别概率预测向量,根据类别概率预测向量,确定每个待分类图像的预测图像类别,根据每个待分类图像的预测图像类别,确定每个图像类别的图像数量,根据每个图像类别的图像数量和预设图像数量阈值,确定每个待分类图像的第一损失权重参数,通过将预设图像数量阈值作为图像类别的图像数量分布的衡量基准,提高了第一损失权重参数的可靠性和准确性;获取每个待分类图像的原始图像类别,根据待分类图像和原始图像类别,确定每个原始图像类别的图像数量,根据每个原始图像类别的图像数量和预设图像数量阈值,确定每个待分类图像的第二损失权重参数,通过将预设图像数量阈值作为原始图像类别的图像数量分布的衡量基准,提高了第二损失权重参数的可靠性和准确性;根据每个待分类图像的预测图像类别、第一损失权重参数、第二损失权重参数、类别概率估计向量和类别概率预测向量,确定图像分类模型的模型损失,根据模型损失对图像分类模型进行训练,得到训练好的图像分类模型,将第二损失权重参数作为类别概率估计向量和对应的预测图像类别之间的相似性的权重基础,将第一损失权重参数作为类别概率估计向量和类别概率预测向量之间的相似性的权重基础,以降低标签不均衡问题对图像分类模型的训练影响,提高了图像分类模型的准确度。