本申请涉及数据处理,尤其涉及一种目标分类模型的训练方法、目标识别方法及电子设备及存储介质。
背景技术:
1、随着人工智能技术的飞速发展,机器学习模型的逐渐被渗透至各行各业,推动传统行业的智能化转型。机器学习模型投入到产业应用中,需要经过模型训练,并在模型收敛之后再将其设置在设备中直接进行使用,因此模型性能的优劣往往取决于模型训练阶段的处理过程,例如样本数据集、损失函数、样本标签等等。
2、目前,通过鉴别输入数据的目标分类的目标分类模型已经被广泛应用于各类业务场景中,例如图像目标识别任务、语音目标识别任务等等,通过有监督对比学习来比较正负样本标签的标签信息,在产业中得到了较佳的应用推广。
3、但是,正样本标签(+)和负样本标签(-)所能够反馈的标签信息是非常有限的,例如在正样本数据集中的不同正样本针对正标签的贴近程度是存在差异的,导致样本数据的利用率不足,使得目标分类模型无法充分学习各个样本数据的标签信息,导致最终模型的性能不佳。
4、针对上述问题,目前业界暂未提出较佳的解决方案。
技术实现思路
1、本申请提供一种识别模型的训练方法、目标识别方法及电子设备及存储介质,用以至少解决现有技术中样本数据利用率不足而导致模型无法较佳地完成识别任务的问题。
2、第一方面,本申请实施例提供一种目标分类模型的训练方法,包括:获取针对所述目标分类模型的锚点样本;针对所述目标分类模型的训练样本集中的各个训练样本,确定所述训练样本与所述锚点样本之间的语义相似度;基于所述语义相似度,校准各个所述训练样本的样本标签;基于各个经校准的样本标签,对所述目标分类模型进行训练。
3、第二方面,本申请实施例提供一种目标识别方法,包括:获取待识别的输入数据;其中,所述输入数据的数据类型包含音频数据或图像数据;基于目标分类模型确定与所述输入数据相对应的目标分类结果,所述目标分类模型是通过如上述的目标分类模型的训练方法而进行训练的。
4、第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任一实施例的目标分类模型的训练方法或目标识别方法的步骤。
5、第四方面,本申请实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本申请任一实施例的目标分类模型的训练方法或目标识别方法的步骤。
6、本申请实施例的有益效果在于:
7、基于设定锚点样本,并将训练样本集中的各个训练样本与锚点样本进行比较,依据比较结果来对训练样本的样本标签进行校准,进而依据经标签校准后的样本对模型进行训练。由此,通过语义相似度来对样本标签进行校准,使得同类型的样本标签所对应的训练样本具有类似的概念语义信息,并扩大正负样本之间的差异性,利用语义信息丰富标签,提高了针对样本数据的利用率,使得目标分类模型学习到更丰富的标签信息,有助于提升最终模型的目标分类预测性能。
1.一种目标分类模型的训练方法,包括:
2.根据权利要求1所述的方法,其中,所述确定所述训练样本与所述锚点样本之间的语义相似度,包括:
3.根据权利要求1所述的方法,其中,所述锚点样本为正锚点样本,
4.根据权利要求3所述的方法,其中,所述语义相似度与所述辅助权重之间呈正相关关系。
5.根据权利要求3所述的方法,其中,在基于所述语义相似度,确定针对所述训练样本集中正样本子集的各个正样本的样本标签的辅助权重之前,包括:
6.根据权利要求5所述的方法,其中,所述基于所述语义相似度和预设的相似度阈值,确定是否替换所述训练样本集中各个正样本和/或负样本的样本标签,包括:
7.根据权利要求5所述的方法,其中,所述基于所述语义相似度和预设的相似度阈值,确定是否替换所述训练样本集中各个正样本和/或负样本的样本标签,包括:
8.一种目标识别方法,包括:
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。