场景分类模型的训练方法、电子设备及存储介质与流程

文档序号：35475942发布日期：2023-09-16 17:59阅读：25来源：国知局

本申请实施例涉及人工智能，特别是涉及一种场景分类模型的训练方法、电子设备及存储介质。

背景技术：

1、在智能手机等电子设备与人们生活紧密相连的今天，电子设备的软硬件、算法已经逐渐趋于同质化，因此越来越多的电子设备通过使用ai(artificial intelligence，人工智能)算法来实现差异化的亮点功能，其中也包括了场景识别算法。当用户通过手机等电子设备拍摄某一具体场景时，由于缺乏专业知识往往不会针对性调整相机参数，这时电子设备通过对预览流图片进行ai场景识别进而自动对参数调整，当拍摄完成时可以自动修图并完成智能相册分类，这一连串的操作离不开精准的场景识别算法。

2、现有技术中，场景识别算法基本都是采用基于深度学习的多标签分类技术，但是由于多标签分类任务的特殊性，极大的增大了训练的难度。多标签分类任务中，类别数目较多，从而数据标注员在进行数据标注时，往往存在某张图片漏标某个类别的情况，这种“脏数据”会对训练带来不可逆转的影响，导致训练完成的模型的识别准确性低。

技术实现思路

1、鉴于上述问题，提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种场景分类模型的训练方法、电子设备及存储介质。

2、依据本申请实施例的第一方面，提供了一种场景分类模型的训练方法，包括：

3、通过第一分类模型对目标样本图像集合中的样本图像进行多类别的识别处理，得到第一预测结果，并通过第二分类模型对所述样本图像进行多类别的识别处理，得到第二预测结果，其中，所述第一分类模型的网络参数量小于所述第二分类模型的网络参数量；

4、根据所述样本图像的分类标签和所述第一预测结果，确定所述第一分类模型的分类损失函数值，并根据所述分类标签和所述第二预测结果，确定所述第二分类模型的分类损失函数值；

5、根据所述第一预测结果和所述第二预测结果，确定互监督损失函数值；

6、根据所述第一分类模型的分类损失函数值和所述互监督损失函数值，对所述第一分类模型的网络参数进行更新，并根据所述第二分类模型的分类损失函数值，对所述第二分类模型的网络参数进行更新；

7、将训练完成的第一分类模型作为待部署的场景分类模型。

8、依据本申请实施例的第二方面，提供了一种电子设备，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如第一方面中所述的场景分类模型的训练方法。

9、依据本申请实施例的第三方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的场景分类模型的训练方法。

10、依据本申请实施例的第四方面，提供了一种计算机程序产品，包括计算机程序或计算机指令，所述计算机程序或计算机指令被处理器执行时实现如第一方面所述的场景分类模型的训练方法。

11、本申请实施例提供的场景分类模型的训练方法、电子设备及存储介质，通过第一分类模型对目标样本图像集合中的样本图像进行多类别的识别处理，得到第一预测结果，并通过第二分类模型对样本图像进行多类别的识别处理，得到第二预测结果，根据样本图像的分类标签和第一预测结果确定第一分类模型的分类损失函数值，并根据分类标签和第二预测结果，确定第二分类模型的分类损失函数值，根据第一预测结果和第二预测结果，确定互监督损失函数值，根据第一分类模型的分类损失函数值和互监督损失函数值，对第一分类模型的网络参数进行更新，并根据第二分类模型的分类损失函数值，对第二分类模型的网络参数进行更新，将训练完成的第一分类模型作为待部署的场景分类模型，由于第二分类模型的网络参数量大于第一分类模型的网络参数量，同时对第一分类模型和第二分类模型进行训练，训练的过程中可以由样本图像的分类标签和第二分类模型的第二预测结果来共同指导对第一分类模型的训练，采用这种双模型联动训练的方法可以减弱遗漏分类标签给模型训练带来的影响，从而可以提高第一分类模型的分类识别准确性。

12、上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

技术特征：

1.一种场景分类模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述样本图像的分类标签和所述第一预测结果，确定所述第一分类模型的分类损失函数值，并根据所述分类标签和所述第二预测结果，确定所述第二分类模型的分类损失函数值，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据结果预测为所述类别的权重和结果预测为非所述类别的权重，对所述分类标签和所述第一预测结果的交叉熵进行加权求和，得到所述第一分类模型的分类损失函数值，包括：

4.根据权利要求3所述的方法，其特征在于，通过如下公式确定所述第一分类模型或所述第二分类模型的分类损失函数值：

5.根据权利要求1-4任一项所述的方法，其特征在于，所述根据所述第一预测结果和所述第二预测结果，确定互监督损失函数值，包括：

6.根据权利要求1-4任一项所述的方法，其特征在于，在所述通过第一分类模型对目标样本图像集合中的样本图像进行多类别的识别处理之前，还包括：

7.根据权利要求6所述的方法，其特征在于，所述对初始图像集合中的样本图像进行数据增强处理，得到所述目标样本图像集合，包括：

8.一种电子设备，其特征在于，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-7任一项所述的场景分类模型的训练方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的场景分类模型的训练方法。

10.一种计算机程序产品，其特征在于，包括计算机程序或计算机指令，所述计算机程序或计算机指令被处理器执行时实现权利要求1至7任一项所述的场景分类模型的训练方法。

技术总结
本申请实施例提供了一种场景分类模型的训练方法、电子设备及存储介质，该方法包括：通过第一分类模型对样本图像进行多类别的识别处理，得到第一预测结果，通过第二分类模型对样本图像进行多类别的识别处理，得到第二预测结果，第一分类模型的网络参数量小于第二分类模型的网络参数量；确定第一分类模型的分类损失函数值，并确定第二分类模型的分类损失函数值；根据第一预测结果和第二预测结果，确定互监督损失函数值；根据第一分类模型的分类损失函数值和互监督损失函数值，对第一分类模型的网络参数进行更新，根据第二分类模型的分类损失函数值，对第二分类模型的网络参数进行更新。本申请实施例可以提高模型的分类识别准确性。

技术研发人员：陈宇浩
受保护的技术使用者：北京迈格威科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈宇浩
技术所有人：南京旷云科技有限公司
我是此专利的发明人

上一篇：一种稳定性好的监控电子眼的制作方法
上一篇：一种人防地下车库墙体防撞结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。