本技术涉及人工智能,特别是涉及一种对象质量检测方法、质量检测模型的构建方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、随着人工智能技术的发展,以及对生产制造过程中的不同产品的质量要求日益提升,出现了工业缺陷质检技术。其中,工业缺陷质检主要是通过拍摄工业产品的表面得到产品表面图片,并通过对产品表面图片进行特征提取、缺陷识别以及质量检测等处理,以获得相应的检测识别结果,确定产品是否存在缺陷,避免缺陷产品流入市场。
2、传统上,通常采用训练卷积神经网络模型的方式,以根据卷积神经网络模型对产品表面图片进行特征提取,并对提取到的特征进行二分类,分为有缺陷和缺陷两个类别,从而实现对产品进行有无质量问题的分类。
3、然而,实际应用过程中,由于产品的多样化,对不同产品采集到的缺陷图像并不属于简单的二分类,比如包括较多缺陷图像的程度较低,无法直接划分为有缺陷图像,或者某些图像缺陷程度十分轻微,本质上可以划分为无缺陷图像的情况等,即实际应用过程中的产品图像,无法通过简单的二值标签进行全面表述。同时,简单的二值标签需要人工预先标注,不同人进行标注时,根据缺陷图像的不同缺陷程度,其标注结果也会不同,会导致预先进行的人工标注的标签带有噪声和误差数据。而若利用带噪和误差的数据进行模型的训练,通常所获得的模型也携带噪声,会导致模型的识别、分类等性能下降,进而所利用模型获得的质量检测结果准确度也较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提升对产品的质量检测准确度的质量检测模型的构建方法、对象质量检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种对象质量检测方法。所述方法包括:
3、接收对象质量检测请求,并获取与所述对象质量检测请求对应的待检测产品图像;
4、根据训练好的质量检测模型,对所述待检测产品图像进行质量检测处理,获得与所述待检测产品图像对应的缺陷置信度数据;
5、其中,所述训练好的质量检测模型,是根据目标检测模型对第二检测模型进行知识蒸馏训练得到的;所述目标检测模型是根据奖励参数从各第一检测模型中确定得到的,所述奖励参数是根据对所述第二检测模型训练过程中的监督损失、以及根据增强产品图像样本对各所述第一检测模型进行强化训练过程的强化损失,确定得到的;所述监督损失是根据与第一预测结果对应的监督数据、以及第二预测结果确定得到的,所述第一预测结果是根据多个训练好的第一检测模型,对各所述增强产品图像样本进行预测处理得到的,所述第二预测结果是根据第二检测模型,对各所述增强产品图像样本进行预测处理得到的。
6、第二方面,本技术提供了一种质量检测模型的构建方法。所述方法包括:
7、获取增强产品图像样本,并根据多个训练好的第一检测模型、以及第二检测模型,对各所述增强产品图像样本进行预测处理,获得与各所述第一检测模型对应的第一预测结果、以及与所述第二检测模型对应的第二预测结果;
8、确定与各所述第一预测结果对应的监督数据,并根据所述监督数据和所述第二预测结果,确定在对所述第二检测模型训练过程中的监督损失;
9、根据各所述增强产品图像样本,对各所述第一检测模型进行强化训练,并确定强化训练过程的强化损失;
10、基于所述监督损失和所述强化损失,确定奖励参数;
11、根据所述奖励参数,从各所述第一检测模型中确定出目标检测模型,并根据所述目标检测模型对所述第二检测模型进行知识蒸馏训练,获得训练好的质量检测模型。
12、第三方面,本技术还提供了一种对象质量检测装置。所述装置包括:
13、待检测产品图像获得模块,用于接收对象质量检测请求,并获取与所述对象质量检测请求对应的待检测产品图像;
14、缺陷置信度数据获得模块,用于根据训练好的质量检测模型,对所述待检测产品图像进行质量检测处理,获得与所述待检测产品图像对应的缺陷置信度数据;
15、其中,所述训练好的质量检测模型,是根据目标检测模型对第二检测模型进行知识蒸馏训练得到的;所述目标检测模型是根据奖励参数从各第一检测模型中确定得到的,所述奖励参数是根据对所述第二检测模型训练过程中的监督损失、以及根据增强产品图像样本对各所述第一检测模型进行强化训练过程的强化损失,确定得到的;所述监督损失是根据与第一预测结果对应的监督数据、以及第二预测结果确定得到的,所述第一预测结果是根据多个训练好的第一检测模型,对各所述增强产品图像样本进行预测处理得到的,所述第二预测结果是根据第二检测模型,对各所述增强产品图像样本进行预测处理得到的。
16、第四方面,本技术还提供了一种质量检测模型的构建装置。所述装置包括:
17、预测结果获得模块,用于获取增强产品图像样本,并根据多个训练好的第一检测模型、以及第二检测模型,对各所述增强产品图像样本进行预测处理,获得与各所述第一检测模型对应的第一预测结果、以及与所述第二检测模型对应的第二预测结果;
18、监督损失确定模块,用于确定与各所述第一预测结果对应的监督数据,并根据所述监督数据和所述第二预测结果,确定在对所述第二检测模型训练过程中的监督损失;
19、强化损失确定模块,用于根据各所述增强产品图像样本,对各所述第一检测模型进行强化训练,并确定强化训练过程的强化损失;
20、奖励参数确定模块,用于基于所述监督损失和所述强化损失,确定奖励参数;
21、质量检测模型获得模块,用于根据所述奖励参数,从各所述第一检测模型中确定出目标检测模型,并根据所述目标检测模型对所述第二检测模型进行知识蒸馏训练,获得训练好的质量检测模型。
22、第五方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
23、接收对象质量检测请求,并获取与所述对象质量检测请求对应的待检测产品图像;
24、根据训练好的质量检测模型,对所述待检测产品图像进行质量检测处理,获得与所述待检测产品图像对应的缺陷置信度数据;
25、其中,所述训练好的质量检测模型,是根据目标检测模型对第二检测模型进行知识蒸馏训练得到的;所述目标检测模型是根据奖励参数从各第一检测模型中确定得到的,所述奖励参数是根据对所述第二检测模型训练过程中的监督损失、以及根据增强产品图像样本对各所述第一检测模型进行强化训练过程的强化损失,确定得到的;所述监督损失是根据与第一预测结果对应的监督数据、以及第二预测结果确定得到的,所述第一预测结果是根据多个训练好的第一检测模型,对各所述增强产品图像样本进行预测处理得到的,所述第二预测结果是根据第二检测模型,对各所述增强产品图像样本进行预测处理得到的。
26、第六方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
27、获取增强产品图像样本,并根据多个训练好的第一检测模型、以及第二检测模型,对各所述增强产品图像样本进行预测处理,获得与各所述第一检测模型对应的第一预测结果、以及与所述第二检测模型对应的第二预测结果;
28、确定与各所述第一预测结果对应的监督数据,并根据所述监督数据和所述第二预测结果,确定在对所述第二检测模型训练过程中的监督损失;
29、根据各所述增强产品图像样本,对各所述第一检测模型进行强化训练,并确定强化训练过程的强化损失;
30、基于所述监督损失和所述强化损失,确定奖励参数;
31、根据所述奖励参数,从各所述第一检测模型中确定出目标检测模型,并根据所述目标检测模型对所述第二检测模型进行知识蒸馏训练,获得训练好的质量检测模型。
32、第七方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
33、接收对象质量检测请求,并获取与所述对象质量检测请求对应的待检测产品图像;
34、根据训练好的质量检测模型,对所述待检测产品图像进行质量检测处理,获得与所述待检测产品图像对应的缺陷置信度数据;
35、其中,所述训练好的质量检测模型,是根据目标检测模型对第二检测模型进行知识蒸馏训练得到的;所述目标检测模型是根据奖励参数从各第一检测模型中确定得到的,所述奖励参数是根据对所述第二检测模型训练过程中的监督损失、以及根据增强产品图像样本对各所述第一检测模型进行强化训练过程的强化损失,确定得到的;所述监督损失是根据与第一预测结果对应的监督数据、以及第二预测结果确定得到的,所述第一预测结果是根据多个训练好的第一检测模型,对各所述增强产品图像样本进行预测处理得到的,所述第二预测结果是根据第二检测模型,对各所述增强产品图像样本进行预测处理得到的。
36、第八方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
37、获取增强产品图像样本,并根据多个训练好的第一检测模型、以及第二检测模型,对各所述增强产品图像样本进行预测处理,获得与各所述第一检测模型对应的第一预测结果、以及与所述第二检测模型对应的第二预测结果;
38、确定与各所述第一预测结果对应的监督数据,并根据所述监督数据和所述第二预测结果,确定在对所述第二检测模型训练过程中的监督损失;
39、根据各所述增强产品图像样本,对各所述第一检测模型进行强化训练,并确定强化训练过程的强化损失;
40、基于所述监督损失和所述强化损失,确定奖励参数;
41、根据所述奖励参数,从各所述第一检测模型中确定出目标检测模型,并根据所述目标检测模型对所述第二检测模型进行知识蒸馏训练,获得训练好的质量检测模型。
42、第九方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
43、接收对象质量检测请求,并获取与所述对象质量检测请求对应的待检测产品图像;
44、根据训练好的质量检测模型,对所述待检测产品图像进行质量检测处理,获得与所述待检测产品图像对应的缺陷置信度数据;
45、其中,所述训练好的质量检测模型,是根据目标检测模型对第二检测模型进行知识蒸馏训练得到的;所述目标检测模型是根据奖励参数从各第一检测模型中确定得到的,所述奖励参数是根据对所述第二检测模型训练过程中的监督损失、以及根据增强产品图像样本对各所述第一检测模型进行强化训练过程的强化损失,确定得到的;所述监督损失是根据与第一预测结果对应的监督数据、以及第二预测结果确定得到的,所述第一预测结果是根据多个训练好的第一检测模型,对各所述增强产品图像样本进行预测处理得到的,所述第二预测结果是根据第二检测模型,对各所述增强产品图像样本进行预测处理得到的。
46、第十方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
47、获取增强产品图像样本,并根据多个训练好的第一检测模型、以及第二检测模型,对各所述增强产品图像样本进行预测处理,获得与各所述第一检测模型对应的第一预测结果、以及与所述第二检测模型对应的第二预测结果;
48、确定与各所述第一预测结果对应的监督数据,并根据所述监督数据和所述第二预测结果,确定在对所述第二检测模型训练过程中的监督损失;
49、根据各所述增强产品图像样本,对各所述第一检测模型进行强化训练,并确定强化训练过程的强化损失;
50、基于所述监督损失和所述强化损失,确定奖励参数;
51、根据所述奖励参数,从各所述第一检测模型中确定出目标检测模型,并根据所述目标检测模型对所述第二检测模型进行知识蒸馏训练,获得训练好的质量检测模型。
52、上述对象质量检测方法、质量检测模型的构建方法、装置、计算机设备、存储介质和程序产品中,通过接收对象质量检测请求,获取与对象质量检测请求对应的待检测产品图像,进而根据训练好的质量检测模型,对待检测产品图像进行质量检测处理,获得与待检测产品图像对应的缺陷置信度数据。其中,训练好的质量检测模型是根据目标检测模型对第二检测模型进行知识蒸馏训练得到的,目标检测模型则是根据奖励参数从各第一检测模型中确定得到的,达到了利用强化训练实现对各第一检测模型的进一步加权和选择,确定出最合适的目标检测模型的目的,奖励参数则是根据对第二检测模型训练过程中的监督损失、以及根据增强产品图像样本对各第一检测模型进行强化训练过程的强化损失确定得到的,监督损失则是根据与第一预测结果对应的监督数据、以及第二预测结果确定得到的。通过根据目标模型对第二检测模型进行知识蒸馏训练,使得第二检测模型可学习到第一检测模型中的知识,减少对产品图像样本中预先标注的标签的依赖,以及预先标注的标签带来的噪声误差数据,从而获得模型精准度更高的质量检测模型,从而提升了利用质量检测模型对产品的质量检测准确度。