本发明涉及图像数据异常检测领域,具体为一种基于非对称教师学生网络的知识蒸馏异常检测方法。
背景技术:
1、随着工业智能化水平的不断提高,计算机视觉技术被广泛运用于构建高效的自动化工业质检系统中。不同于传统的检测算法对于标注训练数据的高度依赖,异常检测技术通过仅使用目标工业产品的正常样本进行模型训练,并具有对检测图像进行异常判断和异常区域进行定位的能力,避免了在数据准备阶段收集异常样本困难,标注数据耗时费力的问题,同时具有优异的异常检测性能。
2、现有的基于知识蒸馏的异常检测方法可分为对称结构的教师学生网络模型和非对称结构的教师学生网络模型。对称结构的教师学生网络模型采用完全一致的教师学生网络结构,学生网络可能对于异常区域仍然提取跟教师网络相似的特征,导致无法精确定位异常区域位置;现有的非对称教师学生网络通过简化学生网络的结构以避免对于异常区域的相似特征提取,但同时弱化了学生网络的学习能力,不能很好学习正常样本的特征,导致正常区域也出现较多的虚警。
技术实现思路
1、(一)解决的技术问题
2、针对现有技术的不足,本发明提供了一种基于非对称教师学生网络的知识蒸馏异常检测方法,采用不同的教师学生网络结构以最大化异常区域的特征差异,同时通过掩码特征重构模块加强学生网络对于正常样本的特征学习能力,降低模型的虚警率。
3、(二)技术方案
4、为解决上述现有方法的一个或多个不足,本发明提供如下技术方案:一种基于非对称教师学生网络的知识蒸馏异常检测方法,包括以下步骤:
5、s1:收集目标工业产品正常图像样本并定义为数据集,将该数据集按比例划分训练集和验证集;
6、s2:搭建基于非对称教师学生网络的知识蒸馏异常检测模型,该模型包括教师网络和学生网络两部分;
7、s3:将步骤s1的训练集图像输入步骤s2所搭建的异常检测模型中的教师网络提取不同尺度的中间层特征,作为蒸馏知识信息;
8、s4:将步骤s1的训练集图像输入步骤s2所搭建的异常检测模型中的学生网络进行模型训练,提取经过掩码重生成后的各级中间层特征,采用余弦相似度损失和均方误差损失,与对应尺度的教师网络特征进行特征对齐,最终的优化目标函数如下:
9、loss=cos_loss+mse_loss;
10、s5:利用训练好的模型,输入新获取的目标数据集,计算不同尺度的教师网络和学生网络的特征相似度并融合得到最终的异常区域图,选取其中的最大值作为图像的异常得分,以判断图像是否异常并确定异常区域位置。
11、优选的,步骤s1中收集的数据集仅包含目标工业产品的正常样本数据。
12、优选的,步骤s1中,数据集的划分结果是80%为训练集和20%为验证集。
13、优选的,步骤s2中,用于教师网络的特征提取骨干网络采用预训练的wideresnet50,用于学生网络的特征提取骨干网络采用预训练的resnext50,学生网络同时还包含掩码特征重生成模块。
14、优选的,步骤s3具体指:将步骤s1的训练集图像输入步骤s2所搭建的异常检测模型中的教师网络,冻结其权重并提取三个不同尺度的中间层特征
15、优选的,步骤s4具体指,在步骤s4中的各级中间层特征具体指,三个不同尺度的中间层特征根据步骤s3得到的分别计算和之间的余弦相似度损失和均方误差损失,相加求和得到最终的总损失值,公式表达如下:
16、
17、
18、
19、式中,n代表三个不同的特征尺度。
20、优选的,步骤s5具体指,将待检测的数据集输入训练好的异常检测模型,分别计算和之间的余弦相似度和均方误差,得到三张不同尺度的特征差异图后上采样至输入图像尺寸,相加三张特征差异图得到最终的异常区域图,并将图中的最大值作为该张图像的异常分数。选取图像异常阈值α1,若图像异常分数大于α1则判定该图像为异常,小于α1则判定该图像为正常。选取像素异常阈值α2,若异常区域图中像素点的值大于α2,则判定该像素点为异常,若小于α2则判定该像素点为正常,最终根据得到的二值化分割结果可具体定位异常区域位置。
21、(三)有益效果
22、与现有技术相比,本发明提供了一种基于非对称教师学生网络的知识蒸馏异常检测方法,具备以下有益效果:
23、该基于非对称教师学生网络的知识蒸馏异常检测方法,获取目标工业产品的正常样本图像后,对模型进行训练,利用训练好的模型,将新获取的目标工业产品图像预处理后,输入模型中,得到异常检测结果。本方法构建了高效化、高检测精度的异常检测方法,可用于自动化的工业质检系统进行工业产品的异常检测,避免高额的人力成本,能及时发现潜在的产品缺陷,避免进一步的安全、经济隐患。
1.一种基于非对称教师学生网络的知识蒸馏异常检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于非对称教师学生网络的知识蒸馏异常检测方法,其特征在于,步骤s1中收集的数据集仅包含目标工业产品的正常样本数据。
3.根据权利要求1所述的一种基于非对称教师学生网络的知识蒸馏异常检测方法,其特征在于,步骤s1中,数据集的划分结果是80%为训练集和20%为验证集。
4.根据权利要求1所述的一种基于非对称教师学生网络的知识蒸馏异常检测方法,其特征在于,步骤s2中,用于教师网络的特征提取骨干网络采用预训练的wideresnet50,用于学生网络的特征提取骨干网络采用预训练的resnext50,学生网络同时还包含掩码特征重生成模块。
5.根据权利要求1所述的一种基于非对称教师学生网络的知识蒸馏异常检测方法,其特征在于,步骤s3具体指:将步骤s1的训练集图像输入步骤s2所搭建的异常检测模型中的教师网络,冻结其权重并提取三个不同尺度的中间层特征
6.根据权利要求1所述的一种基于非对称教师学生网络的知识蒸馏异常检测方法,其特征在于,在步骤s4中的各级中间层特征具体指,三个不同尺度的中间层特征根据步骤s3得到的分别计算和之间的余弦相似度损失和均方误差损失,相加求和得到最终的总损失值,公式表达如下:
7.根据权利要求1所述的一种基于非对称教师学生网络的知识蒸馏异常检测方法,其特征在于,步骤s5具体指,将待检测的数据集输入训练好的异常检测模型,分别计算和之间的余弦相似度和均方误差,得到三张不同尺度的特征差异图后上采样至输入图像尺寸,相加三张特征差异图得到最终的异常区域图,并将图中的最大值作为该张图像的异常分数;选取图像异常阈值α1,若图像异常分数大于α1则判定该图像为异常,小于α1则判定该图像为正常。选取像素异常阈值α2,若异常区域图中像素点的值大于α2,则判定该像素点为异常,若小于α2则判定该像素点为正常,最终根据得到的二值化分割结果可具体定位异常区域位置。