一种基于特征存储的小样本异常检测方法及装置

文档序号:37335426发布日期:2024-03-18 17:59阅读:17来源:国知局
一种基于特征存储的小样本异常检测方法及装置

本发明涉及工业异常检测,尤其是指一种基于特征存储的小样本异常检测方法、装置及计算机可读存储介质。


背景技术:

1、无监督异常检测是计算机视觉领域重要的研究课题之一。无监督异常检测任务通过在只有正常样本的训练集上训练模型,要求模型在测试时能够区分出正常样本和异常样本。这项技术可以广泛应用于制造业领域,检测带有污损、划痕等缺陷的工业品,减少次品率。

2、现有的研究探索了一种特殊实用的无监督异常检测,即小样本异常检测,在训练时,每个类别只提供有限数量的正常样本。目前的小样本异常检测主要有基于归一化流的方法、基于孪生网络的方法和基于特征存储的方法。基于归一化流的方法在训练时使用卷积神经网络提取图像的特征,并使用归一化流估计正常样本的分布,测试时计算待测图像的特征与该分布的距离作为异常分数。基于孪生网络的方法使用成对正常图像样本进行训练,训练孪生网络的目标是最大程度地减小正样本对的表示空间距离,训练完成后,使用孪生网络进行测试,以确定输入样本与正常样本的相似性。基于特征存储的方法在训练时采用一个预训练好的cnn(卷积神经网络)提取图像的特征映射,存储所有的特征映射构成一个多维高斯分布,测试时计算待测图像的特征与该高斯分布的距离作为异常分数。

3、与其他两种方法相比,基于特征存储的方法简单,无需进行训练即可得到较好的效果。但是现有的基于特征存储的方法主要面向正常设置下的异常检测,在小样本的情况下,随着存储样本减少,检测准确率会严重下降。


技术实现思路

1、为此,本发明所要解决的技术问题在于克服现有技术中基于特征存储的无监督异常检测方法在小样本情况下检测准确率严重下降的问题。

2、为解决上述技术问题,本发明提供了一种基于特征存储的小样本异常检测方法,包括:

3、s1、获取小样本无监督异常检测数据集,将数据集分为训练集和测试集;

4、s2、将训练集中所有样本图像的每个补丁分别输入特征提取器,得到训练集中所有样本图像每个补丁的输出特征集,存入特征存储库;

5、s3、对训练集中的所有样本图像进行数据增强,将数据增强后的图像的每个补丁分别输入特征提取器,得到数据增强后的图像每个补丁的输出特征集,分别计算每个补丁输出特征集中每个输出特征与特征存储库中所有特征的距离,在所述距离中选择最小值构建该补丁的最近距离集合;

6、s4、创建特征变换网络,将每个补丁的最近距离集合中最小值对应的特征存储库中的特征输入特征变换网络,得到每个补丁的映射特征,计算每个补丁的映射特征与该补丁最近距离集合中最小值对应的数据增强后的图像的输出特征的损失函数值;根据所述损失函数值优化特征变换网络的参数,使得损失函数值最小;

7、s5、使用特征提取器提取测试集中样本图像的每个补丁的特征,在特征存储库中寻找与测试集中样本图像的每个补丁的输出特征距离最近的特征,输入优化后的特征变换网络,得到该样本图像每个补丁的映射特征;计算每个补丁的映射特征与该补丁的输出特征的损失函数值,构成异常热点图,并选择异常热点图中最大的损失函数值作为该样本图像的异常分数;比较测试集中正常图像和异常图像的异常分数,设置正常图像和异常图像的分割阈值;

8、s6、计算待检测图像的异常分数;若异常分数大于分割阈值,则待检测图像为异常图像,若异常分数小于等于分割阈值,则待检测图像为正常图像。

9、在本发明的一个实施例中,s1中,所述训练集中仅包含正常图像,所述测试集中包含正常图像和异常图像。

10、在本发明的一个实施例中,s2中,所述将训练集中所有样本图像的每个补丁分别输入特征提取器,得到训练集中所有样本图像每个补丁的输出特征集,包括:

11、使用特征提取器提取样本图像b的补丁的输出特征公式为:

12、

13、其中,b为训练集中样本图像的总个数,h为样本图像的高,w为样本图像的宽;φ表示特征提取器;

14、得到补丁pj的输出特征集

15、在本发明的一个实施例中,s3中,分别计算每个补丁输出特征集中每个输出特征与特征存储库中所有特征的距离,在所述距离中选择最小值构建该补丁的最近距离集合,包括:

16、计算补丁pj的输出特征集中每个输出特征与特征存储库m中所有特征的距离,在所述距离中选择最小值构建该补丁的最近距离集合公式为:

17、

18、其中,m为特征存储库,为特征存储库中的特征,n为数据增强后的图像的总个数。

19、在本发明的一个实施例中,s4中,所述特征变换网络包括两个线性层和一个激活层。

20、在本发明的一个实施例中,所述特征变换网络的损失函数为:

21、

22、其中,f表示特征变换网络,为最近距离集合dj中最小值对应的特征存储库中的特征,为最近距离集合dj中最小值对应的样本图像输出。

23、在本发明的一个实施例中,异常热点图p的表达式为:

24、p=|qi-f(mi)|2,i∈rh*w

25、其中,f表示特征变换网络,qi为测试集样本图像r补丁pi的输出特征,mi为特征存储库中与qi距离最近的特征。

26、在本发明的一个实施例中,s5中,构建异常热点图后,对异常热点图进行高斯滤波平滑,并选择平滑后的异常热点图中最大的损失函数值作为该样本图像的异常分数。

27、本发明还提供了一种基于特征存储的小样本异常检测装置,包括:

28、采样模块,用于获取小样本无监督异常检测数据集,将数据集分为训练集和测试集;

29、特征存储库构建模块,用于将训练集中所有样本图像的每个补丁分别输入特征提取器,得到训练集中所有样本图像每个补丁的输出特征集,存入特征存储库;

30、特征网络构建模块,用于对训练集中的所有样本图像进行数据增强,将数据增强后的图像的每个补丁分别输入特征提取器,得到数据增强后的图像每个补丁的输出特征集,分别计算每个补丁输出特征集中每个输出特征与特征存储库中所有特征的距离,在所述距离中选择最小值构建该补丁的最近距离集合;创建特征变换网络,将每个补丁的最近距离集合中最小值对应的特征存储库中的特征输入特征变换网络,得到每个补丁的映射特征,计算每个补丁的映射特征与该补丁最近距离集合中最小值对应的数据增强后的图像的输出特征的损失函数值;根据所述损失函数值优化特征变换网络的参数,使得损失函数值最小;

31、阈值设置模块,用于使用特征提取器提取测试集中样本图像的每个补丁的特征,在特征存储库中寻找与测试集中样本图像的每个补丁的特征距离最近的特征输入优化后的特征变换网络,得到该样本图像每个补丁的映射特征;计算每个补丁的映射特征与该补丁的输出特征的损失函数值,构成异常热点图,并选择异常热点图中最大的损失函数值作为该样本图像的异常分数;比较测试集中正常图像和异常图像的异常分数,设置正常图像和异常图像的分割阈值;

32、检测模块,用于计算待检测图像的异常分数;若异常分数大于分割阈值,则待检测图像为异常图像,若异常分数小于等于分割阈值,则待检测图像为正常图像。

33、本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于特征存储的小样本异常检测方法的步骤。

34、本发明的上述技术方案相比现有技术具有以下优点:

35、本发明所述的一种基于特征存储的小样本异常检测方法,使用小样本构建特征存储库,并创建和优化特征变换网络,将特征存储库中的特征经特征变换网络进一步提取其特征信息后得到的映射特征计算图像的异常分数,设置正常图像和异常图像的分割阈值。在检测时,从特征存储库中找到与待检测图像的输出特征差异最小的特征,并对该差异最小特征进行特征变换,提取原有存储特征的信息,扩大了特征存储库中已有的信息量,提高了小样本异常检测的准确率。本发明能够更好适应工业生产中可供训练样本有限的情况,并保证了异常检测的准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1