缺陷检测模型的训练方法及装置与流程

文档序号:36834292发布日期:2024-01-26 16:50阅读:13来源:国知局
缺陷检测模型的训练方法及装置与流程

本发明涉及缺陷检测,具体涉及缺陷检测模型的训练方法及装置。


背景技术:

1、传统缺陷检测技术如自动光学检测的检测覆盖范围较小,检测目标大多数只能是明显缺陷,对于不明显的缺陷只能进行人工检测,但是检测标准容易因人而异;且自动光学检测的检测算法可移植能力差,针对不同产品需要重新调用算法进行测试;且自动光学检测的维护成本高,无法应对突发的新缺陷;为了改进上述问题,提出机器缺陷检测,机器缺陷检测有着明显的优势,它精确度高,速度快,可“看”清人眼无法看清的快速运动的目标,具有较高的稳定性,提升质量的可控性,同时可以进行信息的集成与留存,方便人员追溯。因此,机器视觉在多个领域都有着频繁的应用,帮助人工进行缺陷的检测识别并标记。

2、但是对于数量少且高度冗余的缺陷样本,机器缺陷检测不但难以提取缺陷的空间特征使训练效果不佳,还会导致过拟合现象。


技术实现思路

1、本发明提供一种缺陷检测模型的训练方法及装置,用以解决现有技术中通过数量少且高度冗余的缺陷样本训练模型时训练效果不佳的问题。

2、为了解决上述技术问题,第一方面,本发明提供一种缺陷检测模型的训练方法,该方法包括:

3、将一个样本图像输入预设的深度学习模型的特征提取网络,获得所述样本图像对应的特征图,其中,所述样本图像为具有缺陷图像的图像;

4、将所述特征图输入所述深度学习模型中包含了卷积空间注意力模块的pan模块,得到第一特征图;

5、将所述第一特征图输入所述深度学习模型中的检测头网络,得到所述样本图像中缺陷的检测结果,其中,所述缺陷的检测结果包括缺陷在所述样本图像中的位置以及缺陷的缺陷类型,所述缺陷类型为预设的至少一个缺陷类型中的一个;

6、确定所有样本图像中缺陷的检测结果的检测误差,在所有缺陷的所述检测误差小于预设值时将所述深度学习模型确定为缺陷检测模型。

7、可选地,在所述将一个样本图像输入预设的深度学习模型的特征提取网络,获得所述样本图像对应的特征图之后,所述将所述特征图输入所述深度学习模型中包含了卷积空间注意力模块的pan模块,得到第一特征图之前,还包括:

8、将所述特征图输入所述深度学习模型中包含了卷积通道注意力模块的fpn模块,得到第二特征图;

9、所述将所述特征图输入所述深度学习模型中包含了卷积空间注意力模块的pan模块,得到第一特征图,包括:

10、将所述第二特征图输入所述深度学习模型中包含了卷积空间注意力模块的pan模块,得到第一特征图。

11、可选地,所述将所述特征图输入所述深度学习模型中包含了卷积空间注意力模块的pan模块,得到第一特征图,包括:

12、将所述特征图输入所述深度学习模型中包含了卷积空间注意力模块的pan模块;

13、通过所述卷积空间注意力模块基于所述特征图的宽和高对所述特征图进行池化操作,得到第三特征图;

14、将所述第三特征图通过激活函数激活,得到第四特征图;

15、将所述第四特征图与所述特征图进行融合,得到第五特征图;

16、将所述第五特征图输入所述pan模块中的剩余模块中,得到第一特征图,其中,所述pan模块包括所述卷积空间注意力模块和所述剩余模块。

17、可选地,所述通过所述卷积空间注意力模块基于所述特征图的宽和高对所述特征图进行池化操作,得到第三特征图,包括:

18、对所述特征图分别通过全局最大池化操作和全局平均池化操作进行池化,得到全局最大第三特征图和所述全局平均第三特征图;

19、将所述全局最大第三特征图和所述全局平均第三特征图进行融合,得到第三特征图。

20、可选地,所述将所述全局最大第三特征图和所述全局平均第三特征图进行融合,得到第三特征图,包括:

21、通过具有一个过滤器的卷积层对所述全局最大第三特征图和所述全局平均第三特征图进行卷积,将卷积得到的特征图确定为第三特征图。

22、可选地,所述将所述第四特征图与所述特征图进行融合,得到第五特征图,包括:

23、将所述第四特征图与所述特征图中相对应的预设元素相乘,得到第五特征图。

24、可选地,所述将所述特征图输入所述深度学习模型中包含了卷积通道注意力模块的fpn模块,得到第二特征图,包括:

25、将所述特征图输入所述深度学习模型中包含了卷积通道注意力模块的fpn模块;

26、通过所述卷积通道注意力模块基于所述特征图的宽和高对所述特征图进行池化操作,得到第六特征图;

27、将所述第六特征图通过激活函数激活,得到第七特征图;

28、将所述第七特征图与所述特征图进行融合,得到第八特征图;

29、将所述第八特征图输入所述fpn模块中的第一剩余模块中,得到第二特征图,其中,所述fpn模块包括所述卷积通道注意力模块和所述第一剩余模块。

30、可选地,所述通过所述卷积通道注意力模块基于所述特征图的宽和高对所述特征图进行池化操作,得到第六特征图,包括:

31、对所述特征图分别通过全局最大池化操作和全局平均池化操作进行池化,得到全局最大第六特征图和所述全局平均第六特征图;

32、将所述全局最大第六特征图和所述全局平均第六特征图进行融合,得到第六特征图。

33、可选地,所述将所述全局最大第六特征图和所述全局平均第六特征图进行融合,得到第六特征图,包括:

34、将所述全局最大第六特征图和所述全局平均第六特征图输入共享多层感知器,得到全局最大第六特征图对应的第九特征图和所述全局平均第六特征图对应的第十特征图;

35、对所述第九特征图和所述第十特征图对应的预设元素加和,得到第六特征图。

36、第二方面,本发明提供一种缺陷检测模型的训练装置,该装置包括:

37、特征提取模块,用于将一个样本图像输入预设的深度学习模型的特征提取网络,获得所述样本图像对应的特征图,其中,所述样本图像为具有缺陷图像的图像;

38、输入模块,用于将所述特征图输入所述深度学习模型中包含了卷积空间注意力模块的pan模块,得到第一特征图;

39、检测模块,用于将所述第一特征图输入所述深度学习模型中的检测头网络,得到所述样本图像中缺陷的检测结果,其中,所述缺陷的检测结果包括缺陷在所述样本图像中的位置以及缺陷的缺陷类型,所述缺陷类型为预设的至少一个缺陷类型中的一个;

40、确定模块,用于确定所有样本图像中缺陷的检测结果的检测误差,在所有缺陷的所述检测误差小于预设值时将所述深度学习模型确定为缺陷检测模型。

41、与现有技术相比,本发明提供的一种缺陷检测模型的训练方法及装置,具有以下有益效果:

42、将特征图输入pan模块,可以增强多个尺度特征图的定位能力,而在pan模块中引入卷积空间注意力模块,并将特征图输入包含卷积空间注意力模块的pan模块,可以使得输出的多个尺度的特征图的定位能力被进一步增强,可以理解特征图的定位能力增强会使得缺陷样本的空间特征容易被提取,也即特征图中对应的缺陷特征更容易被定位到,从而在缺陷样本数量少且高度冗余时,缺陷样本的空间特征能够被容易提取到,并使得所能定位到的缺陷特征数量远远多于没有增强定位能力的特征图能够定位到的缺陷特征数量,以解决现有技术中通过数量少且高度冗余的缺陷样本训练模型时训练效果不佳的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1