本公开涉及人工智能领域,并且更具体地,涉及一种样本处理方法、装置、计算设备和计算机可读存储介质。
背景技术:
1、在诸如制造、医疗检验等领域,存在大量需要检测的任务。例如,在制造领域中,存在零件缺陷检测任务;在医疗检验领域中,存在病症检测任务等。然而,随着人力成本的提高和检测需求的扩大,质检人员或专业医生等有限人力难以承受连续且高强度的异常检测任务。因此,使用人工智能模型代替人力完成异常检测任务成为研究热点。
2、然而,训练用于异常检测任务的诸如深度神经网络的人工智能模型需要数百万量级的相关图像以及对应的标注数据。因此,在样本量稀缺、检测场景丰富的制造、医疗等领域应用难以训练出满足需求的人工智能模型以实现异常检测任务。此外,目前,标注数据基本上是由人工来完成,这也会耗费巨额劳动力和经济成本。
技术实现思路
1、本公开的示例实施例提供了一种样本处理方法,该方法能够基于正样本图像和异常标注掩码图,生成伪造的负样本图像,从而能够自动生成大量伪造的负样本图像,为样本量稀缺场景下的任务检测提供充分的样本数据集,从而提高自动检测能力和精确度。
2、第一方面,提供了一种样本处理方法。该方法包括:获取正样本图像;基于正样本图像,获取与正样本图像相对应的异常标注掩码图;以及基于正样本图像和异常标注掩码图,生成伪造的负样本图像,其中伪造的负样本图像中的异常区域与异常标注掩码图中的异常标注区域相对应。
3、如此,在本公开的实施例中,基于正样本图像和异常标注掩码图实现了伪造的负样本图像的生成。由此,可以为训练用于在样本量稀缺场景中进行异常检测任务的人工智能模型(例如,异常检测模型)提供充足的样本数据集,以提高人工智能模型进行异常检测的精确度,并且能够解决样本稀缺带来的过拟合问题。
4、在第一方面的一些实施例中,该方法还包括使用生成的伪造的负样本图像和对应的异常标注掩码图来训练异常检测系统。如此,通过使用伪造的负样本图像和对应的异常标注掩码图来训练异常检测系统,能够提高异常检测系统的泛化能力,还可以解决样本稀缺引起的过拟合问题,并进一步提高异常检测系统的检测精确度。
5、在第一方面的一些实施例中,该异常检测系统用于对待检测图像中的异常进行检测并标注。如此,无需人工参与即可实现对异常的检测。并且,训练好的异常检测系统不仅可以自动且精确地检测待检测图像中的异常,而且还可以用于对负样本图像中的异常区域进行标注,从而能够作为负样本数据的自动标注系统对负样本数据中的异常进行标注,进而极大地降低了人工标注的人力成本。
6、在第一方面的一些实施例中,对待检测图像中的异常进行检测并标注包括:接收待检测图像;由异常检测系统中的正样本生成器基于接收到的待检测图像生成中间正样本图像;将待检测图像和中间正样本图像进行拼接,生成拼接图像;由标注器基于拼接图像,生成与待检测图像相对应的异常标注图。如此,训练好的异常检测系统可以实现对待检测图像中的异常进行检测和标注。此外,由于异常检测系统可以对待检测图像中的异常进行标注,因此,可以用作负样本标注系统对负样本图像进行标注,从而能够极大地降低了人工标注的人力成本。
7、在第一方面的一些实施例中,伪造的负样本图像由负样本生成器生成,并且,负样本生成器和正样本生成器均基于正样本训练图像、负样本训练图像以及异常标注掩码训练图训练得到。如此,通过利用相同的训练数据集对负样本生成器和正样本生成器进行训练,可以使得异常检测系统的训练难度和训练成本降低,并且能够进一步提升异常检测系统的检测异常的精确度。
8、在第一方面的一些实施例中,负样本生成器和正样本生成器通过以下方式训练得到:由负样本生成器基于正样本训练图像和异常标注掩码训练图,生成训练输出负样本图像;由正样本生成器基于训练输出负样本图像生成训练输出正样本图像;基于正样本训练图像和训练输出正样本图像,确定重构损失函数;基于负样本训练图像和训练输出负样本图像,确定对抗损失函数;以及基于重构损失函数和对抗损失函数,训练负样本生成器和正样本生成器。如此,通过使用正样本训练图像、负样本训练图像以及异常标注掩码训练图来训练负样本生成器以及异常检测系统中的正样本生成器,能够提高负样本生成器伪造负样本图像的能力,同时还能降低异常检测系统的训练成本和训练难度。
9、在第一方面的一些实施例中,确定对抗损失函数包括:将负样本训练图像和训练输出负样本图像输入至鉴别器;以及由鉴别器确定对抗损失函数。如此,通过采用基于鉴别器的对抗网络,可以提高负样本生成器伪造负样本图像的能力,从而能够生成更接近真实负样本的伪造的负样本图像。
10、在第一方面的一些实施例中,训练负样本生成器和所述正样本生成器,包括:基于重构损失函数和对抗损失函数,训练所述负样本生成器、正样本生成器和鉴别器。如此,可以使得异常检测系统的训练难度和训练成本降低,并且能够进一步提升异常检测系统的检测异常的精确度。
11、在第一方面的一些实施例中,获取异常标注掩码图包括:由随机噪声器基于正样本图像生成随机掩码图;获取位置导向掩码图;通过将随机掩码图和位置导向掩码图进行点乘处理,来获取异常标注掩码图。如此,通过获取异常标注掩码图,可以随机模拟各种形状、大小和所在位置的异常的负样本图像,从而提高负样本数据的多样性,进而提升异常检测系统的泛化能力以及异常检测的精确度。
12、在第一方面的一些实施例中,由随机噪声器生成随机掩码图包括:通过为正样本图像中的至少一个像素随机地生成对应的像素值,来获取数值掩码图;将数值掩码图中高于像素阈值的像素值设置为第一像素值;将数值掩码图中低于像素阈值的像素值设置为第二像素值;基于更新像素值的数值掩码图,生成随机掩码图。如此,通过生成随机掩码图,有利于随机模拟具有各种形状和大小的异常的负样本图像,以增加负样本数据的多样性,进而提升异常检测系统的泛化能力以及异常检测的精确度。
13、在第一方面的一些实施例中,随机噪声器包括柏林噪声器或高斯噪声器。
14、在第一方面的一些实施例中,在位置导向掩码图中,包括第一像素值的区域为异常被引导的区域。如此,通过采用位置导向掩码图,可以基于异常检测系统被应用的异常检测任务的实际特点和情况,将伪造的负样本图像中的异常引导至异常出现概率高的区域中,从而进一步提升伪造的负样本图像的真实性。
15、在第一方面的一些实施例中,该方法还包括:获取纹理图像;将异常标注掩码图和纹理图像进行点乘处理,以获取随机纹理图像;获取位置导向掩码图的补码图像;通过将补码图像与正样本图像进行点乘处理,来获取更新的正样本图像;以及通过将随机纹理图像和更新的正样本图像进行相加处理,来获取初级伪负样本图像。通过采用纹理图像和异常标注掩码图像,可以获得初级伪造的负样本图像。由于采用了纹理图像,该初级伪造的负样本图像中可以包括各种纹理、颜色、形状、大小等的异常,从而增加负样本数据的多样性,进而提升异常检测系统的泛化能力以及异常检测的精确度。
16、在第一方面的一些实施例中,获取纹理图像包括:获取初始纹理图像;以及通过对初始纹理图像进行增强处理,来生成纹理图像。通过对初始纹理图像进行增强处理,可以提升生成的初级负样本图像中的异常区域的清晰度和精度,从而提升训练异常检测系统的效率,并且使得训练好的模型能够实现高精度、像素级的异常检测任务。
17、第二方面,提供了一种样本处理装置。该装置包括:第一获取单元,被配置为获取正样本图像;第二获取单元,被配置为基于正样本图像,获取与正样本图像相对应的异常标注掩码图;以及生成单元,被配置为基于正样本图像和异常标注掩码图,生成伪造的负样本图像,其中伪造的负样本图像中的异常区域与异常标注掩码图中的异常标注区域相对应。
18、如此,基于正样本图像和异常标注掩码图,本公开第二方面提供的样本处理装置实现了生成伪造的负样本图像。由此,可以为训练用于在样本量稀缺场景中进行异常检测任务的人工智能模型(例如,异常检测模型)提供充足的样本数据集,以提高人工智能模型进行异常检测的精确度,并且解决样本稀缺带来的过拟合问题。
19、在第二方面的一些实施例中,该样本处理装置还包括第一训练单元,被配置为使用生成的伪造的负样本图像和对应的异常标注掩码图来训练异常检测系统。如此,通过使用伪造的负样本图像和对应的异常标注掩码图来训练异常检测系统,能够提高异常检测系统的泛化能力,还可以解决样本稀缺引起的过拟合问题,并进一步提高异常检测系统的检测精确度。
20、在第二方面的一些实施例中,该异常检测系统用于对待检测图像中的异常进行检测并标注。如此,无需人工参与即可实现对异常的检测。并且,训练好的异常检测系统不仅可以自动且精确地检测待检测图像中的异常,而且还可以用于对负样本图像中的异常区域进行标注,从而能够作为负样本数据的自动标注系统对负样本数据中的异常进行标注,进而极大地降低了人工标注的人力成本。
21、在第二方面的一些实施例中,异常检测系统对待检测图像中的异常进行检测并标注包括:接收待检测图像;由异常检测系统中的正样本生成器基于接收到的待检测图像生成中间正样本图像;将待检测图像和中间正样本图像进行拼接,生成拼接图像;由标注器基于拼接图像,生成与待检测图像相对应的异常标注图。如此,训练好的异常检测系统可以实现对待检测图像中的异常进行检测和标注。此外,由于可以对待检测图像中的异常进行标注,因此,异常检测系统可以用作负样本标注系统对负样本图像进行标注,从而能够极大地降低了人工标注的人力成本。
22、在第二方面的一些实施例中,伪造的负样本图像由负样本生成器生成,并且,样本处理装置还包括第二训练单元,被配置为基于正样本训练图像、负样本训练图像以及异常标注掩码训练图训练负样本生成器和正样本生成器。如此,通过利用相同的训练数据集对负样本生成器和正样本生成器进行训练,可以使得异常检测系统的训练难度和训练成本降低,并且能够进一步提升异常检测系统的检测异常的精确度。
23、在第二方面的一些实施例中,第二训练单元包括:第一获取子单元,被配置为获取由负样本生成器基于正样本训练图像和异常标注掩码训练图生成的训练输出负样本图像;第二获取子单元,被配置为获取由正样本生成器基于训练输出负样本图像生成的训练输出正样本图像;第一确定子单元,被配置为基于正样本训练图像和训练输出正样本图像,确定重构损失函数;第二确定子单元,被配置为基于负样本训练图像和训练输出负样本图像,确定对抗损失函数;以及训练子单元,被配置为基于重构损失函数和对抗损失函数,训练负样本生成器和正样本生成器。如此,通过使用正样本训练图像、负样本训练图像以及异常标注掩码训练图来训练负样本生成器以及异常检测系统中的正样本生成器,能够提高负样本生成器伪造负样本图像的能力,同时还能降低异常检测系统监督学习模型的训练成本。
24、在第二方面的一些实施例中,第二确定子单元被配置为:将训练负样本图像和训练输出负样本图像输入至鉴别器;以及由鉴别器确定对抗损失函数。如此,通过采用基于鉴别器的对抗网络,可以提高负样本生成器伪造负样本图像的能力,从而生成更接近真实负样本的伪造的负样本图像。
25、在第二方面的一些实施例中,训练子单元被配置为:基于重构损失函数和对抗损失函数,训练所述负样本生成器、正样本生成器和鉴别器。如此,可以使得异常检测系统的训练难度和训练成本降低,并且能够进一步提升异常检测系统的检测异常的精确度。
26、在第二方面的一些实施例中,第二获取单元包括:随机噪声器,被配置为基于正样本图像生成随机掩码图;第三获取子单元,被配置为获取位置导向掩码图;第四获取子单元,被配置为通过将随机掩码图和位置导向掩码图进行点乘处理,来获取异常标注掩码图。如此,通过获取异常标注掩码图,可以随机模拟各种形状、大小和所在位置的异常的负样本图像,从而提高负样本数据的多样性,进而提升异常检测系统的泛化能力以及异常检测的精确度。
27、在第二方面的一些实施例中,随机噪声器包括:第五获取子单元,被配置为通过为正样本图像中的至少一个像素随机地生成对应的像素值,来获取数值掩码图;第一设置子单元,被配置为将数值掩码图中高于像素阈值的像素值设置为第一像素值;第二设置子单元,被配置为将数值掩码图中低于像素阈值的像素值设置为第二像素值;生成子单元,被配置为基于更新像素值的数值掩码图,生成随机掩码图。如此,通过生成随机掩码图,有利于随机模拟具有各种形状和大小的异常的负样本图像,以增加负样本数据的多样性,进而提升异常检测系统的泛化能力以及异常检测的精确度。
28、在第二方面的一些实施例中,随机噪声器包括柏林噪声器或高斯噪声器。
29、在第二方面的一些实施例中,在位置导向掩码图中,包括第一像素值的区域为异常被引导的区域。如此,通过采用位置导向掩码图,可以基于异常检测系统被应用的异常检测任务的实际特点和情况,将伪造的负样本图像中的异常引导至异常出现概率高的区域中,从而进一步提升伪造的负样本图像的真实性。
30、在第二方面的一些实施例中,该装置还包括:纹理图像获取单元,被配置为获取纹理图像;随机纹理图像获取单元,被配置为将异常标注掩码图和纹理图像进行点乘处理,以获取随机纹理图像;补码图像获取单元,被配置为获取位置导向掩码图的补码图像;更新的正样本图像获取单元,被配置为通过将补码图像与正样本图像进行点乘处理,来获取更新的正样本图像;以及初级伪负样本获取单元,被配置为通过将随机纹理图像和更新的正样本图像进行相加处理,来获取初级伪负样本。通过采用纹理图像和异常标注掩码图像,可以获得初级伪造的负样本图像。由于采用了纹理图像,该初级伪造的负样本图像中可以包括各种纹理、颜色、形状、大小等的异常,从而增加负样本数据的多样性,进而提升异常检测系统的泛化能力以及异常检测的精确度。
31、在第二方面的一些实施例中,纹理图像获取单元被配置为:初始纹理图像获取子单元,被配置为获取初始纹理图像;以及纹理图像生成子单元,被配置为通过对初始纹理图像进行增强处理,来生成纹理图像。通过对初始纹理图像进行增强处理,可以提升生成的初级负样本图像中的异常区域的清晰度和精度,从而提升训练异常检测系统的效率,并且使得训练好的模型能够实现高精度、像素级的异常检测任务。
32、第三方面,提供了一种计算设备,包括处理器以及存储器,所述存储器上存储有由处理器执行的指令,当该指令被处理器执行时使得所述计算设备实现根据上述第一方面或其任一实施例中的方法的操作。
33、第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现根据上述第一方面或其任一实施例中的方法的操作。
34、第五方面,提供了一种芯片或芯片系统。该芯片或芯片系统包括处理电路,被配置为执行根据上述第一方面或其任一实施例中的方法的操作。
35、第六方面,提供了一种计算机程序或计算机程序产品。该计算机程序或计算机程序产品被有形地存储在计算机可读介质上并且包括计算机可执行指令,计算机可执行指令在被执行时使设备实现根据上述第一方面或其任一实施例中的方法的操作。