本技术实施例涉及数据处理,尤其涉及一种人脸识别的测试数据集生成方法、装置、设备及存储介质。
背景技术:
1、人脸识别是一种基于人的脸部特征信息进行身份识别的生物识别技术。采用摄像机或者摄像头采集到含有人脸的图像或者视频流,并自动在图像上进行检测、跟踪人脸,进而对检测到的人脸进行人脸的一系列相关技术。在线下应用场景中,人脸识别设备既要承受光线和环境等外界因素干扰,也要适应客户图像的采集位置和脸部表情的差异,所以往往识别效率低下。为了提高人脸识别系统的稳定性,提升识别效果,要对设备进行充分的测试。因此,需要基于测试数据集来检测人脸识别设备的识别效果。
2、相关技术中,将随机生成的第一潜在编码输入至预设的生成器中,得到所述生成器输出的第一人脸图像;根据至少一类人脸属性更新所述第一潜在编码,生成第二潜在编码;将所述第二潜在编码输入至预设的生成器中,得到所述生成器输出的第二人脸图像;在确定所述第一人脸图像和第二人脸图像属于同一人脸身份信息的情况下,保存所述第一人脸图像和第二人脸图像以生成目标人脸识别数据集。通过随机生成训练图片,然后通过图片编辑技术根据至少一类人脸属性对训练图片添加人脸属性信息,进而实现人脸识别数据集的生成。
3、然而,现有技术中的人脸识别的测试数据集生成方法实现复杂,测试数据集生成效率低。
技术实现思路
1、本技术提供一种人脸识别的测试数据集生成方法、装置、设备及存储介质,从而解决现有技术中的人脸识别的测试数据集生成方法实现复杂,测试数据集生成效率低的技术问题。
2、第一方面,本技术提供了一种人脸识别的测试数据集生成方法,包括:
3、根据公开数据集及预设采集场景,获取原始采集图像数据;
4、对所述原始采集数据进行图像预处理,得到待处理图像数据,其中,每个所述待处理图像数据的尺寸均为预设尺寸;
5、随机对所述待处理图像数据进行分类处理,得到第一类待处理图像数据、第二类待处理图像数据和第三类待处理图像数据;
6、对所述第一类待处理图像数据进行图像增强处理,得到增强图像数据;
7、对所述第二类待处理图像数据进行图像翻译处理,得到翻译图像数据;
8、将所述第三类待处理图像数据、所述增强图像数据和所述翻译图像数据进行汇总处理,得到测试数据集。
9、本技术提供了一种高效、准确地用于人脸识别设备测试的的测试数据集生成方法,基于公开数据集及预设采集场景采集到的数据,为了保证数据集数据的多样性,将经过预处理的图像随机分为三份,分别使用数据增强技术和图像翻译算法构建增强图像数据及翻译图像数据,基于增强图像数据及翻译图像数据以原始采集图像数据中的部分原始数据,汇聚得到测试数据集。本技术基于有限人脸图像,通过改进数据增强技术以及图像翻译算法处理,生成大量模拟线下场景的人脸图像数据集,不仅可以在保护用户隐私的前提下用于人脸识别设备的测试,而且能大大减轻测试人员准备测试数据集的压力,降低了人脸识别的测试数据集生成的复杂度,提高了测试数据集生成效率,提高了测试效率。
10、可选地,所述对所述第一类待处理图像数据进行图像增强处理,得到增强图像数据,包括:
11、将所述第一类待处理图像数据输入至预设图像增强模型,以根据所述预设图像增强模型的输出得到增强图像数据,其中,所述预设图像增强模型由图像增强输入图片数据样本和所述图像增强输入图片数据样本对应的输出图片样本训练得到。
12、其中,数据增强是最常用的数据集扩充方法之一,通过对原始数据进行一系列变换操作,生成新的数据集,从而达到扩充数据集的目的。为了进一步地提高数据增强处理的效率,进一步地提高数据增强处理质量,得到更加符合多样化的更多增强图像数据,本技术通过预设图像增强模型,将第一类待处理图像数据输入至预先训练好的预设图像增强模型,即可得到增强图像数据,进一步地降低了人脸识别的测试数据集生成的复杂度,提高了测试数据集生成效率,提高了测试效率。
13、可选地,在所述将所述第一类待处理图像数据输入至预设图像增强模型,以根据所述预设图像增强模型的输出得到增强图像数据之后,还包括:
14、采用利用深度生成先验进行多用途图像修复与处理网络,对所述增强图像数据进行优化调整处理,得到优化增强图像数据;
15、相应地,所述将所述第三类待处理图像数据、所述增强图像数据和所述翻译图像数据进行汇总处理,得到测试数据集,包括:
16、将所述第三类待处理图像数据、所述优化增强图像数据和所述翻译图像数据进行汇总处理,得到测试数据集。
17、由于对图像进行数据增强处理可能会使图像出现噪声或者失真,因此本技术采用利用深度生成先验进行多用途图像修复与处理(deep generative prior,dgp)网络对数据集进行进行微调,使得生成数据集质量较高,降低了增强图像数据中噪声或者失真的影响,进一步地提高了测试数据集生成的质量,提高了测试准确性。
18、可选地,所述对所述第二类待处理图像数据进行图像翻译处理,得到翻译图像数据,包括:
19、将所述第二类待处理图像数据输入至预设图像翻译模型,以根据所述预设图像翻译模型的输出得到翻译图像数据,其中,所述预设图像翻译模型由图像翻译输入图片数据样本和所述图像翻译输入图片数据样本对应的形态标签样本训练得到。
20、其中,本技术通过模型的方式对第二类待处理图像数据进行图像翻译处理,能够高效地获取翻译图像数据。
21、可选地,在所述将所述第二类待处理图像数据输入至预设图像翻译模型,以根据所述预设图像翻译模型的输出得到翻译图像数据之前,还包括:
22、根据生成对抗网络算法,将所述图像翻译输入图片数据样本和所述图像翻译输入图片数据样本对应的形态标签样本输入至生成对抗网络模型;
23、对所述生成对抗网络模型进行模型训练处理,得到预设图像翻译模型。
24、其中,图像翻译能够将图像内容中图像域x的属性移除,重新赋予其图像域y的属性,但是基本的模型每次仅可对图像进行一个属性域的修改。因此本技术通过生成式对抗网络(generative adversarial network,gan)来实现多个属性域的更改,可选地,本技术使用可以同时修改多个属性域的stargan算法,stargan算法是gan的一种,区别于传统图像翻译算法只能实现一个域的迁移,stargan可以仅使用一个生成器同时产生多个属性域的改变,使得图像生成更具多样性,在保证数据集质量的同时,提高测试数据集数量,进一步地提高了测试数据集生成效率,提高了测试效率及准确性。
25、可选地,所述对所述生成对抗网络模型进行模型训练处理,得到预设图像翻译模型:
26、基于对抗损失函数、领域分类损失函数和重构损失函数,对所述生成对抗网络模型进行模型训练处理,得到预设图像翻译模型。
27、这里,本技术基于多个损失函数,能够更好的修正生成对抗网络模型的误差,提高生成对抗网络模型输出图像的准确性。
28、可选地,在所述将所述第三类待处理图像数据、所述增强图像数据和所述翻译图像数据进行汇总处理,得到测试数据集之后,还包括:
29、将所述测试数据集输入至验证模型,以根据所述验证模型的输出结果对所述测试数据集进行准确度验证。
30、其中,本技术还能够对测试数据集进行验证,以保证测试的准确性。
31、第二方面,本技术提供了一种人脸识别的测试数据集生成装置,包括:
32、获取模块,用于根据公开数据集及预设采集场景,获取原始采集图像数据;
33、第一处理模块,用于对所述原始采集数据进行图像预处理,得到待处理图像数据,其中,每个所述待处理图像数据的尺寸均为预设尺寸;
34、第二处理模块,用于随机对所述待处理图像数据进行分类处理,得到第一类待处理图像数据、第二类待处理图像数据和第三类待处理图像数据;
35、第三处理模块,用于对所述第一类待处理图像数据进行图像增强处理,得到增强图像数据;
36、第四处理模块,用于对所述第二类待处理图像数据进行图像翻译处理,得到翻译图像数据;
37、第五处理模块,用于将所述第三类待处理图像数据、所述增强图像数据和所述翻译图像数据进行汇总处理,得到测试数据集。
38、可选地,所述第三处理模块具体用于:
39、将所述第一类待处理图像数据输入至预设图像增强模型,以根据所述预设图像增强模型的输出得到增强图像数据,其中,所述预设图像增强模型由图像增强输入图片数据样本和所述图像增强输入图片数据样本对应的输出图片样本训练得到。
40、可选地,在所述第三处理模块用于将所述第一类待处理图像数据输入至预设图像增强模型,以根据所述预设图像增强模型的输出得到增强图像数据之后,上述装置还包括:
41、优化处理模块,用于采用利用深度生成先验进行多用途图像修复与处理网络,对所述增强图像数据进行优化调整处理,得到优化增强图像数据;
42、相应地,所述第五处理模块具体用于:
43、将所述第三类待处理图像数据、所述优化增强图像数据和所述翻译图像数据进行汇总处理,得到测试数据集。
44、可选地,所述第四处理模块具体用于:
45、将所述第二类待处理图像数据输入至预设图像翻译模型,以根据所述预设图像翻译模型的输出得到翻译图像数据,其中,所述预设图像翻译模型由图像翻译输入图片数据样本和所述图像翻译输入图片数据样本对应的形态标签样本训练得到。
46、可选地,在所述第四处理模块用于将所述第二类待处理图像数据输入至预设图像翻译模型,以根据所述预设图像翻译模型的输出得到翻译图像数据之前,上述装置还包括训练模块,用于:
47、根据生成对抗网络算法,将所述图像翻译输入图片数据样本和所述图像翻译输入图片数据样本对应的形态标签样本输入至生成对抗网络模型;
48、对所述生成对抗网络模型进行模型训练处理,得到预设图像翻译模型。
49、可选地,所述训练模块具体用于:
50、基于对抗损失函数、领域分类损失函数和重构损失函数,对所述生成对抗网络模型进行模型训练处理,得到预设图像翻译模型。
51、可选地,在所述第五处理模块用于将所述第三类待处理图像数据、所述增强图像数据和所述翻译图像数据进行汇总处理,得到测试数据集之后,上述装置还包括:
52、验证模块,用于将所述测试数据集输入至验证模型,以根据所述验证模型的输出结果对所述测试数据集进行准确度验证。
53、第三方面,本技术提供一种人脸识别的测试数据集生成设备,包括:至少一个处理器和存储器;
54、所述存储器存储计算机执行指令;
55、所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的人脸识别的测试数据集生成方法。
56、第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的人脸识别的测试数据集生成方法。
57、第五方面,本技术提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上第一方面以及第一方面各种可能的设计所述的人脸识别的测试数据集生成方法。
58、本技术提供的人脸识别的测试数据集生成方法、装置、设备及存储介质,其中该方法基于公开数据集及预设采集场景采集到的数据,为了保证数据集数据的多样性,将经过预处理的图像随机分为三份,分别使用数据增强技术和图像翻译算法构建增强图像数据及翻译图像数据,基于增强图像数据及翻译图像数据以原始采集图像数据中的部分原始数据,汇聚得到测试数据集。本技术基于有限人脸图像,通过改进数据增强技术以及图像翻译算法处理,生成大量模拟线下场景的人脸图像数据集,不仅可以在保护用户隐私的前提下用于人脸识别设备的测试,而且能大大减轻测试人员准备测试数据集的压力,降低了人脸识别的测试数据集生成的复杂度,提高了测试数据集生成效率,提高了测试效率。