一种人脸图像处理方法及终端设备与流程

文档序号:26840699发布日期:2021-10-08 22:31阅读:90来源:国知局
一种人脸图像处理方法及终端设备与流程

1.本技术实施例涉及人工智能技术领域,尤其涉及一种人脸图像处理方法及终端设备。


背景技术:

2.目前,伴随着社交网络的快速发展,个人信息也越来越容易发生泄露。例如,针对采用人脸识别技术对用户终端进行解锁的场景,若用户的终端和该用户的人脸照片同时被不法分子获取,此时不法分子可以通过该用户的人脸照片实现对该用户的终端的解锁,以盗取用户的个人信息。因此,用户在社交网络中分享照片时,若照片中存在用户真实的人脸,那么根据以上的方式,极容易发生用户的个人信息泄漏的事件。
3.因此,目前亟需一种对真实人脸进行替换的方法,以实现对个人信息的保护。
4.申请内容
5.本技术提供一种人脸图像处理方法及终端设备,用于针对真实人脸照片在发布到社交网络时,可以提高对用户个人信息的保护力度。
6.第一方面,本技术实施例提供一种人脸图像处理方法,该方法包括:接收包含第一人脸的第一图像;对所述第一图像进行处理以得到包含第二人脸的第二图像,其中所述第二人脸位于所述第一人脸所在的位置,且所述第二人脸与所述第一人脸具有相同或相似的属性,所述属性包括表情、年龄、性别中的至少一种。
7.基于该方案,通过对包含第一人脸的第一图像的处理,以使得在第一人脸所在位置使用第二人脸进行替换,从而得到包含第二人脸的第二图像,其中,第二人脸与第一人脸在各个属性上的属性值相同或者相似。通过这种对真实人脸进行替换的方式,且替换得到的人脸与用户真实的人脸在各个属性上表现为相同或者相似,如此的话,可以在用户分享人脸照片时既能够保证人脸的真实性,却又不是以用户真实的人脸进行发布,可以提高对用户个人信息的保护力度。
8.在一种可能实现的方法中,所述对所述第一图像进行处理以得到包含第二人脸的第二图像,包括:确定所述第一图像中的所述第一人脸在设定属性上的第一属性值;所述设定属性包括表情;随机生成用于生成第二人脸的第一特征向量;将所述第一特征向量中所述设定属性所在维度的值设置为所述第一属性值,得到第二特征向量;根据所述第一属性值中的表情属性值,确定所述表情属性值对应的第一人脸生成模型;将所述第二特征向量输入所述第一人脸生成模型,得到第二人脸;将所述第一图像中的所述第一人脸替换为所述第二人脸,得到第二图像。
9.基于该方案,针对第一图像中的第一人脸(需要被替换的人脸),首先确定第一人脸在设定属性上的第一属性值,其中,(人脸)表情是设定属性之一,然后,随机生成第一特征向量,并针对第一特征向量,将其中设定属性所在维度的值设置为第一属性值,得到第二特征向量,接着确定出与第一人脸的表情相对应的第一人脸生成模型,并将第二特征向量输入第一人脸生成模型,从而得到第二人脸,最后用第二人脸对第一图像中的第一人脸进
行替换,得到第二图像。当将该方式生成的第二图像应用于社交网络中用户的真实人脸照片(第一图像)的发布时,可以避免用户的真实人脸照片的泄漏,起到有效保护用户的个人数据的作用。
10.在一种可能实现的方法中,所述第一人脸生成模型是通过与第一人脸表情分类模型构成对抗网络训练得到的;所述第一人脸表情分类模型用于识别出输入图像是否具有生成的第一人脸表情;所述第一人脸生成模型用于生成使得所述第一人脸表情分类模型难以区分的人脸图像。
11.基于该方案,通过使用对抗网络的方式训练得到第一人脸生成模型和第一人脸表情分类模型,可以使得第一人脸生成模型根据第二特征向量生成的第二人脸让第一人脸表情分类模型无法区分是由模型生成的人脸还是真实的人脸,从而说明第二人脸与真实人脸相差无几,如此使用第二人脸替换第一人脸的方式是合理的,最后当用生成的第二图像应用于社交网络中用户的真实人脸照片(第一图像)的发布时,可以避免用户的真实人脸照片的泄漏,起到有效保护用户的个人数据的作用。
12.在一种可能实现的方法中,所述第一人脸生成模型是通过与第一人脸表情分类模型构成对抗网络训练得到的,包括:随机生成各第三特征向量;将各第三特征向量分别输入初始人脸生成模型,得到各第三图像;将各第三图像和具有第一人脸表情的各第四图像作为样本,对初始人脸表情分类模型进行训练,得到第一轮人脸表情分类模型;根据所述第一轮人脸表情分类模型对样本的识别结果,作为训练所述初始人脸生成模型的调整依据,得到第一轮人脸生成模型;通过所述第一轮人脸生成模型得到更新后的样本,循环更新模型,直至得到所述第一人脸生成模型和所述第一人脸表情分类模型。
13.基于该方案,通过随机生成多个第三特征向量,并针对该些多个第三特征向量,初始人脸生成模型可以就其中的每一个第三特征向量生成一个第三图像;同时,将多个第三图像将和具有第一人脸表情的多个第四图像作为样本,对初始人脸表情分类模型进行训练,得到第一轮人脸表情分类模型;然后,将第一轮人脸表情分类模型对样本的识别结果作为训练初始人脸生成模型的调整依据,得到第一轮人脸生成模型,接着通过第一轮人脸生成模型得到更新后的样本,循环更新模型,直至得到第一人脸生成模型和第一人脸表情分类模型。该方式通过对抗网络训练的方式,使得每一次更新的人脸生成模型在对随机生成的特征向量生成的图像越来越和真实人脸相接近,以至于“欺骗”到人脸表情分类模型(让人脸表情分类模型误以为由人脸生成模型生成的图像是真实人脸),同时,每一次更新的人脸表情分类模型也具有更高的分类精度,用于准确地区分真实的人脸图像和由人脸生成模型生成的图像。该方式中针对两种具有对抗关系的模型——人脸生成模型和人脸表情分类模型,通过固定一种模型的参数来训练另一种模型,如此的话,可以提高模型训练的效果,使得最终得到的第一人脸生成模型可以准确地用于对预设人脸表情下的真实人脸的替换图像进行生成。
14.在一种可能实现的方法中,所述确定所述第一图像中的所述第一人脸在设定属性上的第一属性值之前,还包括:接收第一触发指令;所述第一触发指令用于指示对所述第一图像中的人脸进行替换;通过人脸识别模型,确定所述第一图像中的各人脸;接收第二触发指令;所述第二触发指令用于指示对所述第一人脸进行替换。
15.基于该方案,该方式中对于含有人脸的第一图像,若确定需要对其中的人脸进行
替换时,则通过发出第一触发指令,由于第一触发指令用于指示对第一图像中的人脸进行替换,因此在接收到第一触发指令后,通过人脸识别模型可以确定出第一图像中包括的人脸,并对人脸进行标识,最后通过发出第二触发指令,由于第二触发指令是作用于第一人脸对应的标识上,用于指示对第一人脸进行替换,如此可以确定本次的人脸替换的目标具体包括哪些。
16.在一种可能实现的方法中,所述确定所述第一图像中的所述第一人脸在设定属性上的第一属性值,包括:通过表情识别模型确定所述第一人脸的表情属性值;通过年纪识别模型确定所述第一人脸的年纪属性值;通过性别识别模型确定所述第一人脸的性别属性值。
17.基于该方案,由于在生成第一人脸的替换图像——第二图像的过程中,若保证生成的第二图像与第一人脸具有相同的表情、年纪和性别,则所生成的第二图像与第一图像可表现得更为贴切,对此,通过不同的识别模型来识别第一人脸具有的各种属性信息,如此在使用第一人脸生成模型对第一人脸进行替换时,可以根据得到的各种属性信息来适应生成第一人脸的替换图像。
18.在一种可能实现的方法中,所述确定所述第一图像中的所述第一人脸在设定属性上的第一属性值,包括:接收属性输入指令;所述属性输入指令用于指示所述第一属性值。
19.在一种可能实现的方法中,保存所述第一图像与所述第二图像的对照关系;所述第一图像以隐藏方式存储;在接收到设定指令后,显示所述第一图像;否则,显示所述第二图像。
20.基于该方案,在得到任一第一图像的同时,可通过第一人脸表情生成模型生成关于该第一图像的第二图像,并对该组图像(包括第一图像和第二图像)建立对照关系后进行保存,其中将第一图像设置为以隐藏方式存储,如此在用户分享时,若用户需要对某一第一图像进行分享,则默认以该第一图像对应的第二图像进行发布,当且仅当接收到设定指令后(也即,用户希望以真实人脸的图像进行发布),此时则以第一图像进行发布,如此可以最大程度保护的用户的个人数据,且也提供以真实人脸的图像进行发布的方式,增强了用户的体验感。
21.第二方面,本技术实施例提供一种终端设备,该终端设备包括:显示单元,用于进行显示包含第一人脸的第一图像;处理器,所述处理器被配置为:响应于用户的指令,控制所述显示单元在所述第一人脸所在的位置替换为第二人脸,其中,所述第二人脸与所述第一人脸具有相同或相似的属性,所述属性包括表情、年龄、性别中的至少一种。
22.基于该方案,当终端设备中的显示单元在对包含第一人脸的第一图像进行显示时,该终端设备中的处理器将会使用第二人脸对第一图像中的第一人脸进行替换,得到第二图像,并控制显示单元对包含第二人脸的第二图像进行显示,其中,第二人脸与第一人脸在各个属性上的属性值相同或者相似。通过这种对真实人脸进行替换的方式,且替换得到的人脸与用户真实的人脸在各个属性上表现为相同或者相似,如此的话,可以在用户分享人脸照片时既能够保证人脸的真实性,却又不是以用户真实的人脸进行发布,可以提高对用户个人信息的保护力度。
23.在一种可能实现的方法中,所述处理器,被具体配置为:确定所述第一图像中的所述第一人脸在设定属性上的第一属性值;所述设定属性包括表情;随机生成用于生成第二
人脸的第一特征向量;将所述第一特征向量中所述设定属性所在维度的值设置为所述第一属性值,得到第二特征向量;根据所述第一属性值中的表情属性值,确定所述表情属性值对应的第一人脸生成模型;将所述第二特征向量输入所述第一人脸生成模型,得到第二人脸;将所述第一图像中的所述第一人脸替换为所述第二人脸,得到第二图像。
24.基于该方案,针对第一图像中的第一人脸(需要被替换的人脸),首先确定第一人脸在设定属性上的第一属性值,其中,(人脸)表情是设定属性之一,然后,随机生成第一特征向量,并针对第一特征向量,将其中设定属性所在维度的值设置为第一属性值,得到第二特征向量,接着确定出与第一人脸的表情相对应的第一人脸生成模型,并将第二特征向量输入第一人脸生成模型,从而得到第二人脸,最后用第二人脸对第一图像中的第一人脸进行替换,得到第二图像。当将该方式生成的第二图像应用于社交网络中用户的真实人脸照片(第一图像)的发布时,可以避免用户的真实人脸照片的泄漏,起到有效保护用户的个人数据的作用。
25.在一种可能实现的方法中,所述第一人脸生成模型是通过与第一人脸表情分类模型构成对抗网络训练得到的;所述第一人脸表情分类模型用于识别出输入图像是否具有生成的第一人脸表情;所述第一人脸生成模型用于生成使得所述第一人脸表情分类模型难以区分的人脸图像。
26.基于该方案,通过使用对抗网络的方式训练得到第一人脸生成模型和第一人脸表情分类模型,可以使得第一人脸生成模型根据第二特征向量生成的第二人脸让第一人脸表情分类模型无法区分是由模型生成的人脸还是真实的人脸,从而说明第二人脸与真实人脸相差无几,如此使用第二人脸替换第一人脸的方式是合理的,最后当用生成的第二图像应用于社交网络中用户的真实人脸照片(第一图像)的发布时,可以避免用户的真实人脸照片的泄漏,起到有效保护用户的个人数据的作用。
27.在一种可能实现的方法中,所述处理器,被具体配置为:随机生成各第三特征向量;将各第三特征向量分别输入初始人脸生成模型,得到各第三图像;将各第三图像和具有第一人脸表情的各第四图像作为样本,对初始人脸表情分类模型进行训练,得到第一轮人脸表情分类模型;根据所述第一轮人脸表情分类模型对样本的识别结果,作为训练所述初始人脸生成模型的调整依据,得到第一轮人脸生成模型;通过所述第一轮人脸生成模型得到更新后的样本,循环更新模型,直至得到所述第一人脸生成模型和所述第一人脸表情分类模型。
28.基于该方案,通过随机生成多个第三特征向量,并针对该些多个第三特征向量,初始人脸生成模型可以就其中的每一个第三特征向量生成一个第三图像;同时,将多个第三图像将和具有第一人脸表情的多个第四图像作为样本,对初始人脸表情分类模型进行训练,得到第一轮人脸表情分类模型;然后,将第一轮人脸表情分类模型对样本的识别结果作为训练初始人脸生成模型的调整依据,得到第一轮人脸生成模型,接着通过第一轮人脸生成模型得到更新后的样本,循环更新模型,直至得到第一人脸生成模型和第一人脸表情分类模型。该方式通过对抗网络训练的方式,使得每一次更新的人脸生成模型在对随机生成的特征向量生成的图像越来越和真实人脸相接近,以至于“欺骗”到人脸表情分类模型(让人脸表情分类模型误以为由人脸生成模型生成的图像是真实人脸),同时,每一次更新的人脸表情分类模型也具有更高的分类精度,用于准确地区分真实的人脸图像和由人脸生成模
型生成的图像。该方式中针对两种具有对抗关系的模型——人脸生成模型和人脸表情分类模型,通过固定一种模型的参数来训练另一种模型,如此的话,可以提高模型训练的效果,使得最终得到的第一人脸生成模型可以准确地用于对预设人脸表情下的真实人脸的替换图像进行生成。
29.在一种可能实现的方法中,所述处理器,被具体配置为:接收第一触发指令;所述第一触发指令用于指示对所述第一图像中的人脸进行替换;通过人脸识别模型,确定所述第一图像中的各人脸;接收第二触发指令;所述第二触发指令用于指示对所述第一人脸进行替换。
30.基于该方案,该方式中对于含有人脸的第一图像,若确定需要对其中的人脸进行替换时,则通过发出第一触发指令,由于第一触发指令用于指示对第一图像中的人脸进行替换,因此在接收到第一触发指令后,通过人脸识别模型可以确定出第一图像中包括的人脸,并对人脸进行标识,最后通过发出第二触发指令,由于第二触发指令是作用于第一人脸对应的标识上,用于指示对第一人脸进行替换,如此可以确定本次的人脸替换的目标具体包括哪些。
31.在一种可能实现的方法中,所述处理器,被具体配置为:通过表情识别模型确定所述第一人脸的表情属性值;通过年纪识别模型确定所述第一人脸的年纪属性值;通过性别识别模型确定所述第一人脸的性别属性值。
32.基于该方案,由于在生成第一人脸的替换图像——第二图像的过程中,若保证生成的第二图像与第一人脸具有相同的表情、年纪和性别,则所生成的第二图像与第一图像可表现得更为贴切,对此,通过不同的识别模型来识别第一人脸具有的各种属性信息,如此在使用第一人脸生成模型对第一人脸进行替换时,可以根据得到的各种属性信息来适应生成第一人脸的替换图像。
33.在一种可能实现的方法中,所述处理器,被具体配置为:接收属性输入指令;所述属性输入指令用于指示所述第一属性值。
34.在一种可能实现的方法中,所述处理器,被具体配置为:保存所述第一图像与所述第二图像的对照关系;所述第一图像以隐藏方式存储;在接收到设定指令后,显示所述第一图像;否则,显示所述第二图像。
35.基于该方案,在得到任一第一图像的同时,可通过第一人脸表情生成模型生成关于该第一图像的第二图像,并对该组图像(包括第一图像和第二图像)建立对照关系后进行保存,其中将第一图像设置为以隐藏方式存储,如此在用户分享时,若用户需要对某一第一图像进行分享,则默认以该第一图像对应的第二图像进行发布,当且仅当接收到设定指令后(也即,用户希望以真实人脸的图像进行发布),此时则以第一图像进行发布,如此可以最大程度保护的用户的个人数据,且也提供以真实人脸的图像进行发布的方式,增强了用户的体验感。
36.第三方面,本技术实施例提供了一种计算设备,包括:
37.存储器,用于存储程序指令;
38.处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如第一方面的任一实现方法。
39.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储
介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面的任一实现方法。
附图说明
40.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
41.图1为本技术实施例提供的一种可能的系统架构示意图;
42.图2为本技术实施例提供的一种人脸图像处理方法;
43.图3为本技术实施例提供的一种多个维度的特征码与人脸特征的关系示意图;
44.图4为本技术实施例提供的一种终端设备;
45.图5为本技术实施例提供的一种计算设备的示意图。
具体实施方式
46.为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
47.目前,用户在分享照片时,通常是将拍摄得到的照片原封不动的分享到互联网中。其中,若分享的照片中包括人脸,则该种照片分享方式容易对用户的个人信息造成泄漏。众所周知,随着人工智能技术的飞速进步,将人脸识别技术用于对终端的解锁,已经非常热门。因此,当用户的终端不小心流落到不法分子手中,且该不法分子持有用户的人脸照片,通过将用户的人脸照片对准用户的终端(如摄像头),则很容易实现对用户终端的解锁,并从中获取用户的个人信息,甚至会对用户造成一种不可挽回的损失。
48.基于上述问题,如图1所示,为本技术实施例提供的一种可能的系统架构示意图,该系统包括终端设备110和服务器120。
49.其中,终端设备110被配置有图像采集单元,如摄像头。在用户有拍照需求时,用户可以通过终端设备110上的摄像头进行拍照,如用户可以使用终端设备拍摄一张全家福。终端设备110还被配置有处理单元,用于对拍摄图像进行处理。其中,若拍摄图像中包括人脸,则处理器对拍摄图像的处理包括对拍摄图像中的人脸进行替换,得到处理后的图像,其中,替换后的人脸位于替换前的人脸的位置,且替换后的人脸与替换前的人脸具有相同或相似的属性,如具有相同或相似的表情、年龄和性别等。终端设备110还被配置有存储单元,用于在对拍摄图像以及该拍摄图像的处理图像建立对照关系后进行保存。终端设备110还被配置有显示单元,在用户分享照片到互联网中时,显示单元默认采用拍摄图像的处理图像进行显示,在一种实施中,若用户本次分享照片想采用拍摄图像进行分享,显示单元则以拍摄图像进行显示。
50.服务器120可与终端设备110建立连接,用于将终端设备110的数据发布到互联网中,如服务器120可以将终端设备110对拍摄图像的处理图像发布到互联网中。
51.基于背景技术的问题和图1所示的系统架构,如图2所示,为本技术实施例提供的一种人脸图像处理方法,该方法可以通过图1所示的终端设备予以执行,包括以下步骤:
52.步骤201,接收包含第一人脸的第一图像。
53.在本步骤中,可通过终端设备中的处理器接收包含第一人脸的第一图像。其中,第一人脸是需要由处理器进行替换的人脸。处理器接收包含第一人脸的第一图像的节点,可以是用户打算将含有第一人脸的照片发布到互联网时并想要保证真实人脸不被呈现出来,也可以是用户在刚刚拍摄得到含有第一人脸的照片时,同步生成对真实人脸的替换图像。
54.步骤202,对所述第一图像进行处理以得到包含第二人脸的第二图像,其中所述第二人脸位于所述第一人脸所在的位置,且所述第二人脸与所述第一人脸具有相同或相似的属性,所述属性包括表情、年龄、性别中的至少一种。
55.在本步骤中,通过处理器对第一图像进行处理,从而使得得到的第二图像中的第二人脸位于原先图像中第一人脸的位置,且第二人脸与第一人脸在各种属性上具有相同或者相似的属性值,如替换的第二人脸与第一人脸具有相同或者相似的表情、年龄、性别、发型等。
56.基于该方案,通过对包含第一人脸的第一图像的处理,以使得在第一人脸所在位置使用第二人脸进行替换,从而得到包含第二人脸的第二图像,其中,第二人脸与第一人脸在各个属性上的属性值相同或者相似。通过这种对真实人脸进行替换的方式,且替换得到的人脸与用户真实的人脸在各个属性上表现为相同或者相似,如此的话,可以在用户分享人脸照片时既能够保证人脸的真实性,却又不是以用户真实的人脸进行发布,可以提高对用户个人信息的保护力度。
57.以下将结合示例分别对上述一些步骤进行详细说明。
58.在上述步骤202的一种实施中,所述对所述第一图像进行处理以得到包含第二人脸的第二图像,可通过以下步骤实现:
59.步骤301,确定所述第一图像中的所述第一人脸在设定属性上的第一属性值。
60.在本步骤中,在一种实施中,第一图像中包括一张人脸,则此时这张唯一的人脸就是第一人脸;在一种实施中,第一图像中包括多张人脸,则此时包括:第一人脸是这多张人脸中的任意一张人脸,或者第一人脸是这多张人脸中的至少两张人脸。
61.在本步骤中,设定属性包括多个预先被定义的属性,针对第一人脸,从中获取第一人脸在多个设定属性上的第一属性值。其中,所述设定属性包括表情。在一种实施中,如第一图像是a女士在微笑时候的一张自拍照,则此时a女士的脸庞就是第一人脸,且关于表情这一属性,可以确定a女士在该属性上的第一属性值为高兴。
62.步骤302,随机生成用于生成第二人脸的第一特征向量。
63.在本步骤中,一种实施方式是,第一特征向量可以为1*128维度的向量。其中,1*128维度的向量是符合目前使用的神经网络模型的一种常用规格,其中的每一个维度的特征码都用于控制着生成人脸的特征。如图3所示,为本技术实施例提供的一种多个维度的特征码与人脸特征的关系示意图。参考图3,其中的特征码1-特征码4用于控制姿势、发型、面部形状,特征码5-特征码8用于控制更精细的面部特征,特征码9-特征码18用于控制颜色和微观特征,其中所控制的颜色包括眼睛的颜色、头发的颜色和肤色。对于图中未示出的特征码19-特征码128,它们也都用于控制生成人脸的特征,其具体含义本技术中不再一一说明。
64.步骤303,将所述第一特征向量中所述设定属性所在维度的值设置为所述第一属性值,得到第二特征向量。
65.在本步骤中,通过对第一特征向量中设定属性所在维度的值进行设置,以得到第二特征向量。其中,设置的内容包括:根据步骤301中所确定出的各个设定属性对应的第一属性值、以及步骤302中的用于控制设定属性生成的特征码,将所确定的特征码的参数值分别用对应设定属性的第一属性值进行设置,从而得到更新后的1*128维度的向量,该向量即为第二特征向量。
66.步骤304,根据所述第一属性值中的表情属性值,确定所述表情属性值对应的第一人脸生成模型。
67.在本步骤中,在一种实施方式中,预先训练有多种不同表情的人脸生成模型,因此,当对第一图像中的第一人脸进行替换时,通过确定第一人脸的设定属性中的表情属性对应的表情属性值,从而可以根据表情属性值确定用于生成该表情的人脸生成模型,此时的用于生成与表情属性值对应的人脸的人脸生成模型即为第一人脸生成模型。在一种实施方式中,多种不同表情的人脸生成模型包括高兴表情的人脸生成模型、平静表情的人脸生成模型、惊讶表情的人脸生成模型、伤心表情的人脸生成模型、厌恶表情的人脸生成模型、愤怒表情的人脸生成模型、恐惧表情的人脸生成模型。在一种实施方式中,多种不同表情的人脸生成模型可以包括的人脸生成模型的种类是根据人脸表情识别模型所能够识别出来的(人脸)表情的种类进行确定的,如目前的人脸表情识别模型已经能够准确识别出高兴、平静、惊讶、伤心、厌恶、愤怒和恐惧这7种人脸表情,因此,本技术实施例中可以包括对以上7种人脸表情进行生成的人脸生成模型。可以理解的是,随着人脸表情识别模型对人脸表情的识别种类的增加,本技术实施例中的人脸生成模型的种类也可以适应增加。
68.步骤305,将所述第二特征向量输入所述第一人脸生成模型,得到第二人脸。
69.在本步骤中,通过将第二特征向量输入第一人脸生成模型,可以快速输出第二人脸。此时的第二人脸与第一人脸在同一设定属性上,具有相同的属性值。在一种实施方式中,设定属性为表情,当第一人脸是高兴表情时,则通过第一人脸生成模型得到的第二人脸的表情也是高兴;在一种实施方式中,设定属性为性别,当第一人脸是女性人脸时,则通过第一人脸生成模型得到的第二人脸的性别也是女性;在一种实施方式中,设定属性为年纪,当第一人脸是18岁的人脸时,则通过第一人脸生成模型得到的第二人脸的年纪也是18岁;在一种实施方式中,设定属性为肤色,当第一人脸的肤色是黄色(也即第一人脸是黄种人),则通过第一人脸生成模型得到的第二人脸的肤色也是黄色。
70.步骤306,将所述第一图像中的所述第一人脸替换为所述第二人脸,得到第二图像。
71.在本步骤中,通过使用第二人脸对第一图像中的第一人脸进行替换,从而生成第二图像。在一种实施方式中,在用户想要将带有人脸的照片,如第一图像,发布到互联网中时,通过使用第二图像进行发布,而不是使用真正的第一图像进行发布,如此可以保护第一图像中的第一人脸的数据不被泄漏。
72.在上述步骤304的一种实施中,所述第一人脸生成模型是通过与第一人脸表情分类模型构成对抗网络训练得到的;所述第一人脸表情分类模型用于识别出输入图像是否具有生成的第一人脸表情;所述第一人脸生成模型用于生成使得所述第一人脸表情分类模型
难以区分的人脸图像。
73.可选的,所述第一人脸生成模型是通过与第一人脸表情分类模型构成对抗网络训练得到的,包括:随机生成各第三特征向量;将各第三特征向量分别输入初始人脸生成模型,得到各第三图像;将各第三图像和具有第一人脸表情的各第四图像作为样本,对初始人脸表情分类模型进行训练,得到第一轮人脸表情分类模型;根据所述第一轮人脸表情分类模型对样本的识别结果,作为训练所述初始人脸生成模型的调整依据,得到第一轮人脸生成模型;通过所述第一轮人脸生成模型得到更新后的样本,循环更新模型,直至得到所述第一人脸生成模型和所述第一人脸表情分类模型。
74.举个例子,首先,设随机生成100个第三特征向量,分别用z1、z2、z3
……
z100表示这100个第三特征向量,其中,这100个第三特征向量均为1*128维度的向量。然后,通过将这100个第三特征向量分别输入初始人脸生成模型,则初始人脸生成模型关于这100个第三特征向量中的每一个第三特征向量分别生成一张图像,所生成的图像即为第三图像。如初始人脸生成模型关于z1、z2、z3
……
z100这些第三特征向量分别生成的第三图像依次表示为photo_z1、photo_z2、photo_z3
……
photo_z100。可以理解的是,由于尚处在对初始人脸生成模型的训练阶段,此时生成的photo_z1、photo_z2、photo_z3
……
photo_z100分别与z1、z2、z3
……
z100可能表现得完全不相似。在一种实施方式中,本技术关于不同种类的人脸表情可分别训练一个对应该表情的人脸生成模型。因此,在训练第一人脸表情(此处的第一人脸表情可以指多种不同种类的人脸表情中的任一种人脸表情)的人脸生成模型的最初阶段,获取多张关于第一人脸表情的图像作为第四图像,如获取100张关于第一人脸表情的图像,并分别记为photo1、photo2、photo3
……
photo100。
75.然后,分别将第三图像photo_z1、photo_z2、photo_z3
……
photo_z100和第四图像photo1、photo2、photo3
……
photo100作为样本,输入至初始人脸表情分类模型中,对初始人脸表情分类模型进行训练。可以理解的是,由于第四图像中的任一张图像都是对应同一种人脸表情,因此,本次所训练的初始人脸表情分类模型可以用于识别这种人脸表情,并且用于控制与该初始人脸表情分类模型形成对抗网络的初始人脸生成模型按照该初始人脸表情分类模型所能够识别的人脸表情来生成对应于该种人脸表情的人脸图像。在对初始人脸表情分类模型进行训练的过程中,包括:若初始人脸表情分类模型可以清楚地区分photo_z1、photo_z2、photo_z3
……
photo_z100这些第三图像均为初始人脸生成模型进行生成的、且可以清楚地区分photo1、photo2、photo3
……
photo100这些第四图像并非是由初始人脸生成模型进行生成的(也即,是用户拍摄得到的人脸图像),则说明初始人脸表情分类模型的精度非常高,此时可无须调整初始人脸表情分类模型的参数,此时的初始人脸表情分类模型也可以称为第一轮人脸表情分类模型;若初始人脸表情分类模型对第三图像和/或第四图像的分类结果有误的话,则需要调整初始人脸表情分类模型的参数,比如初始人脸表情分类模型将第三图像中的某一/些图像错误识别为不是由初始人脸生成模型生成的,或者初始人脸表情分类模型将第四图像中的某一/些图像错误识别为是由初始人脸生成模型生成的,则此时需要对初始人脸表情分类模型的参数进行调整,以使得参数调整后的初始人脸表情分类模型——第一轮人脸表情分类模型可以对第三图像和第四图像进行准确地分类。
76.接着,基于第一轮人脸表情分类模型可以准确地对由初始人脸生成模型生成的图
像(第三图像)和实际拍摄得到的图像(第四图像)进行分类,从而,为了使得由人脸生成模型得到的人脸可以被用于对真实人脸进行替换,因此要求由人脸生成模型得到人脸与真实人脸高度符合,如让第一轮人脸表情分类模型误以为由人脸生成模型得到的人脸是实际拍摄得到的人脸,而不是由人脸生成模型得到的人脸,也即“欺骗”到第一轮人脸表情分类模型,以致于第一轮的人脸表情分类模型对有人脸生成模型得到的人脸真假难以分辨,此时人脸生成模型得到的人脸可以用于对真实人脸进行替换。为了实现上述的目标,根据第一轮人脸表情分类模型对第三图像和第四图像的识别结果,对初始人脸生成模型的参数进行调整,得到第一轮人脸生成模型,从而,当将新一轮的第三特征向量输入到第一轮人脸生成模型,第一轮人脸生成模型可对该轮的第三特征向量对应生成第三图像,当将该轮生成的第三图像和新一轮的第四图像(可以与第一轮的第四图像相同,也可以与第一轮的第四图像不同)输入到第一轮人脸表情分类模型中,由第一轮人脸表情分类模型对该轮的第三图像和新一轮的第四图像进行分类,分别确定该轮的第三图像中的每一张图像以及新一轮的第四图像中的每一张图像的是否是由第一轮人脸生成模型进行生成的。此时,可以基于以下逻辑对第一轮人脸表情分类模型进行调整,包括:若第一轮人脸表情分类模型将该轮的第三图像中的某个/些图像识别为并非由第一轮人脸生成模型生成的,也即将该轮的第三图像中的某个/些图像识别为实际拍摄得到的人脸,从而说明由第一轮人脸生成模型得到的人脸可以在一定程度上“欺骗”到第一轮人脸表情分类模型,然而事实上这个/些“欺骗”到第一轮人脸表情分类模型的第三图像确实是由第一轮人脸生成模型进行生成的,因此说明对初始人脸生成模型进行参数调整得到的第一轮人脸生成模型在生成真实人脸的替换人脸的过程中具有较好的效果,然而第一轮人脸表情分类模型的分类效果却不是很好(也即,在分类时发生了错误,将确实是由第一轮人脸生成模型生成的人脸识别为真实拍摄得到的人脸),因此需要对第一轮人脸表情分类模型的参数进行调整,以得到新一轮的人脸表情分类模型。
77.最后,根据新一轮的第三图像和新一轮的第四图像对第二轮的人脸生成模型以及第二轮的人脸生成模型进行训练,如此交替训练,直到达到预设的训练次数,从而得到最中的第一人脸生成模型和第一人脸表情分类模型。
78.针对任一种人脸表情,如高兴、平静、惊讶、伤心、厌恶、愤怒和恐惧7种人脸表情中的任一种人脸表情,均可以通过采用对抗网络训练得到第一人脸生成模型和第一人脸表情分类模型。
79.在上述步骤301的一个实施中,所述确定第一图像中第一人脸在设定属性上的第一属性值之前,还包括:接收第一触发指令;所述第一触发指令用于指示对所述第一图像中的人脸进行替换;通过人脸识别模型,确定所述第一图像中的各人脸;接收第二触发指令;所述第二触发指令用于指示对所述第一人脸进行替换。
80.举个例子,设第一图像是某一家三口的全家福照片,包括家长a、家长b和小朋友c。设在拍摄得到该全家福照片时,家长a想要将该全家福照片发布在社交网络中,如发布在自己的微信朋友圈或者新浪微博中。在发布过程中,在家长a选中该全家福照片并准备进行发布时,此时系统可以弹出一个对话框,设对话框的内容为“确定开启人脸替换?”,响应内容可以包括:若家长a点击“否”选项,则系统直接将该全家福照片发布到社交网络中;若家长a点击“是”选项,则系统可以调用内置的人脸识别模型对该全家福照片中的人脸进行识别,
并对可以识别出来的人脸进行标识,如使用一个正红色矩形框框出所识别出来的人脸的区域,如在本技术的例子中,可被正红色矩形框框出的区域有3处,分别为家长a的人脸所在区域、家长b的人脸所在区域和小朋友c的人脸所在区域;最后,系统可继续弹出一个对话框,设该对话框的内容为“请选中需要替换的人脸”,设此时家长a点击了小朋友c的人脸所在区域的正红色矩形框,此时系统接收到的指示为用户(家长a)希望对所选中区域的人脸(小朋友c的人脸)进行替换。该示例中的家长a点击“是”选项的行为可以用于表示发出第一触发指令,相应的,系统可接收到第一触发指令;该示例中家长a点击了小朋友c的人脸所在区域的正红色矩形框的行为可以用于表示发出了第二触发指令,相应的,系统可接收到第二触发指令;该示例中的小朋友c的人脸即为第一人脸。
81.可选的,所述确定第一图像中第一人脸在设定属性上的第一属性值,包括:通过表情识别模型确定所述第一人脸的表情属性值;通过年纪识别模型确定所述第一人脸的年纪属性值;通过性别识别模型确定所述第一人脸的性别属性值。
82.如前面的例子中,家长a在本次分享全家福照片时,希望是对小朋友c的人脸进行替换,在系统接收到第二触发指令时,通过调用内置的表情识别模型确定小朋友c的表情具体是什么表情,调用内置的年纪识别模型识别小朋友c的年纪为多大,以及调用内置的性别识别模型识别小朋友c的性别为何,从而在系统得到小朋友c的多个属性分别具有的第一属性值后,对小朋友c的人脸进行替换。具体可以包括:设表情识别模型对小朋友c的表情识别结果为高兴,则系统确定调用高兴表情这一人脸生成模型来生成小朋友c的人脸的替换图像;接着,随机生成一组1*128维度的向量,在将该组向量输入到高兴表情这一人脸生成模型之前,根据年纪识别模型对小朋友c的年纪识别结果以及根据性别识别模型对小朋友c的性别识别结果,对该组1*128维度的向量中的某些控制年纪和性别的特征码的值进行调整,如将控制年纪的特征码的值设置为年纪识别模型对小朋友c的年纪识别结果,将控制性别的特征码的值设置为性别识别模型对小朋友c的性别识别结果,如此,将调整后的1*128维度的向量输入至高兴表情这一人脸生成模型,则可以快速输出与全家福照片中的小朋友c具有相同表情、相同年纪和相同性别的人脸。
83.可选的,所述确定第一图像中第一人脸在设定属性上的第一属性值,包括:接收属性输入指令;所述属性输入指令用于指示所述第一属性值。
84.如前面的例子中,家长a在本次分享全家福照片时,希望是对小朋友c的人脸进行替换,此时系统接收到第二触发指令时,一种处理方式是通过上面例子中的直接调用内置的表情识别模型、年纪识别模型和性别识别模型对小朋友c的人脸进行分别识别,另一种处理方式是提示用户(家长a)可以主动控制将小朋友c的人脸在设定属性上的第一属性值具体设置为多少,也即系统可以接收到家长a发出的属性输入指令,该属性输入指令用于指示本次小朋友c的人脸在设定属性上的第一属性值。通过该方式,可以生成与第一人脸不具有相同或者相似表情、年纪以及性别等的人脸,增加了人脸替换过程中的自主性,以及趣味性。
85.在一种实施方式中,保存所述第一图像与所述第二图像的对照关系;所述第一图像以隐藏方式存储;在接收到设定指令后,显示所述第一图像;否则,显示所述第二图像。
86.举个例子,设用户每次拍摄有关于人脸的照片时,在得到拍摄照片的同时,系统可以对拍摄照片同步生成第二图像(此时的第二图像可以是对拍摄照片中的所有人脸都进行
了相同表情、相同年纪和相同性别的替换),如此,系统可以建立起第一图像(也即拍摄图像)和第二图像的对照关系;当用户想要将第一图像发布到社交网络中时,系统默认以与该第一图像存在对照关系的第二图像进行发布,当且仅当用户确定用第一图像进行发布并不会影响自己的个人信息时,用户通过点击“切换”按钮,此时系统将可以以该第一图像进行发布,而不再以第二图像进行发布了。该方式在最大化保护用户个人信息的同时,还支持用户以真实的人脸照片进行发布,可给用户带来不错的体验感。
87.基于同样的构思,本技术实施例还提供一种终端设备,如图4所示,该终端设备包括显示单元401和处理器402;其中:
88.显示单元401,用于进行显示包含第一人脸的第一图像。
89.处理器402,被配置为:响应于用户的指令,控制所述显示单元在所述第一人脸所在的位置替换为第二人脸,其中,所述第二人脸与所述第一人脸具有相同或相似的属性,所述属性包括表情、年龄、性别中的至少一种。
90.进一步的,对于终端设备,处理器402被具体配置为:确定所述第一图像中的所述第一人脸在设定属性上的第一属性值;所述设定属性包括表情;随机生成用于生成第二人脸的第一特征向量;将所述第一特征向量中所述设定属性所在维度的值设置为所述第一属性值,得到第二特征向量;根据所述第一属性值中的表情属性值,确定所述表情属性值对应的第一人脸生成模型;将所述第二特征向量输入所述第一人脸生成模型,得到第二人脸;将所述第一图像中的所述第一人脸替换为所述第二人脸,得到第二图像。
91.进一步的,对于终端设备,所述第一人脸生成模型是通过与第一人脸表情分类模型构成对抗网络训练得到的;所述第一人脸表情分类模型用于识别出输入图像是否具有生成的第一人脸表情;所述第一人脸生成模型用于生成使得所述第一人脸表情分类模型难以区分的人脸图像。
92.进一步的,对于终端设备,处理器402被具体配置为:随机生成各第三特征向量;将各第三特征向量分别输入初始人脸生成模型,得到各第三图像;将各第三图像和具有第一人脸表情的各第四图像作为样本,对初始人脸表情分类模型进行训练,得到第一轮人脸表情分类模型;根据所述第一轮人脸表情分类模型对样本的识别结果,作为训练所述初始人脸生成模型的调整依据,得到第一轮人脸生成模型;通过所述第一轮人脸生成模型得到更新后的样本,循环更新模型,直至得到所述第一人脸生成模型和所述第一人脸表情分类模型。
93.进一步的,对于终端设备,处理器402被具体配置为:接收第一触发指令;所述第一触发指令用于指示对所述第一图像中的人脸进行替换;通过人脸识别模型,确定所述第一图像中的各人脸;接收第二触发指令;所述第二触发指令用于指示对所述第一人脸进行替换。
94.进一步的,对于终端设备,处理器402被具体配置为:通过表情识别模型确定所述第一人脸的表情属性值;通过年纪识别模型确定所述第一人脸的年纪属性值;通过性别识别模型确定所述第一人脸的性别属性值。
95.进一步的,对于终端设备,处理器402被具体配置为:保存所述第一图像与所述第二图像的对照关系;所述第一图像以隐藏方式存储;在接收到设定指令后,显示所述第一图像;否则,显示所述第二图像。
96.本技术实施例还提供了一种计算设备,该计算设备具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(personal digital assistant,pda)等。该计算设备可以包括中央处理器(center processing unit,cpu)、存储器、输入/输出设备等,输入设备可以包括键盘、鼠标、触摸屏等,输出设备可以包括显示设备,如液晶显示器(liquid crystal display,lcd)、阴极射线管(cathode ray tube,crt)等。
97.存储器,可以包括只读存储器(rom)和随机存取存储器(ram),并向处理器提供存储器中存储的程序指令和数据。在本技术实施例中,存储器可以用于存储人脸图像处理方法的程序指令;
98.处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行人脸图像处理方法。
99.如图5所示,为本技术实施例提供的一种计算设备的示意图,该计算设备包括:
100.处理器501、存储器502、收发器503、总线接口504;其中,处理器501、存储器502与收发器503之间通过总线505连接;
101.所述处理器501,用于读取所述存储器502中的程序,执行上述人脸图像处理方法;
102.处理器501可以是中央处理器(central processing unit,简称cpu),网络处理器(network processor,简称np)或者cpu和np的组合。还可以是硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,简称asic),可编程逻辑器件(programmable logic device,简称pld)或其组合。上述pld可以是复杂可编程逻辑器件(complex programmable logic device,简称cpld),现场可编程逻辑门阵列(field-programmable gate array,简称fpga),通用阵列逻辑(generic array logic,简称gal)或其任意组合。
103.所述存储器502,用于存储一个或多个可执行程序,可以存储所述处理器501在执行操作时所使用的数据。
104.具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器502可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,简称ram);存储器502也可以包括非易失性存储器(non-volatile memory),例如快闪存储器(flash memory),硬盘(hard disk drive,简称hdd)或固态硬盘(solid-state drive,简称ssd);存储器502还可以包括上述种类的存储器的组合。
105.存储器502存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
106.操作指令:包括各种操作指令,用于实现各种操作。
107.操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
108.总线505可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
109.总线接口504可以为有线通信接入口,无线总线接口或其组合,其中,有线总线接口例如可以为以太网接口。以太网接口可以是光接口,电接口或其组合。无线总线接口可以为wlan接口。
110.本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行人脸图像处理方法。
111.本领域内的技术人员应明白,本技术的实施例可提供为方法、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
112.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
113.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
114.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
115.尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
116.显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1