人脸识别方法、装置、电子设备和介质与流程

文档序号:22834817发布日期:2020-11-06 16:26阅读:75来源:国知局
人脸识别方法、装置、电子设备和介质与流程
本发明涉及计算机视觉
技术领域
,尤其是涉及一种人脸识别方法、装置、电子设备和介质。
背景技术
:人脸识别技术隶属生物识别技术范畴,已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域,用于提升系统的安全性以及应用服务的便捷性。一般而言,通过提取视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征以及深度学习卷积网络模型提取的卷积特征,并根据提取出的差异性人脸特征构建分类模型,实现人脸唯一性识别。针对存在遮挡区域的人脸识别问题,由于遮挡物的存在,加之有些人的眼部生物学特征具有较强的相似性,特征提取不够精准或者无法提取有效的特征,原有人脸识别技术准确率很低,甚至通常无法识别、使用。技术实现要素:本申请提供了一种人脸识别方法、装置、电子设备和介质。第一方面,提供了一种人脸识别方法,包括:获取待识别人脸图像;基于第一网络结构对所述待识别人脸图像进行特征提取,获得所述待识别人脸图像的人脸特征数据;通过目标字典参数对所述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据;基于第二网络结构对所述调整特征数据进行处理,获得目标人脸特征向量;通过比对所述目标人脸特征向量和模板人脸特征向量,确定所述待识别人脸图像的识别结果。在一种可选的实施方式中,所述通过目标字典参数对所述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据,包括:确定所述待识别人脸图像的人脸特征数据中的非关注特征元素和关注特征元素;将所述非关注特征元素置为0。在一种可选的实施方式中,所述方法还包括:获取多组样本人脸图像对,所述样本人脸图像对包括样本人脸图像与对应的样本遮挡人脸图像,所述样本遮挡人脸图像为存在遮挡物的样本人脸图像;基于第一网络结构分别对所述多组样本人脸图像对进行特征提取,获得所述多组样本人脸图像对的特征向量;通过目标生成器获取所述多组样本人脸图像对的特征向量的差值;再根据所述特征向量的差值确定用于遮挡情况下特征识别的所述非关注特征元素和所述关注特征元素;根据所述特征向量的差值确定用于遮挡情况下特征识别的所述非关注特征元素和所述关注特征元素。在一种可选的实施方式中,所述目标生成器的网络结构包括:一个卷积层、一个prelu激活层、一个组归一化层和一个sigmoid激活层;所述卷积层的卷积核大小为3x3,步长为1,填充为1,通道数为512。在一种可选的实施方式中,所述根据所述特征向量的差值确定用于特征识别的非关注特征元素和关注特征元素,包括:获取所述特征向量的差值的平均值;将所述平均值的特征图水平拉伸,获得平均特征向量;获取参考比例阈值n%;确定所述平均特征向量的元素从小到大排列情况下前n%的元素为所述非关注特征元素,其余元素为所述关注特征元素。在一种可选的实施方式中,所述通过比对所述目标人脸特征向量和模板人脸特征向量,确定所述待识别人脸图像的识别结果包括:获取所述目标人脸特征向量和所述模板人脸特征向量的相似度;在所述相似度大于或等于预设的特征相似度阈值的情况下,确定所述待识别人脸图像识别成功;在所述相似度小于所述预设的特征相似度阈值的情况下,确定所述待识别人脸图像识别失败。在一种可选的实施方式中,所述模板人脸特征向量为:模板人脸图像基于所述第一网络结构进行特征提取、通过所述目标字典参数对所述模板人脸图像的人脸特征数据进行调整,再基于所述第二网络结构处理获得的人脸特征向量。在一种可选的实施方式中,所述样本人脸图像为干净人脸图像;所述方法还包括:获取多个遮挡物图像,基于所述干净人脸图像和所述遮挡物图像合成所述样本遮挡人脸图像。第二方面,提供了一种人脸识别装置,包括:获取模块,用于获取待识别人脸图像;第一提取模块,用于基于第一网络结构对所述待识别人脸图像进行特征提取,获得所述待识别人脸图像的人脸特征数据;调整模块,用于通过目标字典参数对所述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据;第二提取模块,用于基于第二网络结构对所述调整特征数据进行处理,获得目标人脸特征向量;识别处理模块,用于通过比对所述目标人脸特征向量和模板人脸特征向量,确定所述待识别人脸图像的识别结果。第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如第一方面及其任一种可能的实现方式的步骤。第四方面,提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面及其任一种可能的实现方式的步骤。本申请通过获取待识别人脸图像,基于第一网络结构对上述待识别人脸图像进行特征提取,获得上述待识别人脸图像的人脸特征数据,再通过目标字典参数对上述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据,然后基于第二网络结构对上述调整特征数据进行处理,获得目标人脸特征向量,进而可以通过比对上述目标人脸特征向量和模板人脸特征向量,确定上述待识别人脸图像的识别结果,可以实现不同情境下的人脸识别,在调整时强化对人脸识别贡献大的特征,尤其是能提升遮挡人脸识别的准确率,可以结合多种特征提取网络模型,具有较强通用性。附图说明为了更清楚地说明本申请实施例或
背景技术
中的技术方案,下面将对本申请实施例或
背景技术
中所需要使用的附图进行说明。图1为本申请实施例提供的一种人脸识别方法的流程示意图;图2为本申请实施例提供的一种人脸识别处理步骤示意图;图3为本申请实施例提供的另一种人脸识别方法的流程示意图;图4为本申请实施例提供的一种扁平化处理流程示意图;图5为本申请实施例提供的一种人脸识别方法的训练流程示意图;图6为本申请实施例提供的一种人脸识别装置的结构示意图;图7为本申请实施例提供的一种电子设备的结构示意图。具体实施方式为了使本
技术领域
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。下面结合本申请实施例中的附图对本申请实施例进行描述。请参阅图1,图1是本申请实施例提供的一种人脸识别方法的流程示意图。该方法可包括:101、获取待识别人脸图像。本申请实施例中的执行主体为人脸识别装置,可以实现人脸识别处理包括遮挡人脸识别。该人脸识别装置可以为一种电子设备,具体实现中,上述电子设备为一种终端,也可称为终端设备,包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备,可以通过应用程序实现人脸识别功能。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。在一种实施方式中,本申请实施例中的电子设备可以为具有摄像头的人脸识别装置,如考勤装置或门禁装置等。上述待识别人脸图像即为将要进行人脸特征提取和身份识别的人脸图像,可以通过设备摄像头采集。设备通过摄像头捕捉到当前待处理图像后,可以经过人脸检测算法判断图像中是否有人脸,存在人脸的情况下裁剪人脸检测框,并经过人脸对齐算法将面部关键点矫正对齐,以获得本申请实施例中提到的待识别人脸图像,然后再通过模型进行识别。其中,本申请实施例中的待识别人脸图像可以为存在遮挡物的人脸图像,上述遮挡物可以理解为对人脸图像中人脸特征识别区域有所遮挡的元素,可包括如口罩、围巾、墨镜、帽子等物体中的一种或几种,本申请实施例对此不作限制。在一种实施方式中,对于采集到的人脸图像可以先检测其是否存在上述遮挡物,若不存在,对无遮挡的干净人脸图像可以通过一般的人脸识别方式进行处理,或者说仍然使用本申请实施例中提到的网络结构处理,但不需要在处理过程中采用目标字典参数来调整;当检测到存在遮挡物的待识别人脸图像的情况下,再执行本申请实施例中的人脸识别方法,本申请实施例对此不作限制。102、基于第一网络结构对上述待识别人脸图像进行特征提取,获得上述待识别人脸图像的人脸特征数据。为了更清楚地介绍本申请实施例中的方法,首先对网络结构进行描述。相对于一般的特征提取网络,本申请实施例涉及到的用于人脸特征处理的网络结构可分为两部分:从输入层到最后卷积层的第一网络结构,和最后卷积层到人脸特征向量输出层的第二网络结构。可以参见表1,表1为本申请实施例提供的一种网络结构示意图,如表1所示,该网络结构可以用于人脸特征提取和识别,以表1为例,其中第一部分a(1-9行所示)即为第一网络结构,第二部分b(10、11行所示)即为第二网络结构。输入(input)操作(operator)cns112×112×3conv3×3641256×56×64bottleneck644156×56×64depthwiseconv3×31281228×28×128bottleneck1288128×28×128depthwiseconv3×32561214×14×256bottleneck25616114×14×256depthwiseconv3×3512127×7×512bottleneck512517×7×512conv1×1512117×7×512lineargdcconv7×7512111×1×512linearconv1×1512/25611表1具体的,上述输入中112x112x3为输入图片尺寸:长、宽、rgb3通道(长宽范围96-112),56x56x64为上层112x112x3输入图片经过操作(operator)中的conv3x3卷积得到的输出特征图的尺寸,56x56x64分别为特征图长、宽、通道数,c为本层的输入经过操作得到输出的特征图的通道数,n为本层操作的次数,s为本层操作的步长,以此类推。其中512/256为最终输出的人脸特征编码或向量;bottleneck为残差单元,对应的n为残差单元的个数;depthwiseconv3x3为深度可分离卷积,具体操作见上述表格,其中conv为卷积层,后面的数字1x1、3x3表示卷积核的长、宽大小;lineargdcconv7x7表示全局深度可分离卷积,设置卷积核的大小等于输出特征图的长、宽7x7;linearconv1x1为卷积核长、宽为1x1的线性卷积层。可见第一网络结构包含输入层到最后卷积层,第二网络结构包括上述最后卷积层到人脸特征向量输出层。以上仅为一种网络模型的举例说明,本申请实施例中的方法还可以兼容其他网络结构,进行类似的划分,对具体网络结构不做限制。具体的,待识别人脸图像可以输入第一网络结构进行特征提取处理,输出上述待识别人脸图像的人脸特征数据。本申请实施例中对特征提取的具体算法不做限制。特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征,特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。对于人脸图像的特征提取可以将人脸图像上的像素点分为对应人脸特征(如眉毛、眼睛、鼻子等)的子集。由第一网络结构处理后获得的人脸特征数据或称为特征向量(编码),不是最终的人脸特征数据,由于遮挡物等因素的影响,可以通过步骤103提高特征提取的准确度,以提高人脸识别的精度。103、通过目标字典参数对上述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据。具体的,可以在特征提取的中间环节,执行对人脸特征数据的调整,确定不同区域特征的关注度,强化对人脸识别贡献大的特征,将对人脸识别贡献不大的如口罩区域的特征弱化,从而提升后续的特征提取效果。在一种实施方式中,上述步骤103具体可包括:通过训练目标生成器获得的目标字典参数对所述待识别人脸图像的人脸特征数据进行调整。其中,上述目标字典参数可以是基于目标生成器(如mask生成器)获得的。具体的,可以预先以多组干净人脸图像与对应的遮挡人脸图像为样本训练mask生成器,以获得目标字典参数,也可以称为mask字典常量,它可以理解为用于调整图像中各元素关注度的参数。训练后的网络结构可以利用mask字典常量对上述待识别人脸图像的人脸特征数据进行调整,具体可以包括:确定待识别人脸图像的人脸特征数据中的非关注特征元素和关注特征元素;将上述非关注特征元素置为0。在本申请实施例中,遮挡物即对应上述非关注特征元素。可以理解为,获得的mask字典常量为包含参数0、1的矩阵,其中的参数对应并区别人脸特征中的遮挡部分和未遮挡部分,可用于调整人脸特征数据,将非关注特征元素乘以0,置为0,将关注特征元素乘以1,保留用于特征提取和识别。由此仅关注人脸未遮挡区域特征提取和识别的处理。在实际应用中,模型训练好后,会对人脸面部特征建立索引,即可以标识出其中非关注特征的区域。可见对于无遮挡物的人脸图像的识别处理不会有影响,即不存在需要乘以0、置为0的非关注特征元素,因此最终比对的依然是非置0的区域。无论是否有遮挡物的影响,该模型都能够准确地进行特征提取和人脸识别处理。在上述调整处理之后可以将上述调整特征数据输入第二网络结构。104、基于第二网络结构对上述调整特征数据进行处理,获得目标人脸特征向量。由上述mask字典常量调整的特征数据可以继续通过第二网络结构中的全连接层继续处理,得到对应的最终人脸特征向量,完成整个特征提取流程,再执行步骤105的识别操作。105、通过比对上述目标人脸特征向量和模板人脸特征向量,确定上述待识别人脸图像的识别结果。具体地,可以通过特征向量的比对进行人脸识别和身份验证。在一种可选地实施方式中,上述步骤105包括:获取上述目标人脸特征向量和上述模板人脸特征向量的相似度;在上述相似度大于或等于预设的特征相似度阈值的情况下,确定上述待识别人脸图像识别成功;在上述相似度小于上述预设的特征相似度阈值的情况下,确定上述待识别人脸图像识别失败。在人脸识别的身份认证场景中,可以预先设置特征相似度阈值,通过与用户注册时的干净人脸图像对应的人脸特征向量进行比对,获得两两比对的人脸相似度,通过比较该相似度与预设的特征相似度阈值来确定人脸身份是否匹配:若该相似度大于或等于预设的特征相似度阈值,则判定匹配,身份验证成功;若小于该特征相似度阈值,则判定不匹配,身份验证失败。比如,特征相似度阈值可以设置为0.23-0.24,若需要拒识率低,可阈值设置偏小,为0.23左右;若需要错误接收率低(误识率),则阈值设置偏大,为0.24左右,可根据具体的应用场景设置,本申请实施例对此不做限制。其中,上述模板人脸特征向量为:上述模板人脸图像基于上述第一网络结构进行特征提取、通过上述目标字典参数对上述模板人脸图像的人脸特征数据进行调整,再基于上述第二网络结构处理获得的人脸特征向量。上述模板人脸图像可以是在用户注册时采集并存储的人脸图像,用于身份核验时的人脸识别。在一种实施方式中,上述模板人脸图像为待识别人脸图像对应的比对图像,该方法通过一对一的相似度度量,验证待识别人脸图像与模板人脸图像是否匹配。举例来讲适用于用户通过任意自身账号进行身份核验的场景,如基于身份证的人脸识别,则模板人脸图像为身份证人脸图像,或者用户使用已注册账号登录应用程序、在应用程序内执行操作时需要的人脸识别验证,其中的模板人脸图像为预先采集的并与该账号绑定的模板人脸图像。可选的,本申请实施例中存储的模板人脸图像可以包括多个用户的模板人脸图像,则在人脸识别过程中需要将该待识别人脸图像与各个模板人脸图像进行比对,可通过一对多的相似度度量,验证待识别人脸图像是否与其中一个模板人脸图像匹配,以确定用户身份。举例来讲,企事业单位使用人脸考勤系统的场景,在考勤设备中录入各个员工的模板人脸图像,在每个员工进行考勤时的处理操作如上;又如某些单位通过布设在相关位置的监控头进行人脸识别,或者社区的管理单位通过门禁系统的摄像头进行身份核验的场景;以及刷脸乘车、刷脸登机、刷脸支付时的应用场景,均适用。需要注意的是,上述模板人脸特征向量也是通过与前述步骤102-步骤104中待识别人脸图像相同的处理后获得的,即干净的模板人脸图像也要通过第一网络结构,得到最后卷积层的特征图,再使用目标字典参数调整处理,再通过第二网络结构处理,得到对应的人脸特征向量,再用于比对。上述模板人脸图像的处理时间节点不做限制。可以参见如图2,图2为本申请实施例提供的一种人脸识别处理步骤示意图,其中从应用层面介绍了本申请实施例中的人脸识别方法:对于待处理的人脸图像(戴口罩或未戴口罩)a,可以:21、输入第一网络结构进行初步特征提取处理;22、通过第一网络结构最后卷积层输出特征图b;23、乘以mask字典常量m;24、输入第二网络结构继续特征提取处理;25、通过第二网络结构输出最终人脸编码向量f。概括地,以戴口罩的人脸为例进行说明,本申请利用成对的同一个人的未戴口罩与戴有口罩的人脸图片,训练出能够识别出二者差异性特征的卷积网络(轻量化结构),其中主要方法是根据mask生成器的输出以及口罩与人脸面积的占比处理后得到字典常量,该字典常量可以表现为一种0-1二值化的矩阵,用于处理戴口罩的人脸图片特征,作为最终比对的数据输入。上述方法的优点包括,构建的算法模型能够处理掉带有口罩部分的特征,使得在计算人脸相似性时,只考虑未遮挡区域,达到与具有注意力机制的算法模型同等识别效果。由于二值化矩阵生成时采用图像随机分割、遮挡进行处理,该方案对于人脸遮挡物的种类不限于口罩,遮挡位置也不限于嘴角鼻子等,因此该方案更具较强的通用性。本申请实施例通过获取待识别人脸图像,基于第一网络结构对上述待识别人脸图像进行特征提取,获得上述待识别人脸图像的人脸特征数据,再通过目标字典参数对上述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据,然后基于第二网络结构对上述调整特征数据进行处理,获得目标人脸特征向量,进而可以通过比对上述目标人脸特征向量和模板人脸特征向量,确定上述待识别人脸图像的识别结果,可以实现不同情况下的人脸识别,在特征提取中利用目标字典参数调整特征,尤其是对存在遮挡物的人脸识别过程中,对人脸识别贡献不大的如口罩区域的特征弱化,强化对人脸识别贡献大的特征,从而提升遮挡人脸识别的准确率,可以结合多种特征提取网络模型,具有较强通用性。上述实施例主要介绍了人脸识别方法在应用侧的处理步骤。为了更清楚地介绍本申请实施例中的方案,将结合图3进一步进行阐述。请参阅图3,图3是本申请实施例提供的另一种人脸识别方法的流程示意图。如图3所示,该方法为前述利用mask生成器的训练方法,图3所示的方法可以用于获得图1所示实施例中的目标字典参数。该方法具体可包括:301、获取多组样本人脸图像对,上述样本人脸图像对包括样本人脸图像与对应的样本遮挡人脸图像。在一种可选的实施方式中,上述样本人脸图像为干净(无遮挡物)人脸图像,同一人可以有对应的多张人脸图像;上述方法还包括:获取多个遮挡物图像,基于上述干净人脸图像和上述遮挡物图像合成上述样本遮挡人脸图像。可选的,可以上述干净人脸上生成各种样式带口罩的合成图像,作为样本遮挡人脸图像。可以在一张干净的人脸图像的基础上生成一张或者多张不同样式带口罩的人脸图像。在一种实施方式中,上述基于上述干净人脸图像和上述遮挡物图像合成上述样本遮挡人脸图像可包括:对上述遮挡物图像进行轮廓和关键点检测,对上述干净人脸图像进行关键点检测,确定上述遮挡物图像与上述干净人脸图像的关键点映射信息;根据上述关键点映射信息,将上述干净人脸图像和上述遮挡物图像合成为上述样本遮挡人脸图像。可以通过人脸关键点检测算法对人脸图像进行关键点检测,确定人脸图像中的多个关键点,对遮挡物图像进行轮廓和关键点检测,确定其关键点,包括边缘关键点。以一张干净人脸图像和一张遮挡物图像为例,则可基于两者关键点检测结果确定关键点映射信息,可以理解为确定人脸图像与遮挡物图像重叠的关键点对,从而将遮挡物图像叠加在将干净人脸图像上,合成样本遮挡人脸图像。比如根据鼻尖、脸的位置、像素值等参数确定口罩的合成位置。302、基于第一网络结构分别对上述多组样本人脸图像对进行特征提取,获得上述多组样本人脸图像对的人脸特征数据。上述第一网络结构对样本人脸图像对的特征提取可以是一组一组进行处理的。其中,通过上述第一网络结构对各图像的处理步骤可以参考图1所示实施例中步骤102中的具体描述,以获得多组样本人脸图像对中各个人脸图像的人脸特征数据,此处不再赘述。303、通过目标生成器上述多组样本人脸图像对的人脸特征数据进行处理,获得上述多组样本人脸图像对的特征向量的差值。具体的,上述目标生成器的网络结构可以包括:一个卷积层,一个组归一化层,以及分别对应卷积层和组归一化层的两个激活层。其中上述mask生成器的网络结构具体可以为:1层卷积层,其中卷积核大小为3x3,步长为1,填充为1,通道数为512,即512个卷积核;后接1个prelu激活层,1个groupnorm层,1个sigmoid激活层。举例来讲,成对的干净人脸和口罩人脸输入到上述第一网络结构中得到的最后卷积层的特征图作为mask生成器的输入,mask生成器可以获取其每对特征图的差值,即上述多组样本人脸图像对的特征向量的差值进行训练。mask生成器的输出为,先后经过上述1层卷积层、1个prelu激活层,1个groupnorm层,1个sigmoid激活层得到的输出。具体来讲,可以为7x7x512的特征图,其中7、7、512分别表示特征图的长、宽、通道数(此处以表1中的网络结构进行说明,其他的网络结构特征图不一定相同,其中7x7对应人脸图像经过第一网络结构最后卷积层输出的特征图1或2的长、宽,512维是取决于最终输出的人脸特征向量的维数,512还可以换成256或128等,此处不做限制)。304、根据上述特征向量的差值确定用于遮挡情况下特征识别的上述非关注特征元素和上述关注特征元素。基于多组样本的特征向量的差值进行训练,以获得mask字典参数。在一种可选的实施方式中,上述步骤304包括:获取上述特征向量的差值的平均值;将上述平均值的特征图水平拉伸,获得平均特征向量;获取参考比例阈值n%;确定上述平均特征向量的元素从小到大排列情况下前n%的元素为上述非关注特征元素,其余元素为上述关注特征元素。其中,上述特征图拉伸是指将多维特征图变成一维的降维处理过程。mask字典参数的获取是通过mask生成器输出的所有图像对的7x7x512的特征图,再获取特征图平均值,将此平均值7x7x512的立体特征图进行水平拉伸,获得一个预设值的平均特征向量,比如25088大小的向量。进一步地,可以预先设置参考比例阈值n%,对于平均特征向量的元素从小到大进行排列,可以取排列在前n%的元素确定为上述非关注特征元素,其余元素为上述关注特征元素。通过mask字典常量,使特征数据中的非关注特征元素乘以0,不再考虑其特征提取,而关注特征元素通过乘以1的方式保持原样,用于特征提取和识别。可选的,上述参考比例阈值n%可以根据需要进行设置,比如25%,可以较好地对应口罩与人脸的面积比例。相比不带口罩的人脸,有口罩部分的特征值偏小,实际情况口罩面积占比有一定出入,本申请实施例对此阈值不做限定。根据上述样本数据训练mask生成器,获取mask字典参数,可以实现将对人脸识别贡献不大的特征元素(如遮挡部位的特征)置为0,将对人脸识别贡献大的特征元素(如眼睛、眉毛等部位的)不变。需要注意的是,利用训练完成的网络模型进行识别时,可以实现对存在遮挡物的人脸图像的识别,一般的干净人脸依然可以识别,即当人脸图像为无遮挡物时,对比的对象依然会将预设比例的非关注特征元素置为0,这相当如处理了遮挡物部分。而在对网络模型训练时,才需要用到包含遮挡物的人脸图像样本。可以参见如图4所示的一种扁平化处理流程示意图,如图4所示,如图4所示,对于多组人脸图像(包括干净人脸图像和对应的遮挡人脸图像)中的每个图像,均通过第一网络结构进行处理,分别获得对应的特征图1和特征图2;再进行相关的差分运算和如图所示的网络处理,可以获得对应的mask特征图(特征向量)。具体的,关于mask字典的生成方法举例来讲,比如现在有9万对人脸图像经过上述流程图,得到9万个扁平化处理的特征向量,对这些特征向量求平均值(特征图平均值跟样本数有关),得到一个平均特征向量,将此平均特征向量的元素从小到大前25%的元素置为0,其余元素保留,对应用于该特征调节的包含0和1的矩阵即可以看作mask字典常量。其中,每对人脸图像是成对的干净人脸和合成的口罩人脸,除了口罩区域外其它都相同,并且可选的,同一个人可以有多对人脸图像,即同一个人可能存在年龄、光线、姿态、表情、背景、衣服、是否化妆等不同的情形。根据最终输出的两者的特征编码向量,同一个人的就使得特征向量之间的距离最小化,不同人的就使得特征向量之间的距离最大化。再结合表1所示的网络结构,以及按照前述9万对人脸图像进行扁平化处理继续举例,可以获得对应的多个一维向量以及求得其平均,具体可以表示为:p1:[a1,a2,...,a25088];p2:[b1,b2,...,b25088];以此类推,直到p90000:[m1,m2,...,m25088];扁平处理一维向量平均mask:[mean1,mean2,...,mean25088],其中,进一步具体的,可以参见如图5所示的一种人脸识别方法的训练流程示意图,如图5所示的流程展示了包括如图4所示的步骤在内的整个训练流程。其中,对于与图4相同的部分不再赘述,具体在获得mask特征图并获取扁平化处理特征向量后,可以利用该扁平化处理特征向量分别与前述获得的特征图1和特征图2相乘,即对应前述目标字典参数调整,再输入第二网络结构继续处理,获得最终编码向量。本申请实施例通过获取多组样本人脸图像对,上述样本人脸图像对包括样本人脸图像与对应的样本遮挡人脸图像,基于第一网络结构分别对上述多组样本人脸图像对进行特征提取,获得上述多组样本人脸图像对的人脸特征数据,然后通过目标生成器上述多组样本人脸图像对的人脸特征数据进行处理,获得上述多组样本人脸图像对的特征向量的差值,根据上述特征向量的差值确定用于遮挡情况下特征识别的上述非关注特征元素和上述关注特征元素,可以训练目标生成器,获得目标字典参数,用于如图1所示的人脸识别处理过程,调整在特征提取处理中不同特征元素的关注度,以降低遮挡物对特征提取的影响,提升遮挡人脸识别的准确率。并且可以兼容其他不同的人脸识别网络结构实现遮挡人脸识别,具有较强通用性。目前的人脸识别技术,面临的主要问题为人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物(例如口罩、墨镜、头发围巾、帽子、胡须等)、年龄等多方面因素的影响。针对遮挡区域的人脸识别问题,通常人脸识别技术无法使用,原因是人脸由于遮挡物的存在,无法提取有效的特征。目前可能存在具有注意力机制的卷积网络,能够提取未遮挡区域人脸的有效特征,但是相比干净人脸整体丢失较为严重,准确率低。本申请主要解决人脸有遮挡物的识别问题,通过数据增强以及构造针对性的人脸特征提取网络层,降低遮挡物对特征提取的影响,提升模型在戴口罩场景下的适用性和识别准确率。基于上述人脸识别方法实施例的描述,本申请实施例还公开了一种人脸识别装置。请参见图6,人脸识别装置600包括:获取模块610,用于获取待识别人脸图像;第一提取模块620,用于基于第一网络结构对上述待识别人脸图像进行特征提取,获得上述待识别人脸图像的人脸特征数据;调整模块630,用于通过目标字典参数对上述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据;第二提取模块640,用于基于第二网络结构对上述调整特征数据进行处理,获得目标人脸特征向量;识别处理模块650,用于通过比对上述目标人脸特征向量和模板人脸特征向量,确定上述待识别人脸图像的识别结果。可选的,上述调整模块630具体用于:确定上述待识别人脸图像的人脸特征数据中的非关注特征元素和关注特征元素;将上述非关注特征元素置为0。可选的,涉及到模型训练时,上述获取模块610还用于,获取多组样本人脸图像对,上述样本人脸图像对包括样本人脸图像与对应的样本遮挡人脸图像,上述样本遮挡人脸图像为存在遮挡物的样本人脸图像;上述第一提取模块620还用于,基于第一网络结构分别对上述多组样本人脸图像对进行特征提取,获得上述多组样本人脸图像对的人脸特征数据;上述调整模块630还用于:通过目标生成器获取上述多组样本人脸图像对的特征向量的差值;再根据上述特征向量的差值确定用于遮挡情况下特征识别的上述非关注特征元素和上述关注特征元素。可选的,上述目标生成器的网络结构包括:一个卷积层、一个prelu激活层、一个组归一化层和一个sigmoid激活层;所述卷积层的卷积核大小为3x3,步长为1,填充为1,通道数为512。进一步可选的,上述调整模块630具体用于:获取上述特征向量的差值的平均值;将上述平均值的特征图水平拉伸,获得平均特征向量;获取参考比例阈值n%;确定上述平均特征向量的元素从小到大排列情况下前n%的元素为上述非关注特征元素,其余元素为上述关注特征元素。可选地,上述识别处理模块650具体用于:获取上述目标人脸特征向量和上述模板人脸特征向量的相似度;在上述相似度大于或等于预设的特征相似度阈值的情况下,确定上述待识别人脸图像识别成功;在上述相似度小于上述预设的特征相似度阈值的情况下,确定上述待识别人脸图像识别失败。可选的,上述模板人脸特征向量为:模板人脸图像基于上述第一网络结构进行特征提取、通过上述目标字典参数对上述模板人脸图像的人脸特征数据进行调整,再基于上述第二网络结构处理获得的人脸特征向量。可选地,上述样本人脸图像为干净人脸图像;上述获取模块610还用于,获取多个遮挡物图像,基于上述干净人脸图像和上述遮挡物图像合成上述样本遮挡人脸图像。根据本申请的一个实施例,图1和图3所示的方法所涉及的各个步骤均可以是由图6所示的人脸识别装置600中的各个模块执行的,此处不再赘述。在一种实施方式中,可以在其他设备上执行本申请实施例中涉及的网络训练过程,获得训练后的模型,在该人脸识别装置600中基于训练后的模型执行如图1所示的应用方法。也可以在该人脸识别装置600中执行训练和应用步骤,本申请实施例对此不作限制。本申请实施例中的人脸识别装置600,通过获取待识别人脸图像,基于第一网络结构对上述待识别人脸图像进行特征提取,获得上述待识别人脸图像的人脸特征数据,再通过目标字典参数对上述待识别人脸图像的人脸特征数据进行调整,获得调整特征数据,然后基于第二网络结构对上述调整特征数据进行处理,获得目标人脸特征向量,进而可以通过比对上述目标人脸特征向量和模板人脸特征向量,确定上述待识别人脸图像的识别结果,可以实现不同情况下的人脸识别,尤其是能通过调整将对人脸识别贡献不大的如口罩区域的特征弱化,强化对人脸识别贡献大的特征,从而提升遮挡人脸识别的准确率,可以结合多种特征提取网络模型,具有较强通用性。基于上述方法实施例以及装置实施例的描述,本申请实施例还提供一种电子设备。请参见图7,该电子设备700至少包括处理器701、输入设备702、输出设备703以及计算机存储介质704。其中,终端内的处理器701、输入设备702、输出设备703以及计算机存储介质704可通过总线或其他方式连接。计算机存储介质704可以存储在终端的存储器中,上述计算机存储介质704用于存储计算机程序,上述计算机程序包括程序指令,上述处理器701用于执行上述计算机存储介质704存储的程序指令。处理器701(或称cpu(centralprocessingunit,中央处理器))是终端的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能;在一个实施例中,本申请实施例上述的处理器701可以用于进行一系列的处理,包括如图1和图3所示实施例中方法等等。本申请实施例还提供了一种计算机存储介质(memory),上述计算机存储介质是终端中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端中的内置存储介质,当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器701加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。在一个实施例中,可由处理器701加载并执行计算机存储介质中存放的一条或多条指令,以实现上述实施例中的相应步骤;具体实现中,计算机存储介质中的一条或多条指令可以由处理器701加载并执行图1和/或图3中方法的任意步骤,此处不再赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriberline,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-onlymemory,rom),或随机存储存储器(randomaccessmemory,ram),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digitalversatiledisc,dvd)、或者半导体介质,例如,固态硬盘(solidstatedisk,ssd)等。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1