基于残差量化卷积神经网络的人脸识别方法及装置与流程

文档序号:15559336发布日期:2018-09-29 01:52阅读:171来源:国知局
本发明属于机器学习领域,涉及人脸识别方法及装置,具体涉及一种基于残差量化卷积神经网络的人脸识别方法及装置。
背景技术
:人脸识别是利用人类脸部的生物特征信息,通过一定的技术识别对应人的身份,例如,获得目标人物的人脸图像后从大量待判定的人脸图像中判定出与该目标人物一致人脸图像。人脸识别在计算机视觉与模式识别领域是一项重要的研究工作,也具有丰富的实际生活应用场景,如社区安防、罪犯追逃、移动支付等等。人脸识别技术的发展已有数十年,早些年的许多相关的机器学习算法被提出,包括基于几何特征的方法和基于统计的方法等等。不过,受到光照亮度、呈现姿态、面部妆容以及环境遮挡等问题的影响,这些早期的机器学习方法识别精度都不理想,一旦环境或人物妆容发生较大变化,则难以准确地进行人脸识别。近几年中,基于卷积神经网络的方法被广泛用于人脸识别上,并取得了较好的识别精度。其主要流程为利用训练集对卷积神经网络进行训练,并采用训练好的卷积神经网络进行特征提取获得目标图像以及待判定图像的向量,再通过基于向量的相似度判定方法,即可将相似度最高的待判定图像判定为目标人物。由于人脸图像较为复杂、相关特征难以准确表示,而各种卷积神经网络模型及算法中,基于残差学习机制的卷积神经网络具有良好的学习能力和泛化能力,因此能够适用于人脸识别任务。现有技术中,有科研人员采用了残差卷积神经网络结构,用三个公开数据集超过1.7万人的约70万张图像训练模型,并在人脸识别数据集lfw上取得了优异的精度。然而,卷积神经网络模型中的各层均存在对应的参数矩阵,而50层的残差网络模型就有超过2500万的参数。应用于人脸识别时,对于通常的人脸图像尺寸所对应的224×224大小的3通道输入,其计算过程包括42亿多次的浮点乘法,因而存储和计算的开销十分巨大,当应用于大规模的人脸识别时(例如待判定图像的数量巨大时)则更容易产生参数过量、模型过大和海量计算、效率低下的问题,这不仅提升了完成人脸识别所需的硬件要求,还将增加模型训练所需的时间甚至使得训练过程几乎无法完成,导致基于残差学习机制的卷积神经网络难以实际地应用在人脸识别任务上。技术实现要素:为解决上述问题,提供一种既能够完成大规模的人脸识别,又能够减小计算量从而降低硬件需求、减少训练所需时间的人脸识别方法及装置,本发明采用了如下技术方案:本发明提供了一种基于残差量化卷积神经网络的人脸识别方法,用于对目标图像进行人脸识别并从多个待判定图像中判定出与目标图像相一致的人脸图像,其特征在于,包括如下步骤:步骤s1,构建卷积神经网络模型并采用多个现有人脸图像作为训练集对该卷积神经网络模型进行基于残差量化的训练,得到训练后的卷积神经网络模型作为特征提取模型;步骤s2,对目标图像进行预处理获得预处理目标图像,并对待判定图像进行预处理获得对应的预处理待判定图像;步骤s3,将预处理待判定图像及预处理目标图像依次输入特征提取模型,从而得到分别与预处理待判定图像相对应的多个待判定特征向量以及与预处理目标图像相对应的目标特征向量;步骤s4,根据目标特征向量以及待判定向量判定出待判定图像中的与目标图像一致的人脸图像,其中,步骤s1包括如下子步骤:步骤s1-1,对用于作为训练集的多个现有人脸图像进行预处理从而获得尺寸统一并且分别与现有人脸图像相对应的预处理训练图像;步骤s1-2,构建含有输入层、卷积模块、残差计算模块以及全连接模块的卷积神经网络模型,该卷积神经网络模型中各层的参数矩阵中的参数为随机设置;步骤s1-3,将预处理图像作为训练集输入卷积神经网络模型;步骤s1-4,将卷积神经网络模型中的预定层设定为量化层并对量化层的参数进行整数位量化来近似该量化层的参数矩阵,然后进行前向传递计算误差;步骤s1-5,采用反向传播算法传递误差更新参数;步骤s1-6,重复步骤s1-3至步骤s1-5直至达到训练完成条件,得到训练后的卷积神经网络模型作为特征提取模型。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,卷积模块由依次连接的第一卷积层、第二卷积层以及第一最大池化层构成,残差计算模块包括依次连接的多个第一残差子模块和一个第二残差子模块,第一残差子模块由依次连接的至少一个残差构件、第三卷积层以及第二最大池化层构成,第二残差子模块由至少一个残差构件构成,全连接模块包括依次连接的第一全连接层、随机丢弃层以及第二全连接层,量化层为第二卷积层、残差构件、第三卷积层以及第一全连接层。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,步骤s1-4中,量化层的整数量化位数为1位,整数量化为二值量化。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,参数矩阵的二值量化近似采用下式(1)与式(2)的形式进行:式(1)中,w表示二值量化前的参数矩阵,α为原有参数矩阵中所有参数的平均值,n为参数矩阵中的参数个数,b为二值量化后的参数矩阵,式(2)中,x为参数矩阵中的原有参数,sign(x)为对应的二值量化后的参数。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,步骤s1-5中,针对每一个参数的更新,均利用导函数g(w)进行,该导函数g(w)采用下式(3)表示:式(3)中,w表示参数。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,量化层的整数量化位数为1~5位。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,靠近第一卷积层的多个量化层为低位量化层,远离第一卷积层的多个量化层为高位量化层,位于低位量化层和高位量化层之间的多个量化层为中位量化层,低位量化层的整数量化位数为1~2位,中位量化层的整数量化位数为2~3位,高位量化层的整数量化位数为4~5位。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,步骤s2的预处理包括如下子步骤:步骤s2-1,对待处理图像进行人脸检测,找出其中的人脸位置;步骤s2-2,检测步骤s2-1找出的人脸的至少包括双眼中心、鼻头以及两侧嘴角在内的多个关键位置点;步骤s2-3,根据关键位置点对待处理图像进行对齐操作并将待处理图像进行尺寸统一化;步骤s2-4,将尺寸统一化后的待处理图像进行中心剪裁,得到对应的预处理图像。本发明提供的基于残差量化卷积神经网络的人脸识别方法,还可以具有这样的技术特征,其中,步骤s1-6中的训练完成条件为完成了预定的循环次数、参数已经收敛或消除了训练误差。本发明还提供了一种基于残差量化卷积神经网络的人脸识别装置,用于对目标图像进行人脸识别并从多个待判定图像中判定出与目标图像相一致的人脸图像,其特征在于,包括:预处理部,对待判定图像以及目标图像进行预处理从而分别得到对应的预处理待判定图像及预处理目标图像;特征提取部,对预处理待判定图像进行特征提取得到对应的待判定特征向量以及对预处理目标图像进行特征提取得到对应的目标特征向量,该特征提取部含有经过采用多个现有人脸图像作为训练集训练得到的特征提取模型;以及一致判定部,根据目标特征向量以及待判定向量判定出待判定图像中的与目标图像一致的人脸图像,其中,特征提取模型采用如下方法获得:步骤1,对用于作为训练集的多个现有人脸图像进行预处理从而获得尺寸统一并且分别与现有人脸图像相对应的预处理训练图像;步骤2,构建含有输入层、卷积模块、残差计算模块以及全连接模块的卷积神经网络模型,该卷积神经网络模型中各层初始的参数为随机设置;步骤3,将预处理图像作为训练集输入卷积神经网络模型;步骤4,选取卷积神经网络模型中的预定多层设定为量化层,对量化层的参数进行整数位量化并用量化后的参数代替对应的原有参数,然后进行前向传递计算误差;步骤5,采用反向传播算法传递误差并更新参数;步骤6,重复步骤3至步骤5直至达到训练完成条件,得到训练后的卷积神经网络模型作为特征提取模型。发明作用与效果根据本发明提供的基于残差量化卷积神经网络的人脸识别方法及装置,由于在对构建好的卷积神经网络模型进行训练的过程中设定了量化层并对量化层进行了整数位量化,因此可以使各个量化层的浮点乘法计算被简化,将计算时间缩短30%~50%,使得模型训练能够更快完成,并且采用训练后的模型进行的特征向量提取也能够更快完成,从而让人脸识别的模型训练速度、目标图像和待判定图像的特征提取速度均得到加快。同时,本发明的方法及装置的识别精度与现有技术中的多种优秀人脸识别方法接近,与采用未量化卷积神经网络模型的方法相比,其识别精度仅仅略有下降,完全能够满足通常的人脸识别的需求。附图说明图1是本发明实施例的基于残差量化卷积神经网络的人脸识别方法的流程图;图2是本发明实施例的卷积神经网络结构示意图;图3是本发明实施例的卷积神经网络模型的计算量示意图。具体实施方式以下结合附图以及实施例来说明本发明的具体实施方式。<实施例>本实施例中的模型构建等均在linux平台上实现,该平台具有至少一张图形处理单元gpu卡的支持。图1是本发明实施例的基于残差量化卷积神经网络的人脸识别方法的流程图。如图1所示,基于残差量化卷积神经网络的人脸识别方法主要包括以下步骤。步骤s1,模型构建及训练。即,构建卷积神经网络模型并采用多个现有人脸图像作为训练集对该卷积神经网络模型进行基于残差量化的训练,得到的训练后卷积神经网络模型即可作为特征提取模型。该模型构建及训练包括如下子步骤:步骤s1-1,对用于作为训练集的多个现有人脸图像进行预处理从而获得大小统一并且分别与现有人脸图像相对应的预处理训练图像。本实施例中,作为训练集的现有人脸图像来源于casia-webface数据集,该数据集包括10575个人的494414张人脸图像,其中的每个人脸图像均作为待处理图像进行预处理,该预处理过程包括如下步骤:步骤s1-1-1,对待处理图像进行人脸检测,找出其中的人脸位置。本实施例中,采用现有技术中的mtcnn来检测图像中的人脸。步骤s1-1-2,检测步骤s1-1-1找出的人脸中的多个关键位置点,即至少包括双眼中心、鼻头以及两侧嘴角在内的关键位置点。步骤s1-1-3,根据关键位置点对待处理图像进行对齐操作并将待处理图像进行尺寸统一化(即调整为统一尺寸)。本实施例中,待处理图像的对齐操作均依据双眼中心、鼻头以及两侧嘴角这样的关键点进行,在对齐后各个待处理图像就通过通常的图像调整手段被统一调整为128×128像素的尺寸。另外,各个待处理图像的通道数均不作改变。步骤s1-1-4,将尺寸统一化后的待处理图像进行剪裁,得到对应的预处理图像。本实施例中,作为训练集的各个图像所采用的剪裁方式为随机剪裁,得到112×96大小的剪裁后图像。剪裁后,这些图像的各个像素点的像素值均减去127.5并处以128,使得各个像素值均归一化到-1与+1之间,以便将对应的像素值输入至模型。步骤s1-2,构建模型。本实施例中所采用的模型为基于残差计算的卷积神经网络,该卷积神经网络模型含有输入层、卷积模块、残差计算模块以及全连接模块。图2是本发明实施例的卷积神经网络结构示意图。如图2所示,本实施例所构建出的卷积神经网络模型包括输入层1、卷积模块2、残差计算模块3以及全连接模块4。其中,卷积模块2由第一卷积层c1a、第二卷积层qc1b及第一最大池化层p1依次连接而构成。残差计算模块3由依次连接的三个第一残差子模块(即第一残差子模块31、第一残差子模块32、第二残差子模块33)和一个第二残差子模块34所构成。第一残差子模块31由依次连接的三个残差构件qb(图2中,qb×3表示此处有三个依次连接的残差构件;下同)、第三卷积层qc2以及第二最大池化层p2构成,第一残差子模块32由依次连接的四个残差构件qb、第三卷积层qc3以及第二最大池化层p3构成,第一残差子模块33由依次连接的六个残差构件qb、第三卷积层qc4以及第二最大池化层p4构成。第二残差子模块34由三个依次连接的残差构件qb构成。全连接模块4包括第一全连接层qfc5以及第二全连接层fc6,该第一全连接层qfc5和第二全连接层fc6之间还设有随机丢弃层(即dropout层,图中未示出)。上述各层中均含有用于计算向下一层传递的数据的计算权重数值(即参数)。本实施例中,各层参数如下表1所示。表1本发明实施例的卷积神经网络模型各层参数表1中,残差构件qc2_x(即qc2_1~qc2_3,一共三个残差构件)分别表示第一残差子模块31中的三个残差构件qb;残差构件qc3_x(即qc3_1~qc3_4,一共四个残差构件)分别表示第一残差子模块32中的四个残差构件qb;残差构件qc4_x(即qc4_1~qc4_6,一共六个残差构件)分别表示第一残差子模块33中的六个残差构件qb;残差构件qc5_x(即qc5_1~qc5_3,一共三个残差构件)分别表示第二残差子模块34中的三个残差构件qb。从表1中可看出,本实施例的卷积神经网络模型的总层数为55层。模型构建完成后,即可采用训练集对其进行训练。步骤s1-3,将预处理训练图像作为训练集输入卷积神经网络模型。步骤s1-4,将卷积神经网络模型中的预定层设定为量化层并对量化层的参数进行整数位量化来近似该量化层的参数矩阵,然后进行前向传递并计算训练误差。本实施例的模型各层中,除去第一卷积层c1a和第二全连接层fc6之外,其余卷积层与全连接层均被设定为量化层并进行二值量化。由于残差构件qb分别由不同层数的卷积层构成,因此各个残差构件的各层也进行二值量化。即,量化层为第二卷积层qc1b、各个残差构件qb、各个第三卷积层(即第三卷积层qc2、qc3和qc4)以及第一全连接层qfc5。量化方法如下式(1)和(2)所示:式(1)中,w表示二值量化前的所述参数矩阵,α为原有参数矩阵中所有参数的平均值,n为所述参数矩阵中的参数个数,b为二值量化后的所述参数矩阵,式(2)中,x为参数矩阵中的原有参数,sign(x)为对应的二值量化后的参数。步骤s1-5,采用反向传播算法传递误差更新参数,即根据训练误差在模型中进行反向传播计算,并逐渐调整各层参数,使得训练误差逐渐降低。本实施例中,本实施例中,针对网络模型各层的每一个参数的更新,均可利用导函数g(w)进行,该导函数g(w)的形式如下式(3)所示:式(3)中,w表示网络模型各层的各个参数。步骤s1-6,重复步骤s1-3至步骤s1-5,直至达到了完成训练的条件(即完成了预定的循环次数、参数已经收敛或基本消除了训练误差),得到训练后的卷积神经网络模型作为特征提取模型。为了方便图像输入、加快模型训练速度,本实施例的上述训练过程采用了分批输入处理的方式。即,将训练集的图像分为10000个批次、每批次输入64张图像,然后每批次分别进行步骤s1-4~步骤s1-5的处理;全部批次均完成输入及处理后,一次循环就完成了,随后即可进行下一个循环的分批次输入处理过程。本实施例中,循环总次数为100次。另外,在输入时模型的初始学习率设置为0.01,并在40、70和90个循环时分别缩小10倍。模型采用softmax损失函数进行监督,通过步骤s1-5的设置进行反向传播更新参数。经过上述步骤,本实施例的卷积神经网络模型就完成了构建及训练,可以用于进行人脸识别了。本实施例中,训练后的上述卷积神经网络模型作为一种特征提取部,用于进行目标图像和待判定图像的特征向量提取,得到的特征向量即可用于判定目标图像与各个待判定图像的相似程度,从而找出多个待判定图像中与目标图像一致的人脸图像。将目标图像和待判定图像输入训练好的模型前还需要进行相应的预处理,以获得尺寸大小一致的图像,即步骤s2:对目标图像进行预处理获得预处理目标图像,并对待判定图像进行预处理获得对应的预处理待判定图像。本实施例中,采用lfw数据集作为测试数据集,该lfw数据集包含5749人的共13233张图像。进行测试前,先将各个人脸图像进行镜像翻转得到镜像图像作为待判定图像,而各个原图像则分别作为目标图像。这些待判定图像及目标图像在输入训练好的模型前同样需要进行预处理,该预处理过程与作为训练集的人脸图像的预处理过程基本相同(即步骤),包括如下步骤:步骤s2-1,对待处理图像进行人脸检测,找出其中的人脸位置;步骤s2-2,检测步骤s2-1找出的人脸的至少包括双眼中心、鼻头以及两侧嘴角在内的多个关键位置点;步骤s2-3,根据关键位置点对待处理图像进行对齐操作并将待处理图像进行尺寸统一化;步骤s2-4,将尺寸统一化后的待处理图像进行中心剪裁,得到对应的预处理图像。本实施例中,与训练集不同,作为测试集的各个人脸图像的剪裁不采用随机剪裁而是采用中心剪裁。同样地,经过上述预处理的图像的各个像素点的像素值均减去127.5并处以128,使得各个像素值均归一化到-1与+1之间,以便将对应的像素值输入至模型。上述待判定图像及目标图像经过预处理后即可进行特征提取及判定,即如下步骤:步骤s3,将预处理待判定图像及预处理目标图像依次输入特征提取模型,从而得到分别与预处理待判定图像相对应的多个待判定特征向量以及与预处理目标图像相对应的目标特征向量。步骤s4,根据目标特征向量以及待判定向量判定出待判定图像中的与目标图像一致的人脸图像。本实施例中,为了方便进行训练后模型判定精度的考察,将预处理目标图像及对应的预处理待判定图像(即经过翻转及预处理后得到的图像)设置为图片对。在分别输入模型得到对应的特征向量后,采用余弦距离来对一个图片对中的两个特征向量的相似度进行计算,当计算得到的余弦距离大于预设值时,则判定图片对中的目标图像及待判定图像中不是同一个人,而小于预设值时则判定二者中的为同一个人。显然,由于图片对中的待判定仅仅是目标图像翻转后形成的,因此实际上二者均为同一个人。当经过上述图像预处理、输入模型获得特征向量、计算余弦距离并判定的过程后,若一个图片对的判定结果为不是同一个人,则说明该次人脸识别结果有误,而若判定结果为同一个人,则说明该次人脸识别结果是正确的。表2是本发明实施例的基于残差量化卷积神经网络的人脸识别方法的判定精度结果,该表2中还包含了采用其他人脸识别方法对本实施例的测试集进行人脸识别的判定精度结果。其中,“量化模型”指本实施例的基于残差量化卷积神经网络的人脸识别方法。“deepface单模型”、“deepface联合”以及“deepid”是现有技术中常用的优秀人脸识别方法。“未量化网络”的方法与本实施例基本相同,但其采用的是不经过量化的卷积神经网络模型,即,采用与本实施例相同的模型架构(即55层的卷积神经网络模型),但其训练过程中完全不采用参数量化的策略(即,在步骤s1-4中不设定量化层,也不进行任何整数位量化,而是直接进行前向传递计算误差)。表2本发明实施例的方法与其他一些优秀方法模型精度的对比方法准确率deepface单模型0.9592deepface联合0.9735deepid0.9745未量化网络0.9783量化网络0.9743从表2可以看出,本实施例的基于残差量化卷积神经网络的人脸识别方法识别精度较高,基本达到了现有技术中常用的优秀人脸识别方法的精度。同时,本实施例的精度为0.9743,而采用未量化卷积神经网络模型的方法的精度为0.9783,因此,与基于通常的残差卷积神经网络模型的人脸识别方法相比,本实施例的基于残差量化卷积神经网络的人脸识别方法的精度仅仅略有下降,完全能够满足通常的人脸识别的需求。图3是本发明实施例的卷积神经网络模型的计算量示意图。如图3所示,当一个经过预处理的目标图像或待判定图像进入训练好后的卷积神经网络模型时,主要经过如下计算过程:首选,输入层1的输入数据为112×96的三通道图像,因此其输入的数据大小为112×96×3。随后,该112×96×3的输入数据就进入了第一卷积层c1a,根据表1可知,该第一卷积层c1a不进行填充计算,因此其卷积输出的数据大小110×94×32。本实施例中,该第一卷积层c1a一共有864个参数,当数据在该层时需经过8933760次的浮点乘法计算,其计算结果作为该层的输出进入下一层(即第二卷积层qc1b)。数据经过第二卷积层qc1b,该层与第一卷积层c1a的参数设置一样,故该层的输出尺寸为108×92×64,共有18432个参数,且计算过程中经过183140352次浮点乘法。然后,数据经过第一最大池化层p1。该层采用区间为2×2、移动步长为2的最大池化方法,这一设置将使得输入数据的长宽均减少一半,故其输出大小为54×46×64。随后,第一最大池化层p1输出的数据经过pc2_x层,即,数据开始进入残差计算模块3的第一残差子模块31。根据表1的可知,第一残差子模块31一共包含三个连续的残差构件qb,而各残差构件qb中的各卷积层的填充尺寸为1,其输出尺寸仍为54×46×64,这也是保证残差构件最后相加操作时两边对应维度能够相等;每个残差构件qb包含三个卷积核,每个卷积核所对应层的参数为36864,相应地具有浮点乘法91570716次。因此,第一残差子模块31的三个残差构件qb一共有9个卷积层,共331776个参数及824131584次浮点乘法。第一残差子模块31的最后残差构件qb(即残差构件qc2_3)输出的数据经过第三卷积层qc2,该层不采用填充操作,且通道数翻倍,故该层计算的输出尺寸为52×44×128。而计算可得,该层共73728个参数,共168689664次浮点乘法。第三卷积层qc2的输出数据继续经过第二最大池化层p2,该第二最大池化层p2与第一最大池化层p1采用一样的设置,其输出尺寸为26×22×128,且输出的数据将继续向下进入第二残差子模块32。进入第二残差子模块32及第三残差子模块33后,数据所经历的计算过程与上述第一残差子模块31类似,其不同点主要是残差构件qb的数量不同,在此不再赘述。在经过上述残差计算模块3后,数据进入全连接模块4的第一全连接层qfc5。这是全连接模块4的第一层,其输出为1024维向量,相应地输出数据大小为5×4×512,因此该层共有10485760个参数和与参数个数相同的浮点计算。类似地,数据经过随机丢弃层后进入第二全连接层fc6,这是网络最后一层,其输出结果为与训练集中所包含的人数相对应的向量,即,训练集中包含10575人时,该输出的向量为10575维向量。本实施例中,该第二全连接层fc6所输出的向量主要用于计算训练误差,其具体方式为:设定与训练集中每个人分别对应的标签向量(即10575个10575维向量,每个10575维向量中均只有与人的序号相对应的一维的数值为1,其他维的数值均为0),然后将模型输出的各个10575维向量与标签向量分别比对,从而计算得出训练误差。理论上来说,卷积神经网络模型所输出的向量应该与训练集中的个人相对应,也就是说,输出的10575维向量中应当有且仅有与个人相对应的一维的数值为1,其他维的数值应当为0,即,输出的各个向量应当与对应的各个标签向量一致。然而,由于训练误差的存在,输出的向量不总是与标签向量一致,因此将输出向量与标签向量比对计算即可得出训练误差。本实施例的卷积神经网络模型中,各个卷积层与全连接层的参数共有56833888个;而一个112×96×3的输入图像经过上述模型进行特征提取的过程中,需要进行4152970624次浮点乘法计算。由于本实施例中,除去第一卷积层c1a和第二全连接层fc6之外的其余卷积层与全连接层均被设定为量化层并进行二值量化,因此,与进行二值量化的模型相比,相应层的浮点乘法计算均被简化,其计算时间可缩短30%~50%。实施例作用与效果根据本实施例提供的基于残差量化卷积神经网络的人脸识别方法,由于在对构建好的卷积神经网络模型进行训练的过程中设定了量化层并对量化层进行了二值量化,因此可以使各个量化层的浮点乘法计算被简化,将计算时间缩短30%~50%,使得模型训练能够更快完成,并且采用训练后的模型进行的特征向量提取也能够更快完成,从而让人脸识别的模型训练速度、目标图像和待判定图像的特征提取速度均得到加快。同时,根据表2可知,本实施例的方法的识别精度与现有技术中的多种优秀人脸识别方法接近,采用未量化卷积神经网络模型的方法相比,其识别精度仅仅略有下降,完全能够满足通常的人脸识别的需求。上述实施例仅用于举例说明本发明的具体实施方式,而本发明不限于上述实施例的描述范围。例如,实施例提供的是基于残差量化卷积神经网络的人脸识别方法,该方法中包含基于残差量化的卷积神经网络模型的构建及训练步骤。根据该方法,本发明也可以提供相应的人脸识别装置,即,将经过上述构建及训练得到的卷积神经网络模型进行封装形成特征提取部,再增加用于对待判定图像以及目标图像进行预处理的预处理部以及用于根据特征提取部提取出的目标特征向量和待判定向量进行一致性判定的一致判定部,即可形成基于残差量化卷积神经网络的人脸识别装置。实施例中,各个量化层的整数量化位数相同,均为一位,也就是说,各个量化层均同样地进行二值量化。但在本发明中,考虑到越低的层(即靠近输入层的层)所包含的特征信息越少,可以将量化层的整数量化位数设置得不同,例如,按照与输入层之间的远近关系,将靠近第一卷积层的多个量化层设定为低位量化层,远离第一卷积层的多个量化层设定为高位量化层,同时将位于低位量化层和高位量化层之间的多个量化层设定为中位量化层,进一步将各种量化层的整数量化位数按照低位量化层<中位量化层<高位量化层的规则进行设定。同时,由于整数量化位数过多则无法达到减小计算量的效果,因此整体的整数量化位数宜设定在1~5位。例如,可以将低位量化层的整数量化位数设定为1~2位、中位量化层的整数量化位数设定为2~3位、高位量化层的整数量化位数设定为4~5位。实施例中,目标图像与待判定图像之间是否一致是通过二者的特征向量之间的余弦距离计算来判定的。在本发明中,也可以利用其他的向量距离计算方式来判定目标图像与待判定图像之间的一致性。实施例中,为了方便图像输入、加快模型训练速度,训练过程采用了分批输入处理的方式。但在采用图像数量不多的其他训练集时,也可以不采用分批输入处理的方式,而是直接将训练集全部输入,然后进行步骤s1-4~步骤s1-5的处理过程。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1