图像识别处理方法和装置的制造方法_3

文档序号:9866130阅读:来源:国知局
g、缩放和旋转等归一化处理。进而,根据归一化后的人脸样本图像和非人脸样本图像对卷积神经网络中各层隐层节点之间的特征系数进行训练,得到脸部识别模型。
[0107]因为本实施例中对卷积神经网络进行训练的目的,是为了获得具有两个输出层的脸部识别模型,因此,为了保证分类输出层对分类结果的准确可靠,以及位置回归输出层对人脸器官点位置定位结果的准确可靠,具体来说,根据人脸样本图像和非人脸样本图像对卷积神经网络中各层隐层节点之间的特征系数进行训练的过程如下:
[0108]对人脸样本图像进行第一分类标号的标记,对非人脸样本图像进行第二分类标号的标记。并且,确定人脸样本图像对应的第一人脸器官点位置坐标和非人脸样本图像对应的第二人脸器官点位置坐标,其中,第二人脸器官点位置坐标被设置为预设坐标值,比如为
O。进而,将人脸样本图像、对应的第一分类标号、对应的第一脸部器官点位置坐标以及非人脸样本图像、第二分类标号、对应的第二脸部器官点位置坐标分别输入到卷积神经网络中,对卷积神经网络中各层隐层节点之间的特征系数进行训练,得到脸部识别模型。
[0109]也就是说,为了区别人脸样本图像和非人脸样本图像,以及为了确定训练得到的脸部识别模型是否准确,分别对人脸样本图像和非人脸样本图像进行分类标号的标记,假设人脸样本图像都标记为第一分类标号I,非人脸样本图像都标记为第二分类标号2。
[0110]另外,为了实现对位置回归输出层功能的训练,预先确定每个样本图像的脸部器官点位置坐标。对于非人脸样本图像来说,不具备器官点坐标,该位置坐标可以设置为O。对于人脸样本图像来说,可以预先采用诸如sdm等算法进行器官点标定,以获得每个人脸样本图像的器官点位置坐标。
[0111]从而,在对卷积神经网络进行训练的过程中,分别输入样本图像,得到输出结果。具体来说,针对输入的是人脸样本图像来说,输入的是人脸样本图像、对应的分类标号1、对应的人脸器官点位置坐标,输出的是输出分类标号和输出位置坐标。针对输入的是非人脸样本图像来说,输入的是非人脸样本图像、对应的分类标号2、对应的脸部器官点位置坐标0,输出的是输出分类标号和输出位置坐标,理想情况下该输出位置坐标为O。
[0112]本实施例中,通过采用包含有大量人脸样本图像和非人脸样本图像的训练样本集,将样本图像以及样本图像对应的分类标号和脸部器官点位置坐标作为输入,对卷积神经网络进行训练,使得得到的脸部识别模型能够自动深度学习到各样本图像中包含的多层次的特征信息,从而不但提高了基于该脸部识别模型正确识别待识别图像分类的可能性,也能够准确识别获得脸部器官点位置坐标,保证了识别结果的准确可靠。
[0113]图5是根据一示例性实施例示出的一种图像识别处理方法实施例四的流程图,如图5所示,在前一实施例的基础上,在步骤303后,还可以包括如下步骤:
[0114]在步骤401中,若当前输入的样本图像对应的输出分类标号与当前输入的样本图像对应的输入分类号间的差值大于预设差值,或者,若当前输入的样本图像对应的输出人脸器官点位置坐标与当前输入的样本图像对应的输入人脸器官点位置坐标间的距离大于预设距离,则调整经当前输入的样本图像训练后得到的各层隐层节点之间的特征系数。
[0115]其中,输入分类号为第一分类标号或第二分类标号,输入人脸器官点位置坐标为第一人脸器官点位置坐标或第二人脸器官点位置坐标。
[0116]值得说明的是,在对卷积神经网络进行训练的过程中,针对任一输入的样本图像来说,如果输出的类别标号与输入的类别标号不同,则可以调整特征系数,或者,如果输出的位置坐标与输入的位置坐标间的距离大于预设距离,则可以调整特征系数。调整特征系数之后,进行后一样本图像的输入训练过程,如此反复,直到卷积神经网络收敛为止,此时,可以得到稳定可靠的特征系数即卷积核,从而最终获得脸部识别模型。
[0117]其中,输出的位置坐标与输入的位置坐标间的距离可以根据诸如欧式距离、马氏距离、切比雪夫距离、余弦距离等距离度量方式计算。其中,对各层隐层节点间的特征系数的调整可以采用梯度下降法进行调整。
[0118]本实施例中,基于各样本图像训练结果,对脸部识别模型的各特征系数进行及时有效的调整,能够保证最终训练获得的脸部识别模型具有更佳的稳定性、可靠性,实现识别的快速收敛。
[0119]以上描述了图像识别处理方法的实现过程,该过程可以由图像识别处理装置来实现,以下将对图像识别处理装置的内部功能和结构进行说明。
[0120]图6是根据一示例性实施例示出的一种图像识别处理装置实施例一的框图,如图6所示,该图像识别处理装置包括:第一获取模块11、识别处理模块12。
[0121]第一获取模块11,被配置为获取待识别图像。
[0122]识别处理模块12,被配置对所述第一获取模块11获取的所述待识别图像进行脸部识别,同时获取所述待识别图像的脸部分类结果和脸部器官点位置坐标。
[0123]可选的,所述识别处理模块12,包括:第一识别处理子模块121。
[0124]第一识别处理子模块121,被配置为采用脸部识别模型对所述待识别图像进行脸部识别,同时获取所述待识别图像的脸部分类结果和脸部器官点位置坐标。
[0125]其中,所述脸部识别模型的输出层包括分类输出层和位置回归输出层,所述位置回归输出层用于进行所述脸部器官点位置坐标的定位,所述脸部分类结果包括所述待识别图像为人脸图像或者非人脸图像。
[0126]本实施例中,第一获取模块11获取的上述待识别人脸图像中可能不含人脸,也可能是包含一张或多张人脸的图像。本实施例中,识别处理模块12对待识别图像进行脸部识另IJ,除了要识别该图像是否是人脸图像外,还要进一步获得脸部器官点位置坐标,以用于在识别出是人脸图像的情况下,基于获得的人脸器官点位置坐标进行比如人脸美妆处理等不同应用。
[0127]本实施例中,为了同时识别待识别图像的分类结果、器官点位置坐标,第一识别处理子模块121可以采用脸部识别模型来实现,该脸部识别模型可以是基于对卷积神经网络进行训练而获得。也就是说,本实施例中,第一识别处理子模块121可以采用脸部识别模型对待识别图像进行脸部识别,同时获取待识别图像的脸部分类结果和脸部器官点位置坐标。
[0128]为了获得上述两种识别结果,该脸部识别模型的输出层包括分类输出层和位置回归输出层。其中,位置回归输出层用于进行脸部器官点位置坐标的定位,分类输出层用于进行脸部分类结果的识别处理,该分类结果可以包括待识别图像为人脸图像或者非人脸图像两种结果。
[0129]本实施例中,米用卷积神经网络(Convolut1nal Neural Networks,简称CNN)构建脸部部识别模型,以采用该脸部识别模型进行待识别图像的识别处理。
[0130]卷积神经网络是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。卷积神经网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。
[0131]其中,Alex网络为卷积神经网络的一种,是目前比较通用的物体识别的深度卷积神经网络图。图2为深度卷积神经网络Alex网络图,如图2所示,卷积神经网络是一个多层的神经网络,包括多个卷积层、下采样层、全连接层和一个输出层,每层由多个二维平面组成,而每个平面由多个独立神经元组成。从一个平面到下一个平面的映射可以看作是作卷积运算。本实施例中,假设基于卷积神经网络获得的脸部识别模型具有N层结构,相邻两层隐层节点间的各个连接的权重系数即卷积核,亦即上述特征系数由训练样本集训练确定。
[0132]如图4所示的传统的卷积神经网络的输出层仅为一个,即提供了具有分类作用的分类输出层。本实施例中,在传统卷积神经网络的基础上,扩展输出层,具有两个不同功能的输出层,这两个不同的输出层共同基于相同的特征提取过程,即这两个输出层共享输出层之前的各特征系数。
[0133]这两个输出层分别是分类输出层和位置回归输出层,每个输出层相当于对应一个损失函数或者称监督函数。分类输出层,顾名思义,用于实现分类的功能,即确定待识别图像是否为人脸图像;位置回归输出层,用于进行脸部器官点位置定位,即在待识别图像为人脸图像时,可以获取其中人脸的器官点位置坐标。
[0134]因此,基于该脸部识别模型,将待识别图像输入到该脸部识别模型中后,在输出端,可以得到两个输出结果,一个为是否是人脸图像的判定结果,一个是脸部器官点位置坐标。这两个输出结果是同时输出的。
[0135]具体来说,如果待识别图像被确定不是人脸图像,则输出的脸部器官点位置坐标为0,即没有位置坐标或预设的其他表征没有器官点位置坐标的坐标值。如果待识别图像被确定是人脸图像,则输出识别到的人脸器官点位置坐标。
[0136]本实施例中,通过对基于深度学习的卷积神经网络进行具有两个输出层的训练,获得既能够识别是否是人脸图像,又能够获得脸部器官点位置坐标的脸部识别模型。从而,采用该脸部识别模型对待识别图像进行识别,在确定其为人脸图像的同时,还能够同时获得人脸器官点的位置坐标。基于该脸部识别模型,不但能够获得准确的识别结果,而且能够提尚识别处理效率。
[0137]图7是根据一示例性实施例示出的一种图像识别处理装置实施例二的框图,如图7所示,在图6所示实施例的基础上,所述装置还包括:脸部轮廓检测模块21。
[0138]脸部轮廓检测模块21,被配置为对所述第一获取模块11获取的所述待识别图像进行不大于预设层次的脸部轮廓检测处理,获取脸部轮廓候选区域图像。
[0139]所述识别处理模块12,包括:第二识别处理子模块122。
[0140]第二识别处理子模块122,被配置为对所述脸部轮廓候选区域图像进行识别。
[0141]在实际应用中,为了进一步保证识别处理的速度和识别结果的准确性,可以对待识别图像进行一定的预处理,该预处理包括进行图像的归一化处理。比如对尺寸、坐标中心化、x-shearing、缩放和旋转等进行归一化处理。
[0142]另外,预处理还可以包括脸部轮廓检测模块21对待识别图像,尤其是归一化处理后
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1