图像识别处理方法和装置的制造方法_4

文档序号:9866130阅读:来源:国知局
的待识别图像进行脸部轮廓检测处理,以检测出大致的脸部轮廓区域,即上述脸部轮廓候选区域图像。具体的,可以采用adaboost算法进行脸部轮廓检测。
[0143]传统的脸部轮廓检测方法中,也是采用adaboost算法进行脸部轮廓检测处理,但是为了控制错误率,一般会进行很多层的运算,最后输出准确的结果。譬如adaboost进行了12层运算,才收敛,这样速度明显不会太快,错误率也不能控制。
[0144]而本实施例中,虽然也是采用adaboost算法来进行脸部轮廓检测,但是只需要输出大概的脸部轮廓候选区域即可,不需要太精确的结果,哪怕错误率很高也可以。所以本实施例中adaboost算法仅进行不大于预设层次比如7层的运算即可,这样时间性能上面会大大提高。与传统方法不同的是,本实施例中脸部轮廓检测的错误率会很高,但是没有关系,因为本实施例的脸部轮廓检测主要得到脸部的候选区域,并不是真正进行脸部检测,即便存在较高的错误率,后续输入到基于深度学习的卷积神经网络而获得的脸部识别模型中便可实现精确的识别。
[0145]本实施例中,在进行对待识别图像的识别处理前,通过对待识别图像进行一定较少层次的脸部轮廓检测处理,能够获得脸部所在的大致区域,从而脸部识别模型仅需要对该大致区域进行识别处理,能够进一步提高脸部识别的处理效率。
[0146]图8是根据一示例性实施例示出的一种图像识别处理装置实施例三的框图,如图8所示,在以上实施例的基础上,所述装置还包括:第二获取模块31、训练模块32。
[0147]第二获取模块31,被配置为获取训练样本集,所述训练样本集中包括人脸样本图像和非人脸样本图像。
[0148]训练模块32,被配置为根据所述第二获取模块31获取的所述人脸样本图像和所述非人脸样本图像对卷积神经网络中各层隐层节点之间的特征系数进行训练,得到所述脸部识别模型。
[0149]具体地,所述训练模块32包括:标记子模块321、确定子模块322、训练子模块323。
[0150]标记子模块321,被配置为对所述第二获取模块31获取的所述人脸样本图像进行第一分类标号的标记,对所述第二获取模块获取的所述非人脸样本图像进行第二分类标号的标记。
[0151]确定子模块322,被配置为确定所述第二获取模块31获取的所述人脸样本图像对应的第一人脸器官点位置坐标和所述第二获取模块获取的所述非人脸样本图像对应的第二人脸器官点位置坐标,所述第二人脸器官点位置坐标被设置为预设坐标值。
[0152]训练子模块323,被配置为将所述人脸样本图像、所述第一分类标号、所述第一人脸器官点位置坐标以及所述非人脸样本图像、所述第二分类标号、所述第二人脸器官点位置坐标分别输入到所述卷积神经网络中,对所述卷积神经网络中各层隐层节点之间的特征系数进行训练,得到所述脸部识别模型。
[0153]本实施例中,为了保证人脸识别模型的准确可靠,训练时,需要获取大量的人脸样本图像和非人脸样本图像,比如人脸样本图像和非人脸样本图像分别20万张。
[0154]为了保证训练结果的准确可靠,可以先对各样本图像进行归一化处理,比如第二归一化模块33进行尺寸、坐标中心化、x-shearing、缩放和旋转等归一化处理。进而,训练模块32根据归一化后的人脸样本图像和非人脸样本图像对卷积神经网络中各层隐层节点之间的特征系数进行训练,得到脸部识别模型。
[0155]因为本实施例中对卷积神经网络进行训练的目的,是为了获得具有两个输出层的脸部识别模型,因此,为了保证分类输出层对分类结果的准确可靠,以及位置回归输出层对人脸器官点位置定位结果的准确可靠,具体来说,根据人脸样本图像和非人脸样本图像对卷积神经网络中各层隐层节点之间的特征系数进行训练的过程如下:
[0156]标记子模块321对人脸样本图像进行第一分类标号的标记,对非人脸样本图像进行第二分类标号的标记。并且,确定子模块322确定人脸样本图像对应的第一人脸器官点位置坐标和非人脸样本图像对应的第二人脸器官点位置坐标,其中,第二人脸器官点位置坐标被设置为预设坐标值,比如为O。进而,训练子模块323将人脸样本图像、对应的第一分类标号、对应的第一人脸器官点位置坐标以及非人脸样本图像、第二分类标号、对应的第二脸部器官点位置坐标分别输入到卷积神经网络中,对卷积神经网络中各层隐层节点之间的特征系数进行训练,得到脸部识别模型。
[0157]也就是说,为了区别人脸样本图像和非人脸样本图像,以及为了确定训练得到的人脸识别模型是否准确,分别对人脸样本图像和非人脸样本图像进行分类标号的标记,假设人脸样本图像都标记为第一分类标号I,非人脸样本图像都标记为第二分类标号2。
[0158]另外,为了实现对位置回归输出层功能的训练,预先确定每个样本图像的脸部器官点位置坐标。对于非人脸样本图像来说,不具备器官点坐标,该位置坐标可以设置为O。对于人脸样本图像来说,可以预先采用诸如sdm等算法进行器官点标定,以获得每个人脸样本图像的器官点位置坐标。
[0159]从而,在对卷积神经网络进行训练的过程中,分别输入样本图像,得到输出结果。具体来说,针对输入的是人脸样本图像来说,输入的是人脸样本图像、对应的分类标号1、对应的人脸器官点位置坐标,输出的是输出分类标号和输出位置坐标。针对输入的是非人脸样本图像来说,输入的是非人脸样本图像、对应的分类标号2、对应的脸部器官点位置坐标0,输出的是输出分类标号和输出位置坐标,理想情况下该输出位置坐标为O。
[0160]本实施例中,通过采用包含有大量人脸样本图像和非人脸样本图像的训练样本集,将样本图像以及样本图像对应的分类标号和脸部器官点位置坐标作为输入,对卷积神经网络进行训练,使得得到的脸部识别模型能够自动深度学习到各样本图像中包含的多层次的特征信息,从而不但提高了基于该脸部识别模型正确识别待识别图像分类的可能性,也能够准确识别获得脸部器官点位置坐标,保证了识别结果的准确可靠。
[0161]图9是根据一示例性实施例示出的一种图像识别处理装置实施例四的框图,如图9所示,在图8所示实施例的基础上,该图像识别处理装置还包括:调整模块41。
[0162]调整模块41,被配置为在当前输入的样本图像对应的输出分类标号与当前输入的样本图像对应的输入分类号间的差值大于预设差值时,或者,在当前输入的样本图像对应的输出人脸器官点位置坐标与当前输入的样本图像对应的输入人脸器官点位置坐标间的距离大于预设距离时,调整经所述当前输入的样本图像训练后得到的各层隐层节点之间的特征系数。
[0163]其中,所述输入分类号为所述第一分类标号或所述第二分类标号,所述输入人脸器官点位置坐标为所述第一人脸器官点位置坐标或所述第二人脸器官点位置坐标。
[0164]在对卷积神经网络进行训练的过程中,针对任一输入的样本图像来说,如果输出的类别标号与输入的类别标号不同,则调整模块41可以调整特征系数,或者,如果输出的位置坐标与输入的位置坐标间的距离大于预设距离,则调整模块41可以调整特征系数。调整特征系数之后,进行后一样本图像的输入训练过程,如此反复,直到卷积神经网络收敛为止,此时,可以得到稳定可靠的特征系数即卷积核,从而最终获得脸部识别模型。
[0165]其中,输出的位置坐标与输入的位置坐标间的距离可以根据诸如欧式距离、马氏距离、切比雪夫距离、余弦距离等距离度量方式计算。其中,调整模块41对各层隐层节点间的特征系数的调整可以采用梯度下降法进行调整。
[0166]本实施例中,基于各样本图像训练结果,对脸部识别模型的各特征系数进行及时有效的调整,能够保证最终训练获得的脸部识别模型具有更佳的稳定性、可靠性,实现识别的快速收敛。
[0167]以上描述了图像识别处理装置的内部功能和结构,如图10所示,图10是根据一示例性实施例示出的一种图像识别处理装置的框图;该图像识别处理装置可实现为:
[0168]存储器;
[0169]用于存储处理器可执行指令的存储器;
[0170]其中,所述处理器被配置为:
[0171]获取待识别图像;
[0172]对所述待识别图像进行脸部识别,获取所述待识别图像的脸部分类结果和脸部器官点位置坐标。
[0173]本实施例中,在对待识别图像进行脸部识别时,在确定其脸部分类结果,比如是否为人脸图像的同时,还能够同时获得脸部器官点的位置坐标,提高识别处理效率。
[0174]图11是根据一示例性实施例示出的另一种图像识别处理装置的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
[0175]参照图11,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口 812,传感器组件814,以及通信组件816。
[0176]处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
[0177]存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
[0178]电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
[0179]多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1