人脸分类方法、装置及智能终端与流程

文档序号:13472903阅读:201来源:国知局
人脸分类方法、装置及智能终端与流程

本发明实施例涉及模型算法领域,尤其是一种人脸分类方法、装置及智能终端。



背景技术:

随着智能移动终端运算能力的提高,智能移动终端能够搭载越来越复杂且功能强大的应用程序。通过对用户面部图像进行拍摄,并将拍摄的面部图像进行数据处理,根据数据处理结果对用户面部图像进行评价或分类。

现有技术中,用户终端通过下载应用程序的方式,将服务器发送的具有普适性的数据模型进行安装,用户在应用该功能时,将获取的实时面部图像输入至数据模型中,数据模型输出对用户面部图像进行评价或分类的结果。

本发明创造的发明人在研究中发现,技术中对于用户面部图像分类或评价的准确率,取决于该数据模型的性能。因此,现有技术中急需一种具有优异性能的数据模型,提高用户脸部分类精准度。



技术实现要素:

本发明实施例提供能够有效提高分类准确率的人脸分类方法、装置及智能终端。

为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种人脸分类方法,包括下述步骤:

采集待测目标信息;

将所述待测目标信息输入通过输出目标与期望目标进行误差优化训练所得到的优化卷积神经网络模型中;

获取所述优化卷积神经网络模型输出的所述待测目标信息的分类结果。

具体地,所述优化卷积神经网络模型通过下述步骤训练形成:

获取标记有分类判断信息的训练样本数据;

将所述训练样本数据输入卷积神经网络模型获取所述训练样本数据的模型分类参照信息;

通过止损函数比对所述训练样本数据内不同样本的模型分类参照信息,并判断所述比对结果与所述分类判断信息是否一致;

当所述比对结果与所述分类判断信息不一致时,反复循环迭代的更新所述卷积神经网络模型中的权重,至所述比对结果与所述分类判断信息一致时结束。

具体地,所述训练样本数据包括:人脸数据对以及对所述人脸数据对进行标记的分类判断信息;

所述分类判断信息包括:人体颜值、年龄、种族和性别信息当中的一种或多种的组合。

具体地,所述将所述训练样本数据输入卷积神经网络模型获取所述训练样本数据的模型分类参照信息,的步骤具体包括:

将所述训练样本数据输入卷积神经网络模型;

将所述卷积神经网络模型最后一层全连接的输出值作为激活函数的输入值获取模型分类参照信息,以使所述分类参照信息输出有界。

具体地,所述止损函数特征描述为:

l(a,b)=max(f(a)–f(b),0)(label(a)<label(b));或

l(a,b)=max(f(b)–f(a),0)(label(b)<label(a));

其中,a为人脸数据对中的一个样本数据,b为人脸数据对中另一个样本数据,label(a)表示a的分类判断数据,label(b)表示b的分类判断数据,f(a)表示卷积神经网络模型输出的a的模型分类参照数据,f(b)表示卷积神经网络模型输出的b的模型分类参照数据。

具体地,所述当所述比对结果与所述分类判断信息不一致时,反复循环迭代的更新所述卷积神经网络模型中的权重,至所述比对结果与所述分类判断信息一致时结束,的步骤具体包括:

当所述比对结果与所述分类判断信息不一致时,根据所述分类判断信息计算模型期望输出信息;

根据所述模型分类参照信息与所述模型期望输出信息的差值计算响应误差;

将所述训练样本数据与所述响应误差相乘求取权重的梯度;

将所述梯度与训练因子相乘后取反并将其与所述权重相加以更新所述权重;

反复循环迭代的更新所述权重,至所述比对结果与所述分类判断信息一致时结束。

具体地,所述训练因子特征描述为:

w=w+δw+lr*αw;

其中,w表示训练因子,lr表示第一参数值,α表示第二参数值,并定义函数:

其中,β表示第三参数值。

为解决上述技术问题,本发明实施例还提供了:一种人脸分类装置,包括:

采集模块,用于采集待测目标信息;

计算模块,用于将所述待测目标信息输入通过输出目标与期望目标进行误差优化训练所得到的优化卷积神经网络模型中;

输出模块,用于获取所述优化卷积神经网络模型输出的所述待测目标信息的分类结果。

具体地,所述训练装置还包括:

第一获取子模块,用于获取标记有分类判断信息的训练样本数据;

第一计算子模块,用于将所述训练样本数据输入卷积神经网络模型获取所述训练样本数据的模型分类参照信息;

第一判断子模块,用于通过止损函数比对所述训练样本数据内不同样本的模型分类参照信息,并判断所述比对结果与所述分类判断信息是否一致;

第一模型优化子模块,用于当所述比对结果与所述分类判断信息不一致时,反复循环迭代的更新所述卷积神经网络模型中的权重,至所述比对结果与所述分类判断信息一致时结束。

具体地,所述训练样本数据包括:人脸数据对以及对所述人脸数据对进行标记的分类判断信息;

所述分类判断信息包括:人体颜值、年龄、种族和性别信息当中的一种或多种的组合。

具体地,所述分类装置还包括:

第一数据输入子模块,用于将所述训练样本数据输入卷积神经网络模型;

第一数据约束子模块,用于将所述卷积神经网络模型最后一层全连接的输出值作为激活函数的输入值获取模型分类参照信息,以使所述分类参照信息输出有界。

具体地,所述止损函数特征描述为:

l(a,b)=max(f(a)–f(b),0)(label(a)<label(b));或

l(a,b)=max(f(b)–f(a),0)(label(b)<label(a));

其中,a为人脸数据对中的一个样本数据,b为人脸数据对中另一个样本数据,label(a)表示a的分类判断数据,label(b)表示b的分类判断数据,f(a)表示卷积神经网络模型输出的a的模型分类参照数据,f(b)表示卷积神经网络模型输出的b的模型分类参照数据。

具体地,所述分类装置还包括:

第一数据处理子模块,用于当所述比对结果与所述分类判断信息不一致时,根据所述分类判断信息计算模型期望输出信息;

第二数据处理子模块,用于根据所述模型分类参照信息与所述模型期望输出信息的差值计算响应误差;

第三数据处理子模块,用于将所述训练样本数据与所述响应误差相乘求取权重的梯度;

第四数据处理子模块,用于将所述梯度与训练因子相乘后取反并将其与所述权重相加以更新所述权重;

第五数据处理子模块,用于反复循环迭代的更新所述权重,至所述比对结果与所述分类判断信息一致时结束。

具体地,所述训练因子特征描述为:

w=w+δw+lr*αw;

其中,w表示训练因子,lr表示第一参数值,α表示第二参数值,并定义函数:

其中,β表示第三参数值。

为解决上述技术问题,本发明实施例还提供一种智能终端,包括:

一个或多个处理器;

存储器;

一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述文件所述的人脸分类方法。

本发明实施例的有益效果是:由于采用了输出目标与期望目标之间的误差对卷积神经网络模型进行反向优化,不断地调整卷积神经网络模型的各项参数,优化卷积神经网络模型的性能,获取到优化卷积神经网络模型,能够有效地提高卷积神经网络模型的分类准确率。将待测目标信息输入到优化后卷积神经网络模型中,就能够得到准确率较高的分类结果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例人脸分类方法的基本流程示意图;

图2为本发明实施例优化卷积神经网络模型训练方法的基本流程示意图;

图3为本发明实施例获取模型分类参照信息的具体方法流程图;

图4为本发明实施例卷积神经网络模型进行权重校正的流程示意图;

图5为本发明实施例人脸分类装置基本结构框图;

图6为本发明实施例智能终端基本结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

请参阅图1,图1为本实施例人脸分类方法的基本流程示意图。

如图1所示,一种人脸分类方法,包括下述步骤:

s1100、采集待测目标信息;

待测目标信息具体是指人体面部的图像信息。但不限于此,根据应用场景的不同,待测目标信息能够是待分类或待识别的动植物图片或日常用品图片等。

待测目标信息的获取,能够通过拍摄装置实时获取、用户上传已有照片或从影像视频中以帧为单位获取的图像资料等。

s1200、将所述待测目标信息输入通过输出目标与期望目标进行误差优化训练所得到的优化卷积神经网络模型中。

将获取到的待测目标信息作为输入值输入到预设的优化卷积神经网络模型中。

优化卷积神经网络模型是通过输出目标与期望目标进行误差优化得到的,通过将输出目标与期望目标进行差分计算,将所得的差分数值反向带入到积神经网络模型中,优化积神经网络模型的各项权值参数,达到优化卷积神经网络模型的目的,优化后的卷积神经网络模型输出目标与期望目标之间具有一致性,因此,优化后卷积神经网络模型进行的分类计算的结果总是与用户对该分类的期望结果保持同一性,提高了卷积神经网络模型的分辨准确率。

s1300、获取所述优化卷积神经网络模型输出的所述待测目标信息的分类结果。

优化卷积神经网络模型根据输入的待测目标信息,对该待测目标信息进行分类,该分类结果能够是:根据常规标准对人体面部进行颜值打分、根据人体面部信息辨识年龄、种族和性别等信息。将分类信息进行标记形成索引标签或显示,如性别划分,分类识别确定某一待测目标信息为女性时,对该待测目标信息进行标记,并在该待测目标信息上形成女性的索引标签。

上述实施方式通过输出目标与期望目标之间的误差对卷积神经网络模型进行反向优化,不断地调整卷积神经网络模型的各项参数,优化卷积神经网络模型的性能,获取到优化卷积神经网络模型,能够有效地提高卷积神经网络模型的分类准确率。将待测目标信息输入到优化后卷积神经网络模型中,就能够得到准确率较高的分类结果。

优化卷积神经网络模型的形成,需要通过大量的训练样本数据进行反复的训练优化才能够得到,其具体的优化方法请参阅图2,图2为本实施例优化卷积神经网络模型训练方法的基本流程示意图。

如图2所示,包括下述步骤:

s2100、获取标记有分类判断信息的训练样本数据;

训练样本数据是整个训练集的构成单位,训练集是由若干个训练样本训练数据组成的。

训练样本数据是由人脸数据对以及对人脸数据对进行标记的分类判断信息组成的。

人脸数据对是指每一个训练样本数据是由两个不同的人脸图像组成的。但不限于此,人脸数据对的构成与卷积神经网络模型训练的方向有关。如,当卷积神经网络模型被训练用于识别人的性别和人种时,由于分类标准的个数有限,相对简单,每一个训练样本数据能够由一张人脸图像组成,而当卷积神经网络模型被训练用于辨识人体颜值分数和人体年龄时,由于分类标准较多相对复杂,每一个训练样本数据需要由两张人脸图像组成。

分类判断信息是指人们根据输入卷积神经网络模型的训练方向,通过普适性的判断标准和事实状态对训练样本数据做出的人为的判断,也就是人们对卷积神经网络模型输出数值的期望目标。如,在一个训练样本数据对中,对两张不同的图像进行颜值打分,各自标注每张图像中人体脸部的颜值,更加优化的实施方式中,标记出两张图像中那张图像所表示的人体脸部的颜值更高。

分类判断信息的内容与卷积神经网络模型的训练方向紧密相关,如卷积神经网络模型的训练方向为辨识性别时,分类判断信息就为图像表征的人体脸部的性别,而卷积神经网络模型训练的方向为对颜值进行打分时,标注的分类判断信息的内容是那张图像表征的人体脸部图像的颜值更高。

人脸数据对采用两张人体脸部图像的方式进行比对标注,能够为卷积神经网络模型的训练提供最直接期望目标,方便对卷积神经网络模型的训练。

步骤s2100之后进行步骤s2200。

s2200、将所述训练样本数据输入卷积神经网络模型获取所述训练样本数据的模型分类参照信息;

将训练样本数据输入到待训练的卷积神经网络模型中,获取待训练的卷积神经网络模型输出的分类参照信息。

具体的步骤s2200能够被分解为两个步骤,请参阅图3,图3为本实施例获取模型分类参照信息的具体方法流程图。

如图3所示,步骤s2200包括下述步骤:

s2210、将所述训练样本数据输入卷积神经网络模型;

将训练样本数据一个包含四个卷积层和两个全连接层的卷积神经网络模型,但不限于此,神经网络模型的规格能够根据应用场景的不同进行调整,如当卷积神经网络模型被训练用于识别人种时,更多的是训练识别图像中人体脸部的图像,需要识别的特征单一且不复杂,因此能够采用更为简单的卷积神经网络模型,而卷积神经网络模型被用于进行面部比对时,则需要更为复杂的卷积神经网络模型。

s2220、将所述卷积神经网络模型最后一层全连接的输出值作为激活函数的输入值获取模型分类参照信息,以使所述分类参照信息输出有界。

卷积神经网络模型最后一层全连接为输出信号将仅仅是一个简单的线性函数,线性函数输出的复杂性有限,并且从数据中学习复杂函数映射的能力更小,且输出的数据结果具有离散性,不符合本实施例对于输出结果的要求。

因此,在四个卷积层和两个全连接层的第二个全连接层输出的数据需要采用激活函数进行限缩。具体采用sigmoid激活函数:它是一个f(x)=1/1+exp(-x)形式的激活函数。它的值区间在0和1之间,是一个s形曲线。由于sigmoid激活输出值区间在0和1之间,保证了卷积神经网络模型的输出有界。

s2300、通过止损函数比对所述训练样本数据内不同样本的模型分类参照信息,并判断所述比对结果与所述分类判断信息是否一致;

止损函数是用于检测卷积神经网络模型中模型分类参照信息,与期望的分类判断信息是否具有一致性的检测函数。

止损函数数特征描述为:

l(a,b)=max(f(a)–f(b),0)(label(a)<label(b));或

l(a,b)=max(f(b)–f(a),0)(label(b)<label(a));

其中,a为人脸数据对中的一个样本数据,b为人脸数据对中另一个样本数据,label(a)表示a的分类判断数据,label(b)表示b的分类判断数据,f(a)表示卷积神经网络模型输出的a的模型分类参照数据,f(b)表示卷积神经网络模型输出的b的模型分类参照数据。

举例说明,当卷积神经网络模型被训练用于对人体颜值进行打分时,a表示为训练样本中的一张人体脸部图片,b表示为训练样本中的另一张人体脸部图片。label(a)表示a的颜值分数为70分;label(b)表示b的颜值分数为80分;f(a)表示卷积神经网络模型输出的a的模型分数为0.6;f(b)表示卷积神经网络模型输出的a的模型分数为0.55。

由上述数据能够看出,label(a)=70,label(b)=80,则说明人为标注结果b表示的颜值大于a;但f(a)=0.6,f(b)=0.55表明,l(a,b)的输出值不为零而是0.05,表明模型输出的值认定a表示的颜值大于b。这个结果与人们期望的结果相反,此时,需要继续执行步骤s2400,以校正卷积神经网络模型输出结果,否则,当模型输出的数值f(a)小于f(b),l(a,b)的值为零时,表明s2300比对结果与分类判断信息一致时,对该组训练样本数据的训练结束。

s2400、当所述比对结果与所述分类判断信息不一致时,反复循环迭代的更新所述卷积神经网络模型中的权重,至所述比对结果与所述分类判断信息一致时结束。

当卷积神经网络模型的输出结果与分类判断信息的期望结果不一致时,需要对卷积神经网络模型中的权重进行校正,以使卷积神经网络模型的输出结果与分类判断信息的期望结果相同。

具体请参阅图4,图4为本实施例卷积神经网络模型进行权重校正的流程示意图。

如图4所示,步骤s2400包括下述步骤:

s2410、当所述比对结果与所述分类判断信息不一致时,根据所述分类判断信息计算模型期望输出信息;

当卷积神经网络模型输出的两个数值的比对的大小关系与分类判断信息不一致时,读取该分类判断信息以使终端获取人们期望的输出结果,并将模型期望输出信息带入到步骤s2420中。需要指出的是模型期望输出信息分类判断信息的一次判断,如模型期望输出信息是b表示的颜值大于a表示的颜值。

s2420、根据所述模型分类参照信息与所述模型期望输出信息的差值计算响应误差;

具体地,当比对结果与分类判断信息不一致,如期望的l(a,b)=0,而实际的f(a)-f(b)=0.05,则响应误差为0.05。计算出响应误差后转入反向传播进行至步骤s2430。

s2430、将所述训练样本数据与所述响应误差相乘求取权重的梯度;

将输入的训练样本数据中的两张人脸图像的数据信息和响应误差相乘,从而获得卷积神经网络模型权重的梯度。

s2440、将所述梯度与训练因子相乘后取反并将其与所述权重相加以更新所述权重;

将计算得到的梯度乘上训练因子并取反后加到权重上,更新成为新的权重。训练因子将会影响到训练过程的速度和效果。梯度的方向指明了误差扩大的方向,因此在更新权重的时候需要对其取反,从而减小权重引起的误差。

s2450、反复循环迭代的更新所述权重,至所述比对结果与所述分类判断信息一致时结束。

比对结果与分类判断信息一致的结果无法通过一次权重的更新达到目的,因此,权重更新后将训练样本数据再次输入到卷积神经网络模型,验证卷积神经网络模型输出数据的比对结果与分类判断信息是否一致,不一致时,以当前的输出数据计算响应误差后继续循环至步骤s2430,如此反复循环迭代的更新权重,直至比对结果与分类判断信息一致时结束。

其中,训练因子特征描述为:

w=w+δw+lr*αw;

其中,w表示训练因子,lr表示第一参数值,α表示第二参数值,并定义函数:

其中,β表示第三参数值。

具体地,lr=0.01,α=0.0005,β=0.09

举例说明,本实施例卷积神经网络模型被训练用于检测人体脸部颜值。

准备50万的人脸对,对每个人脸对标注哪个人的颜值更高,搭建4层卷积和2层全连接的网络,最后一层全连接网络的输出数,采用激活函数sigmoid,保证输出有界。输出的是0~1之间的数值,输出的数值越高,表明颜值越高,输出值乘以100即为最终的颜值得分。构建损失函数验证卷积神经网络模型输出的结果是否需要验证。需要进行验证时通过反向传播算法更新卷积神经网络模型权重,直至卷积神经网络模型输出的结果不需要进行验证时为止。通过该方法依次对50万的人脸对进行验证训练。

本实施例还提供一种人脸分类装置。具体请参阅图5,图5为本实施例人脸分类装置基本结构框图。

如图5所示,人脸分类装置包括:采集模块2100、计算模块2200和输出模块2300。其中,采集模块2100用于采集待测目标信息;计算模块2200用于将待测目标信息输入通过输出目标与期望目标进行误差优化训练所得到的优化卷积神经网络模型中;输出模块2300用于获取优化卷积神经网络模型输出的待测目标信息的分类结果。

人脸分类装置采用了输出目标与期望目标之间的误差对卷积神经网络模型进行反向优化,不断地调整卷积神经网络模型的各项参数,优化卷积神经网络模型的性能,获取到优化卷积神经网络模型,能够有效地提高卷积神经网络模型的分类准确率。将待测目标信息输入到优化后卷积神经网络模型中,就能够得到准确率较高的分类结果。

具体地,训练样本数据包括:人脸数据对以及对人脸数据对进行标记的分类判断信息;分类判断信息包括:人体颜值、年龄、种族和性别信息当中的一种或多种的组合。

在一些实施方式中,分类装置还包括:第一数据输入子模块和第一数据约束子模块。其中,第一数据输入子模块用于将训练样本数据输入卷积神经网络模型;第一数据约束子模块用于将卷积神经网络模型最后一层全连接的输出值作为激活函数的输入值获取模型分类参照信息,以使分类参照信息输出有界。

具体地,止损函数特征描述为:

l(a,b)=max(f(a)–f(b),0)(label(a)<label(b));或

l(a,b)=max(f(b)–f(a),0)(label(b)<label(a));

其中,a为人脸数据对中的一个样本数据,b为人脸数据对中另一个样本数据,label(a)表示a的分类判断数据,label(b)表示b的分类判断数据,f(a)表示卷积神经网络模型输出的a的模型分类参照数据,f(b)表示卷积神经网络模型输出的b的模型分类参照数据。

在一些实施方式中,分类装置还包括:第一数据处理子模块、第二数据处理子模块、第三数据处理子模块、第四数据处理子模块和第五数据处理子模块,其中,第一数据处理子模块用于当比对结果与分类判断信息不一致时,根据分类判断信息计算模型期望输出信息;第二数据处理子模块用于根据模型分类参照信息与模型期望输出信息的差值计算响应误差;第三数据处理子模块用于将训练样本数据与响应误差相乘求取权重的梯度;第四数据处理子模块用于将梯度与训练因子相乘后取反并将其与权重相加以更新权重;第五数据处理子模块用于反复循环迭代的更新权重,至比对结果与分类判断信息一致时结束。

在一些实施方式中,分类装置还包括:

训练因子特征描述为:

w=w+δw+lr*αw;

其中,w表示训练因子,lr表示第一参数值,α表示第二参数值,并定义函数:

其中,β表示第三参数值,表示对l进行求偏导数运算,表示对w进行求偏倒数。

本实施例还提供一种智能终端。具体请参阅图6,图6为本实施例智能终端基本结构示意图。

如图6所示,智能终端包括:一个或多个处理器3110和存储器3120;一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:

采集待测目标信息;

将待测目标信息输入通过输出目标与期望目标进行误差优化训练所得到的优化卷积神经网络模型中;

获取优化卷积神经网络模型输出的待测目标信息的分类结果。

智能终端由于采用了输出目标与期望目标之间的误差对卷积神经网络模型进行反向优化,不断地调整卷积神经网络模型的各项参数,优化卷积神经网络模型的性能,获取到优化卷积神经网络模型,能够有效地提高卷积神经网络模型的分类准确率。将待测目标信息输入到优化后卷积神经网络模型中,就能够得到准确率较高的分类结果。

需要指出的是本实施列中,智能终端的存储器内存储用于实现本实施例中移动人脸分类方法中的所有程序,处理器能够调用该存储器内的程序,执行上述移动人脸分类方法所列举的所有功能。由于智能终端实现的功能在本实施例中的移动人脸分类方法进行了详述,在此不再进行赘述。

本实施例所表述的智能终端包括(不限于)智能手机、移动计算机或pc机。

需要说明的是,本发明的说明书及其附图中给出了本发明的较佳的实施例,但是,本发明可以通过许多不同的形式来实现,并不限于本说明书所描述的实施例,这些实施例不作为对本发明内容的额外限制,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。并且,上述各技术特征继续相互组合,形成未在上面列举的各种实施例,均视为本发明说明书记载的范围;进一步地,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1