年龄估计装置、年龄估计方法和年龄估计程序的制作方法

文档序号：6349042阅读：191来源：国知局

专利名称：年龄估计装置、年龄估计方法和年龄估计程序的制作方法
技术领域：
本发明涉及用于估计人的年龄的装置、方法和程序。
背景技术：
例如，作为一种基于人脸图像数据利用识别设备等来机械地估计人的年龄的方法，例如，存在自己识别年龄的方法，即将年龄作为连续量来估计的方法(在该方法中，年龄估计被作为回归问题执行)。例如，非专利文献1中公开了这种方法。由于可以表达连续年龄，因此实验已表明，与年龄估计被作为识别问题执行的方法相比，出现更少的矛盾，并且，可以以高准确性来识别年龄。回归问题可通过将求解所估计年龄(被估计的年龄)和正确年龄(正确的年龄)作为最小化问题来获得。具体的示例包括多线性回归分析和(内核)岭回归(ridge regression)。这些方法执行学习，以便减少所估计年龄和正确年龄之间的均方误差或平均
绝对误差。图5示出了将年龄估计作为回归问题来执行的年龄估计装置的示例。一般而言，将要输入的图像数据(例如，脸部图像数据)是诸如像素数或像素数X3(R、G和B的颜色值)之类的高维度数据。因此，在维度压缩器61中，从图像数据中抽取特征，使得年龄信息被突出，而非必要信息(光照条件、脸部角度，等等)被删除。因此，图像数据被从高维度数据转换成低维度数据。此处，在维度压缩器61中，例如，使用诸如主成分分析(PCA)、线性判别分析(LDA)和局部保持投影(LPP)之类的方法。该处理还被称为是“特征选择”和“维度压缩”。然后，识别设备62基于所抽取的特征来估计年龄。为了通过年龄估计装置60基于图像数据来估计年龄，需要维度压缩器61和识别设备62的学习。即，其正确年龄(实际年龄或感知年龄(即，视年龄(apparent age)))已知的人的多个图像数据被输入到维度压缩器61，并且，每个数据由诸如N倍交叉验证(N-fold cross validation)禾口留一$111￡ (leave-one-out cross-validation)
估。基于该评估结果，识别设备62的输出被调整，使得误差(所估计年龄和正确年龄之间的差异)可被减少。对于识别设备62的学习，应用诸如线性回归、多回归、岭回归和神经网络之类的方法。通过重复类似的流程同时变更特征的类型和组合、抽取方法(即，维度压缩所使用的参数)等，参数和模型被选择，使得误差可被减少。相关领域文献[非专利文献]非专利文献 1 :Y. Fu、Y. Xu 禾口 Τ· S. Huang, Estimating human age by manifold analysis of face pictures and regression on aging features，IEEE 多I^y[本禾口MH 论文集，第1383页至第1386页，200
发明内容
发明所要解决的问题为了在图5中所示的年龄估计装置中获得带有高准确性的年龄估计，需要收集大量的图像数据。但是，存在如下问题需要手动地将正确年龄数据应用到大量图像数据中的每一个的操作(加标签)。鉴于以上问题，做出了本发明，并且，其意欲提供能够减少对用于年龄估计的图像数据的加标签劳动的年龄估计装置、年龄估计方法和年龄估计程序。解决问题的手段为了获得前述目的，本发明的年龄估计装置是一种用于估计图像数据中的人的年龄的年龄估计装置，包括维度压缩单元，该维度压缩单元用于对图像数据应用维度压缩以输出低维度数据；分簇单元，该分簇单元用于对所输出的低维度数据执行分簇；加标签单元，该加标签单元用于对已分簇的低维度数据中的每个簇的代表性数据加标签；以及识别单元，该识别单元用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄。本发明的年龄估计方法是一种用于估计图像数据中的人的年龄的年龄估计方法，包括用于对图像数据应用维度压缩以输出低维度数据的维度压缩步骤；用于对所输出的低维度数据执行分簇的分簇步骤；用于对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签步骤；以及用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄的识别步骤。本发明的程序是一种用于估计图像数据中的人的年龄的年龄估计程序，其中，计算机被导致执行如下处理对图像数据应用维度压缩以输出低维度数据的维度压缩处理；对所输出的低维度数据执行分簇的分簇处理；对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签处理；以及利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄的识别处理。发明的效果根据本发明，可减少对用于年龄估计的图像数据的加标签工作。

图1是示出了根据本发明的实施例的年龄估计装置的配置的示图。图2是示出了由根据本发明的实施例的年龄估计装置所执行的年龄估计结果的示例。图3是示出了根据本发明的实施例的年龄估计装置的模型中的数据分布的示例的示图。图4是示出了由估计器针对每个年龄基于脸部图像的年龄估计结果的示例的示图。图5是示出了将年龄估计作为回归问题来执行的年龄估计装置的示例的示图。
具体实施例方式[第一实施例]将描述合适地实现了本发明的第一实施例。
图1示出了根据该实施例的年龄估计装置的配置。年龄估计装置10包括维度压缩器11、分簇设备12、加标签设备13，以及识别设备14。例如，人的图像数据(例如，人脸图像数据)作为训练数据(学习数据)被输入到年龄估计装置10。该图像数据是具有像素数X照明水平数的维度的高维度数据。当高维度图像数据被输入时，维度压缩器11执行维度压缩(维度减少)。即，维度压缩器11从图像数据抽取特征，使得年龄信息被突出，而非必要信息(光照条件、脸部角度，等等)被删除。例如，特征通过诸如PCA、LDA和LPP之类的方法被抽取。因此，高维度图像数据被转换成低维度图像数据(低维度数据)。接下来，分簇设备12执行对通过维度压缩所获得的低维度数据的分簇。作为分簇，例如，可使用K-均值分簇。接下来，在经过了分簇的低维度数据中，仅有代表性数据被加标签设备13加标签 (对正确年龄数据的应用)。例如，最接近属于每个簇的数据的平均值的数据被看作是代表性数据，并且，代表性数据由加标签设备13加标签；或者，从每个簇中随机选出的数据被看作是代表性数据，并且，代表性数据由加标签设备13加标签。另外，多个代表性数据可由加标签设备13来加标签。以下，已加标签的数据被称为已加标签训练数据(已指导数据)，而未加标签的数据被称为未加标签训练数据(未指导数据)。在输入到年龄估计装置10的图像数据中，认为数据的出现频率被局部增加的部分依赖于脸部特征的各种变化和拍摄环境的差异而被分散。如将稍后描述的，在高斯内核被用于回归模型的情形中，训练数据和测试数据之间的距离给出了重要的信息。因此，如上所述，对数据的出现频率增加的部分训练数据加标签可以是有效的方法。通过这种方式，根据该实施例，加标签不是关于所有所输入的图像数据而执行的，而是关于部分数据(代表性数据)来执行的。因此，根据该实施例，可减少加标签的劳动。识别设备14基于由维度压缩器11所抽取的特征来估计年龄。作为维度压缩器11和识别设备14，可使用那些具有共同配置的设备。但是，在维度压缩器11中的特征抽取方法(维度压缩所使用的参数)和识别设备14的类型是基于通过考虑示出了所估计的年龄误差(所估计年龄和正确年龄之间的差异)的严重程度的“权重”所获得的评估结果来决定的。另外，权重的概念被引入到识别设备14的学习内容中。此处，将如以下来描述引入权重概念的原因。如上所述，通过惯常的年龄估计装置(例如，在图5中所示的装置)，基于脸部图像数据，通过重复流程同时变更特征的类型和组合以及抽取方法(即，维度压缩所使用的参数)，参数和模型被选择，使得误差可被减少。但是，由于依赖于所意欲的年龄，年龄之间的距离是不同的，因此，使用所估计年龄和正确年龄之间的均方误差和平均绝对误差导致年龄识别的准确度的降低。例如，在正确年龄和识别年龄之间存在10年差异(误差)的情形中，在将5岁误认为是15岁和将35岁误认为是45岁之间的严重程度是不同的。换言之，即便是在相同的10岁差异的误差中，将5岁误认为15岁意味着将幼儿园的孩子误认为是初中生或高中生，并且，就人的感知而言，这是非常严重的误差。在另一方面，由于35岁的人的脸部特征非常类似于45岁的人的脸部特征，因此，人甚至常常不能识别其间的差异。因此，将35岁误认为45岁不像将5岁误认为15岁那么严重。人的外观在青年阶段(诸如成长阶段)急剧变化，而在变成成年人之后缓慢地变化。因此，即便是相同的年龄差异误差，如果用相同的指示符来做出评估，则出现问题。图4示出了由估计器针对每个年龄基于脸部图像来做出的年龄估计的结果的示例。示图示出了在针对每个年龄对其正确年龄已知的人的年龄估计的结果进行分类的情形中的“所估计年龄的标准偏差(变化程度)”。水平轴指示对象的正确年龄(真实年龄)，而垂直轴示出估计误差的标准偏差。此处，正确年龄(真实年龄)是由估计器所估计的年龄的平均值。由于年轻人的标准偏差很小，可以理解，大多数估计器将年轻人估计为类似的年龄。因此，如果在年龄估计装置中年轻人的数据被错误地识别为成年人，则这与人所感知的结果极大地不同。此处，该实施例通过将权重的概念引入到识别设备14的学习内容中而获得能够获得与人的识别结果非常匹配的识别结果的特征抽取。另外，识别设备14通过不仅利用已加标签的训练数据还通过利用未加标签的训练数据来创建准确的模型(用于年龄估计的模型)。此处，将参照图3A和图;3B来描述在该实施例中所创建的模型的示例。图3A示出了在识别设备14的学习之前(初始状态)的模型的数据分布。如图3A所示，在学习之前的模型包括两种类型的数据，其已加标签的训练数据和未加标签的训练数据，并且，这些数据被边界分开。即，在图3A中，在a的范围内的未加标签训练数据被分类为由菱形所指示的已加标签的训练数据，而在b的范围内的未加标签训练数据被分类为由圆圈所指示的已加标签的训练数据。在该实施例中，例如通过将稍后描述的半指导学习，在图3A中所示的模型被转换成在图3B中所示的准确模型。与在图3A中所示的模型相比，在图:3B中所示的模型的边界被变形，并且，在a的范围内的未加标签的训练数据被分类为由圆圈所指示的已加标签的训练数据，并且，在b的范围内的未加标签的训练数据被分类为由菱形所指示的已加标签的训练数据。以下，将描述通过不仅利用已加标签的训练数据还利用未加标签的训练数据的半指导学习的年龄估计方法。该方法是未加标签的训练数据被用于内核函数的正规化最小二乘的方法(将权重指派给内核函数的正规化最小二乘的方法，内核正规化加权最小二乘 KRWLS)，并且，有效地使用整个训练数据的示图和副本(manifold)的结构。该方法意欲通过利用诸如示图和副本的结构(将稍后描述的表达式(3))之类的信息来平滑回归模型，从而提高年龄估计的准确度。另外，年龄的权重被在最小二乘中考虑。从这种特点来看，该方法可被称为是半指导内核正规化加权最小二乘(SKRWLS)。此处，所考虑的问题是预测测试数据的真实年龄f的半指导学习，测试数据为特征向量χ的抽取源，其中，在应用一个已加标签训练数据(Xi，yi) [Xi是示例性变量(脸部特征 < 其可被称为特征向量>)，Yi是客观变量(年龄)，i是1到1]和u个未加标签训练数据(Xi) [Xi是示例性变量(脸部特征 < 其可被称为特征向量>)，i是1+1到1+u]的条件下， y* = f(x)0在该实施例中，年龄估计函数f(x)由正定内核k(x，x’)的线性组合建模。这由以下的表达式(1)来表达。表达式(1)是用于输出确定的年龄的表达式。该年龄是通过在学习(将稍后描述其细节)期间获得最佳解并然后将所获得的最佳解带入表达式(1)中来输出的。
权利要求
1.一种用于估计图像数据中的人的年龄的年龄估计装置，包括维度压缩单元，该维度压缩单元用于对所述图像数据应用维度压缩以输出低维度数据；分簇单元，该分簇单元用于对所输出的低维度数据执行分簇；加标签单元，该加标签单元用于对已分簇的低维度数据中的每个簇的代表性数据加标签；以及识别单元，该识别单元用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄。
2.根据权利要求1所述的装置，其中用于所述维度压缩单元的维度压缩的参数和用于所述识别单元的年龄估计的特征量是利用加权函数基于对一般化能力的评估结果而设置的，该加权函数示出了每个年龄的估计年龄误差的严重程度，以及所述识别设备的学习是基于所述加权函数而执行的。
3.根据权利要求1或2所述的装置，其中所述对一般化能力的评估是基于加权均方误差做出的。
4.根据权利要求1至3中的任一项所述的装置，其中所述加权函数是基于每个感知年龄的标准偏差定义的。
5.根据权利要求1至4中的任一项所述的装置，其中所述加权函数的值越小，所述估计年龄误差越严重。
6.一种用于估计图像数据中的人的年龄的年龄估计方法，包括用于对所述图像数据应用维度压缩以输出低维度数据的维度压缩步骤；用于对所输出的低维度数据执行分簇的分簇步骤；用于对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签步骤；以及用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄的识别步骤。
7.根据权利要求6所述的方法，其中用于所述维度压缩步骤中的维度压缩的参数和用于所述识别步骤中的年龄估计的特征量是基于加权函数设置的，该加权函数示出了每个年龄的估计年龄误差的严重程度，以及执行所述识别步骤的识别设备被使得基于所述加权函数执行学习。
8.根据权利要求6或7所述的方法，其中所述对一般化能力的评估是基于加权均方误差做出的。
9.根据权利要求6至8中的任一项所述的方法，其中所述加权函数是基于每个感知年龄的标准偏差定义的。
10.根据权利要求6至9中的任一项所述的方法，其中所述加权函数的值越小，所述估计年龄误差越严重。
11.一种用于估计图像数据中的人的年龄的年龄估计程序，其中，计算机被使得执行如下处理对所述图像数据应用维度压缩以输出低维度数据的维度压缩处理；对所输出的低维度数据执行分簇的分簇处理；对已分簇的低维度数据中的每个簇的代表性数据加标签的加标签处理；以及利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄的识别处理。
12.根据权利要求11所述的程序，其中用于所述维度压缩处理的维度压缩的参数和用于所述识别处理的年龄估计的特征量是基于加权函数设置的，该加权函数示出了每个年龄的估计年龄误差的严重程度，以及所述计算机被使得基于所述加权函数来执行用于执行所述识别处理的识别设备的学习的处理。
13.根据权利要求11或12所述的程序，其中所述计算机被使得基于加权均方误差来执行做出对一般化能力的评估的处理。
14.根据权利要求11至13中的任一项所述的程序，其中所述计算机被使得基于每个感知年龄的标准偏差来执行用于定义所述加权函数的处理。
15.根据权利要求11至14中的任一项所述的程序，其中所述加权函数的值越小，所述估计年龄误差越严重。
全文摘要
提供了能够减少年龄估计所用的对图像数据进行加标签的劳动的年龄估计装置、年龄估计方法和年龄估计程序。用于估计拍摄成图像数据中的人的年龄的年龄估计装置包括维度压缩装置，用于对图像数据应用维度压缩以输出低维度数据；分簇装置用于对所输出的低维度数据执行分簇；加标签装置用于对已分簇的低维度数据中的每个簇的代表性数据加标签；以及识别装置用于利用包含在已加标签的低维度数据和未加标签的低维度数据中的特征量基于学习结果来估计人的年龄。
文档编号G06T7/00GK102422323SQ201080019028
公开日2012年4月18日申请日期2010年4月14日优先权日2009年4月28日
发明者伊原康行, 杉山将, 植木一也申请人:Nec软件有限公司, 国立大学法人东京工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：植木一也;杉山将;伊原康行
技术所有人：NEC软件有限公司;国立大学法人东京工业大学
我是此专利的发明人

上一篇：年龄估计设备、方法和程序的制作方法
上一篇：用于处理文档对象模型(dom)以处理视频内容的方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。