对象形状对准装置、对象处理装置及其方法_3

文档序号:9667796阅读:来源:国知局
入了L1范数正则化,因此学习到的用于β的参数矩阵将是主要 由零占据的稀疏矩阵。也就是说,使得能够从计算出的包含多个提取特征的特征向量仅选 择作为最相关或者最有价值的特征片段的一些特征(其数量可例如由λ控制)。然后,特 征向量中的所选特征片段的索引(与式(2)中的维数变量j对应)可被记录为要在对准期 间使用的特征选择图。另外,与所选特征片段对应的参数h可被记录为要在对准期间使 用的回归函数的参数向量。
[0091] 顺便提及的是,如从式(2)和式(3)可以容易地看出的那样,特征选择图(即,所 选索引)和回归函数(即,其参数向量)两者都是针对所述多个训练样本的相应特征点的 相应坐标。换句话说,对于对象形状中的每个坐标,获得一个相应的特征选择图和一个相应 的回归函数。因此,对于对象形状中的多个坐标,在该步骤中获得多个特征选择图和多个回 归函数。
[0092] 到现在为止,已完成了训练过程。接下来,回到图4,可如步骤200~500中那样执 行对准过程。
[0093] 首先,在步骤200处,基于平均对象形状设定对象图像的初始对象形状(参见图 18) 〇
[0094] 如前所述,初始对象形状可被设定为平均对象形状自身。作为替代方案,可通过随 机扰动平均对象形状来设定初始对象形状。在图18中,类似地,示出了 15个特征点(即, 用于每个眼睛的4个特征点,用于鼻子的3个特征点和用于嘴的4个特征点)。但是,特征 点的数量不被特别限制,只要其与训练过程中的相同即可。
[0095] 接下来,在步骤300处,计算关于初始对象形状的多个特征点的至少一个特征向 量。
[0096] 如前所述,可从初始对象形状的多个特征点中的每一个周围的局部图像块提取 SIFT特征,然后,所述多个特征点的提取的SIFT特征可被组装成关于所述多个特征点的 一个特征向量。图19示意性地示出提取的SIFT特征描述符。在图19中,为了简化,如图 17(a)~(c)中那样,示出了仅用于三个特征点的SIFT特征描述符;从每个特征点(其位于 其相应的局部图像块的中心处)周围的4X4格子的局部图像块提取SIFT特征;每个格子 中的提取的SIFT特征的维数是8 ;并且,每个特征点的提取的SIFT特征的维数如4X4X8 =128那样高。但要注意,图像块的尺寸(以及由此特征向量的维数)和提取特征的类型 不被特别限制,只要它们与训练过程中的相同即可。也就是说,用于获得特征向量的该步骤 与训练过程中的相同。
[0097] 然后,在步骤400处,对于初始对象形状的所述多个特征点的每个坐标,基于所述 多个特征选择图中的相应一个从计算出的特征向量选择特征片段并将所选特征片段组装 成子特征向量。
[0098] 更具体而言,例如可如下实施步骤400 :在选择特征片段的情况下,基于所述多个 特征选择图中的相应一个中的特征索引从计算出的特征向量选择特征片段;并且,在组装 特征片段的情况下,基于所述多个特征选择图中的相应一个中的特征次序将特征片段组装 成子特征向量。图21示意性地示出特征向量、特征选择图和子特征向量之间的关系。
[0099] 虽然特征向量实际上包含用于多个特征点的特征,但是,为了简化,图21中的特 征向量仅示出用于三个特征点的特征,其中,特征A至fw、特征至以及特征??·/至f3S4分别与不同的特征点对应,并由此以不同的阴影被示出。显然,特征向量是致密特征集, 其包含非常丰富的特征,但具有非常高的维数。
[0100] 在本发明中,作为直接使用该高维数特征向量的替代,对于初始对象形状中的每 个坐标,最相关或最有价值的特征片段基于特征选择图从其被选择,以被组装成具有低得 多的维数的子特征向量。图21示意性地示出对于三个示例性坐标的特征选择图(a)至(c) 以及相应的子特征向量(a)至(c)。如前所述,特征选择图包含特征向量中的所选特征片 段的索引。特征选择图的形式不被特别限制,只要其能够指示所选特征片段即可。图21给 出了特征选择图的示例性形式。更具体而言,特征选择图可以是具有与特征向量的维数相 同的维数的向量。其元素为〇或1。例如,"〇"表示具有相同的维数索引的相应特征不被选 择,而" 1"表示具有相同的维数索引的相应特征被选择。然后,可基于特征选择图中的特征 次序将每个坐标的所选特征片段组装成子特征向量。如从图21可以看出的那样,不同坐标 的子特征向量可以不同。换句话说,子特征向量对于每个坐标是特定。并且,与特征向量的 维数相比,子特征向量的维数被大大减少。
[0101] 为了更好地示出本发明的特征选择结果,图22比较性地示出选择之前的SIFT特 征(参见(a))和选择之后的SIFT特征的三个例子(参见(b)~(d))。为了简化,图22仅 示出特征点周围的4个格子的SIFT特征描述符。在特征选择之前,每个格子中的特征维数 是8(参见(a))。在特征选择之后,格子中的特征维数可低于8,并且具体情况依赖于对象 形状中的坐标。
[0102] 现在回到图4。在获得子特征向量之后,最后,在步骤500处,对于初始对象形状的 至少一个特征点的至少一个坐标,基于相应的子特征向量和所述多个回归函数中的相应一 个预测坐标增量。
[0103] 例如,可如图6所示的那样实施坐标增量预测步骤500。
[0104] 如图6所示,在步骤510处,对于所述至少一个特征点的所述至少一个坐标,首先 获取所述多个回归函数中的相应一个的参数向量。
[0105] 然后,在步骤520处,对于所述至少一个特征点的所述至少一个坐标,将相应的子 特征向量投影到参数向量上以获得坐标增量。
[0106] 这可由下式(6)表示:
[0107]
[0108] 这里,ΛSk表示对象形状中的第k个坐标的坐标增量(假定如式(5)中那样总共 存在Μ个特征点,变量k的范围可以为1至2M,并且Ask可指示从八七至ΛχΜ和Ayi至 ΛyM中的任一个),fk表示第k个坐标的子特征向量,rkt表示对于某个对准处理(在重复T 次的级联处理中,变量t的范围可以为1至T)的第k个坐标的回归函数,并且符号表 示投影或交互作用(诸如相乘、点积等)。图23给出式(6)的结构示意。在图23中,为了 简化,与图14中那样,只示出用于4个格子的SIFT特征描述符。
[0109] 顺便提及的是,要注意,用于预测坐标增量的步骤500只需要被应用于初始对象 形状的至少一个特征点的至少一个坐标。但是,步骤500也可优选被应用于初始对象形状 的多个特征点的每个坐标。在本发明中,这不被特别限制。
[0110] 到现在为止,已示意性地描述了本发明的对象形状对准方法。通过SDM和本发明 的方法之间的比较可以看出,SDM通过使用同一个特征向量和一个统一的回归函数来预测 对象形状中的不同坐标的坐标增量;而本发明的对象形状对准方法通过使用不同的特征 片段和不同的回归函数来独立地预测对象形状中的不同坐标的坐标增量。更具体而言,在 SDM(参见式(1)和图14)中,采用包含多个特征的一个高维数特征向量F(S卩,致密特征 集)和用于整个对象形状的一个统一的回归函数1^来预测多个坐标的坐标增量AS;相对 照地,在本发明(参见式(6)和图23)中,对于对象形状中的每个坐标,采用特定的子特征 向量fk(具有低得多的维数且只包含最相关或最有价值的特征)和特定的回归函数r:来 独立地预测一个坐标的坐标增量ASk。由于以上的原因,因此,本发明能够减小模型尺寸, 实现更高的精度和/或更高的速度和/或更高的鲁棒性等,如以下将更清楚地看到的那样。
[0111] 可选地,在对于初始对象形状中的坐标预测坐标增量之后,通过对于所述至少一 个特征点的所述至少一个坐标添加相应的坐标增量,可将所述至少一个特征点移动到其更 新位置。由此,获得了更新的对象形状。图20示意性地示出特征点移动。图20中的箭头 指示特征点的更新位置,其看起来更接近真值。
[0112] 另外,可选地,图4中的对准处理可被重复几次(例如,T次),以逐步接近对象形 状的真值(这是为什么式(6)中的回归函数具有上标"t"的原因)。换句话说,可对对准处 理采用级联回归器。图7给出了根据本发明的级联对象形状对准方法的示意性流程图。其 主要步骤与图4的基本上相同。
[0113] 如图7所示,首先,在步骤95处,变量t被设定为1。然后,处理依次前进到步骤 100、200、300、400、500 (其与图4中的相同)。接下来,在步骤600处,判断t是否小于阈值 T(T是经验确定值;由于本发明的方法是Newton方法的变型,因此其收敛速度是二次的,由 此T例如可以仅约为4~5)。如果是,那么处理前进到t被加1的步骤700,并然后回到步 骤100;否则,处理结束。
[0114] 也就是说,在本发明中,可通过使用不同的对象形状回归模型并将当前更新的对 象形状设定为下一对象形状回归模型的初始对象形状,来依次重复执行获取对象形状回归 模型的步骤、设定初始对象形状的步骤、计算所述至少一个特征向量的步骤、选择特征片段 并组装特征片段的步骤、以及预测坐标增量的步骤。
[0115] 要注意,虽然以上通过以面部形状为例描述了本发明的对象形状对准方法,但其 不必限于此。实际上,本发明的对象形状对准方法也可被应用于各种其它的对象形状,包括 但不限于例如体部形状。在对准体部形状的情况下,可检测诸如头、手、膝盖、脚等的体部部 位的位置。
[0116] 现在,将评价本发明的对象形状对准方法的效果。
[0117] 通过利用包括FERET、PIE、BioID、IndianFaceDatabase、CVLAB和Labelled FacesintheWild(LFW)的公共可用的面部数据集来进行评价。为了在不同的条件下进 行评价,将测试的面部图像分成6个数据集。3个数据集包含随机选自FERET、Bi〇ID、PIE、 CVLAB和IndianFaceDatabase的面部图像,其在受控的室内条件下被收集并由此示出很 小的背景、表情、照明等的变动。其它3个数据集包含随机选自LFW的面部图像,其从网络 (即,在不受控的条件下)被收集并由此示出大的姿势、表情、照明、焦点、背景等的变动。
[0118] 根据这6个数据集的RMSE(均方根误差)直方图结果和累积概率结果,本发明的 对象形状对准方法的表现对随机选自相同条件的数据集是非常稳定的。可以断定,对所选 数据集的表现可代表相应条件下的真实表现。并且,本发明的对象形状对准方法对于年龄、 面部表情、视角、种族、照明等的变动是非常鲁棒的。
[0119] 表1给出了LFW数据集上的SDM与本发明的对象形状对准方法之间的表现比较。
[0120] 表 1
[0121]
[0122] 如从表1清楚可见的那样,对于本发明的对象形状对准方法,模型尺寸大大减小, 而时间成本相当,精度更好。
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1