一种视频中人脸特征点的稳定检测方法与流程

文档序号：12272153阅读：来源：国知局

技术特征：

1.一种视频中人脸特征点的稳定检测方法，其特征在于：包括如下步骤：

1)采用形状回归方法以级联的方式预测脸部形状S，从一个初始的形状S⁰，S通过一级一级估计形状增量进阶式改善，在一个通用形式下，一个形状增量ΔS^t在t级回归为：

ΔS^t＝W^tΦ^t(I，S^t-1)， (1)

其中I是输入图像，S^t-1是来自于上一级的形状，Φ^t是特征映射函数，W^t是线性回归矩阵；Φ^t依赖于I和S^t-1；通过将ΔS^t加入到S^t-1，将回归带入到下一级；

2)学习局部二值特征Φ^t

特征映射函数由一系列局部特征映射函数组成，学习每一个映射函数，学习的回归目标是形状的偏移量

其中i表示迭代所有的训练样本，运算π_l从向量选出两个元素表示第i个训练样本中第l个特征点的实际值；

用标准的随机森林学习每一个局部映射函数每棵树的分裂节点通过特征的像素差训练；训练之后，每一个叶节点存储了一个所有训练样本的平均向量；

在测试时，样本将会遍历一棵树直到它到达某一个叶节点，随机森林的输出是每一个叶节点值的总和，假设所有叶节点的输出值是D，那么输出写作：

$<mrow> <msubsup> <mi>ω</mi> <mi>l</mi> <mi>t</mi> </msubsup> <msubsup> <mi>φ</mi> <mi>l</mi> <mi>t</mi> </msubsup> <mrow> <mo>(</mo> <msub> <mi>I</mi> <mi>i</mi> </msub> <mo>,</mo> <msubsup> <mi>S</mi> <mi>i</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>$

其中是一个2*D的矩阵，其中每一列是一个存储在叶节点的二维向量，是一个D维二值向量，对于里面的每一维，如果测试样本到达该叶节点，那么它就是1，否则就是0；因此，是一个非常稀疏的二值向量；

2)学习全局线性回归W^t

通过下式获得：

$<mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <msup> <mi>W</mi> <mi>t</mi> </msup> </munder> <msubsup> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </msubsup> <mo>|</mo> <mo>|</mo> <msubsup> <mi>ΔS</mi> <mi>i</mi> <mi>t</mi> </msubsup> <mo>-</mo> <msup> <mi>W</mi> <mi>t</mi> </msup> <msup> <mi>Φ</mi> <mi>t</mi> </msup> <mrow> <mo>(</mo> <msub> <mi>I</mi> <mi>i</mi> </msub> <mo>,</mo> <msubsup> <mi>S</mi> <mi>i</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>+</mo> <mi>λ</mi> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>t</mi> </msup> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>$

其中第一项是回归目标，第二项是一个W^t上的L2正则化项，λ控制正则化强度；

4)基于视频的人脸特征点稳定处理

在检测到特征点以后，将该特征点与上一帧检测到的特征点做一个分析，如果两帧图像的特征点平均移动值小于某一个值，假设该帧图像的脸没有移动，那么将特征点位置设置为与上一帧相同：

$<mrow> <mi>Δ</mi> <mi>d</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <msubsup> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>n</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mrow> <mo>(</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>y</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> </msub> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>$

其中，n为特征点个数，x_i1表示第i个特征点在前一帧图像中的坐标的x值，x_i2表示第i个特征点在后一帧图像中的坐标的x值，y_i1表示第i个特征点在前一帧图像中的坐标的y值，y_i2表示第i个特征点在后一帧图像中的坐标的y值。

2.如权利要求1所述的视频中人脸特征点的稳定检测方法，其特征在于：所述步骤4)中，把特征点分成多份，每一份分别检测平均位移。

完整全部详细技术资料下载

当前第2页1 2 3