一种面部识别方法及其系统的制作方法_2

文档序号:9826406阅读:来源:国知局
硬件和软件一起实现其功能。
[0032] 所述输入视频302可以包括任何合适类型的资源的视频内容并且可以包含有多 种不同的视频资源。源自于所述输入视频302的内容可以包括视频数据以及元数据。输入 视频的一系列视频帧包含了输入视频302的内容并用于其他模块进行处理。当然,所述输 入视频也可以是一幅单独的图片。所述输入视频还可以被分为多个不同的视频帧集合。
[0033] 所述面部检测模块304可以用于一系列视频帧中定位面部。所述面部检测模块 304可以内置在电视机102中,或者作为一个独立的模块设置在电视机102外。
[0034] 所述运算模块306用于通过改进的鲁棒主成分分析算法(IRPCA)来初始化^半 二次的低秩表不算法(LRRHKhLl)并且通过所述h半二次的低秩表不算法来计算获得所 述权重矩阵,从而在复杂的遮挡及噪声、模糊的影响中恢复清晰的图像。
[0035] 所述面部分类模块308用于通过鲁棒协同表示算法(RCR)进行分类操作并且给出 选出的最终类别辨认特性。
[0036] 具体的,所述字典310可以包括任何合适的数据库用于存储面部图像等。例如,一 个存储有面部相关图像收集结果的本地或在线数据库。更具体的,对于在一部给定的电影 以及对应的演员集合中进行面部识别,每个演员(如目标演员)的姓名以及电影名可以作 为检索关键字,在字典中检索获得一系列图像,其中每个图像中均包含有一个或者多个演 员的面部。
[0037] 所述输出模块312用于输出已辨认面部。上述模块可以整合到一起或者减省,也 可以添加一些其他功能模块。
[0038] 图4为本发明具体实施例的在所述面部识别系统的各个模块中执行的面部识别 程序400的方法流程图。
[0039] 如图4所示,首先,将输入视频分割为若干不同的视频帧集合(S402)。由于视频是 由一系列的视频帧组成,并且在现有常用的视频帧率(例如25帧/每秒)下,相邻视频帧的 变化非常小。因此,可以使用一些聚类或者组合技术将整个视频分割为若干个由相似的视 频帧组成的视频帧集合进行进一步的处理来替代原有独立的处理每一视频帧的处理方法。
[0040] 例如,图5为将一个视频流分割为若干个不同的视频成分的示意图。如图5所示, 一个视频流可以分割为若干个场景,一个场景可以分割为若干个镜头,并且一个镜头可以 分割为若干个视频帧等。所述视频帧可以进一步分割为视频帧的目标及特征,所述目标及 特征可以被提取用于进一步的处理。
[0041] 继续参阅图4,在获取输入视频序列后,所述视频序列被简化为一个与通过记录在 输入视频帧的每个摄像机参数设置,与初始摄像机参数设置对齐的已记录摄像机参数设置 一致的视频帧序列(S404)。
[0042] 典型的电影视频序列是由多个摄影镜头以交错形式组成,并且"摄像机获取的内 容"是一个在给定的摄像机参数设置下连续的记录过程。在此使用术语"摄像机参数设置 记录结果"(camera registration)表示采用不同摄像机拍摄的视频帧形成的某一视频序 列或者视频流的摄像机参数设置记录结果。所述"摄像机参数设置记录结果"的概念源自 于视频编辑中视频重构的"摄像机获取的内容"(camera take)。
[0043] 典型的视频序列是一个由多个镜头以交错形式组成,并且"摄像机获取的内容"是 一个在给定的摄像机参数设置下连续的记录过程。通过记录输入视频帧的每一个摄像机参 数设置,所述原始的镜头交错形式可以被分离为与初始摄像机参数设置对齐的"已记录摄 像机参数设置"(registered camera)对应的一系列视频帧序列。
[0044] 在定义摄像机获取的内容后,检测在视频中每一视频帧的面部(S406)。在每一视 频帧中进行面部检测能够在进行面部识别之前有效的提供面部轨迹。这样的,可以在每个 摄像机获取的内容中的每一视频帧中进行面部检测。所述面部检测能够自动的在一系列视 频帧中定位面部的位置。
[0045] 在同一个摄像机获取的内容中检测出的面部的集合可以作为面部轨迹。通过这种 方式,可以生成在整个视频中的面部轨迹(S408)。具体的,一个新的面部轨迹通过在每一摄 像机获取的内容中的第一个检测出的面部进行初始化。对于摄像机获取的内容中的其他视 频帧,当来自于相邻视频帧之间的两个检测出的面部的距离超出预定的阈值时,生成一个 新的面部轨迹。否则,将其加入到原有的面部轨迹中。
[0046] 进一步的,使用基于鲁棒协同表示分类器,在具有复杂的遮挡及噪声、模糊影 响的面部测试样本中恢复一个清晰的图像并进行分类(S410)。现有的孤立点检测算 法及分类器能够方便的整合到一个鲁棒框架中用于协同表示。令y e 1^表示测试样本, Γ =阢e irm表示c个目标堆叠在列的样本集合的矩阵(如字典),其中η e舻~表 示第ith个目标的1个样本集合从而令Σ ιηι=η。
[0047] 假设孤立点检测结果输入测试样本y以及面部字典T,并且形成权重对角矩阵W。 这样的w y是一个具有权重的测试样本,其中孤立点部分(例如太阳眼镜的组成像素)被赋 予较小的权重(接近0)。所述孤立点检测(OLD)的步骤通过如下算式表示:
[0048] ff = 0LD(y, T) (1)
[0049] 令分类过程输入测试样本y、面部字典T以及权重对角矩阵W中,并输出分类结果 索引,所述分类结果索引通过如下算式表示:
[0050] Identity (y) =CLF(y,T,ff) (2)
[0051] 算式1可以通过h半二次(Half Quardratic,HQ)最小化来求解,所述1丨半二次 优化方法已经被证明能够在遮挡和噪声、模糊等影响下保持鲁棒。
[0052] 图6为本发明具体实施例的鲁棒协同表示方法的方法流程图。如图6所示,为了 初始化用于半二次(HQ)最小化的W,通过改进的鲁棒主成分分析来获得一幅清晰的测试图 像(S4102)。
[0053] 若函数K由两组变量a和w所决定,函数k为半二次,从而使函数k为a的二次函 数。所述改进的半二次函数k由一些非二次准则J组成,并可以由如下算式表示:
[0055] J (a)为重构函数,由如下算式定义:
[0056] J (a) = Φ (a) +Q (a). (4)
[0057] 其中,Φ (a)和Q(a)分别定义如下:
[0061] 依据算式(4),(5)和(6),K(a,w)由如下算式表示::
[0063] 其中,Φ可以通过凸对偶关系,由Φ所定义。所述^半二次问题通过a和w的交 替迭代不断优化以达到最小值。
[0066] 选择使用的势函数Φ以及其对应的权重函数w可以通过Μ估计法或者其他能够 满足所述半二次势函数情况的函数所确定。
[0067] 上述迭代算法是一种迭代重加权最小二乘法(IRLS)算法。因此,在半二次及重加 权最小二乘之间具有清晰的联系。即使在某些情况下,对于任何初始值蹲,K(a,b)具有全 局收敛性,但是半二次函数在^框架中是否全局收敛仍然是不确定的。对于不同的初始值 获得不同的W。选择恰当的初始值对于面部识别(FR)的效果非常重要。首先,列出两个 最具潜力的初始值硭。然后,初始化的求解过程具体如下:
[0068] 1、该初始化可以是由测试样本减去平均字典图像。亦即硿¥ - )?,其中,
[0069] 2、义的另一个基于a°的可能解为a°的幼稚重构。亦即,a°= T/y。
[0070] 第一种解的表示可能与测试样本的面部偏离很多,由于平均面部并不需要与测试 样本相似并且存在非常多错误。因此,当包含有错误的平均面部进行初始化时,其会导致错 误W。在测试样本和字典中的面部存在一些小的模糊及噪声影响时,第二种解的表示可以形 成一个准确的W。在此时,在W中的所有元素均接近于0。但是,当测试样本中存在许多模 糊及噪声影响时,该幼稚重
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1