基于多示例学习的视频人脸识别算法

文档序号:8457554阅读:284来源:国知局
基于多示例学习的视频人脸识别算法
【技术领域】
[0001] 本发明涉及数字图像处理与计算机视觉领域,特别涉及一种视频人脸识别算法。
【背景技术】
[0002] 视频人脸识别近年来成为计算机视觉领域的研宄热点和难点问题,伴随着物联 网、网络安全等的发展,具有广阔的应用前景。相对于静态图像,动态视频中可选用的特征 信息更加丰富多样,例如,视频的时间动态信息有助于识别率的提升;从视频序列中可以选 取分辨率相对较高的图像以能够提高识别性能;还可以通过视频学习重构目标三维模型, 利用这些模型可以高效的实现目标识别。总之,时间和运动信息在基于视频的目标识别中 起到了至关重要的作用。
[0003] 视频人脸识别方法主要分为两类:一类方法是设法提取出视频序列中最具代表性 的单独人脸帧图像,采用传统的基于静态图像的人脸识别方法,包括基于几何特征的方法、 基于统计的方法等等。该类方法存在的主要问题是对关键帧的定义较为模糊,且没有有效 利用视频中的上下文信息。另外一类方法就是将视频看成是一个视频帧集合,从帧集合的 角度进行分析,利用3D建模、时空连续信息的概率模型方法、设计视频纹理描述等提高识 别率,在这类方法中如何充分利用视频中人脸的时间和空间信息克服视频中人脸分辨率 低、光照、表情、姿态变化剧烈等困难是研宄的重点。因此,需要一种方法解决上述问题。

【发明内容】

[0004] 本发明所要解决的技术问题是为解决视频人脸识别问题中关键帧难以准确定位 以及高信噪比导致的识别率偏低等问题,提出一种基于多示例学习的视频人脸识别方法。 所述方法在提高视频人脸识别准确率和识别性能方面有显著地提高。
[0005] 为了解决上述技术问题,本发明所采用的技术方案是:
[0006] 一种基于多示例学习的视频人脸识别方法,包括如下步骤:
[0007] 步骤A,对从视频中提取的正面人脸视频序列以双眼坐标为基准进行人脸归一化 处理;
[0008] 步骤B,在预处理阶段,对提取出的人脸视频序列中的每个视频帧进行两个尺度、 四个方向的Gabor变换,得到频域幅值图像,利用这些频域幅值图像可以获得增强的频域 幅值特征;
[0009] 步骤C,将上一步骤得到的频域幅值图像集合划分分块,并对每个分块通过LBP算 子获得分块的纹理特征,每个分块的纹理特征通过统计直方图的形式表示,将各分块直方 图级联以得到该人脸视频的全局纹理信息;
[0010] 步骤D,通过上述步骤得到训练视频的特征分布空间,通过EMDD算法得到特征空 间中多样性密度最大点t,对于每一个测试包,计算t与测试包之间的距离。如果测试包与 t之间的距离小于分类阈值,那么就将其作为正包,否则,将其归为反包,实现对测试包的二 分类。
[0011] 步骤E,对于给定的K个分类的训练视频集合,通过上述步骤将得到K (κ-l) /2个子 分类器,通过采用One-Against-One方法可以建立多分类模型,对于任一测试人脸视频,可 以通过步骤A、B、C的操作后获得全局纹理信息,输入到该多分类模型就可以得到测试包的 最终分类结果。
[0012] 所述的分类阈值的确定可以通在候选阈值进行选择,当某一候选阈值可以最大程 度上将训练集合中的包进行正确分类时,将该候选阈值最为最终的分类阈值。
[0013] 有益效果:本发明提出了一种基于多示例学习的视频人脸识别算法,所述算法提 出了一种基于多示例学习的视频人脸识别方法,该方法将人脸视频视为一个包,而将视频 中的人脸图像作为包中的示例,对包中的示例提取加权的LBP特征直方图来以获取示例特 征,通过多示例学习算法训练得到分类器以实现对测试人脸视频的分类预测。本文算法在 得到较高的识别精度的同时,有效解决了人脸视频中关键帧难以选择的问题,并且具有较 强的抗干扰能力,对光照变化、表情等问题也具有较好的鲁棒性。
【附图说明】
[0014] 图1是本发明基于多示例学习的视频人脸识别算法的流程图。
【具体实施方式】
[0015] 下面结合附图,对本发明提出的一种基于直方图的彩色图像分割方法进行详细说 明:
[0016] 如图1所示,本发明的视频人脸识别方法,其步骤如下:
[0017] 下面结合图1详细说明本发明的基于多示例学习的视频人脸识别算法。
[0018] 首先,进行人脸图像的预处理。Gabor小波变换能够提取图像的多尺度、多方向局 部频率信息,可以增强一些关键特征,在提取目标的局部空间频率域信息方面具有良好的 特性。在人脸识别领域中,Gabor变换得到了广泛的应用。
[0019] 二维Gabor小波函数定义为:
【主权项】
1. 一种基于多示例学习的视频人脸识别算法,其特征在于:包括如下步骤: 步骤A,对从视频中提取的正面人脸视频序列以双眼坐标为基准进行人脸归一化处 理; 步骤B,在预处理阶段,对提取出的人脸视频序列中的每个视频帧进行两个尺度、四个 方向的Gabor变换,得到频域幅值图像,利用这些频域幅值图像可以获得增强的频域幅值 特征; 步骤C,将上一步骤得到的频域幅值图像集合划分分块,并对每个分块通过LBP算子获 得分块的纹理特征,每个分块的纹理特征通过统计直方图的形式表示,将各分块直方图级 联以得到该人脸视频的全局纹理信息; 步骤D,通过上述步骤得到训练视频的特征分布空间,通过EMDD算法得到特征空间中 多样性密度最大点t,对于每一个测试包,计算t与测试包之间的距离,如果测试包与t之 间的距离小于分类阈值,那么就将其作为正包,否则,将其归为反包,实现对测试包的二分 类; 步骤E,对于给定的K个分类的训练视频集合,通过上述步骤将得到K(K-I) /2个子分类 器,通过采用One-Against-One方法可以建立多分类模型,对于任一测试人脸视频,可以通 过步骤A、B、C的操作后获得全局纹理信息,输入到该多分类模型就可以得到测试包的最终 分类结果。
2. 根据权利要求1所述的一种基于多示例学习的视频人脸识别算法,其特征在于:步 骤D所述的分类阈值的确定可以通在候选阈值进行选择,当某一候选阈值可以最大程度上 将训练集合中的包进行正确分类时,将该候选阈值做为最终的分类阈值。
【专利摘要】本发明提出一种基于多示例学习的视频人脸识别算法,该算法将每个人脸视频视为一个包,将视频中正规化后的人脸帧图像作为包中的示例,采用基于加权的分块局部二值模式级联直方图作为示例特征,在训练集合的多示例特征空间中,采用多示例学习算法得到分类器,进而实现对测试样本的分类及预测。通过在人脸视频库中的相关实验,该算法得到了比较高的识别精度,同时,该方法对光照变化、表情变化等具有良好的鲁棒性,验证了算法的有效性。
【IPC分类】G06K9-00
【公开号】CN104778457
【申请号】CN201510183977
【发明人】陈海鹏, 申铉京, 王玉, 吕颖达, 王子瑜, 徐浩然
【申请人】吉林大学
【公开日】2015年7月15日
【申请日】2015年4月18日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1