一种基于结构先验知识的鲁棒生物特征识别方法

文档序号:6511487阅读:383来源:国知局
一种基于结构先验知识的鲁棒生物特征识别方法
【专利摘要】本发明公开了一种基于结构先验知识的鲁棒生物特征识别方法,该方法包括:收集图像数据形成训练样本集和测试样本集;提取所述训练样本集中每个训练样本的特征向量,并将提取得到的特征向量组成字典矩阵X;基于所述字典矩阵X,通过优化算法计算得到与所述测试样本集中的每一测试样本对应的重构系数向量;基于所述字典矩阵X,使用与所述测试样本集中的每一测试样本对应的重构系数向量进行样本重构,得到与每一测试样本对应的分属于不同类别的重构测试样本,与相应测试样本最为接近的重构训练样本的类别即为所述测试样本的类别。本发明可以用在人脸识别等生物特征识别领域,能够有效处理存在遮挡噪声情况下的识别分类问题。
【专利说明】—种基于结构先验知识的鲁棒生物特征识别方法
【技术领域】
[0001]本发明涉及模式识别与机器学习领域,特别涉及一种基于结构先验知识的生物特征识别方法,该方法使用稀疏表示、半二次最小化等算法进行生物特征识别。
【背景技术】
[0002]近些年,线性表示模型在计算机视觉领域得到了广泛的应用,比如人脸识别等生物特征识别。比如说,对于人脸识别问题,同一个人的多张不同人脸图像一般分布在同一个子空间之中,所以这个人的ー张图像可以近似用他的其他张图像来线性表示。基于这种认知,人们提出了一系列线性最小ニ乘方法,例如最近邻特征线,最近邻特征平面以及最近邻特征空间等具体算法。而从稀疏性角度分,线性表示模型又大致分为两类,即为稀疏线性表示模型与非稀疏线性表示模型,前者采用LI范数来约束线性表示系数,后者则采用L2范数进行约束。稀疏性主要是考虑当用所有的训练样本去重构待测试样本时,在训练样本数量充分冗余,类别分布覆盖面充分广的条件下,只有跟测试样本同类别的训练样本重构能力最強。如果令线性表示系数是稀疏的,则必然有重构能力最強的训练样本所对应的线性表示系数非零,而其余參加重构的训练样本对应的系数为零。
[0003]对于人脸识别等生物特征识别问题,如何处理有遮挡(墨镜、围巾等)情况下的识别与分类困扰着该领域的研究人员,同时也决定了ー个实际生物特征识别系统的稳定性与实用性。然而,上述中的大多数模型都不能很好的解决遮挡噪声对识别分类结果的干扰,也没有考虑遮挡这ー常见噪声的结构特性。为此,本模型中引入遮挡噪声的空间连续性先验,即使得被恢复出的遮挡噪声相邻像素的ー阶差分值尽可能小,进而使得模型对像遮挡这样的连续性噪声更加鲁棒。

【发明内容】

[0004]为了解决现有技术存在的空缺,本发明的目的是提供一种基于结构先验知识的生物特征识别方法,本发明根据实际中遮挡等噪声一般具有空间连续性这一先验知识,对线性表示中的噪声项施加连续性约束,即令遮挡噪声项的相邻像素值的ー阶差分值尽可能小。同时本发明还使用鲁棒M估计子(Robust M-Estimator)来约束重构系数、遮挡噪声项以及重构误差,从而解决了 LI约束使得优化目标函数在原点处不可微,L2约束使得模型对遮挡等大噪声十分敏感,过分拟合噪声误差等问题。
[0005]本发明提出的一种基于结构先验知识的生物特征识别方法包括以下步骤:
[0006]步骤SI,收集图像数据形成训练样本集和测试样本集;
[0007]步骤S2,提取所述训练样本集中每个训练样本的特征向量,并将提取得到的特征向量组成字典矩阵X ;
[0008]步骤S3,基于所述字典矩阵X,通过优化算法计算得到与所述测试样本集中的每一测试样本对应的重构系数向量;
[0009]步骤S4,基于所述字典矩阵X,使用与所述测试样本集中的每ー测试样本对应的重构系数向量进行样本重构,得到与每ー测试样本对应的分属于不同类别的重构测试样本,与相应测试样本最为接近的重构训练样本的类别即为所述测试样本的类别。
[0010]由于本发明中引入了遮挡噪声的空间连续性先验知识,从而使本发明对生物特征识别的过程中的遮挡类噪声更加鲁棒,进而提高了生物特征识别分类的准确率。
【专利附图】

【附图说明】
[0011]图1是本发明提出的基于结构先验知识的生物特征识别方法流程图。
【具体实施方式】
[0012]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并參照附图,对本发明进ー步详细说明。
[0013]本发明通过引入遮挡噪声的空间连续性这ー结构先验知识,有效的处理在有遮挡噪声情况下的生物特征识别问题,使得生物特征识别更加的稳定与实用。
[0014]图1是本发明提出的基于结构先验知识的生物特征识别方法流程图,本发明的识别方法适用于对于任何生物特征的识别,下文以人脸识别为例对本发明方法进行介绍,如图1所示,所述生物特征识别方法包括以下步骤:
[0015]步骤S1,收集图像数据形成训练样本集和测试样本集;
[0016]其中,每个样本集中包含有多个类别的图像,且每个类别包含有多张图像(例如同一人脸的不同图像)。
[0017]对于训练样本集,其中的图像均为无遮挡噪声的正常图像;对于测试样本集,其中的图像为有遮挡噪声(墨镜、围巾等)的图像。
[0018]步骤S2,提取所述训练样本集中每个训练样本的特征向量,并将提取得到的特征向量组成字典矩阵X ;
[0019]该步骤中提取所述特征向量的步骤进一歩包括:
[0020]步骤S21,将某ー训练样本的各列像素值顺序连接拉直成为ー个新的列向量;
[0021]步骤S22,将得到的列向量进行归一化(比如归ー化到[0,1]之间)后得到的向量作为该训练样本的特征向量。
[0022]之后,将训练样本集中所有训练样本的特征向量按照类别依次排列就组成了所述字典矩阵X。
[0023]步骤S3,基于所述字典矩阵X,通过优化算法计算得到与所述测试样本集中的每一测试样本对应的重构系数向量;
[0024]所述步骤S3进ー步包括以下步骤:
[0025]步骤S31,将待识别的测试样本集中的某一测试样本表示成为重构项、噪声项以及重构误差项z之和:
[0026]y = Xβ +e+z,
[0027]其中,y表示某一测试样本;P为与该测试样本对应的重构系数向量;X@为与该测试样本对应的重构项,所述重构项也可以理解为是所述训练样本集中所有训练样本的特征向量的线性加权和,加权系数即为重构系数;e为噪声向量;z为重构误差向量。
[0028]步骤S32,在上述约束条件下,通过最小化目标函数,使重构系数向量0和噪声向量e稀疏化,重构误差向量z最小化,同时使噪声向量e的邻接像素ー阶差分最小化,进而求得重构系数向量3。
[0029]所述重构误差向量z属于高斯噪声,其与噪声向量e相比较小,实际中可以忽略不计。
[0030]在本发明ー实施例中,所述目标函数表示为:
【权利要求】
1.一种基于结构先验知识的鲁棒生物特征识别方法,其特征在于,所述方法包括以下步骤: 步骤SI,收集图像数据形成训练样本集和测试样本集; 步骤S2,提取所述训练样本集中每个训练样本的特征向量,并将提取得到的特征向量组成字典矩阵X ; 步骤S3,基于所述字典矩阵X,通过优化算法计算得到与所述测试样本集中的每ー测试样本对应的重构系数向量; 步骤S4,基于所述字典矩阵X,使用与所述测试样本集中的每ー测试样本对应的重构系数向量进行样本重构,得到与每ー测试样本对应的分属于不同类别的重构测试样本,与相应测试样本最为接近的重构训练样本的类别即为所述测试样本的类别。
2.根据权利要求1所述的方法,其特征在干,每个样本集中包含有多个类别的图像,每个类别包含有多张图像。
3.根据权利要求1所述的方法,其特征在于,所述训练样本集中的图像为无遮挡噪声的图像;所述测试样本集中的图像为有遮挡噪声的图像。
4.根据权利要求1所述的方法,其特征在于,所述步骤S2中提取所述特征向量的步骤进ー步包括: 步骤S21,将某ー训练样本的各列像素值顺序连接成为ー个新的列向量; 步骤S22,将得到的列向量进行归一化后得到的向量作为该训练样本的特征向量。
5.根据权利要求1所述的方法,其特征在于,所述字典矩阵X由所述训练样本集中所有训练样本的特征向量按照类别依次排列組成。
6.根据权利要求1所述的方法,其特征在于,所述步骤S3进ー步包括以下步骤: 步骤S31,将待识别的测试样本集中的某一测试样本表示成为重构项、噪声项以及重构误差项z之和:
7.根据权利要求6所述的方法,其特征在于,所述目标函数表示为:
8.根据权利要求7所述的方法,其特征在于,所述变换矩阵的主对角线元素为1,主对角线上方的第一个对角线元素均为-1,其余元素为O。
9.根据权利要求7所述的方法,其特征在干,采用乘性半二次最小化算法来优化所述目标函数。
10.根据权利要求1所述的方法,其特征在于,所述步骤S4中,分别计算不同类别的重构测试样本与相应的测试样本之间的残差,使得残差最小的那个重构训练样本的类别即为所述测试样本的类 别。
【文档编号】G06K9/62GK103440504SQ201310418307
【公开日】2013年12月11日 申请日期:2013年9月13日 优先权日:2013年9月13日
【发明者】谭铁牛, 王亮, 赫然, 王东 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1