一种基于改进SVM的双胞胎识别方法与流程

文档序号:11177723阅读:488来源:国知局
一种基于改进SVM的双胞胎识别方法与流程

本发明涉及人脸识别技术在血缘关系辨别领域的应用,具体是一种基于改进svm的双胞胎识别方法方法,用于人脸识别技术领域。



背景技术:

模式分析的一个重要的研究领域在于分析2d或3d的面部图像并提取其中的信息,其中通过面部验证血缘关系是模式分析和计算机视觉领域的新问题。通过面部图像验证血缘关系技术可以应用于许多领域,例如历史和系谱研究、数据库的自动管理和标记、法医学以及寻找失踪的家庭成员等。自动验证血缘关系的研究具有极大的潜在价值,但该领域为新领域,目前国内外的研究成果均极少。本文只研究一个特定的主题,即识别双胞胎图像。假设父母年轻时期的面部图像与孩子的面部图像之间的相似度较大,使用扩展传输子空间方法(extendedtransfersubspacelearning,tsl),利用一个中间类(含父母青年时期图像),从目标类(儿童和他们的父母)中获取最优判别子空间。再者通过标志性特征训练集(例如,眼睛、鼻子和嘴)计算两个个体的特征为家族性特征的概率。计算不受控光照条件下获取的正面图像数据集,其整体精度大约为75%,由此可知通过面部图像验证血缘关系是可行的。本文选择了多种不同的面部属性,以单个属性或属性组合作为特征,实现了双胞胎图像的识别。



技术实现要素:

1双胞胎图像识别过程

本文旨在进行双胞胎血缘关系识别,每个研究对象均有两张图像,一张正面或半侧面图像,一张侧面图像,该图像均在不受控光照条件下获取。所用数据集共有三个,正面图像数据集、侧面图像数据集以及全图像数据集。双胞胎图像识别算法的各个步骤如下:

1)将所有数据集中的图像标准化。

2)从每个图像中提取出下文详述的各种类型的特征或属性并形成各种特征向量。对于同一研究对象的所有图像的每个属性,其特征向量是连续获得的。

3)选择图像集中的图像,两个研究对象(即a、b)为一对,建立成对的数据集。该数据集是由相等数量的正样本(双胞胎图像对)和负样本(非双胞胎图像对)组成,负样本的选择是随机的。特征向量v(ab)是一对研究对象a和b的欧几里德距离,在其n维空间中,每个属性对应于a和b的特性向量的相应元素。一对研究对象的特征向量是可交换的,即v(ab)=v(ba)

4)对于数据集中的每个属性以及属性组合(如下文所述),选择适合的核函数及参数构造svm分类器并依据结果选择出最相关的特征变量。

1.1图像标准化

预处理步骤将调整使用的图像,将所有包含显著面部特征的人脸调整为统一大小,选择研究对象图像的参考点,将同一研究对象的正面和侧面图像的同一位置的参考点对应起来,将图像进行几何标准化。

1.2属性提取和面部表示

1.2.1几何属性

属性1坐标该属性定义为acoo。它包含面部标准化坐标的位置(x,y)。用于标准化的两个参考坐标对于所有相同类型的图像有相同的位置。

属性2面部特殊三角形此属性为实验着重研究属性,定义为atri。实验选择重要的面部参考点,将临近的参考点相连接,形成包含重要面部特征部位的三角形,该三角形称为面部特殊三角形。

1.2.2整体属性

属性3pca该属性定义为apca。面部图像分析领域已经广泛使用降维特征脸技术。在将主成分分析(principalcomponentanalysis,pca)应用于一组可用的样本之前,实验先将每个独立的图像裁剪成标准的区域。在尽可能多的丢弃背景像素等干扰信息后进行pca变换,选择表示图像信息最多的几个特征维度,这几个维度应占总信息量的95%以上。再进行pca矩阵反变换,获得降维后的特征。

设m*n的面部图像,经变换后获得列向量为。估计出均值向量为,协方差矩阵为,则投影变换矩阵a取前k个最大特征值的特征向量的降维公式为。

1.2.3纹理描述符

属性4ric-lbp该属性定义为。相邻lbps旋转不变共生性(therotation-invariantco-oc-currenceofadjacentlbps,ric-lbp)是扩展了经典的局部二值模式(localbinarypatterns,lbps)。该算法旨在以改善光照不变性及旋转不变性。在实验的初步测试中,ric-lbp优于其他lbps的扩展。

计算该属性时不断旋转圆形邻域得到一系列的初始lbp值,取其最小值作为该邻域的lbp值,如式。设为沿时钟方向将位数移动次。

属性5sift该属性定义为。尺度不变特征变换(scaleinvariantfeaturetransform,sift)是一种流行的局部图像描述符。事实上,sift已经成为计算机视觉方面的标准,广泛应用于如物体识别、图像配准和基于内容的图像检索等领域。因此,基于sift的描述符已被用于表征独立图像的坐标附近区域。sift作用于单色图像,进行统一不变的缩放和旋转,以及部分不变的仿射畸变和光照变化。最近,提出了不同类型的基于颜色描述符,可以对不同颜色方案应用sift算法,该方法能够有效提高图像的照明不变性和辨别力。该方法的所有颜色描述符被计算评估为单独的sift描述符,其大小是128,并将每个通道的相应颜色模型关联到简单的向量中。

1.3基于svm的分类

本发明使用支持向量机(supportvectormachines,svm)来建立分类器。svm分类器通过一个非线性映射,将样本空间映射到高维的特征空间中,使得在样本空间中非线性可分的问题转化为特征空间中线性可分的问题。由于svm是在高维特征空间中建立线性学习机,所以与线性模型相比,使用svm几乎不增加计算复杂度,避免了“维数灾难”。在本实验中使用以径向基函数为核的svm,径向基核函数为。本发明通过五倍交叉验证技术和参数空间的网格搜索来优化内核参。

2结果与讨论

2.1识别精确度

本实验分别计算了每个属性的分类精确度,并定义了属性组,评估了几何属性组、纹理属性组和全属性组共三个属性组的分类精确度。几何属性组包含坐标属性和面部特殊三角形属性,即。纹理属性组包含ric-lbp属性和sift属性,即。全属性组包含所有的属性,即。表1为属性及属性组识别精确度表。

表1属性及属性组识别精确度表

2.2识别时间

表2属性及属性组识别时间表

实验计算运行时间是衡量一个算法优劣的重要标准。表2为属性及属性组识别时间表,表中数据为计算及分类一对研究对象所用时间。由表中数据可知,面部特殊三角形属性的计算及分类时间与ric-lbp、sift属性相仿;实验识别准确率在80%以上的结果中,识别最短时间可达到12ms,最长时间为27ms。由此可知,该算法的识别时间在可接受范围之内。

附图说明

图1为图像标准化,圆形点为参考点,方形点为对应点。

图2面部特殊三角形属性。面部特殊三角形的边的标准化长度、面部特殊三角形内外角角度、面部特殊三角形顶点的相对位置等数据均为此属性的子数据。由于图像不同,面部特殊三角形的坐标位置也不同,不便于比较面部特殊三角形的绝对坐标。因此,本发明中所用的坐标均为标准化后平均坐标,面部特殊三角形的分割长度等数据可有效地捕捉球形面部形状并直接或间接的描述部分关键面部尺寸(例如嘴和眼睛的距离、嘴的宽度等)。

图3双胞胎图像识别流程图。

具体实施方式

可得出如下结论:

1)可用的信息越多,即,分析的数据越多,可获得越高的分类器精确度。

2)几何属性分析中坐标位置本身不提供有意义的结果。

3)sift作为纹理描述符获得了比几何属性更加精确结果,这显示出sift更适合于捕捉双胞胎特征。相反,在大多数的情况下,ric-lbp表现欠佳。

4)在单属性实验中sift获得最佳的平均结果。

5)分组的属性进行比该组中单一的属性获得的结果更好,对所有数据集将所有可能属性进行组合实验获得了最高的分类精确度。也就是说,有更多的异构的信息,可以获得更好的精度。

双胞胎图像的分类结果表明,不同性质的特征的组合可以有效的实现较高的精确度,实验的最高精确度可达到87.2%。本实验使用的面部特殊三角形属性的测试结果高于面部识别领域常用的pca和ric-lbp属性的测试结果,该属性更加适合血缘关系识别领域。该实验未来可以向辨别其他血缘关系的研究方向发展,例如,父母与子女、父母与孙辈等。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1