基于k-l变换和核相关系数的人脸图像中眼睛定位方法

文档序号：6557160阅读：485来源：国知局

专利名称：基于k-l变换和核相关系数的人脸图像中眼睛定位方法
技术领域：
本发明涉及图像处理和模式识别技术，特别是一种能够对人脸图像中眼睛进行定位的基于K-L变换和核相关系数的人脸图像中眼睛定位方法。
背景技术：
眼睛定位技术可以应用到疲劳驾驶检测、医学检查、视频会议和视觉制导等军民两用领域中。且该技术的应用所体现出的经济价值和社会价值越来显著，比如疲劳驾驶检测，可以大大降低恶性交通事故的发生率；视觉制导系统，可以提高武器系统的效能。目前，定位人眼的方法大致可以分为三种基于图像分割技术、基于模式识别技术和基于模板匹配技术的人眼定位方法。基于图像分割的定位方法有Ostu法(最大类间方差法)和最大熵分割法等；基于模式识别技术的方法有人工神经网络定位法、特征眼法和SVM(支持向量机) 定位法等；基于模板匹配技术的方法最常用的是相关系数法。模板匹配法是较为简单有效的一种定位方法，它需要解决两个问题，首先需要确定一个较为可靠的模板，其次要有一种度量匹配程度的方法。利用传统的模板匹配法定位人眼，直接使用人眼图像作为模板(灰度模板)，将相关系数用作匹配程度的度量。这种检测方法会面临两个问题，模板的选择比较困难，一个人的眼睛模板(图像)只能与同一个人的眼睛进行匹配，检测其他人眼睛的效果差，泛化能力较弱，且对光照、噪声等影响因素较为敏感；此外，传统的相关系数是两个向量的线性相关，而图像具有较强的非线性和非高斯性，用线性相关系数度量匹配程度，效果不能令人满意。

发明内容
本发明所要解决的技术问题是针对现有技术中模板匹配在人眼定位中存在的不足，提供一种具有更高的准确性的基于K-L变换和核相关系数的眼睛定位方法。为实现上述目的，本发明提出一种新的相关方法——核相关系数法，来度量匹配程度。核相关系数来自于核方法(Kernel method)的启发，在核方法中(K.-R. Muller, S. Mika, G. Ratsch, K. Tsuda, and B. Scholkopf, "An Introduction to Kernel-Based Learning Algorithms, ” IEEE Transaction on Neural Networks, vol. 12，no. 2，pp. 181-201，2001·)，向量 I、7 通过函数 m被映射到高维特征空间，成为高维特征向量和Φ( ,而在高维特征空间中的内积K= Φ(Χ)· Φ(Γ)可以用核函数f =材= Φ(Ι)·Φ(Γ)来计算，其中最常用的核函数
是高斯核函数#1力=—(-|#-7||2/2<72)，σ为可调参数。传统的相关系数法，计
X-YX-Y
算向量^^/的线性相关系数的公式为户^^！^^广^^^^^ ,将ρ、7通过映射函数Φ 映射到高维特征空间后，在高维特征空间中的向量和φ(7)的相关系数为
权利要求
1.一种基于K-L变换和核相关系数的人脸图像中眼睛定位方法，其特征在于首先构建眼睛模板库，生成训练矩阵；对训练矩阵进行K-L变换，获取基向量和特征值，并选取主要基向量，将每个眼睛训练样本投影到主要基向量上，获得眼睛样本的投影系数向量；以投影系数向量作为模板，以核相关系数作为匹配程度的度量，在人脸图像中进行左眼和右眼的模板匹配；最后，最大核相关系数的位置，确定为眼睛位置。
2.根据权利要求1所述的人脸图像中眼睛定位的方法，其特征在于，构建眼睛模板库的具体步骤如下(1)建立人脸图像库；创建人脸样本库，对不同的人，在不同光照条件、不同表情条件下获取《幅人脸图像，作为提取人眼的样本图像，并统一取人脸图像的分辨率为 HxW (2)建立眼睛模板库；从人脸样本图像中，截取眼睛图像，为了便于更多的保留眼睛的特征，截取的眼睛图像中应包括眉毛、上眼睑、下眼睑和眼角，按左、右眼归类，并统一为相同的分辨率Axw ,构建含有/7个左眼图像和/7个右眼图像的眼睛模板库。
3.根据权利要求1所述的人脸图像中眼睛定位的方法，其特征在于，生成训练矩阵的具体步骤如下(1)生成眼睛模板向量；将截取的眼睛模板图像，按列与列首尾相接，分别构成《个左眼和/7个右眼Axw维训练模板向量，设第左个左、右眼训练模板向量分别为咬和G , k = ；(2)构建训练矩阵；将左、右眼训练模板的向量作为行，分别构造左、右眼训练矩阵Ai1 和iT。
4.根据权利要求1所述的人脸图像中眼睛定位的方法，其特征在于，对训练矩阵进行 K-L变换，获取基向量和特征值，其具体步骤是对生成的左眼、右眼训练矩阵，分别进行 K-L变换，得到左、右眼训练矩阵的基向量和特征值，并将基向量按相应的特征值从大到小排列。
5.根据权利要求4所述的人脸图像中眼睛定位的方法，其特征在于，选取主要基向量的具体步骤是将排列好的基向量，选择前、《『个基向量分别作为左眼和右眼的主要基向量，其对应的特征值之和大于所有特征值之和的98%。
6.根据权利要求5所述的人脸图像中眼睛定位的方法，其特征在于，获得眼睛样本的投影系数向量的具体步骤是将《个左眼、个右眼训练模板向量分别投影到左、右眼的W、乂个主要基向量上，得到每个眼睛的投影系数向量勻和Cl,边和q分别为W维和？^维向量。
7.根据权利要求1或6所述的人脸图像中眼睛定位的方法，其特征在于，以投影系数向量作为模板的具体方法是分别以左眼和右眼的投影系数向量“和Cl为模板向量，作为模板匹配的模板。
8.根据权利要求1所述的人脸图像中眼睛定位的方法，其特征在于，以核相关系数作为匹配程度的度量的具体方法为计算向量的核相关系数公式为
9.根据权利要求1所述的人脸图像中眼睛定位的方法，其特征在于，在人脸图像中进行左眼和右眼的模板匹配，具体步骤为(1)获取人脸正面图像，将图像以中轴线为界，分为左脸图像和右脸图像两部分，左脸图像包含左眼，右脸图像包含右眼；(2)以高为力、宽为『的滑动窗口，在右脸图像每一个像素位置上剪切子图像A(U), (U)为像素坐标，子图像的分辨率为力X『；(3)将子图像转换为AXr维向量，并将其投影到右眼的W个主要基向量，得到 i维投影系数向量C；(4)由核相关系数得到子图像iM.y)与右眼模板的匹配程度，求向量σ 和 cr 的核相关系数为:
10.为减小计算量，在确定右眼中心位置后，利用左、右眼的对称性缩小搜索范围，只在左脸图像的右眼对称位置的邻域内搜索目标，该邻域为以P— W和
全文摘要
本发明涉及一种人脸图像中眼睛定位的方法，它包括以下步骤首先构建眼睛模板库，生成训练矩阵；对训练矩阵进行K-L变换，获取基向量和特征值，并选取主要基向量，将每个眼睛训练样本投影到主要基向量上，得到投影系数向量；以投影系数向量作为模板，以核相关系数进行匹配程度的度量，在人脸图像中进行左眼和右眼的模板匹配；最后，最大核相关系数的位置，确定为眼睛位置。本发明通过K-L变换，将眼睛训练样本在基向量上的投影系数作为匹配模板，具有更好的泛化能力。本发明通过核相关系数来度量被测对象和模板的匹配程度，其匹配的精度更高，且目标的显著度更高。
文档编号G06K9/62GK102194110SQ201110155309
公开日2011年9月21日申请日期2011年6月10日优先权日2011年6月10日
发明者刘强, 刘瑞明申请人:淮海工学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘瑞明;刘强
技术所有人：淮海工学院
我是此专利的发明人

上一篇：结合哈希值的文件加密方法
上一篇：基于非局部约束的全变分图像去模糊方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。