计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法

文档序号:6521202阅读:437来源:国知局
计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法
【专利摘要】本发明公开了一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,包括以下步骤:(1)采集人眼训练图像,对人眼训练图像进行主成分分析,获得特征眼子空间和系数子空间;(2)将视频中每幅待测人眼图像投影到特征眼子空间和系数子空间中得到另一组新系数向量;取出所有新系数向量的第一个值作为系数值;以视频中的帧数为x轴,相应帧人眼图像对应的系数值为Y轴构建一条帧数-系数值的原始数据曲线;(3)获得一条与原始数据曲线相对应的基准曲线以及差值曲线;(4)将差值曲线上的差值与预设的系数阈值作比较;判断视频中人眼状态。该方法具有很强的自适应性,能够有效克服不同人眼睛的差别带来的影响。
【专利说明】计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法
【技术领域】
[0001]本发明属于智能交通【技术领域】,具体涉及一种计算机基于层叠式主成分分析法智能识别视频中眼睛状态的方法。
【背景技术】
[0002]眼睛是人体面部最重要的特征,在数字图像处理和计算机视觉研究与应用中有着极为重要的作用,眼睛睁闭状态的检测是虹膜识别、视线跟踪和驾驶员疲劳检测等系统的关键环节,检测的准确率直接影响到系统的性能。然而,在实际应用过程中,不均匀光照、光斑、睫毛和眼镜框等诸多因素的影响,使眼睛睁闭状态识别成为了一个极具挑战性的任务。
[0003]目前的眼睛睁闭状态检测方法主要有以下两大类:基于眼球/瞳孔检测的方法和基于眼部结构特征的方法。前者主要通过检测眼部图像是否含有眼球/瞳孔来判断眼睛的状态;后者主要根据眼部整体结构特征的变化,如上下眼睑的变化来判断眼睛的状态。基于眼球/瞳孔检测的方法主要有灰度积分投影法和Hough变换检测瞳孔等算法:灰度积分投影法由于只用到图像的灰度信息,计算量少,速度快,但当出现睫毛、镜框和光斑等因素干扰时,该算法将变得不再适用;Hough变换算法需要进行边缘提取,而边缘的提取往往难度较大,易受到睫毛和不均匀光斑等的干扰,且拟合速度较慢,很难达到实时要求。基于眼部结构特征的算法主要有可变性模板法和神经网络法:可变性模板或将主动形状模型(ASM,Active Shape Model)用于检测上下眼睑的方法较为耗时,且检测效果受模板参数的影响;神经网络法的泛化能力较差,而样本的选取往往很难覆盖实际应用中的各种情况。而基于多种策略组合的研究状态检测方法,需要过多的人为参与,检测效果因人而异,且此方法流程流于繁琐,检测速度很难达到实时要求。本发明因此而来。

【发明内容】

[0004]本发明提供的一种计算机基于层叠式主成分分析法智能识别视频中眼睛状态的方法,解决了现有技术中计算机进行眼睛睁闭状态的识别时普遍存在方法实时性差、易受多种因素的影响、鲁棒性差的问题。
[0005]为了解决现有技术中的这些问题,本发明提供的技术方案是:
[0006]一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,其特征在于所述方法包括以下步骤:
[0007](I)采集人眼训练图像,对人眼训练图像进行第一层主成分分析,获得特征眼子空间;将每幅人眼训练图像投影到特征眼子空间中,分别得到一组系数向量,组合得到一个系数矩阵;对系数矩阵进行第二层主成分分析,得到系数子空间;
[0008](2)将视频中每幅待测人眼图像投影到步骤(I)得到的特征眼子空间上,分别得到一组系数向量;将系数向量分别投影到步骤(I)获得的系数子空间中得到另一组新系数向量;取出所有新系数向量的第一个值作为系数值;以视频中的帧数为X轴,相应帧人眼图像对应的系数值为Y轴构建一条帧数-系数值的原始数据曲线;
[0009](3)进行均值滤波处理获得一条与原始数据曲线相对应的基准曲线;将原始数据曲线和基准曲线上的对应值相减并取绝对值,就得到一条差值曲线;
[0010](4)将差值曲线上的差值与预设的系数阈值作比较;若差值小于系数阈值,则判定为视频中人眼状态为睁眼状态;若差值大于系数阈值,则判定视频中人眼状态为闭眼状态。
[0011]优选的,所述方法步骤(3)中均值滤波处理是以某一帧人眼图像为中心获取前后若干帧人眼图像对应的系数值,然后求取它们的平均值作为该帧原始系数值的基准值;以视频中的帧数为X轴,相应帧原始系数值的基准值为Y轴构建一条帧数-基准值的基准曲线。
[0012]优选的,所述方法中每一帧的待测人眼图像和人眼训练图像均经归一化处理成大小相同,且人眼区域均为右眼区域或左眼区域的图像。
[0013]优选的,所述方法步骤(1)中假设人眼训练图像共有K幅,归一化处理后大小均为nXm的图像,将每幅图像按列优先构成一个nXm的列向量,即:
[0014]X= (bnV..bnlb12V..V..blnb2n...bJ ;
[0015]以每幅图像的列向量为一列,构成一个维数为(nXm) XK的矩阵X,即:X- (Xi,X2,...,x^),i — 1,2,...,K。
[0016]优选的,所述方法步骤(1)中对人眼训练图像进行第一层主成分分析,获得特征眼子空间的步骤包括:
[0017]I)定义平均人眼为
【权利要求】
1.一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,其特征在于所述方法包括以下步骤: (1)采集人眼训练图像,对人眼训练图像进行第一层主成分分析,获得特征眼子空间;将每幅人眼训练图像投影到特征眼子空间中,分别得到一组系数向量,组合得到一个系数矩阵;对系数矩阵进行第二层主成分分析,得到系数子空间; (2)将视频中每幅待测人眼图像投影到步骤(1)得到的特征眼子空间上,分别得到一组系数向量;将系数向量分别投影到步骤(1)获得的系数子空间中得到另一组新系数向量;取出所有新系数向量的第一个值作为系数值;以视频中的帧数为X轴,相应帧人眼图像对应的系数值为Y轴构建一条帧数-系数值的原始数据曲线; (3)对原始数据曲线进行均值滤波处理获得一条与原始数据曲线相对应的基准曲线;将原始数据曲线和基准曲线上的对应值相减并取绝对值,就得到一条差值曲线; (4)将差值曲线上的差值与预设的系数阈值作比较;若差值小于系数阈值,则判定为视频中人眼状态为睁眼状态;若差值大于系数阈值,则判定视频中人眼状态为闭眼状态。
2.根据权利要求1所述的方法,其特征在于所述方法步骤(3)中均值滤波处理是以某一帧人眼图像为中心获取前后若干帧人眼图像对应的系数值,然后求取它们的平均值作为该帧原始系数值的基准值;以视频中的帧数为X轴,相应帧原始系数值的基准值为Y轴构建一条帧数-基准值的基准曲线。
3.根据权利要求1所述的方法,其特征在于所述方法中每一帧的待测人眼图像和人眼训练图像均经归一化处理成大小相同,且人眼区域均为右眼区域或左眼区域的图像。
4.根据权利要求1所述的方法,其特征在于所述方法步骤(1)中假设人眼训练图像共有K幅,归一化处理后大小均为nXm的图像,将每幅图像按列优先构成一个nXm的列向量,即: X= (bnbybmbubyb^…blnb2n...bj ; 以每幅图像的列向量为一列,构成一个维数为(nXm) XK的矩阵X,即:X =(x” X2, ? ? ?,x^),i 1,2,...,K。
5.根据权利要求4所述的方法,其特征在于所述方法步骤(1)中对人眼训练图像进行第一层主成分分析,获得特征眼子空间的步骤包括:. 1)定义平均人眼为:
6.根据权利要求5所述的方法,其特征在于所述方法步骤(1)或(2)中将每幅人眼图像投影到特征眼子空间中,分别得到一组系数向量的步骤为将人眼图像X投影到特征眼子空间中,得到其对应的投影系数向量y为:y = Ut(x-ux),不同的图像得到不同的系数向量
7. 根据权利要求6所述的方法,其特征在于所述方法中当每一幅人眼训练图像X投影到特征眼子空间中,分别得到一组系数向量y,将其组合在一起就得到一个系数矩阵Y ;对系数矩阵Y再次进行主成分分析,得到一个新的特征子空间,即系数子空间P。
【文档编号】G06K9/62GK103745192SQ201310624554
【公开日】2014年4月23日 申请日期:2013年11月27日 优先权日:2013年11月27日
【发明者】张伟, 成波 申请人:苏州清研微视电子科技有限公司, 清华大学苏州汽车研究院(吴江)
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1