一种利用图像信息来识别人眼状态的方法

文档序号:9866147阅读:1936来源:国知局
一种利用图像信息来识别人眼状态的方法
【技术领域】
[0001] 本发明设及一种利用图像信息来识别人眼状态的方法。
【背景技术】
[0002] 人眼的状态识别具有非常广泛的应用场景,比如通过判断人眼状态来识别驾驶员 是否疲劳驾驶,通过人眼状态来进行人机交互等。目前国内外人眼状态识别的方法主要有 Ξ种:基于灰度投影的方法、基于灰度直方图的方法和基于几何参数特征匹配方法。
[0003] 由于人眼的眼球、虹膜、皮肤的灰度各不相同,因此人眼在张开和闭合时眼睛区域 的图像灰度会有比较明显的区别。基于运样的原理,灰度投影的方法首先将人眼图像转换 为灰度图像,然后将图像进行大小归一化和灰度均衡,接着计算图像的灰度水平投影和灰 度垂直投影,将灰度投影作为特征数据进行训练,最终获得基于灰度投影的人眼状态分类 器。由于基于灰度投影的方法利用水平和垂直投影的方式来获取图像中的人眼状态特征, 因此该方法对人眼的定位、角度、光照都有比较强的依赖。在光源不稳定的场景投影曲线的 峰值变化很大,人眼定位不是很精确或人眼倾斜时的投影曲线也会发生不同程度的偏移, 严重影响分类器分类的效果,进而影响人眼状态的识别效果。
[0004] 由于人眼在张开和闭合时,图像中眼睛区域各个灰阶所占的比重不同,基于灰度 直方图的方法通过各个灰阶所占的比重来判断人眼的状态。计算的流程如下:首先将人眼 图像进行灰度转换、归一化和灰度均衡,然后计算图像的灰度直方图,再将灰度直方图中的 256个灰阶合并为64个灰阶,将64个灰阶直方图特征进行训练,最终获得基于灰度直方图的 人眼状态分类器。由于人眼的状态和图像的灰度具有强相关性,因此在光照变化比较大的 情况下直方图会产生很明显的噪音,识别效果也比较差。
[0005] 由于人眼在张开和闭合时的眼险的弧度不同,而且闭合时看不到瞳孔。因此只要 能判断图像中眼睛区域边缘轮廓的曲线弧度,就可W判断人眼的状态。基于几何参数特征 的方法根据曲线拟合的方式获得曲线方程的参数信息,判断曲线的弧度来判断眼睛的状 态。具体流程如下:首先将人眼图像进行灰度转换,再使用化nny算子对图像进行边缘检测, 再对边缘图像进行化U曲变换,结合边缘检测中的角点信息,就可W计算瞳孔的半径和眼险 楠圆的长轴、短轴等参数信息,判断出眼脸的弧度。通过经验方程,通过判断是否有瞳孔和 眼脸的弧度就可W确定人眼张开和闭合的状态,如图1。基于几何参数特征的方法依赖边缘 特征进行人眼状态识别,与前两种方法比较,该方法对光照具有比较强的鲁棒性。但是在人 眼图像倾斜的情况下,曲线拟合算法会出现偏差;另外,眼险曲线拟合的精度严重依赖于左 眼角和右眼角的检测精度,由于左、右眼角检测所使用的角点检测算法本身也存在不少技 术难点,该角点检测算法给系统带来的叠加误差也影响了最终的人眼状态识别率。

【发明内容】

[0006] 本发明的目的在于提供一种用图像信息来识别人眼状态的方法,能在复杂场景中 进行人眼状态识别,提升了人眼状态识别的正确率,能推动人眼状态识别技术的应用发展。
[0007] 本发明一种用图像信息来识别人眼状态的方法,包括人眼状态识别分类器训练和 人眼状态识别分类器分类两个步骤: 步骤1、人眼状态识别分类器训练: 步骤11、获取人眼图像 对采集的人眼样本图像进行人眼检测运算,获取人眼位置信息,分割出人眼图像; 步骤12、人眼图像灰度均衡处理 遍历人眼图像并统计图像的灰度直方图,然后将灰度直方图进行拉伸,使得直方图累 计函数保持线性增长,记录下拉伸前和拉伸后的灰度值对应关系,然后根据灰度值对应关 系对原始人眼图像进行灰度转换; 步骤13、计算灰度图像垂直投影特征 首先对灰度均衡处理后的人眼图像进行大小归一化到32x16的像素大小,然后遍历人 眼图像,分别统计人眼图像每行和每列的平均灰度值组成一个32维的垂直投影特征向量; 步骤14、计算人眼图像统一局部二值模式特征值 计算灰度均衡处理后人眼图像的每个像素点和其邻域其他像素点的差值,如果差值大 于0则赋值为1,如果差值小于0则赋值为0,按照3X3的邻域范围计算,就有8位的二进制结 果,将运8位二进制结果组成一个新的字节,作为表示该像素点的局部二值模式特征值,从 256个局部二值模式特征值中抽取具有旋转不变性的59个特征值作为统一局部二值模式特 征值,每个人眼图像共获得1344个统一局部二值模式特征值的特征向量; 步骤15、人眼状态识别分类器训练 将32维的垂直投影特征向量和1344个统一局部二值模式特征值的特征向量结合,则每 个人眼图像样本获得一个1376维的特征向量,将该特征向量输入支持向量机的人眼状态分 类器中,采用支持向量机进行样本训练获得人眼状态分类模型; 步骤2、人眼状态识别分类器分类: 对采集的图像进行人眼检测运算得到人眼图像,通过步骤11至步骤14,对人眼图像进 行预处理,获取人眼图像的统一局部二值模式特征值的特征向量和垂直投影特征向量,将 运些特征向量输入人眼状态分类器中,并加载人眼状态分类模型后对人眼图像进行分类, 判定人眼状态。
[0008] 所述的支持向量机对人眼状态模型进行训练,使用Sigmoid函数作为核函数,该 Si卵oid核函数定义如下:?输淹(沒d, 其中X表示输入向量,y表示输出标签,g为特征值初始权重,C为噪声偏置。
[0009] 本发明利用图像统一局部二值模式特征来描述人眼图像,将垂直投影特征和局部 二值模式特征结合作为人眼图像状态的描述特征;并使用支持向量机及Sigmoid核函数作 为人眼图像状态的分类器,计算出最终的人眼图像状态,提升了人眼状态识别的正确率。
[0010] 由于本发明采用了统一局部二值模式特征值和垂直投影特征对人眼图像进行描 述,在图像旋转、光照不均的场景进行测试均具有比较好的鲁棒性。使用本发明对不包含在 训练集中的2056个人眼图像样本进行测试,判断人眼状态是张开还是关闭,其中正确识别 1987个,正确识别率为96.6%,高于前述其他方法的识别率。
【附图说明】
[0011] 图1为基于几何参数特征方法中眼险和瞳孔曲线模型的示意图; 图2为本发明人眼状态训练流程图; 图3为本发明人眼状态分类流程图。
[0012] W下结合附图和具体实施例对本发明做进一步详述。
【具体实施方式】
[0013] 本发明一种用图像信息来识别人眼状态的方法,包括人眼状态识别分类器训练和 人眼状态识别分类器分类两个步骤: 步骤1、人眼状态识别分类器训练,如图2所示: 步骤11、获取人眼图像 对采集的样本图像进行人眼检测运算,获取人眼位置信息,分割出人
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1