用于监控车辆驾驶员的状况的方法和系统与流程

文档序号:17439573发布日期:2019-04-17 04:34阅读:497来源:国知局
用于监控车辆驾驶员的状况的方法和系统与流程

不适用。

本申请涉及使用3d传感器识别驾驶员状态和驾驶员头部姿势。



背景技术:

根据nhtsa,美国所有致命撞车事故中有10%是由于驾驶员注意力分散造成的,其中,2014年有3179人死亡,估计有431,000人受伤(根据nhtsa的国家统计与分析中心,发表在技术报告《交通安全事实:注意力分散驾驶2014年》中)。因此,监控驾驶员的注意力分散水平将成为下一代车辆的关键成功因素。头部姿势、面部表情和眼睑运动都有助于对驾驶员注意力分散水平的全面评估。

2015年3月的欧洲新车规划2020年路线图技术报告包括了虚拟副驾驶概念的推广和驾驶员状态监控领域内的创新的时间表。如果汽车制造商提供这样的安全技术,不仅作为附加功能,而且作为标准,他们将获得奖励。

对于自动驾驶汽车,驾驶员必须在危急或复杂的情形下接管控制权。然而,接管决定也取决于驾驶员的状态,因此自动驾驶汽车必须依赖于驾驶员状况监控。

减少车辆碰撞中的致命伤害的社会义务已经促使汽车制造商及其供应商建立传感器系统,其不仅可以观察车辆外部世界,还可以监控车辆内部,特别是机械设备的驾驶员的状态。

基于视觉传感器的用于驾驶员状态监控的通用系统要求将传感器安装于特定位置(例如,美国公开申请20100002075a1中的安装在方向盘上),对这种系统的设计过程实施严格的限制。

用于驾驶员状态监控的替代系统基于非常不同的特征和输入源,诸如驾驶员的转向行为,如美国专利5,815,070(机动车的驾驶状态监控装置)中所公开的;或者驾驶员响应询问信号的能力,如美国专利6,154,123(驾驶员警觉性监控系统)中那样的。美国专利6,049,747(驾驶员监控设备)中公开的系统专注于通过在驾驶员面部上投射亮点图案来获得3d数据的特定方式。诸如美国专利7,138,922中的另一系统,则假设存在针对昏昏欲睡的驾驶员的检测器,并关注如何通过涉及操作人员来与昏昏欲睡的驾驶员通信。

驾驶员状态监控通常与面部检测相关。在许多科学出版物中描述了检测二维图像中面部的方法,其中最常引用的是paulviola和michaelj.jones开发的标准方法(鲁棒性实时面部检测,《国际计算机视觉杂志》,57(2):137–154,2004)。例如,steinberg等人的wo专利申请pct/ep2007/006540和corcoran等人的美国专利申请第14/563,972号中公开了另一方法。

用于面部检测和头部跟踪的大多数方法依赖于面部特征或标志。一般工作流程是维护内部对象模型,包括标志定位。对于每一幅新图像,内部模型的标志与传感器的当前视图相匹配,以获得对象和传感器之间的相对定位。当标志变得不可见时(例如,当用户避开传感器时)或临时遮挡时(例如,当用户搔他或她的鼻子时),这种方法可能会失败。在某些情况下,根本无法检测到这样的标志,例如,对于某些类型的眼镜、头发和胡须样式。此外,照明的变化、来自眼镜、太阳镜和隐形眼镜的光反射可能会阻碍对有效标志的检测。

一般来说,基于标志的方法依赖于面向前方(frontfacing)的传感器,即传感器的安装方式使得操作者的面部直接以默认定位朝向传感器。然而,在监控车辆驾驶员行为的最突出的应用中,传感器定位很可能安装在非面向(non-facing)的位置,诸如a型梁、后视镜位置或中央控制台。

在wo专利申请pct/au2008/000,290中,tell公开了一种基于标志的方法的典型工作流程,其中三维对象被渲染,从三维对象模型中提取显著的点特征或标志,在图像中定位对应的特征,并且从对象模型的标志和视图之间的对应关系推导出新的对象取向。然而,该方法专注于被定义为处于预定数量的位置并具有最高边缘的点特征。对一些预定位置的遮挡可能会阻碍图像序列的应用,并且图像序列的分辨率对于实现所需的性能水平至关重要。

头部姿势估计通常被解释为推断头部相对于相机视图的取向的能力。在开发价格合理的3d传感器之前,早期的头部跟踪技术仅限于使用灰度或彩色图像序列。erikmurphy-chutorian和mohanmanubhaitrivedi(计算机视觉中的头部姿势估计:调查:ieee模式分析和机器智能的交易,31(4):607–626,2009)的出版物对这些方法进行了很好的概述。

在美国专利申请11/420,864中,victor等人公开了一种用于睡意检测的方法,该方法基于睡意导致肌肉松弛这样的假设,进而使得可以通过头部姿势检测来识别的特定头部运动。

在wo专利申请pct/au2009/001,547中,langdale-smith等人已经公开了测量注意力水平的指标;并且该指标可以包括面部和眼睛的取向、观看特定感兴趣区域的持续时间、面对感兴趣区域的持续时间、面部反应、以及面部表情的相对变化。然而,该发明没有公开检索和量化所需特征(例如,面部表情)的技术上可行的方法。

在wo专利申请pct/au2010/000,142中,langdale-smith等人公开了一种用于监控机械设备操作者对车辆运动的注意力的方法。他们只考虑了操作者头部的三维定位,而没有考虑面部表情。

利用面部的操作的大多数方法都需要传感器,该传感器被假定为观察裸露的面部。然而,一般来说,驾驶员或机器操作者可以戴眼镜、头盔或其他部分遮挡面部标志的防护装备。因此,即使是通过使用局部图像算子来增强分类前面部特征的方法(诸如loy等人在美国专利申请10/951,081中公开的)也很可能会失败。另外,这种方法需要预先知道标志的视觉外观。机器操作者的防护装备很可能会提供用于视觉跟踪的良好特征,但是外观不会被事先知道,并且不同的操作员之间可能会有很大的差异。

除了仅检测面部,一些方法还进一步处理面部,例如,从头部或眼睛定位导出注视方向(美国专利申请10/350,835和美国专利7,043,056)或从眼睛和嘴唇导出面部表情(美国专利申请14/680,977)。已经提出了一些专门专注于眼睛跟踪和睡意检测的驾驶员监控系统。在美国专利申请14/484,875中,seok等人公开了一种用于控制车辆中的平视显示器的组合注视跟踪和手指检测方法。

诸如美国专利5,229,754中的其他方法根据头部姿势调整诸如平视显示器的显示器。

眼睛跟踪的一个常见替代方法是监控驾驶员的头部姿势,作为驾驶员所观看的位置的近似。这种方法已经在美国专利5,691,693、wo专利申请pct/us2001/047,612、美国专利申请11/317,431和美国专利申请11/796,807中提出,但不够准确。

shahramizadi等人在美国专利9,251,590、美国专利申请13/017,474和美国专利申请13/017,587中提出了使用低成本消费深度传感器重建刚性对象的第一方法中的一种方法,称为kinectfusion(kinectfusion:使用移动深度相机进行实时三维重建和交互,《第24届年度用户界面软件和技术acm研讨会记录》,第559-568页,2011年)。来自微软kinectrgbd传感器的数据被用于重建曲面,并估计当前相机相对于该曲面的定位。首先,这些方法通过使用基于icp(iterativeclosestpoint,迭代最近点)的方法将当前图像与(通过整合一系列先前图像获得的)整合图像对齐,来迭代地跟踪相机定位。然后,对体积进行整合,并通过光线投射来估计重建曲面的视图。这里,与模型的偏差被视为噪声,而在我们的方法中,它们被视为可用于区分对象状态的信息。

一些扩展允许估计对象曲面,即使对象在被扫描时变形(richarda.newcombe,dieterfox,andstevenm.seitz,动态融合:实时重建和跟踪非刚性场景;和mingsongdou,jonathantaylor,henryfuchs,andrewfitzgibbon,shahramizadi,用单个rgbd传感器3d扫描可变形对象;两者都发表在2015年ieee计算机视觉和模式识别会议上)。因此,在扫描过程期间,变形函数不断更新。然而,这里的目标是补偿变形,而不是提取被进一步处理的额外有用信息。

本申请描述了用于识别驾驶员状态和驾驶员头部姿势的系统和方法的改进。



技术实现要素:

如本文所述,一种系统和方法利用深度数据来识别驾驶员的状态和驾驶员的头部姿势。

在本发明的一个方面,提供了一种用于实时进行驾驶员状态监控的方法。该方法包括操作图像处理系统以从深度传感器接收深度图像的序列。每个深度图像包括表示场景的图像的图像数据。图像数据包括指示距深度传感器的距离的深度值。图像处理系统使用图像的序列识别场景中的人的头部。图像处理系统使用深度图像来跟踪人的头部相对于主要定位和取向的定位和取向,其中人的头部被建模为3d曲面以定义头部模型,并随时间被连续调整以获得平均中性面部模型。图像处理系统识别与中性面部的深度偏差,并将这种深度偏差分类为不同的驾驶员状态。

特征在于,包括灰度或彩色图像的补充图像是从深度传感器或已经按像素配准到深度图像的附加传感器获得的。

另一特征在于,根据汽车内部的cad模型,除了头部像素之外的所有像素都被排除在外。

又另一特征在于,通过应用随机决策森林,或者通过肤色,或者通过面部检测方法来识别人的头部。

再另一特征在于头部模型是通过迭代最近点匹配获得的。

还有进一步特征在于,中性面部被存储在包括变化的历史的数据库中。深度变化可以与数据库中已经存储的对于特定驾驶员的变化的历史进行比较,该比较用于提取驾驶员状态检测的特征。

根据另一方面,公开了一种用于实时进行驾驶员状态监控的系统。该系统包括深度传感器,用于捕获场景的深度图像并生成表示场景的图像的图像数据。图像数据包括指示距传感器的距离的深度值。图像处理系统可操作地耦合到传感器,以从传感器接收深度图像的序列。图像处理系统被编程为使用图像的序列来识别场景中的人的头部,使用深度图像来跟踪人的头部相对于主要定位和取向的定位和取向,其中人的头部被建模为3d曲面以定义头部模型,并且随时间被连续调整以获得平均中性面部模型,识别与中性面部的深度偏差,并且将这样的深度偏差分类为不同的驾驶员状态。

进一步的特征和优点将从说明书和附图中显而易见。

附图说明

图1a是示出如本文所述的用于监控车辆驾驶员的状况的系统的块图;

图1b是车辆中的传感器相对于驾驶员的定位的定位示意图;

图2是在图1a的处理单元中实施的用于识别驾驶员状态和头部姿势的程序的流程图;

图3a、图3b、图3c、图3d和图3e示出了驾驶员注意力分散和遮挡情景的示例;

图4a、图4b、图4c、图4d和图4e示出了使用图2的流程图获得的用于获得中性面部模型的图像数据;

图5a、图5b、图5c、图5d、图5e和图5f示出了图2的流程图的不同步骤处的图像数据;和

图6示出了各种面部表情、遮挡和注意力分散因素。

具体实施方式

所公开的方法和系统涉及识别车辆驾驶员的状态,包括允许估计注意力分散和疲劳水平的特征。

尽管本发明涉及车辆驾驶员的状态,但是对于本领域技术人员来说显而易见的是,同样的方法可以用于监控任何移动或静止机械设备的操作者的状态,其中疲劳、注意力分散、疏忽或压力可能导致系统严重故障或造成任何类型的伤害。这种机械设备包括但不限于飞机、船只、建筑机械、起重机和生产设施。

在又一实施例中,本发明可以支持监察任务,诸如监视患者。

由诸如注意力、疲劳、注意力分散和唤醒的水平等术语定义的驾驶员的抽象状态可以从诸如头部姿势、眼睑运动、面部表情及其时间和空间演变等物理表现中推导出。然而,每个单一方面都可能不足以有效分类驾驶员的状态以潜在地忽略动作并让自动驾驶系统接管控制权。因此,本发明意图提供一种驾驶员监控的整体方法,其中多个特征可以由单一系统提供。

在说明性实施例中,如图1a所示,图像处理系统20被用于识别驾驶员的状态和头部姿势。系统20包括处理单元22和连接到处理单元22的传感器24。传感器24包括三维(3d)传感器。传感器24可以以任何期望的取向或定位安装在车辆中,诸如图1b所示。传感器24可以更灵活地安装,因为头部跟踪不依赖于特定的面部特征。传感器24可以是现成的传感器或专用传感器。此外,处理单元22可以被连接到多个传感器,诸如传感器24和第二传感器24’以及未示出的附加传感器。图像处理系统20还包括来自处理单元22的输出块26。输出块26被用于输出诸如识别的驾驶员状态和驾驶员头部姿势的信息。根据需要或期望,该输出可以由车辆内的其他程序或设备使用,或者由远程单元使用。本申请并不针对如何使用这些数据,而是针对这些数据的确定。

处理单元22包括根据存储在存储器28中的定制程序操作的编程处理器,诸如个人计算机、服务器等,如下所述。该程序在下面讨论的图2的流程图中大体示出。存储器28可以是内部存储器和/或外部存储器,诸如ram、rom、硬盘驱动器、光驱、服务器,或者与其他处理器相关。本文示出的系统20不意图限于任何特定的硬件配置,因为由系统20实施的方法体系(methodology)可以在许多不同的硬件配置上实施。

在说明性示例中,人的头部h位于传感器24附近。传感器24可操作以捕获场景中的图像数据。由传感器24的视图中的周围环境来定义场景,诸如图1b所示。

如本文所述,用于监控驾驶员的方法包括使用处理单元22操作图像处理系统20,以从传感器24接收图像数据。图像数据表示以驾驶员头部h为对象的场景的图像。图像数据包括像素的二维阵列,并且每个像素包含指示距传感器24的距离的深度值。图像处理系统使用图像序列识别场景中的人的头部h。系统20使用深度图像来跟踪头部h相对于主定位和取向的定位和取向,其中头部h被建模为3d曲面以定义头部模型,并且随时间被连续调整以包含中性面部模型。系统20识别与中性面部的深度偏差,并将这种深度偏差分类为不同的驾驶员状态。

该方法使用深度传感器24提供的数据。这也可以称为3d传感器(如3d相机)或范围传感器。3d传感器提供的数据称为范围数据或深度数据。传感器具有位于图像平面中的像素,并且在那里用索引(i,j)索引。对于每个像素(i,j),传感器提供范围值(到对象的距离),该范围值表示从像素到传感器前方3d空间中成像的3d点的距离。在位于图像平面中的具有(x,y)轴的坐标系中(以图像平面与光轴的交点为中心),已经感测到的3d点具有坐标(x,y,z),并且可以表示为矢量。存在不同类型的3d传感器。它们基于可用于获取范围数据的不同方法。第一区别是直接方法和间接方法之间的区别。

最重要的直接方法是测量光从光源到达对象并返回传感器所需的时间;这些传感器被称为飞行时间传感器(time-of-flight-sensor)或tof传感器。该时间可以通过发送光脉冲或调制光源并测量发射光和反射光之间的相移来测量。

大多数间接方法基于三角测量,这意味着对象上的3d点从不同的已知视点被照亮和/或成像,这些视点和3d点一起定义了一个三角形,从这个三角形可以确定到3d点的距离。该方法用于不同种类的传感器;例如,第一微软kinect传感器在不同定位使用红外光投影仪和相机。传统的方法是使用两个或更多个相机,其好处是不需要额外的光源,尽管在某些情况下使用额外的光源。

不同的传感器其精度(它们能够测量的范围)不同,但它们在能提供多少个3d数据点方面也不同。只要对象反射足够的光,tof传感器就可以测量范围,而标准立体系统要求对象具有可以在两个(或更多个)图像中匹配的某种结构。

本文公开的方法可以利用任何3d传感器,只要它提供足够密集的3d点云(cloud)和与深度图像对齐的许多补充图像。这种补充图像可以是灰度图像,诸如飞行时间传感器的幅度图像,或者rgb彩色图像。所公开的方法监视传感器视野内的人的状态。在本发明的范围内,状态指的是头部姿势,包括现实世界坐标中的头部定位和头部取向角(翻滚角、俯仰角、偏航角);和基于与中性面部不同的区域识别的许多特定驾驶员状态。

为了简单起见,所公开的方法提到使用单个深度传感器24。然而,应该清楚的是,相同的方法可以应用于多个并行操作的深度传感器,以增加覆盖范围、准确性或鲁棒性。

如下文更具体描述的,该系统和方法被用于使用图1a的系统确定驾驶员的各种状态和驾驶员头部姿势。虽然图1b示出了正常驾驶员状态,但是在附图的其他图中示出了注意力分散和遮挡情景的示例。例如,图3a示出了驾驶员可能睡着的情景。在这张图片中,司机的头部朝下。图3b示出了驾驶员注意力分散的示例,诸如向上看。图3c示出了驾驶员的注意力被转移,诸如将他的头转向一侧。图3d示出了驾驶员饮酒的示例。图3示出了驾驶员戴眼镜的示例。

参照图2,流程图示出了在图1a的处理单元22中实施的用于监视驾驶员的状况的程序的操作。

该程序开始于数据获取块101。这包括处理单元22从深度传感器24获取深度图像。假设每个像素位置(i,j)具有该位置处像素的对应水平、垂直和距离信息的三维矢量可用。在一些情况下,可以获取与深度图像正确配准的补充图像(例如,振幅、强度、rgb或其他),即深度图像中的像素捕获与次级(secondary)图像中的对应像素相同的3d点。一些适当的传感器确实会默认传送这样的数据(例如,飞行时间传感器);对于其他传感器,存在配准两个图像的方法(例如,对于结构光传感器,诸如附接有第二非深度图像传感器的kinect,或者立体传感器)。图4a示出了从块101的数据获取步骤获得的深度图像。

在块102处,通过各种手段获得感兴趣区域,即属于头部的像素的集合。图4b示出了感兴趣区域,以更浅的阴影显示了深度图像的被识别为属于头部像素的部分。在最简单的情况下,传感器24相对于透镜的视场被物理地安装和限制,使得只有用户的头部h是可见的。此外,如果可用,可以使用次级彩色图像来识别皮肤像素。如美国专利5,930,392中公开的基于随机决策森林的方法,或者熟知的viola-jones方法(美国专利7,099,510)也可以被用于识别头部像素。另外,环境的物理模型可以被用于排除某些区域内的像素以进行任何进一步的处理。例如,车辆内部的静态图像可以被存储在存储器28中,并且这可以被用于排除图像中的对应数据,使得剩下的是用户的图像。

此后,该程序可操作为获得平均中性面部模型。中性面部可以被认为是参考图像,包括处于正常、非注意力分散驾驶状态下驾驶员的图像。在初始阶段,确定中性阶段和主头部姿势两者。中性面部随后被用于获得驾驶员状态特征,头部姿势随后相对于主头部姿势被连续更新。在用户没有意识到的情况下,获得中性面部和主头部姿势两者。

判定块103确定程序是否已经收敛到中性面部。这是基于是否获得了稳定的中性面部。如果不是,则在块104处执行曲面重建步骤。这不需要将运动传感器附接到要重建的对象上,而是仅依赖于对对象相对于观察到的图像序列的两个连续帧的相对运动(平移和旋转)的估计。该曲面可以使用上述方法重建,诸如美国专利9,251,590、美国专利申请13/017,474或美国专利申请13/017,587、或者替代的已知方法。然后在块105处重建中性面部。图4c示出了中性面部的振幅图像。图4d示出了重建的3d中性面部,图4e示出了由块104的曲面重建和块105的中性面部重建产生的重建的振幅中性面部。

在中性面部模型适应收敛之后,如在判定块103确定的,判定块106确定是否已经估计了绝对头部姿势。如果不是,则在块107进行主头部姿势估计。如果是,或者在块107处的主头部姿势估计之后,块108实施头部姿势跟踪。在程序的主循环中,只跟踪头部姿势。这估计了头部相对于先前定位的当前定位。姿势的这些相对变化被整合以在块109处获得绝对姿势,但是取决于被称为主姿势的初始姿势。在开始时,在块107处确定主姿势。为了确定主姿势,可以使用各种方法。例如,可以使用依赖于上述背景中描述的面部特征或标志的已知方法之一。另一种方法是通过假设驾驶员最常看前方的道路,然后跟踪相对于这个前视姿势的姿势来校准系统。

传感器24相对于头部h的定位和取向由包含旋转矩阵rk和平移向量tk的变换矩阵表示:

旋转和平移参数可以通过使用上述方法或替代方法来估计。注意的是,这种方法通过随时间整合姿势变化来获得姿势。这就是为什么需要主姿势。

每当估计的头部姿势在视场之外或者变化比生理约束更快时,如在判定块109处确定的,则在块110处重置内部头部模型,并且通过开始返回到块101处来估计新的主头部姿势。否则,在块111处,诸如灰度或颜色信息的次级图像信息被配准到深度图,即,它被链接到与对应深度值相同的体素。

迭代最近点(icp)是一种已知的配准数据的方式。在本申请的上下文中,当前面部与通过对先前配准的面部进行整合而获得的“整合面部”配准。异常值是配准的面部之间的差异。由于头部姿势不同,面部可能会有所不同。一旦头部姿势从方程中得出,剩下的差异就是异常值。头部模型或头部姿势涉及获得中性阶段。在上面讨论的初始阶段中,其中获得了中性面部模型,异常值被认为是噪声异常值,并且程序估计了这种噪声异常值的概率。后来,当中性面部模型稳定时,异常值被认为是可能是由于例如面部表情的变化而造成的特征。噪声异常值的初始估计概率被用于确定是否存在特征异常值。这是基于这样的假设,即噪声永久存在,并且非中性面部表情是相当罕见的事件,其偏离中性面部的概率取决于噪声水平,即上述噪声异常值。这种概率随特定的面部而有所不同。

类似于判定块103,判定块103a确定中性面部模型是否保持收敛。如果需要确定更新后的中性面部模型,则程序循环回到上面讨论的块101。如果不是,则在块112处获得对中性面部的深度、幅度和颜色异常值的识别。图5a示出深度异常值的示例。图5b示出振幅异常值的示例。

中性面的曲面异常值随后被用于量化变化的显著性。由于所使用的深度感测技术的噪声特性,重建的体积可能包含异常值的高概率区域(例如,飞行时间传感器在深度边缘往往不准确,并且在这些位置处产生具有高方差的像素)。因此,当测量偏离中性面部的偏差时,程序排除了产生异常值的高概率区域。这是通过随时间整合icp异常值图来完成的,以获得每个曲面补片(surfacepatch)产生异常值的概率,甚至对于中性面也是如此。

在块113处,被标记为中性面部的icp异常值的所有当前icp异常值都被丢弃,因为它们位于即使对于中性姿势也具有高可变性的区域内。

基于剩余icp异常值,检测非刚性运动和变形。这些由传感器平面中的一组像素坐标表示,这些像素坐标不被包括于在姿势估计步骤中找到的对应对中,并且因此已被保存在异常值图中。其原理是,异常值可能是由噪声和不确定的测量值引起的,或者是由非刚性运动和变形引起的。噪声异常值主要出现在深度段的边缘处,在这些边缘处,曲面几乎与传感器平面的法向量正交。图5c示出了在闭着眼睛的情况下的振幅异常值的示例。图5d示出了在去除中性面部中标记的异常值之后在闭着眼睛的情况下的异常值。图5e示出了在驾驶员打哈欠的情况下的深度异常值的示例。图5f示出了在去除中性面部中的异常值之后在驾驶员打哈欠的情况下的异常值。

然后在块114处,异常值被映射到头部模型上,并被标记为在重建曲面的前面或后面。

将异常值鲁棒地识别为特征是本发明的核心。基于这些通用特征,在块115处,可以使用各种已知方法来识别语义面部特征,并且在块116处,根据预定义类别来分类驾驶员的状态。类别(即要检测的驾驶员的状态)取决于应用。一旦定义了状态,就创建了表示这些状态的数据库,并使用机器学习技术来训练分类器,然后分类器可以通过将确定的特征与数据库上定义的状态进行比较来自动确定正确的状态。取决于应用的复杂性,简单的自适应阈值、支持向量机或深度网络被用作分类器。

图6示出了诸如可以被包括在数据库中的许多驾驶员注意力分散情景,其中一个或多个上述特征允许对驾驶员的状态进行分类。

通过跟踪驾驶员头部姿势,如上相对于块108讨论的,系统可以量化与平均中性面部模型的偏差,在图6中大体示为300。这些变化包括,例如,301处的不适当坐姿,302处的由于困倦而产生的特征性点头模式,以及303处所示的唤醒模式。

看起来比中性面部300更靠近传感器24的较大区域可以指示一般的注意力分散,诸如304处的打电话或者309处的看报纸。还可以检测310处的与特定面部表情相关的攻击性手势。

在面部区域中看起来更靠近传感器24的小区域可以被分类为311处的驾驶员戴太阳镜或其他可穿戴物品,或者308处的驾驶员驾驶时吸烟。

相对于中性面部看起来更远离传感器24的小区域可以指示305处驾驶员正在说话。结合眼睛位置处的振幅或颜色信息的突然变化,可以检测306处的震惊状态。

307处的细微面部表情需要分析包括深度、灰度和/或颜色信息的完整特征集。

在一些情况下,显著的变化可能不直接与注意力分散相关,但是应该触发中性面部模型的重置,诸如312处的驾驶员戴上帽子的情况下,或者313处的头发束的特定变化的情况下。

314处的面部颜色的变化也可能有助于总体的驾驶员状态估计,并指示诸如压力和唤醒的状态。

一旦驾驶员状态在块116处被分类,就使用例如图6所示的状态,在块117处输出驾驶员状态和头部姿势。然后,经由图1a的块26的输出可以被其他程序或警告系统等用于适当地作用于驾驶员的状态。

因此,如本文所述,一种系统和方法涉及一种估计车辆驾驶员的状况的计算机系统。这是通过对空间和时间模式进行分类以识别驾驶员状况和注意力分散事件来完成的。

已经参照流程图和块图描述了本系统和方法。应当理解,流程图的每个块和图表可以通过计算机程序指令来实施。这些程序指令可以被提供给处理器以生产机器,使得在处理器上执行的指令创建用于实施块中指定的功能的装置。计算机程序指令可以由处理器运行,以使处理器执行一系列操作步骤,从而产生计算机实施的过程,使得指令将运行并且处理器提供用于实施在块中指定的功能的步骤。因此,这些图示支持用于执行特定功能的装置的组合和用于执行这些特定指令的步骤的组合。还应当理解,每个块和块的组合可以由执行指定功能或步骤的基于专用硬件的系统来实施,或者由专用硬件和计算机指令的组合来实施。根据本文公开的各个方面的方法都不限于以任何特定顺序执行其步骤。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1