基于深度学习的车载人脸识别方法与流程

文档序号：15258153发布日期：2018-08-24 21:00阅读：744来源：国知局

本发明涉及一种人脸识别方法。特别是涉及一种基于深度学习的车载人脸识别方法。

背景技术：

随着信息获取和信息处理技术的快速发展,计算机视觉,即如何利用计算机技术高效准确地从环境图像或者视频中获取相关信息,进而对客观世界中的事物及发生的现象进行分析、判断和决策,已经成为一个非常重要的研究课题。随着深度学习的快速发展，计算机视觉在近几年发展迅速，深层卷积神经网络对进行计算机视觉方面的研究发展起到了非常重要的作用。

随着计算机视觉的快速发展，人脸识别技术发展势头良好，人脸识别的应用也越来越广泛，人脸识别是基于人脸的面部特征进行识别的一种生物识别技术，通过摄像机等图像采集设备采集含有人脸的图像或者视频流，然后在图像中进行人脸检测和人脸跟踪，进而对检测到的人脸进行脸部相关的一系列相关技术。目前人脸识别技术主要包括(1)几何特征的人脸识别方法；(2)基于特征脸(pca)的人脸识别方法(3)神经网络的人脸识别方法(4)弹性图匹配的人脸识别方法(5)线段hausdorff距离(lhd)的人脸识别方法(6)支持向量机(svm)的人脸识别方法。

目前交通事故频发，除了自然原因外，有很大一部分是驾驶员自身的问题，主要包括疲劳驾驶、接听电话、开车时看手机分心等，以上原因造成的意外不计其数。

目前我国的车载摄像头虽然有一定的发展，但是主要集中于车速测试、目标跟踪、行人检测、障碍物检测等领域，针对驾驶员的安全文明驾驶没有过多的研究，以前由于技术的限制，如何判断驾驶员是否违规行驶缺乏实时高效的判断方法。基于深度学习的人脸识别技术，能够对驾驶员的实时操作进行监督和判断，能够有效减少驾驶员违规操作而造成交通事故。

技术实现要素：

本发明所要解决的技术问题是，提供一种能够通过实时分析人脸变化，判断司机是否有疲劳驾驶等现象，并给出及时提醒的基于深度学习的车载人脸识别方法。

本发明所采用的技术方案是：一种基于深度学习的车载人脸识别方法，包括如下步骤：

1)获取图像，构建驾驶员数据集；

2)构建模型，包括：

(1)通过卷积神经网络和lstm网络，分别从驾驶员数据集中提取视觉特征和语义特征；

(2)将提取的视觉特征和语义特征输入到带有attention机制的lstm网络中构成特征处理模型；

3)训练特征处理模型，将驾驶员数据集中的60％的图像用于训练，20％的图像用于验证，20％的图像用于测试；

4)根据测试结果分别对参数wz、wr、w进行微调，优化实验结果，将优化后的特征处理模型传送到总控制端；

5)在车上安装警示灯和摄像头，实时将驾驶员的操作情况上传到总控制端，总控制端根据优化后的特征处理模型判断驾驶员是否有违规驾驶，当有违规驾驶，总控制端发出信号，激发警示灯，提醒驾驶员文明行驶。

步骤1)包括利用基于python的网络图片获取脚本，通过互联网获取不同驾驶员图像，对图像制作标签，标签详细注明图像内容，然后汇总，作为驾驶员数据集，所述的图像内容包括：驾驶员正常驾驶、低头看手机、四处观看、闲聊及疲劳驾驶。

步骤2)中的第(1)包括：利用卷积神经网络中的vgg-19网络的conv5_3层提取驾驶员数据集的14×14×512维视觉特征，得到特征向量ai，通过attention机制产生视觉信息上下文向量zvt；通过lstm网络提取驾驶员数据集的语义特征，并获得语义上下文向量zst。

步骤2)中的第(2)步包括：

(1)将视觉信息上下文向量zvt和语义上下文向量zst通过仿射变换形成能够更加充分的表达图像信息的上下文向量zt；

(2)将得到的上下文向量zt输入到带有attention机制的lstm网络，分析驾驶员的行为。

所述的特征处理模型，如下：

et＝fatt(ai,ht-1)

zt＝σ(wz·[ht-1,xt])

rt＝σ(wr·[ht-1,xt])

其中，zvt表示视觉信息上下文向量，ai表示视觉特征向量，αt表示权重，zt表示上下文向量，xt表示当前时刻的输入，ht和ht-1分别表示当前时刻和上一时刻的隐藏层状态，为当前时刻隐藏层的候选状态，wz、wr、w为参数。

本发明的基于深度学习的车载人脸识别方法，在驾车过程中通过车载摄像头获取驾驶员实时信息，通过实时分析人脸变化，提取人脸特征，通过卷积神经网络检测其是否有违规操作，与数据集进行分析对比，一旦发现有违法违规行为，如发现疲劳驾驶和接听电话，看手机等现象，会自动发出警报，及时制止驾驶员的不良行为。减少交通事故发生的可能性。

附图说明

图1是本发明基于深度学习的车载人脸识别方法的流程图。

具体实施方式

下面结合实施例和附图对本发明的基于深度学习的车载人脸识别方法做出详细说明。

如图1所示，本发明的基于深度学习的车载人脸识别方法，包括如下步骤：

1)获取图像，构建驾驶员数据集，包括：

利用基于python的网络图片获取脚本，通过互联网获取不同驾驶员图像，对图像制作标签，标签详细注明图像内容，然后汇总，作为驾驶员数据集，所述的图像内容包括：驾驶员正常驾驶、低头看手机、四处观看、闲聊及疲劳驾驶。

2)构建模型，包括：

(1)为了能够更好的分辨驾驶员的行为，本发明提取视觉特征和语义特征。通过卷积神经网络和lstm网络，分别从驾驶员数据集中提取视觉特征和语义特征；包括：利用卷积神经网络中的vgg-19网络的conv5_3层提取驾驶员数据集的14×14×512维视觉特征，得到特征向量ai，通过attention机制产生视觉信息上下文向量zvt；通过lstm网络提取驾驶员数据集的语义特征，并获得语义上下文向量zst。

(2)将提取的视觉特征和语义特征输入到带有attention机制的lstm网络中构成特征处理模型；包括：

(2.1)将视觉信息上下文向量zvt和语义上下文向量zst通过仿射变换形成能够更加充分的表达图像信息的上下文向量zt；

(2.2)将得到的上下文向量zt输入到带有attention机制的lstm网络，分析驾驶员的行为。例如：聊天时嘴型变化，疲劳时的眼睛的变化。

lstm(longshortterm)是一种特殊的rnn模型，可以学习长期依赖信息。lstm能够通过一个忘记门来选择性的记住或者遗忘之前的信息。attention机制是当前非常流行的一种图像处理的方法，它是通过计算图像相关区域的权重来分配关注程度。所述的特征处理模型，如下：

et＝fatt(ai,ht-1)

zt＝σ(wz·[ht-1,xt])

rt＝σ(wr·[ht-1,xt])

3)训练特征处理模型，将驾驶员数据集中的60％的图像用于训练，20％的图像用于验证，20％的图像用于测试；

4)根据测试结果分别对参数wz、wr、w进行微调，优化实验结果，将优化后的特征处理模型传送到总控制端；

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冀中;贺二路;庞彦伟
技术所有人：天津大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。