一种利用神经网络的驾驶员身份识别系统的制作方法

文档序号：18466543发布日期：2019-08-17 02:31阅读：167来源：国知局

本发明涉及面部识别领域，特别是涉及车辆驾驶环境下的驾驶员面部识别。

背景技术：

人脸识别：是基于人的脸部特征信息进行身份识别的一种生物识别技术。被广泛的应用于人类生活的各个方面。近年来兴起的网约车为人们的生活带来了方便和快捷，但同时也存在大量的安全隐患。其中一个隐患就是车队里的部分驾驶员因各种原因，并不是驾驶的本车队里自己熟悉的车，甚至是由非本车队的人员驾驶网约车车队里的车辆。这给驾驶安全以及乘客都带来了隐患。对于驾驶员与车辆的匹配认证，现有技术中常见的有：将属于该车的驾驶员照片及个人信息粘贴在副驾驶的位置，这样当有乘客上车时便可以在第一时间将该照片与实际驾驶员进行比对，以发现是否是本车的驾驶员。但这一方式存在两个问题：1)采取人工的方式比对，容易出现差错。2)当发现可以不匹配时，往往此时已经处于车辆行驶过程中，这为采取后续措施，都带来了不便。现有技术近年来出现了图像识别技术，通过摄像装置采集实际驾驶员的人脸图像，并将该人脸图像与本车的预存的驾驶员人脸图像进行比对，当相似度低于阈值时，即实际驾驶员并不是该车驾驶员，则对车辆进行锁定，报警和/或禁止车辆启动。因该方式采用了非人工的方式，解决了上述技术问题，但带来了新的技术问题：即需要对识别的准确度有了更高的要求。而需要得到较高的识别正确率，现有技术中存在通过神经网络训练分类器，以提高训练的精度。在采用神经网络进行训练过程的过程中，训练集一个人算是一类。在训练过程中，监督函数一般使用softmax或其改进算法。对于分类模型训练，占用显存主要是网络的分类器部分，而需要分类的类目数量越多，占用显存越多，故由于受到显存等硬件设备限制，使用softmax监督函数的方法无法训练类目为几十万的大分类模型。对此，提出一种新方法，使得利用softmax或其改进函数能训练大分类模型。

如图1所示，传统方法中，每块显卡共享同一数据输入和相同的分类器；一般在工业界，一个可以商用的人脸识别模型，往往是在上百万甚至是上千万人的训练集上的训练产物，但是，一般在单条显存为12g的显卡上，当特征向量维度为512维时，分类器的数量一般最大在30万左右，否则会面临显存溢出等问题。大训练集和显存限制成为了人脸识别模型训练中的主要矛盾。

技术实现要素：

鉴于现有技术中存在的问题，本发明的一个方面，是提供一种车辆驾驶员身份识别系统，其包括有传感器激活单元，存储器单元，认证系统单元等组成；该传感器激活单元用于检测车辆是否进入驾驶状态；存储器单元用于存储预存的车辆驾驶员信息；所述认证系统包括神经网络系统；所述系统包括数据输入层、特征融合层、分类器和损失函数；

所述数据输入层不停的遍历训练样本图像；

所述特征融合层提取每一张图的深度特征；

所述分类器对所述样本图像进行分类；

所述损失函数再依据分类结果和所述样本图像的真实标签作比对；

所述分类器包括多个分类器，不同的分类器对所述样本图像的不同内容进行分类；

所述系统还包括检测装置，用于检测所述系统中显卡的数量和大小，每个显卡训练不同的分类器，根据显卡的数量和大小，将所述样本图像分别分配给每个显卡。

优选的，在训练过程中，不同的分类器之间不通信，不同分类器之间参数互不更新。

优选的，每块显卡分别建立存储模型。

优选的，每块显卡的输入数据有所交叠，所述显卡的输入数据包括所述样本图像及所述样本图像的真实标签。

优选的，所述特征融合层为特征提取单元。

优选的，所述检测车辆是否进入驾驶状态是通过重量传感器和/或摄像头实现。

优选的，所述车辆驾驶员信息包括人脸图像、声纹信息和/或体重信息。

优选的，该人脸识别系统还包括警告单元，其用于触发警告事件，优选的，触发警告事件包括向车辆数据服务器发送警告。

本发明的另一方面，提供一种车辆驾驶员身份识别方法，该识别方法使用了前述的技术方案中任一项所述的人脸识别系统。

本发明的发明点包括但不限于以下几点：

(1)不同的分类器对应不同的数据，有效解决了在训练人脸识别模型中，因为显存限制而无法训练大规模人脸数据集的问题；在人脸识别训练这一特殊领域，将显存与不同的分类器相对应，这是本发明的发明点之一。

(2)训练过程中，每块显卡的分类器有着不同的参数，互不通信，要让每块卡的分类器参数互不更新，同时，每块卡都有独立的存储模型；现有技术中对于每块显卡并没有严格的区分，对显卡间的通信并没有限定。本发明将每块显卡设定为独立的，具有独立的存储模型，保证了训练的独立性，更利于大数据量的人脸识别通信。这是本发明的发明点之一

(3)每块显卡的输入数据有所交叠；训练过程中，由于一个类别在多张卡的分类器上，在整个特征提取网络拟合数据集的时候，不同卡的分类器之间的差异性在一定程度上被降低，故使得网络更好收敛，同时特征表达更加充分。使得特征提取网络更加充分的拟合训练数据，提升网络的鲁棒性。这是本发明的发明点之一。

(4)本发明的目的是提供一种用于车辆上的人脸识别装置，其中人脸识别装置采用了先进的神经网络训练模型。该训练模型能够解决该应用所必须的大训练集和显存限制的问题。从而能够高反应度、高准确率的识别驾驶员人脸图像。本发明将该先进的神经网络与车辆上的人脸识别系统相结合，采用该神经网络恰好能满足在该应用领域中需要大量人脸数据进行训练，同时又满足了需要较高的认证准确度的要求。这是本发明的发明点之一。

附图说明

图1是示出传统方法中人脸识别模型的训练方法流程图；

图2是示出确认认证的过程的流程图；

图3是本发明中示出的人脸识别模型训练方法流程图。

具体实施方式

本发明可以以多种方式实现，包括作为过程；装置；一个系统；物质的组成；计算机程序产品，包含在计算机可读存储介质上；和/或处理器，例如处理器，被配置为执行存储在耦合到处理器的存储器上和/或由耦合到处理器的存储器提供的指令。在本说明书中，这些实现或本发明可以采用的任何其他形式可以称为技术。通常，可以在本发明的范围内改变所公开的过程的步骤的顺序。除非另有说明，否则诸如处理器或被描述为被配置为执行任务的存储器的组件可以被实现为临时配置为在给定时间执行任务的通用组件或者被制造为执行任务的特定组件。任务。如这里所使用的，术语“处理器”指的是被配置为处理数据的一个或多个设备，电路和/或处理核，例如计算机程序指令。

下面提供本发明的一个或多个实施例的详细描述以及说明本发明原理的附图。

表1是示出驾驶员信息数据库的实施例的图。在一些实施例中，驾驶员信息数据库包括表1的驾驶员信息数据库。在所示的示例中，驾驶员信息数据库包括用于一组驾驶员中的每一个的id序号，姓名，图像数据。在一些实施例中，图像数据包括来自面向驾驶员的相机的图像数据。在一些实施例中，存储原始图像数据。在一些实施例中，存储压缩图像数据。在一些实施例中，存储经处理(例如，裁剪，颜色平衡，傅立叶变换，滤波，增强等)的图像数据。在一些实施例中，为图像数据存储导出的图像数据(例如，面部数据，面部参数等)。在一些实施例中，还可以包括语音数据辅助认证，这些语音数据包括来自麦克风的语音数据。在一些实施例中，存储原始语音数据。在一些实施例中，存储压缩的语音数据。在一些实施例中，存储经处理(例如，去噪，动态范围压缩，滤波，傅里叶变换等)的语音数据。在一些实施例中，为语音数据存储导出的语音数据(例如，语音参数，共振峰等)。在一些实施例中，还可以包括有重量信息，重量信息通过驾驶员座椅重量传感器收集的信息得到(未在表1中体现)。这些信息作为数据库中的数据存储在系统的存储单元中。

表1驾驶员信息数据库

图2是示出用于基于接收数据确认认证的过程的流程图。在一些实施方案中，图2的过程包括：在所示的示例中，确定是否开始认证，该确定是否开始认证是通过一传感器激活单元101执行的。具体的，例如可以通过体重检测器检测驾驶位坐椅的重量以决定是否激活认证程序。在一些实施例中，通过车内内置的摄像头检测是否有驾驶员坐在驾驶位坐椅上以决定是否激活认证程序；也可以两者兼顾，当体重检测器和摄像头都检测到驾驶员时，才激活认证程序。在一些实施例中，确定驾驶员是否被认证包括将面部数据与存储的面部数据进行比较，这一过程是通过接收存储器单元102执行的。具体的是将摄像头拍摄的人脸部图像与上述的存储在系统中的存储单元中的数据进行比较，该比较过程包括了下述的神经网络模型系统。下述的神经网络模型系统是得出该驾驶员是否是本车驾驶员的核心部件。在一些实施例中，通过认证系统单元103确定驾驶员是否被认证包括还包括将传感器数据与接收的传感器数据进行比较。在一些实施例中，确定驾驶员是否被认证包括确定驾驶员信息数据库中的任何条目都不匹配传感器数据和面部数据(例如，因此驾驶员未被认证)。在一些实施例中，确定驾驶员是否被认证包括确定驾驶员信息数据库中的一个或多个条目与传感器数据或面部数据中的一个匹配。在一些实施例中，该匹配包括预先设定一个匹配度相关的阈值，当处理结果高于该阈值时，说明匹配度符合要求，该驾驶员是登记在该车辆的驾驶员；或处理结果等于或小于该阈值时，说明匹配度不符合要求，该驾驶员不是登记在该车辆的驾驶员。对于该阈值的选择，体现出神经网络的先进与否。本申请使用的神经网络，可将阈值设在较高的，典型的如0.95(满分为1)。

在一些实施例中，确定驾驶员已经被认证，则激活车辆驱动系统104，如果认证失败，则结束认证过程。

在认证系统单元103中包括有神经网络系统进行认证，其通过设定一定的阈值以检测实际驾驶员的图像阈值是否超过了预设的阈值。此外，该认证系统单元103还可以包括辅助认证系统单元，通过请求附加数据进行认证。在一些实施例中，附加数据包括语音数据。在一些实施例中，请求附加数据包括提示给出语音数据样本(例如，“说你好”)。在各种实施例中，附加数据包括指纹数据，密码数据，磁条数据(例如，从刷卡识别卡)，射频识别数据(例如，来自具有射频识别标签的识别卡)或任何其他适当的附加数据。数据。在神经网络系统进行图像识别的基础上，再辅助以其他传感器的信息，例如人的体重，特别是人的声纹信息，对提高认证的准确度有很大的帮助，这也是本发明的发明点之一。

在各种实施例中，分析附加数据包括去噪，动态范围压缩，滤波，傅立叶变换，提取声音参数，提取共振峰，提取语音或任何其他适当的分析技术。在一些实施例中，使用附加数据确定驾驶员是否被认证包括确定语音数据匹配驱动器信息数据库中的一个或多个条目之一的存储的语音数据，其包括匹配的传感器或语音数据之一。

此外，还包括有警告单元，其功能为触发警告事件。在一些实施例中，触发警告事件包括向车辆数据服务器发送警告，该警告单元在认证程序中位于当认证系统认证失败，即数据与预存数据不匹配的情况下会被激活。在一些实施例中，警告包括指示驾驶员面部数据或所接收的传感器数据(例如，驾驶员座位重量数据)中的一个与记录的数据不匹配但是由于额外的数据匹配而允许驾驶员继续进行的指示(例如，语音数据匹配)。

实施例2

本实施例提供一种人脸识别系统，具体包括人脸识别模型，其采用深度学习方法训练得到，网络模型由数据输入层、特征融合层、分类器和损失函数构成，其中损失函数为softmax函数。

所述数据输入层不停的遍历训练样本图像；所述特征融合层提取每一张图的深度特征；

所述分类器对所述样本图像进行分类；所述损失函数再依据分类结果和所述样本图像的真实标签作比对。

上述系统还包括检测装置，用于检测系统中显卡的数量和大小，根据显卡的数量和大小，训练集中的数据被分配给每个显卡相应数量的数据；具体分配规则如下：如果检测到有n个显卡，并且每个显卡的显存大小相同，就将训练集中的数据n等分分给每个显卡，如果每个显卡的显存并不相同，则依据显存大小进行分配，例如，有的显卡的显存为12g，有的为6g，则12g显卡分配的数据量为6g显卡的一倍。并且要求每个显卡分配的训练集数据或是训练的分类器数量不能超过其上限；一般在单条显存为12g的显卡上，当特征向量维度为512维时，分类器的类别数量一般最大在30万左右。

每个显卡对应不同的训练集数据，而每个分类器也相应对应不同的训练集数据，在训练过程中，要求分类器不通信，由于每块显卡上分类器是不同的，相互通信反而会影响模型的训练。训练过程中，使用随机梯度下降法计算损失，同时，每块卡分别存储各自的模型参数。

如图2所示，为本发明的人脸识别模型，训练集数据根据显卡的数量及大小相应的分为若干数据集，每个显卡训练不同的分类器，但所有显卡或分类器共有相同的特征提取单元。

每个数据集之间并不相同，例如，最终输出的特征向量为512维特征向量，每个训练集数据包括所有图像本身以及标识出的脸型，头发，眉毛，眼睛，鼻子，嘴巴，肤色等512维特征向量中的一部分，例如：

第一显卡包括所有图像本身以及标识出眼睛的相关标识数据；

第二显卡包括所有图像本身以及标识出的头发相关标识数据；

第三显卡包括所有图像本身以及标识出的脸型相关标识数据；

……

第n显卡包括所有图像本身以及标识出的嘴巴相关标识数据；

第n+1显卡包括所有图像本身以及标识出的鼻子相关标识数据；

其中第一显卡训练的分类器包括第一分类器，第二分类器……；第一分类器具体用于分类眼睛的颜色，第二分类器用于分类单眼皮，双眼皮。

以上数据中，头发的相关数据可以包括发型，头发的颜色等，眼睛的相关数据可以包括眼睛大小，眼睛的颜色，眼睛的形状，单眼皮双眼皮等，嘴巴的相关数据可以包括嘴巴的形状，嘴唇的颜色等。

在一般训练系统中，多机器或多显卡训练模型时，有多种存储模型的方案。比如，每块卡分别完成一次图像的前向和反向传播，在互相通信更新参数，存储模型时只存第一块卡的参数；或者把所有卡的特征提取层的输出都集中到第一块卡上完成前向传播，等反向传播时，再将各参数分发到对应卡上，存储模型时只存第一块卡的参数；

但由于本发明中，每块卡的分类器有着不同的参数，故不能使用集中-分发操作，也不能单纯的存储第一块卡的模型参数。对此，需要修改训练系统的训练逻辑。在训练过程中，要让每块卡的分类器参数互不更新，同时，每块卡都有独立的存储模型。

以上方案中由于不同的分类器对应不同的数据，有效解决了在训练人脸识别模型中，因为显存限制而无法训练大规模人脸数据集的问题。

实施例3

本实施例提供一种人脸识别模型的训练方法，所述方法由人脸识别训练系统实施。

步骤s1：人脸识别训练系统的检测装置检测系统中显卡的数量和大小，根据显卡的数量和显存大小，将训练集中相应数量的数据输入给每块显卡。当训练集类别数量除以显卡数小于分类器最大分类数目时，一般会令每块显卡之间的输入数据有交叠。举例来说，假设有8张显卡，训练集有80万个类别，所谓交叠，即在保证每张卡的分类器平均分到10万个类别后，随机从其它7张卡长抽取20万个类别添加到本张卡的分类器上，这样每个类别至少存在两张卡上，即不同卡的分类器存在弱耦合关系。训练过程中，由于一个类别在多张卡的分类器上，在整个特征提取网络拟合数据集的时候，不同卡的分类器之间的差异性在一定程度上被降低，故使得网络更好收敛，同时特征表达更加充分。总之，交叠的数据能使得特征提取网络更加充分的拟合训练数据，提升网络的鲁棒性。

步骤s2：人脸识别模型的特征融合层提取每一张图像的深度特征，输入分类器进行分类，人脸识别模型的损失函数层再依据分类结果和样本(即每一张图像)真实标签作比对，反向传播更新各层参数；这里的特征融合层具体为特征提取网络。

在步骤s1中，在训练过程中，训练集中一个人被当作一类，当系统检测到训练集人数超过各显卡显存之和时，如当训练集人数增加时，只需要对应增加显卡数量，即可以完成模型训练，提升模型性能。这里创造性的提出将一个人被当作一类，从而可以以增加显示数量方式应对训练集人数的增加。

在步骤s2中，特征提取网络根据每块显卡被输入的具体数据，对应的提取相应的特征，例如，第一显卡被输入的数据为所有图像本身以及眼睛相关标识数据，特征提取层需要从每张图像中提取眼睛相关的深度特征，然后将这些深度特征输入到第一显卡训练的分类器中进行分类训练。

尽管为了清楚理解的目的已经在一些细节上描述了前述实施例，但是本发明不限于所提供的细节。存在许多实现本发明的替代方式。所公开的实施例是说明性的而非限制性的。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑弘晖;胡杰;武冰冰
技术所有人：初速度（苏州）科技有限公司
我是此专利的发明人

上一篇：杆锁的制作方法
上一篇：控制装置、具有该控制装置的卷帘和控制方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。