用户面部表情识别方法、装置和设备与流程

文档序号：30497672发布日期：2022-06-22 06:55阅读：126来源：国知局

1.本技术涉及图像处理技术领域，尤其涉及一种用户面部表情识别方法、装置和设备。

背景技术：

2.由于煤矿生产环境具有不稳定性高、光照条件差以及能见度较低等特性，需要对煤矿生产现场进行实时监控，尤其需要对煤矿井下作业人员的面部表情进行识别分类，以尽早发现作业人员的异常，保障煤矿井下作业人员的人身安全以及生产作业安全。
3.现有技术中，利用结构简单的卷积神经网络对煤矿作业人员的面部表情图像进行简单卷积处理，以获取煤矿作业人员的面部特征信息，进而确定面部表情图像的分类识别结果。
4.然而现有技术中，由于煤矿作业人员的面部表情图像中人脸区域与背景区域对比度较小，并且煤矿作业人员的脸部颜色较深，使用结构简单的卷积神经网络提取其面部特征信息的精度较低，进而导致识别结果不准确。

技术实现要素：

5.本技术提供一种用户面部表情识别方法、装置和设备，用以解决提取用户面部特征信息的精度较低，面部表情识别结果不准确的问题。
6.第一方面，本技术提供一种用户面部表情识别方法，所述方法包括：获取目标对象的待处理图像，并对所述待处理图像进行卷积处理，确定所述待处理图像的第一特征图，其中，所述第一特征图表征所述待处理图像的基础特征信息；基于所述第一特征图，提取所述待处理图像的深层特征信息，得到最终特征图，其中，所述最终特征图包括所述基础特征信息和所述深层特征信息；根据所述最终特征图，确定所述待处理图像的分类识别结果。
7.在可选的一种实施方式中，基于所述第一特征图，提取所述待处理图像的深层特征信息，确定最终特征图，包括：重复执行以下步骤，直至达到预设条件：对所述第一特征图中每一像素点进行卷积处理和采样处理，提取所述第一特征图中每一像素点的关键特征信息，确定第二特征图，其中，所述第一特征图中包括有n
×
n个像素点，n为大于1的正整数；对所述第一特征图中每一像素点进行卷积处理和激活处理，提取所述特征图中每一像素点的关联特征信息，确定第三特征图；对所述第一特征图、所述第二特征图以及所述第三特征图进行特征融合处理，确定第四特征图，将所述第四特征图确定为新的第一特征图；其中，所述预设条件为预设最大深层特征信息提取次数；达到预设条件时的第一特征图为最终特征图。
8.在可选的一种实施方式中，对所述第一特征图中每一像素点进行卷积处理和采样处理，提取所述第一特征图中每一像素点的关键特征信息，确定第二特征图，包括：基于预设的1
×
1卷积核，对所述第一特征图中每一像素点进行卷积处理，获取所述第一特征图中每一像素点的特征映射信息；对每一像素点的特征映射信息进行上采样和下采样处理，确定并强化每一像素点的关键特征信息，确定第二特征图。
9.在可选的一种实施方式中，对所述第一特征图中每一像素点进行卷积处理和激活处理，提取所述特征图中每一像素点的关联特征信息，确定第三特征图，包括：对所述第一特征图进行深度可分离卷积处理，并根据第一预设激活函数对每一像素点进行逐通道激活，提取每一像素点的关联特征信息，确定第三特征图。
10.在可选的一种实施方式中，所述第一预设激活函数具有线性参数，所述线性参数用于对每一像素点进行逐通道激活，获取每一像素点的关联特征信息。
11.在可选的一种实施方式中，根据所述最终特征图，确定所述待处理图像的分类识别结果，包括：对所述最终特征图进行池化处理，并根据第二预设激活函数确定所述待处理图像的识别预测信息，确定所述待处理图像的分类识别结果。
12.第二方面，本技术提供一种用户面部表情识别装置，所述装置包括：第一确定单元，用于获取目标对象的待处理图像，并对所述待处理图像进行卷积处理，确定所述待处理图像的第一特征图，其中，所述第一特征图表征所述待处理图像的基础特征信息；处理单元，用于基于所述第一特征图，提取所述待处理图像的深层特征信息，得到最终特征图，其中，所述最终特征图包括所述基础特征信息和所述深层特征信息；第二确定单元，用于根据所述最终特征图，确定所述待处理图像的分类识别结果。
13.在可选的一种实施方式中，所述处理单元具体用于：重复执行以下步骤，直至达到预设条件：对所述第一特征图中每一像素点进行卷积处理和采样处理，提取所述第一特征图中每一像素点的关键特征信息，确定第二特征图，其中，所述第一特征图中包括有n
×
n个像素点，n为大于1的正整数；对所述第一特征图中每一像素点进行卷积处理和激活处理，提取所述特征图中每一像素点的关联特征信息，确定第三特征图；对所述第一特征图、所述第二特征图以及所述第三特征图进行特征融合处理，确定第四特征图，将所述第四特征图确定为新的第一特征图；其中，所述预设条件为预设最大深层特征信息提取次数；达到预设条件时的第一特征图为最终特征图。
14.第三方面，本技术提供一种电子设备，所述电子设备包括：存储器，处理器；存储器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行如第一方面所述的方法。
15.第四方面，本技术提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如第一方面所述的方
法。
16.本技术提供的用户面部表情识别方法、装置和设备，通过以下步骤：获取目标对象的待处理图像，并对待处理图像进行卷积处理，确定待处理图像的第一特征图，其中，第一特征图表征待处理图像的基础特征信息；基于第一特征图，提取待处理图像的深层特征信息，得到最终特征图，其中，最终特征图包括基础特征信息和深层特征信息；根据最终特征图，确定待处理图像的分类识别结果。实现了对用户面部表情的特征的高精度、深层次提取，提高了面部表情分类识别结果的准确性。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
18.图1为本技术实施例提供的一种用户面部表情识别方法的流程图；图2为本技术实施例提供的另一种用户面部表情识别方法的流程图；图3为本技术实施例提供的一种用户面部表情识别装置的结构示意图；图4为本技术实施例提供的一种电子设备的结构示意图；图5是根据一示例性实施例示出的一种终端设备的框图。
19.通过上述附图，已示出本技术明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围，而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
20.这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
21.由于煤矿生产环境具有不稳定性高、光照条件差以及能见度较低等特性，需要对煤矿生产现场进行实时监控，尤其需要对煤矿井下作业人员的面部表情进行识别分类，以尽早发现作业人员的异常，保障煤矿井下作业人员的人身安全以及生产作业安全。
22.现有技术中，利用结构简单的卷积神经网络对煤矿作业人员的面部表情图像进行简单卷积处理，以获取煤矿作业人员的面部特征信息，进而确定面部表情图像的分类识别结果。
23.如果要使得面部识别结果更加准确，就需要大量的数据集进行识别训练，目前传统的机器学习对于大量数据集的处理方面存在不足；深度学习方法需要对数据进行预处理，去除与面部表情无关的背景和图像，考虑光照、头部姿态引起的面部表情的差异，进而进行特征学习。但由于煤矿环境中光照条件较差，可见度较低，图像或影像中人脸区域与背景区域对比度较小，并且识别对象，例如矿工，的脸部颜色较深，因此使用人工特征的分类器和结构简单的卷积神经网络对用户面部表情的特征提取的精度较低，进而导致识别结果不准确。
24.本技术提供的用户面部表情识别方法，旨在解决现有技术的如上技术问题。
25.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本技术的实施例进行描述。
26.图1为本技术实施例提供的一种用户面部表情识别方法的流程图，如图1所示，该方法包括：101、获取目标对象的待处理图像，并对待处理图像进行卷积处理，确定待处理图像的第一特征图，其中，第一特征图表征待处理图像的基础特征信息。
27.示例性地，获取目标对象的图像数据，即待处理图像，并对待处理图像进行卷积处理，这个过程包括对待处理图像中的对人脸进行检测提取，对人脸的面部姿态、光照和位置进行统一处理，分离背景，对人脸面部的表情进行特征提取，获取面部的形变特征信息、面部的运动特征信息，确定待处理图像的第一特征图，其中，第一特征图表征待处理图像的基础特征信息。
28.一个示例中，基于特征提取网络提取待处理图像的特征，首先连续使用两个卷积模块对待处理图像进行卷积处理，提取待处理图像的基础特征信息，确定待处理图像的第一特征图，其中，每一卷积模块依次包括3
×
3卷积层、网络权重归一化层以及改进的frelu激活函数。
29.102、基于第一特征图，提取待处理图像的深层特征信息，得到最终特征图，其中，最终特征图包括基础特征信息和深层特征信息。
30.示例性地，对获取到的第一特征图进行特征提取，获取待处理图像的深层特征信息，根据得到的待处理图像的基础特征信息和深层特征信息，得到待处理图像的最终特征图。
31.一个示例中，基于提取网络提取待处理图像的特征，根据特征提取网络中预先设置的一个或多个残差提取模块对第一特征图进行深层特征信息提取，其中，每一残差提取模块包括两个分支模块，基于每一残差提取模块中各分支模块获取的特征信息与基础特征信息，得到最终特征图。
32.103、根据最终特征图，确定待处理图像的分类识别结果。
33.示例性地，根据得到的最终特征图，对目标对象的待处理图像进行分类识别，从而完成识别过程，确定待处理图像的分类识别结果。
34.本实施例中，通过以下步骤：获取目标对象的待处理图像，并对待处理图像进行卷积处理，确定待处理图像的第一特征图，其中，第一特征图表征待处理图像的基础特征信息；基于第一特征图，提取待处理图像的深层特征信息，得到最终特征图，其中，最终特征图包括基础特征信息和深层特征信息；根据最终特征图，确定待处理图像的分类识别结果。实现了对用户面部表情的特征的高精度、深层次提取，提高了面部表情分类识别结果的准确性。
35.图2为本技术实施例提供的另一种用户面部表情识别方法的流程图，如图2所示，该方法包括：201、获取目标对象的待处理图像，并对待处理图像进行卷积处理，确定待处理图像的第一特征图，其中，第一特征图表征待处理图像的基础特征信息。
36.示例性地，本步骤参见步骤101，不再赘述。
n+1)
×
(w-n+1)映射图，再将映射图堆叠成(h-n+1)
×
(w-n+1)
×
3的表情特征图作为该卷积层的输出图像；步骤二，即采用m个大小为1
×1×
3的过滤器对步骤一得到输出图像进行卷积以扩展输出深度，最终得到m个通道的表情特征图，其中，m为卷积核个数。
48.普通卷积与深度可分离卷积过程中产生的参数量如下式：其中，表示普通卷积产生的参数数量；表示深度可分离卷积产生的参数数量；w、h和c代表输入图像的尺寸和通道数；n为卷积核尺寸大小；m为卷积核个数。进而可计算两种卷积方式参数数量比e为：一个示例中，第一预设激活函数，即改进的frelu激活函数可以表示为，新增的线性系数为，其表达式为：，其表达式为：其中，代表exp-frelu激活函数；c代表第c特征通道，i、j代表表情特征图横、纵坐标；是第c个通道上非线性激活的输入像素点；代表依赖于空间上下文的二维漏斗条件，有助于提取物体的精细空间布局；表示以为中心点的w
×
h参数池化窗口，w和h代表参数池化窗口尺寸；表示同一通道中共享的该窗口上的参数。表示w
×
h参数池化窗口内的比重参数；e代表该池化窗口内每个像素点像素值的归一化值，且e （0,1）；为自适应像素特征学习参数，与每个像素点相对应。与e两矩阵对应位置相乘后构成新的参数矩阵，并逐通道累加，共累加c次，最后取其均值得到表情特征比重参数的数值。
49.205、对第一特征图、第二特征图以及第三特征图进行特征融合处理，确定第四特征图，将第四特征图确定为新的第一特征图。
50.示例性地，对第一特征图、第二特征图以及第三特征图进行特征融合处理，确定第
四特征图，将第四特征图确定为新的第一特征图。
51.一个示例中，残差提取模块中的第一分支模块还包括有两个1
×
1卷积层，用于改变特征图的通道数；sigmoid函数，用于对获取的特征信息进行非线性化处理，经过处理后的第二特征图与第三特征图以及第一特征图具有相同的特征通道数，进而可以进行特征融合，确定第四特征图，将第四特征图确定为新的第一特征图。
52.206、对最终特征图进行池化处理，并根据第二预设激活函数确定待处理图像的识别预测信息，确定待处理图像的分类识别结果。
53.示例性地，对最终特征图进行池化处理，并根据第二预设激活函数，例如softmax激活函数，确定待处理图像的识别预测信息，确定待处理图像的分类识别结果。
54.本实施例中，通过以下方式获取待处理图像的深层特征信息，进而确定最终特征图：基于预设的1
×
1卷积核，对第一特征图中每一像素点进行卷积处理，获取第一特征图中每一像素点的特征映射信息；对每一像素点的特征映射信息进行上采样和下采样处理，确定并强化每一像素点的关键特征信息，确定第二特征图；对第一特征图中每一像素点进行卷积处理和激活处理，提取特征图中每一像素点的关联特征信息，确定第三特征图；对第一特征图、第二特征图以及第三特征图进行特征融合处理，确定第四特征图，将第四特征图确定为新的第一特征图，直至达到预设的深层特征提取次数，此时的第一特征图为最终特征图。这个过程中使用深度可分离卷积层、1
×
1卷积、上下采样、以及改进的exp-frelu激活函数获取了待处理图像多样化的深层特征信息，有效的减少了卷积过程的参数量，并且实现了对用户面部表情的特征的高精度、深层次提取，提高了面部表情分类识别结果的准确性。
55.图3为本技术实施例提供的一种用户面部表情识别装置的结构示意图，如图3所示，该装置包括：第一确定单元31，用于获取目标对象的待处理图像，并对待处理图像进行卷积处理，确定待处理图像的第一特征图，其中，第一特征图表征待处理图像的基础特征信息。
56.处理单元32，用于基于第一特征图，提取待处理图像的深层特征信息，得到最终特征图，其中，最终特征图包括基础特征信息和深层特征信息。
57.第二确定单元33，用于根据最终特征图，确定待处理图像的分类识别结果。
58.一个示例中，处理单元32具体用于：重复执行以下步骤，直至达到预设条件：对第一特征图中每一像素点进行卷积处理和采样处理，提取第一特征图中每一像素点的关键特征信息，确定第二特征图，其中，第一特征图中包括有n
×
n个像素点，n为大于1的正整数；对第一特征图中每一像素点进行卷积处理和激活处理，提取特征图中每一像素点的关联特征信息，确定第三特征图；对第一特征图、第二特征图以及第三特征图进行特征融合处理，确定第四特征图，将第四特征图确定为新的第一特征图；其中，预设条件为预设最大深层特征信息提取次数；达到预设条件时的第一特征图为最终特征图。
59.一个示例中，处理单元32具体用于：基于预设的1
×
1卷积核，对第一特征图中每一像素点进行卷积处理，获取第一特
征图中每一像素点的特征映射信息；对每一像素点的特征映射信息进行上采样和下采样处理，确定并强化每一像素点的关键特征信息，确定第二特征图。
60.一个示例中，处理单元32具体用于：对第一特征图进行深度可分离卷积处理，并根据第一预设激活函数对每一像素点进行逐通道激活，提取每一像素点的关联特征信息，确定第三特征图。
61.一个示例中，第一预设激活函数具有线性参数，线性参数用于对每一像素点进行逐通道激活，获取每一像素点的关联特征信息。
62.一个示例中，第二确定单元33具体用于：对最终特征图进行池化处理，并根据第二预设激活函数确定待处理图像的识别预测信息，确定待处理图像的分类识别结果。
63.图4为本技术实施例提供的一种电子设备的结构示意图，如图4所示，电子设备包括：存储器51，处理器52。
64.存储器51；用于存储处理器52可执行指令的存储器。
65.其中，处理器52被配置为执行如上述实施例提供的方法。
66.图5是根据一示例性实施例示出的一种终端设备的框图，该设备可以是移动电话，计算机，数字广播终端，消息收发设备，医疗设备，个人数字助理等。
67.装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出（i/ o）接口812，传感器组件814，以及通信组件816。
68.处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。
69.存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器（sram），电可擦除可编程只读存储器（eeprom），可擦除可编程只读存储器（eprom），可编程只读存储器（prom），只读存储器（rom），磁存储器，快闪存储器，磁盘或光盘。
70.电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。
71.多媒体组件808包括在装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器（lcd）和触摸面板（tp）。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可
以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
72.音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风（mic），当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。
73.i/ o接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。
74.传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到装置800的打开/关闭状态，组件的相对定位，例如组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如cmos或ccd图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。
75.通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如wifi，2g或3g，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件816还包括近场通信（nfc）模块，以促进短程通信。例如，在nfc模块可基于射频识别（rfid）技术，红外数据协会（irda）技术，超宽带（uwb）技术，蓝牙（bt）技术和其他技术来实现。
76.在示例性实施例中，装置800可以被一个或多个应用专用集成电路（asic）、数字信号处理器（dsp）、数字信号处理设备（dspd）、可编程逻辑器件（pld）、现场可编程门阵列（fpga）、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。
77.在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，非临时性计算机可读存储介质可以是rom、随机存取存储器（ram）、cd-rom、磁带、软盘和光数据存储设备等。
78.本技术实施例还提供了一种非临时性计算机可读存储介质，当该存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述实施例提供的方法。
79.本技术实施例还提供了一种计算机程序产品，计算机程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
80.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本技术的真正范围和精神由下面的
权利要求书指出。
81.应当理解的是，本技术并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求书来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周波陈永刚苗瑞邹小刚梁书玉
技术所有人：深圳市海清视讯科技有限公司
我是此专利的发明人

上一篇：可作为益生元的金耳多糖ATP-L1及其制备方法和应用与流程
上一篇：一种新型充电桩装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。