人脸识别方法和装置的制造方法_5

文档序号：9376238阅读：来源：国知局

随机存取存储器（SRAM)，电可擦除可编程只读存储器（EEPROM)，可擦除可编程只读存储器（EPROM)，可编程只读存储器（PROM)，只读存储器（ROM)，磁存储器，快闪存储器，磁盘或光盘。
[0191] 电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统，一个或多个电源，及其他与为装置400生成、管理和分配电力相关联的组件。
[0192] 多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器（LCD)和触摸面板（TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0193] 音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个麦克风（MIC)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。
[0194] I/0接口 412为处理组件402和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。
[0195] 传感器组件414包括一个或多个传感器，用于为装置400提供每个方面的状态评估。例如，传感器组件414可以检测到装置400的打开/关闭状态，组件的相对定位，例如所述组件为装置400的显示器和小键盘，传感器组件414还可以检测装置400或装置400 一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS或C⑶图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。
[0196] 通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件416还包括近场通信（NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别（RFID)技术，红外数据协会（IrDA)技术，超宽带 (UWB)技术，蓝牙（BT)技术和其他技术来实现。
[0197] 在示例性实施例中，装置400可以被一个或多个应用专用集成电路（ASIC)、数字信号处理器（DSP)、数字信号处理设备（DSPD)、可编程逻辑器件（PLD)、现场可编程门阵列 (FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述人脸识别方法。
[0198] 在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是R0M、随机存取存储器（RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
[0199] 一种非临时性计算机可读存储介质，当所述存储介质中的指令由分类装置的处理器执行时，使得分类装置能够执行一种人脸识别方法，所述方法包括：
[0200] 基于训练的强分类器，对图像的每个区域进行分类，得到所述图像的多个候选图像区域，所述强分类器由多个弱分类器组成，所述多个弱分类器基于同一训练样本集训练而成；
[0201] 遍历所述多个候选图像区域；
[0202] 对于当前遍历到的候选图像区域，基于预设分类模型，对所述候选图像区域进行分类，得到所述候选图像区域的分类结果，所述分类结果为人脸区域或者非人脸区域；
[0203] 从所述多个候选图像区域中，提取出分类结果为人脸区域的候选图像区域；
[0204] 其中，所述预设分类模型包括多个网络层，每个网络层由多个特征图组成，每个特征图由多个神经元组成，同一特征图内的每个神经元的权重矩阵相同。
[0205] 在另一实施例中，所述基于训练的强分类器，对图像的每个区域进行分类，得到所述图像的多个候选图像区域，包括：
[0206] 遍历多种尺寸，所遍历的每种尺寸均不大于所述图像的尺寸；
[0207] 按照当前遍历到的尺寸，对所述图像进行划分，得到所述图像的多个区域；
[0208] 对于划分得到的每个区域，
[0209] 根据预设特征提取算法，提取所述区域的特征；
[0210] 根据所述区域的特征和所述强分类器，获取所述区域的分类结果，所述分类结果为人脸区域或者非人脸区域；
[0211] 如果所述区域的分类结果为人脸区域，则将所述区域作为候选人脸区域。
[0212] 在另一实施例中，所述对于当前遍历到的候选图像区域，基于预设分类模型，对所述候选图像区域进行分类，得到所述候选图像区域的分类结果之前，所述方法还包括：
[0213] 对所述预设分类模型中每个特征图的权重矩阵和偏置项进行初始化；
[0214] 根据所述预设分类模型中每个特征图的权重矩阵、偏置项和预设激活函数，计算样本图像的输出结果；
[0215] 计算所述输出结果与所述样本图像的预设理论结果之间的差值；
[0216] 根据所述差值，对所述预设分类模型中每个特征图的权重矩阵和偏置项进行调整；
[0217] 基于调整后的权重矩阵和偏置项以及所述预设激活函数，继续计算所述样本图像的输出结果，直至计算出的输出结果与所述预设理论结果之间的差值小于预设阈值时停止，得到所述预设分类模型中每个特征图的权重矩阵和偏置项。
[0218] 在另一实施例中，所述根据所述预设分类模型中每个特征图的权重矩阵、偏置项和预设激活函数，计算样本图像的输出结果，包括：
[0219] 将所述样本图像输入所述预设分类模型中的第一个网络层；
[0220] 在所述预设分类模型的每个网络层中，根据上一个网络层的输出结果以及当前网络层中每个特征图的权重矩阵、偏置项和所述预设激活函数，计算输出结果；
[0221] 将当前网络层的输出结果输入至下一网络层中，继续计算下一网络层的输出结果，直至计算出最后一层的输出结果。
[0222] 在另一实施例中，所述预设分类模型包括卷积层；在所述预设分类模型的每个网络层中，根据上一个网络层的输出结果以及当前网络层中每个特征图的权重矩阵、偏置项和所述预设激活函数，计算输出结果，包括：
[0223] 获取上一个网络层的每个特征图中的每个神经元的输出结果；
[0224] 对于所述卷积层的每个特征图中的每个指定神经元，
[0225] 根据上一个网络层中每个神经元与所述指定神经元之间的连接权重，对获取到的上一个网络层中每个神经元的输出结果进行加权求和，得到所述指定神经元的特征值；
[0226] 计算所述指定神经元的特征值与所述指定神经元所在特征图的偏置项的和值；
[0227] 应用所述预设激活函数，对所述和值进行计算，得到所述指定神经元的输出结果。
[0228] 在另一实施例中，所述预设分类模型包括子采样层；在所述预设分类模型的每个网络层中，根据上一个网络层的输出结果以及当前网络层中每个特征图的权重矩阵、偏置项和所述预设激活函数，计算输出结果，包括：
[0229] 对于所述子采样层的每个特征图中的每个指定神经元，
[0230] 获取在上一个网络层的每个特征图中的连接神经元的输出结果，所述连接神经元是指上一个网络层中，所在的特征图与所述指定神经元所在的特征图的位置相同、子采样窗口与所述指定神经元的子采样窗口的尺寸相同且互不重叠的神经元；
[0231] 计算上一个网络层中，与所述指定神经元所在的指定特征图的位置相同的特征图中的连接神经元的输出结果的和值，作为所述指定神经元的特征值；
[0232] 计算所述指定特征图的权重矩阵与所述指定神经元的特征值的乘积，并计算所述乘积与所述指定特征图的偏置项的和值；
[0233] 应用所述预设激活函数，对所述乘积与所述指定特征图的偏置项的和值进行计算，得到所述神经元的输出结果。
[0234] 在另一实施例中，所述基于预设分类模型，对所述候选图像区域进行分类，得到所述候选图像区域的分类结果，包括：
[0235] 将所述候选图像区域输入至所述预设分类模型中；
[0236] 根据所述预设分类模型中已确定的每个特征图的权重矩阵、偏置项和所述预设激活函数，计算所述候选图像区域的分类结果。
[0237] 上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再 --赘述。
[0238] 本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0239] 应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
【主权项】
1. 一种人脸识别方法，其特征在于，所述方法包括：基于训练的强分类器，对图像的每个区域进行分类，得到

完整全部详细技术资料下载

当前第5页1 2 3 4 5 6