识别对象的方法和设备以及训练识别器的方法和设备的制造方法_5

文档序号：9866122阅读：来源：国知局

述的DCNN。
[0129] 至少一些示例实施例可通过基于相貌将脸部分割为内脸部、眼睛、鼻子、耳朵、嘴、 W及外脸部并识别每个部件的属性来提供有利于脸部识别的技术。至少一些示例实施例可提供根据基于训练的特征(而非手动生成的特征)进行最优识别实际图像(而非训练数据）的技术。至少一些示例实施例可提供使用单个识别器基于与中级特征相应的相貌执行脸部属性的多任务识别和脸部识别的技术。
[0130] 至少一些示例实施例可在训练脸部识别器时通过考虑脸部属性提高识别性能，并且同时提高识别准确度。至少一些示例实施例可通过使用多个随机线性函数的组合作为激活函数来针对实际数据提高识别性能。
[0131] 至少一些示例实施例可通过不使用手动生成的特征来归纳特征。因此，W能够执行专为实际图像而不是训练数据的识别的形式提供技术优势。此外，至少一些示例实施例通过不使用手动生成的特征而可在训练过程期间不需要特征的最佳组合。结果，至少一些示例实施例与现有图像识别技术相比提供降低的复杂度。此外，使用手动特征的现有图像识别方法可能更适合捜索图像而不是识别脸部。另一方面，至少一些示例实施例提供与现有图像识别方法相比更适合识别脸部的图像识别方法。此外，至少一些现有图像识别方法受一定数量的训练数据的限制。例如，至少一些现有方法使用大约100000元素的训练数据或更少执行训练。另一方面，至少一些示例实施例能够使用多于100000000个元素的训练数据执行训练。此外，至少一些现有图像识别方法不能通用于解决图像识别的各种问题。一些现有图像识别方法被限于使用特定的特征解决特定的图像识别问题。例如，局部二元模式 (LBP)可W是用于脸部识别的期望特征，而方向梯度直方图化oG)或尺度不变特征变换 (SIFT)可W是用于对象识别的期望特征。另一方面，至少一些示例实施例能够提供通过使用例如一个或多个DO^N来深度学习特征表示而通用于解决图像识别（例如，ID识别和属性识别）的多重、各种问题的技术优势。
[0132] 可使用硬件组件和软件组件来实现运里所描述的单元和/或模块。例如，硬件组件可包括麦克风、放大器、带通滤波器、音频数字转换器和处理装置。可使用一个或多个被配置为通过执行算数、逻辑和输入/输出操作来运行和/或执行程序代码的硬件装置来实现处理装置。处理装置可包括处理器、控制器和算术逻辑单元、数字信号处理器、微型计算机、现场可编程阵列、可编程逻辑单元、微型处理器或能够W限定的方式响应并执行指令的任何其它装置。处理装置可运行操作系统(0S)和运行在0S上的一个或多个软件应用。处理装置也可响应于软件的执行来访问、存储、操控、处理和创建数据。为了简单起见，使用单数来描述处理装置。然而，本领域技术人员将理解:处理装置可包括多个处理元件和多种类型的处理元件。例如，处理装置可包括多个处理器或一个处理器W及一个控制器。此外，可具有不同的处理配置(诸如，并行处理器）。
[0133] 软件可包括用于独立地或共同地指示和/或配置处理装置W如所期望的一样操作的计算机程序、一段代码、指令或它们的组合，从而使处理装置转变为专用处理器。软件和数据可在任何类型的机器、组件、物理的或虚拟的设备、计算机存储介质或装置中、或能够将指令或数据提供给处理装置或由处理装置解释的传播信号波中永久地或临时地被实施。软件也可被分布在联网的计算机系统上，使得软件按照分布方式被存储并被执行。软件和数据可由一个或多个非暂时性计算机可读记录介质进行存储。
[0134] 根据上述示例实施例的方法可被记录在包括程序指令W执行上述示例实施例的各种操作的非暂时性计算机可读介质中。所述介质还可包括单独的或与所述程序指令结合的数据文件、数据结构等。根据至少一些示例实施例，在所述介质上记录的程序指令可W是针对示例实施例的目的而专口设计和构建的那些程序指令。非暂时性计算机可读介质的示例包括磁介质（诸如硬盘、软盘和磁带）、光学介质（诸如CD ROM盘、DVD和/或蓝光盘）、磁光介质(诸如光盘)和专口被配置为存储并执行程序指令的硬件装置(诸如只读存储器(ROM)、随机存取存储器(RAM)、闪存(例如，USB闪存驱动器、存储卡、记忆棒)等）。程序指令的示例包括机器代码(诸如由编译器产生的机器代码)和包含可由计算机使用解释器来执行的更高级代码的文件两者。上述装置可被配置为充当一个或多个软件模块W便执行上述示例实施例的操作，或者反之亦然。根据至少一个示例实施例，一个或多个软件模块可被存储在存储器上，并且由例如与存储器连接的一个或多个处理器执行，W使一个或多个处理器执行 W上提到的示例实施例的一个、一些或全部的操作。
[0135] 本发明构思的示例实施例已经如此被描述，显然，可W许多方式改变本发明构思的示例实施例。运些改变不应被视为脱离本发明构思的示例实施例所意图的精神和范围，并且所有运种对于本领域技术人员将是明显的修改意图被包括在权利要求的范围内。
【主权项】
1. 一种识别方法，包括：接收输入图像；使用被预训练为同时识别多个元素的单个识别器识别与输入图像相关联的多个元素。2. 如权利要求1所述的识别方法，其中，所述多个元素包括：标识ID，标识输入图像；至少一个属性，与输入图像相关联。3. 如权利要求2所述的识别方法，其中，ID标识包括在输入图像中的至少一个对象。4. 如权利要求2所述的识别方法，其中，所述至少一个属性包括以下至少一项：与包括在输入图像中的脸部区域相应的性别；与所述脸部区域相应的年龄；与所述脸部区域相应的种族；与所述脸部区域相应的吸引力；与所述脸部区域相应的面部表情；与所述脸部区域相应的情感。5. 如权利要求4所述的识别方法，其中，所述至少一个属性包括所述性别、所述年龄、所述种族、所述吸引力、所述面部表情和所述情感中的至少两个不同的属性。6. 如权利要求1所述的识别方法，其中，所述识别器包括神经网络，所述识别的步骤包括:基于包括在神经网络中的节点之间的预学习的权重来计算与所述多个元素对应的特征值。7. 如权利要求1所述的识别方法，其中，所述识别的步骤包括:基于输入图像产生多个特征图像。8. 如权利要求7所述的识别方法，其中，所述多个特征图像包括以下至少一项：去除光照噪声的颜色通道图像；方向梯度大小通道图像；皮肤概率通道图像；局部二元模式通道图像。9. 如权利要求7所述的识别方法，其中，所述识别的步骤包括：对所述多个特征图像进行滤波；基于所述滤波的输出来输出与所述多个元素相应的特征值。10. 如权利要求9所述的识别方法，其中，所述识别的步骤还包括：基于所述特征值识别所述多个元素。11. 如权利要求1所述的识别方法，其中，所述识别的步骤包括：获取与包括在训练图像中的脸部的部件相应的多个部件图像；产生与所述多个部件图像中的每个相应的多个特征图像。12. 如权利要求11所述的识别方法，其中，所述识别的步骤包括：基于多个部件识别处理的输出来输出与所述多个元素相应的特征值，其中，所述多个部件识别处理中的每个包括：对相应的部件图像的特征图像进行滤波；基于所述滤波的输出来输出与与相应的部件图像相关联的元素相应的特征值。13. 如权利要求12所述的识别方法，其中，所述识别的步骤还包括：基于所述特征值识别所述多个元素。14. 如权利要求1所述的识别方法，还包括：将所述多个元素和多个与参考图像相关联的元素进行比较；基于比较的结果确定输入图像是否与参考图像匹配。15. 如权利要求14所述的识别方法，其中，所述比较的步骤包括：基于所述多个元素产生特征向量；将所述特征向量与参考图像的参考向量进行比较。16. -种训练识别器的方法，所述方法包括：接收训练图像；基于训练图像和在训练图像中标记的多个元素，训练被配置为从输入图像识别多个元素的识别器。17. 如权利要求16所述的方法，其中，所述多个元素包括：标识ID，标识训练图像；至少一个属性，与训练图像相关联。18. 如权利要求17所述的方法，其中，ID包括标识包括在训练图像中的至少一个对象的信息。19. 如权利要求17所述的方法，其中，所述至少一个属性包括以下至少一项：与包括在训练图像中的脸部区域相应的性别；与所述脸部区域相应的年龄；与所述脸部区域相应的种族；与所述脸部区域相应的吸引力；与所述脸部区域相应的面部表情；与所述脸部区域相应的情感。20. 如权利要求19所述的方法，其中，所述至少一个属性包括所述性别、所述年龄、所述种族、所述吸引力、所述面部表情和所述情感中的至少两个不同的属性。21. 如权利要求16所述的方法，其中，所述训练的步骤包括:计算与所述多个元素相应的损失。22. 如权利要求21所述的方法，其中，所述识别器包括神经网络，所述训练的步骤包括:基于所述损失来训练识别器学习包括在神经网络中的节点之间的权重。23. 如权利要求16所述的方法，其中，所述识别器包括神经网络，所述训练的步骤包括:基于随机分段线性(PWL)模型激活包括在神经网络中的节点。24. 如权利要求16所述的方法，其中，所述训练的步骤包括:基于训练图像产生多个特征图像。25. 如权利要求24所述的方法，其中，所述多个特征图像包括以下至少一项：去除光照噪声的颜色通道图像；方向梯度大小通道图像；皮肤概率通道图像；局部二元模式通道图像。26. 如权利要求24所述的方法，其中，所述训练的步骤包括：训练识别器对所述多个特征图像进行滤波；基于对所述多个特征图像进行滤波的输出来训练识别器输出与所述多个元素相应的特征值。27. 如权利要求26所述的方法，其中，所述训练的步骤还包括：基于输出的特征值来训练识别器识别所述多个元素。28. 如权利要求16所述的方法，其中，所述训练的步骤包括：获取与包括在训练图像中的脸部的部件相应的多个部件图像。29. 如权利要求28所述的方法，其中，不同元素在所述多个部件图像中被标记。30. 如权利要求28所述的方法，其中，所述训练的步骤还包括：产生与所述多个部件图像中的每个相应的多个特征图像。31. 如权利要求30所述的方法，其中，所述训练的步骤包括：基于与所述多个部件图像相应的多个部件识别处理的输出来训练识别器输出与所述多个元素相应的特征值；所述多个部件识别处理中的每个包括：训练识别器对相应的部件图像的特征图像进行滤波；基于所述滤波的输出来训练识别器输出与与相应的部件图像相关联的元素相应的特征值。32. 如权利要求31所述的方法，其中，所述训练的步骤还包括：基于输出的特征值来训练识别器识别所述多个元素。33. -种识别设备，包括：存储器，存储指令；一个或多个处理器，被配置为执行指令以使所述一个或多个处理器被配置为：接收输入图像；使用预训练的单个识别器识别与输入图像相关联的多个元素。34. -种用于训练识别器的设备，所述设备包括：存储器，存储指令；一个或多个处理器，被配置为执行指令以使所述一个或多个处理器被配置为：接收训练图像；基于训练图像和在训练图像中标记的多个元素来训练被配置为从输入图像识别多个元素的识别器。
【专利摘要】公开了识别对象的方法和设备以及训练识别器的方法和设备。识别方法包括：接收输入图像；使用被预训练为同时识别多个元素的单个识别器识别与输入图像相关联的多个元素。
【IPC分类】G06K9/00, G06K9/62
【公开号】CN105631398
【申请号】CN201510823759
【发明人】俞炳仁, 金楠隼, 李昶教, 崔昌圭, 韩在濬
【申请人】三星电子株式会社
【公开日】2016年6月1日
【申请日】2015年11月24日
【公告号】EP3023911A1, US20160148080

完整全部详细技术资料下载

当前第5页1 2 3 4 5