人物中心特性特定照片匹配排名引擎的制作方法

文档序号:17534667发布日期:2019-04-29 13:51阅读:159来源:国知局
人物中心特性特定照片匹配排名引擎的制作方法

本公开总体上涉及图像识别,并且更特别地涉及用于使用特定特性的面部识别的技术。



背景技术:

图像识别技术常常被用于定位、标识和/或验证在图像中出现的一个或多个主题。一些图像识别技术涉及从图像提取界标或者特征的集合,并且将所提取的特征集与从一个或多个其他图像提取的对应的特征相比较以便标识或者验证图像。例如,在面部识别中,可以从面部的图像提取一个或多个特性(诸如面部中的眼睛、鼻子、颧骨等的位置、大小和/或形状),并且这些提取的特性可以与从一个或多个其他图像提取的对应特性相比较以验证或者标识面部。

已经通常使用全局地说明面部特性的基于通用机器学习的面部验证系统解决无约束环境中的人物标识。然而,为了增加面部识别的准确度,被存储在用于比较图像的数据库中的图像的数目需要是足够大的。然而,这样的技术导致图像中的主题的不太准确的表示,并且导致图像中的主题的不太准确或者不正确的标识和/或验证。



技术实现要素:

根据实施例,一种图像处理系统包括面部分类器,其被配置为接收输入图像,并且分析输入图像以确定至少一个特定特性。特征提取器被配置为:基于所确定的特定特性来接收多个数据集,其中多个数据集中的相应数据集包括图像对,其中每个对包含包括特定特性的一个图像和不包括特定特性的另一图像;以及生成对应于多个数据集的多个特征集,其中多个特征集中的相应特征集包括从多个数据集中的相应数据集提取的对应特征。特征比较器被配置为:从图像数据库接收多个图像;通过使用由特征提取器生成的多个特征集来将输入图像与来自图像数据库的多个图像相比较;以及输出指示输入图像与图像数据库中的多个图像之间的匹配的可能性的潜在匹配的排名。

在另一实施例中,一种有形非暂态计算机可读介质或者媒介,其存储机器可读指令,机器可读指令当由一个或多个处理器执行时,使得一个或多个处理器:接收输入图像;分析输入图像以确定至少一个特定特性;基于所确定的特定特性来接收多个数据集,其中多个数据集中的相应数据集包括图像对,其中每个对包含包括特定特性的一个图像和不包括特定特性的另一图像;生成对应于多个数据集的多个特征集,其中多个特征集中的相应数据集包括从多个数据集中的相应数据集提取的对应特征;从图像数据库接收多个图像;通过使用多个特征集来将输入图像与来自图像数据库的多个图像相比较;以及输出指示输入图像与图像数据库中的多个图像之间的匹配的可能性的潜在匹配的排名。

在又一实施例中,一种用于处理图像的方法,方法包括:接收输入图像;分析输入图像以确定至少一个特定特性;基于所确定的特定特性来接收多个数据集,其中多个数据集中的相应数据集包括图像对,其中每个对包含包括特定特性的一个图像和不包括特定特性的另一图像;生成对应于多个数据集的多个特征集,其中多个特征集中的相应特征集包括从多个数据集中的相应数据集提取的对应特征;从图像数据库接收多个图像;通过使用多个特征集将输入图像与来自图像数据库的多个图像相比较;以及输出指示输入图像与图像数据库中的多个图像之间的匹配的可能性的潜在匹配的排名。

附图说明

虽然所附的权利要求集阐述具有特殊性的本技术的特征,但是这些技术可以最好地结合其附图而从以下具体实施方式被理解:

图1是根据实施例的示例面部识别系统的块图。

图2是根据实施例的图示用于在图1的面部识别系统中处理图像的示例方法的流程图。

图3是根据另一实施例的图示用于图1的面部识别系统中的面部识别的示例方法的流程图。

图4是根据实施例的适于实现图1的面部识别系统的一个或多个部件的计算机系统的块图。

具体实施方式

以下讨论涉及各种示例性实施例。然而,本领域的普通技术人员将理解到,在此所公开的示例具有很宽的应用,并且任何实施例的讨论仅旨在是该实施例的示例,并且不旨在提出包括权利要求的本公开的范围限于该实施例。

某些术语贯穿以下描述被用于指代特定特征或者组分。如本领域的技术人员将理解到,不同的人物可以通过不同的姓名指代相同特征或者组分。附图不必按比例。在此某些特征和部件可以以比例或者稍微示意性形式放大示出并且常规元素的一些细节可以出于清晰和简洁而未被示出。

在下文所描述的各种实施例中,面部识别系统可以基于被包括在图像中的特定特性的比较来生成用于各个图像的标识/或验证决策。图1是根据实施例的示例面部识别系统100的块图。面部识别系统100包括特征提取器102和特征比较器104。特征提取器102接收对应于多个图像的多个数据集{xk}106,并且基于多个数据集{xk}106中的相应数据集来生成相应特征集{fk}110,其包括从多个数据集{xk}106中的不同数据集提取的对应特征。每个特征集{fk}110可以是数据结构(诸如向量),其包括指示从相应数据集{xk}提取的相应特征的多个元素。例如,多个特征集{fk}110中的相应特征集可以包括从相应图像提取的面部特征(诸如眼睛、鼻子、颧骨等的位置、大小和/或形状)的指示。特征提取器102可以在数据集{xk}106进行操作以将每个数据集x嵌入到相应特征集f,其包括基于数据集x生成的特征集。在实施例中,特征提取器102实现神经网络(诸如深度卷积神经网络(cnn)或者另一适合类型的神经网络)以将数据集x嵌入到对应的特征集f。在另一实施例中,特征提取器102实现除了cnn之外的适合的神经网络以将相应数据集x嵌入到对应的特征集f,或者实现除神经网络之外的适合的特征提取系统以将相应数据集x嵌入到对应的特征集f。

继续参考图1,特征提取器102经由面部分类器111接收输入图像。根据实施例,面部分类器111被配置为分析待验证的面部并且确定显性特性。根据又一实施例,在其中面部包括超过一个显性特性的情况下,面部分类器11组合一个或多个特定特性。面部识别系统100的特征提取器102采集将被验证的面部对的数据集——即,属于相同人物的两个面部。根据实施例,数据集利用展示特定显性特性(例如,年龄范围、疤痕、纹身、痣、种族、性别等)的面部的正例/负例对而被构建。面部识别系统使用特征集{fk}110构建暹罗(siamese)架构,其中针对待比较的两个图像中的每个图像;计算n维特征向量{fk}110。特征集{fk}110可以被提供到特征聚合器104。特征比较器104确定量化两个特征的相似性的损失函数。在以这种方式训练面部识别系统100之后,面部识别系统100能够利用服从描述两个面部来自相同人物的可能性的输出值的特定特性。

可以因此通过输入具有特定特性的面部对的数据集,针对每个特定特性来训练面部识别系统100。特征比较器104将输入图像与图像数据库108相比较以确定潜在匹配。更特别地,特征比较器104生成量化输入图像与图像数据库108中的图像的相似性的损失函数。根据实施例,多个数据集中的图像可以根据法律实施服务而被采集。根据另一实施例,可以从社交网站采集多个数据集108中的图像。本领域的技术人员将理解到,任何数目的源可以被用于获得多个数据集。

根据实施例,面部识别系统100输出类似于输入图像的潜在匹配的排名。面部识别系统100可以因此提供具有显著较高的准确度的结果,同时要求如果系统不针对特定特性训练则将以其他方式需要更小的数据集。此外,减少的数据集要求增加计算效率并且减少存储要求。

图2是根据实施例的用于面部识别系统中的面部识别的方法200的流程图。在实施例中,通过图1的面部识别系统100实现方法200。在实施例中,通过与图1的面部识别系统100不同的面部识别系统实现方法200。

在块202处,可以接收图像。图像可以被分析以确定在图像中存在的一个或多个特定特性。例如,特定特性可以是年龄范围、性别、种族、肤色、纹身或者疤痕中的一个或多个。本领域的技术人员将理解到,可以标识任何数目的特定特性。在块204处,可以接收多个数据集。在块204处,多个数据集中的相应数据集可以包括相同人物的面部对,其中该对中的一个包括特定特性并且该对中的另一个不包括特定特性。

在块206处,可以基于在块204处接收到的多个数据集生成多个特征集。在块206处生成的多个特征集中的相应特征集可以包括从相应数据集提取的特征。每个特征集可以是数据结构(诸如向量),其包括指示从相应数据集提取的相应特征的多个元素。

在块208处,特征向量可以被用于将输入图像与多个数据集相比较。更特别地,可以针对输入图像与图像数据库计算特征向量以确定潜在匹配。在块210处,可以输出指示输入图像匹配图像数据库中的图像之一的可能性的潜在匹配的排名。

图3是根据实施例的用于面部识别系统中的面部识别的方法300的流程图。在实施例中,通过图1的面部识别系统100实现方法300。在实施例中,通过与图1的面部识别系统100不同的面部识别系统实现方法300。

在块302处,可以接收未知的面部。在块304处,通用分类器可以分析未知的面部以确定在面部中存在的一个或多个显性特性。例如,显性特性可以是年龄范围、性别、种族、肤色、纹身或者疤痕中的一个或多个。本领域的技术人员将理解到,可以标识任何数目的显性特性。通用分类器可以包括面部的大型语料库并且将未知的面部与该数据集相比较以确定显性特性。

在块306处,可以接收多个数据集。在块306处,多个数据集中的相应数据集可以包括相同人物的面部对,其中该对中的一个包括显性特性并且该对中的另一个不包括显性特性。此外,在块306处,可以基于多个接收到的数据集来训练特定分类器。

在块308处,经训练的特定分类器被用于将输入图像与图像数据库相比较以确定潜在匹配。在块310处,可以输出指示输入图像匹配图像数据库中的图像之一的可能性的潜在匹配的排名。

图4是适于实现本公开的一个或多个实施例的计算系统400的块图。在其最基本配置中,计算系统400可以包括至少一个处理器402和至少一个存储器404。计算设备400还可以包括用于在计算机系统400的各种部件之间传递信息数据、信号和信息的总线(未示出)或者其他通信机构。部件可以包括输入部件404,其处理用户动作(诸如从小键盘/键盘选择键、选择一个或多个按钮或者链路等)并且向至少一个处理器402发送对应的信号。部件还可以包括输出部件(诸如显示器411),其可以显示例如由至少一个处理器402所执行的操作的结果。收发器或者网络接口406可以在计算机系统400与其他设备(诸如可以利用由计算机系统400实现的过程的结果的用户设备)之间发送和接收信号。在一个实施例中,传输是无线的,但是其他传输介质和方法也可以是适合的。

至少一个处理器402(其可以是微控制器、数字信号处理器(dsp)或者其他处理部件)处理这些各种信号,诸如用于在计算机系统400上显示或者经由通信链路传输到其他设备。至少一个处理器402还可以控制将信息(诸如cookies或者ip地址)传输到其他设备。至少一个处理器402可以执行被存储在存储器404中的计算机可读指令。计算机可读指令当由至少一个处理器402执行时可以使得至少一个处理器402基于多个图像来实现与主题的图像处理和/或识别相关联的过程。

计算机系统400的部件还可以包括至少一个静态存储部件416(例如,rom)和/或至少一个磁盘驱动器417。计算机系统400可以通过执行被包含在系统存储器部件414中的指令的一个或多个序列来通过处理器412和其他部件执行特定操作。逻辑可以被编码在计算机可读介质中,其可以指代参与向至少一个处理器402提供指令以用于执行的任何介质。这样的介质可以采取许多形式,包括但不限于非暂态介质、非易失性介质、易失性介质和传输介质。在各种实现中,非易失性介质包括光盘或者磁盘,易失性介质包括动态存储器(诸如系统存储器部件414),并且传输介质包括同轴电缆、铜线和光纤。在一个实施例中,逻辑被编码在非暂态计算机可读介质中。在一个示例中,传输介质可以采取声波或者光波的形式(诸如在无线电波、光和红外数据通信期间生成的那些)。

计算机可读介质的一些常见形式包括例如软磁盘、软盘、硬盘、磁带、任何其他磁性介质、cd-rom、任何其他光学介质、打孔卡、纸带、具有孔的图案的任何其他物理介质、ram、prom、eeprom、flash-eeprom、任何其他存储器芯片或者磁带盒、计算机适于从其读取的任何其他介质。

在本公开的各种实施例中,可以通过计算机系统400执行实践本公开的指令序列的执行。在本公开的各种其他实施例中,由通信链路418耦合到网络(例如,诸如lan、wlan、ptsn和/或各种其他有线或无线网络,包括电信、移动和蜂窝电话网络)的多个计算机系统400可以执行指令序列以彼此协调执行本公开。

在适用的情况下,可以使用硬件、软件、或者硬件和软件的组合实现由本公开提供的各种实施例。而且,在适用的情况下,在不脱离本公开的精神的情况下,在此阐述的各种硬件部件和/或软件部件可以组合为包括软件、硬件和/或两者的复合部件。在适用的情况下,在不脱离本公开的范围的情况下,在此阐述的各种硬件部件和/或软件部件可以被分离为包括软件、硬件或两者的子部件。另外,在适用的情况下,应预期到,软件部件可以被实现为硬件部件并且反之亦然。

根据本公开,软件(诸如程序代码和/或数据)可以被存储在一个或多个计算机可读介质上。还应预期到,可以使用一个或多个通用或专用计算机和/或计算机系统、联网和/或以其他方式实现在此所标识的软件。在适用的情况下,在此所描述的各种步骤的排序可以被改变、被组合为复合步骤和/或被分离为子步骤以提供在此所描述的特征。

虽然在“模块”或者“部件”方面在此已经描述面部识别系统的各种操作,但是应注意到,该方面不限于单个单元或者功能。而且,归因于在此所描述的模块或者部件中的一些的功能可以被组合并且归因于较少的模块或者部件。更进一步地,虽然已经参考特定示例描述本发明,但是这些示例旨在仅是说明性的,并且不旨在限制本发明。对于本领域的普通技术人员而言将明显的是,在不脱离本发明的精神和范围的情况下,可以对所公开的实施例做出改变、添加或者删除。例如,上文所描述的方法的一个或多个部分可以以不同的次序(或者并行地)执行并且仍然实现期望的结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1