人脸聚类方法、装置、系统和存储介质与流程

文档序号：16036988发布日期：2018-11-24 10:09阅读：265来源：国知局

本发明涉及人脸聚类技术领域，更具体地涉及一种人脸聚类方法、装置、系统和存储介质。

背景技术

目前很多场景下会用到人脸聚类，比如手机相册，通过人脸聚类的方法可以把同一人的人脸图像聚到一个组里面。

现有的人脸聚类方法通常直接针对需要聚类的图像进行人脸聚类，缺乏针对性的人脸聚类策略，使得人脸聚类的方式不灵活、准确度低、效率也低下。此外，现有的人脸聚类方法在定位出人脸后采用全量比对特征值的方式去比对，进一步降低了聚类效率。

技术实现要素：

本发明提出了一种人脸聚类方案，其首先基于待聚类图像的数量确定聚类方式，然后基于确定好的聚类方式对待聚类图像进行适当的分批人脸聚类，可以实现自定义的人脸聚类策略，实现灵活且高效的人脸聚类。下面简要描述本发明提出的人脸聚类方案，更多细节将在后续结合附图在具体实施方式中加以描述。

根据本发明一方面，提供了一种人脸聚类方法，所述方法包括：基于待聚类图像的数量确定聚类方式，所述聚类方式描述每次从所述待聚类图像中获取多少张图像进行一次人脸聚类；以及基于所述确定的聚类方式每次从所述待聚类图像中获取相应数量的图像进行人脸聚类，直到所述待聚类图像全部聚类完成。

在一个实施例中，除首次人脸聚类之外，每次的人脸聚类均结合前次的人脸聚类的结果来进行，其中：前次的人脸聚类的结果包括前次的人脸聚类后形成的已聚类图像组，所述已聚类图像组包括各个聚类中每一聚类的所有图像；对前次的人脸聚类的结果的结合包括结合所述已聚类图像组的子集，所述子集中的所述每一聚类包括一张图像。

在一个实施例中，所述子集中的所述每一聚类包括该聚类中人脸质量最好的一张图像。

在一个实施例中，所述人脸聚类是基于对获取的图像进行人脸检测得到的人脸相关信息，所述人脸相关信息包括代表不同人脸的人脸标识以及每个人脸的人脸特征值。

在一个实施例中，对所述已聚类图像组的子集的结合包括：基于本次获取的图像的人脸特征值对所述本次获取的图像进行人脸聚类，得到本次获取的图像的内部聚类结果；将所述内部聚类结果中每一聚类的人脸质量最好的代表图像的人脸特征值与所述子集中图像的人脸特征值进行匹配；如果未从所述子集中找到匹配结果，则将所述代表图像作为新聚类保存在所述子集中；以及如果从所述子集中找到匹配结果，则确定所述代表图像的人脸质量是否高于所找到的匹配结果的人脸质量，如果是，则采用所述代表图像替换所述匹配结果保存在所述子集中以用于下一次的人脸聚类。

在一个实施例中，所述人脸质量的判断指标包括以下中的至少一项：人脸模糊度、人脸角度、人脸大小以及人脸位置，所述判断指标是基于对获取的图像进行人脸检测时获得的人脸相关信息而得到。

在一个实施例中，所述基于待聚类图像的数量确定聚类方式包括：如果所述待聚类图像的数量小于等于第一阈值，则确定每次获取第一数量的图像进行一次人脸聚类；如果所述待聚类图像的数量大于所述第一阈值且小于等于第二阈值，则确定每次获取第二数量的图像进行一次人脸聚类；以及如果所述待聚类图像的数量大于所述第二阈值，则确定每次获取第三数量的图像进行一次人脸聚类。

根据本发明另一方面，提供了一种人脸聚类装置，所述装置包括：确定模块，用于基于待聚类图像的数量确定聚类方式，所述聚类方式描述每次从所述待聚类图像中获取多少张图像进行一次人脸聚类；以及聚类模块，用于基于所述确定模块确定的聚类方式每次从所述待聚类图像中获取相应数量的图像进行人脸聚类，直到所述待聚类图像全部聚类完成。

在一个实施例中，所述聚类模块进一步用于：除首次人脸聚类之外，每次的人脸聚类均结合前次的人脸聚类的结果来进行，其中：前次的人脸聚类的结果包括前次的人脸聚类后形成的已聚类图像组，所述已聚类图像组包括各个聚类中每一聚类的所有图像；对前次的人脸聚类的结果的结合包括结合所述已聚类图像组的子集，所述子集中的所述每一聚类包括一张图像。

在一个实施例中，所述子集中的所述每一聚类包括该聚类中人脸质量最好的一张图像。

在一个实施例中，所述聚类模块实施的所述人脸聚类是基于对获取的图像进行人脸检测得到的人脸相关信息，所述人脸相关信息包括代表不同人脸的人脸标识以及每个人脸的人脸特征值。

在一个实施例中，所述聚类模块对所述已聚类图像组的子集的结合包括：基于本次获取的图像的人脸特征值对所述本次获取的图像进行人脸聚类，得到本次获取的图像的内部聚类结果；将所述内部聚类结果中每一聚类的人脸质量最好的代表图像的人脸特征值与所述子集中图像的人脸特征值进行匹配；如果未从所述子集中找到匹配结果，则将所述代表图像作为新聚类保存在所述子集中；以及如果从所述子集中找到匹配结果，则确定所述代表图像的人脸质量是否高于所找到的匹配结果的人脸质量，如果是，则采用所述代表图像替换所述匹配结果保存在所述子集中以用于下一次的人脸聚类。

在一个实施例中，所述确定模块基于待聚类图像的数量确定聚类方式包括：如果所述待聚类图像的数量小于等于第一阈值，则确定每次获取第一数量的图像进行一次人脸聚类；如果所述待聚类图像的数量大于所述第一阈值且小于等于第二阈值，则确定每次获取第二数量的图像进行一次人脸聚类；以及如果所述待聚类图像的数量大于所述第二阈值，则确定每次获取第三数量的图像进行一次人脸聚类。

根据本发明又一方面，提供了一种人脸聚类系统，所述系统包括存储装置和处理器，所述存储装置上存储有由所述处理器运行的计算机程序，所述计算机程序在被所述处理器运行时执行上述任一项所述的人脸聚类方法。

根据本发明再一方面，提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序在运行时执行上述任一项所述的人脸聚类方法。

根据本发明实施例的人脸聚类方法、装置、系统和存储介质首先基于待聚类图像的数量确定聚类方式，然后基于确定好的聚类方式对待聚类图像进行适当的分批人脸聚类，可以实现自定义的人脸聚类策略，实现灵活且高效的人脸聚类。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1示出用于实现根据本发明实施例的人脸聚类方法、装置、系统和存储介质的示例电子设备的示意性框图；

图2示出根据本发明实施例的人脸聚类方法的示意性流程图；

图3示出根据本发明实施例的人脸聚类装置的示意性框图；以及

图4示出根据本发明实施例的人脸聚类系统的示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

首先，参照图1来描述用于实现本发明实施例的人脸聚类方法、装置、系统和存储介质的示例电子设备100。

如图1所示，电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106以及输出装置108，这些组件通过总线系统110和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

示例性地，用于实现根据本发明实施例的人脸聚类方法和装置的示例电子设备可以被实现诸如智能手机、平板电脑等等移动终端。

下面，将参考图2描述根据本发明实施例的人脸聚类方法200。如图2所示，人脸聚类方法200可以包括如下步骤：

在步骤s210，基于待聚类图像的数量确定聚类方式，所述聚类方式描述每次从所述待聚类图像中获取多少张图像进行一次人脸聚类。

在本发明的实施例中，可以根据需要聚类的图像的量级自定义相应的聚类策略，以提高人脸聚类的效率。其中，聚类策略可以理解为针对不同数量的待聚类图像采用不同的聚类方式，聚类方式描述每次从待聚类图像中获取多少张图像进行一次人脸聚类。

示例性地，如果所述待聚类图像的数量小于等于第一阈值，则确定每次获取第一数量的图像进行一次人脸聚类；如果所述待聚类图像的数量大于所述第一阈值且小于等于第二阈值，则确定每次获取第二数量的图像进行一次人脸聚类；以及如果所述待聚类图像的数量大于所述第二阈值，则确定每次获取第三数量的图像进行一次人脸聚类。

例如，如果存在10张待聚类的图像，可以每次获取1张图像进行一次人脸聚类；如果存在100张待聚类的图像，可以每次获取4张图像进行一次人脸聚类；如果存在1000张待聚类的图像，可以每次获取10张图像进行一次人脸聚类；如果存在2000张待聚类的图像，可以每次获取50张图像进行一次人脸聚类；诸如此类。

在上述示例中，当存在100张待聚类的图像时，如果按照现有的人脸聚类方法，则需将这100张待聚类的图像进行1:1的比对，效率很低。而根据本发明的实施例，当存在100张待聚类的图像时，采用每4张进行一次人脸聚类的方式，将这100张图像分成25组，后面的组无需和前面的组中的所有图像相比对，而仅需要比对前面的组中的一张或几张图像即可，因为前面的组的聚类结果已经产生，如果不是互不成一类的话，需要比对的图像的数量必然减少，因为针对同一聚类的只需比对一张即可。因此，将待聚类的图像按照一定的聚类方式分批进行人脸聚类可以有效提高人脸聚类的效率。

基于确定好的聚类方式，可以对待聚类图像进行人脸聚类。下面继续参考图2，描述人脸聚类方法200后续的步骤。

在步骤s220，基于所述确定的聚类方式每次从所述待聚类图像中获取相应数量的图像进行人脸聚类，直到所述待聚类图像全部聚类完成。

基于在步骤s210中所确定的聚类方式，可以每次从待聚类图像中获取相应数量的图像进行人脸聚类。此处，相应数量是指所确定的聚类方式所描述的每次应从待聚类图像中获取的图像数量。例如，如果在步骤s210中确定每次需要从待聚类图像中获取10张图像进行一次人脸聚类，则在步骤s220中可以每次获取10张图像进行人脸检测，获取这10张图像的人脸相关信息，以用于进行人脸聚类。

示例性地，所述人脸相关信息可以包括代表不同人脸的人脸标识以及每个人脸的人脸特征值。其中，人脸标识可以理解为人脸id，在一张图像中，如果存在多个人脸，则每个人脸的id是不同的。每个人脸的人脸特征值则可用于人脸聚类时的比对匹配，下文中将详细描述到。

在本发明的实施例中，在根据所确定的聚类方式分批分次对待聚类图像进行人脸聚类时，除首次人脸聚类之外，每次的人脸聚类可以均结合前次的人脸聚类的结果来进行，其中：前次的人脸聚类的结果包括前次的人脸聚类后形成的已聚类图像组，所述已聚类图像组包括各个聚类中每一聚类的所有图像；对前次的人脸聚类的结果的结合包括结合所述已聚类图像组的子集，所述子集中的所述每一聚类包括一张图像。其中，对所述已聚类图像组的子集的结合可以包括：基于本次获取的图像的人脸特征值对所述本次获取的图像进行人脸聚类，得到本次获取的图像的内部聚类结果；将所述内部聚类结果中每一聚类的人脸质量最好的代表图像的人脸特征值与所述子集中图像的人脸特征值进行匹配；如果未从所述子集中找到匹配结果，则将所述代表图像作为新聚类保存在所述子集中；以及如果从所述子集中找到匹配结果，则确定所述代表图像的人脸质量是否高于所找到的匹配结果的人脸质量，如果是，则采用所述代表图像替换所述匹配结果保存在所述子集中以用于下一次的人脸聚类。

例如，可以针对首次人脸聚类的结果形成已聚类图像组，此时所述已聚类图像组显示了首次获取的一批图像的聚类结果。例如，首次获取的10张图像的聚类结果是这10张图像中有6张图像包括人物a，有3张图像包括人物b，还有一张图像包括人物c，则首次人脸聚类后形成的已聚类图像组可以包括3个聚类，分别代表人物a、b和c，其中人物a的聚类包括6张图像，人物b的聚类包括3张图像，人物c的聚类包括1张图像。然后，可基于已聚类图像组形成已聚类图像组的子集，以用于第二次人脸聚类时结合使用。示例性地，已聚类图像组的子集可以包括3个聚类，分别代表人物a、b和c，其中人物a的聚类、人物b的聚类以及人物c的聚类均各自包括1张图像(例如子集中代表人物a的图像是从上述6张图像中选择的人脸质量最好的一张，子集中代表人物b的图像是从上述3张图像中选择的人脸质量最好的一张)。也就是说，在第二次的人脸聚类时，如果出现了人物a，则可将人物a的人脸特征值与已聚类图像组的子集中关于人脸a的1张图像的人脸特征值进行比对即可获得匹配结果，而无需比对6张，从而可大大提高效率。此外，在第二次的人脸聚类时，可以先在第二次获取的10张图像内部进行聚类，比如在多张图像中出现了人物a，则可将人脸质量最好的一张图像作为代表图像与已聚类图像组的子集中的图像比对，从而可进一步提高聚类效率。在得到第二次的人脸聚类结果后，可以更新前述的已聚类图像组，也就是将第二次的人脸聚类结果反映在已聚类图像组中(可能是针对某已存在的聚类添加了新的图像，也可能是添加了新的聚类所包括的图像)；基于更新后的已聚类图像组，可以按照前述的方式形成该更新后已聚类图像组的子集，以用于下一次的人脸聚类。同样地，在第三次人脸聚类时，也是和第二次人脸聚类的过程类似。以此类推，直到所有待聚类图像完成聚类。

此外，如果在前一次的已聚类图像组的子集中没有找到匹配结果，表明出现了新的人物，则可将该新人物的代表图像(即本次获取的图像中包括该新人物的质量最好的一张图像，如果仅有1张包括该新人物的图像则就采用这一张)作为新聚类保存在已聚类图像组的子集中。反之，如果在前一次的已聚类图像组的子集中找到了匹配结果，表明之前的聚类结果中包含此人，则可确定该人物的代表图像(即本次获取的图像中包括该人物的质量最好的一张图像，如果仅有1张包括该人物的图像则就采用这一张)的人脸质量是否比子集中找到的匹配结果的人脸质量更好，如果是，则采用该代表图像替换子集中的匹配图像，反之则不进行该替换操作。基于上述操作，已聚类图像组的子集中所包括的各聚类的代表图像的质量越来越好，对于后续人脸聚类的准确度的提升将起到巨大的促进作用。

在上述的示例中，人脸质量的判断指标可以包括以下中的至少一项：人脸模糊度、人脸角度、人脸大小以及人脸位置。这些指标项可以单独或结合使用。例如，前述的人脸质量最好可以表示人脸模糊度最低。再如，前述的人脸质量最好可以表示人脸角度在预定范围且人脸模糊度最低等等。这些判断指标可以基于对获取的图像进行人脸检测时获得的人脸相关信息而得到，例如在前述的对获取的图像进行人脸检测得到人脸相关信息时同时得到这些判断指标，这些判断指标也可包括在人脸检测得到的人脸相关信息中。

在上述的示例中，在进行人脸聚类时可能出现没有人脸的图像的情况，此时将这样的图像丢弃或者放入专门的无人脸图像集合中即可。对于已聚类图像组和已聚类图像组的子集，也可以采用两个结构体单元来存储。例如，可以采用高速缓存(cache)结构体单元来存储已聚类图像组，即存储所有包含人脸的图像，或仅存储这些图像的人脸信息；可以采用块(block)结构体单元来存储已聚类图像组的子集，即存储各聚类的仅一张人脸图像，或仅存储这些图像的人脸信息。这些结构体单元所存储的图像可以表示为包括各种变量的结构体。该结构体除了可以包括前述的人脸标识、人脸特征值这两个变量以外，还可以包括该图像中某人脸的聚类分组号、人脸的坐标、人脸模糊度、人脸的角度、未被聚类的原因等。其中，可以采用0来表示未被聚类的分组号，因某些原因未被聚类的图像也可以与前述获取的图像一起参与人脸聚类。

另外，在实施上述人脸聚类方法的过程中，如果还存在先前的人脸聚类结果，可将其从物理存储介质中读取到内存中来参与人脸聚类；此外，每次获取的图像的人脸相关信息、未被聚类的图像的信息可以都存储在内存中，便于提高运算速度。

基于上面的描述，根据本发明实施例的人脸聚类方法首先基于待聚类图像的数量确定聚类方式，然后基于确定好的聚类方式对待聚类图像进行适当的分批人脸聚类，可以实现自定义的人脸聚类策略，实现灵活且高效的人脸聚类。

以上示例性地描述了根据本发明实施例的人脸聚类方法。示例性地，根据本发明实施例的人脸聚类方法可以在具有存储器和处理器的设备、装置或者系统中实现。

此外，根据本发明实施例的人脸聚类方法可以方便地部署到智能手机、平板电脑、个人计算机等移动设备上。替代地，根据本发明实施例的人脸聚类方法还可以部署在服务器端(或云端)。替代地，根据本发明实施例的人脸聚类方法还可以分布地部署在服务器端(或云端)和个人终端处。

下面结合图3描述本发明另一方面提供的人脸聚类装置。图3示出了根据本发明实施例的人脸聚类装置300的示意性框图。

如图3所示，根据本发明实施例的人脸聚类装置300包括确定模块310和聚类模块320。所述各个模块可分别执行上文中结合图2描述的人脸聚类方法的各个步骤/功能。以下仅对人脸聚类装置300的各模块的主要功能进行描述，而省略以上已经描述过的细节内容。

确定模块310用于基于待聚类图像的数量确定聚类方式，所述聚类方式描述每次从所述待聚类图像中获取多少张图像进行一次人脸聚类。聚类模块320用于基于所述确定模块确定的聚类方式每次从所述待聚类图像中获取相应数量的图像进行人脸聚类，直到所述待聚类图像全部聚类完成。确定模块310和聚类模块320均可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

示例性地，如果所述待聚类图像的数量小于等于第一阈值，则确定模块310确定每次获取第一数量的图像进行一次人脸聚类；如果所述待聚类图像的数量大于所述第一阈值且小于等于第二阈值，则确定模块310确定每次获取第二数量的图像进行一次人脸聚类；以及如果所述待聚类图像的数量大于所述第二阈值，则确定模块310确定每次获取第三数量的图像进行一次人脸聚类。

例如，如果存在10张待聚类的图像，确定模块310可以确定聚类模块320每次获取1张图像进行一次人脸聚类；如果存在100张待聚类的图像，确定模块310可以确定聚类模块320每次获取4张图像进行一次人脸聚类；如果存在1000张待聚类的图像，确定模块310可以确定聚类模块320每次获取10张图像进行一次人脸聚类；如果存在2000张待聚类的图像，确定模块310可以确定聚类模块320每次获取50张图像进行一次人脸聚类；诸如此类。

在上述示例中，当存在100张待聚类的图像时，如果按照现有的人脸聚类方式，则聚类模块320需将这100张待聚类的图像进行1:1的比对，效率很低。而根据本发明的实施例，当存在100张待聚类的图像时，聚类模块320采用每4张进行一次人脸聚类的方式，将这100张图像分成25组，后面的组无需和前面的组中的所有图像相比对，而仅需要比对前面的组中的一张或几张图像即可，因为前面的组的聚类结果已经产生，如果不是互不成一类的话，需要比对的图像的数量必然减少，因为针对同一聚类的只需比对一张即可。因此，将待聚类的图像按照一定的聚类方式分批进行人脸聚类可以有效提高人脸聚类的效率。

基于确定模块310所确定的聚类方式，聚类模块320可以每次从待聚类图像中获取相应数量的图像进行人脸聚类。此处，相应数量是指确定模块310所确定的聚类方式所描述的聚类模块320每次应从待聚类图像中获取的图像数量。例如，如果确定模块310确定每次需要从待聚类图像中获取10张图像进行一次人脸聚类，则聚类模块320可以每次获取10张图像进行人脸检测，获取这10张图像的人脸相关信息，以用于进行人脸聚类。

在本发明的实施例中，在聚类模块320根据确定模块310所确定的聚类方式分批分次对待聚类图像进行人脸聚类时，除首次人脸聚类之外，每次的人脸聚类可以均结合前次的人脸聚类的结果来进行，其中：前次的人脸聚类的结果包括前次的人脸聚类后形成的已聚类图像组，所述已聚类图像组包括各个聚类中每一聚类的所有图像；对前次的人脸聚类的结果的结合包括结合所述已聚类图像组的子集，所述子集中的所述每一聚类包括一张图像。其中，对所述已聚类图像组的子集的结合可以包括：基于本次获取的图像的人脸特征值对所述本次获取的图像进行人脸聚类，得到本次获取的图像的内部聚类结果；将所述内部聚类结果中每一聚类的人脸质量最好的代表图像的人脸特征值与所述子集中图像的人脸特征值进行匹配；如果未从所述子集中找到匹配结果，则将所述代表图像作为新聚类保存在所述子集中；以及如果从所述子集中找到匹配结果，则确定所述代表图像的人脸质量是否高于所找到的匹配结果的人脸质量，如果是，则采用所述代表图像替换所述匹配结果保存在所述子集中以用于下一次的人脸聚类。可以结合前文参考图2描述的示例理解聚类模块320的具体操作，为了简洁，此处不再赘述。

在上述的实施例中，人脸质量的判断指标可以包括以下中的至少一项：人脸模糊度、人脸角度、人脸大小以及人脸位置。这些指标项可以单独或结合使用。例如，前述的人脸质量最好可以表示人脸模糊度最低。再如，前述的人脸质量最好可以表示人脸角度在预定范围且人脸模糊度最低等等。这些判断指标可以基于对获取的图像进行人脸检测时获得的人脸相关信息而得到，例如在前述的对获取的图像进行人脸检测得到人脸相关信息时同时得到这些判断指标，这些判断指标也可包括在人脸检测得到的人脸相关信息中。

基于上面的描述，根据本发明实施例的人脸聚类装置首先基于待聚类图像的数量确定聚类方式，然后基于确定好的聚类方式对待聚类图像进行适当的分批人脸聚类，可以实现自定义的人脸聚类策略，实现灵活且高效的人脸聚类。

图4示出了根据本发明实施例的人脸聚类系统400的示意性框图。人脸聚类系统400包括存储装置410以及处理器420。

其中，存储装置410存储用于实现根据本发明实施例的人脸聚类方法中的相应步骤的程序代码。处理器420用于运行存储装置410中存储的程序代码，以执行根据本发明实施例的人脸聚类方法的相应步骤，并且用于实现根据本发明实施例的人脸聚类装置中的相应模块。

在一个实施例中，在所述程序代码被处理器420运行时使得人脸聚类系统400执行以下步骤：基于待聚类图像的数量确定聚类方式，所述聚类方式描述每次从所述待聚类图像中获取多少张图像进行一次人脸聚类；以及基于所述确定的聚类方式每次从所述待聚类图像中获取相应数量的图像进行人脸聚类，直到所述待聚类图像全部聚类完成。

在一个实施例中，在所述程序代码被处理器420运行时使得人脸聚类系统400执行的人脸聚类除首次人脸聚类之外，每次的人脸聚类均结合前次的人脸聚类的结果来进行，其中：前次的人脸聚类的结果包括前次的人脸聚类后形成的已聚类图像组，所述已聚类图像组包括各个聚类中每一聚类的所有图像；对前次的人脸聚类的结果的结合包括结合所述已聚类图像组的子集，所述子集中的所述每一聚类包括一张图像。

在一个实施例中，所述子集中的所述每一聚类包括该聚类中人脸质量最好的一张图像。

在一个实施例中，在所述程序代码被处理器420运行时使得人脸聚类系统400执行的所述人脸聚类是基于对获取的图像进行人脸检测得到的人脸相关信息，所述人脸相关信息包括代表不同人脸的人脸标识以及每个人脸的人脸特征值。

在一个实施例中，在所述程序代码被处理器420运行时使得人脸聚类系统400执行的对所述已聚类图像组的子集的结合包括：基于本次获取的图像的人脸特征值对所述本次获取的图像进行人脸聚类，得到本次获取的图像的内部聚类结果；将所述内部聚类结果中每一聚类的人脸质量最好的代表图像的人脸特征值与所述子集中图像的人脸特征值进行匹配；如果未从所述子集中找到匹配结果，则将所述代表图像作为新聚类保存在所述子集中；以及如果从所述子集中找到匹配结果，则确定所述代表图像的人脸质量是否高于所找到的匹配结果的人脸质量，如果是，则采用所述代表图像替换所述匹配结果保存在所述子集中以用于下一次的人脸聚类。

在一个实施例中，在所述程序代码被处理器420运行时使得人脸聚类系统400执行的所述基于待聚类图像的数量确定聚类方式包括：如果所述待聚类图像的数量小于等于第一阈值，则确定每次获取第一数量的图像进行一次人脸聚类；如果所述待聚类图像的数量大于所述第一阈值且小于等于第二阈值，则确定每次获取第二数量的图像进行一次人脸聚类；以及如果所述待聚类图像的数量大于所述第二阈值，则确定每次获取第三数量的图像进行一次人脸聚类。

此外，根据本发明实施例，还提供了一种存储介质，在所述存储介质上存储了程序指令，在所述程序指令被计算机或处理器运行时用于执行本发明实施例的人脸聚类方法的相应步骤，并且用于实现根据本发明实施例的人脸聚类装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(rom)、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。

在一个实施例中，所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的人脸聚类装置的各个功能模块，并且/或者可以执行根据本发明实施例的人脸聚类方法。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行以下步骤：基于待聚类图像的数量确定聚类方式，所述聚类方式描述每次从所述待聚类图像中获取多少张图像进行一次人脸聚类；以及基于所述确定的聚类方式每次从所述待聚类图像中获取相应数量的图像进行人脸聚类，直到所述待聚类图像全部聚类完成。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的人脸聚类除首次人脸聚类之外，每次的人脸聚类均结合前次的人脸聚类的结果来进行，其中：前次的人脸聚类的结果包括前次的人脸聚类后形成的已聚类图像组，所述已聚类图像组包括各个聚类中每一聚类的所有图像；对前次的人脸聚类的结果的结合包括结合所述已聚类图像组的子集，所述子集中的所述每一聚类包括一张图像。

在一个实施例中，所述子集中的所述每一聚类包括该聚类中人脸质量最好的一张图像。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的所述人脸聚类是基于对获取的图像进行人脸检测得到的人脸相关信息，所述人脸相关信息包括代表不同人脸的人脸标识以及每个人脸的人脸特征值。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的对所述已聚类图像组的子集的结合包括：基于本次获取的图像的人脸特征值对所述本次获取的图像进行人脸聚类，得到本次获取的图像的内部聚类结果；将所述内部聚类结果中每一聚类的人脸质量最好的代表图像的人脸特征值与所述子集中图像的人脸特征值进行匹配；如果未从所述子集中找到匹配结果，则将所述代表图像作为新聚类保存在所述子集中；以及如果从所述子集中找到匹配结果，则确定所述代表图像的人脸质量是否高于所找到的匹配结果的人脸质量，如果是，则采用所述代表图像替换所述匹配结果保存在所述子集中以用于下一次的人脸聚类。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行的所述基于待聚类图像的数量确定聚类方式包括：如果所述待聚类图像的数量小于等于第一阈值，则确定每次获取第一数量的图像进行一次人脸聚类；如果所述待聚类图像的数量大于所述第一阈值且小于等于第二阈值，则确定每次获取第二数量的图像进行一次人脸聚类；以及如果所述待聚类图像的数量大于所述第二阈值，则确定每次获取第三数量的图像进行一次人脸聚类。

根据本发明实施例的人脸聚类装置中的各模块可以通过根据本发明实施例的人脸聚类电子设备的处理器运行在存储器中存储的计算机程序指令来实现，或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。

尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢建涛
技术所有人：北京旷视科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。