人脸数据筛选方法、装置及电子设备与流程

文档序号:21782238发布日期:2020-08-07 20:12阅读:122来源:国知局
人脸数据筛选方法、装置及电子设备与流程

本发明涉及数据筛选技术领域,尤其是涉及一种人脸数据筛选方法、装置及电子设备。



背景技术:

当前,随着技术的进步和光学成像设备的广泛应用,人脸识别技术应用领域得到了极大拓展。在进行人脸识别任务时,其中的核心和关键点是人脸数据集。而人脸数据集会受到标签噪声的影响,因此需要对人脸数据集进行二次的清洗才能应用。现有技术中,通常采用人工标注法和自动获取置信度较高数据的方法对人脸数据集进行清洗,得到筛选数据。但是,人工标注法工作效率低,且筛选准确性受主观意识影响也较低;自动获取置信度较高数据的方法由于抛弃了低置信度的数据,造成筛选出的数据不准确。



技术实现要素:

本发明的目的在于提供了一种人脸数据筛选方法、装置及电子设备,可以有效提高人脸数据筛选效率和准确性。

第一方面,本发明提供了一种人脸数据筛选方法,其中,包括:

获取待处理的人脸数据;

基于图像相同归类法对所述人脸数据进行归类,将归类后的所述人脸数据与预设人员信息库进行比对,并将归类后的所述人脸数据中与所述人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据,人员信息库包括已知人脸数据,每个已知人脸数据都对应有人员活动信息;

基于所述预设人员信息库中人员活动信息,将所述筛选数据中人员的活动信息与所述预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果。

进一步的,所述获取待处理的人脸数据的步骤之前,还包括:

对所述待处理的人脸数据进行人脸检测,将检测失败的人脸数据进行去除;

对所述待处理的人脸数据进行人脸质量评估,将质量不合格的人脸数据进行去除。

进一步的,所述基于图像相同归类法对所述人脸数据进行归类,将归类后的所述人脸数据与预设人员信息库进行比对,并将归类后的所述人脸数据中与所述人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据的步骤,包括:

基于离线聚类法对所述人脸数据进行聚类分析,得到聚类数据;

将所述聚类数据中相同特征图像划分为相同类别;

将所述聚类数据中与预设人员信息库不同类别的数据进行去除,得到筛选数据。

进一步的,所述人员活动信息包括人员活动时间和区域,所述基于所述预设人员信息库中人员活动信息,将所述筛选数据中人员的活动信息与所述预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果的步骤,包括:

将所述筛选数据中与所述预设人员信息库中人员活动时间相同,且,人员活动区域不同的筛选数据进行去除,得到人脸数据筛选结果。

第二方面,本发明提供了一种人脸数据筛选装置,其中,包括:

数据获取单元,用于获取待处理的人脸数据;

图像去除单元,用于基于图像相同归类法对所述人脸数据进行归类,将归类后的所述人脸数据与预设人员信息库进行比对,并将归类后的所述人脸数据中与所述人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据,人员信息库包括已知人脸数据,每个已知人脸数据都对应有人员活动信息;

活动信息去除单元,用于基于所述预设人员信息库中人员活动信息,将所述筛选数据中人员的活动信息与所述预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果。

进一步的,所述数据获取单元还用于:

对所述待处理的人脸数据进行人脸检测,将检测失败的人脸数据进行去除;

对所述待处理的人脸数据进行人脸质量评估,将质量不合格的人脸数据进行去除。

进一步的,所述图像去除单元还用于:

基于离线聚类法对所述人脸数据进行聚类分析,得到聚类数据;

将所述聚类数据中相同特征图像划分为相同类别;

将所述聚类数据中与预设人员信息库不同类别的数据进行去除,得到筛选数据。

进一步的,所述活动信息去除单元还用于:

将所述筛选数据中与所述预设人员信息库中人员活动时间相同,且,人员活动区域不同的筛选数据进行去除,得到人脸数据筛选结果。

第三方面,本发明提供了一种电子设备,其中,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现第一方面所述的人脸数据筛选方法的步骤。

第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器运行时执行第一方面所述的人脸数据筛选方法的步骤。

本发明实施例带来了以下有益效果:

本发明提供了一种人脸数据筛选方法、装置及电子设备,该方法通过获取待处理的人脸数据;然后基于图像相同归类法对人脸数据进行归类,将归类后的人脸数据与预设人员信息库进行比对,并将归类后的人脸数据中与人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据,人员信息库包括已知人脸数据,每个已知人脸数据都对应有人员活动信息;最终基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果。在本实施例提供的上述方式中,通过图像相同归类法对获取的待处理人脸数据进行归类,将人脸数据与预设人员信息库不同类别的数据进行去除,得到筛选数据,然后再基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,进而得到人脸数据筛选结果,与现有技术的人工标注法工作效率低,且筛选准确性受主观意识影响;或者抛弃置信度低的数据而只选择置信度高的数据的方式相比,本申请提供的这种方式在对数据进行筛选时,是在所有人脸数据的基础上,从图像相同归类和人员活动信息对比的两个方面进行筛选的,筛选所用的数据较为全面且筛选过程合理可靠,有助于得到更真实有效的筛选结果,可以有效提高人脸数据筛选效率和准确性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的一种人脸数据筛选方法流程图;

图2为本发明实施例一提供的获取待处理的人脸数据方法流程图;

图3为本发明实施例二提供的一种人脸数据筛选装置示意图;

图4为本发明实施例供的电子设备的结构示意图。

图标:301-数据获取单元;302-图像去除单元;303-活动信息去除单元;400-处理器;401-存储器;402-总线;403-通信接口。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

考虑到现有技术中通常采用人工标注法和自动获取置信度较高数据的方法对人脸数据集进行清洗,但是,人工标注法工作效率低,且筛选准确性受主观意识影响也较低;或者自动获取置信度较高数据的方法由于抛弃了低置信度的数据,造成筛选出的数据不准确的问题。本发明提供了一种人脸数据筛选方法、装置及电子设备,该方法通过获取待处理的人脸数据;然后基于图像相同归类法对人脸数据进行归类,将归类后的人脸数据与预设人员信息库进行比对,并将归类后的人脸数据中与人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据,人员信息库包括已知人脸数据,每个已知人脸数据都对应有人员活动信息;最终基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果,有效提高了人脸数据筛选效率和准确性。

为便于对本实施例进行理解,首先对本发明实施例所公开的一种人脸数据筛选方法进行详细介绍。

实施例一:

参照图1所示的一种人脸数据筛选方法流程图,可以由诸如计算机、处理器等电子设备执行,该方法主要包括步骤s101至步骤s103:

步骤s101,获取待处理的人脸数据。

步骤s102,基于图像相同归类法对人脸数据进行归类,将归类后的人脸数据与预设人员信息库进行比对,并将归类后的人脸数据中与人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据。人员信息库包括已知人脸数据,每个已知人脸数据都对应有人员活动信息。

在一种具体的实施方式中,一种示例性的说明如下:预设人员信息库可以包括员工和园区人员底库,已知人脸数据为员工和园区人员的人脸数据,将归类后的人脸数据中的一类人脸数据的多张图像与员工和园区人员的人脸数据进行比对,当相同程度达到阈值时,则该类人脸数据是员工和园区人员底库中的分类,阈值可以设定为相同程度达到80%以上。

步骤s103,基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果。

在本实施例提供的上述方式中,通过图像相同归类法对获取的待处理人脸数据进行归类,将人脸数据与预设人员信息库不同类别的数据进行去除,得到筛选数据,然后再基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,进而得到人脸数据筛选结果,与现有技术的人工标注法工作效率低,且筛选准确性受主观意识影响;或者抛弃置信度低的数据而只选择置信度高的数据的方式相比,本申请提供的这种方式在对数据进行筛选时,是在所有人脸数据的基础上,从图像相同归类和人员活动信息对比的两个方面进行筛选的,筛选所用的数据较为全面且筛选过程合理可靠,有助于得到更真实有效的筛选结果,可以有效提高人脸数据筛选效率和准确性。

在具体实施时,参照图2所示的获取待处理的人脸数据方法流程图,获取待处理的人脸数据的步骤之前,还包括以下步骤s201~s202:

步骤s201,对待处理的人脸数据进行人脸检测,将检测失败的人脸数据进行去除。

步骤s202,对待处理的人脸数据进行人脸质量评估,将质量不合格的人脸数据进行去除。

在本实施例提供的上述方式中,可以对待处理的人脸数据进行预处理,提高筛选效率。

在具体实施时,基于图像相同归类法对所述人脸数据进行归类,将归类后的人脸数据与预设人员信息库进行比对,并将归类后的人脸数据中与人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据的步骤,包括以下步骤a~c:

步骤a,基于离线聚类法对所述人脸数据进行聚类分析,得到聚类数据。

步骤b,将聚类数据中相同特征图像划分为相同类别。

步骤c,将聚类数据中与预设人员信息库不同类别的数据进行去除,得到筛选数据。

在本实施例提供的上述方式中,可以去除不相同的特征图像,提高筛选准确性。

在具体实施时,人员活动信息包括人员活动时间和区域,基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果的步骤,包括:将筛选数据中与预设人员信息库中人员活动时间相同,且,人员活动区域不同的筛选数据进行去除,得到人脸数据筛选结果。

在一种具体的实施方式中,在判断筛选数据中人员的活动信息与预设人员信息库中人员活动信息是否相同时,可以根据某个人员,在某个时间出现在某个区域了,则不可能出现在该区域以外的其他区域的原则进行判断,将不符合该原则的数据进行去除。

在本实施例提供的上述方式中,可以将人员活动时间与区域不匹配的数据去除,提高筛选准确性。

实施例二:

参照图3所示的一种人脸数据筛选装置,该装置包括:

数据获取单元301,用于获取待处理的人脸数据。

图像去除单元302,用于基于图像相同归类法对人脸数据进行归类,将归类后的人脸数据与预设人员信息库进行比对,并将归类后的人脸数据中与人员信息库存储的已知人脸数据类别不同的数据进行去除,得到筛选数据,人员信息库包括已知人脸数据,每个已知人脸数据都对应有人员活动信息。

活动信息去除单元303,用于基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,得到人脸数据筛选结果。

在本实施例提供的上述装置中,通过图像相同归类法对获取的待处理人脸数据进行归类,将人脸数据与预设人员信息库不同类别的数据进行去除,得到筛选数据,然后再基于预设人员信息库中人员活动信息,将筛选数据中人员的活动信息与预设人员信息库中人员活动信息不同的筛选数据进行去除,进而得到人脸数据筛选结果,与现有技术的人工标注法工作效率低,且筛选准确性受主观意识影响;或者抛弃置信度低的数据而只选择置信度高的数据的方式相比,本申请提供的这种方式在对数据进行筛选时,是在所有人脸数据的基础上,从图像相同归类和人员活动信息对比的两个方面进行筛选的,筛选所用的数据较为全面且筛选过程合理可靠,有助于得到更真实有效的筛选结果,可以有效提高人脸数据筛选效率和准确性。

在具体实施时,数据获取单元301还用于:

对待处理的人脸数据进行人脸检测,将检测失败的人脸数据进行去除;

对待处理的人脸数据进行人脸质量评估,将质量不合格的人脸数据进行去除。

在具体实施时,图像去除单元302还用于:

基于离线聚类法对人脸数据进行聚类分析,得到聚类数据;

将聚类数据中相同特征图像划分为相同类别;

将聚类数据中与预设人员信息库不同类别的数据进行去除,得到筛选数据。

在具体实施时,活动信息去除单元303还用于:

将筛选数据中与预设人员信息库中人员活动时间相同,且,人员活动区域不同的筛选数据进行去除,得到人脸数据筛选结果。

本发明实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现实施例一人脸数据筛选方法的步骤。

图4为本发明实施例提供的一种电子设备的结构示意图,该电子设备包括:处理器400,存储器401,总线402和通信接口403,处理器400、通信接口403和存储器401通过总线402连接;处理器400用于执行存储器401中存储的可执行模块,例如计算机程序。

其中,存储器401可能包含高速随机存取存储器(ram,randomaccessmemory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个通信接口403(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。

总线402可以是isa总线、pci总线或eisa总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器401用于存储程序,所述处理器400在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器400中,或者由处理器400实现。

处理器400可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器400中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器400可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现成可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器401,处理器400读取存储器401中的信息,结合其硬件完成上述方法的步骤。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其中,计算机程序被处理器400运行时执行实施例一人脸数据筛选方法的步骤。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1