人脸数据的采集方法、装置、计算机可读介质及系统与流程

文档序号：17131878发布日期：2019-03-16 01:22阅读：216来源：国知局

本发明实施例涉及人脸采集领域，尤其涉及一种人脸数据的采集方法、装置、计算机可读介质及系统。

背景技术：

由于人脸识别技术具有方便、安全等优点，越来越受到人们的青睐，对人脸识别技术的研究也越来越多。

在实际研究中，基于深度学习方法的人脸识别技术需要大量的训练数据。目前获取人脸训练数据的方法有两种方案：

1、通过互联网下载人脸数据，例如首先确定姓名信息等关键字，然后利用搜索引擎抓取相应的图片获得人脸数据。该方案的缺点是获得人脸数据可能包含不同年龄、不同装扮的数据，需要耗费大量的人力成本进行后期整理，尤其是美女明星长得都很相似，很难进行区分。

2、设置人脸采集的设施对真实的人脸数据进行采集，该方案的缺点是如果规模较小，采集的人脸数量较少，无法满足深度学习算法的需求，如果规模较大，成本太高。

技术实现要素：

本发明解决的技术问题是如何以较低的成本采集大规模的人脸数据。

为解决上述技术问题，本发明实施例提供一种人脸数据的采集方法，所述方法包括：获取包含人脸数据的视频文件；利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离，生成不同人脸标识对应的数据。

可选地，所述利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离，生成不同人脸标识对应的数据，包括：提取所述视频文件的第一帧作为当前帧；从所述当前帧，直至所述视频文件的倒数第二帧，迭代执行如下步骤：基于当前帧数据对应的人脸，生成新的人脸标识，所述新的人脸标识对应当前帧数据；利用人脸跟踪算法判断后一帧数据对应的人脸与当前帧数据对应的人脸是否为同一个，如果后一帧数据对应的人脸与当前帧数据对应的人脸为同一个，则将后一帧数据增加至所述新的人脸标识对应的数据中；如果后一帧数据对应的人脸与当前帧数据对应的人脸不一致，则提取后一帧作为更新后的所述当前帧。

可选地，所述人脸数据的采集方法，还包括：利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理，将识别算法识别为同一人脸的多个不同人脸标识对应的数据进行合并，生成合并后的不同人脸标识对应的数据。

可选地，所述人脸数据的采集方法，还包括：通过人工方式对合并后的不同人脸标识对应的数据进行审核，将属于同一人脸的多个不同人脸标识对应的数据进行合并，将同一个人脸标识对应的不同人脸的数据进行拆分，生成更新后的不同人脸标识对应的数据。

可选地，所述人脸数据的采集方法，还包括：采集特殊场合下的人员的人脸数据。

本发明实施例提供一种人脸数据的采集装置，包括：获取单元，适于获取包含人脸数据的视频文件；生成单元，适于利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离，生成不同人脸标识对应的数据。

可选地，所述生成单元，包括：提取子单元，适于提取所述视频文件的第一帧作为当前帧；迭代子单元，包括生成模块和判断模块，适于由生成模块和判断模块从所述当前帧，直至所述视频文件的倒数第二帧，迭代执行数据处理，其中：所述生成模块，适于基于当前帧数据对应的人脸，生成新的人脸标识，所述新的人脸标识对应当前帧数据；所述判断模块，适于利用人脸跟踪算法判断后一帧数据对应的人脸与当前帧数据对应的人脸是否为同一个，如果后一帧数据对应的人脸与当前帧数据对应的人脸为同一个，则将后一帧数据增加至所述新的人脸标识对应的数据中；如果后一帧数据对应的人脸与当前帧数据对应的人脸不一致，则提取后一帧作为更新后的所述当前帧。

可选地，所述人脸数据的采集装置还包括：第一识别单元，适于利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理，将识别算法识别为同一人脸的多个不同人脸标识对应的数据进行合并，生成合并后的不同人脸标识对应的数据。

可选地，所述人脸数据的采集装置还包括：第二识别单元，适于通过人工方式对合并后的不同人脸标识对应的数据进行审核，将属于同一人脸的多个不同人脸标识对应的数据进行合并，将同一个人脸标识对应的不同人脸的数据进行拆分，生成更新后的不同人脸标识对应的数据。

可选地，所述人脸数据的采集装置，还包括：采集单元，适于采集特殊场合下的人员的人脸数据。

本发明实施例提供一种计算机可读介质，其上存储有计算机指令，所述计算机指令运行时执行上述任一种所述方法对应的步骤。

本发明实施例提供一种采集系统，包括存储器和处理器，所述存储器上存储有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述任一种所述方法对应的步骤。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

本发明实施例通过利用人脸跟踪算法对视频文件中不同人脸对应的数据进行分离，生成不同人脸标识对应的数据。一方面，利用人脸跟踪算法对不同人脸对应的数据进行分离，成本较低，不需要耗费大量的人力成本进行后期整理；另一方面，通过直接从视频文件中提取出不同的人脸数据，可以实现大规模的采集，成本较低。

进一步地，通过采集特殊场景下的人员的人脸数据。例如，通过采集安检卡口身份证上的图片，不仅扩充了人脸数据的样本分布，也方便以后的数据整理。

附图说明

图1是本发明实施例提供的一种人脸数据的采集方法的流程图；

图2是本发明实施例提供的一种人脸数据的采集装置的示意图。

具体实施方式

目前获取人脸训练数据的方法有两种方案：1、通过互联网下载人脸数据，例如首先确定姓名信息等关键字，然后利用搜索引擎抓取相应的图片获得人脸数据。该方案的缺点是获得人脸数据可能包含不同年龄、不同装扮的数据，需要耗费大量的人力成本进行后期整理，尤其是美女明星长得都很相似，很难进行区分。2、设置人脸采集的设施对真实的人脸数据进行采集，该方案的缺点是如果规模较小，采集的人脸数量较少，无法满足深度学习算法的需求，如果规模较大，成本太高。

为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

参见图1，本发明实施例提供的一种人脸数据的采集方法包括如下步骤：

s101，获取包含人脸数据的视频文件。

在具体实施中，可以通过多种途径获取包含人脸数据的视频文件，例如，可以通过internet网络下载公开的允许使用的视频文件，也可以从正规渠道购买光盘获取视频文件，只要对所述视频文件的获取和使用合法，本发明实施例不做限制。

在具体实施中，可以获取一个包含人脸数据的视频文件，也可以获取多个包含人脸数据的视频文件，视频文件越多，生成的人脸数据越多，相应的处理也越多，可以根据实际需求选择合适的视频文件个数，本发明实施例不做限制。

s102，利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离，生成不同人脸标识对应的数据。

在具体实施中，由于视频文件中的人脸数据是连贯的，因此相邻帧的人脸相似度很高，而且姿势的分布也比较均匀，很容易进行跟踪。故可以利用人脸跟踪算法对所述视频文件前后帧的人脸进行跟踪，将同一个人脸对应的数据进行合并，不同人脸的数据进行分离，生成不同人脸标识对应的数据。

在本发明一实施例中，可以提取所述视频文件的第一帧作为当前帧，然后从所述当前帧，直至所述视频文件的倒数第二帧，迭代执行如下步骤：基于当前帧数据对应的人脸，生成新的人脸标识，所述新的人脸标识对应当前帧数据；利用人脸跟踪算法判断后一帧数据对应的人脸与当前帧数据对应的人脸是否为同一个，如果后一帧数据对应的人脸与当前帧数据对应的人脸为同一个，则将后一帧数据增加至所述新的人脸标识对应的数据中；如果后一帧数据对应的人脸与当前帧数据对应的人脸不一致，则提取后一帧作为更新后的所述当前帧。

在具体实施中，所述人脸标识可以为数字标识，例如0，1，2，…，也可以为字母标识，例如，a，b，c…，只要可以用来区分不同的人脸数据，均属于本发明实施例的保护范围。

在具体实施中，由于人脸跟踪算法只是针对视频文件中前后帧不同的人脸数据进行合并和分离，所以很有可能最后生成的多个人脸标识对应同一个人脸，故需要对同一个人脸对应的数据进行合并。

在本发明一实施例中，可以利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理，将识别算法识别为同一人脸的多个不同人脸标识对应的数据进行合并，生成合并后的不同人脸标识对应的数据。

在具体实施中，在利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理时，为了避免将不同人脸标识的数据识别为同一个人脸，可以设置较高的相似度阈值门限。

在具体实施中，对于人脸标识的合并，可以从多个人脸标识中随机选择一个，也可以选择保留第一个人脸标识，只要合并后的人脸标识可以区分其所对应的数据即可，本发明实施例不做限制。

在具体实施中，为了进一步提高人脸数据的准确性，可以通过人工方式对合并后的不同人脸标识对应的数据进行进一步审核，将属于同一个人脸标识的不同人脸的数据拆分，将不同人脸标识的属于同一个人脸的数据合并。

在本发明一实施例中，可以通过人工方式对合并后的不同人脸标识对应的数据进行审核，将属于同一人脸的多个不同人脸标识对应的数据进行合并，将同一个人脸标识对应的不同人脸的数据进行拆分，生成更新后的不同人脸标识对应的数据。

在具体实施中，对于人工审核后遗留的有疑问的数据，可以选择丢弃，也可以通过上述人脸识别算法和人工结合的方式进行重复处理，本发明实施例不做限制。

在具体实施中，可以通过多人合作，对多个视频文件进行采集，这样在短时间内就可以得到一个大规模的人脸数据集合。

在具体实施中，还可以采集特殊场景下的人员的人脸数据。例如，在安检卡口的应用场景，可以采集读卡器采集到的身份信息，比如身份证上的图片，不仅扩充了人脸数据的样本分布，也方便以后的数据整理。

在具体实施中，可以在特殊场景定期采集人员的人脸数据，并自动进行数据整理。

应用上述方案，一方面，利用人脸跟踪算法对不同人脸对应的数据进行分离，成本较低，不需要耗费大量的人力成本进行后期整理；另一方面，通过直接从视频文件中提取出不同的人脸数据，可以实现大规模的采集，成本较低。

为使本领域技术人员更好地理解和实现本发明，本发明实施例提供了能够实现上述人脸数据的采集方法对应的装置，如图2所示。

参见图2，本发明实施例提供了一种人脸数据的采集装置20，包括：获取单元21和生成单元22，其中：

所述获取单元21，适于获取包含人脸数据的视频文件。

所述生成单元22，适于利用人脸跟踪算法对所述视频文件中不同人脸对应的数据进行分离，生成不同人脸标识对应的数据。

在具体实施中，所述生成单元22包括：提取子单元221和迭代子单元222，其中：

所述提取子单元221，适于提取所述视频文件的第一帧作为当前帧。

所述迭代子单元222，包括生成模块(未示出)和判断模块(未示出)，适于由生成模块和判断模块从所述当前帧，直至所述视频文件的倒数第二帧，迭代执行数据处理，其中：

所述生成模块，适于基于当前帧数据对应的人脸，生成新的人脸标识，所述新的人脸标识对应当前帧数据。

所述判断模块，适于利用人脸跟踪算法判断后一帧数据对应的人脸与当前帧数据对应的人脸是否为同一个，如果后一帧数据对应的人脸与当前帧数据对应的人脸为同一个，则将后一帧数据增加至所述新的人脸标识对应的数据中；如果后一帧数据对应的人脸与当前帧数据对应的人脸不一致，则提取后一帧作为更新后的所述当前帧。

在具体实施中，所述人脸数据的采集装置20还可以包括：第一识别单元23，适于利用人脸识别算法对所述生成的不同人脸标识对应的数据进行处理，将识别算法识别为同一人脸的多个不同人脸标识对应的数据进行合并，生成合并后的不同人脸标识对应的数据。

在具体实施中，所述人脸数据的采集装置20还可以包括：第二识别单元24，适于通过人工方式对合并后的不同人脸标识对应的数据进行审核，将属于同一人脸的多个不同人脸标识对应的数据进行合并，将同一个人脸标识对应的不同人脸的数据进行拆分，生成更新后的不同人脸标识对应的数据。

在具体实施中，所述人脸数据的采集装置，还包括：采集单元(未示出)，适于采集特殊场合下的人员的人脸数据。

本发明实施例还提供一种计算机可读介质，其上存储有计算机指令，所述计算机指令运行时执行上述任一种实施例所述方法对应的步骤，此处不再赘述。

本发明实施例还提供一种采集系统，包括存储器和处理器，所述存储器上存储有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述任一种实施例所述方法对应的步骤，此处不再赘述。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵文忠;顾红旗
技术所有人：上海银晨智能识别科技有限公司
我是此专利的发明人

上一篇：一种采用喷涂形成AG膜层的制备方法与流程
上一篇：一种BGSFMC/CNFO多铁性复合薄膜及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。