一种基于人像识别的人口数据清理方法

文档序号:6519680阅读:374来源:国知局
一种基于人像识别的人口数据清理方法
【专利摘要】本发明公开一种基于人像识别的人口数据清理方法,包括以下步骤:获取入库人员的图像,从中提取对应的人像特征数据,根据入库人员的信息和人像特征数据建立对应的模板数据,其中入库人员的信息包括年龄、性别、地区中的至少一项;根据入库人员的信息将其对应的模板数据存储在对应的人员分库中;在单机大数据量比对时,将待比对人员的模板数据根据计算机的CPU内核数平均分组,每组对应一个内核,每组的平均模板数为N,N为自然数,按照设定条件进行设定特征的相互比对,在比对时首先每组按照公式N×(N﹣1)÷2进行组内比对,然后进行各组间模板数据的交叉比对,设定条件包括相似度和返回结果数。
【专利说明】一种基于人像识别的人口数据清理方法
【技术领域】
[0001]本发明涉及人口管理领域,具体而言,涉及一种基于人像识别的人口数据清理方法。
【背景技术】
[0002]人口管理是我国社会管理的基础,公民身份的唯一性、准确性、权威性涉及国家各层面的安全。由于历史原因,各地人口管理工作中存在的数据问题较多,尽管公安部开展了多次全国性的重号清理等户籍整顿工作,但由于缺乏有效的手段,深层次问题如冒领、骗领、重复办证等问题难以及时发现。一些不法分子利用这些管理上的漏洞,编造虚假身份信息从事不法行为或通过假冒信息躲避法律制裁,严重干扰了法律秩序,威胁着公众安全。根据各地实际应用经验,人像识别技术应用于以二代证照片为基础人像源的查重比对,可以有效遏制冒用身份犯罪,具有很高的安全性与广泛的适用性,能够发挥巨大的实战效果。2011年5月,公安部开展全国范围的“清网行动”以来,人像识别技术逐渐成为公安部及各地公安机关逃犯抓捕、案件侦破的利器。
[0003]人像识别技术,也叫人脸识别技术,是一种利用分析比较人脸视觉特征信息进行身份鉴别的生物特征识别技术。该技术具有特征数据量小、识别速度快、识别准确率高、拒识率低、甄别简便、使用条件简单等特点,是一种灵活、简便、易于被人接受的非侵犯性身份识别方法,在当前社会公共安全防范、逃犯追捕、金融安全、网络安全等诸多领域发挥着重要的作用,被广泛应用于公安、交通、海关、银行、计算机网络,产生了巨大的社会管理效应,对于维护国家安全和社会稳定、打击各类犯罪活动具有十分重大的意义。

【发明内容】

[0004]本发明提供一种基于人像识别的人口数据清理方法,用以提高人员核验的效率。
[0005]为达到上述目的,本发明提供了一种基于人像识别的人口数据清理方法,包括以下步骤:
[0006]获取入库人员的图像,从中提取对应的人像特征数据,根据入库人员的信息和人像特征数据建立对应的模板数据,其中入库人员的信息包括年龄、性别、地区中的至少一项;
[0007]根据入库人员的信息将其对应的模板数据存储在对应的人员分库中;
[0008]在单机大数据量比对时,将待比对人员的模板数据根据计算机的CPU内核数平均分组,每组对应一个内核,每组的平均模板数为N,N为自然数,按照设定条件进行设定特征的相互比对,在比对时首先每组按照公式NX (N -1)+2进行组内比对,然后进行各组间模板数据的交叉比对,设定条件包括相似度和返回结果数。
[0009]可选的,在多机大数据量查重比对时,将入库人员的模板数据按年龄、性别、地区中的至少一项平均分配到奇数比对服务器上,以多层嵌套的方式存储在各个服务器中按设定条件对入库人员的设定特征进行相互比对,所述设定条件包括相似度和返回结果数,然后通过[(N+1) + 2 -1]公式计算出每台比对服务器与几台其它比对服务器比对,在单机比对完后再与所计算出的其它比对服务器进行交叉比对,其中N代表比对服务器的台数,N为自然数。
[0010]可选的,设定特征为人像特征数据或身份证号。
[0011]可选的,上述人口数据清理方法还包括以下步骤:
[0012]在核查比对时,获取所要核验人员的图像,从中提取对应的人像特征数据,根据所要核验人员的信息和人像特征数据建立所要核验人员的模板数据,其中所要核验人员的信息包括年龄、性别、地区中的至少一项;
[0013]根据所要核验人员的信息设定比对条件,比对条件包括相似度和返回结果数;
[0014]根据比对条件将所要核验人员对应的人像特征数据在目标人口库中进行比对,并将比对结果展示给用户。
[0015]可选的,在建立入库人员的模板数据时,支持大批量数据多机并行建立模板数据,将大批量的入库人员的图像和信息数据平均分配到多个服务终端,各服务终端采用多线程技术实现任务的并行处理。
[0016]可选的,对于视频图像,通过截取视频图像建立模板数据,在建立模板数据时根据图像的清晰度、分辨率、以及是否具有遮挡对图像进行质量评价,对光照、姿态不佳及模糊图像进行逆向恢复图像信息,并根据所得数据对图像进行评价处理,标记对应的质量等级,质量等级与比对时设定条件中的相似度相关联。
[0017]可选的,对于建立模板数据失败的人像,提供用户界面接受用户手工建立模板数据。
【专利附图】

【附图说明】
[0018]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本发明一个实施例的基于人像识别的人口数据清理系统框架图;
[0020]图2为本发明一个实施例的基于人像识别的人口数据清理方法中的查重比对流程图;
[0021]图3为本发明一个实施例的基于人像识别的人口数据清理方法中的核查比对流程图;
[0022]图4为本发明一个实施例的多台比对服务器的交叉比对关系示意图。
【具体实施方式】
[0023]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0024]图1为本发明一个实施例的基于人像识别的人口数据清理系统框架图;如图所示,人口数据清理系统集Java EE技术与.Net技术之所长,采用C/S构架与B/S构架相结合的软件体系架构。平台以公安行业信息化标准规范为指导,以比对算法、负载均衡、分布式计算等底层核心技术为基础,充分考虑系统安全性、可靠性,构建高效、灵活、易扩展的人像比对支撑平台,实现了实时人像采集、自动特征提取、动态模板更新、快速人像比对、多维结果分析等核心功能。以人脸识别技术为核心,支持多种人脸图像采集方式,自动提取人脸特征进行比对,可应用于户籍历史数据清理整顿、人口业务办理中的身份信息核查验证,重点区域人员信息核实,特殊人员身份快速识别,在社会管理及公安安全防范领域发挥了重要作用。
[0025]基于人像识别的人口数据清理系统主要分为人像采集、建模、比对、处理、接口五部分:人像采集功能支持对多种业务照片数据源建立照片分库,支持对数据源新增、修改、删除的变更数据进行同步更新,支持手动导入一张或多张照片,支持视频中截取人像;建模功能支持大批量数据多机并行建模,将大批量数据平均分配到若干服务终端,各服务终端采用多线程技术实现任务的并行处理,有效的提高建模效率。对视频图像截取建模,建模时根据图像的清晰度、分辨率、以及是否具有遮挡等因素对照片进行质量评价,对光照、姿态不佳及模糊图像根据其具体问题,寻求产生的原因,逆向恢复图像信息,使得最大程度上获取所需的数据,再根据所得数据对图像进行评价处理,并标记质量等级,对于建模失败的人像提供手工建模功能;比对功能支持1:1比对即两张照片比对确认是否同一人,1:x单人一对几比对即一张照片与给出的几张照片比对,1:N比对即一张照片与选定的照片分库比对,X:N批量比对即提交一张照片分别与选定的照片分库比对,NA:NA库内查重比对即同一照片库进行比对查重,NA:NB库间查重比对即不同照片库间比对查重,重号比对即相同身份证号的照片进行交叉比对,标准视频文件人脸提取并比对,同步异步比对,支持对照片分库的动态新增数据进行动态增量式查重,以保证对入库数据的持续挖掘和清理,在批量比对中研发运用了两个公式(η*(n-1)/2、(η+1)/2-1)提高多机比对的效率;处理功能提供对比对结果的查询、验证、下发处理、统计等应用;接口功能提供了高效的人像比对接口,可以嵌入到任何公安系统中,协助公安在处理其他业务时方便的使用人像比对功能。
[0026]本发明充分结合了各种类型数据的采集与复杂照片的建模及多服务器大数据量的比对和简单高效的结果处理等多项优点,全面的完善人像比对中对虚假身份的核验清理。
[0027]其中人员核验流程包括:公安可分四步进行人员核验,第一步选择要核验的人员信息分库,常口分库还可以选择要核验的地区;第二步选择要核验的人员照片,如果自动建模失败可以手动定位建模;第三步设置与人员分库比对的条件:性别、年龄、相似度、返回结果数等,然后进行比对;第四步对比对结果进行核查处理,此流程方便快捷,有效的协助公安进行人员核验。
[0028]数据清理流程包括:公安可分五步进行数据清理,第一步创建人员类别,每个人员类别代表一种人员分库(如:常口分库、在逃分库等;第二步对创建的人员类别进行建模并生成模板分库,即在B/S部分配置人员类别信息,选择适当的模版类型,进而将系统库中的部分数据导入模版表从而建立模版分库;第三步选择要清理数据的方式(如:核查比对、查重比对、重号比对等)然后选择进行清理的人员类别,指定要参与比对的服务器进行比对;第四步对比对结果进行核查处理;第五步生成各种统计报表,此流程可以协助公安对各种人口数据进行清理整顿。
[0029]以下以查重比对和核查比对为例进行具体阐述。
[0030]图2为本发明一个实施例的基于人像识别的人口数据清理方法中的查重比对流程图;如图所示,查重比对包括以下步骤:
[0031]获取入库人员的图像,从中提取对应的人像特征数据,根据入库人员的信息和人像特征数据建立对应的模板数据,其中入库人员的信息包括年龄、性别、地区中的至少一项;
[0032]根据入库人员的信息将其对应的模板数据存储在对应的人员分库中;
[0033]在单机大数据量比对时,将待比对人员的模板数据根据计算机的CPU内核数平均分组,每组对应一个内核,每组的平均模板数为N,N为自然数,按照设定条件进行设定特征的相互比对,在比对时首先每组按照公式NX (N -1)+2进行组内比对,然后进行各组间模板数据的交叉比对,设定条件包括相似度和返回结果数。此方法可以确保了每台服务器上分配的数据量基本相同,所有比对服务器完成比对任务的时间相近。
[0034]其中,在多机大数据量查重比对时,将入库人员的模板数据按年龄、性别、地区中的至少一项平均分配到奇数比对服务器上,以多层嵌套的方式存储在各个服务器中按设定条件对入库人员的设定特征进行相互比对,设定条件包括相似度和返回结果数,然后通过[(N+l) + 2 -1]公式计算出每台比对服务器与几台其它比对服务器比对,在单机比对完后再与所计算出的其它比对服务器进行交叉比对,其中N代表比对服务器的台数,N为自然数。例如,在图4的实施例中,共有5台比对服务器,通过公式(N十1) + 2 -1可以计算出每台比对服务器要与其它的2台比对服务器进行比对,如I号服务器与2、3号服务器比对,2号服务器要与3、4号比对。此方法将高效逻辑比对与嵌套并发比对相结合,使每个线程同时比对结束并且无重复比对,可以将计算机性能利用到极限,精确快速地完成比对任务。
[0035]其中,上述设定特征可以为人像特征数据或身份证号。
[0036]图3为本发明一个实施例的基于人像识别的人口数据清理方法中的核查比对流程图;如图所示,核查比对包括以下步骤:在核查比对时,获取所要核验人员的图像,从中提取对应的人像特征数据,根据所要核验人员的信息和人像特征数据建立所要核验人员的模板数据,其中所要核验人员的信息包括年龄、性别、地区中的至少一项;根据所要核验人员的信息设定比对条件,比对条件包括相似度和返回结果数;根据比对条件将所要核验人员对应的人像特征数据在目标人口库中进行比对,并将比对结果展示给用户。
[0037]其中,在建立入库人员的模板数据时,支持大批量数据多机并行建立模板数据,将大批量的入库人员的图像和信息数据平均分配到多个服务终端,各服务终端采用多线程技术实现任务的并行处理。对于视频图像,通过截取视频图像建立模板数据,在建立模板数据时根据图像的清晰度、分辨率、以及是否具有遮挡对图像进行质量评价,对光照、姿态不佳及模糊图像进行逆向恢复图像信息,并根据所得数据对图像进行评价处理,标记对应的质量等级,质量等级与比对时设定条件中的相似度相关联。
[0038]本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
[0039]本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
[0040]最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
【权利要求】
1.一种基于人像识别的人口数据清理方法,其特征在于,包括以下步骤: 获取入库人员的图像,从中提取对应的人像特征数据,根据入库人员的信息和人像特征数据建立对应的模板数据,其中入库人员的信息包括年龄、性别、地区中的至少一项; 根据入库人员的信息将其对应的模板数据存储在对应的人员分库中; 在单机大数据量比对时,将待比对人员的模板数据根据计算机的CPU内核数平均分组,每组对应一个内核,每组的平均模板数为N,N为自然数,按照设定条件进行设定特征的相互比对,在比对时首先每组按照公式NX (N -1)+2进行组内比对,然后进行各组间模板数据的交叉比对,所述设定条件包括相似度和返回结果数。
2.根据权利要求1所述的人口数据清理方法,其特征在于,在多机大数据量查重比对时,将入库人员的模板数据按年龄、性别、地区中的至少一项平均分配到奇数比对服务器上,以多层嵌套的方式存储在各个服务器中按设定条件对入库人员的设定特征进行相互比对,所述设定条件包括相似度和返回结果数,然后通过[(N+ 1) + 2 -1]公式计算出每台比对服务器与几台其它比对服务器比对,在单机比对完后再与所计算出的其它比对服务器进行交叉比对,其中N代表比对服务器的台数,N为自然数。
3.根据权利要求1或2所述的人口数据清理方法,其特征在于,所述设定特征为人像特征数据或身份证号。
4.根据权利要求1或2所述的人口数据清理方法,其特征在于,还包括以下步骤: 在核查比对时,获取所要核验人员的图像,从中提取对应的人像特征数据,根据所要核验人员的信息和人像特征数据建立所要核验人员的模板数据,其中所要核验人员的信息包括年龄、性别、地区中的至少一项; 根据所要核验人员的信息设定比对条件,所述比对条件包括相似度和返回结果数; 根据所述比对条件将所要核验人员对应的人像特征数据在目标人口库中进行比对,并将比对结果展示给用户。
5.根据权利要求1或2所述的人口数据清理方法,其特征在于,在建立入库人员的模板数据时,支持大批量数据多机并行建立模板数据,将大批量的入库人员的图像和信息数据平均分配到多个服务终端,各服务终端采用多线程技术实现任务的并行处理。
6.根据权利要求1或2所述的人口数据清理方法,其特征在于,对于视频图像,通过截取视频图像建立模板数据,在建立模板数据时根据图像的清晰度、分辨率、以及是否具有遮挡对图像进行质量评价,对光照、姿态不佳及模糊图像进行逆向恢复图像信息,并根据所得数据对图像进行评价处理,标记对应的质量等级,所述质量等级与比对时所述设定条件中的相似度相关联。
7.根据权利要求6所述的人口数据清理方法,其特征在于,对于建立模板数据失败的人像,提供用户界面接受用户手工建立模板数据。
【文档编号】G06K9/64GK103810663SQ201310581202
【公开日】2014年5月21日 申请日期:2013年11月18日 优先权日:2013年11月18日
【发明者】汤滔, 张建光, 陶勇, 乔晓光, 邹继文 申请人:北京航天金盾科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1