基于数理统计建立身份识别信息关联关系的方法及系统与流程

文档序号:15205114发布日期:2018-08-21 07:48阅读:142来源:国知局

本发明涉及信息处理技术领域,尤其涉及基于数理统计建立身份识别信息关联关系的方法及系统。



背景技术:

随着科技的不断进步,对于身份识别特征数据的采集和获取变得快速便捷,例如业界可以通过旷视、百度及科大讯飞等成熟的免费开放接口,通过摄像头能在短时间内大规模、低成本地采集多个人物面部识别信息;而通过wifi探针等设备信息采集技术,能够在同一时间内大批量采集和捕获随身设备的mac信息;但在实际业务使用场景中,往往仍然存在着难以在海量信息中,快速获取识别身份信息并有效建立关联关系,使得巨量采集的身份识别信息在实际业务中产生实际作用的问题,各种人物特征信息成为各自的信息孤岛。

传统的解决方法通常是借助国家机构或者大型企业的数据库,通过数据库技术的查询和对比建立关联模型。但此方法存在以下不足:

1.国家机关的数据库往往涉及国家信息安全问题,不便对普通机构和民众开放,限制了民用商业的应用场景。

2.大型企业的数据库,又存在三方面问题:(1)数据库的对接费用较高,对于中小型企业来说存在对接门槛问题;(2)由于大型企业的数据量较多,也会涉及公共信息安全问题,因此对中小型企业开放也存在政策上的限制问题;(3)企业数据库匹配成功率还受企业本身的市场覆盖率限制,数据库不能达到全面、实时覆盖,从而影响匹配成功率。

因此,建立一种简单、便捷、实时的身份识别信息的关联方法应用于商业和公共安全领域具有积极的社会意义。



技术实现要素:

本发明的目的在于提出一种基于数理统计建立身份识别信息关联关系的方法,该方法具有低成本、不涉及公民隐私信息泄露,实施简单便捷的特点。

本发明的另一个目的在于提出一种基于数理统计建立身份识别信息关联关系的系统。

为达此目的,本发明采用以下技术方案:

基于数理统计建立身份识别信息关联关系的方法,包括如下步骤:

初始化,通过数理统计分析的方法,建立人的生物身份识别与人的随身设备身份信息的关联数据模型,其中,将人的生物身份识别特征作为身份识别维度a的信息,将人的随身设备特征作为身份识别维度b的信息;并设定某一人物的出现必然同时携带身份识别维度a和b的信息为高概率事件;

步骤1,在某一时间和地点采集人群的身份特征识别的数据,并在数据模型中标识为x场景数据,在此x场景中,同时采集身份识别维度a和身份识别维度b的信息;

步骤2,在另一个时间和地点采集群的身份特征识别的数据,并在数据模型中标识为y场景数据,在此y场景中,同时采集身份识别维度a和身份识别维度b的信息;

步骤3,当某一人物c均在x场景和y场景中出现,则在x场景中,通过人物c的身份识别维度a信息,搜索该x场景中身份识别维度b信息,得到身份识别维度b信息的有限集合,作为人物c的身份识别信息的待定有限集合j;

步骤4,在y场景中,通过人物c的身份识别维度a信息,搜索该场景y中身份识别维度b信息,得到身份识别维度b信息的有限集合,作为人物c的身份识别信息的待定有限集合k;

步骤5,将待定有限集合j和待定有限集合k的数据,进行数据集合交集运算,得到有限集合l;

步骤6,若集合l中元素的数量为1,则该集合l中的元素为人物c的身份识别维度b的信息的确定结果;若集合l的元素的数量>1或=0,则重复步骤1-5,并将集合l与重复步骤1-5后得到的新集合l’的结果进行交集运算,直至有限集合的元素数量为1或直至可选场景数据穷尽。本发明提出基于数理统计建立身份识别信息关联关系的方法,着力于解决各种身份识别信息采集的信息孤岛问题,主要通过基于集合理论和概率论的数理统计分析的方法,建立人的生物身份识别特征与随身设备身份特征的关联关系模型,能够对较长时间或空间间隔的多场景身份识别信息进行采集与分析,从而能够快速有效地在海量信息中,快速采集和获取识别身份信息并有效建立关联关系,该方法具有实施简单、成本低、不涉及公民隐私信息泄露、推广应用便捷、实时更新的特点,在商业民用以及社会公共安全方面具有较大的应用价值。

其中,本发明将人的随身设备特征和生物身份识别特征归并为身份识别维度信息,并通过建立关联关系后,均具备身份识别能力。将基于特定时间和空间采集的身份识别数据作为场景数据,将基于不同身份识别特征数据作为身份识别特征数据。

进一步说明,所述人的生物身份识别特征包括人脸信息、虹膜信息或指纹信息中的任意一种。

进一步说明,所述人的随身设备特征为通讯设备的mac信息。

进一步说明,当可选场景数据穷尽后未能得到有限集合的元素数量为1时,则集合l’中的元素作为人物c的身份识别维度b信息,并对各个元素置于置信度,该置信度的值为集合l’元素数量的倒数的百分比的运算。

进一步说明,所述某一人物的出现必然同时携带身份识别维度a和b的信息的概率为>99.9%。

一种基于数理统计建立身份识别信息关联关系的方法的系统,包括初始化模块、数据采集模块、数据关联模块、数据处理模块和数据输出模块;

所述初始化模块用于通过数理统计分析的方法,建立人的生物身份识别与人的随身设备身份信息的关联数据模型,其中,将人的生物身份识别特征作为身份识别维度a的信息,将人的随身设备特征作为身份识别维度b的信息;并设定某一人物的出现必然同时携带身份识别维度a和b的信息为高概率事件;

所述数据采集模块用于在某一时间和地点采集人群的身份特征识别的数据,并在数据模型中标识为x场景数据,在此x场景中,同时采集身份识别维度a和身份识别维度b的信息;还用于在另一个时间和地点采集群的身份特征识别的数据,并在数据模型中标识为y场景数据,在此y场景中,同时采集身份识别维度a和身份识别维度b的信息;

所述数据关联模块用于当某一人物c均在x场景和y场景中出现,则在x场景中,通过人物c的身份识别维度a信息,搜索该x场景中身份识别维度b信息,得到身份识别维度b信息的有限集合,作为人物c的身份识别信息的待定有限集合j;在y场景中,通过人物c的身份识别维度a信息,搜索该场景y中身份识别维度b信息,得到身份识别维度b信息的有限集合,作为人物c的身份识别信息的待定有限集合k;还用于将待定有限集合j和待定有限集合k的数据,进行数据集合交集运算,得到有限集合l;

所述数据输出模块用于当集合l中元素的数量为1时,则将该集合l中的元素为人物c的身份识别维度b的信息的确定结果;若集合l的元素的数量>1或=0,则重复步骤1-5,并将集合l与重复步骤1-5后得到的新集合l’的结果进行交集运算,直至有限集合的元素数量为1或直至可选场景数据穷尽。

进一步说明,所述数据输出模块还用于当可选场景数据穷尽后未能得到有限集合的元素数量为1时,则将集合l’中的元素作为人物c的身份识别维度b信息,并对各个元素置于置信度,该置信度的值为集合l’元素数量的倒数的百分比的运算。

本发明的有益效果:通过基于集合理论和概率论的数理统计分析的方法,建立人的生物身份识别特征与随身设备身份特征的关联关系模型,能够对较长时间或空间间隔的多场景身份识别信息进行采集与分析,从而能够快速有效地在海量信息中,快速采集和获取识别身份信息并有效建立关联关系,该方法具有实施简单、成本低、不涉及公民隐私信息泄露、推广应用便捷、实时更新的特点,在商业民用以及社会公共安全方面具有较大的应用价值。

附图说明

图1是本发明一个实施例的基于数理统计建立身份识别信息关联关系的方法的流程图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

具体应用举例-通过人脸信息(生物身份识别之一)确定其手机设备识别码(mac地址)。

应用背景介绍:mac地址作为随身设备——智能手机的识别码,可以作为身份信息的识别特征。公安机关铺设在各个治安管理关键出入口的基站卡口设备,能够实时大量收集手机mac地址信息。但是,仅有设备信息并不能完全确定具体个人的信息。公共安全视频监控联网应用,可通过摄像头获取大量的人脸图片,通过人脸识别技术得到大量的人脸信息。

本发明能够通过低成本、便捷地采集嫌疑人的人脸信息和海量的手机mac地址信息,并建立两者的关联关系后,可根据嫌疑人的人脸信息,确定其随身手机设备的信息,为进一步侦查案件提供有利线索,其实施步骤如下:

步骤1:选择在特定时间和地点,2018年1月1日广州火车南站采集数据,并在数据模型中标识为x场景数据,在此x场景中,同时采用公安摄像头拍摄人群人脸信息,得到人脸身份识别维度a的信息,采用公安wifi探针设备,采集手机mac地址,得到人群设备身份识别维度b的信息;

步骤2:选择在另一个特定时间和地点,2018年2月1日广州白云机场采集数据,并在数据模型中标识为y场景数据,在此y场景中,同时采用公安摄像头拍摄人脸信息,得到人脸身份识别维度a的信息,采用公安wifi探针设备,采集手机mac信息,得到人群设备身份识别维度b的信息;

步骤3:设定人物c的出现手机是其随身设备,与其"人脸"是同时出现是高概率事件,并通过数据检索,确定人物c均在2018年1月1日广州火车南站和2018年2月1日广州白云机场的场景中出现;

为确定人物c的手机信息,首先在在x场景中,通过人脸身份识别维度a信息的有限集合,搜索该x场景中人群设备身份识别维度b信息的有限集合;作为人物c的手机mac信息的待定有限集合j;

步骤4:在y场景中,通过人脸身份识别维度a信息的有限集合,搜索该y场景中人群设备身份识别维度b信息的有限集合;作为人物c的手机mac信息的待定有限集合k;

步骤5:通过集合运算,将待定有限集合j和待定有限集合k的数据,进行数据集合交集运算,得到有限集合l;

步骤6:若集合l中元素的数量为1,基于不是人物c,且与人物c没有强社会关系,并同时在多个间隔较长的(时间和地点)场景出现的事件为小概率事件,则该集合l中的唯一元素为人物c的手机mac信息的确定结果;并可以置于高可信度;

若集合l的元素的数量>1或=0,则可以与人物c其他记录场景中的手机信息集合取多次交集运算,即重复步骤1-5,并将集合l与重复步骤1-5后得到的新集合l’的结果进行交集运算,直至有限集合的元素数量为1,得出高置信度结果,其高置信度与交集运算次数成正比或直至可选场景数据穷尽,当可选场景数据穷尽后未能得到有限集合的元素数量为1时,则集合l’中的元素作为人物c的手机mac信息,并对各个元素置于置信度,该置信度的值为集合l’元素数量的倒数的百分比的运算;例如最后l结合的结果为3个手机mac信息,则可以认为3个手机mac为人物c的手机信息,置信度为33%,公安机关根据概率进行侧重调查。

本发明以人脸信息和手机设备信息的关联为例子,以公安侦测为应用场景举例,但是本发明的应用不应局限于此。例如人脸信息和其他可穿戴设备信息关联,虹膜身份识别信息和其他随身设备信息关联,应用场景亦可是民用商业各种精准营销场景。

以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1