一种基于大数据的多源信息关联方法

文档序号:9274821阅读:876来源:国知局
一种基于大数据的多源信息关联方法
【技术领域】
[0001] 本发明涉及大数据技术领域,尤其涉及一种基于大数据的多源信息关联方法。
【背景技术】
[0002] 随着机器视觉、智能传感器、大数据等新技术的引入,安防监控系统逐步走向智能 化。对运动目标的检测、识别、跟踪、时空轨迹分析,已经成为安防监控行业需要解决的关键 问题之一。其中,对运动目标的身份识别是上述问题解决的基础,因为只有识别出目标的唯 一身份,才能基于目标汇总海量时空点数据,从而可以对目标的时空活动轨迹做进一步的 分析。
[0003] 从安防的运动目标来看,主要分成车和人。
[0004] 无论是基于监控视频图像数据、还是智能传感器数据,对车的身份识别技术相对 比较成熟。在智能交通系统中,智能卡口、电警等前端设备可以在各种背景环境下,较稳定 的提取出经过车辆的车牌、车型、车身颜色等各维度的数据。通过"车牌+车型"的组合识 另|J,系统可以实现对车辆的唯一身份识别。基于RFID等传感器设备,可以通过RFID阅读器, 捕获所经过车辆的唯一电子车牌的身份数据,从而可以实现对车辆的唯一身份识别。
[0005] 在基于视频图像数据对人员进行身份识别方面,目前主要采用的是人脸特征提取 与识别技术。该技术方案一般实现如下:在封闭场所的入口,部署人员卡口相机。该相机能 够自动捕获经过人员的人脸区域图片,并将图片发送到后台的人脸识别设备。人脸识别设 备通过人脸特征提取算法,从图片中提取出人脸的关键特征向量数据。然后,按照一定的匹 对算法,将该特征向量与所存储的海量人脸特征数据逐一进行匹对。
[0006] 如果匹对计算得到的置信度值达到阈值,则认为两张人脸图片很可能是同一目标 的人脸。
[0007] 安防领域的视频图像具有特殊性,气候条件不固定(晴天、雨天、雾霾天、雪天、大 风、风沙)、光照条件不固定(顺光、逆光、强光、雨天反光、阴影)、视频场景复杂多样(室 内、室外)、人脸种类繁多等等,很难找到一种很好的具有很强辨别力的模型,能够把不同类 别的人脸样本特征在特征空间中,完美的做聚类与划分。
[0008] 因此,基于人脸特征数据对人进行目标身份识别,应用范围有限,只能在某些背景 环境相对固定(出入口)、光照条件较好(白天)的场景下进行应用,尚无法推广到各种复 杂场景下。

【发明内容】

[0009] 有鉴于此,本发明提供一种基于大数据的多源信息关联方法和装置。该方法和装 置用于关联手机MAC地址和人脸。
[0010] 该基于大数据的多源信息关联方法包括:采集包含手机MAC地址和人脸的N个样 本,其中每一个样本的手机MAC地址和人脸在同一地点采集;从N个样本中筛选出出现次数 超过第一预设阈值的手机MAC地址集合;针对集合中的每一个MAC地址,计算该MAC地址绑 定其所在M个样本中的每一组相同人脸的置信度R;如果该MAC地址绑定某一组相同人脸 的置信度大于第二预设阈值,且与该MAC地址绑定其他任何一组相同人脸的置信度的差大 于第三预设阈值,则该MAC地址绑定该某一组相同人脸成功;如果该MAC地址绑定任何一组 相同人脸的置信度均小于第四预设阈值,则该MAC地址绑定人脸失败;如果该MAC地址绑定 一组相同人脸的置信度和绑定另一组人脸的置信度相同或者差值小于第五预设阈值,则该 MAC地址绑定人脸失败。
[0011] 该基于大数据的多源信息关联装置包括:样本采集模块,用于采集包含手机MAC 地址和人脸的N个样本,其中每一个样本的手机MAC地址和人脸在同一地点采集;MAC地址 筛选模块,用于从N个样本中筛选出出现次数超过第一预设阈值的手机MAC地址集合;置信 度计算模块,用于针对集合中的每一个MAC地址,计算该MAC地址绑定其所在M个样本中的 每一组相同人脸的置信度R;绑定模块,用于如果该MAC地址绑定某一组相同人脸的置信度 大于第二预设阈值,且与该MAC地址绑定其他任何一组相同人脸的置信度的差大于第三预 设阈值,则该MAC地址绑定该某一组相同人脸成功;如果该MAC地址绑定任何一组相同人脸 的置信度均小于第四预设阈值,则该MAC地址绑定人脸失败;如果该MAC地址绑定一组相同 人脸的置信度和绑定另一组人脸的置信度相同或者差值小于第五预设阈值,则该MAC地址 绑定人脸失败。
[0012] 相较于现有技术,本发明的方案基于大数据的规律性定律,解决了视频监控系统 采集的人脸数据和WIFIAP采集的手机MAC地址两个炜度的人员身份数据对同一目标建立 绑定关系的问题。
【附图说明】
[0013] 图1是本发明实施例流程图。
[0014] 图2是数据采集区域示例图。
[0015] 图3是样本示例图。
[0016] 图4是本发明实施例装置逻辑结构图。
【具体实施方式】
[0017]目前,智能手机越来越普及,已经逐步成为了人们的必备物品。智能手机上一般安 装了微信、网上银行等与人员身份强绑定的服务软件,因此手机MAC地址可以逐步成为人 员身份的一种标识。
[0018] 在城市的某些地点(比如宾馆、咖啡店、机场等),免费WIFI已经成为一种比较普 遍的服务。
[0019] 利用智能手机自动扫描WIFI网络的特性,提供WIFI服务的AP可以自动获取到手 机MAC地址、手机与AP的距离等信息。利用这些数据,可以进一步得到人员活动的时空轨 迹。
[0020] 但是通过WIFIAP采集到的数据,只有手机MAC地址数据,与安防监控系统的海量 视频数据之间没有关联关系。既无法通过视频进行人员身份确认,同时也无法对人员的具 体行为进行分析,在安防监控领域的应用有限。
[0021] 本发明基于大数据的规律性定律,解决安防视频监控系统采集的人脸、WIFIAP采 集的手机MAC地址两个维度的人员身份数据对同一目标(人)建立绑定关系的问题。
[0022] 当对同一目标(人)建立多炜度的身份标识数据之后,后续只要能够采集到任一 炜度的数据,就可以认为目标在当前时空点出现,从而有效扩展人员定位的应用场景,为人 员时空轨迹分析打下更好的数据基础。以下通过具体实施例详细说明。
[0023] 实施例一
[0024] 请参图1所示的一种建立手机MAC地址和人脸绑定关系的流程图。
[0025]S11、在同一地点采集包含手机MAC地址和人脸的N个样本。
[0026] 为保障在同一地点尽可能完整的采集到同一目标(人)的人脸和手机MAC数据, 采集地点需要是封闭区域。在区域的出入口位置安装人脸卡口相机,这样只要人员进入该 区域,就能够采集到人脸。WIFI AP采集的手机MAC地址需要是进入该封闭区域的人员的手 机MAC地址,所以WIFI AP需要能够基于手机与AP的距离、AP与封闭区域边缘的大致距离 等进行数据过滤,只采集封闭区域内的手机MAC地址。采集地点最好是同一目标(人)频 繁出现的地点,比如小区、宾馆、咖啡店、博物馆、超市、银行等。
[0027] 请参图2给出一个数据采集区域示例图。圆形区域为WIFI AP的信号覆盖范围, 该范围内的智能手机全部能检测到。扇形区域为摄像机的数据采集范围,当人员进入该区 域时,相机就捕获进入该区域的人脸。
[0028] -个样本采集的例子如下:该样本是在一小区采集的数据,采集时间为下午5 点~8点进入小区的人的人脸数据和这些人的手机MAC地址,这些人脸数据和手机MAC地 址构成一个样本。连续采集N天,这样就得到N个样本。图3给出了一个样本的示例。
[0029]S12、从N个样本中筛选出出现次数超过第一预设阈值的手机MAC地址集合。
[0030] 比如说第一预设阈值可以设置为N/10,若N为1000,则第一预设阈值为100。当 MAC1出现在样本1、样本5、样本16、样本32等100个以上样本中时,MAC1被选出。通过该 步骤S12,可以筛选出若干个MAC地址。
[0031] S13、针对集合中的每一个MAC地址,计算该MAC地址绑定其所在M个样本中的每 一组相同人脸的置信度R。
[0032] 以MAC1为例,计算该MAC1绑定其所在M个样本中的一组相同人脸的置信度R包 括:1)获取该M个样本中的一组相同人脸各自的采集时间,计算每一个所述相同人脸采集 时间与同一样本中MAC1采集时间的差值T ;2)根据每一个差值T计算子置信度;3)置信度 R等于各子置信度的和。差值T越小,子置信度越大,置信度R越大。
[0033] 以表1给出的数据为例来说明置信度R的计算过程。请参表1,该表的第1列表示 MAC1出现的M个样本,该表的第2列表示样本包含的人脸。从该表可以看出,MAC1出现在 样本1、样本5、样本16......样本S这M个样本中;其中,样本1包含人脸1、人脸2、人脸3、 人脸4-...人脸nl;样本5包含人脸1、人脸4、人脸7、人脸8……人脸n2 ;样本16包含人 脸1、人脸3、人脸4、人脸19……人脸n3 ;样本S包含人脸1、人脸12、人脸19、人脸25…… 人脸ni。
[0034]
[0035] 表 1
[0036] 样本1中的人脸1、样本5中的人脸1、样本16中的
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1