一种数据关联方法及装置与流程

文档序号:19129003发布日期:2019-11-13 02:25阅读:192来源:国知局
一种数据关联方法及装置与流程

本申请涉及信息处理领域,尤其涉及一种数据关联方法及装置。



背景技术:

目前,通过大数据分析可以得到一些有价值的信息,其中,多种数据进行关联是大数据分析中的一种,因此,通过对多种数据进行关联可以得到有价值的信息,进而可以为用户的决策等提供依据。



技术实现要素:

本申请提供了一种数据关联方法及装置,目的在于确定wifi数据和人脸数据间的关联关系。

为了实现上述目的,本申请提供了以下技术方案:

本申请提供了一种数据关联方法,包括:

获取wifi数据和人脸数据;所述wifi数据包括:连接wifi网络的设备的mac地址;所述人脸数据包括:人脸图像;

将所述wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组;

计算每个wifi数据组包含的mac地址分别与所述人脸图像中各人脸间的匹配分值;所述匹配分值的大小,与所述mac地址所属的设备和所述人脸图像所属的人脸分别指示同一个人的程度成正相关;

对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址关联的人脸。

可选的,所述wifi数据组中任一条wifi数据还包括:该条wifi数据的产生时刻;任意一条所述人脸数据还包括:所述人脸图像的拍摄时刻。

可选的,确定任意一个wifi数据组包含的mac地址与所述人脸数据中的任意一个人脸间的匹配分值,包括:

从该人脸的人脸数据中,确定分别与该wifi数据组中的每条wifi数据间满足预设条件的人脸数据,作为与所述wifi数据关联的人脸数据组;对于任意一条wifi数据,所述预设条件包括:时刻属于预设时刻范围;所述预设时刻范围为以该条wifi数据的产生时刻为时间中点的前后预设时长构成的时刻范围;

分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值;

依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选的,任意一条所述wifi数据还包括:所述设备的位置;任意一条所述人脸数据还包括:所述人脸图像在被拍摄时的位置。

可选的,计算任意一条wifi数据和关联的人脸数据组间的匹配分值,包括:

计算该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值;其中,该条wifi数据和关联的人脸数据组中的任意一条人脸数据的匹配分值与差距成负相关;所述差距为第一距离和第二距离间的差值;所述第一距离为该条wifi数据中的位置与该条wifi数据所属的路由器间的距离;所述第二距离为该条人脸数据中的位置与该条wifi数据所属的路由器间的距离;

将该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值相加得到的值,作为该条wifi数据和关联的人脸数据组间的匹配分值。

可选的,在所述分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值之后,且在所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值之前,还包括:

从该wifi数据组中,确定属于不同路由器的wifi数据中重叠时间段的wifi数据为一组待处理wifi数据;

将所述待处理wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据;

确定所述排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值;任意一条wifi数据的匹配分值的权值与目标距离成负相关;所述目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离;

分别对每组待处理wifi数据的匹配分值进行加权和,任意一组待处理wifi数据的匹配分值进行加权和得到的数值为该组待处理wifi数据的匹配分值;

将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加;

所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值,包括:

将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选的,所述预设条件,还包括:位置属于预设位置范围;所述预设位置范围为:以该条wifi数据所属的路由器为中心,以预设距离为半径所形成的圆形区域;所述预设距离为所述路由器的信号覆盖的直线长度。

可选的,在所述获取wifi数据和人脸数据之后,且在所述将所述wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组之前,还包括:

将所述wifi数据和所述人脸数据中的位置,统一到预设的参考坐标系下,得到统一后的wifi数据和统一后的人脸数据;

从所述统一后的wifi数据中去除与数据关联不相关的数据和质量较差的数据,得到去除后的wifi数据;所述与数据关联不相关的数据为持续时长不属于预设时长范围的wifi数据;所述质量较差的数据为信号强度小于预设强度阈值的wifi数据;

将所述去除后的wifi数据的起始时刻、与所述起始时刻间的时长为第一预设时长的整数倍的时刻,以及所述去除后的wifi数据的结束时刻,作为wifi采样时刻;

将所述去除后的wifi数据中除所述wifi采样时刻的wifi数据外的wifi数据进行删除,得到预处理后的wifi数据;

将所述统一后的人脸数据中除预先指定人员的人脸数据之外的人脸数据进行删除,得到去除后的人脸数据;

将所述去除后的人脸数据的起始时刻、与所述起始时刻的时长为所述第二预设时长的整数倍的时刻,以及所述去除后的人脸数据的结束时刻为人脸采样时刻;

将所述去除后的人脸数据中除所述人脸采样时刻的人脸数据外的人脸数据进行删除,得到预处理后的人脸数据。

可选的,所述第一预设时长与所述第二预设时长相同且等于预设延时时长;所述预设延时时长为所述wifi数据的产生时刻与连接到路由器的时刻间的延时。

可选的,在所述对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值对应的人脸,作为与该mac地址关联的人脸之后,还包括:

在不同预设时间段内分别得到的与各个mac地址分别关联的人脸中存在相同的mac地址的情况下,确定与相同mac地址关联的人脸中重复出现的人脸,作为所述不同预设时间段内与所述相同mac地址关联的人脸。

本申请还提供了一种数据关联装置,包括:

获取模块,用于获取wifi数据和人脸数据;所述wifi数据包括:连接wifi网络的设备的mac地址;所述人脸数据包括:人脸图像;

分组模块,用于将所述wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组;

计算模块,用于计算每个wifi数据组包含的mac地址分别与所述人脸图像中各人脸间的匹配分值;所述匹配分值的大小,与所述mac地址所属的设备和所述人脸图像所属的人脸分别指示同一个人的程度成正相关;

排序模块,用于对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址关联的人脸。

可选的,所述分组模块分组所得的wifi数据组中任一条wifi数据还包括:该条wifi数据的产生时刻;所述获取模块获取的任意一条所述人脸数据还包括:所述人脸图像的拍摄时刻。

可选的,所述计算模块,用于确定任意一个wifi数据组包含的mac地址与所述人脸图像中的任意一个人脸间的匹配分值,包括:

所述计算模块,具体用于从该人脸的人脸数据中,确定分别与该wifi数据组中的每条wifi数据间满足预设条件的人脸数据,作为与所述wifi数据关联的人脸数据组;对于任意一条wifi数据,所述预设条件包括:时刻属于预设时刻范围;所述预设时刻范围为以该条wifi数据的产生时刻为时间中点的前后预设时长构成的时刻范围;

分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值;

依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选的,所述分组模块分组所得的wifi数据组中任一条wifi数据还包括:所述设备的位置;所述获取模块获取的任意一条所述人脸数据还包括:所述人脸图像在被拍摄时的位置。

可选的,用于计算任意一条wifi数据和关联的人脸数据组间的匹配分值,包括:

所述计算模块,具体用于计算该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值;其中,该条wifi数据和关联的人脸数据组中的任意一条人脸数据的匹配分值与差距成负相关;所述差距为第一距离和第二距离间的差值;所述第一距离为该条wifi数据中的位置与该条wifi数据所属的路由器间的距离;所述第二距离为该条人脸数据中的位置与该条wifi数据所属的路由器间的距离;

将该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值相加得到的值,作为该条wifi数据和关联的人脸数据组间的匹配分值。

可选的,还包括:

加权模块,用于在所述计算模块分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值之后,且在所述依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值之前,从该wifi数据组中,确定属于不同路由器的wifi数据中重叠时间段的wifi数据为一组待处理wifi数据;

将所述待处理wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据;

确定所述排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值;任意一条wifi数据的匹配分值的权值与目标距离成负相关;所述目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离;

分别对每组待处理wifi数据的匹配分值进行加权和,任意一组待处理wifi数据的匹配分值进行加权和得到的数值为该组待处理wifi数据的匹配分值;

将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加;

所述计算模块,用于依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值,包括:

所述计算模块,具体用于将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选的,所述预设条件,还包括:位置属于预设位置范围;所述预设位置范围为:以该条wifi数据所属的路由器为中心,以预设距离为半径所形成的圆形区域;所述预设距离为所述路由器的信号覆盖的直线长度。

可选的,还包括:

预处理模块,用于在所述获取模块获取wifi数据和人脸数据之后,且在所述分组模块将所述wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组之前,将所述wifi数据和所述人脸数据中的位置,统一到预设的参考坐标系下,得到统一后的wifi数据和统一后的人脸数据;

从所述统一后的wifi数据中去除与数据关联不相关的数据和质量较差的数据,得到去除后的wifi数据;所述与数据关联不相关的数据为持续时长不属于预设时长范围的wifi数据;所述质量较差的数据为信号强度小于预设强度阈值的wifi数据;

将所述去除后的wifi数据的起始时刻、与所述起始时刻间的时长为第一预设时长的整数倍的时刻,以及所述去除后的wifi数据的结束时刻,作为wifi采样时刻;

将所述去除后的wifi数据中除所述wifi采样时刻的wifi数据外的wifi数据进行删除,得到预处理后的wifi数据;

将所述统一后的人脸数据中除预先指定人员的人脸数据之外的人脸数据进行删除,得到去除后的人脸数据;

将所述去除后的人脸数据的起始时刻、与所述起始时刻的时长为所述第二预设时长的整数倍的时刻,以及所述去除后的人脸数据的结束时刻为人脸采样时刻;

将所述去除后的人脸数据中除所述人脸采样时刻的人脸数据外的人脸数据进行删除,得到预处理后的人脸数据。

可选的,所述第一预设时长与所述第二预设时长相同且等于预设延时时长;所述预设延时时长为所述wifi数据的产生时刻与连接到路由器的时刻间的延时。

可选的,还包括:

处理模块,用于在所述排序模块对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值对应的人脸,作为与该mac地址关联的人脸之后,在不同预设时间段内分别得到的与各个mac地址分别关联的人脸中存在相同的mac地址的情况下,确定与相同mac地址关联的人脸中重复出现的人脸,作为所述不同预设时间段内与所述相同mac地址关联的人脸。

本申请所述的数据关联方法及装置中,获取wifi数据和人脸数据,其中,wifi数据包括:连接wifi网络的设备的mac地址,人脸数据包括:人脸图像,将wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组,计算每个wifi数据组包含的mac地址分别与人脸数据中各人脸间的匹配分值,得到每个mac地址分别与各人脸间的匹配分值,对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址关联的人脸。

由于匹配分值的大小,与mac地址所属的设备与人脸图像所属的人脸分别指示同一个人的程度成正关联,因此,本方案确定出的与mac地址关联的人脸具有一定的准确性,因此,本申请提供了一种数据关联方案,并且,对mac地址和人脸进行关联得到的关联结果具有一定的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的一种数据关联方法的应用场景示意图;

图2为本申请实施例公开的一种数据关联方法的流程图;

图3为本申请实施例公开的一种数据关联装置的结构示意图。

具体实施方式

图1为本申请实施例提供的一种数据关联方法的应用场景示意图,包括:第一设备101、第二设备102和本申请实施例提供的数据关联装置103,其中,第一设备101用于提供wifi数据,第二设备102用于提供人脸数据,数据关联装置103用于确定第一设备101提供的wifi数据和第二设备102提供的人脸数据进行关联,匹配出属于同一个人的wifi数据和人脸数据。

本申请实施例中,第一设备提供的wifi数据和第二设备提供的人脸数据指:在指定场所内同一个预设空间产生的wifi数据和人脸数据。例如,指定场所为xx商场,指定场所内同一个预设空间可以为该xx商场内同一层产生的wifi数据和人脸数据。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图2为本申请实施例提供的一种数据关联方法,包括以下步骤:本实施例是以对指定场所产生的wifi数据和人脸数据为例进行介绍。

s201、获取wifi数据和人脸数据。

在本申请实施例中,wifi数据为各时刻下设备扫描到指定场所内的路由器,路由器产生的数据,其中,wifi数据具体包括:连接到wifi网络的设备的mac地址、路由器产生wifi数据的时刻、信号强度,以及位置。其中,设备可以为手机,本实施例不对设备的具体形式所限定,位置表示设备相对于扫描到的路由器的位置。例如,mac地址为a的设备扫描到商场二层中的路由器b,并且,依据该设备扫描到的信号强度可以确定出mac地址为a的设备与路由器b间的距离,由于路由器b在商场中的位置是已知的,因此,可以确定出mac地址为a的设备在商场中的位置为以路由器b为圆心以计算出的距离为半径所形成的圆边的附近区域。指定场所可以根据实际的业务场景设定,例如,设置为指定的商场。

具体的,可以通过wifi探针获取wifi数据。在本实施例中,将一个mac地址在一个时刻下的wifi数据称一条wifi数据。

人脸数据为指定场所内的各人物在各时刻下的位置,具体的,人脸数据包括:人脸图像、人脸图像的拍摄时刻和人脸图像中的人脸被拍摄到时在指定场所内的位置。

具体的,人脸数据的获取方式可以包括:通过从指定场所内安装的各个摄像头拍摄的视频流中,识别出人脸图像、以及人脸图像的拍摄时刻,并依据视频流中的图像进行三维重建,确定识别出的各人脸图像包含的人物在指定场所内的各时刻的位置,并将识别出的人脸图像、人脸图像的拍摄时刻,以及人脸图像包含的人物该拍摄时刻在指定场所内的位置组成人脸数据。

为了描述方便,在本实施例中,将一个人脸在一个时刻下的位置所构成的人脸数据称为一条人脸数据。

s202、将获取的wifi数据中的位置和人脸数据中的位置,统一到预设的参考坐标系下,得到统一后的wifi数据和统一后的人脸数据。

具体的,本步骤的实现过程为现有技术,这里不再赘述。

s203、对统一后的wifi数据和统一后的人脸数据分别进行预处理,得到预处理后的wifi数据和预处理后的人脸数据。

对统一后的wifi数据和统一后的人脸数据分别进行的预处理包括两个方面,分别为第一方面和第二方面。

其中,第一方面为:从统一后的wifi数据中去除与数据关联不相关的数据和质量较差的数据,得到去除后的wifi数据。从统一后的人脸数据中去除与数据关联不相关的数据,得到去除后的人脸数据。第二方面为:对去除后的人脸数据和去除后的wifi数据分别进行数据采样,得到预处理后的wifi数据和预处理后的人脸数据。

针对wifi数据:对统一后的wifi数据进行的第一方面的处理包括:从统一后的wifi数据中去除与数据关联不相关的数据包括:从统一后的wifi数据中去除持续时长不属于预设时长范围的wifi数据。从统一后的wifi数据中去除质量较差的数据包括:从统一后的wifi数据中去除信号强度小于预设强度阈值的wifi数据。

其中,预设时长范围由时长上限值和时长下限值构成,其中,时长上限值为用于区分指定人员和非指定人员的时长。还以指定场所为商场,顾客是与数据关联相关的人员(即指定人员)为例,由于顾客和非顾客(工作人员)在商场中的时长是不同的,因此,可以确定出一个用于区分工作人员和顾客的时长值作为时长上限值,例如,时长上限值可以为8小时。具体的,时长上限值的具体取值需要根据实际情况进行设定,本实施例不对时长上限值的具体取值作限定。

其中,时长下限值为用于区分wifi数据中mac地址所属的设备指示的人员是否为指定场所内的人员。还以指定场所为商场且顾客是指定人员为例,由于在路过商场且未进入商场的人员的设备也可能扫描到商场内的路由器,但是,路过商场且未进入商场的人员不是数据关联相关的人员(非指定人员)。并且,相对于商场内的人员,路过商场且未进入商场的人员的wifi数据持续的时长较短,因此,可以设置一个用于区分wifi数据中mac地址所属的设备指示的人员是否为商场内的人员的时长值作为时长下限值。例如,时长下限值为2分钟。

其中,信号强度小于预设强度阈值的wifi数据表示信号强度较差的wifi数据,具体的,预设强度阈值的取值可以为-90db,当然,预设强度阈值的具体取值需要根据实际情况进行设定,本实施例不对预设强度阈值的具体取值作限定。

针对人脸数据:在本步骤中,对统一后的人脸数据进行第一方面的处理包括:从人脸数据中去除预先指定人员的人脸数据外的人脸数据,其中,指定人员为实际的业务场景所需进行数据关联的人员。还以指定场所为商场为例,顾客是指定人员。

具体的,从统一后的人脸数据中去除指定人员的人脸数据外的人脸数据的过程包括:从统一后的人脸数据中识别出指定人员的人脸数据外的人脸数据,并将识别出的人脸数据进行删除。其中,从统一后的人脸数据中识别出指定人员的人脸数据外的人脸数据的过程可以包括:事先统计指定人员的人脸信息,从统一后的人脸数据中识别出已统计的人脸信息,进而得到统一后的人脸数据中除指定人员的人脸数据之外的人脸数据。当然,本实施例只是提供了一种从统一后的人脸数据中识别出除指定人员的人脸数据外的人脸数据的方式,在实际中,还可以通过其他方式,本实施例不对具体的识别方式作限定。

在得到去除后的wifi数据和去除后的人脸数据后,对去除后的wifi数据和去除后的人脸数据分别进行第二方面的处理,即分别进行数据采样,得到预处理后的人脸数据和预处理后的wifi数据。

在本实施例中,为了减少计算资源和提高计算效率,对去除后的人脸数据进行第二方面的处理,具体为对去除后的人脸数据进行采样。具体的采样过程包括:将去除后的人脸数据的起始时刻,与起始时刻的时长为第一预设时长的整数倍的时刻,以及结束时刻作为人脸采样时刻。将去除后的人脸数据中除人脸采样时刻的人脸数据外的人脸数据删除,得到预处理后的人脸数据。其中,第一预设时长的具体取值可以根据实际业务场景进行设置,本实施例不对第一预设时长的取值作限定。

对去除后的wifi数据进行第二方面的处理为对去除后的wifi数据进行数据采样。具体的,对去除后的wifi数据进行数据采样的过程包括:将去除后的wifi数据的起始时刻、与起始时刻间的时长为第二预设时长的整数倍的时刻,以及结束时刻作为wifi采样时刻,将去除后的wifi数据中除wifi采样时刻的wifi数据外的wifi数据删除,得到预处理后的wifi数据。其中,第二预设时长的具体取值需要根据具体的业务场景设定,本实施例不对第二预设时长的具体取值作限定。

在实际中,wifi数据的产生时刻与扫描到时刻(扫描产生wifi数据的路由器的时刻)间存在一定的延时,在本实施例中,基于延时设定一个延时时长,例如,延时时长为5s,当然,在实际中,预设延时时长还可以为其他取值,本实施例不对预设延时时长的具体取值作限定。在本实施例中,当第一预设时长与第二预设时长相同,并且,等于预设延时时长的情况下,基于预处理后的wifi数据和预处理后的人脸数据进行后续步骤,最终所得到的wifi数据和人脸数据的关联结果的准确性会得到提高。

需要说明的是,在实际中本步骤不是必须要执行的步骤。

s204、将wifi数据中同一个mac地址的wifi数据作为一组,得到wifi数据组。

可以对预处理后的wifi数据执行本步骤,也可以是统一后的wifi数据执行本步骤。

s205、计算每个wifi数据组包含的mac地址分别与人脸数据中各人脸间的匹配分值,得到每个mac地址分别与各人脸间的匹配分值。

在本步骤中,确定与每组wifi数据包含的mac地址分别与人脸数据中各人脸间的匹配分值的过程是相同的,为了描述方便,以任意一个wifi数据组和任意一个人脸为例,介绍确定该wifi数据组包含的mac地址与该人脸间的匹配分值的过程。具体包括步骤a1~步骤a5:

a1、确定与该wifi数据组中的每条wifi数据相匹配的人脸数据组。

在本步骤中,确定与每条wifi数据相关联的人脸数据组的过程是相同的,为了描述方便,以任意一条wifi数据为例,介绍从该人脸的人脸数据中确定与该条wifi数据关联的人脸数据组。具体的,从该人脸的人脸数据中确定满足预设条件的人脸数据为该条wifi关联的人脸数据组,其中,预设条件包括:产生时刻属于预设时刻范围。其中,预设时刻范围包括上限值和下限值,其中,上限值是以该条wifi数据的产生时刻为时间中点之前预设时长的时刻,下限值以该条wifi数据的产生时刻为时间中点之后预设时长的时刻。

针对任意一条wifi数据,通过本步骤确定出该人脸的人脸数据中满足预设条件的人脸数据组为该条wifi数据关联的人脸数据组。在本实施例中,需要判断该条wifi数据包含的mac地址所属的设备和确定出的人脸数据组包含的人脸是否分别指示同一个人。在实际中,有时该条wifi数据包含的mac地址所属的设备和关联的人脸数据组包含的人脸图像指示的人脸明显不是指示同一个人,如果按照以下步骤确定匹配分值是无意义的。例如,商场三楼的路由器产生的一条wifi数据和满足预设条件的人脸数据为商场一楼的一组人脸数据。

因此,在本步骤中,为了提高本实施例的计算效率,预设条件还包括:位置属于预设位置范围,具体的,预设位置范围包括:以该条wifi数据所属的路由器为中心,以预设距离为半径所形成的圆形区域,其中,所述预设距离为所述路由器的信号可以覆盖的直线长度。

如果该人脸的人脸数据中不存在满足预设条件的人脸数据组,则将该条wifi数据与该人脸间的匹配分值设为0,无需按照以下步骤a2的动作执行,当然,也可以继续执行步骤a2的动作。

a2、计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值。

在本步骤中,对任意一条wifi数据和关联的人脸数据组的匹配分值的计算过程相同,为了描述方便,以任意一条wifi数据和关联的人脸数据组为例,介绍该条wifi数据和关联的人脸数据组间的匹配分值的计算过程,具体包括:分别计算该条wifi数据和关联的人脸数据组中的各条人脸数据间的匹配分值,并将所计算出的各匹配分值相加,如果相加所得到的值不大于预设匹配分数阈值,则将相加所得到的值作为该条wifi数据和关联的人脸数据组间的匹配分值,如果相加得到的值大于预设匹配分值阈值的情况下,将预设匹配分值阈值作为该条wifi数据和关联的人脸数据组间的匹配分值。为了描述方便,将该条wifi数据和关联的人脸数据组间的匹配分值,称为该条wifi数据的匹配分值。

其中,计算该条wifi数据和与联的人脸数据组中任意一条人脸数据间的匹配分值的过程包括:首先,根据该条wifi数据中的信号强度以及信号强度和距离间的预设关系,计算出该条wifi数据包含的mac地址所属的设备距离该条wifi数据所属的路由器的距离为第一距离。其次,确定该条人脸数据包含的人脸与该条wifi数据所属的路由器间的距离为第二距离。最后,依据第一距离与第二距离间的差距,确定该条wifi数据和该条人脸数据间的匹配分值,其中,第一距离与第二距离间的差距与该条wifi数据和该条人脸数据间的匹配分值成负相关,即第一距离与第二距离的差距越小,则该条wifi数据和该条人脸数据间的匹配分值越高,相反,该条wifi数据和该条人脸数据间的匹配分值越低。

通过本步骤可以得到该wifi数据组中每条wifi数据的匹配分值。

a3、依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址和该人脸间的匹配分值。

在本步骤中,可以通过两种方式进行计算,分别为第一种方式和第二种方式。

其中,第一种方式包括:将该wifi数据组中每条wifi数据的匹配分值相加,所得到的值作为该wifi数据组包含的mac地址和该人脸间的匹配分值。

在实际中,由于该wifi数据组中存在属于不同路由器的wifi数据,并且属于不同路由器的wifi数据中存在时间段重叠的wifi数据,即该wifi数据组中存在噪声数据,导致按照第一种方式确定出的该wifi数据组与该人脸间的匹配分值的准确性不能达到很好的效果。例如,该wifi数据组中存在属于路由器a的wifi数据,时间段为9点00分~9点30分,同时,该wifi数据组中存在属于路由器b的wifi数据,时间段为9点20分~9点40分,其中,9点20分~9点30分为重叠时间段。

为了进一步提高该wifi数据组包含的mac地址和该人脸间的匹配分值的准确性,本步骤提供了第二种方式。具体的,通过第二种方式计算该wifi数据组包含的mac地址与该人脸间的匹配分值的过程包括步骤b1~步骤b3:

b1、将该wifi数据组中属于不同路由器的wifi数据中时间段重叠的wifi数据作为一组待处理wifi数据。

还以9点20分~9点30分为重叠时间段为例,在本步骤中,则将该wifi数据组中存在属于路由器a的wifi数据中时刻属于9点20分~9点30分的wifi数据,以及该wifi数据组中存在属于路由器b的wifi数据中时刻属于9点20分~9点30分的wifi数据作为一组待处理的wifi数据。

b2、对于每组待处理wifi数据中各条待处理wifi数据的匹配分值的权值。

具体的,以任意一组wifi数据为例,将该组待处理wifi数据组中的wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据。确定排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值,其中,任意一条wifi数据的匹配分值的权值与目标距离成负相关,其中,目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离。

其中,相邻可以为前一条或者后一条,但是,对于计算一组待处理wifi数据的匹配分值的过程中,对于每条待处理wifi数据,相邻的一条wifi数据都为“前一条wifi数据”,或者,相邻的一条wifi数据都为“后一条wifi数据”,具体为“前一条wifi数据”还是“后一条wifi数据”本实施例不作限定,只要同一组待处理wifi数据统一即可。

具体的,如果分别所属的路由器间的距离大于预设距离阈值,可以将该权值设置为大于1的一个数值,并且,距离越大权值越大。如果分别所属的路由器间的距离小于预设距离阈值,则将该权值设置为小于1的一个数值,并且,距离越小权值越小。对于任一组待处理wifi数据从时间上进行排序后中的第一条wifi数据(以前一条wifi数据进行比较的情况),权值可以设定为1。对于该组待处理wifi数据从时间上进行排序后中的最后一条wifi数据(以后一条wifi数据进行比较的情况),权值可以设定为1。

b3、将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加,并将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

s206、对于每个wifi数据组分别包含的mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址关联的人脸。

以任意一个wifi数据组为例进行介绍。具体的,将该wifi数据组包含的mac地址分别与各人脸间的匹配分值按照从高到低的顺序,确定出前预设数量的匹配分值对应的人脸,作为与该wifi数据组包含的mac地址关联的人脸。

在本步骤中,预设数量的取值可以根据实际的业务场景确定,本实施例不对预设数量的取值作限定。在本实施例中,预设数量的取值可以为5。

例如,该wifi数据组包含的mac地址为a,与该wifi数据组关联的人脸数组包含的人脸包括:人脸a、人脸b、人脸c和人脸d,其中,a与人脸a间的匹配分值为80分,a与人脸b间的匹配分值为90分,a与人脸c间的匹配分值为90分和a与人脸d间的匹配分值为100分,预设数量的取值为3,则本步骤中,将人脸d、人脸c和人脸b作为与mac地址a关联的人脸。

s207、在不同预设时间段内的与各个mac地址分别关联的人脸中存在相同mac地址的情况下,确定与相同mac地址关联的人脸中重复出现的人脸,作为该不同预设时间段内与相同mac地址关联的人脸。

在本步骤中,不同预设时间段可以为不同天,例如,2019年6月20日和2019年6月21日是两个不同的预设时间段。

在本实施例中,可以从每个预设时间内的wifi数据和人脸数据中,确定出与wifi数据包含的各个mac地址分别关联的人脸。在本步骤中,在不同预设时间段内与各个mac地址分别关联的人脸中存在相同mac地址的情况下,将不同预设时间段内相同的mac地址分别关联的人脸中重复出现的人脸,作为与该相同的mac地址关联的人脸。

例如,在2019年6月20日、2019年6月21日、2019年6月22日和2019年6月23日中的每天,都得到与wifi数据组包含的mac地址关联的人脸。在本步骤中,从与wifi数据组包含的mac地址关联的人脸中,确定重复出现的人脸。将所确定出的重复出现的人脸作为与wifi数据组包含的mac地址关联的人脸,此时得到的关联结果具有较高的准确性。

例如,小红在2019年6月20日与朋友a、朋友b一起在x商场,可能得到与小红设备的mac地址关联的人脸有小红、朋友a和朋友b。小红在2019年6月21日与朋友c、朋友d一起在x商场,可能得到与小红设备的mac地址关联的人脸有小红、朋友c和朋友d。假设,小红在2019年6月20日和2019年6月21日在x商场所携带的设备是同一个设备,则可以得到2019年6月20日和2019年6月21日,与小红设备的mac地址关联的人脸中重复出现的人脸是小红,则可以确定出与小红设备的mac地址关联的人脸是小红,这一结果与实际情况相符合,所以,将与mac地址关联的人脸中重复出现的人脸作为该mac地址关联的人脸这一关联结果具有较高的准确性。

本实施例具有以下有益效果:

有益效果一、

在本实施例中,获取wifi数据和人脸数据,其中,wifi数据包括:mac地址和mac地址包含的设备在指定场所内的位置,人脸数据包括:人脸图像、拍摄时刻和人脸图像中的人脸在被拍摄时在指定场所内的位置,将wifi数据和人脸数据中的位置,统一到预设的参考坐标系下,得到统一后的wifi数据和统一后的人脸数据。将统一后的wifi数据中相同的mac地址的wifi数据作为一组,得到多个wifi数据组,计算每个wifi数据组包含的mac地址分别与人脸数据中各人脸间的匹配分值,得到每个mac地址分别与各人脸间的匹配分值,对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址关联的人脸。

由于匹配分值的大小与mac地址所属的设备与人脸分别指示同一个人的程度成正关联,因此,确定出的与mac地址关联的人脸具有一定的准确性。

有益效果二、

在本实施例中,对统一后的wifi数据和统一后人脸数据分别进行了预处理,具体包括两方面的处理,对于wifi数据,第一方面的处理包括:去除与数据关联不相关的wifi数据和质量较差的wifi数据,得到去除后的wifi数据。对于人脸数据,第一方便的处理包括:去除与数据关联不相关的人脸数据,得到去除后的人脸数据。分别对wifi数据和人脸数据进行第一方面的处理,使得去除后的wifi数据和去除后的人脸数据对于数据关联来说,数据质量得到提高,使得最终得到的与wifi数据中各mac地址关联的人脸的结果的准确性具有一定的保证。

同时,预处理过程中的第二方面的处理包括:对去除后的wifi数据和去除后的人脸数据分别进行数据采样,由于去除后的wifi数据和去除后的人脸数据中存在大量的冗余数据,通过本实施例的第二方面的处理后,可以大幅度降低去除后的wifi数据和去除后的人脸数据中的冗余数据,得到预处理后的wifi数据和预处理后的人脸数据,使得后续基于预处理后的wifi数据和预处理后的人脸数据计算得到最终的关联结果的过程,可以节省较多的计算资源,以及提高计算效率。

图3为本申请实施例提供的一种数据关联装置,包括:获取模块301、分组模块302、计算模块303和排序模块304。

其中,获取模块301,用于获取wifi数据和人脸数据,wifi数据包括:连接wifi网络的设备的mac地址,人脸数据包括:人脸图像。分组模块302,用于将wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组。计算模块303,用于计算每个wifi数据组包含的mac地址分别与人脸图像中各人脸间的匹配分值,匹配分值的大小,与mac地址所属的设备和人脸图像所属的人脸分别指示同一个人的程度成正相关。排序模块304,用于对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值分别对应的人脸,作为与该mac地址关联的人脸。

可选的,分组模块302分组所得的wifi数据组中任一条wifi数据还包括:该条wifi数据的产生时刻,获取模块301获取的任意一条人脸数据还包括:人脸图像的拍摄时刻。

可选的,计算模块303,用于确定任意一个wifi数据组包含的mac地址与人脸图像中的任意一个人脸间的匹配分值,包括:

计算模块303,具体用于从该人脸的人脸数据中,确定分别与该wifi数据组中的每条wifi数据间满足预设条件的人脸数据,作为与wifi数据关联的人脸数据组,对于任意一条wifi数据,预设条件包括:时刻属于预设时刻范围;预设时刻范围为以该条wifi数据的产生时刻为时间中点的前后预设时长构成的时刻范围。分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值。依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选的,所述分组模块302分组所得的wifi数据组中任一条wifi数据还包括:设备的位置,获取模块获取的任意一条人脸数据还包括:人脸图像在被拍摄时的位置。

可选的,计算模块303,用于计算任意一条wifi数据和关联的人脸数据组间的匹配分值,包括:

计算模块303,具体用于计算该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值;其中,该条wifi数据和关联的人脸数据组中的任意一条人脸数据的匹配分值与差距成负相关,差距为第一距离和第二距离间的差值,第一距离为该条wifi数据中的位置与该条wifi数据所属的路由器间的距离,第二距离为该条人脸数据中的位置与该条wifi数据所属的路由器间的距离。将该条wifi数据分别和关联的人脸数据组中的每条人脸数据的匹配分值相加得到的值,作为该条wifi数据和关联的人脸数据组间的匹配分值。

可选的,该装置还包括:加权模块305,用于在计算模块303分别计算每条wifi数据和关联的人脸数据组间的匹配分值,得到每条wifi数据的匹配分值之后,且在依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值之前,从该wifi数据组中,确定属于不同路由器的wifi数据中重叠时间段的wifi数据为一组待处理wifi数据。

将待处理wifi数据的时刻按照预设先后顺序进行排序,得到排序后的待处理wifi数据。确定排序后的待处理wifi数据中的每条wifi数据的匹配分值的权值,任意一条wifi数据的匹配分值的权值与目标距离成负相关,目标距离为该条wifi数据和相邻的一条wifi数据分别所属的路由器间的距离。分别对每组待处理wifi数据的匹配分值进行加权和,任意一组待处理wifi数据的匹配分值进行加权和得到的数值为该组待处理wifi数据的匹配分值。将该wifi数据组中,除各组待处理wifi数据外的wifi数据的匹配分值,以及各组待处理wifi数据分别对应的匹配分值进行相加。

计算模块303,用于依据每条wifi数据的匹配分值,确定该wifi数据组包含的mac地址与该人脸间的匹配分值,包括:

计算模块303,具体用于将相加得到的值作为该wifi数据组包含的mac地址与该人脸间的匹配分值。

可选的,预设条件,还包括:位置属于预设位置范围,预设位置范围为:以该条wifi数据所属的路由器为中心,以预设距离为半径所形成的圆形区域;预设距离为所述路由器的信号覆盖的直线长度。

可选的,该装置还包括:预处理模块306,用于在获取模块301获取wifi数据和人脸数据之后,且在分组模块302将wifi数据中相同的mac地址的wifi数据作为一组,得到wifi数据组之前,将wifi数据和人脸数据中的位置,统一到预设的参考坐标系下,得到统一后的wifi数据和统一后的人脸数据。从统一后的wifi数据中去除与数据关联不相关的数据和质量较差的数据,得到去除后的wifi数据,与数据关联不相关的数据为持续时长不属于预设时长范围的wifi数据,质量较差的数据为信号强度小于预设强度阈值的wifi数据。

将去除后的wifi数据的起始时刻、与起始时刻间的时长为第一预设时长的整数倍的时刻,以及去除后的wifi数据的结束时刻,作为wifi采样时刻。将去除后的wifi数据中除wifi采样时刻的wifi数据外的wifi数据进行删除,得到预处理后的wifi数据。将统一后的人脸数据中除预先指定人员的人脸数据之外的人脸数据进行删除,得到去除后的人脸数据。将去除后的人脸数据的起始时刻、与起始时刻的时长为第二预设时长的整数倍的时刻,以及去除后的人脸数据的结束时刻为人脸采样时刻。将去除后的人脸数据中除人脸采样时刻的人脸数据外的人脸数据进行删除,得到预处理后的人脸数据。

可选的,第一预设时长与第二预设时长相同且等于预设延时时长,预设延时时长为wifi数据的产生时刻与连接到路由器的时刻间的延时。

可选的,该装置还包括:处理模块307,用于在排序模块304对于每个mac地址,将该mac地址分别与各人脸间的匹配分值中,按照匹配分值从大到小顺序的预设数量的匹配分值对应的人脸,作为与该mac地址关联的人脸之后,在不同预设时间段内分别得到的与各个mac地址分别关联的人脸中存在相同的mac地址的情况下,确定与相同mac地址关联的人脸中重复出现的人脸,作为不同预设时间段内与相同mac地址关联的人脸。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1