一种线上数据和线下数据的关联方法及计算设备与流程

文档序号:14941118发布日期:2018-07-13 20:49阅读:276来源:国知局

本发明涉及互联网技术领域,特别涉及一种线上数据和线下数据的关联方法及计算设备。



背景技术:

随着互联网技术和移动终端技术的不断发展,如智能手机、平板电脑等移动终端得到了广泛使用和普及,人们的活动和消费行为一部分发生在线上,比如看新闻和视频以及通过电商的购物行为,另一部分则发生在线下,比如逛街买衣服、去超市或者就餐。对于线下的商家来说,希望能够对到店的消费者有一定程度的了解,以便提供更好的个性化服务,而对于线上的应用提供商家来说,也希望能够了解应用使用者所处的场景和周围的环境,以便提供更精准的推送和服务,用更好的智能交互提高用户粘性,进而增加商业转化率。

目前在线上,应用的推送通常基于通过大数据分析后的人群画像结果,能够利用的主要数据是线上数据,对用户的理解有限。而在线下,商家也只能从相关服务提供商获得基于线上大数据的某个区域的人群画像,以及通过线下问卷调查获得的结果来指定自己的促销策略以吸引消费者。可见,线上和线下数据的关联仍然是一个很大的挑战。



技术实现要素:

为此,本发明提供一种线上数据和线下数据的关联的技术方案,以力图解决或者至少缓解上面存在的问题。

根据本发明的一个方面,提供一种线上数据和线下数据的关联方法,适于在网络服务器中执行,网络服务器中存储有用户线上数据集和用户线下行为集,用户线上数据集相关联地存储有各用户设备标识及对应用户的线上数据,用户线下行为集相关联地存储有各用户人脸特征及对应用户的线下行为,网络服务器与多个数据探针和摄像头通信连接,各数据探针和摄像头相应部署于各店铺中,数据探针用于采集其位于的店铺内一个或多个用户所携带电子设备的设备信息,摄像头用于拍摄在其拍摄区域内一个或多个用户的用户图像,该方法包括如下步骤:首先,接收各数据探针实时上报的、所采集到的设备信息,设备信息包括用户设备标识;对各用户设备标识对应的电子设备进行定位以获取相应的位置信息;对获取到的各位置信息,若该位置信息位于一个摄像头的拍摄区域内,则获取该摄像头所拍摄到用户图像的人脸特征,并将该人脸特征与该位置信息对应的电子设备的用户设备标识进行关联处理;对各关联处理后的人脸特征,从用户线下行为集中获取与该人脸特征对应的用户人脸特征关联的线下行为,将该线下行为与该人脸特征及其对应的用户设备标识关联;对各关联处理后的用户设备标识,从用户线上数据集中获取与该用户设备标识对应的线上数据,将该线上数据与该用户设备标识对应的线下数据关联。

可选地,在根据本发明的线上数据和线下数据的关联方法中,用户设备标识为对用户所携带电子设备的物理地址进行匿名化处理后生成的字符串。

可选地,在根据本发明的线上数据和线下数据的关联方法中,设备信息还包括时间戳、接收端标识、数据探针标识、基本服务装置标识、信号帧类型、信号强度和/或信道。

可选地,在根据本发明的线上数据和线下数据的关联方法中,对各用户设备标识对应的电子设备进行定位以获取相应的位置信息的步骤包括:对接收到的设备信息进行分组处理,以获取一个或多个预设的第一时间段内各电子设备被相应数据探针采集到的设备信息;遍历各第一时间段内各电子设备被相应数据探针所采集到的设备信息,对该第一时间段内各电子设备被相应数据探针采集到的设备信息,若该电子设备被不少于预设的第一数量个数据探针采集到设备信息,则对该电子设备进行定位以获取其在该第一时间段内的位置信息。

可选地,在根据本发明的线上数据和线下数据的关联方法中,对该电子设备进行定位以获取其在该第一时间段内的位置信息的步骤包括:根据该电子设备在该第一时间段内被采集到的设备信息中的信号强度,计算出该电子设备到各采集到相应设备信息的数据探针的距离;基于计算出的各距离和各采集到相应设备信息的数据探针的坐标信息,对该电子设备进行三角定位运算以获取其在该第一时间段内的位置信息。

可选地,在根据本发明的线上数据和线下数据的关联方法中,第一数量预设为3。

可选地,在根据本发明的线上数据和线下数据的关联方法中,从用户线下行为集中获取与该人脸特征对应的用户人脸特征关联的线下行为,将该线下行为与该人脸特征及其对应的用户设备标识关联的步骤包括:分别计算该人脸特征与用户线下行为集中各用户人脸特征的相似度;若存在超过预设的第一相似度阈值的相似度,则从用户线下行为集中获取该相似度对应的用户人脸特征关联的线下行为,将该线下行为与该人脸特征及其对应的用户设备标识关联。

可选地,在根据本发明的线上数据和线下数据的关联方法中,还包括:若不存在超过第一相似度阈值的相似度,则对该人脸特征进行质量评分;若质量评分的分数超过预设的分数阈值,则将该人脸特征作为新用户的用户人脸特征以存储于用户线下行为集中。

可选地,在根据本发明的线上数据和线下数据的关联方法中,还包括:接收各摄像头定时上报的、所拍摄到的用户图像及该用户图像的拍摄时间;对各用户图像进行人脸检测并提取相应的人脸特征,将提取出的各人脸特征与对应的用户图像的拍摄时间关联。

可选地,在根据本发明的线上数据和线下数据的关联方法中,还包括预先生成用户线上数据集,预先生成用户线上数据集的步骤包括:接收各电子设备发送的、对应用户的线上行为;对各线上行为进行分析以获取相应的线上数据;将各线上数据与发送其对应线上行为的电子设备的用户设备标识进行关联,以生成用户线上数据集。

根据本发明的又一个方面,提供一种计算设备,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行根据本发明的线上数据和线下数据的关联方法的指令。

根据本发明的又一个方面,提供一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行根据本发明的线上数据和线下数据的关联方法。

根据本发明的线上数据和线下数据的关联的技术方案,接收各数据探针上报的设备信息,对设备信息中的用户设备标识对应的电子设备进行定位,以获取相应的位置信息,对各位置信息,获取该位置信息对应的、被拍摄到的用户图像的人脸特征,将该人脸特征与该位置信息对应的电子设备的用户设备标识关联处理,对各关联处理后的人脸特征,将该人脸特征与其对应的线下行为、用户设备标识进行关联,对各关联处理后的用户设备标识,将该用户设备标识对应的线上数据和线下数据关联。在上述技术方案中,线上数据和线下数据的关联基于用户设备标识这一个唯一的标识符,且其为对用户所携带电子设备的物理地址进行匿名化处理后生成的字符串,由于线上数据和线下数据对应的用户设备标识采用如上相同的策略进行匿名化,因此这一匿名化处理的过程不仅防止了用户隐私外泄,也避免了通过该标识符来反向定位到用户及其携带的电子设备,在实现线上线下数据打通的同时保障了数据安全。

附图说明

为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明的一个实施例的网络系统100的示意图;

图2示出了根据本发明的一个实施例的计算设备200的结构框图;以及

图3示出了根据本发明的一个实施例的线上数据和线下数据的关联方法300的流程图

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的网络系统100的示意图。应当指出,图1中的网络系统100仅是示例性的,在具体的实践情况中,网络系统100中可以有不同数量的网络服务器、数据探针和摄像头,本发明对网络系统100中所包括的网络服务器、数据探针和摄像头的数量不做限制。

如图1所示,网络系统100包括网络服务器400、数据探针1~m以及摄像头1~n,网络服务器400中存储有用户线上数据集和用户线下行为集,且与数据探针1~m和摄像头1~n通信连接。其中,用户线上数据集相关联地存储有各用户设备标识及对应用户的线上数据,用户线下行为集相关联地存储有各用户人脸特征及对应用户的线下行为,m和n均为正整数,数据探针1~m表示共有m个数据探针,分别为数据探针1、数据探针2、……、数据探针m,摄像头1~n表示共有n个摄像头,分别为摄像头1、摄像头2、……、摄像头n。数据探针1~m和摄像头1~n相应部署于各店铺中,各数据探针用于采集其位于的店铺内一个或多个用户所携带电子设备的设备信息,各摄像头用于拍摄在其拍摄区域内一个或多个用户的用户图像。

具体的,数据探针1~m不间断地采集在其位于的店铺内出现的用户所携带电子设备的设备信息,并将采集到的设备信息实时上报至网络服务器400,同时摄像头1~n也会对出现在其拍摄区域内的用户进行拍摄,并将获取到的用户图像发送至网络服务器400。而网络服务器400将根据接收到的各设备信息以及从各用户图像中提取出的相应的人脸特征,进行一系列处理以将各用户的线上数据与线下数据通过对应的用户设备标识关联起来,用户设备标识包含于设备信息中,为用户所携带的电子设备的唯一的标识符。

为便于理解,这里先对数据探针采集设备信息的过程进行简要说明。对一个电子设备来说,在wi-fi(wireless-fidelity,无线保真)开启但没有连接任何wi-fi热点的情况下,无论在用户正常使用情况下,或者在息屏待机时,该电子设备都会周期性发出一些探测请求帧,扫描周围是否有可用的wi-fi热点,而当该电子设备已经连接到某个wi-fi热点时,其和该wi-fi热点之间的数据通信是通过数据帧来完成的。当然,探测请求帧和数据帧都属于wi-fi信号帧。而在该实施方式中,数据探针1~m是可以检测到周围的电子设备的wi-fi信号强度的探针,基于此,各数据探针可获取到位于相应探测范围内的用户所携带的电子设备的设备信号。关于基于wi-fi探测来获取设备信息的具体处理方式,为现有成熟技术,此处不予以赘述。

此外,关于数据探针和摄像头的部署,需要根据各店铺的实际情况来进行安排。具体的,对数据探针而言,一个店铺中所部署的所有数据探针不能连成一条直线,且应该处于同一高度,并尽量覆盖店内最大区域,考虑店内布局和面积来灵活选择数据探针的数量,但通常数量应该不小于3。对摄像头而言,根据店铺的规模,通常将摄像头部署在容易拍摄到人脸的区域,比如收银台、出入口等,特别是收银台,此时用户会有正面相对静止状态,而且方便和店铺流水管理系统集成,直接将用户线下的消费记录和采集到的人脸特征关联。

图2示出了根据本发明一个实施例的计算设备200的结构框图。在基本配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。

取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(alu)、浮点数单元(fpu)、数字信号处理核心(dsp核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。

取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如ram)、非易失性存储器(诸如rom、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据226。在一些实施方式中,程序222可以布置为在操作系统上由一个或多个处理器204利用程序数据224执行指令。

计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置102经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个a/v端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个i/o端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(rf)、微波、红外(ir)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备200可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和web服务器等,也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(pda)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备200还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备200可实现为网络服务器,例如图1所示的网络服务器400,并被配置为执行根据本发明的线上数据和线下数据的关联方法。其中,计算设备200的一个或多个程序222包括用于执行根据本发明的线上数据和线下数据的关联方法300的指令。

图3示出了根据本发明的一个实施例的线上数据和线下数据的关联方法300的流程图。线上数据和线下数据的关联方法300适于在网络服务器(例如图1所示的网络服务器400)中执行。

如图3所示,方法300始于步骤s310。在步骤s310中,接收各数据探针实时上报的、所采集到的设备信息,设备信息包括用户设备标识。根据本发明的一个实施例,用户设备标识为对用户所携带电子设备的物理地址进行匿名化处理后生成的字符串。电子设备的物理地址即为其mac(mediaaccesscontrol,媒体访问控制)地址,可通过md5算法((messagedigestalgorithmmd5,消息摘要算法第五版)来对电子设备的mac地址进行匿名化处理,比如在电子设备的mac地址前添加上相应店铺的名称,再对其采用md5算法来进行匿名化以生成对应的用户设备标识。关于md5算法的具体内容,为现有成熟技术,此处不予以赘述。需要说明的是,对于用户设备标识生成的具体方式,根据实际情况的不同可采取相应的算法来实现,这些对于了解本发明方案的技术人员来说是可以容易想到的,并且也在本发明的保护范围之内,此处不予以赘述。

在该实施方式中,设备信息除了用户设备标识外,还包括时间戳、接收端标识、数据探针标识、基本服务装置标识、信号帧类型、信号强度和/或信道。其中,时间戳为数据探针接收到wi-fi信号帧的时间,至少为毫秒级,接收端标识为接收电子设备所发出信号的目的设备的mac地址,数据探针标识为数据探针的mac地址,基本服务装置标识对应的英文表述为basicservicesetid,英文缩写为bssid,表示wi-fi访问节点的mac地址,信号帧类型包括管理帧、数据帧和控制帧,信号强度对应的英文表述为receivedsignalstrengthindication,英文缩写为rssi,信道为数据探针探测到wi-fi信号当时通信的通道。以下为采集到的设备信息的一个具体示例:

时间戳:1499429553478564

数据探针标识:e4956e410b32(16进制)

用户设备标识:12686f93eec26ddba45e22138dde71e0(16进制)

接收端标识:58:1f:28:16:37:ab(16进制)

基本服务装置标识:00:00:00:00:00:00(16进制)

信号帧类型:ack(ack帧为控制帧的一种)

信号强度:-51(单位是dbm)

信道:0

在接收数据探针1~m实时上报的、所采集到的设备信息后,进入步骤s320,对各用户设备标识对应的电子设备进行定位以获取相应的位置信息。根据本发明的一个实施例,可通过如下方式对各用户设备标识对应的电子设备进行定位以获取相应的位置信息。首先,对接收到的设备信息进行分组处理,以获取一个或多个预设的第一时间段内各电子设备被相应数据探针采集到的设备信息,再遍历各第一时间段内各电子设备被相应数据探针所采集到的设备信息,对该第一时间段内各电子设备被相应数据探针采集到的设备信息,若该电子设备被不少于预设的第一数量个数据探针采集到设备信息,则对该电子设备进行定位以获取其在该第一时间段内的位置信息。进一步的,在对该电子设备进行定位以获取其在该第一时间段内的位置信息时,先根据该电子设备在该第一时间段内被采集到的设备信息中的信号强度,计算出该电子设备到各采集到相应设备信息的数据探针的距离,再基于计算出的各距离和各采集到相应设备信息的数据探针的坐标信息,对该电子设备进行三角定位运算以获取其在该第一时间段内的位置信息。

在该实施方式中,第一时间段优选为一秒,则先对接收到的设备信息进行分组处理,以获取每一秒内各电子设备被相应数据探针采集到的设备信息。具体的,先按照时间戳来对各设备信息进行整理,将相同时间戳的设备信息归为一类,然后按照用户设备标识对同一秒内的各时间戳下的设备信息进行整理,将相同用户设备标识的设备信息再归为一组,最后按照信息来源的数据探针对上述按照用户设备标识分组后的每一组设备信息进行整理,从而获取到每一秒内各电子设备被相应数据探针采集到的设备信息。比如,对电子设备d1来说,在2017年7月17日11点56分12秒这一秒内,该电子设备被数据探针1、2和3采集到的设备信息(为便于展示,设备信息只显示有信号强度)如下所示:

其中,1500263772为在2017年7月17日11点56分12秒对应的时间戳,12686f93eec26ddba45e22138dde71e0为电子设备d1的用户设备标识,记为e1,e4956e410922、e4956e4e53e4和e4956e4e53e7分别为数据探针1、2和3的数据探针标识,-80为数据探针1采集到的电子设备d1在该秒内对应的信号强度,-68、-68、-68、-69、-69、-68为数据探针2采集到的电子设备d1在该秒内对应的信号强度,-73、-74、-75和-74为数据探针3采集到的电子设备d1在该秒内对应的信号强度。

接下来,遍历每一秒内各电子设备被相应数据探针所采集到的设备信息,对该秒内各电子设备被相应数据探针采集到的设备信息,若该电子设备被不少于预设的第一数量个数据探针采集到设备信息,则对该电子设备进行定位以获取其在该秒内的位置信息。在对该电子设备进行定位以获取其在该秒内的位置信息时,先根据该电子设备在该秒内被采集到的设备信息中的信号强度,计算出该电子设备到各采集到相应设备信息的数据探针的距离,再基于计算出的各距离和各采集到相应设备信息的数据探针的坐标信息,对该电子设备进行三角定位运算以获取其在该秒内的位置信息。其中,第一数量预设为3。

在该实施方式中,以2017年7月17日11点56分12秒这一秒内电子设备d1被数据探针1、2和3所采集到的设备信息为例,由于电子设备d1被不少于3个数据探针采集到设备信息,则对电子设备d1进行定位以获取其在该秒内的位置信息。具体的,先根据电子设备d1在该秒内被采集到的设备信息中的信号强度,计算出电子设备d1到数据探针1、2和3的距离,由于数据探针2和3采集到的电子设备d1在该秒内对应的信号强度有多个记录,因此需要进行平均处理以获取相应的信号强度均值,最终可得数据探针2采集到的电子设备d1在该秒内对应的信号强度均值为[-68+(-68)+(-68)+(-69)+(-69)+(-68)]/6=-68,数据探针3采集到的电子设备d1在该秒内对应的信号强度均值为[-73+(-74)+(-75)+(-74)]/4=-74。在进行距离计算时,可根据hata-okumara模型中信号强度与记录之间的对应关系,来计算电子设备d1到数据探针1、2和3的距离,将各距离依次记为l1、l2和l3。数据探针1、2和3的坐标信息依次为(35.9,5.1)、(33.0,11.3)和(38.2,7.8),基于这些坐标信息和相应的各距离对电子设备d1进行三角定位运算,得到该电子设备在该秒内的位置信息为(32.1910988163,1.35179051994)。以下为三角定位运算的关键代码示例,具体如下所示:

defget_position(probelocation):

set=[]

num=len(probelocation)

foriteminprobelocation:

distance=np.power(10,(-40.0-item[2])/40)

set.append((item[0],item[1],distance))

ifnum>2:

a=[]

b=[]

foriinrange(0,num):

a.append((2*(set[i][0]-set[num-1][0]),2*(set[i][1]-set[num-1][1])))

b.append(np.power(set[i][0],2)-np.power(set[num-1][0],2)+np.power

(set[i][1],2)-np.power(set[num-1][1],2)+np.power(set[i][2],2)–

np.power(set[num-1][2],2))

a=np.mat(a)

#print(set[num-1][0],set[num-1][1])

b=np.mat(b)

at=a.t

ata=at*a

ifnp.linalg.matrix_rank(ata)!=0:

invata=ata.i

invataat=invata*at

x=invataat*np.mat(b).t

lat=np.array(x)[0][0]

lng=np.array(x)[1][0]

squart=0

foriinset:

squart+=np.power(np.sqrt(np.power(i[0]-lat,2)+np.power(i[1]-lng,2))–i[2],2)

acc=np.sqrt(squart/len(set))

returnlat,lng,acc

else:

return0.0,0.0,0.0

关于hata-okumara模型和三角定位运算的相关技术,为现有成熟技术,此处不再赘述。

在步骤s330中,对获取到的各位置信息,若该位置信息位于一个摄像头的拍摄区域内,则获取该摄像头所拍摄到用户图像的人脸特征,并将该人脸特征与该位置信息对应的电子设备的用户设备标识进行关联处理。根据本发明的一个实施例,对获取到的位置信息(32.1910988163,1.35179051994)来说,该位置信息位于摄像头1的拍摄区域内,则获取该摄像头所拍摄到的用户图像的人脸特征。为便于处理,可直接获取摄像头1在2017年7月17日11点56分12秒这一秒内所拍摄到的用户图像的人脸特征,此时得到人脸特征f1,对应于用户u1,再将该人脸特征与该位置信息对应的电子设备d1的用户设备标识e1进行关联处理。

接下来,执行步骤s340,对各关联处理后的人脸特征,从用户线下行为集中获取与该人脸特征对应的用户人脸特征关联的线下行为,将该线下行为与该人脸特征及其对应的用户设备标识关联。根据本发明的一个实施例,可通过如下方式从用户线下行为集中获取与该人脸特征对应的用户人脸特征关联的线下行为,将该线下行为与该人脸特征及其对应的用户设备标识关联。首先,分别计算该人脸特征与用户线下行为集中各用户人脸特征的相似度,若存在超过预设的第一相似度阈值的相似度,则从所述用户线下行为集中获取该相似度对应的用户人脸特征关联的线下行为,再将该线下行为与该人脸特征及其对应的用户设备标识关联。其中,第一相似度阈值预设为90%。

在该实施方式中,以关联处理后的人脸特征f1为例,先分别计算人脸特征f1与用户线下行为集中各用户人脸特征的相似度,由于用户线下行为集中存储有1000个用户人脸特征,各用户人脸特征依次标记为t1、t2、t3、……、t1000,且分别与用户的线下行为b1、b2、b3、……、b1000对应,则可计算得出1000个相似度,这1000个相似度中存在1个超过90%的相似度,该相似度对应的用户人脸特征为t3,从用户线下行为集中获取用户人脸特征t3关联的线下行为b3,再将线下行为b3与人脸特征f1及其对应的用户设备标识e1关联。当然,若这1000个相似度中存在不止1个超过90%的相似度,从用户线下行为集中获取数值最大的相似度对应的用户人脸特征关联的线下行为,再将该线下行为与该人脸特征及其对应的用户设备标识关联。此外,根据本发明的又一个实施例,若不存在超过第一相似度阈值的相似度,则对该人脸特征进行质量评分,若质量评分的分数超过预设的分数阈值,则将该人脸特征作为新用户的用户人脸特征以存储于用户线下行为集中。其中,分数阈值预设为8,满分为10。关于人脸质量评分的算法,可参考现有的人脸图像质量评价方法,此处不予以赘述。

最后,在步骤s350中,对各关联处理后的用户设备标识,从用户线上数据集中获取与该用户设备标识对应的线上数据,将该线上数据与该用户设备标识对应的线下数据关联。根据本发明的一个实施例,对关联处理后的用户设备标识e1而言,由于用户线上行为集中存储有1000个用户设备标识,各用户设备标识依次标记为e1、e2、e3、……、e1000,且分别与用户的线上数据c1、c2、c3、……、c1000对应,则从用户线上数据集中获取与用户设备标识e1对应的线上数据c1,将线上数据c1与用户设备标识e1对应的线下数据b3关联。

考虑到存在某一第一时间段内有多个电子设备被定位到同一拍摄区域、且该拍摄区域对应的摄像头也拍摄到多个用户图像的情况,根据本发明的又一个实施例,对定位后获取到的一个位置信息,若该位置信息所处的拍摄区域中在该第一时间段内出现的电子设备的数量大于1,则对每一个该位置信息所处的拍摄区域中在该第一时间段内出现的电子设备,根据该电子设备的用户设备标识,查找该用户设备标识是否关联有用户线下行为集中的一个用户人脸特征,若是,则分别计算该用户人脸特征与该摄像头在该第一时间段内、拍摄到的各用户图像的人脸特征的相似度,将超过预设的第二相似度阈值的相似度对应的人脸特征与该用户设备标识关联。其中,第二相似度阈值预设为95%。将该第一时间段内,被定位到上述拍摄区域的电子设备中、未关联有人脸特征的用户设备标识所对应电子设备的数量记为h1,该拍摄区域内被拍摄到的用户图像的人脸特征中、未关联有用户设备标识的人脸特征的数量记为h2,若h1=h2=1,则将该未关联有用户设备标识的人脸特征、与该未关联有人脸特征的用户设备标识进行关联处理,若h1>1且h2≥1,或者h1≥1且h2>1,则将各未关联有用户设备标识的人脸特征与各未关联有人脸特征的用户设备标识存储在待关联列表中,以待再次关联处理。

在该实施方式中,第一时间段优选为一秒,则以2017年7月18日13点27分39秒这一秒为例,在该秒内定位到摄像头2的拍摄区域内的电子设备有2个,对应的用户设备标识分别为e1和e3,而摄像头2在该秒内拍摄到2个用户图像,从这2个用户图像中提取出的人脸特征分别是f2和f3,由于用户设备标识e1与用户人脸特征t3关联,且人脸特征f2和用户人脸特征t3的相似度为97.23%,超过了95%,则将人脸特征f2与用户设备标识e1关联。此时,只剩下了1个用户设备标识e3和1个人脸特征f3,则可直接将人脸特征f3与用户设备标识e3进行关联处理。

由于摄像头1~n在拍摄到用户图像后,需要将其上传至网络服务器400,以便网络服务器400从各用户图像中提取人脸特征,因此根据本发明的又一个实施例,网络服务器400接收各摄像头定时上报的、所拍摄到的用户图像及该用户图像的拍摄时间,对各用户图像进行人脸检测并提取相应的人脸特征,将提取出的各人脸特征与对应的用户图像的拍摄时间关联。

此外,前述提到的用户线上数据集,是预先根据各电子设备上报的数据来预先生成的,则根据本发明的又一个实施例,网络服务器400接收各电子设备发送的、对应用户的线上行为,对各线上行为进行分析以获取相应的线上数据,再将各线上数据与发送其对应线上行为的电子设备的用户设备标识进行关联,以生成用户线上数据集。在该实施方式中,对用户的电子设备而言,会在该电子设备的某一个商家有关的移动应用中集成一个sdk(softwaredevelopmentkit,软件开发工具包),该sdk会为该电子设备生成对应的用户设备标识,而且提供了一系列进行用户行为记录的接口供商家或开发者调用,一旦基于相应的业务和ui(userinterface,用户界面)调转逻辑关系调用不同的接口,即可使得sdk在该移动应用运行时记录用户的操作行为作为线上行为,并上报至网络服务器400。

目前,在线上,应用的推送通常基于通过大数据分析后的人群画像结果,能够利用的主要数据是线上数据,对用户的理解有限,而在线下,商家也只能从相关服务提供商获得基于线上大数据的某个区域的人群画像,以及通过线下问卷调查获得的结果来指定自己的促销策略以吸引消费者,没有较好地实现线上和线下数据的打通,也就难以进行精准及定向推荐。根据本发明实施例的线上数据和线下数据的关联的技术方案,接收各数据探针上报的设备信息,对设备信息中的用户设备标识对应的电子设备进行定位,以获取相应的位置信息,对各位置信息,获取该位置信息对应的、被拍摄到的用户图像的人脸特征,将该人脸特征与该位置信息对应的电子设备的用户设备标识关联处理,对各关联处理后的人脸特征,将该人脸特征与其对应的线下行为、用户设备标识进行关联,对各关联处理后的用户设备标识,将该用户设备标识对应的线上数据和线下数据关联。在上述技术方案中,线上数据和线下数据的关联基于用户设备标识这一个唯一的标识符,且其为对用户所携带电子设备的物理地址进行匿名化处理后生成的字符串,由于线上数据和线下数据对应的用户设备标识采用如上相同的策略进行匿名化,因此这一匿名化处理的过程不仅防止了用户隐私外泄,也避免了通过该标识符来反向定位到用户及其携带的电子设备,在实现线上线下数据打通的同时保障了数据安全。

a9.如a1-8中任一项所述的方法,还包括:

接收各摄像头定时上报的、所拍摄到的用户图像及该用户图像的拍摄时间;

对各用户图像进行人脸检测并提取相应的人脸特征,将提取出的各人脸特征与对应的用户图像的拍摄时间关联。

a10.如a1-9中任一项所述的方法,还包括预先生成用户线上数据集,所述预先生成用户线上数据集的步骤包括:

接收各电子设备发送的、对应用户的线上行为;

对各线上行为进行分析以获取相应的线上数据;

将各线上数据与发送其对应线上行为的电子设备的用户设备标识进行关联,以生成用户线上数据集。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组间可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组间组合成一个模块或单元或组间,以及此外可以把它们分成多个子模块或子单元或子组间。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。

这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、cd-rom、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的线上数据和线下数据的关联方法。

以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。

如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1