信息聚合方法及装置与流程

文档序号:11251012阅读:1408来源:国知局
信息聚合方法及装置与流程

本公开涉及网络技术领域,尤其涉及一种信息聚合方法及装置。



背景技术:

在通过互联网向用户推送广告时,为了提高广告推送的精准度,通常需要将采用不同标识从同一终端采集的用户信息进行聚合,以根据与该终端对应的全面的用户信息进行推送。

相关技术中,pc((personalcomputer,个人计算机)端通常采用浏览器的cookie为标识采集用户信息,不同的网站对应不同的cookie,当浏览器向网站服务器1发送cookie1时,该网站服务器1会向网站服务器2转发该cookie1,网站服务器2向网站服务器1返回cookie2,从而使网站服务器1和网站服务器2均得到cookie1和cookie2的映射关系,依次类推,可以得到pc端多个cookie的映射关系,从而使得不同cookie对应的用户信息得到聚合。



技术实现要素:

为克服相关技术中存在的问题,本公开提供一种信息聚合方法及装置,所述技术方案如下:

根据本公开实施例的第一方面,提供一种信息聚合方法,包括:

获取多个映射数据源,每个映射数据源包括多条标识映射记录,每一条标识映射记录用于指示同一设备不同类型标识的映射关系,不同映射数据源的标识映射记录所包含标识的类型不完全相同;

根据至少一个预设标识类型,提取所述多个映射数据源所包括的每一条标识映射记录的主键标识,所述主键标识为标识类型与所述至少一个预设标识类型匹配的标识;

将所述多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录,以聚合采用每一条聚合映射记录中不同标识采集的用户信息。

在一种可能的实现方式中,所述多个映射数据源分别用于指示设备的出厂信息映射关系、与指定标识关联的映射关系和与账号标识关联的映射关系中的至少两种映射关系,所述指定标识为根据设备的动态信息生成的标识,所述动态信息用于指示非设备强相关的信息。

在一种可能的实现方式中,所述根据至少一个预设标识类型,提取所述多个映射数据源所包括的每一条标识映射记录的主键标识,包括:

对于所述多个映射源的每一条标识映射记录,根据所述至少一个预设标识类型,确定所述标识映射记录的主键标识类型;

根据所述主键标识类型,提取所述标识映射记录的主键标识。

在一种可能的实现方式中,所述对于所述多个映射源的每一条标识映射记录,根据所述至少一个预设标识类型,确定所述标识映射记录的主键标识类型,包括:

根据所述至少一个预设标识类型,从所述标识映射记录所指示的多个标识类型中,确定与所述至少一个预设标识类型匹配的标识类型的数目;

如果所述数目大于1,则根据所述至少一个预设标识类型的优先级,将所述匹配的标识类型中优先级最高的标识类型确定为所述主键标识类型。

在一种可能的实现方式中,所述根据所述主键标识类型,提取所述标识映射记录的主键标识,包括:

从所述标识映射记录所包含的多个标识中,确定属于所述主键标识类型的第一标识,所述第一标识的数目为一个或多个;

将所述第一标识作为所述标识映射记录的主键标识。

在一种可能的实现方式中,所述将所述多个映射数据源中具有相同主键标识的标识映射记录进行合并,包括:

对于具有相同主键标识的任两条标识映射记录,确定第二标识,所述第二标识为所述两条标识映射记录中相同的标识;

根据所述两条标识映射记录的主键标识和所述第二标识,对所述两条标识映射记录进行去重合并。

在一种可能的实现方式中,所述将所述多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录之后,所述方法还包括:

当接收到新标识映射记录时,根据所述至少一个预设标识类型,获取所述新标识映射记录的主键标识;

根据所述新标识映射记录的主键标识,从所述多条聚合映射记录中获取与所述新标识映射记录的主键标识匹配的目标聚合映射记录;

当所述新标识映射记录中的第三标识和所述目标聚合映射记录中的第四标识不相同时,则在所述目标聚合映射记录中,根据所述第三标识对所述第四标识进行更新,所述第三标识和所述第四标识为标识类型相同的标识。

根据本公开实施例的第二方面,提供一种信息聚合装置,包括:

第一获取模块,用于获取多个映射数据源,每个映射数据源包括多条标识映射记录,每一条标识映射记录用于指示同一设备不同类型标识的映射关系,不同映射数据源的标识映射记录所包含标识的类型不完全相同;

提取模块,用于根据至少一个预设标识类型,提取所述多个映射数据源所包括的每一条标识映射记录的主键标识,所述主键标识为标识类型与所述至少一个预设标识类型匹配的标识;

合并模块,用于将所述多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录,以聚合采用每一条聚合映射记录中不同标识采集的用户信息。

在一种可能的实现方式中,所述多个映射数据源分别用于指示设备的出厂信息映射关系、与指定标识关联的映射关系和与账号标识关联的映射关系中的至少两种映射关系,所述指定标识为根据设备的动态信息生成的标识,所述动态信息用于指示非设备强相关的信息。

在一种可能的实现方式中,所述提取模块,包括:

确定单元,对于所述多个映射源的每一条标识映射记录,根据所述至少一个预设标识类型,确定所述标识映射记录的主键标识类型;

提取单元,根据所述主键标识类型,提取所述标识映射记录的主键标识。

在一种可能的实现方式中,所述确定单元,用于:

根据所述至少一个预设标识类型,从所述标识映射记录所指示的多个标识类型中,确定与所述至少一个预设标识类型匹配的标识类型的数目;

如果所述数目大于1,则根据所述至少一个预设标识类型的优先级,将所述匹配的标识类型中优先级最高的标识类型确定为所述主键标识类型。

在一种可能的实现方式中,所述提取单元,用于:

从所述标识映射记录所包含的多个标识中,确定属于所述主键标识类型的第一标识,所述第一标识的数目为一个或多个;

将所述第一标识作为所述标识映射记录的主键标识。

在一种可能的实现方式中,所述合并模块,用于:

对于具有相同主键标识的任两条标识映射记录,确定第二标识,所述第二标识为所述两条标识映射记录中相同的标识;

根据所述两条标识映射记录的主键标识和所述第二标识,对所述两条标识映射记录进行去重合并。

在一种可能的实现方式中,所述装置还包括:

第二获取模块,用于当接收到新标识映射记录时,根据所述至少一个预设标识类型,获取所述新标识映射记录的主键标识;

第三获取模块,用于根据所述新标识映射记录的主键标识,从所述多条聚合映射记录中获取与所述新标识映射记录的主键标识匹配的目标聚合映射记录;

更新模块,用于当所述新标识映射记录中的第三标识和所述目标聚合映射记录中的第四标识不相同时,则在所述目标聚合映射记录中,根据所述第三标识对所述第四标识进行更新,所述第三标识和所述第四标识为标识类型相同的标识。

根据本公开实施例的第三方面,提供一种信息聚合装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:获取多个映射数据源,每个映射数据源包括多条标识映射记录,每一条标识映射记录用于指示同一设备不同类型标识的映射关系,不同映射数据源的标识映射记录所包含标识的类型不完全相同;根据至少一个预设标识类型,提取所述多个映射数据源所包括的每一条标识映射记录的主键标识,所述主键标识为标识类型与所述至少一个预设标识类型匹配的标识;将所述多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录,以聚合采用每一条聚合映射记录中不同标识采集的用户信息。

根据本公开实施例的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述程序被处理器执行时实现第一方面以及第一方面任一种可能的实现方式所述的信息聚合方法。

本公开的实施例提供的技术方案可以包括以下有益效果:

通过收集多个映射数据源,并根据预设的标识类型,提取该多个映射数据源的每一条标识映射记录的主键标识,进而根据主键标识对不同的标识映射记录进行合并,使得使用每一条聚合映射记录中不同标识采集的用户信息能够得到聚合,提高了信息聚合的全面性和准确性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种信息聚合方法的流程图。

图2a是根据一示例性实施例示出的一种信息聚合方法的流程图。

图2b是根据一示例性实施例示出的一种信息聚合的方法示意图。

图2c是根据一示例性实施例示出的一种信息更新的流程示意图。

图3是根据一示例性实施例示出的一种信息聚合装置的框图。

图4是根据一示例性实施例示出的一种信息聚合装置的框图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种信息聚合方法的流程图,如图1所示,该方法用于服务器中,包括以下步骤:

在步骤101中,获取多个映射数据源。

其中,每个映射数据源包括多条标识映射记录,每一条标识映射记录用于指示同一设备不同类型标识的映射关系,不同映射数据源的标识映射记录所包含标识的类型不完全相同。

在步骤102中,根据至少一个预设标识类型,提取该多个映射数据源所包括的每一条标识映射记录的主键标识,该主键标识为标识类型与该至少一个预设标识类型匹配的标识。

在步骤103中,将该多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录,以聚合采用每一条聚合映射记录中不同标识采集的用户信息。

本公开实施例提供的方法,通过收集多个映射数据源,并根据预设的标识类型,提取该多个映射数据源的每一条标识映射记录的主键标识,进而根据主键标识对不同的标识映射记录进行合并,使得使用每一条聚合映射记录中不同标识采集的用户信息能够得到聚合,提高了信息聚合的全面性和准确性。

在一种可能的实现方式中,该多个映射数据源分别用于指示设备的出厂信息映射关系、与指定标识关联的映射关系和与账号标识关联的映射关系中的至少两种映射关系,该指定标识为根据设备的动态信息生成的标识,该动态信息用于指示非设备强相关的信息。

在一种可能的实现方式中,该根据至少一个预设标识类型,提取该多个映射数据源所包括的每一条标识映射记录的主键标识,包括:

对于该多个映射源的每一条标识映射记录,根据该至少一个预设标识类型,确定该标识映射记录的主键标识类型;

根据该主键标识类型,提取该标识映射记录的主键标识。

在一种可能的实现方式中,该对于该多个映射源的每一条标识映射记录,根据该至少一个预设标识类型,确定该标识映射记录的主键标识类型,包括:

根据该至少一个预设标识类型,从该标识映射记录所指示的多个标识类型中,确定与该至少一个预设标识类型匹配的标识类型的数目;

如果该数目大于1,则根据该至少一个预设标识类型的优先级,将该匹配的标识类型中优先级最高的标识类型确定为该主键标识类型。

在一种可能的实现方式中,该根据该主键标识类型,提取该标识映射记录的主键标识,包括:

从该标识映射记录所包含的多个标识中,确定属于该主键标识类型的第一标识,该第一标识的数目为一个或多个;

将该第一标识作为该标识映射记录的主键标识。

在一种可能的实现方式中,该将该多个映射数据源中具有相同主键标识的标识映射记录进行合并,包括:

对于具有相同主键标识的任两条标识映射记录,确定第二标识,该第二标识为该两条标识映射记录中相同的标识;

根据该两条标识映射记录的主键标识和该第二标识,对该两条标识映射记录进行去重合并。

在一种可能的实现方式中,该将该多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录之后,该方法还包括:

当接收到新标识映射记录时,根据该至少一个预设标识类型,获取该新标识映射记录的主键标识;

根据该新标识映射记录的主键标识,从该多条聚合映射记录中获取与该新标识映射记录的主键标识匹配的目标聚合映射记录;

当该新标识映射记录中的第三标识和该目标聚合映射记录中的第四标识不相同时,则在该目标聚合映射记录中,根据该第三标识对该第四标识进行更新,该第三标识和该第四标识为标识类型相同的标识。

上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。

在对本公开实施例的详细流程进行介绍之前,首先对本公开实施例的应用场景进行概述。在本公开实施例中,同一设备可以通过不同的标识向服务器上报用户信息,服务器对应不同的标识存储相应的用户信息,该用户信息可以用户向终端进行信息的定向推送,比如定向推送的信息可以为广告信息、服务商业务办理信息、医疗咨询信息等。当设备是移动终端时,设备向服务器上报信息的标识不再是cookie,而是对应不同的应用采用设备的静态标识、指定标识或者账号标识等。因此,现有技术中针对pc端建立浏览器的cookie映射关系以进行信息聚合的方式已经不再适用。其中,用户信息可以包括用户的上网行为信息,比如终端应用的浏览记录、购物记录、收藏记录、兴趣偏好设置等。

其中,设备的静态标识是指设备强相关的(通常情况下不会发生变化)、能够唯一定位终端的标识,例如,终端的imei(internationalmobileequipmentidentity,国际移动设备身份码)、meid(mobileequipmentidentifier,移动设备识别码)、androidid、或者mac(mediaaccesscontrol,媒体访问控制)地址等。

其中,指定标识是指服务器生成并下发给设备的标识,该标识由服务器统一管理。例如,服务器可以根据设备的动态信息,为设备生成一个唯一的、且非设备强相关的标识。其中,设备的动态信息是指除设备的静态标识以外的信息。例如,设备的动态信息可以包括设备的一些设备信息和环境信息等,其中,设备信息可以包括设备的出厂时间、设备型号、生产商信息、本地系统信息等。环境信息可以包括设备所在位置以及网络服务商标识等可变化的信息。其中,终端的本地系统信息可以包括设备的首次开机时间和系统版本(如安卓系统版本等)等设备静态标识之外的信息。

其中,账号标识可以为设备的系统账号、或者为设备上所安装应用的应用账号。

需要说明的是,由于指定标识是根据设备的动态信息生成的,而且设备的动态信息是非设备强相关的,因此,采用指定标识来采集设备的用户信息,并向设备进行定向信息推送,即使该指定标识和对应的用户信息被窃取,也无法通过该指定标识对设备进行定位,更不可能利用用户信息向设备发送恶意信息,使得被窃取的用户信息没有任何利用价值,能够保证用户信息的隐私安全性。可见,采用指定标识进行信息采集和推送起到了一个匿名的作用,在实际应用中,可以将该指定标识称为aaid(anonymousadvertisingidentifier,匿名广告标识符),基于各个设备的aaid可以建立一个aaid信息采集和推送系统,该系统中服务器负责aaid的统一生成和管理。

当同一设备采用不同标识进行信息采集,或者同一用户拥有不同设备时,单单根据一个标识对应的用户信息进行信息推送,不能够全面的反映用户的真实信息,从而会导致推送的信息不够准确。因此,本公开实施例提供了一种信息聚合方法,可以将属于同一设备或者属于同一用户的信息进行聚合,详细过程参见图2a提供的实施例。

图2a是根据一示例性实施例示出的一种信息聚合方法的流程图,如图2a所示,该方法用于服务器中,包括以下步骤:

在步骤201中,获取多个映射数据源。

其中,每个映射数据源包括多条标识映射记录,每一条标识映射记录用于指示同一设备不同类型标识的映射关系。

在本公开实施例中,服务器可以从多个渠道获取到多个映射数据源,比如:

(1)从设备生产商获取不同设备的出厂信息映射关系。

该出厂信息映射关系可以包括设备的imei、mac地址、meid、sn(serialnumber,产品序列号)和出厂时间等信息。其中,当设备是移动终端时,imei可以包括imei1(单卡移动终端),或者可以包括imei1和imei2(双卡双待移动终端)。对于每一条出厂信息映射关系,服务器将该映射关系存储为一条标识映射记录。在实际应用中,该出厂信息映射关系可以根据设备的实际功能灵活变化,例如当设备为不具有电话功能的平板电脑时,该设备出厂信息映射关系中不包含设备的imei和meid。

(2)在使用过程中,获取不同设备的与指定标识关联的映射关系。

对于同一设备,与指定标识关联的映射关系可以由该设备上报至服务器,服务器将该映射关系记录为标识映射记录。

其中,该设备的与指定标识关联的映射关系可以是指该设备的指定标识、设备的静态标识、账号标识和上报时间等信息的对应关系。例如,针对单卡移动终端该映射关系可以为aaid、imei1、userid和date之间的对应关系,或者针对双卡双待移动终端该映射关系可以为aaid、imei1、imei2、userid和date之间的对应关系,或者针对不具有电话功能的平板电脑,该映射关系可以为aaid、mac地址、userid和date的对应关系。其中,当该设备未登录有任何账号标识时,该映射关系中也可以不包含账号标识。

(2)在使用过程中,获取不同设备的与账号标识关联的映射关系。

对于同一账号,与账号标识关联的映射关系可以由登录有该账号标识的设备上报至服务器,服务器将该映射关系记录为映射标识记录。

其中,与账号标识关联的映射关系可以是指账号标识、登录有该账号的设备的静态标识等信息的对应关系。例如,针对单卡移动终端该映射关系可以为userid和imei1之间的对应关系,或者针对双卡双待移动终端该映射关系可以为userid、imei1、imei2之间的对应关系,或者针对不具有电话功能的平板电脑,该映射关系可以为userid和mac地址之间的对应关系。

需要说明的是,本公开实施例中,将标识分为不同的标识类型,例如,aaid类型、imei类型、mac类型、userid类型、sn类型等。其中,imei1、imei2以及meid可以同属于imei类型。

在步骤202中,对于该多个映射源的每一条标识映射记录,根据至少一个预设标识类型,确定所述标识映射记录的主键标识类型。

其中,至少一个预设标识类型可以由服务器根据聚合需求预先设定或修改,本实施例对此不作限定。比如,该至少一个预设标识类型可以包括imei类型、mac类型、userid类型。

其中,根据至少一个预设标识类型,确定该标识映射记录的目标主键标识类型的过程可以为:根据至少一个预设标识类型,从标识映射记录所指示的多个标识类型中,确定与至少一个预设标识类型匹配的标识类型的数目;如果该数目大于1,则根据至少一个预设标识类型的优先级,将匹配的标识类型中优先级最高的标识类型确定为该主键标识类型;如果该数目等于1,则将该匹配的标识类型确定为该主键标识类型。其中,至少一个预设标识类型的优先级可以由服务器进行预先设定或修改,本实施例对此不作限定。

例如,该至少一个预设标识类型包括imei类型、mac类型、userid类型,其中,优先级从高到低的顺序为imei类型、mac类型、userid类型,假如一条标识映射记录中包括的多个标识的标识类型分别为imei类型、mac类型、sn类型,则该条标识映射记录中与预设标识类型匹配的标识类型有两个,分别为imei类型和mac类型,由于imei类型的优先级高于mac类型的优先级,则将imei类型确定为该条标识映射记录的主键标识类型。

在步骤203中,根据该标识映射记录的主键标识类型,提取该标识映射记录的主键标识。

其中,根据该标识映射记录的主键标识类型,对该标识映射记录进行主键标识提取的过程可以为:从该标识映射记录所包含的多个标识中,确定属于该主键标识类型的第一标识;将第一标识作为标识映射记录的主键标识。

其中,第一标识的数目可以为一个或多个,也即是该标识映射记录中属于该主键标识类型的标识数目为可以一个或多个。例如,当该主键标识类型为imei类型,该标识映射记录中同时包括imei1标识和imei2标识时,该第一标识的数目即为2个。

需要说明的是,当第一标识的数目为多个时,在一种实施方式中,可以将该多个第一标识均作为该标识映射记录的主键标识;在另一种实施方式中,可以按照预设优先级的高低,从该多个第一标识映射记录中选取优先级最高的第一标识作为该标识映射记录的第一主键标识,将优先级较低的其他第一标识作为该标识映射记录的第二主键标识,并建立第一主键标识与第二主键标识的映射关系。其中,预设优先级可以由服务器进行预先设定或修改,本实施例对此不作限定。例如,当2个第一标识分别为imei1标识和imei2标识时,可以设定imei1标识的优先级高于imei2标识的优先级,则将imei1标识确定为该标识映射记录的第一主键标识,将imei2标识作为该标识映射记录的第二主键标识,并建立imei1标识和imei2标识的映射关系。

需要说明的是,服务器还可以在获取该多个映射数据源时,便对获取的每一条标识映射记录进行主键标识提取,也可以在获取到多个映射数据源之后,根据实际应用需求,对该多个数据源的每一条标识映射记录再进行主键标识提取,本实施例对此不作限定。

上述步骤202和步骤203是根据至少一个预设标识类型,提取多个映射数据源所包括的每一条标识映射记录的主键标识的过程。

在步骤204中,将多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录,以聚合采用每一条聚合映射记录中不同标识采集的用户信息。

其中,将多个映射数据源中具有相同主键标识的标识映射记录进行合并的过程可以为:对于具有相同主键标识的任两条标识映射记录,确定第二标识,第二标识为该两条标识映射记录中相同的标识;根据该两条标识映射记录的主键标识和第二标识,对两条标识映射记录进行去重合并。

其中,本实施例中对于多个映射数据源中的任两条标识映射记录,服务器确定该两条标识映射记录具有相同主键标识包括以下两种情况:

第一种情况,该两条标识映射记录的主键标识类型相同,且主键标识的个数均为1。

在该种情况下,如果该两条标识映射记录的主键标识相同,则确定该两条标识映射记录具有相同的主键标识。

第二种情况,当该两条映射记录的主键标识类型相同,且其中至少一条标识映射记录的主键标识的个数大于1。

在该种情况下,当该两条标识映射记录中存在相同的主键标识,则确定该两条标识映射记录具有相同的主键标识。例如,标识映射记录1的主键标识为imei1(a)和imei2(b),而标识映射记录2的主键标识为imei1(a),则确定该标识映射记录1和标识映射记录2具有相同的主键标识imei1(a)。

其中,根据该两条标识映射记录的主键标识和第二标识,对两条标识映射记录进行去重合并的过程包括:以该两条标识映射记录相同的主键标识为主键,对该两条标识映射记录进行合并,对于该两条标识映射记录中相同的第二标识,在合并后仅保留一份第二标识,对重复的另一份第二标识进行删除。

需要说明的是,针对aaid标识,用户可以在设备选择重置该aaid标识,也即是,一个设备可以对应多个aaid标识,当多个aaid标识对应的imei相同时,在进行标识映射记录合并时,服务器会在一条聚合标识映射记录中同时记录该多个aaid标识,比如,聚合标识映射记录包括一个aaid列表以记录该多个aaid标识。其中,将上报时间最靠近系统时间的aaid标识确定为设备当前使用的aaid标识。

本公开实施例中,通过将属于同一设备(或用户)的不同标识进行映射,可以将采用该不同标识采集的用户信息进行聚合,从而能够更加全面、准确的反映用户真实情况,并在根据该聚合的用户信息进行信息推送时,能够提高推送信息的精准度。

为了更加形象的说明上述信息聚合的过程,下面结合图2b对上述过程进行举例说明。

例如,标识映射记录1用于指示出厂信息映射关系,比如为imei1(a)、imei2(b)、mac1、sn1、factorytime1。标识映射记录2用于指示与aaid关联的映射关系,比如为:imei1(a)、aaid1、userid1、date1。标识映射记录2用于指示与账户标识关联的映射关系,比如为:userid1、imei1(a)。

以imei为主键标识类型,对该三个标识映射记录进行主键标识提取,得到标识映射记录1的主键标识为[imei1(a)、imei2(b)],标识映射记录2的主键标识为imei1(a),标识映射记录3的主键标识为imei1(a)。因此,对该三个标识映射记录进行合并可以得到聚合标识映射记录:[imei1(a)]、imei2(b)、mac1、sn1、factorytime1、aaid1、userid1、date1。其中,[imei1(a)]表示该聚合标识映射记录的主键标识为imei1(a)。根据该聚合标识映射记录可知,采用该聚合标识映射记录的任一个标识采集得到的用户信息均能够得到聚合。

本公开实施例还可以在设备标识发生变化时,对该设备对应的聚合映射记录进行更新,以保证服务器存储的聚合映射记录能够真实的反映设备的最新标识,参见图2c,该更新过程可以包括以下步骤:

步骤1:当接收到新标识映射记录时,根据至少一个预设标识类型,获取该新标识映射记录的主键标识。

该步骤与上述步骤203提取主键标识的过程同理,在此不作赘述。

步骤2:根据该新标识映射记录的主键标识,从多条聚合映射记录中获取与新标识映射记录的主键标识匹配的目标聚合映射记录。

该步骤中,将多条聚合映射记录中与该新标识映射记录的主键标识相同的聚合映射记录,确定为该目标聚合映射记录。

例如,当该新标识映射记录的主键标识为imei1(a)时,将主键标识为imei1(a)的聚合映射记录作为目标聚合映射记录。

步骤3:当新标识映射记录中的第三标识和目标聚合映射记录中的第四标识不相同时,则在目标聚合映射记录中,根据第三标识对第四标识进行更新。

其中,第三标识和第四标识为标识类型相同的标识。

在该步骤中,当第三标识和第四标识不相同时,说明该目标聚合映射记录所指示的设备或者用户的相关标识发生了变化,本实施例中需要记录该变化,也即,在该目标聚合映射记录中,根据第三标识对该第四标识进行更新。在一种实施方式中,该更新过程可以为在该目标聚合映射记录中将该第四标识替换为该第三标识。例如,当mac地址发生变化时,可以将旧mac地址替换为新mac地址。在另一种实施方式中,该更新过程可以为将该第三标识添加到该目标聚合映射记录中。例如,当设备的aaid发生变化时,将新aaid添加到目标聚合映射记录的aaid列表中,并确定该新aaid为设备当前使用的aaid标识。

需要说明的是,服务器可以根据预设周期对存储的聚合映射记录进行更新,该预设周期可以由服务器根据数据实时性需求进行预先设定或修改,比如,该预设周期为一天、一周等。

需要说明的是,为了防止标识伪造,当服务器接收到的标识映射记录中的主键标识与存储的多个聚合标识映射记录的主键标识均不匹配时,将该标识映射记录标记为可疑记录,后续服务器可以对可疑记录进行分析,以定位伪造方式和伪造设备,通过对伪造设备进行限制以消除标识伪造隐患。

需要说明的是,本公开实施例提供的信息聚合方法,根据聚合的主键标识类型的不同可以实现同一设备的用户信息的聚合、以及同一个用户账号关联的用户信息的聚合。比如,当主键标识类型为imei时,可以将同一个设备的用户信息进行聚合,此时,该设备进行信息采集的标识可以为imei标识、aaid标识、mac地址、sn码或者userid中的一种或多种。当主键标识类型为userid时,可以将同一用户相关的用户信息进行聚合,此时,用户拥有设备1和设备2,在该设备1和设备2上登录有相同的账号,则设备1和设备2即便是采用不同的aaid标识进行信息采集,也能够将该设备1和设备2的用户信息采用userid聚合在一起,从而实现了跨设备的信息聚合。

在本公开实施例中,由于通过聚合映射记录可以得到全面的用户信息,因此,为了保证用户信息的安全性,服务器对聚合映射记录进行加密存储,并对该聚合映射记录的访问权限设置为最高,以降低用户信息的安全风险。在实际信息推送的过程中,服务器根据存储的多条聚合映射记录,对外提供两种信息处理服务,在线处理服务和离线处理服务。其中,在线处理服务用于处理对少量设备的信息推送请求,例如,将少量设备的aaid标识携带在信息推送请求中,服务器通过在线处理接口接收到信息推送请求后,根据接收的aaid标识,从存储的聚合映射记录中确定与该aaid标识匹配的聚合映射记录,从而对匹配的聚合映射记录所指示的用户信息进行分析,返回与该用户信息匹配的推送信息。其中,离线处理服用于进行信息推送的批量处理,例如通过hdfs(hadoopdistributedfilesystem,hadoop分布式文件系统)提供离线批量处理服务。

本公开实施例提供的方法,通过收集多个映射数据源,并根据预设的标识类型,提取该多个映射数据源的每一条标识映射记录的主键标识,进而根据主键标识对不同的标识映射记录进行合并,使得使用每一条聚合映射记录中不同标识采集的用户信息能够得到聚合,提高了信息聚合的全面性和准确性。

图3是根据一示例性实施例示出的一种信息聚合装置的框图。参照图3,该装置包括第一获取模块301,提取模块302和合并模块303。

其中,第一获取模块301,用于获取多个映射数据源,每个映射数据源包括多条标识映射记录,每一条标识映射记录用于指示同一设备不同类型标识的映射关系,不同映射数据源的标识映射记录所包含标识的类型不完全相同。

提取模块302,用于根据至少一个预设标识类型,提取该多个映射数据源所包括的每一条标识映射记录的主键标识,该主键标识为标识类型与该至少一个预设标识类型匹配的标识。

合并模块303,用于将该多个映射数据源中具有相同主键标识的标识映射记录进行合并,得到多条聚合映射记录,以聚合采用每一条聚合映射记录中不同标识采集的用户信息。

在一种可能的实现方式中,该多个映射数据源分别用于指示设备的出厂信息映射关系、与指定标识关联的映射关系和与账号标识关联的映射关系中的至少两种映射关系,该指定标识为根据设备的动态信息生成的标识,该动态信息用于指示非设备强相关的信息。

在一种可能的实现方式中,该提取模块,包括:

确定单元,对于该多个映射源的每一条标识映射记录,根据该至少一个预设标识类型,确定该标识映射记录的主键标识类型;

提取单元,根据该主键标识类型,提取该标识映射记录的主键标识。

在一种可能的实现方式中,该确定单元,用于:

根据该至少一个预设标识类型,从该标识映射记录所指示的多个标识类型中,确定与该至少一个预设标识类型匹配的标识类型的数目;

如果该数目大于1,则根据该至少一个预设标识类型的优先级,将该匹配的标识类型中优先级最高的标识类型确定为该主键标识类型。

在一种可能的实现方式中,该提取单元,用于:

从该标识映射记录所包含的多个标识中,确定属于该主键标识类型的第一标识,该第一标识的数目为一个或多个;

将该第一标识作为该标识映射记录的主键标识。

在一种可能的实现方式中,该合并模块,用于:

对于具有相同主键标识的任两条标识映射记录,确定第二标识,该第二标识为该两条标识映射记录中相同的标识;

根据该两条标识映射记录的主键标识和该第二标识,对该两条标识映射记录进行去重合并。

在一种可能的实现方式中,该装置还包括:

第二获取模块,用于当接收到新标识映射记录时,根据该至少一个预设标识类型,获取该新标识映射记录的主键标识;

第三获取模块,用于根据该新标识映射记录的主键标识,从该多条聚合映射记录中获取与该新标识映射记录的主键标识匹配的目标聚合映射记录;

更新模块,用于当该新标识映射记录中的第三标识和该目标聚合映射记录中的第四标识不相同时,则在该目标聚合映射记录中,根据该第三标识对该第四标识进行更新,该第三标识和该第四标识为标识类型相同的标识。

本公开实施例提供的装置,通过收集多个映射数据源,并根据预设的标识类型,提取该多个映射数据源的每一条标识映射记录的主键标识,进而根据主键标识对不同的标识映射记录进行合并,使得使用每一条聚合映射记录中不同标识采集的用户信息能够得到聚合,提高了信息聚合的全面性和准确性。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种信息采集装置的框图。例如,装置400可以被提供为一服务器。参照图4,装置400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理组件422的执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述信息聚合方法实施例中服务器所执行的方法。

装置400还可以包括一个电源组件426被配置为执行装置400的电源管理,一个有线或无线网络接口450被配置为将装置400连接到网络,和一个输入输出(i/o)接口458。装置400可以操作基于存储在存储器432的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。

在示例性实施例中,还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述信息聚合方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1