用户画像数据处理方法及装置与流程

文档序号:16688632发布日期:2019-01-22 18:35阅读:239来源:国知局
用户画像数据处理方法及装置与流程

本公开涉及数据处理技术领域,尤其涉及用户画像数据处理方法及装置。



背景技术:

目前在数据统计领域,因为统计的维度不同,一定会涉及到用户标识(id)和设备id这两种id的关联,推送面对海量的用户id数据和复杂的统计逻辑,需要在数据清洗和数据分析层面对不同id进行映射整合。

相关技术中,通过将各类用户id和设备id进行关联映射和聚合,以提升数据质量。



技术实现要素:

为克服相关技术中存在的问题,本公开实施例提供一种用户画像数据处理方法及装置。所述技术方案如下:

根据本公开实施例的第一方面,提供一种用户画像数据处理方法,方法包括:

根据预先确定的至少两个型号核准号码tac,批量生成基于各所述tac的国际移动设备识别码imei;

将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeimd5进行匹配,建立各所述imei与所述第一用户画像数据中imeimd5的映射关系;

搜索出所述第一用户画像数据中已关联单个imeimd5的设备标签,所述单个imeimd5记为第一imeimd5;

根据双卡双待设备的两个imei的生产顺序号snr最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeimd5关联同一个设备的目标imeimd5,并将所述目标imeimd5与所述第一imeimd5关联至同一个设备标签。

本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案根据批量生成的各imei与第一用户画像数据中imeimd5的映射关系,利用双卡双待设备的两个imei的snr最后一位为连号关系的特性,搜索到第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,将第一imeimd5和目标imeimd5确定为同一双卡双待设备的两个imei所对应的imeimd5并进行关联,从而达到数据聚合的目的,能够提高数据质量,如此,能够提高信息推送的准确性和可靠性。

在一个实施例中,所述根据双卡双待设备的两个imei的snr最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeimd5关联同一个设备的目标imeimd5,包括:

根据所述映射关系,确定各所述imei中与所述第一imeimd5对应的第一imei、及与所述第一imei的snr最后一位为连号关系的第二imei和第三imei;

根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeimd5和第三imeimd5;

确定所述第一用户画像数据中所述第一imeimd5、第二imeimd5和第三imeimd5分别关联的第一用户标识、第二用户标识和第三用户标识;

将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeimd5确定为所述目标imeimd5。

在一个实施例中,所述方法还包括:

搜索出所述第一用户画像数据中已关联两个imeimd5的设备标签;

根据所述映射关系,确定各所述imei中与所述两个imeimd5分别对应的两个imei;

当所述两个imei的snr最后一位不是连号关系时,将所述两个imeimd5确定为脏数据;

将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。

在一个实施例中,在所述将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配之前,所述方法还包括:

获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;

将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。

在一个实施例中,所述加密后的设备标识,包括:imeimd5、加密后的移动设备识别码meidmd5、及macmd5。

根据本公开实施例的第二方面,提供一种用户画像数据处理装置,装置包括:

第一生成模块,用于根据预先确定的至少两个型号核准号码tac,批量生成基于各所述tac的国际移动设备识别码imei;

映射模块,用于将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeimd5进行匹配,建立各所述imei与所述第一用户画像数据中imeimd5的映射关系;

第一搜索模块,用于搜索出所述第一用户画像数据中已关联单个imeimd5的设备标签,所述单个imeimd5记为第一imeimd5;

关联模块,用于根据双卡双待设备的两个imei的生产顺序号snr最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeimd5关联同一个设备的目标imeimd5,并将所述目标imeimd5与所述第一imeimd5关联至同一个设备标签。

在一个实施例中,所述关联模块,包括:

第一确定子模块,用于根据所述映射关系,确定各所述imei中与所述第一imeimd5对应的第一imei、及与所述第一imei的snr最后一位为连号关系的第二imei和第三imei;

第二确定子模块,用于根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeimd5和第三imeimd5;

第三确定子模块,用于确定所述第一用户画像数据中所述第一imeimd5、第二imeimd5和第三imeimd5分别关联的第一用户标识、第二用户标识和第三用户标识;

第四确定子模块,用于将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeimd5确定为所述目标imeimd5。

在一个实施例中,所述装置还包括:

第二搜索模块,用于搜索出所述第一用户画像数据中已关联两个imeimd5的设备标签;

确定模块,用于根据所述映射关系,确定各所述imei中与所述两个imeimd5分别对应的两个imei;

过滤模块,用于当所述两个imei的snr最后一位不是连号关系时,将所述两个imeimd5确定为脏数据,及将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。

在一个实施例中,所述装置还包括:

获取模块,用于获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;

第二生成模块,用于将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。

根据本公开实施例的第三方面,提供一种用户画像数据处理装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

根据预先确定的至少两个型号核准号码tac,批量生成基于各所述tac的国际移动设备识别码imei;

将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeimd5进行匹配,建立各所述imei与所述第一用户画像数据中imeimd5的映射关系;

搜索出所述第一用户画像数据中已关联单个imeimd5的设备标签,所述单个imeimd5记为第一imeimd5;

根据双卡双待设备的两个imei的生产顺序号snr最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeimd5关联同一个设备的目标imeimd5,并将所述目标imeimd5与所述第一imeimd5关联至同一个设备标签。

根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述第一方面中任意一项所述方法实施例的步骤。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的用户画像数据处理方法的流程图。

图2是根据一示例性实施例示出的用户画像数据处理方法的流程图。

图3是根据一示例性实施例示出的用户画像数据处理方法的流程图。

图4是根据一示例性实施例示出的用户画像数据处理装置的框图。

图5是根据一示例性实施例示出的用户画像数据处理装置的框图。

图6是根据一示例性实施例示出的用户画像数据处理装置的框图。

图7是根据一示例性实施例示出的用户画像数据处理装置的框图。

图8是根据一示例性实施例示出的用户画像数据处理装置的框图。

图9是根据一示例性实施例示出的装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

相关技术中,通过将各类用户id和设备id进行关联映射和聚合,以此提升数据质量。但是,同一台双卡双待设备一般有两个国际移动设备识别码(imei,internationalmobileequipmentidentificationnumber)并对应两个imei信息-摘要算法5(md5,message-digestalgorithm5),而在数据采集阶段,由于上报机制或者上报漏洞,导致设备每次连接后台的服务器时只上传一个imeimd5,因此针对同一台设备在服务器中就会记录两个用户标识及imeimd5,即同一台设备被当做了两台设备,这就导致统计结果虚高,严重降低数据质量,导致上层业务没有办法明确知晓哪些id代表同一台设备,从而为业务发展带来隐患,造成信息推送的准确性和可靠性较差。

为了解决上述问题,本公开实施例提供了一种用户画像数据处理方法,方法包括:根据预先确定的至少两个型号核准号码(tac),批量生成基于各tac的imei;将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配,建立各imei与第一用户画像数据中imeimd5的映射关系;搜索出第一用户画像数据中已关联单个imeimd5的设备标签,单个imeimd5记为第一imeimd5;根据双卡双待设备的两个imei的生产顺序号(snr)最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,并将目标imeimd5与第一imeimd5关联至同一个设备标签。本公开实施例根据批量生成的各imei与第一用户画像数据中imeimd5的映射关系,利用双卡双待设备的两个imei的snr最后一位为连号关系的特性,搜索到第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,将第一imeimd5和目标imeimd5确定为同一双卡双待设备的两个imei所对应的imeimd5并进行关联,从而达到数据聚合的目的,能够提高数据质量,提高信息推送的准确性和可靠性。

在上述分析的基础上,下面介绍本公开方法实施例。

图1是根据一示例性实施例示出的一种用户画像数据处理方法的流程图;该方法的执行主体可以为服务器;如图1所示,该方法包括以下步骤101-104:

在步骤101中,根据预先确定的至少两个tac,批量生成基于各tac的imei。

示例的,对于市面上的设备,由于前十大品牌占据了新增设备量的绝大多数份额,因此通过有效清洗前十大品牌的设备所对应的数据,即可大幅度提高数据质量。由于数据采集的时候通常也会采集设备的机型,因此可以在第一用户画像数据中通过imeimd5找到关联的机型、品牌等信息。同时,imei是由tac、snr、sp等组成,其中tac为前8位数字,可以唯一标识一类机型;snr为后6位数字,可以标识生产顺序号;sp为预留备用。通过分析公开渠道获取的imei可以获知这些imei对应的tac,进而获知市面杀青都有哪些tac存在,将这些tac作为预先确定的至少两个不同机型的tac。根据这些tac,批量生成基于各tac的两个以上的imei。

在步骤102中,将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配,建立各imei与第一用户画像数据中imeimd5的映射关系。

示例的,在第一用户画像数据中搜索与各imei对应的第一imeimd5。例如,将各imei分别加密得到分别与各imei对应的第二imeimd5;将第二imeimd5与第一用户画像数据中imeimd5进行匹配;将第一用户画像数据中与第二imeimd5匹配的imeimd5,确定为第一用户画像数据中与各imei对应的第一imeimd5;建立各imei与第一imeimd5的映射关系。

示例的,在将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配之前,获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。

示例的,待处理用户画像数据包括:新增的用户画像数据、及历史的用户画像数据。例如,可以每天将日志中新增的用户画像数据按照用户标识(uuid)为key存储起来,接着和历史的用户画像数据组合起来形成全部的以uuid为key的待处理用户画像,待处理用户画像数据包括uuid、imeimd5、移动设备识别码(meid,mobilestationequipmentidentifier)及macmd5。可选的,待处理用户画像数据还可以包括国际移动用户识别码(imsi,internationalmobilesubscriberidentificationnumber)。需要说明的是,处于用户隐私保护的原因,服务器不能直接采集设备的imei,只能采集加密的imei然后存储,例如imeimd5。可选的,加密后的设备标识包括:imeimd5、meidmd5、及macmd5。

示例的,待处理用户画像数据的维度可以包括uuid、imeimd5、meidmd5、及macmd5。示例的,分别以各加密后的设备标识为关键字对待处理用户画像数据进行拆分并重新聚合;将上述拆分并重新聚合的步骤迭代执行两次,得到各加密后的设备标识各自对应的值;根据各加密后的设备标识各自对应的值,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。经过三轮的打散及聚合处理之后,各加密后的设备标识都有了聚合之后的值,而设备标签与具有相同值的加密后的设备标识建立一对多的映射关系;从而通过将待处理用户画像数据拆分并重新聚合,迭代三次后生成以设备标签为关键字的第一用户画像数据。需要说明的是,通常双卡双待设备可能会有2个imeimd5和1个meidmd5,因此,最多只需3轮聚合即可实现用户画像数据的数据存储形式的转变。

在步骤103中,搜索出第一用户画像数据中已关联单个imeimd5的设备标签,单个imeimd5记为第一imeimd5。

在步骤104中,根据双卡双待设备的两个imei的snr最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,并将目标imeimd5与第一imeimd5关联至同一个设备标签。

示例的,根据映射关系,确定各imei中与第一imeimd5对应的第一imei、及与第一imei的snr最后一位为连号关系的第二imei和第三imei;根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeimd5和第三imeimd5;确定第一用户画像数据中第一imeimd5、第二imeimd5和第三imeimd5分别关联的第一用户标识、第二用户标识和第三用户标识;将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeimd5确定为目标imeimd5。目标imeimd5与第一imeimd5所对应的目标imei和第一imei的snr最后一位为连号关系,即目标imei和第一imei为连号第一imei;将两个连号imei所对应的imeimd5进行关联,关联至同一个设备标签。

本公开实施例提供的技术方案,根据批量生成的各imei与第一用户画像数据中imeimd5的映射关系,利用双卡双待设备的两个imei的snr最后一位为连号关系的特性,搜索到第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,将第一imeimd5和目标imeimd5确定为同一双卡双待设备的两个连号imei所对应的imeimd5并进行关联,从而达到数据聚合的目的,能够提高数据质量,如此,能够提高信息推送的准确性和可靠性。

图2是根据一示例性实施例示出的一种用户画像数据处理方法的流程图。如图2所示,在图1所示实施例的基础上,本公开涉及的用户画像数据处理方法可以包括以下步骤201-207:

在步骤201中,根据预先确定的至少两个tac,批量生成基于各tac的imei。

在步骤202中,将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配,建立各imei与第一用户画像数据中imeimd5的映射关系。

在步骤203中,搜索出第一用户画像数据中已关联单个imeimd5的设备标签,单个imeimd5记为第一imeimd5。

在步骤204中,根据双卡双待设备的两个imei的snr最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,并将目标imeimd5与第一imeimd5关联至同一个设备标签。

在步骤205中,搜索出第一用户画像数据中已关联两个imeimd5的设备标签。

在步骤206中,根据映射关系,确定各imei中与两个imeimd5分别对应的两个imei。

示例的,针对第一用户画像数据中已经关联了两个imeimd5的设备标签,若各imei中与上述两个imeimd5分别对应的两个imei的snr最后一位是连号关系,则说明该关联了上述两个imeimd5的设备标签的关联关系是正确的;若各imei中与上述两个imeimd5分别对应的两个imei的snr最后一位不是连号关系,则说明该关联了上述两个imeimd5的设备标签的关联关系是错误的,上述两个imeimd5并不能聚合成一个deviceid,需要将设备标签作为脏数据进行清洗处理,将脏数据从第一用户画像数据中过滤。

在步骤207中,当两个imei的snr最后一位不是连号关系时,将两个imeimd5确定为脏数据;将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。

本公开实施例提供的技术方案,通过对于已经关联两个imeimd5的设备标签进行分析,若各imei中与上述两个imeimd5分别对应的两个imei的snr最后一位不是连号关系,则说明该关联了上述两个imeimd5的设备标签的关联关系是错误的,上述两个imeimd5并不能聚合成一个deviceid,需要将设备标签作为脏数据进行清洗处理,将脏数据从第一用户画像数据中过滤,提高数据质量,提高信息推送的准确性和可靠性。

图3是根据一示例性实施例示出的一种用户画像数据处理方法的流程图。如图3所示,在图1所示实施例的基础上,本公开涉及的用户画像数据处理方法可以包括以下步骤301-308:

在步骤301中,根据预先确定的至少两个tac,批量生成基于各tac的imei。

在步骤302中,将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配,建立各imei与第一用户画像数据中imeimd5的映射关系。

在步骤303中,搜索出第一用户画像数据中已关联单个imeimd5的设备标签,单个imeimd5记为第一imeimd5。

在步骤304中,根据映射关系,确定各imei中与第一imeimd5对应的第一imei、及与第一imei的snr最后一位为连号关系的第二imei和第三imei。

在步骤305中,根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeimd5和第三imeimd5。

在步骤306中,确定第一用户画像数据中第一imeimd5、第二imeimd5和第三imeimd5分别关联的第一用户标识、第二用户标识和第三用户标识。

在步骤307中,将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeimd5确定为目标imeimd5。

在步骤308中,将目标imeimd5与第一imeimd5关联至同一个设备标签。

示例的,为了将第一用户画像数据中属于同一双卡双待设备的两个imei所对应的imeimd5尽可能地关联,可以迭代执行步骤303至步骤308的方案,例如将步骤303至步骤308的方案迭代执行15轮。

至此优化后的设备标签新增了一些imeimd5、uuid以及macmd5的映射关系,再将这些映射打散,以imeimd5和macmd5为key重新进行3轮迭代,生成最新的设备标签。

本公开实施例提供的技术方案,根据双卡双待设备的两个imei的snr最后一位为连号关系的特性,搜索第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,将第一imeimd5和目标imeimd5进行关联,以达到数据聚合的目的,能够提高数据质量,如此,能够提高信息推送的准确性和可靠性。

下述为本公开装置实施例,可以用于执行本公开方法实施例。

图4是根据一示例性实施例示出的一种用户画像数据处理装置的框图;该装置可以采用各种方式来实施,例如在服务器中实施装置的全部组件,或者,在服务器侧以耦合的方式实施装置中的组件;该装置可以通过软件、硬件或者两者的结合实现上述本公开涉及的方法;

如图4所示,该用户画像数据处理装置包括:第一生成模块401、映射模块402、第一搜索模块403及关联模块404,其中:

第一生成模块401被配置为根据预先确定的至少两个tac,批量生成基于各tac的imei;

映射模块402被配置为将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配,建立各imei与第一用户画像数据中imeimd5的映射关系;

第一搜索模块403被配置为搜索出第一用户画像数据中已关联单个imeimd5的设备标签,单个imeimd5记为第一imeimd5;

关联模块404被配置为根据双卡双待设备的两个imei的snr最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,并将目标imeimd5与第一imeimd5关联至同一个设备标签。

本公开实施例提供的装置能够用于执行图1所示实施例的技术方案,其执行方式和有益效果类似,此处不再赘述。

在一种可能的实施方式中,如图5所示,图4示出的用户画像数据处理装置还可以包括把关联模块404配置成包括:第一确定子模块501、第二确定子模块502、第三确定子模块503及第四确定子模块504,其中:

第一确定子模块501被配置为根据映射关系,确定各imei中与第一imeimd5对应的第一imei、及与第一imei的snr最后一位为连号关系的第二imei和第三imei;

第二确定子模块502被配置为根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeimd5和第三imeimd5;

第三确定子模块503被配置为确定第一用户画像数据中第一imeimd5、第二imeimd5和第三imeimd5分别关联的第一用户标识、第二用户标识和第三用户标识;

第四确定子模块504被配置为将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeimd5确定为目标imeimd5。

在一种可能的实施方式中,如图6所示,图4示出的用户画像数据处理装置还可以包括:第二搜索模块601、确定模块602及过滤模块603,其中:

第二搜索模块601被配置为搜索出第一用户画像数据中已关联两个imeimd5的设备标签;

确定模块602被配置为根据映射关系,确定各imei中与两个imeimd5分别对应的两个imei;

过滤模块603被配置为当两个imei的snr最后一位不是连号关系时,将两个imeimd5确定为脏数据,及将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。

在一种可能的实施方式中,如图7所示,图4示出的用户画像数据处理装置还可以包括:获取模块701及第二生成模块702,其中:

获取模块701被配置为获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;

第二生成模块702被配置为将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。

图8是根据一示例性实施例示出的一种用户画像数据处理装置800的框图,用户画像数据处理装置800适用于服务器,用户画像数据处理装置800包括:

处理器801;

用于存储处理器可执行指令的存储器802;

其中,处理器801被配置为:

根据预先确定的至少两个tac,批量生成基于各tac的imei;

将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配,建立各imei与第一用户画像数据中imeimd5的映射关系;

搜索出第一用户画像数据中已关联单个imeimd5的设备标签,单个imeimd5记为第一imeimd5;

根据双卡双待设备的两个imei的snr最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,并将目标imeimd5与第一imeimd5关联至同一个设备标签。

在一个实施例中,上述处理器801还可被配置为:

根据映射关系,确定各imei中与第一imeimd5对应的第一imei、及与第一imei的snr最后一位为连号关系的第二imei和第三imei;

根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeimd5和第三imeimd5;

确定第一用户画像数据中第一imeimd5、第二imeimd5和第三imeimd5分别关联的第一用户标识、第二用户标识和第三用户标识;

将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeimd5确定为目标imeimd5。

在一个实施例中,上述处理器801还可被配置为:

搜索出第一用户画像数据中已关联两个imeimd5的设备标签;

根据映射关系,确定各imei中与两个imeimd5分别对应的两个imei;

当两个imei的snr最后一位不是连号关系时,将两个imeimd5确定为脏数据;

将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。

在一个实施例中,上述处理器801还可被配置为:

获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;

将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。

在一个实施例中,加密后的设备标识,包括:imeimd5、加密后的移动设备识别码meidmd5、及macmd5。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图9是根据一示例性实施例示出的一种装置的框图。例如,装置900可以被提供为一服务器。装置900包括处理组件902,其进一步包括一个或多个处理器,以及由存储器903所代表的存储器资源,用于存储可由处理组件902的执行的指令,例如应用程序。存储器903中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件902被配置为执行指令,以执行上述方法。

装置900还可以包括一个电源组件906被配置为执行装置900的电源管理,一个有线或无线网络接口905被配置为将装置900连接到网络,和一个输入输出(i/o)接口908。装置900可以操作基于存储在存储器903的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。

一种非临时性计算机可读存储介质,当存储介质中的指令由装置900的处理器执行时,使得装置900能够执行如下方法:

根据预先确定的至少两个tac,批量生成基于各tac的imei;

将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配,建立各imei与第一用户画像数据中imeimd5的映射关系;

搜索出第一用户画像数据中已关联单个imeimd5的设备标签,单个imeimd5记为第一imeimd5;

根据双卡双待设备的两个imei的snr最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,并将目标imeimd5与第一imeimd5关联至同一个设备标签。

在一个实施例中,根据双卡双待设备的两个imei的snr最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeimd5关联同一个设备的目标imeimd5,包括:

根据映射关系,确定各imei中与第一imeimd5对应的第一imei、及与第一imei的snr最后一位为连号关系的第二imei和第三imei;

根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeimd5和第三imeimd5;

确定第一用户画像数据中第一imeimd5、第二imeimd5和第三imeimd5分别关联的第一用户标识、第二用户标识和第三用户标识;

将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeimd5确定为目标imeimd5。

在一个实施例中,方法还包括:

搜索出第一用户画像数据中已关联两个imeimd5的设备标签;

根据映射关系,确定各imei中与两个imeimd5分别对应的两个imei;

当两个imei的snr最后一位不是连号关系时,将两个imeimd5确定为脏数据;

将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。

在一个实施例中,在将各imei加密后与以设备标签为关键字第一用户画像数据中的imeimd5进行匹配之前,方法还包括:

获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;

将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。

在一个实施例中,加密后的设备标识,包括:imeimd5、meidmd5、及macmd5。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1