一种识别网络用户的方法、装置和计算设备与流程

文档序号:12278214阅读:172来源:国知局
一种识别网络用户的方法、装置和计算设备与流程

本发明涉及计算机及互联网技术领域,尤其涉及一种识别网络用户的方法、装置和计算设备。



背景技术:

随着互联网技术的快速发展和电子商务的日渐普及,网络信息资源的数量急剧增长,信息提供商总是希望能够根据用户的偏好为用户推荐感兴趣或者需要的商品资源。因此,如何从海量的数据访问信息中准确识别出不同标识下的同一用户,以获取该用户连续而完整的用户行为,从而更好地构建用户画像,已经成为运营商在互联网业务拓展中的重中之重。

通常,运营商通过多屏浏览日志、电话询价等渠道收集到的用户信息以不同的用户标识出现,且一个用户往往有多种用户标识。传统的识别同一用户的方法是:通过各种途径收集用户标识之间的关系。如用户在计算机网页上登入了网站账号,则认为这台计算机的当前cookie和登入的账号id属于同一个用户;如用户在移动终端的应用程序上提交了手机号,则认为这个手机号和从移动终端获取的设备号属于同一个用户;如用户在注册网站会员号时填写了手机号,则认为这个会员号和手机号属于同一个用户。

但这种方法只是单纯地收集用户标识关系,却未进一步的根据收集到的数据探索其中相关的用户关系。也就是说,这种方法能收集到A和B是同一个用户,B和C是同一个用户,C和D是同一个用户,却不能因此知道A、B、C、D都是同一个用户。那么在请求获取A用户的用户画像时,只会考虑A和B的行为,却忽略了C和D的行为。这种情况下,想要获得更多的用户关系,只能通过设计更多不同的收集途径。



技术实现要素:

为此,本发明提供一种识别网络用户的方法、装置和计算设备,以力图解决或至少缓解上面存在的问题。

根据本发明的一个方面,提供一种识别网络用户的方法,适于在计算设备中执行,该方法包括:收集多个用户在业务请求中产生的多个用户标识关系,每个用户标识关系包括属于同一用户的两个用户标识之间的关联关系,且该用户标识关系能够被表示为由将该用户的所有用户标识作为节点构成的生成树中的一条边。根据收集到的多个用户标识关系,生成用户标识集合,用户标识集合包括多个由名称和相关联的值构成的数据条目,其中每个数据条目的名称为用户标识,相关联的值为该用户标识在生成树中的父节点。遍历用户标识集合,获取每个用户标识在生成树中的根节点,并分别将根节点相同的所有用户标识输出为一个用户集合,以便通过用户的一个用户标识获取该用户的所有用户标识。

可选地,在根据本发明的方法中,根据收集到的多个用户标识关系,生成用户标识集合的步骤包括:从多个用户标识关系中依次选取一个用户标识关系。对于所选取的每个用户标识关系,判断该用户标识关系中的两个用户标识是否存在于用户标识集合的数据条目的名称项中,其中用户标识集合初始为空;以及根据判断结果对所述用户标识集合进行更新。

可选地,在根据本发明的方法中,根据判断结果对用户标识集合进行更新的步骤包括:若该用户标识关系中的两个用户标识均不存在于用户标识集合的数据条目的名称项中,则分别以这两个用户标识为数据条目的名称,以这两个用户标识中任意一个用户标识为相关联的值,生成两个数据条目添加到用户标识集合中。若该用户标识关系中仅有一个用户标识存在于用户标识集合的数据条目的名称项中,则以该用户标识为数据条目的值,以另一个用户标识为数据条目的名称,生成一个数据条目添加到用户标识集合中。若该用户标识关系中的两个用户标识均存在于用户标识集合的数据条目的名称项中,则分别从用户标识集合中获取这两个用户标识的根节点。若这两个用户标识的根节点相同,则不进行更新;若这两个用户标识的根节点不同,则选取以其中一个用户标识的根节点为名称的数据条目,将该数据条目的值替换为另一个根节点或者另一用户标识。

可选地,在根据本发明的方法中,还包括:当输出的用户集合中的用户标识数目大于第一阈值时,删除该用户集合,并从用户标识集合中删除所有以该用户集合中的用户标识为名称的数据条目。

可选地,在根据本发明的方法中,还包括:根据输出的用户集合,对属于同一用户的所有用户标识所产生的行为特征进行分析,并构建该用户的用户画像。其中,用户画像包括该用户的基本信息、地理位置、社会属性、生活习惯、消费能力、兴趣爱好、需求特征、活跃度、评价等级中的一种或多种。

可选地,在根据本发明的方法中,用户标识包括cookie、会员号、电话号码、移动设备号中的一个或多个,其中所述cookie包括在计算设备端的cookie和/或在移动终端的cookie。

根据本发明的另一个方面,提供一种识别网络用户的装置,适于驻留在计算设备中,该装置包括:数据收集单元,适于收集多个用户在业务请求中产生的多个用户标识关系,每个用户标识关系包括属于同一用户的两个用户标识之间的关联关系,且该用户标识关系能够被表示为由将该用户的所有用户标识作为节点构成的生成树中的一条边。标识集合生成单元,适于根据收集到的多个用户标识关系,生成用户标识集合,用户标识集合包括多个由名称和相关联的值构成的数据条目,其中每个数据条目的名称为用户标识,相关联的值为该用户标识在生成树中的父节点。用户集合生成单元,适于遍历所述用户标识集合,获取每个用户标识在生成树中的根节点,并分别将根节点相同的所有用户标识输出为一个用户集合,以便通过用户的一个用户标识获取该用户的所有用户标识。

可选地,在根据本发明的装置中,标识集合生成单元适于根据以下方法生成用户标识集合:从多个用户标识关系中依次选取一个用户标识关系;对于所选取的每个用户标识关系,判断该用户标识关系中的两个用户标识是否存在于用户标识集合的数据条目的名称项中,其中所述用户标识集合初始为空;以及根据判断结果对所述用户标识集合进行更新。

可选地,在根据本发明的装置中,标识集合生成单元适于根据以下方法对用户标识集合进行更新:若该用户标识关系中的两个用户标识均不存在于用户标识集合的数据条目的名称项中,则分别以这两个用户标识为数据条目的名称,以这两个用户标识中任意一个用户标识为相关联的值,生成两个数据条目添加到用户标识集合中。若该用户标识关系中仅有一个用户标识存在于用户标识集合的数据条目的名称项中,则以该用户标识为数据条目的值,另一个用户标识为数据条目名称,生成一个数据条目添加到用户标识集合中。若该用户标识关系中的两个用户标识均存在于用户标识集合的数据条目的名称项中,则分别从用户标识集合中获取这两个用户标识的根节点。若这两个用户标识的根节点相同,则不进行更新;若这两个用户标识的根节点不同,则选取以其中一个用户标识的根节点为名称的数据条目,将该数据条目的值替换为另一个根节点或者另一用户标识。

可选地,在根据本发明的装置中,还包括:集合解散单元,适于当输出的用户集合中的用户标识数目大于第一阈值时,删除该用户集合,并从用户标识集合中删除所有以该用户集合中的用户标识为名称的数据条目。

可选地,在根据本发明的装置中,还包括:画像构建单元,适于根据输出的用户集合,对属于同一用户的所有用户标识所产生的行为特征进行分析,并构建该用户的用户画像。其中,用户画像包括该用户的基本信息、地理位置、社会属性、生活习惯、消费能力、兴趣爱好、需求特征、活跃度、评价等级中的一种或多种。

可选地,在根据本发明的装置中,用户标识包括cookie、会员号、电话号码、移动设备号中的至少一个或多个,其中所述cookie包括在计算设备端的cookie和/或在移动终端的cookie。

根据本发明的另一个方面,提供一种计算设备,包括如上所述的识别网络用户的装置。

根据本发明的技术方案,综合所有收集到的用户标识关系,生成用户标识集合,其中用户标识集合包含多个以用户标识为名称、以该用户标识在生成树中的父节点为相关联的值的数据条目。遍历所有用户标识集合,即可获取属于同一用户的所有用户标识。本发明通过离线挖掘的方式分别将每个用户的所有用户标识汇成一个用户集合,使我们随时能通过一个用户标识找到该用户的所有用户标识。在获取到用户集合后,将同一用户的不同用户标识产生的行为数据合并起来,可以从中挖掘出该用户更完整的行为轨迹,从而有助于特征提取和用户画像模型效果的提升。进一步,当用户集合中的元素过多时,还可以删除该用户集合以及对应的数据条目,从而有效过滤掉与多个用户标识有关系的垃圾标识数据,提高了数据运算的有效性。

附图说明

为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的计算设备100的结构示意图;

图2示出了根据本发明一个实施例的识别网络用户的方法200的流程图;

图3示出了根据本发明一个实施例的生成树的示意图;

图4示出了根据本发明一个实施例的识别网络用户的装置400的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的计算设备100的结构图。图1布置为实现根据本发明的识别网络用户的装置400的示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。

计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行根据本发明的识别网络用户的方法200,其中应用122包括根据本发明的识别网络用户的装置400。

图2示出了根据本发明一个实施例的识别网络用户的方法200的流程图。如图2所示,该方法始于步骤S210。

在步骤S210中,收集多个用户在业务请求中产生的多个用户标识关系,每个用户标识关系包括属于同一用户的两个用户标识之间的关联关系,且该用户标识关系能够被表示为由将该用户的所有用户标识作为节点构成的生成树中的一条边。

其中,用户标识通常包括cookie、会员号user_id、电话号码phone、移动设备号device_id中的一个或多个,其中所述cookie包括在计算设备端的cookie和/或在移动终端的cookie。

用户标识关系,代表用户在一次访问请求中出现的用户标识之间具有关联关系。例如,用户在PC端询价,那么用户的“手机号phone”和“cookie”就形成了一条关系。其中,可以将每个用户标识类型的首字母代替该类用户标识,如获取到的多个cookie可以分别用C1、C2、C3等表示,多个电话号码分别用P1、P2、P3等表示,多个会员号分别用U1、U2、U3等表示。进一步地,可以用<用户标识1,用户标识2>来表示用户标识关系。例如,若在一次访问请求中获取到的手机号P1和会员号U1具有关联关系,则可以用<P1,U1>表示该用户标识关系。

应当理解,用户在一次访问请求中可能产生两个以上的用户标识,此时可以把这些多个用户标识按两两组合方式生成用户标识关系,本发明对组合方法不作限定,只要保证最终表述出来的用户标识关系包含所有用户标识即可。如在一次访问请求中,同时获取到了某用户的cookie,记为C2,以及手机号P2和会员号U2这三个用户标识,则可以将其组合为<C2,P2>、<C2,U2>这两个用户标识关系,或者<C2,P2>、<P2,U2>这两个用户标识关系。

将每个用户标识视为一个节点,将用户标识关系视为两个节点之间的边,则该用户的所有用户标识可以构成一个无向图,去掉该无向图中的环,能够得到该用户对应的生成树,因此,用户标识关系可以抽象地理解为该生成树中两个节点之间的边。

例如,在从用户的访问请求中收集到的用户标识关系为<U2,P1>、<P1,C1>、<C3,U1>、<U1,C2>、<C2,P2>和<C2,U3>,则这些用户标识可以构成两棵如图3所示的生成树,其中每条边都代表一个用户标识关系。图3中,左边的生成树包括3个节点和两条边,右边的生成树包括5个节点和4条边。

随后,在步骤S220中,根据收集到的多个用户标识关系生成用户标识集合,所述用户标识集合包括多个由名称和相关联的值构成的数据条目,其中每个数据条目的名称为用户标识,相关联的值为该用户标识在生成树中的父节点。

具体地,用户标识集合可以用Map数据结构表示,这样,每个数据条目是一个键值(key-vlaue)对,键值对的key对应数据条目的名称项,其value对应数据条目中相关联的值。进一步地,可以用(用户标识,该用户标识的父节点)表示一个数据条目。如在图3左边的生成树中,若U2为根节点,则P1的父节点为U2,因此以P1为名称项的数据条目为(P1,U1);在本发明实施例中,将根节点的父节点视作其本身,所以以U1为名称项的数据条目为(U1,U1)。实际上,在用户标识集合中,可以追溯到每个用户标识节点所在生成树的根节点,这样,根节点相同的节点所对应的用户标识都属于同一个网络用户。

生成用户标识集合的过程可以包括:从收集到的多个用户标识关系中依次选取一个用户标识关系;对于所选取的每个用户标识关系,判断该用户标识关系中的两个用户标识是否存在于用户标识集合的数据条目的名称项中,并根据判断结果对所述用户标识集合进行更新。其中,所述用户标识集合初始为空。

其中,根据判断结果对用户标识集合进行更新通常包括以下几种情况:

(1)若该用户标识关系中的两个用户标识均不存在于用户标识集合的数据条目的名称项中,则分别以这两个用户标识为数据条目的名称,以这两个用户标识中任意一个用户标识为相关联的值,生成两个数据条目添加到用户标识集合中。

以上述从用户的访问请求中收集到的用户标识关系为例,初始状态下,用户标识集合为空,此时取出一个用户标识关系<U2,P1>,因为用户标识集合中还没有以U2或P1为名称(key)的数据条目,则分别以U2和P1为数据条目的名称项,任意选取U2或P1为相关联的值,如选U2,生成两个数据条目(U2,U2)和(P1,U2)添加到用户标识集合中。此时,所选取的相关联的值所对应的用户标识实际上可认为是该用户标识所在生成树的根节点。在这个例子中,图3左边生成树的根节点可认为是U2。

(2)若该用户标识关系中仅有一个用户标识存在于用户标识集合的数据条目的名称项中,则以该用户标识为数据条目的值,以另一个用户标识为数据条目的名称,生成一个数据条目添加到用户标识集合中。

例如,继续选取用户标识关系<P1,C1>,因此只有P1存在于已有用户标识集合的数据条目的名称项中,则以P1为数据条目的值,以C1为数据条目的名称项,生成数据条目(C1,P1)添加到用户标识集合中。

此时,若继续选取用户标识关系<C3,U1>,因为C3和U1都不存在于已有数据条目的名称项中,则沿用(1)中情况,分别以C3和U1为名称项,选取U1为相关联的值,生成数据条目(U1,U1)和(C3,U1)添加到用户标识集合中。在这个例子中,图3右边生成树的根节点可认为是U2。

同理,对于用户标识关系<U1,C2>,生成数据条目(C2,U1);

对于用户标识关系<C2,U3>,生成数据条目(U3,C2);

对于用户标识关系<C2,P2>,生成数据条目(P2,C2)。

此时,生成的用户标识集合为{(U2,U2),(P1,U2),(C1,P1),(U1,U1),(C3,U1),(C2,U1),(U3,C2),(P2,C2)}。

(3)若该用户标识关系中的两个用户标识均存在于用户标识集合的数据条目的名称项中,则分别从用户标识集合中获取这两个用户标识的根节点;

若这两个用户标识的根节点相同,则不进行更新;

若这两个用户标识的根节点不同,则选取以其中一个用户标识的根节点为名称的数据条目,将该数据条目的值替换为另一个根节点或者另一用户标识。

例如,若还有一个用户标识为<U2,C1>,因为U2和C1均存在于已有的数据条目的名称项中,那么需要分别从用户标识集合中获取这两个用户标识的根节点。具体地,可以采用遍历算法获取其根节点。以上述例子而言,可遍历得到U2和C1的根节点都是U2,因此不用生成新的数据条目,也不用对用户标识集合进行更新。

若还有一个用户标识关系<C1,C3>,因为C1和C3均存在于已有的数据条目的名称项中,则需要遍历获得其根节点。以上述例子而言,C1的根节点是U2,C3的根节点是U1。因为根节点不同,而这两个根节点不同的生成树又具有关联关系,所以可将其中一个生成树并入到另一个生成树中。具体地,可以选取其中任一个用户标识,如C1,找到以该用户标识的根节点U1为名称的数据条目(U1,U1),将该数据条目的值U1替换为另一个根节点U2或者另一用户标识P1,即将原有用户标识集合中的(U1,U1)项,替换为(U1,U2)或(U1,P1)项。

随后,在步骤S230中,遍历所述用户标识集合,获取每个用户标识在生成树中的根节点,并分别将根节点相同的所有用户标识输出为一个用户集合,以便通过用户的一个用户标识获取该用户的所有用户标识。

对于上述例子中生成的用户标识集合{(U2,U2),(P1,U2),(C1,P1),(U1,U1),(C3,U1),(C2,U1),(U3,C2),(P2,C2)},经过遍历获取每个用户标识在该集合中的根节点。如获取U2、P1和C1的根节点都是U2,则将这三个用户标识输出为用户集合:{U2,P1,C1};而U1、C3、C2、U3和P2的根节点都是U1,则将其输出为另一个用户集合:{U1,C3,C2,U3,P2}。这两个集合分别代表两个不同的用户。

在实际操作中,还可以对用户标识集合进行定期更新。例如,每天更新一次,即将当天收集的新访问请求中的用户标识关系,按照上述步骤S220生成新的用户标识集合,并按照上述步骤S230输出新的用户集合。

另外,通常情况下,用户一般只会有一定数量的用户标识,比如5个以内的手机号,5个以内的会员号,以及20个以内的cookie号。因此,一个用户拥有过多的用户标识并不符合正常的用户行为,其应该存在刷流量、使用公共设备等可能性,这部分数据并不能表达真实的用户标识关系情况,对其进行用户分析并无价值应当舍弃。因此,根据本发明的一个实施例,可以对用户集合进行判断,当输出的用户集合中的用户标识数目大于第一阈值时,删除该用户集合,并从对应的用户标识集合中删除所有以该用户集合中的用户标识为名称的数据条目。其中,第一阈值可以是30。

也就是,用户标识集合生成后,其中的部分数据条目会因为用户集合中元素数目过多而被删除;用户集合一旦生成,则只会增大或被解散。当出现一个用户标识关系,其用户标识分别属于两个用户集合时,其中一个用户集合将被另一个用户集合吞并,这两个用户集合都归属于同一个用户。用户结合解散后,或数据条目被删除后,若再有新的关于这个集合的用户标识出现,则当作它们不曾有过集合一样重新经历集合的生成、壮大、被吞并或解散的过程。总之,集合解散后,之前该集合中出现的关系一概不保留,且不影响其中每个孤点与其他点重新建立用户标识关系。另外,还可以记录Map数据的变化轨迹,以监测两个集合的合并过程。

根据另一个实施例,还可以根据输出的用户集合,对属于同一用户的所有用户标识所产生的行为特征进行分析,并构建该用户的用户画像。其中,用户画像可以包括该用户的基本信息、地理位置、社会属性、生活习惯、消费能力、兴趣爱好、需求特征、活跃度、评价等级中的一种或多种。很明显,获取到的同一用户的用户标识越多,构建该用户的画像会越准确且全面。这样,运营商就可以根据该用户的完整用户画像针对性地向用户推荐可能感兴趣的产品信息。

此外,还可以为每一个输出的用户集合生成唯一的用户集合标签uuid(unique user id)。uuid统一采用“前缀+根节点”的方式生成,前缀按下表规则选取。例如,用户集合{U2,P1,C1}的根节点为U2,则该集合的uuid为U_U2。对于不属于任何集合的孤点,按规则给它生成一个孤点uuid即可,孤点的根节点就是自身。

图4示出了根据本发明一个实施例的识别网络用户的装置400的结构示意图。如图3所示,该装置包括数据收集单元410、标识集合生成单元420和用户集合生成单元430。

数据收集单元410适于收集多个用户在业务请求中产生的多个用户标识关系,每个用户标识关系包括属于同一用户的两个用户标识之间的关联关系,且该用户标识关系能够被表示为由将该用户的所有用户标识作为节点构成的生成树中的一条边。其中,用户标识包括cookie、会员号、电话号码、移动设备号中的至少一个或多个,其中所述cookie包括在计算设备端的cookie和/或在移动终端的cookie。

标识集合生成单元420适于根据收集到的多个用户标识关系,生成用户标识集合,其中用户标识集合包括多个由名称和相关联的值构成的数据条目,其中每个数据条目的名称为用户标识,相关联的值为该用户标识在生成树中的父节点。具体地,从多个用户标识关系中依次选取一个用户标识关系;对于所选取的每个用户标识关系,判断该用户标识关系中的两个用户标识是否存在于用户标识集合的数据条目的名称项中,其中用户标识集合初始为空。最后根据判断结果对所述用户标识集合进行更新。

用户集合生成单元430适于遍历用户标识集合,获取每个用户标识在生成树中的根节点,并分别将根节点相同的所有用户标识输出为一个用户集合,以便通过用户的一个用户标识获取该用户的所有用户标识。

根据一个实施例,装置400还可以包括集合解散单元(图中未示出),适于当输出的用户集合中的用户标识数目大于第一阈值时,删除该用户集合,并从对应的用户标识集合中删除所有以该用户集合中的用户标识为名称项的数据条目。

根据另一个实施例,装置400还可以包括画像构建单元(图中未示出),适于根据输出的用户集合,对属于同一用户的所有用户标识所产生的行为特征进行分析,并构建该用户的用户画像。其中,用户画像包括该用户的基本信息、地理位置、社会属性、生活习惯、消费能力、兴趣爱好、需求特征、活跃度、评价等级中的一种或多种。

根据本发明的识别网络用户的装置400,其具体细节已在基于图1-3的描述中详细公开,在此不再进行赘述。

根据本发明的技术方案,实现了用户标识关系数据的离线挖掘,并根据挖掘到的用户标识关系生成用数据条目表示的用户标识集合,其中,该数据条目以用户标识为名称、以该用户标识在生成树中的父节点为相关联的值。遍历所生成的用户标识集合,具有相同根节点的用户标识都属于同一用户,将这些用户表述输出为该用户的用户集合。这样,我们便能随时通过一个用户标识找到该用户的所有用户标识。将同一用户的所有用户标识产生的行为数据综合起来,可以从中挖掘出该用户更完整的行为轨迹,有助于运营商构建准确而完整的用户画像。另外,当用户集合中的用户标识元素过多时,可以解散该用户集合,并从对应的用户标识集合里删除包括该用户集合中用户标识的所有数据条目,从而有效过滤掉了与多个用户标识有关系的垃圾标识数据,提高了数据运算的有效性。

B10、如B7所述的装置,还包括:

集合解散单元,适于当输出的用户集合中的用户标识数目大于第一阈值时,删除该用户集合,并从所述用户标识集合中删除所有以该用户集合中的用户标识为名称的数据条目。

B11、如B7所述的装置,还包括:

画像构建单元,适于根据输出的用户集合,对属于同一用户的所有用户标识所产生的行为特征进行分析,并构建该用户的用户画像;

其中,所述用户画像包括该用户的基本信息、地理位置、社会属性、生活习惯、消费能力、兴趣爱好、需求特征、活跃度、评价等级中的一种或多种。

B12、如B7所述的装置,所述用户标识包括cookie、会员号、电话号码、移动设备号中的至少一个或多个,其中所述cookie包括在计算设备端的cookie和/或在移动终端的cookie。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1