一种用户行为数据处理方法和装置与流程

文档序号:11864695阅读:195来源:国知局
一种用户行为数据处理方法和装置与流程

本发明涉及网络技术,特别涉及一种用户行为数据处理方法和装置。



背景技术:

当用户进行信息检索等操作时,理论上来说,所生成的用户行为数据应该保存到最近的机房服务器中,但是,由于运营商、网站特性等原因,可能导致用户的用户行为数据散落到不同的机房中,这种现象称之为跳网。

当某一用户出现跳网现象时,由于用户行为数据散落在不同的机房中,无法根据完整的用户行为数据来全面地分析用户的行为特征等,从而会影响后续工作的开展,如根据用户的行为特征向用户推送信息等,因此,需要尽量避免跳网现象的出现。

为此,现有技术中通常采用以下处理方式:

在每天的固定时刻,将所有机房在最近一天内获取并保存的用户行为数据进行汇总等,从而得到各用户的完整用户行为数据,进而可通过对汇总后的各用户的用户行为数据进行分析处理,获知跳网情况,并想办法解决,以避免跳网现象的继续出现。

但是,上述方式在实际应用中也会存在一定的问题,如:

由于需要对所有用户的用户行为数据进行汇总等处理,因此所需处理的数据量非常大,另外,虽然可以通过这种方式来获知跳网情况,但存在较大的延时。



技术实现要素:

本发明提供了一种用户行为数据处理方法和装置,能够减少所需处理的数据量和减少延时。

具体技术方案如下:

一种用户行为数据处理方法,包括:

在流式数据处理过程中,当获取到一条用户行为数据时,若确定所述用户行为数据对应的用户为已注册用户,则将所述用户行为数据保存到预定的机房服务器中。

根据本发明一优选实施例,所述确定所述用户行为数据对应的用户为已注册用户包括:

确定是否保存有所述用户行为数据对应的用户标识;

若是,则确定所述用户行为数据对应的用户为已注册用户。

根据本发明一优选实施例,所述用户标识包括:PC端用户标识和wise端用户标识。

根据本发明一优选实施例,所述用户标识保存在zookeeper中。

根据本发明一优选实施例,

当所述用户标识为PC端用户标识时,所保存的用户标识为:当用户利用PC首次登录使用平台时,所述使用平台获取并上传到所述zookeeper中的所述用户的PC端用户标识;

当所述用户标识为wise端用户标识时,所保存的用户标识为:当用户利用移动终端扫描所述使用平台所展示的网页上的二维码时,所述使用平台获取并上传到所述zookeeper中的所述用户的wise端用户标识。

根据本发明一优选实施例,所述将所述用户行为数据保存到预定的机房服务器中包括:

将所述用户行为数据保存到所述使用平台对应的机房服务器中,以便所述使用平台实时地展示所述用户行为数据。

根据本发明一优选实施例,该方法进一步包括:

将所述用户行为数据所应保存到的机房地址信息连同所述用户行为数据一起,保存到所述使用平台对应的机房服务器中,以便所述使用平台实时地展示所述用户行为数据以及所述机房地址信息。

一种用户行为数据处理装置,包括:决策单元和保存单元;

所述决策单元,用于在流式数据处理过程中,当获取到一条用户行为数据时,若确定所述用户行为数据对应的用户为已注册用户,则将所述用户行为数据发送给所述保存单元;

所述保存单元,用于将所述用户行为数据保存到预定的机房服务器中。

根据本发明一优选实施例,所述决策单元确定是否保存有所述用户行为数据对应的用户标识,若是,则确定所述用户行为数据对应的用户为已注册用户。

根据本发明一优选实施例,所述用户标识包括:PC端用户标识和wise端用户标识。

根据本发明一优选实施例,所述用户标识保存在zookeeper中。

根据本发明一优选实施例,

当所述用户标识为PC端用户标识时,所保存的用户标识为:当用户利用PC首次登录使用平台时,所述使用平台获取并上传到所述zookeeper中的所述用户的PC端用户标识;

当所述用户标识为wise端用户标识时,所保存的用户标识为:当用户利用移动终端扫描所述使用平台所展示的网页上的二维码时,所述使用平台获取并上传到所述zookeeper中的所述用户的wise端用户标识。

根据本发明一优选实施例,所述保存单元将所述用户行为数据保存到所述使用平台对应的机房服务器中,以便所述使用平台实时地展示所述用户行为数据。

根据本发明一优选实施例,

所述决策单元进一步用于,将所述用户行为数据所应保存到的机房地址信息发送给所述保存单元;

所述保存单元进一步用于,将所述机房地址信息连同所述用户行为数据一起,保存到所述使用平台对应的机房服务器中,以便所述使用平台实时地展示所述用户行为数据以及所述机房地址信息。

通过以上介绍可以看出,采用本发明所述方案,在流式数据处理过程中,可实时地将已注册用户的用户行为数据保存到预定的机房服务器中,从而无需像现有技术中一样进行延时汇总,进而减少了延时,而且,仅对已注册用户而不是所有用户进行上述处理,如已注册用户可为专门的测试人员等,从而减少了所需处理的数据量。

【附图说明】

图1为本发明用户行为数据处理方法实施例的流程图。

图2为本发明当出现跳网现象时的用户行为数据处理方式示意图。

图3为本发明用户行为数据处理装置实施例的组成结构示意图。

【具体实施方式】

针对现有技术中存在的问题,本发明中提出一种用户行为数据处理方案,能够减少所需处理的数据量和减少延时。

为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。

实施例一

图1为本发明用户行为数据处理方法实施例的流程图,如图1所示,包括以下具体实现方式:

在11中,在流式数据处理过程中,当获取到一条用户行为数据时,确定该用户行为数据对应的用户是否为已注册用户。

如何获取用户的用户行为数据为现有技术。

当每获取到一条用户行为数据时,可按照现有方式,将该用户行为数据保存到对应的机房服务器中,即将该用户行为数据保存到所应保存到的机房服务器中,并且,可进一步确定该用户行为数据对应的用户是否为已注册用户。

如,确定是否保存有该用户行为数据对应的用户标识,若是,则确定该用户行为数据对应的用户为已注册用户,否则,为未注册用户。

所述用户标识可包括:PC端用户标识和wise端用户标识,其中,wise端用户标识即指手机等移动端用户标识。

当用户利用PC首次登录指定的使用平台时,使用平台可获取到用户的PC端用户标识,并可将获取到的PC端用户标识上传到zookeeper中进行保存,即将用户的PC端用户标识注册到zookeeper中。

并且,可利用使用平台来展示一个特定的网页,该网页上可显示有一个二维码,当用户利用手机等移动终端扫描该二维码时,使用平台可获取到用户的wise端用户标识,并可将获取到的wise端用户标识上传到zookeeper中进行保存,即将用户的wise端用户标识注册到zookeeper中。

在实际应用中,使用平台可为专供测试人员使用的特定平台,已注册用户即可为测试人员,使用平台如何获取用户的PC端用户标识和wise端用户标识可根据实际需要而定,不限于以上所述方式。

另外,已注册用户的PC端用户标识和wise端用户标识也可保存到zookeeper以外的其它地方,如保存到数据库中。

若保存到zookeeper中,那么当每获取到一条用户行为数据时,可首先确定zookeeper中是否保存有该用户行为数据对应的PC端用户标识或wise端用户标识,若确定结果为是,则执行12。

在12中,若确定结果为是,则将该用户行为数据保存到预定的机房服务器中。

预定的机房服务器,通常是指使用平台对应的机房服务器,这样,对于每个已注册用户来说,会将该用户的各用户行为数据实时汇总到使用平台对应的机房服务器中,从而可在使用平台对应的机房服务器中获取到该用户的完整的用户行为数据。

使用平台对应的机房服务器的数量可能为一个,也可能为多个,若为多个,当每获取到一条用户行为数据时,可将该用户行为数据分别保存到各机房服务器中。

对于每个已注册用户,使用平台对应的机房服务器会根据接收到的该用户的用户行为数据,实时组装该用户的会话(session)表,具体实现为现有技术,另外,使用平台可对该用户的用户行为数据进行实时展示。

在将用户行为数据保存到使用平台对应的机房服务器的同时,还可将该用户行为数据所应保存到的机房地址信息保存到使用平台对应的机房服务器,这样,使用平台在实时展示该用户行为数据的同时,还可展示该用户行为数据对应的机房地址信息,以便测试人员直观地了解到该用户行为数据来自于哪个机房,即直观地了解到跳网情况。

使用平台的具体展示方式不限。

另外,使用平台还可将同一用户的PC端用户标识和wise端用户标识的映射关系保存到数据库中。

这样,假设某一用户先利用PC进行了一次信息检索,在检索过程中,会实时地获取到该用户的用户行为数据,对应的用户标识为该用户的PC端用户标识,那么使用平台可实时地、根据获取时间由先到后的顺序,依次显示该用户的各用户行为数据,当本次检索结束之后,假设该用户又利用手机进行了一次信息检索,在检索过程中,会实时地获取到该用户的用户行为数据,对应的用户标识为该用户的wise端用户标识,那么使用平台可通过查询所述数据库,获知当前获取的用户行为数据与之前获取到的PC端用户标识对应的用户行为数据对应于同一用户,相应地,可接着之前所展示的该用户的用户行为数据,继续展示本次获取到的各用户行为数据。

基于上述介绍,图2为本发明当出现跳网现象时的用户行为数据处理方式示意图。

如图2所示,用户a通过使用平台在zookeeper上进行了注册;

当用户a进行信息检索时,其用户行为数据本来应该保存到北京的机房服务器中,但由于出现了跳网现象,其用户行为数据散落到了北京和杭州两地的机房服务器中;

在信息检索过程中,当每获取到用户a的一条用户行为数据时,按照现有方式将该用户行为数据保存到北京或杭州的机房服务器中,并确定zookeeper中是否保存有该用户行为数据对应的用户标识;

确定结果为是,将该用户行为数据进一步保存到使用平台对应的、位于南京的机房服务器中,并且,可将该用户行为数据对应的机房地址信息如北京或杭州一起保存到使用平台对应的机房服务器中;

通过上述方式,相当于是将用户a散落在北京机房服务器和杭州机房服务器中的用户行为数据实时汇总到了使用平台对应的机房服务器中;

使用平台可实时地展示用户a的各用户行为数据以及对应的机房地址信息。

以上是关于本发明方法实施例的介绍,以下对装置实施例进行介绍。

实施例二

图3为本发明用户行为数据处理装置实施例的组成结构示意图,如图3所示,包括:决策单元31和保存单元32。

决策单元31,用于在流式数据处理过程中,当获取到一条用户行为数据时,若确定该用户行为数据对应的用户为已注册用户,则将该用户行为数据发送给保存单元32;

保存单元32,用于将该用户行为数据保存到预定的机房服务器中。

当每获取到一条用户行为数据时,可按照现有方式,将该用户行为数据保存到对应的机房服务器中,即将该用户行为数据保存到所应保存到的机房服务器中,并且,可进一步确定该用户行为数据对应的用户是否为已注册用户。

如,决策单元31可确定是否保存有该用户行为数据对应的用户标识,若是,则确定该用户行为数据对应的用户为已注册用户,否则,为未注册用户。

所述用户标识可包括:PC端用户标识和wise端用户标识。

其中,当用户标识为PC端用户标识时,所保存的用户标识可为:当用户利用PC首次登录使用平台时,使用平台获取并上传到zookeeper中的用户的PC端用户标识;

当用户标识为wise端用户标识时,所保存的用户标识可为:当用户利用移动终端扫描使用平台所展示的网页上的二维码时,使用平台获取并上传到zookeeper中的用户的wise端用户标识。

即使用平台可分别获取用户的PC端用户标识和wise端用户标识,并可分别将用户的PC端用户标识和wise端用户标识注册到zookeeper中。

这样,决策单元31在每获取到一条用户行为数据时,可首先确定zookeeper中是否保存有该用户行为数据对应的PC端用户标识或wise端用户标识,若确定结果为是,则可将该用户行为数据发送给保存单元32。

相应地,保存单元32可将该用户行为数据保存到预定的机房服务器中。

预定的机房服务器,通常是指使用平台对应的机房服务器,这样,对于每个已注册用户来说,会将该用户的各用户行为数据实时汇总到使用平台对应的机房服务器中,从而可在使用平台对应的机房服务器中获取到该用户的完整的用户行为数据。

针对每个已注册用户,使用平台对应的机房服务器会根据接收到的该用户的用户行为数据,实时组装该用户的会话(session)表,具体实现为现有技术,另外,使用平台可对该用户的用户行为数据进行实时展示。

对于已注册用户的用户行为数据,决策单元31还可将该用户行为数据所应保存到的机房地址信息发送给保存单元32。

保存单元32可将接收到的机房地址信息连同该用户行为数据一起,保存到使用平台对应的机房服务器中,以便使用平台实时地展示该用户行为数据及对应的机房地址信息,从而使得测试人员可以直观地了解到该用户行为数据来自于哪个机房,即直观地了解到跳网情况。

以下结合图2,对本实施例所述装置进行进一步说明:

用户a通过使用平台在zookeeper上进行了注册;

当用户a进行信息检索时,其用户行为数据本来应该保存到北京的机房服务器中,但由于出现了跳网现象,其用户行为数据散落到了北京和杭州两地的机房服务器中;

在信息检索过程中,在每获取到用户a的一条用户行为数据后,会按照现有方式将该用户行为数据保存到北京或杭州的机房服务器中,并且,决策单元31可确定zookeeper中是否保存有该用户行为数据对应的用户标识,确定结果为是,将该用户行为数据以及该用户行为数据对应的机房地址信息发送给保存单元32;

保存单元32将该用户行为数据及对应的机房地址信息保存到使用平台对应的位于南京的机房服务器中;

通过上述方式,相当于是将用户a散落在北京机房服务器和杭州机房服务器中的用户行为数据实时汇总到了使用平台对应的机房服务器中;

使用平台可实时地展示用户a的各用户行为数据以及对应的机房地址信息。

通过上述各实施例中的介绍可知,采用本发明所述方案:

在流式数据处理过程中,可实时地将已注册用户的用户行为数据保存到预定的机房服务器中,从而无需像现有技术中一样进行延时汇总,进而减少了延时:

而且,仅对已注册用户而不是所有用户进行上述处理,如已注册用户可为专门的测试人员等,从而减少了所需处理的数据量;

另外,采用本发明所述方案,可对跳网情况进行直观地实时显示,极大地方便了测试人员使用。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1