一种用户行为日志的生成方法及装置与流程

文档序号:16207902发布日期:2018-12-08 07:21阅读:197来源:国知局
一种用户行为日志的生成方法及装置与流程

本发明涉及用户行为日志技术领域,尤其涉及一种用户行为日志的生成方法及装置。

背景技术

目前,随着互联网技术的发展,越来越多的用户,通过安装于终端设备中的各种应用软件,来满足自身的工作、生活、以及休闲娱乐等需求。同时,各种应用软件的供应商,也会通过终端设备中生成的用户行为日志,向用户推送用户较为关注的内容,以提高用户的体验效果。

不过,现有技术中,终端设备中生成的用户行为日志,是由单个应用分别上传的用户的单一孤立行为信息,例如:某购物应用软件上传的下述行为信息:用户在终端设备主页点击该购物应用软件的图标和用户在该购物应用软件首页上点击某个图标等;某聊天应用软件上传的下述行为信息:用户在终端设备桌面点击该聊天应用软件的图标和用户在该聊天应用软件中点击某个联系人图标等。也就是说,用户对终端设备中任意一个应用的任意一个操作,均会对应生成一条用户行为日志,这些用户行为日志,记录的均为单一的孤立行为信息,行为信息之间没有关联,使得终端设备的后台服务器接收到的用户行为日志较为杂乱且冗余;后续根据现有的用户行为日志对用户的行为进行分析归纳时,数据计算量较大,过程较为繁琐,效率较低。

所以,现有的用户行为日志的生成方法,生成的用户行为日志,较为杂乱冗余;后续根据该用户行为日志进行分析归纳时,数据计算量较大,过程较为繁琐,效率较低。



技术实现要素:

本发明提供了一种用户行为日志的生成方法及装置,以解决现有的用户行为日志的生成方法,生成的用户行为日志,较为杂乱冗余的问题。

第一方面,本发明提供了一种用户行为日志的生成方法,该生成方法包括:获取用户的行为信息和所述行为信息对应的场景信息;从所述行为信息对应的场景信息中,获取所述行为信息的生成时间;如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长小于或等于第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,按照相应生成时间的先后顺序,串接于同一条行为信息链中;根据所述行为信息链和所述行为信息链中行为信息对应的场景信息,生成情景行为信息;对所述情景行为信息进行关键词提取,生成用户行为日志。

进一步,根据所述行为信息链和所述行为信息链中行为信息对应的场景信息,生成情景行为信息,具体包括:确定所述行为信息链中包含的有效行为信息;根据所述有效行为信息和所述有效行为信息对应的场景信息,生成情景行为信息。

进一步,该生成方法还包括:如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长大于所述第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,分别串接于不同的行为信息链中。

进一步,确定所述行为信息链中包含的有效行为信息的过程,具体包括:确定所述行为信息链中包含的子行为信息链,所述子行为信息链中包含至少两条行为信息,其中第一条行为信息的生成时间,与最后一条行为信息的生成时间的间隔时长,小于或等于第二预设时长,且所述子行为信息链中包含的所有行为信息相同;将所述子行为信息链中,最后一条行为信息,确定为有效行为信息。

进一步,该生成方法还包括:对于所述行为信息链中,不属于任何一个子行为信息链的每一条行为信息,如果该条行为信息的生成时间,与其下一条行为信息的生成时间的间隔时长,大于或等于第三预设时长,将该条行为信息确定为有效行为信息。

第二方面,本发明还提供了一种用户行为日志的生成装置,该生成装置包括:行为信息获取模块,用于获取用户的行为信息和所述行为信息对应的场景信息;生成时间获取模块,用于从所述行为信息对应的场景信息中,获取所述行为信息的生成时间;行为信息链生成模块,用于如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长小于或等于第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,按照相应生成时间的先后顺序,串接于同一条行为信息链中;情景行为信息生成模块,用于根据所述行为信息链和所述行为信息链中行为信息对应的场景信息,生成情景行为信息;用户行为日志生成模块,用于对所述情景行为信息进行关键词提取,生成用户行为日志。

进一步,该生成装置还包括有效行为信息确定模块,用于执行下述操作:确定所述行为信息链中包含的有效行为信息;删除所述行为信息链中包含的无效行为信息,所述无效行为信息为所述行为信息链中,所述有效行为信息之外的所有行为信息。

进一步,所述行为信息链生成模块还用于:如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长大于所述第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,分别串接于不同的行为信息链中。

进一步,所述有效行为信息确定模块用于确定所述行为信息链中包含的有效行为信息,具体包括:所述有效行为信息确定模块用于执行下述操作:确定所述行为信息链中包含的子行为信息链,所述子行为信息链中包含至少两条行为信息,其中第一条行为信息的生成时间,与最后一条行为信息的生成时间的间隔时长,小于或等于第二预设时长,且所述子行为信息链中包含的所有行为信息相同;将所述子行为信息链中,最后一条行为信息,确定为有效行为信息。

进一步,所述有效行为信息确定模块还用于:对于所述行为信息链中,不属于任何一个子行为信息链的每一条行为信息,如果该条行为信息的生成时间,与其下一条行为信息的生成时间的间隔时长,大于或等于第三预设时长,将该条行为信息确定为有效行为信息。

本发明的实施例提供的技术方案可以包括以下有益效果:本发明提供了一种用户行为日志的生成方法及装置。该生成方法中,通过实时获取用户的行为信息和行为信息对应的场景信息,将相互关联的行为信息串接为行为信息链,将行为信息链中包含的行为信息和该行为信息对应的场景信息,确定为情景行为信息,最后对情景行为信息进行关键词提取处理后,将生成的关键词确定为用户行为日志。

由此可知,本发明实施例提供的用户行为日志的生成方法,生成的用户行为日志,将具有关联关系的行为信息关联在一起,使得行为信息之间不再孤立。这样,一方面,将该用户行为日志上传至后台服务器后,减少了用户行为日志的数据冗余度,降低了后台服务器的负载;另一方面,根据该用户行为日志,对用户行为进行分析时,处理过程较为简单,极大地减少了数据计算量,提高了分析速率,进而提高了分析效率。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种用户行为日志的生成方法的流程示意图;

图2为本发明实施例提供的一种用户行为日志的生成装置的结构框图。

具体实施方式

结合背景技术可知,现有技术中,终端设备中生成的用户行为日志,是由单个应用分别上传的用户的单一孤立行为信息。也就是说,现有技术中,用户对终端设备中任意一个应用的任意一个操作,均会对应生成一条用户行为日志,现有的用户行为日志,记录的均为单一的孤立行为信息,行为信息之间没有关联,使得终端设备的后台服务器接收到的用户行为日志较为杂乱且冗余,后续根据现有的用户行为日志对用户的行为进行分析归纳时,数据计算量较大,过程较为繁琐,效率较低。为了解决这一问题,本发明提供了一种用户行为日志的生成方法及装置。

下面结合附图,详细介绍本发明提供的用户行为日志的生成方法及装置。

参见图1,图1示出的是本发明实施例提供的一种用户行为日志的生成方法的流程示意图。结合图1可知,该生成方法包括:

步骤101、获取用户的行为信息和所述行为信息对应的场景信息。

其中,用户的行为信息为用户对终端设备中各种应用进行操作的信息,例如以用户观看某电影(后续将该电影定义为目标电影)为例,用户首先在智能电视的主页上点击某个视频软件(后续将该视频软件定义为目标视频软件)的图标,并在目标视频软件中首页上点击电影分类图标,进入电影分类页面,在电影分类页面上点击目标电影的图标,后续便可以观看目标电影。并且为了获得更好的观看效果,用户在点击目标电影的图标后,在目标电影观看过程中,同时点击了设置图标,在设置分类页面中,通过对图像模式、亮度和对比度等功能项的调整,对目标电影的图像模式、亮度和对比度进行了调整。在此过程中,会产生下述行为信息:用户点击目标视频软件的图标,用户点击电影分类图标,用户点击目标电影的图标,用户点击设置图标,用户调整了图像模式、亮度和对比度等。

用户的行为信息对应的场景信息包括:用户的行为信息的生成时间和用户行为发生时终端设备的设备信息等。其中,终端设备的设备信息包括终端设备的属性信息和终端设备的参数信息,例如:用户行为发生时,终端设备中,当前运行于最前端的应用软件的信息、终端设备的显示屏上当前显示的内容、以及终端设备中各功能项当前的参数值等。

步骤102、根据所述行为信息和所述行为信息对应的场景信息,生成行为信息链。

获取到用户的行为信息和每条行为信息对应的场景信息后,从每条行为信息对应的场景信息中,可以提取到该条行为信息的生成时间,即根据行为信息对应的场景信息,可以确定出该行为信息的生成时间。

在终端设备开机之后,用户行为日志上报服务(service)自动启动,启动后,开始实时获取用户的行为信息和行为信息对应的场景信息。例如:获取到第一条行为信息以及该条行为信息对应的场景信息后,根据该场景信息确定出第一条行为信息的生成时间。在获取到第二条行为信息和该条行为信息对应的场景信息,并根据该场景信息确定出第二条行为信息的生成时间;然后,计算第二条行为信息的生成时间与第一条行为信息的生成时间的间隔时长,比较该间隔时长与第一预设时长的大小关系;如果该间隔时长小于或等于第一预设时长,认为第二条行为信息与第一条行为信息之间具有关联,将第二条行为信息与第一条行为信息,按照生成时间的先后顺序,串接在一起。之后,每获取到一条行为信息和该条行为信息对应的场景信息,并根据该场景信息,确定出该条行为信息的生成时间后,均会计算该条行为信息的生成时间与其前一条行为信息的生成时间的间隔时长;并比较该间隔时长与将第一预设时长的大小;如果该间隔时长小于或等于第一预设时长,会将该条行为信息与其前一条行为信息,按照相应生成时间的先后顺序,串接在一起,直到获取到某条行为信息后,该条行为信息的生成时间与其前一条行为信息的生成时间的间隔时长大于第一预设时长时,停止将该条行为信息与其前一条行为信息串接。于是,该条行为信息之前的所有行为信息按照相应生成时间的先后顺序,串接为第一条行为信息链,之后,将该条行为信息作为第二条行为信息链的起始行为信息,重复执行比较生成时间在后的行为信息的生成时间与其前一条行为信息的生成时间之间的间隔时长与第一预设时长的大小关系的步骤,以及后续步骤,直至终端设备关机后,用户行为日志上报服务停止为止。

基于此,根据所述行为信息和所述行为信息对应的场景信息,生成行为信息链的过程,具体包括:从所述行为信息对应的场景信息中,获取所述行为信息的生成时间;如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长小于或等于第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,按照相应生成时间的先后顺序,串接于同一条行为信息链中;或,如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长大于所述第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,分别串接于不同的行为信息链中。

需要说明的是,实际应用中,在较短时间内,用户连续操作而产生的一系列行为,表示这些行为之间是相互关联的;而在较长间隔时间内,用户操作而产生的两条行为,表示这两条行为之间是无关联性的。例如:在用户观看电视剧时,在一分钟之内,用户连续三次操作遥控器音量+键,来调节电视剧音量,则表示用户连续三次点击音量+键是具有关联性的三次行为;在用户点击音量+键后的二十分钟,用户点击主页键,进入电视主页,则表示用户点击音量+键和用户点击主页键是不关联的两次行为。因此,本申请实施例中根据前后两条行为信息的生成时间来判断两条行为的关联性。

步骤103、确定所述行为信息链中包含的有效行为信息,删除所述行为信息链中包含的无效行为信息。

用户对终端设备的应用进行操作后生成的行为信息中,有些行为信息为无效行为信息,如果这些无效行为信息生成用户行为日志,该用户行为日志对于后续的用户行为分析,不具有参考性,反而会影响分析的速度,降低效率。所以,生成行为信息链后,需要确定行为信息链中包含的有效行为信息,删除行为信息链中包含的无效行为信息,使得之后生成的用户行为日志,用于后续的用户行为分析时,能够减小计算的数据量,提高分析速度,进而提高分析效率,其中,所述无效行为信息为所述行为信息链中,所述有效行为信息之外的所有行为信息。

具体实施时,确定所述行为信息链中包含的有效行为信息,可以通过下述方式实现:确定所述行为信息链中包含的子行为信息链,所述子行为信息链中包含至少两条行为信息,其中第一条行为信息的生成时间,与最后一条行为信息的生成时间的间隔时长,小于或等于第二预设时长,且所述子行为信息链中包含的所有行为信息相同;将所述子行为信息链中,最后一条行为信息,确定为有效行为信息,即如果在小于或等于第二预设时长的时间段内,用户多次对终端设备的同一个应用进行相同的重复操作,导致在小于或等于第二预设时长的时间段内,生成多条相同的行为信息,则将这多条行为信息中,生成时间最晚的一条行为信息,确定为有效行为信息;对于所述行为信息链中,不属于任何一个子行为信息链的每一条行为信息,如果该条行为信息的生成时间,与其下一条行为信息的生成时间的间隔时长,大于或等于第三预设时长,将该条行为信息确定为有效行为信息。

步骤104、根据所述行为信息链和所述行为信息链中行为信息对应的场景信息,生成情景行为信息。

确定出每一条行为信息链中包含的有效行为信息后,删除该条行为信息链中包含的无效行为信息,将该条行为信息链包含的所有有效行为信息以及每条有效行为信息对应的场景信息,确定为一条情景行为信息。

步骤105、对所述情景行为信息进行关键词提取,生成用户行为日志。

具体实施时,可以采用开源项目hanlp(hanlanguageprocessing)工具包,对情景行为信息进行关键词提取,将每一条情景行为信息输入至该开源项目hanlp工具包的关键词处理接口,对该条情景行为信息进行关键词提取处理后,得到该条情景行为信息对应的一系列关键词,将该条情景行为信息对应的所有关键词确定为一条用户行为日志。

例如,以用户观看目标电影为例,用户的行为信息包括:用户点击目标视频软件的图标,用户点击电影分类图标,用户点击目标电影的图标,用户点击设置图标,用户调整了图像模式、亮度和对比度等。上述行为信息串接为一条行为信息链,且上述行为信息均为有效行为信息。上述行为信息对应的场景信息包括:用户id(英文:identity,中文:身份标识号),用户点击目标电影的图标的时间为晚上23点55分,调整后亮度项的亮度值为40,调整后对比度项的对比度值为35。则,将由上述行为信息和上述行为信息对应的场景信息生成的情景行为信息,输入至开源项目hanlp工具包的关键词处理接口,进行关键词提取处理后,可以获得如下关键词:用户id、目标电影的名称、图像模式为电影、亮度为40、对比度为35、时间为晚上23点55分,这些关键词就可以被确定为一条用户行为日志。

此外,在生成每一条用户行为日志后,会将该条用户行为日志进行数据持久化,上传至终端设备的后台服务器,以便后续可以根据后台服务器中存储的用户行为日志对用户的行为进行分析归纳,并且,由于每一条用户行为日志由一系列相互关联的有效行为信息生成,在采用该用户行为日志对用户的行为进行分析时,可以极大地减少计算的数据量,提高分析的速率,进而提高分析效率。

本发明实施例提供的用户行为日志的生成方法,通过实时获取用户的行为信息和行为信息对应的场景信息,将相互关联的行为信息串接为行为信息链,并剔除行为信息链中包含的无效行为信息,将行为信息链中包含的所有有效行为信息和该有效行为信息对应的场景信息,确定为情景行为信息,最后对情景行为信息进行关键词提取处理后,将生成的关键词确定为用户行为日志。由此可知,本发明实施例提供的用户行为日志的生成方法,生成的用户行为日志,将具有关联关系的行为信息关联在一起,使得行为信息之间不再孤立,且剔除了无效行为信息,提高了用户行为日志的有效性。这样,一方面,将该用户行为日志上传至后台服务器后,减少了用户行为日志的数据冗余度,降低了后台服务器的负载;另一方面,根据该用户行为日志,对用户行为进行分析时,处理过程较为简单,极大地减少了数据计算量,提高了分析速率,进而提高了分析效率。

与上述用户行为日志的生成方法相对应,本发明实施例还公开了一种用户行为日志的生成装置。

参见图2,图2示出的是本发明实施例提供的一种用户行为日志的生成装置的结构框图。结合图2可知,该生成装置包括:

行为信息获取模块201,用于获取用户的行为信息和所述行为信息对应的场景信息;生成时间获取模块202,用于从所述行为信息对应的场景信息中,获取所述行为信息的生成时间;行为信息链生成模块203,用于如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长小于或等于第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,按照相应生成时间的先后顺序,串接于同一条行为信息链中;情景行为信息生成模块204,用于根据所述行为信息链和所述行为信息链中行为信息对应的场景信息,生成情景行为信息;用户行为日志生成模块205,用于对所述情景行为信息进行关键词提取,生成用户行为日志。

进一步,该生成装置还包括有效行为信息确定模块206,用于执行下述操作:确定所述行为信息链中包含的有效行为信息;删除所述行为信息链中包含的无效行为信息,所述无效行为信息为所述行为信息链中,所述有效行为信息之外的所有行为信息。

进一步,所述行为信息链生成模块203还用于:如果生成时间在后的行为信息与其前一条行为信息的生成时间的间隔时长大于所述第一预设时长,将该条生成时间在后的行为信息与其前一条行为信息,分别串接于不同的行为信息链中。

进一步,所述有效行为信息确定模块206用于确定所述行为信息链中包含的有效行为信息,具体包括:所述有效行为信息确定模块206用于执行下述操作:确定所述行为信息链中包含的子行为信息链,所述子行为信息链中包含至少两条行为信息,其中第一条行为信息的生成时间,与最后一条行为信息的生成时间的间隔时长,小于或等于第二预设时长,且所述子行为信息链中包含的所有行为信息相同;将所述子行为信息链中,最后一条行为信息,确定为有效行为信息。

进一步,所述有效行为信息确定模块206还用于:对于所述行为信息链中,不属于任何一个子行为信息链的每一条行为信息,如果该条行为信息的生成时间,与其下一条行为信息的生成时间的间隔时长,大于或等于第三预设时长,将该条行为信息确定为有效行为信息。

采用本发明实施例提供的用户行为日志的生成装置,可以实施上述用户行为日志的生成方法中的各步骤,并获得相同的有益效果。本发明实施例提供的用户行为日志的生成装置,生成的用户行为日志,将具有关联关系的行为信息关联在一起,使得行为信息之间不再孤立,且剔除了无效行为信息,提高了用户行为日志的有效性。这样,一方面,将该用户行为日志上传至后台服务器后,减少了用户行为日志的数据冗余度,降低了后台服务器的负载;另一方面,根据该用户行为日志,对用户行为进行分析时,处理过程较为简单,极大地减少了数据计算量,提高了分析速率,进而提高了分析效率。

具体实现中,本发明还提供一种计算机存储介质,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的用户行为日志的生成方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:rom)或随机存储记忆体(英文:randomaccessmemory,简称:ram)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于用户行为日志的生成装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。

以上所述的本发明实施方式并不构成对本发明保护范围的限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1