用户兴趣采集方法、装置、计算机装置及计算机可读存储介质与流程

文档序号:16263709发布日期:2018-12-14 21:46阅读:165来源:国知局
用户兴趣采集方法、装置、计算机装置及计算机可读存储介质与流程
本发明属于数据处理
技术领域
,尤其涉及一种用户兴趣采集方法、装置、计算机装置及计算机可读存储介质。
背景技术
近年来,随着移动互联网和大数据的爆发性发展,智能推荐技术在越来越多的互联网产品上得到广泛应用,如新闻推荐、电影和书籍推荐、视频推荐、或商品推荐等。现有的推荐技术可以基于一些数据挖掘手段,如挖掘用户点击历史、网页浏览历史、社交网络信息等来确定用户的兴趣,从而根据用户的兴趣为用户推荐相应的内容。但是,实践中发现,用户在上网时可能会暂时因一个标题的吸引而浏览该网页、或者漫无目的随意地去浏览网页,若仍基于上述数据挖掘手段确定用户的兴趣,会导致用户兴趣确定不准确,从而导致后续不能准确地为用户推荐合适的内容,推荐效率较低。技术实现要素:本发明实施例提供一种用户兴趣采集方法,旨在解决用户兴趣确定不准确、推荐效率较低的问题。本发明实施例提供了一种用户兴趣采集方法,包括如下步骤:采集用户的行为数据;根据用户的行为数据,确定至少一个与用户行为数据对应的用户兴趣信息,并根据预设的评分规则与用户的行为数据之间的对应关系,对用户兴趣信息进行评分;对用户兴趣信息的评分进行统计,获取用户兴趣信息对应的分数值,并根据分数值确定用户的实际兴趣信息。本发明实施例提供了一种用户兴趣采集装置,包括:用户行为数据采集单元,用于采集用户的行为数据;评分单元,用于根据用户的行为数据,确定至少一个与用户行为数据对应的用户兴趣信息,并根据预设的评分规则与用户的行为数据之间的对应关系,对用户兴趣信息进行评分;用户实际兴趣信息确定单元,用于对用户兴趣信息的评分进行统计,获取用户兴趣信息对应的分数值,并根据分数值确定用户的实际兴趣信息。本发明实施例还提供了一种计算机装置,所述计算机装置包括:处理器,用于执行存储器中存储的计算机程序时实现如上述用户兴趣采集方法的步骤。本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述用户兴趣采集方法的步骤。本发明实施例中,通过采集用户的行为数据;根据用户的行为数据,确定至少一个与用户行为数据对应的用户兴趣信息,并根据预设的评分规则与用户的行为数据之间的对应关系,对用户兴趣信息进行评分;对用户兴趣信息的评分进行统计,获取用户兴趣信息对应的分数值,并根据分数值确定用户的实际兴趣信息。在用户实际兴趣信息确定时,参考用户关注、点赞、浏览时长等要素,使用户兴趣的确定更加准确,从而后续根据用户兴趣更能有效地为用户推荐内容,提高了推荐技术的有效性。附图说明图1是本发明实施例一提供的用户兴趣采集方法的流程示意图;图2是本发明实施例二提供的确定用户实际兴趣信息的方法的实现流程图;图3是本发明实施例三提供的用户兴趣采集装置采集的结构示意图;图4是本发明实施例四提供的用户实际兴趣信息确定单元的结构示意图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。本发明实施例中,通过采集用户的行为数据,并通过用户的行为数据以及预设的评分规则确定用户的实际兴趣信息。在用户实际兴趣信息确定时,参考用户关注、点赞、浏览时长等要素,使用户兴趣的确定更加准确,从而后续根据用户兴趣更能有效地为用户推荐内容,提高了推荐技术的有效性。实施例一、参见图1,本发明实施例一提供了用户兴趣采集方法的流程示意图,详述如下:该用户兴趣采集方法包括但不限于以下步骤:s101、采集用户的行为数据。用户的行为数据可以包括用户在浏览社交类网页(如微博)时关注、点赞、或取消关注某一网页、或浏览该网页的时长等行为数据,再或者用户观看视频时,观看某一节目的频率、时长等行为数据等;另外,用户的行为数据还可以包括用户使用终端中某一应用的使用时间、使用时长、或使用频率等行为数据。本发明实施例中,用户的行为数据可以通过云端服务器、也可以包括运行在android操作系统、ios操作系统、windows操作系统或其他操作系统的终端上的客户端进行采集,该终端可以包括例如移动电话、移动电脑、平板电脑、个人数字助理(personaldigitalassistant,pda)等。在一种可选的实施例中,当通过运行在终端上的客户端对用户行为数据采集时,用户可以浏览客户端上发布的新闻、视频等信息。此时客户端可以采集用户在浏览网页时关注、点赞、或取消关注、或浏览该网页的时长等行为数据;或者,客户端还可以采集用户观看视频时的频率、时长等行为数据等。s102、根据用户的行为数据,确定至少一个与该用户行为数据对应的用户兴趣信息,并根据预设的评分规则与该用户的行为数据之间的对应关系,对该用户兴趣信息进行评分。在本发明实施例中,预设的评分规则为不同的行为数据对应不同的分值,比如,当用户的行为数据为点赞时,则可加1分,当用户的行为数据为关注时,则可加2分,当用户的行为数据为取消关注时,则可减2分。在本发明实施例中,用户浏览的文章、观看的视频等可分为不同的类型,比如,娱乐、生活、体育等类型,根据用户对不同类型的文章或视频等信息的行为(如关注、点赞、取消关注或浏览等)可确定用户的兴趣信息。其中,用户的兴趣信息可为娱乐、体育、新闻等信息。可选的,用户的行为数据可以为用户浏览不同网页的文章或者视频的时长,可以根据预设的评分与用户浏览时长之间的对应关系,对用户兴趣信息进行评分。例如,网页a1、a2、a3属于娱乐版块,网页b1、b2、b3属于科技版块,网页c1、c2属于游戏版块,预设的评分与用户浏览时长之间的对应关系为:浏览时长为0min-10min对应的分值为1分,浏览时长为10min-20min对应的分值为2分。如果用户兴趣采集装置浏览网页a1、b1和b2,且浏览时长分别为0min-10min、0min-10min和10min-20min,网页a1归属于娱乐版块,网页b1、b2归属于科技版块,则用户兴趣采集装置可以确定用户的兴趣信息为娱乐和科技,且用户的兴趣信息为娱乐的评分统计为1分,用户的兴趣信息为科技的评分统计为浏览b1、b2的分值之和1+2=3分。可选的,用户的行为数据可以为关注、点赞、取消关注网页,用户兴趣采集装置可以设置上述行为与分值之间的关系,对用户兴趣信息进行评分。例如,表1所示行为与分值之间的关系,用户关注网页可以加1分,点赞网页可以加2分,取消关注可以减1分。表1行为与分值对应关系行为分值关注网页加1分点赞网页加2分取消关注减1分如果用户兴趣采集装置采集到用户关注网页a1,关注网页b1、点赞网页b2、点赞网页c1,接上述,网页a1归属于娱乐版块,网页b1、b2归属于科技版块,网页c1归属于游戏版块,则用户兴趣采集装置可以确定用户的兴趣信息为娱乐、科技和游戏,且用户的兴趣信息为娱乐的评分统计为关注网页a1对应的分值1分,用户兴趣信息科技的评分统计为关注网页b1和点赞网页b2对应的分值之和,即1+2=3分,用户兴趣信息游戏的评分统计为点赞网页c1对应的分值2分。在又一种可选的实施例中,还可以根据用户浏览的内容,确定用户兴趣信息。具体的,可以根据用户浏览的内容信息,提取浏览内容信息的关键词,并根据关键词,确定用户行为数据对应的用户兴趣信息。需要说明的是,本发明实施例中,如果用户浏览内容信息有标签,可以直接根据标签确定用户的兴趣信息,如用户浏览的内容的标签为娱乐,则直接可以确定用户的兴趣信息为娱乐;如果用户浏览的内容信息没有标签,则可以提取浏览内容中的关键词,即可确定用户的兴趣信息,如用户浏览的内容的中有“电影首映”,则可以确定用户的兴趣信息为娱乐等。s103、对用户兴趣信息的评分进行统计,获取用户兴趣信息对应的分数值,并根据分数值确定用户的实际兴趣信息。在一种可选的实施例中,分值高于预设阈值的用户兴趣信息为用户的实际兴趣信息;或者,可以确定分值最高的用户兴趣信息为用户的实际兴趣信息等,在此不再赘述。可见,实施本发明实施例,在用户实际兴趣信息确定时,参考用户关注、点赞、浏览时长等要素,使用户兴趣的确定更加准确,从而后续根据用户兴趣更能有效地为用户推荐内容,提高了推荐技术的有效性。实施例二、图2示出了本发明实施例二提供的确定用户实际兴趣信息的方法的实现流程,其与实施例一相似,不同之处在于,所述对所述用户兴趣信息的评分进行统计,获取所述用户兴趣信息对应的分数值,并根据所述分数值确定用户的实际兴趣信息,包括在步骤s210,对所述用户兴趣信息的评分进行统计,获取所述用户兴趣信息对应的分数值。在本发明实施例中,当确定了用户的兴趣信息,并根据用户的行为数据对该兴趣信息进行了评分后,则可对用户兴趣信息的评分进行统计,比如,当用户对于娱乐类型的文章或者视频进行关注了30次,点赞了20次,则用户的兴趣信息为娱乐,且得分为30+20*2=70分。在步骤s220中,获取所述分数值高于预设阈值的用户兴趣信息。在本发明实施例中,预设阈值可为具体的分数值,比如,80分、90分等,具体可以根据实际情况进行设置,本发明实施例不做限定。在本发明实施例中,对应用户的兴趣信息的分数进行统计,并获取分数值高于预设阈值的用户兴趣信息,比如,用户的兴趣信息为娱乐,80分,体育60分,预设阈值为70分,则用户的兴趣信息为娱乐。在本发明实施例中,由于用户的兴趣信息会发生变化,因此可统计预设时间内的用户兴趣信息的分数,比如,一个月内、半年内、3个月内等,具体可根据实际情况进行设置,本发明不做限定。在步骤s230中,根据所述分数值高于预设阈值的用户兴趣信息,确定用户的实际兴趣信息。在本发明实施例中,用户兴趣采集装置可以确定分值高于预设阈值的用户兴趣信息为用户的实际兴趣信息。可见,实施本发明实施例,在用户实际兴趣信息确定时,参考用户关注、点赞、浏览时长等要素,使用户兴趣的确定更加准确,从而后续根据用户兴趣更能有效地为用户推荐内容,提高了推荐技术的有效性。实施例三、示例性的,本发明实施例中,用户的行为数据还可以包括用户使用终端中某一应用的使用时间、使用时长、或使用频率等行为数据,用户兴趣采集装置为终端。具体的,终端采集用户使用某一应用的使用时间等行为数据,从所有使用的应用(可以理解为本申请的用户的兴趣信息)中,确定使用时间较近、使用时长较长或者使用频率较大的应用作为用户的实际兴趣信息。进一步,终端还可以将确定出的用户的实际兴趣信息,即上述对应的应用的图标放置在终端主界面的特定位置,比如放置在终端主界面最下面托盘一栏,或者,放置在用户设置的特定文件夹中等,以使用户下次更方便找到该图标。例如,用户使用应用a、b和c,其中,使用应用a、b和c的频率为10次/天,6次/天和2次/天,预设使用频率阈值为5次/天,终端可以确定使用频率大于预设使用频率的应用a和b作为用户的实际兴趣信息,并还可以将应用a和b放置在在终端主界面最下面托盘一栏。基于上述方法实施例相同的技术构思,本发明实施例还提供了一种用户兴趣采集装置,可以应用于上述方法实施例中。实施例三、如图3所示,为本发明实施例三提供的用户兴趣采集装置300的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。用户兴趣采集装置300包括:用户行为数据采集单元31、评分单元32、用户实际兴趣信息确定单元33。用户行为数据采集单元31,用于采集用户的行为数据;用户的行为数据可以包括用户在浏览社交类网页(如微博)时关注、点赞、或取消关注某一网页、或浏览该网页的时长等行为数据,再或者用户观看视频时,观看某一节目的频率、时长等行为数据等;另外,用户的行为数据还可以包括用户使用终端中某一应用的使用时间、使用时长、或使用频率等行为数据。本发明实施例中,用户的行为数据可以通过云端服务器、也可以包括运行在android操作系统、ios操作系统、windows操作系统或其他操作系统的终端上的客户端进行采集,该终端可以包括例如移动电话、移动电脑、平板电脑、个人数字助理(personaldigitalassistant,pda)等。在一种可选的实施例中,当通过运行在终端上的客户端对用户行为数据采集时,用户可以浏览客户端上发布的新闻、视频等信息。此时客户端可以采集用户在浏览网页时关注、点赞、或取消关注、或浏览该网页的时长等行为数据;或者,客户端还可以采集用户观看视频时的频率、时长等行为数据等。评分单元32,用于根据用户的行为数据,确定至少一个与用户行为数据对应的用户兴趣信息,并根据预设的评分规则与用户的行为数据之间的对应关系,对用户兴趣信息进行评分。在本发明实施例中,预设的评分规则为不同的行为数据对应不同的分值,比如,当用户的行为数据为点赞时,则可加1分,当用户的行为数据为关注时,则可加2分,当用户的行为数据为取消关注时,则可减2分。在本发明实施例中,用户浏览的文章、观看的视频等可分为不同的类型,比如,娱乐、生活、体育等类型,根据用户对不同类型的文章或视频等信息的行为(如关注、点赞、取消关注或浏览等)可确定用户的兴趣信息。其中,用户的兴趣信息可为娱乐、体育、新闻等信息。可选的,评分单元还用于根据预设的评分与用户浏览时长之间的对应关系,对用户兴趣信息进行评分。具体的,用户的行为数据可以为用户浏览不同网页的文章或者视频的时长,可以根据预设的评分与用户浏览时长之间的对应关系,对用户兴趣信息进行评分。例如,网页a1、a2、a3属于娱乐版块,网页b1、b2、b3属于科技版块,网页c1、c2属于游戏版块,预设的评分与用户浏览时长之间的对应关系为:浏览时长为0min-10min对应的分值为1分,浏览时长为10min-20min对应的分值为2分。如果用户兴趣采集装置浏览网页a1、b1和b2,且浏览时长分别为0min-10min、0min-10min和10min-20min,网页a1归属于娱乐版块,网页b1、b2归属于科技版块,则用户兴趣采集装置可以确定用户的兴趣信息为娱乐和科技,且用户的兴趣信息为娱乐的评分统计为1分,用户的兴趣信息为科技的评分统计为浏览b1、b2的分值之和1+2=3分。可选的,用户的行为数据可以为关注、点赞、取消关注网页,用户兴趣采集装置可以设置上述行为与分值之间的关系,对用户兴趣信息进行评分。例如,表1所示行为与分值之间的关系,用户关注网页可以加1分,点赞网页可以加2分,取消关注可以减1分。表1行为与分值对应关系行为分值关注网页加1分点赞网页加2分取消关注减1分如果用户兴趣采集装置采集到用户关注网页a1,关注网页b1、点赞网页b2、点赞网页c1,接上述,网页a1归属于娱乐版块,网页b1、b2归属于科技版块,网页c1归属于游戏版块,则用户兴趣采集装置可以确定用户的兴趣信息为娱乐、科技和游戏,且用户的兴趣信息为娱乐的评分统计为关注网页a1对应的分值1分,用户兴趣信息科技的评分统计为关注网页b1和点赞网页b2对应的分值之和,即1+2=3分,用户兴趣信息游戏的评分统计为点赞网页c1对应的分值2分。在又一种可选的实施例中,评分单元包括:浏览内容信息确定单元,用于根据用户的行为数据,确定浏览内容信息;关键词提取单元,用于提取浏览内容信息的关键词;用户兴趣信息确定单元,用于根据关键词,确定至少一个与用户行为。根据就用户的行为数据可以确定用户浏览的内容,并进一步确定用户兴趣信息。具体的,可以根据用户浏览的内容信息,提取浏览内容信息的关键词,并根据关键词,确定用户行为数据对应的用户兴趣信息。需要说明的是,本发明实施例中,如果用户浏览内容信息有标签,可以直接根据标签确定用户的兴趣信息,如用户浏览的内容的标签为娱乐,则直接可以确定用户的兴趣信息为娱乐;如果用户浏览的内容信息没有标签,则可以提取浏览内容中的关键词,即可确定用户的兴趣信息,如用户浏览的内容的中有“电影首映”,则可以确定用户的兴趣信息为娱乐等。用户实际兴趣信息确定单元33,用于对用户兴趣信息的评分进行统计,获取用户兴趣信息对应的分数值,并根据分数值确定用户的实际兴趣信息。在一种可选的实施例中,用户兴趣采集装置可以确定分值高于预设阈值的用户兴趣信息为用户的实际兴趣信息;或者,可以确定分值最高的用户兴趣信息为用户的实际兴趣信息等,在此不再赘述。可见,实施本发明实施例,在用户实际兴趣信息确定时,参考用户关注、点赞、浏览时长等要素,使用户兴趣的确定更加准确,从而后续根据用户兴趣更能有效地为用户推荐内容,提高了推荐技术的有效性。实施例四、图4示出了本发明实施例四提供了用户实际兴趣信息确定单元33的结构,为了便于说明,仅示出了与本发明实施例相关的部分。用户实际兴趣信息确定单元33,包括:统计模块331,用于对用户兴趣信息的评分进行统计,获取用户兴趣信息对应的分数值;在本发明实施例中,当确定了用户的兴趣信息,并根据用户的行为数据对该兴趣信息进行了评分后,则可对用户兴趣信息的评分进行统计,比如,当用户对于娱乐类型的文章或者视频关注了30次,点赞了20次,则用户的兴趣信息为娱乐,且得分为30+20*2=70分。用户兴趣信息获取模块332,用于获取分数值高于预设阈值的用户兴趣信息。在本发明实施例中,预设阈值可为具体的分数值,比如,80分、90分等,具体可以根据实际情况进行设置,本发明实施例不做限定。在本发明实施例中,对用户的兴趣信息的分数进行统计,并获取分数值高于预设阈值的用户兴趣信息,比如,用户的兴趣信息为娱乐,80分,体育60分,预设阈值为70分,则用户的兴趣信息为娱乐。在本发明实施例中,由于用户的兴趣信息会发生变化,因此可统计预设时间内的用户兴趣信息的分数,比如,一个月内、半年内、3个月内等,具体可根据实际情况进行设置,本发明不做限定。用户实际兴趣信息确定模块333,用于根据分数值高于预设阈值的用户兴趣信息,确定用户的实际兴趣信息。在本发明实施例中,分值高于预设阈值的用户兴趣信息为用户的实际兴趣信息。可见,实施本发明实施例,在用户实际兴趣信息确定时,参考用户关注、点赞、浏览时长等要素,使用户兴趣的确定更加准确,从而后续根据用户兴趣更能有效地为用户推荐内容,提高了推荐技术的有效性。本发明实施例还提供了一种计算机装置,该计算机装置包括处理器,处理器用于执行存储器中存储的计算机程序时实现上述各个方法实施例提供的用户兴趣信息采集方法的步骤。本发明的实施例还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被上述处理器执行时实现上述各个方法实施例提供的用户兴趣新采集方法的步骤。示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。例如,所述计算机程序可以被分割成上述各个方法实施例提供的用户兴趣信息采集方法的步骤。本领域技术人员可以理解,上述计算机装置的描述仅仅是示例,并不构成对计算机装置的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个用户终端的各个部分。所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。所述计算机装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1