基于用户行为的信息推荐方法及装置与流程

文档序号:11432304阅读:158来源:国知局
基于用户行为的信息推荐方法及装置与流程
本发明涉及通信
技术领域
,尤其涉及一种基于用户行为的信息推荐方法及装置。
背景技术
:个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。现有的一些信息网站如招聘网站提供的信息数据量大,用户从信息网站提供的大量数据中,找到自己需要和喜好的数据或内容,逐渐变得越来越难,以招聘网站为例,如何在用户进入某个职位详情页面后,可以为其推荐与当前职位可能存在关联关系的其他职位信息,是一个亟需解决的问题。技术实现要素:本发明提供一种基于用户行为的信息推荐方法及装置,以解决如何为用户推荐与用户当前浏览职位存在关联关系的其他职位信息的问题。第一方面,本发明提供一种基于用户行为的信息推荐方法,包括:从网站的流量日志中获取预设时间内的浏览日志信息,并从所述浏览日志信息中提取出浏览职位信息,所述浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间;根据所述浏览时间从所述浏览职位信息中确定每一用户标识对应的职位标识集合,所述职位标识集合中的职位标识按照时间先后顺序连续;根据关联分析算法和所有用户标识对应的职位标识集合生成推荐信息,所述推荐信息包括每一职位标识对应的关联职位标识集合。进一步地,所述根据所述浏览时间从所述浏览职位信息中确定每一用户标识对应的职位标识集合之前,还包括:将所述浏览职位信息中日平均职位标识数量小于预设值的用户数据删除,所述用户数据包括用户标识、职位标识和浏览时间。可选的,所述关联分析算法为fp-growth算法,所述根据关联分析算法和所有用户标识对应的职位标识集合生成推荐信息,包括:将所有用户标识对应的职位标识集合转换为fp-growth算法所需格式的数据;将转换格式后的数据输入到fp-growth算法中,通过fp-growth算法生成每一职位标识对应的初始关联职位标识集合;将同一职位标识对应的初始关联职位标识集合合并,对合并后的每一集合按照职位标识重复出现次数从大到小进行排序,生成最终的关联职位标识集合。可选的,还包括:接收用户的职位访问请求;根据所述职位访问请求携带的职位标识从所述推荐信息中确定所述职位标识对应的关联职位标识集合,展示所获取的关联职位标识集合。第二方面,本发明提供一种基于用户行为的信息推荐装置,包括:信息获取模块,用于从网站的流量日志中获取预设时间内的浏览日志信息,并从所述浏览日志信息中提取出浏览职位信息,所述浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间;确定模块,用于根据所述浏览时间从所述浏览职位信息中确定每一用户标识对应的职位标识集合,所述职位标识集合中的职位标识按照时间先后顺序连续;处理模块,用于根据关联分析算法和所有用户标识对应的职位标识集合生成推荐信息,所述推荐信息包括每一职位标识对应的关联职位标识集合。进一步地,还包括:删除模块,用于在所述确定模块根据所述浏览时间从所述浏览职位信息中确定每一用户标识对应的职位标识集合之前,将所述浏览职位信息中日平均职位标识数量小于预设值的用户数据删除,所述用户数据包括用户标识、职位标识和浏览时间。可选的,所述关联分析算法为fp-growth算法,所述处理模块具体用于:将所有用户标识对应的职位标识集合转换为fp-growth算法所需格式的数据;将转换格式后的数据输入到fp-growth算法中,通过fp-growth算法生成每一职位标识对应的初始关联职位标识集合;将同一职位标识对应的初始关联职位标识集合合并,对合并后的每一集合按照职位标识重复出现次数从大到小进行排序,生成最终的关联职位标识集合。可选的,还包括:接收模块,用于接收用户的职位访问请求;展示模块,用于根据所述职位访问请求携带的职位标识从所述推荐信息中确定所述职位标识对应的关联职位标识集合,展示所获取的关联职位标识集合。本发明提供的基于用户行为的信息推荐方法及装置,通过从网站的流量日志中获取预设时间内的浏览日志信息,并从浏览日志信息中提取出浏览职位信息,浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间,根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合,职位标识集合中的职位标识按照时间先后顺序连续,最后根据关联分析算法和所有用户标识对应的职位标识集合生成每一职位标识对应的关联职位标识集合,从而,可实现为用户推荐与用户当前浏览职位存在关联关系的其他职位信息,使用户能够快速的找到点了某一职位的人还点击过哪些其他的职位,帮助用户快速找寻找相关职位,从而根本上提高职位的曝光几率,增加网站的职位投递率。附图说明为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明基于用户行为的信息推荐方法实施例一的流程图;图2为本发明基于用户行为的信息推荐方法实施例二的流程图;图3为本发明基于用户行为的信息推荐装置实施例一的结构示意图;图4为本发明基于用户行为的信息推荐装置实施例二的结构示意图;图5为本发明基于用户行为的信息推荐装置实施例三的结构示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1为本发明基于用户行为的信息推荐方法实施例一的流程图,本实施例中的执行主体可以为客户端,如图1所示,本实施例的方法可以包括:s101、从网站的流量日志中获取预设时间内的浏览日志信息,并从浏览日志信息中提取出浏览职位信息,浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间。具体来说,一般从网站的流量日志中可以获取所有用户的招聘业务线的职位详情页点击行为,即就是浏览日志信息,但是用户的点击浏览行为是按照时间顺序累计的,从业务角度出发,考虑到用户一般会在一个周期内连续的进行相关职位的查看,且职位有效期一般最多为半年,所以在选取浏览日志信息时,只选取预设时间内的,例如选取1个月内的浏览日志信息,时间周期为当日起一个月。从浏览日志信息中提取出浏览职位信息,浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间,例如有两个用户a和b,用户a和用户b在不同日期浏览的职位的职位标识如下表一所示。表一浏览职位信息s102、根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合,职位标识集合中的职位标识按照时间先后顺序连续。具体地,以表一所示为例,根据浏览时间先后顺序确定出用户a的职位标识集合为[1,2,3,4,6,9,10,11,2,7,4,7,8,9,10,19,22,32],据浏览时间先后顺序确定出用户b的职位标识集合为[1,3,5,6,5]。可选的,在根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合之前,还可以包括:将浏览职位信息中日平均职位标识数量小于预设值的用户数据删除,用户数据包括用户标识、职位标识和浏览时间,预设值例如为5。通过数据分析可以得出,大多进行投递简历的用户,每天平均的正常浏览职位会在5个以上,因此,可以从浏览职位信息中,进行二次清洗,将平均日浏览量低于5的用户数据删除掉,可进一步提高推荐信息的准确度。例如,进行了该删除处理后,用户b的平均日浏览量低于5,用户b的数据被删除掉。s103、根据关联分析算法和所有用户标识对应的职位标识集合生成推荐信息,推荐信息包括每一职位标识对应的关联职位标识集合。具体来说,在一个连续的浏览周期内,用户点击的所有职位之间都具有相互的关联性,因此可选择一关联分析算法,根据关联分析算法和所有用户标识对应的职位标识集合生成推荐信息,推荐信息包括每一职位标识对应的关联职位标识集合,在其他用户(或者该用户再次)点击推荐信息中的任一职位标识对应的职位时,可从推荐信息中确定职位标识对应的关联职位标识集合,展示给用户。进一步地,在s103之后还包括:接收用户的职位访问请求,根据职位访问请求携带的职位标识从推荐信息中确定职位标识对应的关联职位标识集合,展示所获取的关联职位标识集合。例如,用户进入某个职位详情页时,可对用户展示名为“看了此职位的人还看了哪些职位”的推荐位,其中推荐位中的数据应用最终生成的关联职位标识集合中的数据即可。从而使用户能够快速的找到点了某一职位的人还点击过哪些其他的职位,帮助用户快速找寻找相关职位,从而根本上提高职位的曝光几率,增加网站的职位投递率。可选的,关联分析算法可选择fp-growth算法,fp-growth算法是一种关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(fp-tree),但仍保留项集关联信息。在算法中使用了一种称为频繁模式树(frequentpatterntree)的数据结构。fp-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。fp-growth算法基于以上的结构加快整个挖掘过程,相应地,s103具体可以包括:s1031、将所有用户标识对应的职位标识集合转换为fp-growth算法所需格式的数据。例如,转换格式后的数据如下表二所示:表二职位标识集合1,2,3,4,6,9,10,11,2,7,4,7,8,9,10,19,22,321,2,3,5,7,9,78,3,13,34,124s1032、将转换格式后的数据输入到fp-growth算法中,通过fp-growth算法生成每一职位标识对应的初始关联职位标识集合。本实施例中,可以使用sparkmllib作为算法模型的运行平台,在将转换格式后的数据输入到fp-growth算法中之前,需要对算法计算模型进行参数设置,需要设置最小支持度(minsupport)和最小置信度(minconfidence),最终的数据结果需要完全符合支持度和置信度要求。置信度是指在出现了物品集a的事务t中,物品集b也同时出现的概率有多大,置信度的取值为0~1区间的任意数值,支持度反映了“物品集a的出现”对物品集b的出现概率发生了多大的变化。通过fp-growth算法生成每一职位标识对应的初始关联职位标识集合例如如下表三所示,其中的置信度都为1。表三s1033、将同一职位标识对应的初始关联职位标识集合合并,对合并后的每一集合按照职位标识重复出现次数从大到小进行排序,生成最终的关联职位标识集合。以表三所示的为例,职位1的初始关联集合为[2,3,4],职位2的初始关联集合为[1,3,4],职位3的初始关联集合为[1,2,4],这种情况会降低职位的曝光,且过多的推荐位会出现雷同的职位信息,为了优化这种问题,将同一职位标识对应的初始关联职位标识集合合并,对合并后的每一集合按照职位标识重复出现次数从大到小进行排序,生成最终的关联职位标识集合。以表三所示职位标识为“1”为例,职位标识为“1”的职位对应有3个初始关联职位标识集合,将这3个初始关联职位标识集合合并,合并后的集合按照职位标识重复出现次数从大到小进行排序,合并后的结合如表四所示表四职位标识关联职位标识集合及出现次数17:2,2:1,3:1,4:1,6:1其中职位标识“7”出现2次,职位标识“2”、“3”、“4”、“6”均出现1次,生成最终的关联职位标识集合为[7,2,3,4,6]。本实施例提供的基于用户行为的信息推荐方法,通过从网站的流量日志中获取预设时间内的浏览日志信息,并从浏览日志信息中提取出浏览职位信息,浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间,根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合,职位标识集合中的职位标识按照时间先后顺序连续,最后根据关联分析算法和所有用户标识对应的职位标识集合生成每一职位标识对应的关联职位标识集合,从而,可实现为用户推荐与用户当前浏览职位存在关联关系的其他职位信息,使用户能够快速的找到点了某一职位的人还点击过哪些其他的职位,帮助用户快速找寻找相关职位,从而根本上提高职位的曝光几率,增加网站的职位投递率。下面采用一个具体的实施例,对图1所示方法实施例的技术方案进行详细说明。图2为本发明基于用户行为的信息推荐方法实施例二的流程图,如图2所示,本实施例的方法可以包括:s201、从网站的流量日志中获取预设时间内的浏览日志信息,并从浏览日志信息中提取出浏览职位信息,浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间。s202、将浏览职位信息中日平均职位标识数量小于预设值的用户数据删除,用户数据包括用户标识、职位标识和浏览时间。s203、根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合,职位标识集合中的职位标识按照时间先后顺序连续。s204、将所有用户标识对应的职位标识集合转换为fp-growth算法所需格式的数据。s205、将转换格式后的数据输入到fp-growth算法中,通过fp-growth算法生成每一职位标识对应的初始关联职位标识集合。s206、将同一职位标识对应的初始关联职位标识集合合并,对合并后的每一集合按照职位标识重复出现次数从大到小进行排序,生成最终的关联职位标识集合。图3为本发明基于用户行为的信息推荐装置实施例一的结构示意图,如图3所示,本实施例的装置可以包括:信息获取模块11,用于从网站的流量日志中获取预设时间内的浏览日志信息,并从浏览日志信息中提取出浏览职位信息,浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间。确定模块12,用于根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合,职位标识集合中的职位标识按照时间先后顺序连续。处理模块13,用于根据关联分析算法和所有用户标识对应的职位标识集合生成推荐信息,推荐信息包括每一职位标识对应的关联职位标识集合。本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理类似,此处不再赘述。本实施例提供的基于用户行为的信息推荐装置,通过从网站的流量日志中获取预设时间内的浏览日志信息,并从浏览日志信息中提取出浏览职位信息,浏览职位信息包括用户标识和用户所浏览的职位的职位标识和浏览时间,根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合,职位标识集合中的职位标识按照时间先后顺序连续,最后根据关联分析算法和所有用户标识对应的职位标识集合生成每一职位标识对应的关联职位标识集合,从而,可实现为用户推荐与用户当前浏览职位存在关联关系的其他职位信息,使用户能够快速的找到点了某一职位的人还点击过哪些其他的职位,帮助用户快速找寻找相关职位,从而根本上提高职位的曝光几率,增加网站的职位投递率。图4为本发明基于用户行为的信息推荐装置实施例二的结构示意图,如图4所示,本实施例的装置在图3所示的装置的基础上,进一步地,还可以包括:删除模块14,该删除模块14用于在确定模块12根据浏览时间从浏览职位信息中确定每一用户标识对应的职位标识集合之前,将浏览职位信息中日平均职位标识数量小于预设值的用户数据删除,用户数据包括用户标识、职位标识和浏览时间。在上述实施例中,可选的,关联分析算法为fp-growth算法,处理模块13具体用于:将所有用户标识对应的职位标识集合转换为fp-growth算法所需格式的数据,将转换格式后的数据输入到fp-growth算法中,通过fp-growth算法生成每一职位标识对应的初始关联职位标识集合,将同一职位标识对应的初始关联职位标识集合合并,对合并后的每一集合按照职位标识重复出现次数从大到小进行排序,生成最终的关联职位标识集合。本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理类似,此处不再赘述。图5为本发明基于用户行为的信息推荐装置实施例三的结构示意图,如图5所示,本实施例的装置在图4所示的装置的基础上,进一步地,还可以包括:接收模块15和展示模块16,其中,接收模块15用于接收用户的职位访问请求。展示模块16用于根据职位访问请求携带的职位标识从推荐信息中确定职位标识对应的关联职位标识集合,展示所获取的关联职位标识集合。本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理类似,此处不再赘述。本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1