资讯推荐方法及装置与流程

文档序号:13094902阅读:156来源:国知局
资讯推荐方法及装置与流程

本发明涉及计算机领域,尤其涉及一种资讯推荐方法及装置。



背景技术:

随着互联网的迅猛发展,每天有大量网页在互联网上更新或者发布。对于广大用户来说在大量的信息中想找到自己满意的信息已经是越来越困难,从而导致了“信息过量”与“信息饥饿”的矛盾现象。为解决这一问题,提出了个性化信息服务,这是一种智能信息服务方式。可以根据用户的信息需求和个性化模式,主动搜寻相关信息,并且利用在线智能推荐服务或者推送技术,准确的将用户所需的信息传送到相应的用户。在个性化服务技术中,应用较成功的是协同过滤方法。该方法是指用户根据自身的需求,通过和其他用户进行合作,形成一定的协作规则,或利用多个信息使用者的倾向性来预测单个用户的兴趣,然后根据具有相同兴趣爱好的用户对信息进行评价,从而得到推荐结果。由于web日志中记录了大量的用户行为信息,利用web日志可以为个性化服务提供重要的数据支持。另外,在用户兴趣度量方面,目前存在的从访问日志文件中提取用户的访问模式进行推荐的方法,没有考虑到用户访问页面的时间特性。



技术实现要素:

本发明实施例的目的是提供一种资讯推荐方法,能实现基于用户web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

为实现上述目的,本发明实施例提供了一种资讯推荐方法,包括步骤:

实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;

基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;

根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。

与现有技术相比,本发明公开的资讯推荐方法通过实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

作为上述方案的改进,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体为:

收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;

识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;

根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。

作为上述方案的改进,还包括步骤:

根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。

作为上述方案的改进,实时收集用户的行为日志具体为:

通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。

作为上述方案的改进,基于所述行为日志获得所述用户的习惯属性具体为:

对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。

本发明实施例还提供了一种资讯推荐装置,包括:

收集模块,用于实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;

属性获取模块,用于基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;

第一推荐模块,用于根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。

与现有技术相比,本发明公开的资讯推荐装置通过收集模块实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后通过属性获取模块基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再通过第一推荐模块根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

作为上述方案的改进,收集模块包括:

第一识别模块,用于收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;

第一标签集获取模块,用于识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;

第二识别模块,用于根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。

作为上述方案的改进,还包括:第二推荐模块,用于根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。

作为上述方案的改进,所述收集模块具体用于通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。

作为上述方案的改进,所述属性获取模块具体用于对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。

附图说明

图1是本发明实施例1中一种资讯推荐方法的流程示意图。

图2是本发明实施例2中一种资讯推荐方法的流程示意图。

图3是本发明实施例3中一种资讯推荐装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,是本发明实施例1提供的一种资讯推荐方法的流程示意图,包括步骤:

s1、实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;

其中,海量用户行为日志的入库是通过高负载的消息中间件进行数据传输。

s2、基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;

s3、根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。

具体实施时,先实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

在一优选实施例中,步骤s1中通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体包括步骤:

s11、收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;

s12、识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;

s13、根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。

其中,粒度划分是通过lda(主题模型)实现的。

通过上述步骤,能实现自动化抽取和不同粒度的标签划分。

参见图2,是本发明实施例2提供的一种资讯推荐方法的流程示意图,在实施例1的基础上,还包括步骤:

s4、根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。

不同粒度划分可根据用户行为,推荐不同粒度属性的文章,提高推荐精准度。

在一优选实施例中,步骤s2中基于所述行为日志获得所述用户的习惯属性具体为:

对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。

参见图3,是本发明实施例3提供的一种资讯推荐装置的结构示意图,包括:

收集模块101,用于实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;

属性获取模块102,用于基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;

第一推荐模块103,用于根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。

具体实施时,通过收集模块101实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后通过属性获取模块102基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再通过第一推荐模块103根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

优选地,收集模块101包括:

第一识别模块,用于收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;

第一标签集获取模块,用于识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;

第二识别模块,用于根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。

在一优选实施例中,所述资讯推荐装置100还包括:第二推荐模块,用于根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。

在另一优选实施例中,所述收集模块100具体用于通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。

在一优选实施例中,所述属性获取模块102具体用于对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。

综上,本发明实施例提供了一种资讯推荐方法及装置通过先实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1