推荐方法及装置与流程

文档序号:11864738阅读:139来源:国知局
推荐方法及装置与流程

本发明属于互联网技术领域,尤其涉及一种推荐方法及装置。



背景技术:

随着互联网的飞速发展,每个用户均可自由参与到网络信息的创建与传播中,这不仅造就了网络信息的大爆炸,为用户提供了更多的信息,同时也造成了网络信息的混乱,为用户发现实际可用信息带来了极大障碍。越来越多的用户活跃在社交、新闻、视频等各类站点上,并对网络上的各种内容资源发表自己的看法,具体发表形式包括评论、聊天、弹幕、赞踩、关注、收藏等。基于评论、聊天、弹幕等用户行为产生的用户生成内容(User Generated Content,UGC)信息流充斥在其他用户的浏览视野中,并未被有效利用,使网络信息的获取效率受到大大限制,甚至对产品形态产生负面影响。现有各类互联网产品普遍拥有自己的推荐方案,然而大多数推荐方案通常是基于商品和单一内容的推荐,信息的推荐思路聚焦于物而不是聚焦于人,并未充分利用用户行为相关的信息来获知用户的兴趣爱好,因此常常受限于运算能力和信息维度而出现推荐信息并不贴合用户需求的问题,从而使用户不能直观感受到推荐信息的精准性,降低对推荐系统的依赖。



技术实现要素:

本发明实施例提供一种推荐方法及装置,用以解决现有技术中未充分利用用户行为相关的信息来获知用户的兴趣爱好而导致推荐精准度不高的问题。

本发明实施例第一方面提供一种推荐方法,所述方法包括:

采集用户行为信息和UGC文本信息,获取所述用户行为信息和UGC文本信息对应的兴趣标签作为用户标签;

根据所述用户标签更新用户画像;

根据所述用户画像计算所述用户与其他用户之间的相似度,将所述相似度达到预定阈值的相似用户推荐给所述用户。

在第一方面第一种可行的实现方式中,所述根据所述用户标签更新用户画像的步骤具体包括:

根据用户行为类别为所述用户行为信息和所述UGC文本信息设定权重;

确定每个所述用户标签对应的权重,根据所述用户标签和所述用户标签对应的权重更新用户画像。

在第一方面第二种可行的实现方式中,所述获取所述用户行为信息和UGC文本信息对应的兴趣标签作为用户标签的步骤具体包括:

根据所述用户行为信息在预设兴趣标签库中查找与所述用户行为信息对应的兴趣标签作为用户标签;

对所述UGC文本信息进行内容分析,并根据所述内容分析的结果获取所述UGC文本信息对应的兴趣标签作为用户标签。

结合第一方面第二种可行的实现方式,在第一方面第三种可行的实现方式中,所述获取所述用户行为信息和UGC文本信息对应的兴趣标签作为用户标签的步骤还包括:

将所述UGC文本信息对应的兴趣标签与所述兴趣标签库进行匹配,判断所述UGC文本信息对应的兴趣标签是否包含于所述兴趣标签库中;

当所述UGC文本信息对应的兴趣标签未包含于所述兴趣标签库中时,将所述UGC文本信息对应的兴趣标签存入所述兴趣标签库中。

结合第一方面第二种可行方式,在第一方面第四种可行的实现方式中,所述对UGC文本信息进行内容分析的步骤具体为利用分词算法和语义分析算法对UGC文本信息进行内容分析。

在第一方面第五种可行的实现方式中,所述用户画像包括用户基础属性信息列表,所述方法还包括:

检测所述UGC文本信息中是否包含有用户基础属性信息;

当检测到所述UGC文本信息中包含有用户基础属性信息时,将所述用户基础属性信息存入所述用户基础属性信息列表以更新所述用户画像。

在第一方面第六种可行的实现方式中,所述将所述相似度达到预定阈值的相似用户推荐给所述用户的步骤具体包括:向用户发送推荐消息,所述推荐消息中包含所述相似用户以及所述相似用户对应的推荐理由。

在第一方面第七种可行的实现方式中,所述采集用户行为信息和UGC文本信息的步骤具体包括:

获取用户日志信息;

从用户日志信息中提取用户行为信息;

检测是否存在由所述用户行为对应产生的UGC文本信息;

当检测到存在由所述用户行为对应产生的UGC文本信息时,提取所述UGC文本信息。

本发明实施例第二方面提供一种推荐装置,所述装置包括:

标签获取模块,用于采集用户行为信息和UGC文本信息,并获取所述用户行为信息和UGC文本信息对应的兴趣标签作为用户标签;

用户画像管理模块,用于根据所述用户标签更新用户画像;

推荐模块,用于根据所述用户画像计算所述用户与其他用户之间的相似度,并将所述相似度达到预定阈值的相似用户推荐给所述用户。

在第二方面第一种可行的实现方式中,所述用户画像管理模块包括:

权重设定模块,用于根据用户行为类别为所述用户行为信息和UGC文本信息设定权重;

用户画像更新模块,用于确定每个所述用户标签对应的权重,根据所述用户标签和所述用户标签对应的权重更新所述用户画像。

在第二方面第二种可行的实现方式中,所述标签获取模块包括:

第一查找模块,用于根据所述用户行为信息在预设兴趣标签库中查找与所述用户行为信息对应的兴趣标签作为用户标签;

第一标签获取模块,用于对所述UGC文本信息进行内容分析,并根据所述内容分析的结果获取所述UGC文本信息对应的兴趣标签作为用户标签。

结合第二方面第二种可行的实现方式,在第二方面的第三种可行的实现方式中,所述标签获取模块还包括:

第一检测模块,用于将所述UGC文本信息对应的兴趣标签与所述兴趣标签库进行匹配,并判断所述UGC文本信息对应的兴趣标签是否包含于所述兴趣标签库中;

第一储存模块,用于在所述第一检测模块判断所述UGC文本信息对应的兴趣标签未包含于所述兴趣标签库中时,将所述UGC文本信息对应的兴趣标签存入所述兴趣标签库中。

在第二方面的第四种可行的实现方式中,所述用户画像包括用户基础属性信息列表。

结合第二方面第四种可行的实现方式,在第二方面的第五种可行的实现方式中,所述装置还包括:

第二检测模块,用于检测所述UGC文本信息中是否包含有用户基础属性信息;

第二储存模块,用于在所述第二检测模块的检测到所述UGC文本信息中包含有用户基础属性信息时,将所述用户基础属性信息存入所述用户基础属性信息列表以更新所述用户画像。

在第二方面的第六种可行的实现方式中,所述推荐模块具体包括:消息发送模块,用于向用户发送推荐消息,所述推荐消息中包含所述相似用户以及所述相似用户对应的推荐理由。

在第二方面的第七种可行的实现方式中,所述标签获取模块具体包括:

信息获取模块,用于获取所述用户的日志信息;

第一信息提取模块,用于从所述用户的日志信息中提取所述用户行为信息;

第三检测模块,用于检测是否存在由所述用户行为对应产生的UGC文本信息;

第二信息提取模块,用于在所述第三检测模块检测到存在由所述用户行为对应产生的UGC文本信息时,提取所述UGC文本信息。

从上述本发明实施例可知,本发明通过采集用户行为信息和UGC文本信息来获知用户兴趣爱好,并据此更新用户画像作为用户推荐的依据。相较于现有技术,本发明实施例将推荐聚焦于人,聚焦于人与人的兴趣交集,不仅有效利用了用户行为信息和UGC文本信息,提高了网络信息的使用效率,而且可以提供更为精准的用户推荐以贴合用户需求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明第一实施例中一种推荐方法的流程示意图;

图2为本发明第二实施例中一种推荐方法的流程示意图;

图3为本发明第三实施例中一种推荐方法的流程示意图;

图4为本发明第四实施例中一种推荐方法的流程示意图;

图5为本发明第五实施例中一种推荐装置的功能模块示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,为本发明第一实施例中一种推荐方法的流程示意图。本发明实施例提供的推荐方法,可以应用于运行互联网产品的电子设备中,该电子设备可以是服务器或终端设备,该终端设备可以是智能手机、平板电脑或者笔记本电脑等。如图1所示,该推荐方法包括:

步骤101、采集用户行为信息和UGC文本信息,获取该用户行为信息和UGC文本信息对应的兴趣标签作为用户标签;

需要说明的是,在本发明实施例中,用户行为信息包括但不限于:用户标识、用户行为标识、产品标识、内容标识及时间标识。其中,用户标识用于表征用户行为的主体;用户行为标识用于表征用户行为类别等相关行为特征信息;产品标识和内容标识用于表征用户行为的对象及其所在位置;时间标识可以包括时间戳和/或时间段,用于表征用户行为发生的时间信息。在不同的互联网产品中,由于功能使用场景不同,对应的用户行为也往往不同。例如,在视频应用产品中,用户行为通常包括播放、评论、收藏、弹幕、聊天、关注、赞踩等行为。其中,用户的评论、聊天、弹幕等行为会进一步产生UGC文本信息。由此可知,本发明实施例中的UGC文本信息包括但不限于:评论记录、聊天记录、弹幕内容等文本信息。

在本发明实施例中,用户行为信息和UGC文本信息可以通过用户日志信息来获得。采集用户行为信息和UGC文本信息的步骤可以实时执行,也可以预先设定为定期执行。

在本发明实施例中,兴趣标签用于表征用户兴趣爱好信息,可以从预先设置的兴趣标签库中获取。兴趣标签可以根据实际需求进行多层级设置,例如,在视频应用产品中,可以将“体育”设为第一级兴趣标签,“篮球”设为第二级兴趣标签,“NBA”设为第三级兴趣标签,依此类推。另外,也可以根据兴趣标签被获取的概率(简称标签命中率)对兴趣标签进行分级,将兴趣标签按命中率由大到小依次设置,例如,一级标签可设置为命中率高的兴趣标签,而二、三级标签则为命中率较小的兴趣标签。

步骤102、根据用户标签更新用户画像;

在本发明实施例中,所述用户画像至少包括用户兴趣爱好信息和用户基础属性信息列表。其中,用户兴趣爱好信息采用用户标签表示,用户基础属性信息列表用于存放用户基础属性信息。用户基础属性信息包括但不限于:用户的性别、年龄、学历、地理位置等信息。

需要说明的是,在冷启动阶段,尚未有用户标签数据,此时可以通过对用户进行问卷调查,并根据问卷调查结果生成用户画像。当用户行为产生时,再根据用户行为对应的用户标签更新用户画像。

在本发明实施例中,在获取的用户标签数量较多的情况下,可以预先设定用于更新用户画像的用户标签级别,对用户标签进行筛选,再进行更新操作。

步骤103、根据该用户画像计算该用户与其他用户之间的相似度,并将相似度达到预定阈值的相似用户推荐给该用户;

在本发明实施例中,相似度的计算可以利用K最邻近(K-Nearest neighbors,KNN)算法来实现,具体实现流程如下:

(1)选取待测用户的n个相关画像标签;

其中,画像标签是用户画像的组成单元,可以是作为用户标签的兴趣标签,也可以是用户基础属性信息。在实际应用中,通常并不是所有画像标签都需要参与相似度计算,因此可以根据实际应用场景和功能需求选取相似度计算所需的画像标签。例如,可以选取达到预定权重值的用户标签参与相似度计算。又如,在视频应用产品中,可以选取用户基础属性信息中的年龄和性别等相关信息参与相似度计算。

(2)确定参与相似度计算的用户集;

在本发明实施例中,该用户集中包含多个用于相似度计算的样本用户,该用户集的范围可以根据整体用户量和计算复杂度进行调整。

(3)设定每一画像标签的相似系数t和总体相似度的预定阈值k。

其中,画像标签相似系数t用于表示待测用户与样本用户的画像标签之间的相似程度,通常取值范围为0≤t≤1。预定阈值k则是用来判断用户相似度计算结果是否达标的参考值。

(4)遍历计算用户集中所有样本用户与该待测用户的距离L;

其中,L就是指待测用户与样本用户之间的相似度。

(5)判断L是否达到预定阈值k;

(6)当判断L达到预定阈值k,则确定该样本用户为待测用户的相似用户。

可选地,本发明实施例的相似度计算步骤可以预先设定为定期执行。根据相似度计算获得的相似用户可以是一个也可以是多个。当有多个相似用户存在时,则可将所有相似用户以用户集合的形式一并推荐给用户。

本发明实施例通过采集用户行为信息和UGC文本信息来获知用户兴趣爱好,并据此更新用户画像作为用户推荐的依据,不仅有效利用了用户行为信息和UGC文本信息,提高了网络信息的使用效率,而且可以提供更为精准的用户推荐以贴合用户需求。

由于用户行为的差异直接体现用户兴趣爱好程度的不同,因此为了提高推荐准确度,还可进一步为用户行为信息和UGC文本信息设定权重,具体实现将在下一实施例中进行详细说明。

请参阅图2,为本发明第二实施例中一种推荐方法的流程示意图。如图2所示,本发明第二实施例提供的一种推荐方法包括:

步骤201、采集用户行为信息和UGC文本信息,获取该用户行为信息和UGC文本信息对应的兴趣标签作为用户标签;

在本发明实施例中,采集用户行为信息和UGC文本信息的步骤可以采用如下具体流程来实现:

(1)获取用户日志信息;

(2)从用户日志信息中提取用户行为信息;

(3)检测是否存在由用户行为对应产生的UGC文本信息;

(4)当检测结果为是时,提取UGC文本信息。

在本发明实施例中,可预先设置兴趣标签库,用于存放兴趣标签。该兴趣标签库还可根据兴趣标签的使用频率进行定期更新。

可选地,在本发明实施例中,所述获取该用户行为信息和UGC文本信息对应的兴趣标签作为用户标签的步骤具体包括:

根据用户行为信息在预设兴趣标签库中查找与该用户行为信息对应的兴趣标签作为用户标签;

对UGC文本信息进行内容分析,并根据内容分析的结果获取该UGC文本信息对应的兴趣标签作为用户标签。

在本发明实施例中,可以利用分词算法和语义分析算法对UGC文本信息进行内容分析。

步骤202、根据用户行为类别为该用户行为信息和UGC文本信息设定权重;

步骤203、确定每个用户标签对应的权重,根据用户标签和用户标签对应的权重更新用户画像;

在本发明实施例中,可以根据用户行为类别为用户行为信息和UGC文本信息设定不同权重值。例如,在视频应用产品中,用户行为信息和UGC文本信息的权重值可以由高到低按播放、评论、收藏、弹幕、聊天、关注、赞踩的顺序进行设定。该权重值也是用户行为信息和UGC文本信息对应的用户标签的权重值。权重值越高,说明该用户行为信息和UGC文本信息所对应的用户标签在后续用户推荐中参考价值越大。

可选地,在本发明实施例中,还可参考实际应用场景,结合用户行为发生的时间段、用户行为发生的次数和特定时间段内用户行为发生的频率等相关信息中的任意一类或多类,根据用户行为类别为用户行为信息和UGC文本信息设定不同权重值。例如,针对同一类视频节目,用户播放行为连续发生的时间段超过预定时间段,或者用户播放行为发生的次数超过预定次数,或者特定时间段内用户播放行为发生的频率超过预定频率,则说明用户对此类视频节目非常感兴趣,可以为该用户播放行为设定最大权重值,用户标签的权重也对应确定为最大权重值。

需要说明的是,在冷启动阶段,尚未有用户标签数据,此时可以通过对用户进行问卷调查,并根据问卷调查结果生成用户画像。当用户行为产生时,再根据用户行为对应的用户标签和用户标签对应的权重更新用户画像。

在本发明实施例中,在获取的用户标签数量较多的情况下,可以预先设定用于更新用户画像的用户标签级别,对用户标签进行筛选,再结合其对应的权重进行更新操作。

步骤204、根据该用户画像计算该用户与其他用户之间的相似度,并将相似度达到预定阈值的相似用户推荐给该用户。

在本发明实施例中,关于相似度计算的步骤与本发明第一实施例中步骤103中相关描述内容相似,此处不再赘述。

在相似度计算后,可以通过向用户发送推荐消息的方式将相似度达到预定阈值的相似用户集合推荐给用户,还可将该相似用户集合对应的推荐理由(例如:重合的兴趣标签、重合的画像等)一并发送给用户。该推荐消息中包含相似用户集合以及该相似用户集合对应的推荐理由。用户收到推荐消息后,便可获知与自己具有相同兴趣爱好的其他用户。根据使用场景和推荐理由,可进一步为用户提供即时聊天、动态关注、申请好友等功能,以使用户更为依赖本发明实施例提供的推荐方法。

在本发明实施例中,还可根据实际业务需求和使用场景,定期调整参与相似度计算的权重和兴趣标签的范围,为用户提供更为精准的推荐。

本发明实施例通过采集用户行为信息和UGC文本信息来获知用户兴趣爱好,并进一步为用户行为信息和UGC文本信息设定权重,据此更新用户画像作为用户推荐的依据,不仅有效利用了用户行为信息和UGC文本信息,充分发挥了用户行为信息和UGC文本信息的参考价值,提高了网络信息的使用效率,而且可以提供更为精准的用户推荐以贴合用户需求。

下面将针对UGC文本信息的具体应用以及UGC文本信息对应的兴趣标签获取方式进行详细说明。

请参阅图3,为本发明第三实施例中一种推荐方法的流程示意图。如图3所示,本发明第三实施例提供的一种推荐方法包括:

步骤301、采集用户行为信息和UGC文本信息;

步骤302、根据用户行为信息在预设兴趣标签库中查找与用户行为信息对应的兴趣标签作为用户标签;

在本发明实施例中,步骤301及步骤302与本发明第二实施例中步骤201描述的内容相似,此处不再赘述。

步骤303、对UGC文本信息进行内容分析,并从内容分析的结果中提取UGC文本信息对应的兴趣标签作为用户标签。

在本发明实施例中,步骤303具体实现为:先利用分词算法结合简单的语义分析算法对UGC文本信息进行拆分解析,分析用户的语言习惯和用词习惯,例如通过上下文对分词进行褒贬程度判断,然后从拆分解析得到的分词结果中提取UGC文本信息对应的兴趣标签作为用户标签。

可选地,在本发明实施例中,还可以根据标签的相关度对所提取的UGC文本信息对应的兴趣标签进行层级划分。例如,可以将从UGC文本信息的内容分析结果中提取的核心词汇划分为一级标签,而从内容分析结果中提取的公众词汇划分为二、三级标签。在本发明实施例中还可根据预设规则对不同级别的兴趣标签进行不同的处理,例如,由于二、三级标签的普及率小,命中率小,受时效性限制,因此需要同时结合关注热度和频次进行定期调整。

在本发明实施例中,从内容分析结果中提取UGC文本信息对应的兴趣标签作为用户标签后,还可根据所提取的UGC文本信息对应的兴趣标签更新兴趣标签库,具体实现为:

将UGC文本信息对应的兴趣标签与兴趣标签库进行匹配,判断UGC文本信息对应的兴趣标签是否包含于该兴趣标签库中;

当判断UGC文本信息对应的兴趣标签未包含于该兴趣标签库中时,将UGC文本信息对应的兴趣标签存入兴趣标签库中。

步骤304、根据内容分析结果检测UGC文本信息中是否包含有用户基础属性信息;

步骤305、当检测到UGC文本信息中包含有用户基础属性信息时,根据该用户基础属性信息更新用户画像;

在本发明实施例中,用户画像包括用户基础属性信息列表,用于存放用户基础属性信息。用户基础属性信息包括但不限于:用户的性别、年龄、学历、地理位置、职业等信息。当检测发现UGC文本信息的内容分析结果中包含有用户基础属性信息时,则直接从内容分析结果中提取此类信息并存入用户基础属性信息列表中,以更新用户画像。

步骤306、根据用户行为类别为用户行为信息和UGC文本信息设定权重;

步骤307、确定每个用户标签对应的权重,根据用户标签和该用户标签对应的权重更新用户画像;

步骤308、根据该用户画像计算该用户与其他用户之间的相似度,并将相似度达到预定阈值的相似用户推荐给该用户。

在本发明实施例中,步骤306至步骤308与本发明第二实施例中步骤202至步骤204描述的内容相似,此处不再赘述。

请参阅图4,为本发明第四实施例中一种推荐方法的流程示意图。如图4所示,本发明第四实施例中UGC文本信息对应的兴趣标签可以从兴趣标签库中查找获得。具体地,本发明实施例提供的一种推荐方法包括以下步骤:

步骤401、采集用户行为信息和UGC文本信息;

步骤402、根据用户行为信息在预设兴趣标签库中查找与用户行为信息对应的兴趣标签作为用户标签;

在本发明实施例中,步骤401及步骤402与本发明第二实施例中步骤201描述的内容相似,此处不再赘述。

步骤403、对UGC文本信息进行内容分析,并根据内容分析的结果在兴趣标签库中查找与UGC文本信息对应的兴趣标签作为用户标签。

在本发明实施例中,所述根据内容分析的结果在兴趣标签库中查找与UGC文本信息对应的兴趣标签作为用户标签的步骤具体可以实现为:将内容分析结果中的词汇逐一与兴趣标签库进行匹配查找,当在兴趣标签库中查找到与该词汇一致的兴趣标签时,则从兴趣标签库中提取该兴趣标签作为UGC文本信息对应的用户标签。

步骤404、根据用户行为类别为用户行为信息和UGC文本信息设定权重;

步骤405、确定每个用户标签对应的权重,根据用户标签和该用户标签对应的权重更新用户画像;

步骤406、根据该用户画像计算该用户与其他用户之间的相似度,并将相似度达到预定阈值的相似用户推荐给该用户。

在本发明实施例中,步骤404至步骤406与本发明第二实施例中步骤202至步骤204描述的内容相似,此处不再赘述。

通过上述本发明多个方法实施例的实现可知,本发明通过采集用户行为信息和由用户行为产生的UGC文本信息来分析用户兴趣爱好,并据此更新用户画像作为用户推荐的依据,不仅有效利用了用户行为信息和UGC文本信息,提高了网络信息的使用效率,而且可以提供更为精准的用户推荐以贴合用户需求。此外,本发明实施例中的UGC文本信息还可用于更新兴趣标签库和获得用户基础属性信息,充分体现了UGC文本信息在用户推荐方面的应用价值,有助于提升推荐精准度。

请参阅图5,为本发明第五实施例中一种推荐装置的功能模块示意图。如图5所示,本发明第五实施例提供的一种推荐装置包括:

标签获取模块501,用于采集用户行为信息和UGC文本信息,并获取用户行为信息和UGC文本信息对应的兴趣标签作为用户标签;

用户画像管理模块502,用于根据用户标签更新用户画像;

推荐模块503,用于根据用户画像计算该用户与其他用户之间的相似度,并将相似度达到预定阈值的相似用户推荐给该用户。

在本发明实施例中,本发明实施例提供的推荐装置,可以集成于运行互联网产品的电子设备中,该电子设备可以是服务器或终端设备,该终端设备可以是智能手机、平板电脑或者笔记本电脑等。

需要说明的是,在本发明实施例中,用户行为信息和UGC文本信息可以通过用户日志信息来获得。用户行为信息包括但不限于:用户标识、用户行为标识、产品标识、内容标识及时间标识。在不同的互联网产品中,由于功能使用场景不同,对应的用户行为往往不同,基于用户行为产生的UGC文本信息类型也不同。本发明实施例中的UGC文本信息包括但不限于:评论记录、聊天记录、弹幕内容等文本信息。

相应地,本发明实施例中标签获取模块501具体包括:

信息获取模块,用于获取用户日志信息;

第一信息提取模块,用于从用户日志信息中提取用户行为信息;

第三检测模块,用于检测是否存在由用户行为对应产生的UGC文本信息;

第二信息提取模块,用于在第三检测模块检测到存在由该用户行为对应产生的UGC文本信息时,提取UGC文本信息。

另外,标签获取模块501可设置为实时采集用户行为信息和UGC文本信息,也可设置为定期采集用户行为信息和UGC文本信息。

在本发明实施例中,可预先设置一兴趣标签库,用于存放表征用户兴趣爱好的兴趣标签。相应地,本发明实施例中的标签获取模块501包括:

第一查找模块,用于根据用户行为信息在预设兴趣标签库中查找与该用户行为信息对应的兴趣标签作为用户标签;

第一标签获取模块,用于对UGC文本信息进行内容分析,并根据内容分析的结果获取该UGC文本信息对应的兴趣标签作为用户标签。

其中,作为本发明实施例的一种实现方式,本发明实施例中的第一标签获取模块进一步包括:标签提取模块,用于从内容分析的结果中提取UGC文本信息对应的兴趣标签作为用户标签。

相应地,本发明实施例中的标签获取模块501还包括:

第一检测模块,用于将UGC文本信息对应的兴趣标签与兴趣标签库进行匹配,并判断UGC文本信息对应的兴趣标签是否包含于兴趣标签库中;

第一储存模块,用于在第一检测模块判断UGC文本信息对应的兴趣标签未包含于兴趣标签库中时,将UGC文本信息对应的兴趣标签存入兴趣标签库中。

作为本发明实施例的另一种实现方式,本发明实施例中的第一标签获取模块包括:第二查找模块,用于根据内容分析结果在兴趣标签库中查找与UGC文本信息对应的兴趣标签作为用户标签。

在本发明实施例中,用户画像包括用户基础属性信息列表,用于存放用户基础属性信息。用户基础属性信息包括但不限于:用户的性别、年龄、学历、地理位置、职业等信息。作为本发明实施例的一种实现方式,本发明实施例中的推荐装置还包括:

第二检测模块,用于检测UGC文本信息中是否包含有用户基础属性信息;

第二储存模块,用于在第二检测模块检测到UGC文本信息中包含有用户基础属性信息时,将用户基础属性信息存入用户基础属性信息列表以更新用户画像。

由于用户行为的差异直接体现用户兴趣爱好程度的不同,因此为了提高推荐准确度,还可进一步为用户行为信息和UGC文本信息设定权重。作为本发明实施例的一种实现方式,本发明实施例中用户画像管理模块502具体包括:

权重设定模块,用于根据用户行为类别为所述用户行为信息和UGC文本信息设定权重;

用户画像更新模块,用于确定每个所述用户标签对应的权重,根据所述用户标签和所述用户标签对应的权重更新所述用户画像。

在本发明实施例中,权重设定模块可以根据用户行为类别为用户行为信息和UGC文本信息设定不同权重值。例如,在视频应用产品中,用户行为信息和UGC文本信息的权重值可以由高到低按播放、评论、收藏、弹幕、聊天、关注、赞踩的顺序进行设定。该权重值也是用户行为信息和UGC文本信息对应的用户标签的权重值。权重值越高,说明该用户行为信息和UGC文本信息所对应的用户标签在后续用户推荐中参考价值越大。

可选地,在本发明实施例中,还可参考实际应用场景,结合用户行为发生的时间段、用户行为发生的次数和特定时间段内用户行为发生的频率等相关信息中的任意一类或多类,由权重设定模块根据用户行为类别为用户行为信息和UGC文本信息设定不同权重值。例如,针对同一类视频节目,用户播放行为连续发生的时间段超过预定时间段,或者用户播放行为发生的次数超过预定次数,或者特定时间段内用户播放行为发生的频率超过预定频率,则说明用户对此类视频节目非常感兴趣,可以为该用户播放行为设定最大权重值,用户标签的权重也对应确定为最大权重值。

在本发明实施例中,为将相似度达到推荐指数的用户集合推荐给用户,本发明实施例中的推荐模块503包括一消息发送模块,用于向用户发送推荐消息,该推荐消息中包含用户集合以及该用户集合对应的推荐理由。

为提供更为精准的用户推荐,本发明实施例中的推荐装置还包括:调整模块,用于根据实际业务需求和使用场景定期调整相似度相关的权重和兴趣标签的范围。

另外,在本发明实施例中,还可以对兴趣标签库进行定期更新维护。相应地,作为本发明实施例的一种实现方式,本发明实施例中的推荐装置还包括:标签库管理模块,用于根据兴趣标签的使用频率定期更新所述兴趣标签库。

为解决冷启动阶段的用户推荐问题,本发明实施例中的推荐装置还包括:用户画像生成模块,用于在冷启动阶段,对用户进行问卷调查,并根据问卷调查结果生成用户画像。

由上述实现可知,本发明实施例提供的推荐装置通过标签获取模块采集用户行为信息和UGC文本信息,并获取用户行为信息和UGC文本信息对应的兴趣标签,再通过用户画像管理模块根据用户标签更新用户画像,最后由推荐模块根据用户画像计算该用户与其他用户之间的相似度,并将相似度达到预定阈值的相似用户推荐给该用户,不仅有效利用了用户行为信息和UGC文本信息,提高了网络信息的使用效率,而且可以提供更为精准的用户推荐以贴合用户需求。此外,本发明实施例的推荐装置还设置相应的功能模块用于从UGC文本信息中提取用户属性信息以更新用户画像,并根据从UGC文本信息的内容分析结果中提取的兴趣标签更新兴趣标签库,不仅充分挖掘了UGC文本信息的价值,还可有效提升推荐精准度。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上为对本发明所提供的一种推荐方法及装置的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1