一种基于用户实时兴趣向量的电影个性化推荐方法

文档序号:6552087阅读:808来源:国知局
一种基于用户实时兴趣向量的电影个性化推荐方法
【专利摘要】本发明公开了一种综合电影内容和用户实时评分信息的电影个性化推荐方法,主要解决传统推荐算法不能及时反映用户的兴趣变化和数据稀疏性的问题。为了解决数据稀疏性问题,本发明引入了用户兴趣向量。从电影特征向量入手,借助用户的评分矩阵以迭代的方式处理得到用户的兴趣特征向量,根据得到的用户特征向量构建用户相似矩阵,最终根据传统的协同过滤评分预测公式完成推荐。针对用户兴趣变化的情况,在构建用户兴趣向量过程中又融入了时间因子,使得越接近当前时间的评分行为权重越大,越能表现用户的兴趣。
【专利说明】-种基于用户实时兴趣向量的电影个性化推荐方法

【技术领域】
[0001] 本发明是综合用户的实时评分数据和电影的特征属性产生的推荐方法,主要解决 了传统协同过滤推荐算法中数据稀疏性和不能及时反映用户兴趣变化的问题,属于多媒体 信息处理领域。

【背景技术】
[0002] 随着互联网把我们带进了信息爆炸的时代,电影内容近几年也在迅猛增长,围绕 电影内容相关上线的网站和应用更是不计其数。对于用户而言,面对如此丰富的电影资源, 想要从中挑出真正想要的内容非常困难。推荐系统成为解决这些问题的有效途径,而推荐 算法是影响推荐系统功能实现的关键。目前主流的推荐算法主要包括基于内容的推荐算 法、协同过滤的推荐算法和混合推荐算法等。
[0003] 基于内容的推荐主要思想就是将与用户进行过好评的电影相似的电影作为推荐 结果,该算法的优点是简单、有效,缺点是推荐结果缺少新奇性,不能为用户发现新的感兴 趣的物品。
[0004] 而协同过滤推荐算法则利用用户的历史信息计算不同用户之间的相似性,然后利 用与目标用户相似性较高的邻居对影片的评价来预测目标用户对特定影片的喜好程度。用 户之间的相似度是根据用户对电影的评分矩阵获取的。假设用户在对同一些电影上的评分 越相似,则表示两个用户的兴趣也就越相似。虽然协同过滤推荐系统得到了广泛的应用,但 是也面临很多现实的问题。比如,在互联网视频业务中,由于用户打分的意识不是很强,造 成了视频推荐中存在着明显的数据稀疏性问题,而协同过滤推荐在打分稀疏的情况下,性 能较差。还有一个问题,传统的协同过滤算法不会考虑用户的兴趣爱好随时间会动态的变 化,导致推荐的电影可能不是用户当前感兴趣的。


【发明内容】

[0005] 本发明是为了解决传统协同过滤推荐算法中数据稀疏性和不能及时反映用户兴 趣变化的问题,而提出的一种综合用户的实时评分数据和电影的特征属性产生基于用户实 时兴趣向量的推荐方法。
[0006] 为了实现本发明的目的,提出了一种基于用户实时兴趣向量的电影个性化推荐 方法,将用户的评分矩阵和电影的特征相结合,融入时间因子,得到可以反映用户实时兴趣 的特征向量。得到的用户兴趣向量既可以解决数据稀疏性问题,也实时地反映了用户的兴 趣变化。本发明的方法在选择邻居用户时,将推荐模型中所有电影的特征通过VSM(Vect 〇r Space Model)特征向量的形式表不;再针对用户的兴趣向量模型,融入时间因子,将用户的 评分矩阵和电影的特征向量以迭代的方式进行建模;将用户的兴趣向量处理成与电影特征 向量相似的形式;最后根据输出的用户兴趣向量计算用户之间的相似性,从而得到目标用 户的邻居用户。本发明在预测用户评分时,以邻居和目标用户的兴趣向量的相似性作为权 重,使用经典的基于用户的协同过滤的评分预测机制,预测出目标用户的相应的评分,最终 通过对得到的目标用户的所有未评分电影的预测评分进行排序,得出topN推荐列表。基于 用户兴趣向量的推荐算法框架如图1所示。
[0007] 本发明采用的技术方案为:
[0008] -种基于用户实时兴趣向量的电影个性化推荐方法,包括如下步骤:
[0009] 步骤一:根据电影的元信息对每部电影的特征属性进行建模,得到电影的 特征向量,电影ti的特征向量表示为= …其中由下式得到:

【权利要求】
1. 一种基于用户实时兴趣向量的电影个性化推荐方法,其特征在于该方法包括如下步 骤: 步骤一:根据电影的元信息对每部电影的特征属性进行建模,得到电影的特征向量,电 影ti的特征向量表示为/? = 其中》由下式得到:= f+t g ^ 即若该电影中包含表示电影元信息的属性h,则该属性对应的权值加1,如果该电影中 不包含属性IV则该属性对应的权值为零,T = {ti,t2, . . .,tn}表示电影的集合; 步骤二:由用户的实时评分信息和所述电影特征向量得到用户的实时兴趣向量,用户 集合表示为u = {Up u2,...,un},用户Ui的实时兴趣向量表示为/?I = 其中#%表示用户Ui对属性&的喜爱程度,用户Ui的实时兴趣向量/Μ?是由 Ui已评分电影 的特征向量的加权和,权重是用户对电影的实时喜好程度; 步骤三:结合所述步骤二得到的用户兴趣向量和用户的评分信息对电影特征向量进行 更新,生成更加合理的电影特征向量。 步骤四:由所述步骤二和所述步骤三形成迭代过程,对用户的实时兴趣向量进行更新, 得到更加准确的用户实时兴趣向量; 步骤五:由所述更加准确的用户实时兴趣向量建立用户的相似性矩阵,进而得到目标 用户的邻居用户,根据基于用户的协同过滤算法的评分预测公式打相应的评分,最终完成 topN推荐列表。
2. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法,其特征在 于:步骤一中,使用奇异值分解方法对电影的特征向量进行降维。
3. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法,其特征在 于:步骤二中所述用户兴趣向量可由下述步骤得到: a) 从评分矩阵中得到每个用户的评分电影集TMi = b) 从电影-特征向量矩阵中获取用户评分电影集中电影的特征向量 c) 用户Ui的实时兴趣向量/?(表示为7_'";中每个电影的特征向量/ |#的加权和,权重就是 用户对电影的实时喜好程度,具体公式为:
其中ω^-表示属性的逆向特征频率,由系统中用户总数目除以喜欢属性的用户的 数目,再将得到的商取对数得到,是用户W对电影\的评分,G是用户Ui的平均评分, 表示电影h对用户 Ui的基于时间的权重函数; 将上式分解为用户实时兴趣向量/M|中属性h的权重#$的计算公式为:
其中Wfi/表示属性h在电影Μ寺征向量中的权重,Max(丨wUi|)表示向量/^中最大权 重,allUserNumber是系统中用户总数目,preferedUserNumber是喜欢属性Pj的用户的数 目; 上述公式中的句是电影t对用户^的基于时间的权重函数,评分时间离当前越近 权重越大,反之权重越小,由以下公式表示:
其中dnOT表示当前的时间,电,+々表示用户+对电影\的评分时间,β e (〇,1)称为时 间因子影响参数,β越大时间因子受评分时间影响越大,即用户最近时间段评过分 的电影的权重越大,以前评分电影的权重越小,根据不同的推荐系统,可以通过调整β值 来优化推荐结果。
4. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法,其特征在 于:步骤三中所述更加合理的电影特征向量可由下述步骤得到: a) 从评分矩阵中得到对电影h评过分的用户集% = b) 从用户-兴趣向量矩阵中获取评分用户集中用户的兴趣向量:/?,, c) 结合用户的评分矩阵得到电影的更加合理的特征向量,是电影更新得到的 特征向量中Pi特征的权重,公式如下:
其中,^是对电影h评过分的用户,w?y是用户Ui的兴趣向量中特征h的权重, |)作用是作归一化处理。
5. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法,其特征在 于:步骤四中所述迭代过程的迭代次数根据不同的推荐系统进行调整,以优化推荐结果。
【文档编号】G06F17/30GK104063481SQ201410313446
【公开日】2014年9月24日 申请日期:2014年7月2日 优先权日:2014年7月2日
【发明者】孙建德, 徐文涛, 李静 申请人:山东大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1