一种基于用户实时兴趣向量的电影个性化推荐方法

文档序号：6552087阅读：808来源：国知局

一种基于用户实时兴趣向量的电影个性化推荐方法
【专利摘要】本发明公开了一种综合电影内容和用户实时评分信息的电影个性化推荐方法，主要解决传统推荐算法不能及时反映用户的兴趣变化和数据稀疏性的问题。为了解决数据稀疏性问题，本发明引入了用户兴趣向量。从电影特征向量入手，借助用户的评分矩阵以迭代的方式处理得到用户的兴趣特征向量，根据得到的用户特征向量构建用户相似矩阵，最终根据传统的协同过滤评分预测公式完成推荐。针对用户兴趣变化的情况，在构建用户兴趣向量过程中又融入了时间因子，使得越接近当前时间的评分行为权重越大，越能表现用户的兴趣。
【专利说明】-种基于用户实时兴趣向量的电影个性化推荐方法

【技术领域】
[0001] 本发明是综合用户的实时评分数据和电影的特征属性产生的推荐方法，主要解决了传统协同过滤推荐算法中数据稀疏性和不能及时反映用户兴趣变化的问题，属于多媒体信息处理领域。

【背景技术】
[0002] 随着互联网把我们带进了信息爆炸的时代，电影内容近几年也在迅猛增长，围绕电影内容相关上线的网站和应用更是不计其数。对于用户而言，面对如此丰富的电影资源，想要从中挑出真正想要的内容非常困难。推荐系统成为解决这些问题的有效途径，而推荐算法是影响推荐系统功能实现的关键。目前主流的推荐算法主要包括基于内容的推荐算法、协同过滤的推荐算法和混合推荐算法等。
[0003] 基于内容的推荐主要思想就是将与用户进行过好评的电影相似的电影作为推荐结果，该算法的优点是简单、有效，缺点是推荐结果缺少新奇性，不能为用户发现新的感兴趣的物品。
[0004] 而协同过滤推荐算法则利用用户的历史信息计算不同用户之间的相似性，然后利用与目标用户相似性较高的邻居对影片的评价来预测目标用户对特定影片的喜好程度。用户之间的相似度是根据用户对电影的评分矩阵获取的。假设用户在对同一些电影上的评分越相似，则表示两个用户的兴趣也就越相似。虽然协同过滤推荐系统得到了广泛的应用，但是也面临很多现实的问题。比如，在互联网视频业务中，由于用户打分的意识不是很强，造成了视频推荐中存在着明显的数据稀疏性问题，而协同过滤推荐在打分稀疏的情况下，性能较差。还有一个问题，传统的协同过滤算法不会考虑用户的兴趣爱好随时间会动态的变化，导致推荐的电影可能不是用户当前感兴趣的。

【发明内容】

[0005] 本发明是为了解决传统协同过滤推荐算法中数据稀疏性和不能及时反映用户兴趣变化的问题，而提出的一种综合用户的实时评分数据和电影的特征属性产生基于用户实时兴趣向量的推荐方法。
[0006] 为了实现本发明的目的，提出了一种基于用户实时兴趣向量的电影个性化推荐方法，将用户的评分矩阵和电影的特征相结合，融入时间因子，得到可以反映用户实时兴趣的特征向量。得到的用户兴趣向量既可以解决数据稀疏性问题，也实时地反映了用户的兴趣变化。本发明的方法在选择邻居用户时，将推荐模型中所有电影的特征通过VSM(Vect 〇r Space Model)特征向量的形式表不；再针对用户的兴趣向量模型，融入时间因子，将用户的评分矩阵和电影的特征向量以迭代的方式进行建模；将用户的兴趣向量处理成与电影特征向量相似的形式；最后根据输出的用户兴趣向量计算用户之间的相似性，从而得到目标用户的邻居用户。本发明在预测用户评分时，以邻居和目标用户的兴趣向量的相似性作为权重，使用经典的基于用户的协同过滤的评分预测机制，预测出目标用户的相应的评分，最终通过对得到的目标用户的所有未评分电影的预测评分进行排序，得出topN推荐列表。基于用户兴趣向量的推荐算法框架如图1所示。
[0007] 本发明采用的技术方案为：
[0008] -种基于用户实时兴趣向量的电影个性化推荐方法，包括如下步骤：
[0009] 步骤一：根据电影的元信息对每部电影的特征属性进行建模，得到电影的特征向量，电影ti的特征向量表示为= …其中由下式得到：

【权利要求】
1. 一种基于用户实时兴趣向量的电影个性化推荐方法，其特征在于该方法包括如下步骤：步骤一：根据电影的元信息对每部电影的特征属性进行建模，得到电影的特征向量，电影ti的特征向量表示为/? = 其中》由下式得到：= f+t g ^ 即若该电影中包含表示电影元信息的属性h，则该属性对应的权值加1，如果该电影中不包含属性IV则该属性对应的权值为零，T = {ti，t2, . . .，tn}表示电影的集合；步骤二：由用户的实时评分信息和所述电影特征向量得到用户的实时兴趣向量，用户集合表示为u = {Up u2,...，un}，用户Ui的实时兴趣向量表示为/?I = 其中#%表示用户Ui对属性&的喜爱程度，用户Ui的实时兴趣向量/Μ?是由 Ui已评分电影的特征向量的加权和，权重是用户对电影的实时喜好程度；步骤三：结合所述步骤二得到的用户兴趣向量和用户的评分信息对电影特征向量进行更新，生成更加合理的电影特征向量。步骤四：由所述步骤二和所述步骤三形成迭代过程，对用户的实时兴趣向量进行更新，得到更加准确的用户实时兴趣向量；步骤五：由所述更加准确的用户实时兴趣向量建立用户的相似性矩阵，进而得到目标用户的邻居用户，根据基于用户的协同过滤算法的评分预测公式打相应的评分，最终完成 topN推荐列表。
2. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法，其特征在于：步骤一中，使用奇异值分解方法对电影的特征向量进行降维。
3. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法，其特征在于：步骤二中所述用户兴趣向量可由下述步骤得到： a) 从评分矩阵中得到每个用户的评分电影集TMi = b) 从电影-特征向量矩阵中获取用户评分电影集中电影的特征向量 c) 用户Ui的实时兴趣向量/?(表示为7_'";中每个电影的特征向量/ |#的加权和，权重就是用户对电影的实时喜好程度，具体公式为：
其中ω^-表示属性的逆向特征频率，由系统中用户总数目除以喜欢属性的用户的数目，再将得到的商取对数得到，是用户W对电影\的评分，G是用户Ui的平均评分，表示电影h对用户 Ui的基于时间的权重函数；将上式分解为用户实时兴趣向量/M|中属性h的权重#$的计算公式为：
其中Wfi/表示属性h在电影Μ寺征向量中的权重,Max(丨wUi|)表示向量/^中最大权重，allUserNumber是系统中用户总数目，preferedUserNumber是喜欢属性Pj的用户的数目；上述公式中的句是电影t对用户^的基于时间的权重函数，评分时间离当前越近权重越大，反之权重越小，由以下公式表示：
其中dnOT表示当前的时间，电,+々表示用户+对电影\的评分时间，β e (〇，1)称为时间因子影响参数，β越大时间因子受评分时间影响越大，即用户最近时间段评过分的电影的权重越大，以前评分电影的权重越小，根据不同的推荐系统，可以通过调整β值来优化推荐结果。
4. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法，其特征在于：步骤三中所述更加合理的电影特征向量可由下述步骤得到： a) 从评分矩阵中得到对电影h评过分的用户集％ = b) 从用户-兴趣向量矩阵中获取评分用户集中用户的兴趣向量:/?,， c) 结合用户的评分矩阵得到电影的更加合理的特征向量，是电影更新得到的特征向量中Pi特征的权重，公式如下：
其中，^是对电影h评过分的用户，w?y是用户Ui的兴趣向量中特征h的权重， |)作用是作归一化处理。
5. 根据权利要求1所述的基于用户实时兴趣向量的电影个性化推荐方法，其特征在于：步骤四中所述迭代过程的迭代次数根据不同的推荐系统进行调整，以优化推荐结果。
【文档编号】G06F17/30GK104063481SQ201410313446
【公开日】2014年9月24日申请日期:2014年7月2日优先权日:2014年7月2日
【发明者】孙建德, 徐文涛, 李静申请人:山东大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙建德;徐文涛;李静
技术所有人：山东大学
我是此专利的发明人

上一篇：基于群体行为环境敏感的虚拟根系构建方法
上一篇：网络商品侵权监测系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。