一种基于用户多种行为反馈的电影推荐方法

文档序号:6638025阅读:1019来源:国知局
一种基于用户多种行为反馈的电影推荐方法
【专利摘要】本发明公开了一种基于用户多种行为反馈的电影推荐方法,包括步骤:s1、电影聚类首先对电影信息进行特征选取,得到针对每个电影的关键字描述;s2、用户相似度计算使用基于模糊理论的行为--内容聚类方法,将用户聚类成多个用户集,每个用户在不同用户集中的隶属度不同,利用电影描述信息和用户的多种行为反馈数据进行建模,计算每个用户在用户群中的隶属度,根据用户在不同用户集中的隶属度来计算用户之间的相似度;s3、生成推荐根据得到的用户相似度信息为用户生成不同的电影推荐列表。本发明方法利于解决数据的稀疏性问题,并解决了传统“隐性-显性”转换做法的信息损失问题,提高了推荐精度。
【专利说明】一种基于用户多种行为反馈的电影推荐方法

【技术领域】
[0001] 本发明属于个性化推荐领域,具体涉及一种基于用户多种行为反馈的电影推荐方 法。

【背景技术】
[0002] 随着Internet的迅速发展,互联网上的数据呈指数增长态势。传统的搜索算法只 能呈现给所有的用户一样的排序结果,无法针对不同用户的兴趣爱好提供相应的服务。信 息的爆炸使得信息的利用率反而降低,这种现象被称为信息过载。个性化推荐,包括个性化 搜索,被认为是目前解决信息超载问题的最有效工具之一。
[0003] 推荐算法是个性化推荐系统的核心,推荐算法可以分为基于内容的推荐算法、协 同过滤推荐算法、以及基于知识的推荐算法。其中,由于协同过滤推荐算法能够充分利用数 据集中的信息且对领域知识的需求较低,在现实中的应用最为广泛。
[0004] 然而,目前主流的协同过滤推荐算法主要针对评分预测问题。由于现实中评分数 据的获得往往比较困难,在实际应用中通常将用户多种行为的隐反馈数据转换为评分数 据,这种做法不仅导致推荐精度低,而且存在数据稀疏性问题。


【发明内容】

[0005] 针对现有技术中存在的上述技术问题,本发明提出了一种基于用户多种行为反馈 的电影推荐方法,该方法直接对用户多种行为的隐反馈数据进行建模,利于解决数据稀疏 性问题。
[0006] 为了实现上述目的,本发明采用如下技术方案:
[0007] -种基于用户多种行为反馈的电影推荐方法,包括步骤:
[0008] si、电影聚类
[0009] 根据电影的关键字描述,使用LDA算法将电影聚成m个簇;
[0010] 设定阈值 threshold,0· 6 < threshold <0· 8,从每个族中去掉 p (k I i) < threshold的电影,其中,p (k I i)表示电影i属于电影簇k的概率;
[0011] s2、用户相似度计算
[0012] 针对电影聚类得到每个电影簇k形成与之一一对应的用户群g,用户U对用户群g 的隶属度利用如下公式计算,即:

【权利要求】
1. 一种基于用户多种行为反馈的电影推荐方法,其特征在于,包括步骤: Si、电影聚类 根据电影的关键字描述,使用LDA算法将电影聚成m个簇; 设定阈值threshold,0· 6 <threshold<0· 8,从每个族中去掉p(kIi) <threshold的电影,其中,P(kIi)表示电影i属于电影簇k的概率; s2、用户相似度计算 针对电影聚类得到每个电影簇k形成与之一一对应的用户群g,用户u对用户群g的隶 属度利用如下公式计算,即:
式中,〃<丨表示用户u对用户群g对应的电影簇k中电影的第t种行为的统计次数, 以"为用户u对所有电影的第t种行为的统计次数,t的取值范围为:1彡t彡T; 根据用户模糊聚类的隶属度计算结果,得到用户u的隶属度向量A= 其中,du,g表不用户u对用户群g的隶属度; 对用户集U中的任意两个用户u和V,通过Pearson相关系数来计算u和V的相似度, 并记为sim(u,V); S3、生成推荐 设定邻居选取的相似度阈值为sim-threshold,对任意一个用户u从用户集U中选取满 足sim(u,V) >sim-threshold的用户作为用户u的邻居,并记作Neiu ; 对Neiu中用户看过用户u未看过的所有电影,通过如下方法预测用户u对电影i的偏 好·
式中,A,,表示用户u对电影i的预测偏好,pVii表示用户V对电影i的偏好,该偏好由 用户V的行为权重向量和用户V在电影i上的行为统计向量I的内积来衡量;权重向量 G通过交叉验证来获得; 对用户u的对偏好预测结果进行降序排序,选择前N部电影作为用户u的推荐结果。
2. 根据权利要求1所述的一种基于用户多种行为反馈的电影推荐方法,其特征在于, 在步骤si中,电影的关键字描述按照如下步骤获得: 首先对每部电影简介进行分词处理,保留名词并去掉停用词得到:Wi = {w/,w2',. . .,wn'},其中,Wi表示对电影i进行分词、保留名词去停用词处理后得到的名词 描述; 然后根据在所有电影上的处理结果统计出现频率最高的N个词,并从电影的名词描述 中剔除这N个词以外的词; 最后结合电影的导演、演员和类型信息得到电影的关键字描述=Wi =Iw1,w2, . . .,wn}。
3.根据权利要求1所述的一种基于用户多种行为反馈的电影推荐方法,其特征在于, 在步骤s2中,近在线阶段用户相似度信息更新步骤为: si、分别统计用户u对m个电影簇中电影的行为次数; s2、使用隶属度模型来计算用户u对用户群的隶属度,得到用户u新的隶属度向量,并 更新数据库中用户u的隶属度信息; S3、通过Pearson相关系数基于用户u新的隶属度和数据库中其他用户的隶属度来计 算用户u和其他用户的相似度,并更新数据库。
【文档编号】G06F17/30GK104462383SQ201410753052
【公开日】2015年3月25日 申请日期:2014年12月10日 优先权日:2014年12月10日
【发明者】赵建立, 吴文敏, 张春升, 孟芳 申请人:山东科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1