一种基于词频加权技术的个性化协同过滤推荐方法及系统的制作方法_2

文档序号:9249617阅读:来源:国知局
0104] TF4= 2 ;
[0105] TFs= 3 ;
[0106] IDFi=log[4/(2+l)] = 0. 125 ;
[0107] IDF2=log[4/(2+l)] = 0. 125 ;
[010引 10尸3= log[4/(3+1) ] = 0 ;
[0109] IDp4=log[4/(2+l)] = 0. 125 ;
[0110] IDp5=log[4/(3+1)] = 0 ;
[01U] S303、计算取出的每个物品的TF-IDF频率TI。
[011引 TF-IDF频率TI按下式计算;
[011引TI=TF*IDF。
[0114] 计算结果如下所示:
[0115]TIi=2*0. 125 = 0. 25 ;
[0116]Tl2= 2*0. 125 = 0. 25 ;
[0117]Tl3= 3*0 = 0 ;
[0118]Tl4= 2*0. 125 = 0. 25 ;
[0119]TIs=3*0 = 0 ;
[0120] 进一步,如图4所示,所述步骤S103具体包括:
[0121]S401、按下式求出每个用户的推荐列表:
[0122]
[012引其中N(u)是用户U喜欢的物品合集,是和物品i最相似的K个物品的集合,wy为物品i和j的相似度,Zui为物品i的TF-IDF频率TI;
[0124] 计算结果如下所示:
[012引 ri3= 0. 408*0. 25+0. 408*0. 25+0. 667*0 = 0. 204 ;
[0126]ri4= 0. 5*0. 25+0*0. 25+0. 408*0 = 0. 125 ;
[0127]f2i= 0. 408*0+0. 5*0. 25+0. 408*0 = 0. 125 ;
[0128]r22= 0. 408*0+0*0. 25+0. 816*0 = 0 ;
[0129]T32= 0. 408*0. 25+0. 408*0. 25+0*0. 25 = 0. 102 ;
[0130]r35= 0. 408*0. 25+0. 667*0+0. 408*0. 25 = 0. 204 ;
[013。 r"= 0. 5*0. 125+0. 408*0+0. 408*0 = 0. 125 ;
[0132] T44=0*0. 125+0. 816*0+0. 408*0=0。
[0133]S402、将推荐列表中的各个物品从低到高排序,取排序靠前的若干物品推荐给用 户。
[0134] 按照上面的计算结果,推荐的物品如下表3所示,本实例是W取出排名第一的物 品,当然也可根据需要选择排名前二或前=的物品推荐给用户:
[0135]表 3
[0136]
[0137] 本发明在基于物品的协同过滤算法中应用TF-IDF算法(特征性频率-倒排文档 频率加权法)来提高推荐商品的覆盖率,进而更加全面的推荐物品,能够有效的降低热口 商品对推荐结果的影响,提升推荐系统的推荐覆盖率,进而找出用户真正的个人兴趣所向, 提升推荐系统的准确性与挖掘长尾商品的能力。
[0138] 基于上述方法,本发明还提供一种基于词频加权技术的个性化协同过滤推荐系统 较佳实施例,如图5所示,包括:
[0139] 相似度计算模块100,用于计算两两物品的相似度;
[0140] 频率计算模块200,用于计算出每个物品的特征性频率TF和倒排文档频率IDF,然 后计算出每个物品的TF-IDF频率TI;
[014。 推荐模块300,用于根据两两物品之间的相似度W及每个物品的TF-IDF频率生成 每个用户的推荐列表,然后根据所述推荐列表向用户推荐物品。
[0142] 进一步,如图6所示,所述相似度计算模块100具体包括:
[0143] 对应表获取单元110,用于获取用户-物品对应表;
[0144] 统计单元120,用于统计用户-物品对应表中每一物品出现的次数,化及两两物品 同时出现的次数;
[0145] 相似度计算单元130,用于根据W下公式计算出两两物品之间的相似度Wu;
[0146]
其中,|N(i)I是用户-物品对应表中物品i出现的次数, N(j)I是用户-物品对应表中物品j出现的次数,|N(i)nN(j)I为用户-物品对应表中 物品i和物品j同时出现的次数。
[0147] 进一步,如图7所示,所述频率计算模块200具体包括:
[014引排序单元210,用于取每个物品相似度最高的N个物品,按相似度从高到低进行排 序;
[0149] 第一频率计算单元220,用于分别计算取出的每个物品的特征性频率TF和倒排文 档频率IDF,其中TF=取出的某个物品在用户-物品对应表中出现的次数,IDF=log[S/ (TF+1)],其中S为用户-物品对应表中的用户总数;
[0150] 第二频率计算单元230,用于计算取出的每个物品的TF-IDF频率TI。
[0151] 进一步,如图8所示,所述推荐模块300具体包括:
[0152] 推荐列表生成单元310,用于按下式求出每个用户的推荐列表:
[0153]
[0154] 其中N(u)是用户U喜欢的物品合集,是和物品i最相似的K个物品的集合, Wy为物品i和j的相似度,Zui为物品i的TF-IDF频率TI;
[0155] 推荐单元320,用于将推荐列表中的各个物品从低到高排序,取排序靠前的若干物 品推荐给用户。
[0156] 进一步,所述第二频率计算单元230中,TF-IDF频率TI按下式计算;
[0 巧 7] TI=TF*IDF。
[015引关于上述模块单元的技术细节在前面的方法中已有详述,故不再寶述。
[0159] 应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可 W根据上述说明加W改进或变换,所有该些改进和变换都应属于本发明所附权利要求的保 护范围。
【主权项】
1. 一种基于词频加权技术的个性化协同过滤推荐方法,其特征在于,包括步骤: A、 计算两两物品的相似度; B、 计算出每个物品的特征性频率TF和倒排文档频率IDF,然后计算出每个物品的 TF-IDF频率TI; C、 根据两两物品之间的相似度以及每个物品的TF-IDF频率生成每个用户的推荐列 表,然后根据所述推荐列表向用户推荐物品。2. 根据权利要求1所述的基于词频加权技术的个性化协同过滤推荐方法,其特征在 于,所述步骤A具体包括: Al、获取用户-物品对应表; A2、统计用户-物品对应表中每一物品出现的次数,以及两两物品同时出现的次数; A3、根据以下公式计算出两两物品之间的相似度Wij:是用户-物品对应表中物品j出现的次数,IN(i)nN(j)I为用户-物品对应表中物品i和 物品j同时出现的次数。3. 根据权利要求2所述的基于词频加权技术的个性化协同过滤推荐方法,其特征在 于,所述步骤B具体包括: B1、取每个物品相似度最高的N个物品,按相似度从高到低进行排序; B2、分别计算取出的每个物品的特征性频率TF和倒排文档频率IDF,其中TF表示取出 的某个物品在用户-物品对应表中出现的次数,IDF=log[SATF+l)],其中S为用户-物 品对应表中的用户总数; B3、计算取出的每个物品的TF-IDF频率TI。4. 根据权利要求3所述的基于词频加权技术的个性化协同过滤推荐方法,其特征在 于,所述步骤C具体包括: C1、按下式求出每个用户的推荐列表:其中N(U)是用户u喜欢的物品合集,S(i,e是和物品i最相似的K个物品的集合,wu为 物品i和j的相似度,zui为物品i的TF-IDF频率TI; C2、将推荐列表中的各个物品从低到高排序,取排序靠前的若干物品推荐给用户。5. 根据权利要求3所述的基于词频加权技术的个性化协同过滤推荐方法,其特征在 于,所述步骤B3中,TF-IDF频率TI按下式计算: TI=TF*IDF。6. -种基于词频加权技术的个性化协同过滤推荐系统,其特征在于,包括: 相似度计算模块,用于计算两两物品的相似度; 频率计算模块,用于计算出每个物品的特征性频率TF和倒排文档频率IDF,然后计算 出每个物品的TF-IDF频率TI; 推荐模块,用于根据两两物品之间的相似度以及每个物品的TF-IDF频率生成每个用 户的推荐列表,然后根据所述推荐列表向用户推荐物品。7. 根据权利要求6所述的基于词频加权技术的个性化协同过滤推荐系统,其特征在 于,所述相似度计算模块具体包括: 对应表获取单元,用于获取用户-物品对应表; 统计单元,用于统计用户-物品对应表中每一物品出现的次数,以及两两物品同时出 现的次数; 相似度计算单元,用于根据以下公式计算出两两物品之间的相似度Wij:是用户-物品对应表中物品j出现的次数,IN(i)nN(j)I为用户-物品对应表中物品i和 物品j同时出现的次数。8. 根据权利要求7所述的基于词频加权技术的个性化协同过滤推荐系统,其特征在 于,所述频率计算模块具体包括: 排序单元,用于取每个物品相似度最高的N个物品,按相似度从高到低进行排序; 第一频率计算单元,用于分别计算取出的每个物品的特征性频率TF和倒排文档频 率IDF,其中TF表示取出的某个物品在用户-物品对应表中出现的次数,IDF=log[S/ (TF+1)],其中S为用户-物品对应表中的用户总数; 第二频率计算单元,用于计算取出的每个物品的TF-IDF频率TI。9. 根据权利要求8所述的基于词频加权技术的个性化协同过滤推荐系统,其特征在 于,所述推荐模块具体包括: 推荐列表生成单元,用于按下式求出每个用户的推荐列表:其中N(U)是用户u喜欢的物品合集,S(i,e是和物品i最相似的K个物品的集合,wu为 物品i和j的相似度,zui为物品i的TF-IDF频率TI; 推荐单元,用于将推荐列表中的各个物品从低到高排序,取排序靠前的若干物品推荐 给用户。10. 根据权利要求8所述的基于词频加权技术的个性化协同过滤推荐系统,其特征在 于,所述第二频率计算单元中,TF-IDF频率TI按下式计算: TI=TF*IDF。
【专利摘要】本发明公开一种基于词频加权技术的个性化协同过滤推荐方法及系统,其中,方法包括步骤:A、计算两两物品的相似度;B、计算出每个物品的特征性频率TF和倒排文档频率IDF,然后计算出每个物品的TF-IDF频率TI;C、根据两两物品之间的相似度以及每个物品的TF-IDF频率生成每个用户的推荐列表,然后根据所述推荐列表向用户推荐物品。本发明通过在协同过滤算法中引入TF-IDF算法,能够有效的降低热门商品对推荐结果的影响,提升推荐系统的推荐覆盖率,以及提高推荐准确性,并且能够提高挖掘“长尾”商品的能力。
【IPC分类】G06F17/30, G06Q30/02
【公开号】CN104966219
【申请号】CN201510431734
【发明人】杨焕滨, 王巍
【申请人】Tcl集团股份有限公司
【公开日】2015年10月7日
【申请日】2015年7月21日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1