一种基于项目的协同过滤推荐方法及装置的制造方法_4

文档序号:9579273阅读:来源:国知局
相似度计算模块210和第二阈值调整模块211,
[0153]其中,第二阈值调整模块211,用于在第二判断模块判断结果为否的情况下,将预设的阈值调低,直到在所有数据块中,项目i的候选推荐项目的数量达到项目i实际推荐项目的需求数量N;
[0154]候选推荐项目确定模块204,还用于将相似度高于调低后的阈值对应的项目确定为项目i的候选推荐项目。
[0155]应用本发明图7至图10所示实施例,在项目i所处的数据块中选择出的项目i的实际推荐项目可以直接应用于相应前端用户的请求,进行推荐,对于项目i和其他数据块中的项目相似度的计算由于耗时较长,可以在离线的情况下服务器后端运行,作为推荐覆盖面的完善,当项目i和其他数据块中的项目相似度也计算完成后,将项目i的候选推荐项目中的所有项目按照相似度数值从高到底排序,选取前几个项目作为项目i的实际推荐项目,此时推荐的项目能更好的满足用户的需求。
[0156]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0157]本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0158]本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:R0M/RAM、磁碟、光盘等。
[0159]以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
【主权项】
1.一种基于项目的协同过滤推荐方法,其特征在于,所述方法包括: 获得目标数据集; 将目标数据集拆解成若干适合内存容量的数据块; 对每个数据块B中的每个项目i,计算项目i和该数据块B中其它项目的相似度; 将与所述项目i的相似度高于预设的阈值对应的项目确定为项目i的候选推荐项目。2.根据权利要求1所述的方法,其特征在于,所述目标数据集,包括: 不同用户收藏的网址信息; 或不同用户点击过的广告信息; 或不同用户搜索过的内容; 或不同用户购买过的商品。3.根据权利要求1所述的方法,其特征在于,所述方法还包括: 判断项目i的候选推荐项目的数量是否达到项目i实际推荐项目的需求数量N ; 在项目i的候选推荐项目的数量达到项目i实际推荐项目的需求数量N的情况下,对项目i的候选推荐项目中的所有项目按照相似度数值从高到低排序; 从排序队列中选取前N个项目作为项目i实际推荐项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。4.根据权利要求3所述的方法,其特征在于,所述方法还包括: 在项目i的候选推荐项目的数量没有达到项目i实际推荐项目的需求数量N的情况下,将项目i的候选推荐项目中的所有项目作为项目i实际推荐项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。5.根据权利要求3所述的方法,其特征在于,所述方法还包括: 在项目i的候选推荐项目的数量没有达到项目i实际推荐项目的需求数量N的情况下,将预设的阈值调低,直到在项目i所处的数据块B中,项目i的候选推荐项目的数量达到项目i实际推荐项目的需求数量N ; 对项目i的候选推荐项目中的所有项目按照相似度数值从高到低排序; 从排序队列中选取前N个项目作为项目i实际推荐的项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。6.根据权利要求3所述的方法,其特征在于,所述方法还包括: 在项目i的候选推荐项目的数量没有达到项目i实际推荐项目的需求数量N的情况下,计算项目i和至少一个其它数据块中的各项目的相似度; 将与所述项目i相似度高于预设的阈值对应的项目确定为项目i的候选推荐项目。7.根据权利要求6所述的方法,其特征在于,所述方法还包括: 判断项目i的候选推荐项目的数量是否达到项目i实际推荐项目的需求数量N ; 在项目i的候选推荐项目的数量达到项目i实际推荐项目的需求数量N的情况下,对项目i的候选推荐项目中的所有项目按照相似度数值从高到低排序; 从排序队列中选取前N个项目作为项目i实际推荐项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。8.根据权利要求7所述的方法,其特征在于,所述方法还包括: 在项目i的候选推荐项目的数量没有达到项目i实际推荐项目的需求数量N的情况下,将项目i的候选推荐项目中的所有项目作为项目i实际推荐项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。9.根据权利要求7所述的方法,其特征在于,所述方法还包括: 在项目i的候选推荐项目的数量没有达到项目i实际推荐项目的需求数量N的情况下,将预设的阈值调低,直到在所有数据块中,项目i的候选推荐项目的数量达到项目i实际推荐项目的需求数量N; 对项目i的候选推荐项目中的所有项目按照相似度数值从高到低排序; 从排序队列中选取前N个项目作为项目i实际推荐的项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。10.一种基于项目的协同过滤推荐装置,其特征在于,所述装置包括: 数据集获得模块,用于获得目标数据集; 数据集拆解模块,用于将目标数据集拆解成若干适合内存容量的数据块; 第一相似度计算模块,用于对每个数据块B中的每个项目i,在本地计算项目i和该数据块B中其它项目的相似度; 候选推荐项目确定模块,用于将与所述项目i的相似度高于预设的阈值对应的项目确定为项目i的候选推荐项目。11.根据权利要求10所述的装置,其特征在于,所述目标数据集,包括: 不同用户收藏的网址信息; 或不同用户点击过的广告信息; 或不同用户搜索过的内容; 或不同用户购买过的商品。12.根据权利要求10所述的装置,其特征在于,所述装置还包括: 第一判断模块,用于判断项目i的候选推荐项目的数量是否达到项目i实际推荐项目的需求数量N ; 排序模块,用于在第一判断模块判断结果为是的情况下,对项目i的候选推荐项目中的所有项目按照相似度数值从高到低排序; 实际推荐项目选取模块,用于从排序队列中选取前N个项目作为项目i实际推荐项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。13.根据权利要求12所述的装置,其特征在于,所述实际推荐项目选取模块,还用于: 在第一判断模块判断结果为否的情况下,将项目i的候选推荐项目中的所有项目作为项目i实际推荐项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。14.根据权利要求12所述的装置,其特征在于,所述装置还包括: 第一阈值调整模块,用于在第一判断模块判断结果为否的情况下,将预设的阈值调低,直到在项目i所处的数据块B中,项目i的候选推荐项目的数量达到项目i实际推荐项目的需求数量N。15.根据权利要求12所述的装置,其特征在于,所述装置还包括: 第二判断模块,用于在第一判断模块判断结果为否的情况下,判断是否还存在未和项目i计算相似度的其他数据块的项目; 第二相似度计算模块,用于在第二判断模块判断结果为是的情况下,计算项目i和至少一个其它数据块中的各项目的相似度。16.根据权利要求15所述的装置,其特征在于,所述实际推荐项目选取模块,还用于: 在第二判断模块判断结果为否的情况下,将项目i的候选推荐项目中的所有项目作为项目i实际推荐项目,向客户端反馈项目i的实际推荐的项目,以使所述客户端将所述项目i的实际推荐的项目推荐给所述项目i的用户。17.根据权利要求15所述的装置,其特征在于,所述装置还包括: 第二阈值调整模块,用于在第二判断模块判断结果为否的情况下,将预设的阈值调低,直到在所有数据块中,项目i的候选推荐项目的数量达到项目i实际推荐项目的需求数量N018.根据权利要求15至17所述的装置,其特征在于,所述候选推荐项目确定模块,还用于: 将相似度高于调低后的阈值对应的项目确定为项目i的候选推荐项目。
【专利摘要】本发明实施例公开了一种基于项目的协同过滤推荐方法及装置,该方法包括:获得目标数据集;将目标数据集拆解成若干适合内存容量的数据块;对每个数据块B中的每个项目i,在本地计算项目i和该数据块B中其它项目的相似度;将与所述项目i的相似度高于预设的阈值对应的项目确定为项目i的候选推荐项目。应用本发明实施例,只使用一台计算机进行基于项目的协同过滤推荐算法的计算,在计算时,将项目的整个数据集拆解成若干适合内存容量的数据块,提高了基于项目的协同过滤推荐算法的性能,消减了额外的辅助功能对算法性能的影响,同时避免了成本的增加。
【IPC分类】G06F17/30
【公开号】CN105335385
【申请号】CN201410309477
【发明人】万振, 张凯达
【申请人】北京金山安全软件有限公司
【公开日】2016年2月17日
【申请日】2014年6月30日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1