基于特征的协同过滤推荐方法

文档序号:6506800阅读:693来源:国知局
基于特征的协同过滤推荐方法
【专利摘要】本发明属于信息技术中的推荐系统领域,特别适合于在Internet环境下基于电子商务平台的推荐应用。针对现有协同过滤方法存在的不足,提出一个新的基于特征的协同过滤方法。新方法充分考到用户在商品购买中普遍存在的针对物品特征的好恶,可以在使用较少用户/产品的邻居的情况下获得比传统协同过滤方法更准确的推荐结果,使推荐系统更加贴近网站用户的潜在需求。整体来说,新方法是一个高效的、适用范围广的协同过滤推荐方法。
【专利说明】基于特征的协同过滤推荐方法
【技术领域】
[0001]本发明属于信息技术中的推荐系统【技术领域】,特别适合于Internet环境下基于电子商务的推荐应用。
【背景技术】
[0002]网上购物的出现和急速发展在给人们提供了更丰富更多样的产品信息的同时,也让人们在面对众多选择时犹如大海捞针,难以找到自己真正想要的产品。对这种信息过载的最流行也是最有效的解决方案就是推荐系统。推荐系统可以自动向客户推送个性化的产品以减少客户的浏览时间提高购物效率。推荐系统的本质就是基于客户的历史记录预测一个顾客对某个产品的评价,根据预测的结果向客户推荐他可能感兴趣或者评价高的产品。一个推荐系统往往只推荐同类产品,比如推荐书、音乐或者电影等。通常的推荐系统都是提供个性化推荐,不同的客户群体接收到的推荐不一样;也有非个性化的推荐系统,比如推荐排行前十名的图书或者CD。推荐系统在基于评分的网站应用十分广泛,如亚马逊、Youtube>Netflix>Yahoo>Last.fm、Imdb等。越来越多的公司也开始开发自己的推荐系统,如Netflix是一个在线电影租凭的网站,他们曾经举办了一个比赛,第一个将Netflix推荐系统的效率提高10%的团队可以获得100万美金。
[0003]除了在工业界,学术界里也有很多探讨推荐系统的会议和研讨会,例如成立于2007年的ACM Recommender Systems (RecSys)现在已成为每年都举行的首要的探讨推荐系统的会议。推 荐系统的集会也频繁的出现在数据库、信息系统和自适应系统领域的会议中,如 ACM SIGIRSpecial Interest Group on InformationRetrieval (SIGIR), Internationa Conference on Information and KnowledgementManagement (CIKM), User Modeling, Adaptationand Personalization (UMAP)和 ACMSpecial Interest Group on Management of Data(SIGMOD)等。很多学术期刊也特别开设一个板块刊登推荐系统的最新研究进展,如Al Communications (2008)、IEEE IntelligentSystems(2007)、 InternationalJournal of Electronic Commerce(2006)、InternationalJournal of ComputerScience and App Iicat ions(2006)、ACM Transactionson Computer-HumanInteraction (2005)和 ACM Transactions on InformationSystems (2004)等等。
[0004]Herlocker等定义了 11种推荐系统可以实现的功能。推荐系统的功能和信息检索系统很像,一方面他们有满足客户需求的基本功能,推荐系统帮助客户找到与其历史记录相关的产品,信息检索系统帮助客户找到与查询相关的文档;另一方便,推荐系统推荐给客户之前没有注意到但是可能感兴趣的新事物,信息检索系统也有相关的功能,如google的手气不错。推荐系统的功能可以归纳为以下三个方面:
[0005]I)推荐
[0006]?帮助用户发现可能喜欢的新产品;
[0007]?帮助用户找到和自己兴趣相同的用户;[0008]?帮助一个用户群体找到他们感兴趣的产品;
[0009]?为用户推荐的物品做出解释,这些推荐是基于用户的哪些行为而给出的。
[0010]2)预测
[0011]?帮助客户评价产品是好是坏。
[0012]3)有条件限制的推荐
[0013]?根据客户给出的限定条件作出符合条件的推荐,如价格低于50元的书籍等等。
[0014]推荐系统里最主要的两个概念就是物品(Item)和用户(User)。物品是指被推荐的产品,通常具有属性和特征,如电影有导演、演员、类型、国家等,唱片有歌手、发行公司、发行年份等,通过这些属性我们可以了解一个产品吸引客户的价值在哪里。用户是指使用推荐系统的客户,同样具有一系列属性,在人口学推荐系统中,用户有年龄、性别、所属地区等属性;而在协同过滤的推荐系统中,客户被描述成对一系列物品的打分向量;在一个网页推荐系统中,客户则被描述成网页的历史浏览模式。
[0015]比较常见的推荐算法分成六类:
[0016]1)基于内容的推荐算法:推荐给客户与他以前喜欢的产品相似的产品。产品之间的相似度是根据产品的特征和属性计算的。比如电影之间的相似度根据导演,演员和类型计算,《唐伯虎点秋香》和《大内密探零零发》的相似度显然比和《十面埋伏》的相似度高,如果一个客户喜欢《唐伯虎点秋香》,那一定有很高的可能性喜欢《大内密探零零发》。
[0017]2)协同过滤(Collaborative Filtering)推荐算法:将和客户品味相似的用户喜欢的产品推荐给客户。客户之间相似度是根据客户历史打分记录计算的。I个给《唐伯虎点秋香》5分的客户A和一个给《唐伯虎点秋香》4分的客户B相似度比一个给《唐伯虎点秋香》I分的客户C要高,那么客户B打5分的另一部电影《大内密探零零发》客户A可能也会打5分。
[0018]3)基于人口学的推荐算法:根据客户的年龄,性别,国家,职业等信息进行推荐。
[0019]4)基于知识的推荐算法:比较著名的有基于案例推理的算法和基于约束的算法。这两种算法都是收集用户的需求,然后计算出满足需求的推荐结果。
[0020]5)基于社区的推荐算法:根据客户的朋友们的偏好进行推荐。这种算法的含义是“告诉我你的朋友是谁,我就能知道你是谁”。人以类聚,物以群分,人们会根据各自的品位自动形成一个社区。这种基于社交网络的推荐研究还处于起步阶段,实验的结果有好有坏。
[0021]6)混合型推荐算法:这种算法将以上5种算法结合起来,利用一个算法的长处去补另一个算法短处。例如协同过滤算法有一个问题就是冷启动,当一个产品新加入系统的时候没有用户打分信息,系统无法进行推荐,而基于内容的推荐则没有这种困扰。所以对新加入的产品进行基于内容的推荐,对于有打分信息的产品进行协同过滤推荐。
[0022]在以上介绍的推荐算法中,协同过滤是现在效果最好也是运用最广泛的算法。协同过滤,顾名思义是指依据别人的意见来过滤评价产品的过程。想象这样一个场景,最近出了一部新电影,你不知道应不应该去看,恰好你的朋友们看过了这部电影,告诉你这部电影值得一看,你也许就会进电影院去看这部电影;又或者你发现有一个朋友推荐过的电影你都觉得不错,当有新的电影上映的时候,你会直接去征求那个朋友的意见。协同过滤算法弥补了基于内容算法的缺陷:有一些产品很难描述表示。更重要的是,协同过滤是基于产品质量进行推荐的,基于内容算法仅仅是依据内容相似而忽略了人们对其的评价。协同过滤还可以推荐内容不尽相同然后用户也会感兴趣的产品。
[0023]接下来,具体介绍协同过滤算法。
[0024]1、问题定义
[0025]推荐系统里主要有2个实体:用户和物品。用户通过对物品进行评分表现他的兴趣偏好,可以表示成一个矩阵,任一个用户-物品的值对应着该用户对该物品的已知评分。如图:表示了 3个用户对4个物品的打分矩阵,评分集为{1,2,3,4,5},空白表示该用户没有对当前物品评过分。真实数据中大部分的用户-物品对都是空白,这样的矩阵实际上是十分稀疏的,大部分用户都只给很少一部分物品评过分。推荐系统的任务就是预测矩阵中所有空白处的值。如下,表1协同过滤示例。
[0026]
【权利要求】
1.一种基于特征的协同过滤推荐方法,其特征在于: 步骤一、根据物品的特征,将原有的物品-用户打分矩阵投影到不同的物品特征上,得到多个聚合的特征-用户打分矩阵; 步骤二、对于每一个用户统计其在各个特征上打分的方差,并用该方差值刻画用户对该特征的好恶程度,方差越大,表明用户对该特征的取值有越强偏向; 步骤三、基于各个特征-用户打分矩阵,预测用户对某新物品的打分值; 步骤四、利用步骤二各特征上打分的方差,对步骤三计算得到的打分预测值进行加权平均,得到用户对该物品的最终打分预测值; 步骤五、基于最终的打分预测值,进行物品推荐。
2.根据权利要求1所述的协同过滤推荐方法,其特征在于: 步骤一中,特征-用户打分矩阵,对每个特征fx,特征-用户X矩阵设为Mx,矩阵中第i行第j列的值为用户i评分过的含有特征的评分均值:
M。= ^l7Cfs..efiry.ο
3.根据权利要求2所述的协同过滤推荐方法,其特征在于: 步骤三中,每一个特征矩阵,运用协同过滤方法均得到一个预测评分,这样得到一组预测评分,P= {p'l, ρ'2,…p~r}。
4.根据权利要求3所述的协同过滤推荐方法,其特征在于:物品的预测评分为各个特征预测评分的加权平均值,设SD (i,x)表示用户i在特征X上的预测评分标准差,则有:
【文档编号】G06Q30/02GK103559622SQ201310330389
【公开日】2014年2月5日 申请日期:2013年7月31日 优先权日:2013年7月31日
【发明者】周水庚, 关佶红, 李丹青, 朱晓然, 周晔, 王海清 申请人:焦点科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1