一种基于扩展特征向量的个性化协同过滤推荐方法

文档序号：6577232阅读：611来源：国知局

专利名称：一种基于扩展特征向量的个性化协同过滤推荐方法
技术领域：
本发明涉及一种个性化推荐方法，具体涉及一种基于扩展特征向量的个性化协同过滤推荐方法，属于计算机机器学习领域。
背景技术：
Web 2. O的核心思想是“群体智慧”，也就是基于大众行为，为每个用户提供个性化的推荐。这使得如何让用户能更快速更准确的获得所需要的信息，成为了一个Web应用成败的关键。个性化推荐引擎利用特殊的信息过滤(Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下，推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较，并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的，或是基于用户所在的社会或团体环境。个性化推荐算法主要分为三类(I)基于人口统计学的推荐基于人口统计学的推荐机制是一种最易于实现的推荐方法，它只是简单的根据系统用户的基本信息发现用户的相关程度，然后将相似用户喜爱的其它物品推荐给当前用户。首先，系统对每个用户都有一个用户资料的建模，其中包括用户的基本信息，例如用户的年龄，性别等等(当然在实际的应用中信息种类不仅限于此)；然后，根据用户的资料计算用户的相似度，之后做出推荐。(2)基于内容的推荐基于内容的推荐是在推荐引擎出现之初应用最为广泛的推荐机制，它的核心思想是根据推荐物品或内容的元数据，发现物品或者内容的相关性，然后基于用户以往的喜好记录，推荐给用户相似的物品。(3)基于协同过滤的推荐随着Web 2. O的发展，Web站点更加提倡用户参与和用户贡献，因此基于协同过滤的推荐机制因运而生。其原理是根据用户对物品的偏好，发现物品之间的相关性，或者是发现用户之间的相关性，然后再基于这些关联性进行推荐。基于协同过滤的推荐机制是现今应用最为广泛的推荐机制，它有以下几个的优点它不需要对物品或者用户进行严格的建模，而且不要求物品的描述是机器可理解的，所以这种方法也是领域无关的。这种方法计算出来的推荐是开放的，可以共用他人的经验，很好的支持用户发现潜在的兴趣偏好。但是，这个方法也存在一些问题①方法的核心是基于历史数据，所以对拥有较少偏好信息的新物品和新用户都有“冷启动”的问题。②推荐的效果依赖于用户历史偏好数据的多少和准确性，当系统中的偏好信息较少或者性质较差时，推荐结果往往不是很好。针对这些问题，有必要对原有的协同过滤推荐机制进行一些改进，以适应更多种类的生产环境。

发明内容
本发明的目的是为了克服已有个性化推荐方法存在的不足，提出一种基于扩展特征向量的个性化协同过滤推荐方法。本发明的目的是通过下述技术方案实现的。一种基于扩展特征向量的个性化协同过滤推荐方法，包括基于用户的协同过滤推荐策略和基于物品的协同过滤推荐策略。所述基于用户的协同过滤推荐策略的具体操作过程为步骤I. I :确定用户的扩展特征向量。定义用户的扩展特征向量Useri = (P
(i，l)，P(i，2)，…，P(i，m)，a(i，l)，a(i，2)，*** J a(i, p)) °
其中，Useri表示第i个用户对应的扩展特征向量，I ^ i ^n, η为站点中的用户总数；p(i,j)表示第i个用户对第j个物品的偏好值，m，m为站点中的物品总数；a(i,k)表示第i个用户本身具有的第k个属性值，I < k < p，P为用户的属性个数。所述偏好值是在站点中用户对物品的评分、评论、购买以及浏览记录等信息。所述用户属性值是用户具有的属性信息，包括用户性别、年龄、职业、注册时间、活跃度、所处地区、教育程度等。步骤I. 2 :计算候选推荐物品的推荐值。根据步骤I. I得到的扩展特征向量通过公式(I)计算候选推荐物品的推荐值。
I ^ .
i/,卜其中，R(u, j0表示物品j对于用户U推荐值;Uj表示已经对物品j给出偏好值的用户集合；|U」表示集合％中的元素个数；sim(u,v)表示用户u和用户V之间的相似度，具体指用户u和用户V的扩展特征向量之间的相似度，u、v为该站点中的两个不同用户，且;P(v,j)为用户V对物品j的偏好值。所述用户U和用户V之间的相似度的计算方法包括皮尔逊相关系数、基于欧式距离的相似度和谷本相关系数等。步骤I. 3 :对候选推荐物品的推荐值按照从大到小的顺序进行排序。步骤I. 4 :在步骤I. 3排序的基础上，选取前N个物品推荐给用户U，N为人为设定的某一正整数。经过上述步骤的操作，即完成对用户U的物品推荐。所述基于物品的协同过滤推荐策略的具体操作过程为步骤2. I :确定物品的扩展特征向量。定义物品的扩展特征向量Jtemj = (p(1J), p(2；J),…，p(n,」)，bai), b(j,2)，…，b(j, )。其中，item」表示第j个物品对应的扩展特征向量，I 5 j 5 m,m为站点中的物品总数；p(i，j)表示第i个用户对第j个物品的偏好值，n，n为站点中的用户总数；bai)表示第j个物品本身具有的第I个属性值，l^q, q为站点中的物品的属性个数。所述偏好值是在站点中用户对物品的评分、评论、购买以及浏览记录等信息。所述物品属性值是物品具有的属性信息，包括物品内容、类别、价格、年份、适用人群，产地等。步骤2. 2 :计算候选推荐物品的推荐值。根据步骤2. I得到的扩展特征向量通过公式(2)计算候选推荐物品的推荐值。
权利要求
1.一种基于扩展特征向量的个性化协同过滤推荐方法，其特征在于其包括基于用户的协同过滤推荐策略和基于用户的协同过滤推荐策略；所述基于用户的协同过滤推荐策略的具体操作过程为步骤1.1:确定用户的扩展特征向量；定义用户的扩展特征向量=Useri = (p(ia), p(i,2),…，P(i,m)，a(ijl), a(i；2),…，a(i,p));其中，Useri表示第i个用户对应的扩展特征向量，I彡i彡n, n为站点中的用户总数；p(i,j)表示第i个用户对第j个物品的偏好值，m，m为站点中的物品总数；a(i,k)表示第i个用户本身具有的第k个属性值，I < k < p，p为用户的属性个数；所述偏好值是在站点中用户对物品的评分、评论、购买以及浏览记录等信息；所述用户属性值是用户具有的属性信息，包括用户性别、年龄、职业、注册时间、活跃度、所处地区、教育程度等；步骤I. 2 :计算候选推荐物品的推荐值；根据步骤I. I得到的扩展特征向量通过公式(I)计算候选推荐物品的推荐值； I 一、RU,⑴ 其中，R(u, j,表示物品j对于用户u推荐值外表示已经对物品j给出偏好值的用户集合；|U」表示集合％中的元素个数；sim(u,v)表示用户u和用户V之间的相似度，具体指用户u和用户V的扩展特征向量之间的相似度，U、V为该站点中的两个不同用户，且;p(v,j)为用户v对物品j的偏好值；所述用户U和用户V之间的相似度的计算方法包括皮尔逊相关系数、基于欧式距离的相似度和谷本相关系数等；步骤I. 3 :对候选推荐物品的推荐值按照从大到小的顺序进行排序；步骤I. 4 :在步骤I. 3排序的基础上，选取前N个物品推荐给用户u，N为人为设定的某一正整数；经过上述步骤的操作，即完成对用户u的物品推荐；所述基于物品的协同过滤推荐策略的具体操作过程为步骤2. I :确定物品的扩展特征向量；定义物品的扩展特征向量 atenij = (PcnPW),…，p(n,j)，b(Jjl), b(Jj2),，b(Jjq));其中，item」表示第j个物品对应的扩展特征向量，I j m, m为站点中的物品总数；p(i,」)表示第i个用户对第j个物品的偏好值，n，n为站点中的用户总数；b(il)表示第j个物品本身具有的第I个属性值，l^q, q为站点中的物品的属性个数；所述偏好值是在站点中用户对物品的评分、评论、购买以及浏览记录等信息；所述物品属性值是物品具有的属性信息，包括物品内容、类别、价格、年份、适用人群，产地等；步骤2. 2 :计算候选推荐物品的推荐值；根据步骤2. I得到的扩展特征向量通过公式(2)计算候选推荐物品的推荐值；R(^J) = \7~\^( 1〕I1Ulfelu其中，R吣)表示物品j对于用户u推荐值；IU表示用户u给出偏好值的物品集合；11」表示集合Iu中的元素个数表示物品j和物品j’之间的相似度，具体指物品j和物品j’的扩展特征向量之间的相似度，j、j’为该站点中的两个不同物品，且)为用户u对物品j’的偏好值；所述物品j和物品j ,之间的相似度的计算方法包括皮尔逊相关系数、基于欧式距离的相似度和谷本相关系数等；步骤2. 3 :对候选推荐物品的推荐值按照从大到小的顺序进行排序；步骤2. 4 :在步骤2. 3排序的基础上，选取前N个物品推荐给用户u，N为人为设定的某一正整数；经过上述步骤的操作，即完成对用户u的物品推荐。
全文摘要
本发明公开了一种基于扩展特征向量的个性化协同过滤推荐方法，属于计算机机器学习领域。其具体操作过程为①确定用户/物品的扩展特征向量。②计算候选推荐物品的推荐值。③对候选推荐物品的推荐值按照从大到小的顺序进行排序。④选取前N个物品推荐给用户u。本发明方法与已有个性化推荐方法相比较，具有如下优点①由于参与计算的信息更多，可以更准确地为用户给出推荐项目列表。②具有简单、易行、高效的特点，适合目前广泛流行的分布式计算应用。③可以从现有的关于用户和项目自身属性的信息，为新用户做出推荐，一定程度上减小了偏好信息缺乏对推荐结果的影响。
文档编号G06F17/30GK102968506SQ20121054423
公开日2013年3月13日申请日期2012年12月14日优先权日2012年12月14日
发明者樊博, 宿红毅申请人:北京理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：樊博;宿红毅
技术所有人：北京理工大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。