一种基于矩阵分解的互联网信息产品推荐方法

文档序号:6567205阅读:184来源:国知局
专利名称:一种基于矩阵分解的互联网信息产品推荐方法
技术领域
本发明涉及互联网信息产品的推荐问题,特别针对网站系统中同时存在用户间社交信息以及用户对产品的评分信息,如何有效利用不同用户间社交关系,并根据用户对产品的历史评分数据,快速准确预测用户对其未评价产品的可能评分,为目标用户进行个性化信息产品推荐。
背景技术
互联网信息产品指互联网站上罗列的各类商品和各种电子产品,包括电影、音乐、 书籍、家电以及服饰等。随着互联网的迅速发展,用户通过网络可以接触到海量的信息产品。例如在淘宝网上有数以亿计的各类商品,在豆瓣网上有数以百万计的各类电影。面对海量的产品,互联网用户往往无所适从,无法找到自己感兴趣的产品。很多网站系统和搜索引擎开始采用推荐的方式帮助用户选择合适的产品,有效提高用户体验并实现商业营销。一个高效、准确、个性化的推荐系统已经成为互联网应用领域的研发热点之一。目前的推荐系统主要采用两类方法。其一是协同过滤方法。该方法利用互联网用户的历史评分信息计算用户之间的评分相似度。当系统为某个用户推荐产品时,首先选出与之相似度最高的若干其他用户;然后利用其他用户对产品的评价信息来预测目标用户对未评价产品的评分;最后推荐评分最高的信息产品。协同过滤方法的优点是可以借鉴相似用户的评价信息为目标用户提供推荐。其二是矩阵分解方法。该方法将用户对产品的评价信息组织为一个评分矩阵,采用奇异值分解(Singular Value Decomposition)技术,为每个用户、产品分解出一个特征向量;使得用户对产品的评分可以通过计算用户和产品特征向量的内积来获得。矩阵分解方法的优点是可以减少需要估计和学习的参数数量,提高推荐系统的性能。互联网用户对信息产品的评价会受到其朋友或关注对象的影响,朋友关系或关注关系通过用户之间的社交关系反映。目前大多数网站系统都整合了在线社交关系网络,例如豆瓣网、淘宝网和大众点评网等都集成了社交系统。传统推荐方法没有很好考虑用户间的社交关系,不能准确的为用户提供推荐;同时还存在“冷启动”问题,不能为新加入用户和新产品提供有效推荐。

发明内容
本发明的主要目的是针对互联网海量信息产品的推荐问题,为目标用户提供准确的个性化产品推荐。该方法运用协同过滤和矩阵分解技术,引入对用户社交关系的分析,结合产品类别信息为目标用户提供个性化产品推荐;能够解决新加入用户的“冷启动”问题。 计算简单,可快速为目标用户完成产品推荐,有良好的可扩展性和适应性。为实现上述目的,本发明采用如下的步骤
1)获取用户对信息产品的评分记录;
2)获取用户间社交关系记录;3)按照目标用户和目标产品类别构建评分矩阵和社交矩阵;
4)采用矩阵分解技术学习用户特征向量和产品特征向量;
5)根据特征向量计算目标用户对不同产品的评分,据以推荐用户喜好的产品。
上述步骤1)中获取用户对信息产品评分记录的过程为首先确定一个或多个信息收集网站,收集用户对不同信息产品的评价信息。令 f_表示用户,9表示信息产品,『表示用户对产品的评分,则一个评分记录可以表示成 < P-^r >。然后为每个用户和产品设定唯一标识,如用户标识为产品标识为%·,上述记录转换为< /W,·. >。最后对评分r做归一化处理,如下式所示
其中.η,η,—,.表示网站系统中评分的最大值,而表示网站系统中评分的最小值。
上述步骤2)中获取用户间社交关系记录的过程为首先识别用户在网站系统中的社交关系朋友关系和关注关系;朋友关系为双向关系,关注关系为单向关系。然后获取各个用户的唯一标识,如用户Λ和用户办。接下来将用户间社交关系转换为社交记录如果用户仇和用户是朋友关系,则添加社交记录</.m· >和< 巧·.巧 > ;如果用户外关注用户A·,则只添加社交记录< AW^ >。最后根据社交记录设定社交关系值 〃·,如下式所示
上述步骤3)中按照目标用户和目标产品类别构建评分矩阵和社交矩阵的过程为首先筛选出与目标用户相似的个用户P 二 {州./^.….^},其中参数,是可选参数,例如选择网站系统中全部用户数量的50%。然后根据目标产品类别选择同类别或相似类别的■个产品Q = {(/1. .…·如},参数…也是可选参数,例如选择网站系统中所有的同类别产品。 接下来获取用户群P对产品集Q的所有评分记录,构建评分矩阵礼χ ,,矩阵中元素值 a < u < ."‘ L < ’ < O为用户凡对产品Φ的评分值。如果用户P 未对产品识评分,则 丨设为空值。 下一步根据用户的评分信息计算社交用户之间的评分相似度。根据用户群P中两两用户之间的社交关系值,构建社交矩阵· 》>: 。调整矩阵元素^r为用户A与用户ft.的评分相似度iC计算公式如下
其中Qw C Q表示用户仏和终.共同评价过的产品;乙和4分别表示用户&和办对 Gw中产品评分的均值。再对矩阵Sm 的元素按行进行归一化处理,公式如下(其中若 Σ—二'C — U,则心,=())
权利要求
1.一种基于矩阵分解的互联网信息产品推荐方法,其特征在于包含以下步骤1)获取用户对信息产品的评分记录;2)获取用户间社交关系记录;
2.根据权利要求1所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤 1)中获取用户对信息产品评分记录的流程是首先确定一个或多个信息收集网站,收集用户对不同信息产品的评价信息令P 表示用户,9表示信息产品,『表示用户对产品的评分,则一个评分记录可以表示成 < P-fl-r > ;然后为每个用户和产品设定唯一标识,如用户标识为P..,,产品标识为ft,上述记录转换为< P,,·屮· > ;最后对评分r做归一化处理,如下式所示其中表示网站系统中评分的最大值,而》表示网站系统中评分的最小值。
3.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤2)中获取用户间社交关系记录的流程是首先识别用户在网站系统中的社交关系 朋友关系和关注关系;朋友关系为双向关系,关注关系为单向关系;然后获取各个用户的唯一标识,如用户A和用户A ;接下来将用户间社交关系转换为社交记录如果用户Λ和用户A是朋友关系,则添加社交记录</U·· >和< > ;如果用户1 关注用户Λ,则只添加社交记录< /V/V > ;最后根据社交记录设定社交关系值,如下式所示
4.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤3)中按照目标用户和目标产品类别构建评分矩阵和社交矩阵的流程是首先筛选出与目标用户相似的η个用户Zi = Om ·…/> },其中参数π是可选参数;然后根据目标产品类别选择同类别或相似类别的个产品◎二 {y+卜他··…如},参数m也是可选参数; 接下来获取用户群P对产品集Q的所有评分记录,构建评分矩阵礼χ ,,矩阵中元素值 a < u < ."‘ L < ’ < O为用户&对产品ft的评分值;如果用户A未对产品劣评分,则》’《设为空值;下一步根据用户的评分信息计算社交用户之间的评分相似度;根据用户群P中两两用户之间的社交关系值,构建社交矩阵;调整矩阵元素^£ 为用户A与用户办的评分相似度《;;,计算公式如下其中认厂C Q表示用户外和办共同评价过的产品;+P._,和。分别表示用户&和办对Uw 中产品评分的均值;再对矩阵的元素按行进行归一化处理,公式如下
5.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤4)中采用矩阵分解技术学习用户特征向量和产品特征向量的流程是首先设定用户与产品特征向量的维度β,维度β属于可选参数;用户 的特征向量表示为
6.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤幻中为目标用户推荐产品的流程是首先获得用户队的特征向量/ ;然后获取指定产品类别中用户A未评分的所有产品,针对其中每一个产品Φ,计算用户俗对产品$的评分预测值‘,其中追加用户评分倾向和产品综合印象,公式如下对所有待评分产品预测完毕之后,将产品评分预测值排序,挑选其中评分值最高的& 个产品推荐给目标用户。
全文摘要
本发明公开了一种基于矩阵分解的互联网信息产品推荐方法,其步骤是1)获取用户对信息产品的评分记录;2)获取互联网用户间的社交关系记录;3)按照目标用户和目标产品类别构建评分矩阵和社交矩阵;4)采用矩阵分解技术学习用户特征向量和产品特征向量;5)根据特征向量计算目标用户对不同产品的评分,据以推荐用户喜好的产品。本发明引入对用户社交关系的分析,结合产品类别信息为目标用户提供个性化产品推荐。计算简单快速,有良好的可扩展性和适应性,适于互联网用户的高动态性以及面向海量产品的推荐。
文档编号G06F17/16GK102426686SQ20111029899
公开日2012年4月25日 申请日期2011年9月29日 优先权日2011年9月29日
发明者李敏, 汤九斌, 陈道蓄, 顾庆, 骆斌 申请人:南京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1