一种对个性化推荐结果进行优化的fr方法

文档序号:6650618阅读:1274来源:国知局
专利名称:一种对个性化推荐结果进行优化的fr方法
技术领域
本发明涉及一种对个性化推荐结果进行优化的FR方法,它适用于电子商务个性 化推荐,属于信息检索、数据挖掘技术领域。
背景技术
成熟的电子商务系统往往拥有庞大的用户数量;同时,频繁的用户注册和注销也 使得用户数据非常不稳定。因此,在实际应用中,面向用户的K近邻模型很难提供高效、稳 定的推荐服务。为了解决这一弊端,基于电子商务系统中项目数量往往远少于用户数量、且 项目数据更为稳定的事实,Sarwar等提出了面向项目的K近邻模型。面向项目的K近邻模 型使用对项目间的关系建模取代了对用户间的关系建模,同样也分为离线训练过程和线上 推荐过程。国内外研究者们针对利用社会标签数据进行个性化推荐做了大量的研究。 Milicevic等指出,如何使用社会标签数据进行个性化推荐,已经成为了个性化推荐技术研 究领域的一个研究热点,国内外的研究人员针对该问题进行了大量研究,相关的研究成果 层出不穷,如Hotho等提出的使用社会标签数据对所有项目进行排序的R)lkRank算法;Lin 等提出的从社会标签数据中抽取用户群信息的MetaFac算法;Sen等提出的基于社会标签 数据的推荐模型;Lamere等提出的基于社会标签相似度的推荐模型;Diederich等提出的 根据个性化标签数据对项目进行用户兴趣建模的方法;Satoshi等提出的根据社会标签对 项目进行聚类的方法,等等。然而,上述这些方法走向了另一个极端,即只使用个性化标签 数据进行推荐,产生的推荐结果同样只是以单一数据源为基础。

发明内容
1、目的本发明的目的是提供一种对个性化推荐结果进行优化的FR方法。该方法 利用社会标签网络过滤和推荐偏差移除来提高个性化推荐质量和精度。2、技术方案本发明的技术解决方案一种对个性化推荐结果进行优化的FR方 法,其步骤为步骤一,当需要为用户U进行推荐时,推荐系统将首先使用基于评分相似度的K近 邻模型产生初步推荐结果集;步骤二,推荐系统将使用社会标签网络过滤方法对初步推荐结果集进行过滤;步骤三,推荐系统对过滤后的推荐项目对应的系统评分预测值使用推荐偏差移除 方法优化,得出最后的推荐结果并返回给用户。在社会标签数据中,标注链接是由社会标签所描述的项目之间的关系。标注链接 分为以下三类1)强标注链接(Strong Tagging Links)若两个项目被同一用户添加了相同或相 似的标签,则称这两个项目间存在一条强标注链接,相应的标签对被称为硬标签对;2)中标注链接(Moderate Tagging Links)若两个项目被不同用户添加了相同或相似的标签,则称这两个项目间存在一条中标注链接,相应的标签对被称为强标签对;3)弱标注链接(Weak Tagging Links)若两个项目被同一用户添加了无关的标 签,则称这两个项目间存在一条弱标注链接。从标签相似度的角度考虑,在社会标签数据中,不同标签的格式相互差异很大,所 以将每条标签简单地视作单词集合,然后使用单词集合间的Jaccard相似度作为标签间相 似度的度量值,如下式所示
权利要求
1.一种对个性化推荐结果进行优化的FR方法,其特征在于该方法按下列步骤进行步骤一,当需要为用户u进行推荐时,推荐系统将首先使用基于评分相似度的K近邻模型产生初步推荐结果集;步骤二,推荐系统将使用社会标签网络过滤方法对初步推荐结果集进行过滤;步骤三,推荐系统对过滤后的推荐项目对应的系统评分预测值使用推荐偏差移除方法 优化,得出最后的推荐结果并返回给用户。
2.根据权利要求1所述的一种对个性化推荐结果进行优化的FR方法.,其特征在于 在步骤二中所述的社会标签网络过滤方法,是当系统需要为用户u进行推荐时,首先根据 用户u的用户ID取得其已知评分集R (u),然后根据R (u),以面向项目的K近邻模型为推荐 模型,产生初步的推荐结果集;取出用户u的已知评分集中每个项目的社会标签K近邻集并 将其合并,构成过滤项目集;得到社会标签过滤项目集和初步的推荐结果集后,系统对这两 个集合求交集,从而过滤掉推荐结果集中与用户已评分项目具备较低的社会标签相关度的 项目;过滤项目集是以社会标签数据为基础产生的,经社会标签网络过滤方法处理后的推 荐结果与用户已评分项目同时具备较高的评分相关度和社会标签相关度,更好地反映用户 的兴趣和推荐效果。
3.根据权利要求1所述的一种对个性化推荐结果进行优化的FR方法,,其特征在于 在步骤三中所述的推荐偏差移除方法,是以给定的用户-项目评分数据为基础,使用构造 好的推荐模型构造在已知评分数据上的评分预测值,再已知评分构造对系统推荐偏差的统 计估计值;然后通过将构造出的推荐偏差的估计值从相应的评分预测中移除,来提高推荐 系统的预测精度;最后,随着用户反馈信息的不断增加,推荐偏差的估计值根据用户反馈信 息进行动态更新,从而达到更好的优化效果;推荐偏差移除分为离线模型构造阶段、在线模 型应用更新阶段和代入相似度权重的推荐偏差移除。
4.根据权利要求1所述的一种对个性化推荐结果进行优化的FR方法,其特征在于在 步骤二中所述的社会标签网络,是通过社会标签数据中的标注链接的权重来构成,我们采 取使用项目的社会标签K近邻集合对推荐结果进行过滤的策略,实现数据信息的融合;标 注链接分为以下三类1)强标注链接即StrongTagging Links 若两个项目被同一用户添加了相同或相似的 标签,则称这两个项目间存在一条强标注链接,相应的标签对被称为硬标签对;2)中标注链接即ModerateTagging Links 若两个项目被不同用户添加了相同或相似 的标签,则称这两个项目间存在一条中标注链接,相应的标签对被称为强标签对;3)弱标注链接即WeakTagging Links 若两个项目被同一用户添加了无关的标签,则 称这两个项目间存在一条弱标注链接。
5.根据权利要求4所述的一种对个性化推荐结果进行优化的FR方法,其特征在于该 标注链接的权重从标签相似度的角度考虑,在社会标签数据中,不同标签的格式相互差异 很大,所以将每条标签简单地视作单词集合,然后使用单词集合间的Jaccard相似度作为 标签间相似度的度量值,如下式所示simJta,b=\K^h !/UaU^ I其中,ta和tb分别代表从标签a和标签b中抽取出的单词集合;此外,决定一条标注链接的权重的因素是该标注链接所属的类别如果某类标注链接 的出现概率较低,则该类标注链接应该被赋予更高的权重Λ P、//和/分别代表在一个 社会标签数据集中,弱标注链接、中标注链接和强标注链接出现的概率,令#、分别 代表弱标注链接、中标注链接和强标注链接上的权重,结合社会标签间的Jacaard相似度, 则相应标注链接的上权重的计算方式为
6.根据权利要求1或4所述的一种对个性化推荐结果进行优化的FR方法,其特征在 于该社会标签网络是一个无向带权图,其中每一个点表示一个项目,而每条边的权重则表 示相应项目间的社会标签相关度;在实际应用中,社会标签网络可以用邻接矩阵的方式进 行存贮。
7.根据权利要求3所述的一种对个性化推荐结果进行优化的FR方法,其特征在于推 荐偏差,是推荐系统对评分的预测值,和对应的用户真实评分间的差值;推荐偏差代表的是 基于已知评分构造的推荐模型所做出的评分预测值偏离用户真实评分的程度。
8.根据权利要求1或3所述的一种对个性化推荐结果进行优化的FR方法,其特征在 于该推荐偏差移除中的离线模型构造阶段是根据已知评分和推荐系统对已知评分的预测 值,构造推荐偏差估计值;使用斜率为1的线性模型对推荐偏差进行估计,即对用户u,以用 户u的已知评分集合R(U)和系统对用户u的已知评分的预测评分集合为…)为基础,求解最 优的线性模型
9.根据权利要求1或3所述的一种对个性化推荐结果进行优化的FR方法,其特征在 于该推荐偏差移除中的在线模型构造阶段是当推荐系统对用户u在项目k上的评分进行 预测时,加入推荐偏差修正后的评分预测值为K,k =+ RBU即为原始的系统评分预测值与相应的推荐偏差之和;修正后的系统评分预测值尽管 比修正前具备更高的精确度,但仍会与真实的用户评分存在出入;所以,当用户对系统推荐 的项目做出真实评分反馈后,系统将会根据用户反馈评分对相应的推荐偏差估计值进行更 新;当用户U对系统推荐的项目j做出评分反馈时,相应的推荐偏差RBu将会按照下式进行 更新拙old _ Σ Ε7 ( )(Γ , ^uJ ) u \R°ld(u)\+Y他 new _^u,i) + {ru,j ^u, j )Rold(u)\+\ + rRBold RBnew =“RBuold\R(u)old+小(、厂〈)R(u)old+ l + χ
10.根据权利要求3所述的一种对个性化推荐结果进行优化的FR方法,其特征在于推荐偏差移除中的代入相似度权重的推荐偏差移除是将评分相似度作为权重因数引入推 荐偏差的估计过程;具体做法是,分别为用户估计在每个项目上的推荐偏差,同时代入项目 间的评分相似度进行加权平均;在估计系统为用户u推荐项目k时的推荐偏差RBu, k时,其 估计方式如下式所示
全文摘要
一种对个性化推荐结果进行优化的FR方法,它是利用社会标签网络过滤和推荐偏差移除,提高个性化推荐质量和精度。社会标签网络过滤方法使用社会标签网络模型,建立项目社会网络K近邻,并以其为基础在推荐模型进行推荐时构造社会标签过滤集合,用以过滤掉面向项目的K近邻模型的推荐结果中,与用户已评分项目较低的社会标签相关度的推荐项目,从而将用户-项目评分数据和社会标签网络数据中的信息结合起来进行推荐。推荐偏差移除方法以面向项目的K近邻模型在已知用户-项目评分数据上的预测值和用户真实评分为基础,使用线性模型对推荐偏差进行估计;并在推荐模型进行推荐时,将相应的推荐偏差估计值从评分预测值中移除,从而对推荐结果进行优化。
文档编号G06F17/30GK102073720SQ20111000378
公开日2011年5月25日 申请日期2011年1月10日 优先权日2011年1月10日
发明者欧阳元新, 熊璋, 罗辛, 谢舒翼 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1