基于社交正则化协同话题回归的标签推荐系统及方法

文档序号:6505800阅读:140来源:国知局
基于社交正则化协同话题回归的标签推荐系统及方法
【专利摘要】本发明公开了一种基于社交正则化协同话题回归的标签推荐系统及方法,该系统包括:CTR模型建立模组,对所有标签建立CTR模型;有社交正则化的CTR模型建立模组,通过将物品-标签矩阵、物品内容信息以及物品之间的社交网络整合到一个层级贝叶斯模型以建立CTR-SR模型;参数学习模组,利用最大后验估计对该有社交正则化的CTR模型建立模组建立的模型中的参数进行学习,最终各参数的全后验概率;标签推荐模组,根据学习后的参数进行标签推荐,本发明将CTR模型应用于标签推荐,通过对CTR进行拓展,提出了一种层级式的贝叶斯模型,有效地整合了物品-标签矩阵、物品内容信息,并利用了物品之间的网络关系,提高了推荐的准确度。
【专利说明】基于社交正则化协同话题回归的标签推荐系统及方法
【技术领域】
[0001]本发明关于一种标签推荐系统及方法,特别是涉及一种基于社交正则化协同话题回归的标签推荐系统及方法。
【背景技术】
[0002]标签系统在分类和组织系统方面扮演着重要的角色。比如说,Flickr (图片分享网站)使用标签来组织分类图片,Last.fm (网上音乐库)利用标签来分类艺术家和音乐。CiteULike (个人学术资料库)允许用户对文章标签。通过标签系统,用户可以更好地组织他们的信息,更容易的找到相关物品或信息。
[0003]然而,找到准确的描述物品的标签是件很难的事。正因如此,标签推荐变的越加重要。通过标签推荐系统,用户只需很少的点击来完成标注过程。并且,不同用户生成的标签可能千差万别。不同的用户可能使用不同的文字来形容相同的意向,这些都给使用标签造成了障碍。标签推荐系统可以帮助缩小词汇范围,从而减轻这类问题。同时它可以帮助排除一些错拼和无意义的单词。因此,标签推荐最近成为了非常热门的话题。
[0004]现有的标签推荐方法可以简单分成三类:基于内容的方法,同现(co-occurrence)的方法以及混合方法。基于内容的方法直接利用物品的内容信息来做推荐,比如论文的摘要和内容、图像信息和图像`描述;基于同现(co-occurrence)的方法主要利用标签(tag)在物品中共同出现的次数的记录来做标签推荐,事实上,同现(co-occurrence )方法背后的原理和协同过滤方法(CF)相似。因为标签推荐(TR)问题非常复杂和困难,无论是纯粹的基于内容的方法还是基于同现(co-occurrence)的方法都无法取得满意的效果。因此最近的趋势是使用混合的方法,该方法同时利用了物品-标签矩阵和物品的个体信息来做推荐。
[0005]然而,在一些应用中,除了物品的内容信息和标签在物品中共同出现的次数等信息,也许还可以得到物品之间的网络关系。比如说,如果要在CiteULike里对文章进行标注,文章之间会有引用信息。通常两篇有相关联系的文章更有可能是关于同意的话题的,从而也更有可能有相同的标签。因此,如何有效的整合物品之间的社交网络信息成为了一个新的挑战。
[0006]假设有一个需要标注的物品集合W= [W1;w2;:::1wj],其中Wj2Rd,表示了物品j的内容或属性。比如说,如果希望标注文章,那么物品即文章,而内容可以是文章的摘要。假设有I个标签ft1;t2;::: ;tlgo那么可以用矩阵&来代表所有物品的标签信息。rij是个二元变量,其中Fij=I表示物品Wj有tagi。标签推荐任务即预测::::?]1中的未知值。需说明的是,本发明关注的虽是对文章的标注问题,同样可以被应用到图片和影像的标注任务上。
[0007]基于内容的方法只使用了内容信息来进行推荐。比如说,如果希望给物品 ' 推荐标签,可以使用与Wj内容最相近的物品同样的标签。也可以把每一个标签作为label,然后通过基于内容来训练分类器的方法来进行推荐。
[0008]基于同现(co-occurrence)的方法只使用了矩阵来做推荐。比如说,如果ti和tk同时在多篇文章中作为tag,并且已知t是Wj的tag,那么也应该给Wj推荐tko可以看到同现(co-occurrence)方法背后的原理与协同过滤的方法(CollaborativeFiltering, CF)非常相似。
[0009]然而,不管是co-occurrence方法还是基于内容的方法,都忽略了一些有用的信息,如物品之间的网络关系,因此,它们在应用时无法达到足够令人满意的效果。

【发明内容】

[0010]为克服上述现有技术存在的不足,本发明之目的在于提供一种基于社交正则化协同话题回归的标签推荐系统及方法,其通过将CTR模型应用于标签推荐,通过对CTR进行拓展,提出了一种层级式的贝叶斯模型,有效地整合了物品-标签矩阵,物品内容信息,并利用了物品之间的网络关系,提高了推荐的准确度。
[0011]为达上述及其它目的,本发明提出一种基于社交正则化协同话题回归的标签推荐系统,包括:
[0012]CTR模型建立模组,对所有标签建立CTR模型;
[0013]有社交正则化的CTR模型建立模组,通过将物品-标签矩阵、物品内容信息以及物品之间的社交网络整合到一个层级贝叶斯模型以建立有社交正则化的CTR模型;
[0014]参数学习模组,利用最大后验估计对该有社交正则化的CTR模型建立模组建立的模型中的参数进行学习,最终各参数的全后验概率;
[0015]标签推荐模组,根据学习后的参数进行标签推荐。
[0016]进一步地,假设有K个话题- = -1:Κ,该CTR模型建立过程如下:
[0017]为每个标签生成符合高斯分布的隐含变量upM人其中1£是1(行的单元矩阵;
[0018]对于每个物品j,生成话题分布Pj ? O HH1 及生成物品的隐含偏移量2J ? N (0:41?),并且设置物品的隐含变量为VjO2j+,对于文章Wj的每个单词Wjn,生成话题 Zjn >> Mult ( μ )及生成单词W j? ? i U ItCzjn ).[0019]对于每个标签-物品对(i,j),生成标签信息》i ? N IiJ ν?;4?';其中Cij反映了
r^.的置信度。
[0020]进一步地,
[0021]
【权利要求】
1.一种基于社交正则化协同话题回归的标签推荐系统,包括: CTR模型建立模组,对所有标签建立CTR模型; 有社交正则化的CTR模型建立模组,通过将物品-标签矩阵、物品内容信息以及物品之间的社交网络整合到一个层级贝叶斯模型以建立有社交正则化的CTR模型; 参数学习模组,利用最大后验估计对该有社交正则化的CTR模型建立模组建立的模型中的参数进行学习,最终各参数的全后验概率; 标签推荐模组,根据学习后的参数进行标签推荐。
2.如权利要求1所述的基于社交正则化协同话题回归的标签推荐系统,其特征在于,假设有K个话题_ = _ 1:K,该CTR模型建立过程如下:为每个标签生成符合高斯分布的隐含变量Ui* N人其中Ik是K行的单元矩阵; 对于每个物品j,生成话题分布b ? D ΜΑΗ (κ).及生成物品的隐含偏移量
3.如权利要求2所述的基于社交正则化协同话题回归的标签推荐系统,其特征在于:
4.如权利要求3所述的基于社交正则化协同话题回归的标签推荐系统,其特征在于,该有社交正则化的CTR模型建立模组建立CTR-SR模型的过程如下: 为每个标签生成隐含变量
5.如权利要求4所述的基于社交正则化协同话题回归的标签推荐系统,其特征在于:该参数学习模组采用EM类型方法来计算最大后验估计,可以通过计算给定参数情况下U =
6.如权利要求5所述的基于社交正则化协同话题回归的标签推荐系统,其特征在于:该参数学习模组获得
7.一种基于社交正则化协同话题回归的标签推荐方法,包括如下步骤: 步骤一,对所有标签建立CTR模型; 步骤二,通过将物品-标签矩阵、物品内容信息以及物品之间的社交网络整合到一个层级贝叶斯模型以建立有社交正则化的CTR模型; 步骤三,参数学习模组,利用最大后验估计对该有社交正则化的CTR模型建立模组建立的模型中的参数进行学习,最终各参数的全后验概率; 步骤四,根据学习后的参数进行标签推荐。
8.如权利要求7所述的一种基于社交正则化协同话题回归的标签推荐方法,其特征在于,于步骤一中,假设有K个话题
9.如权利要求8所述的基于社交正则化协同话题回归的标签推荐方法,其特征在于:



10.如权利要求9所述的基于社交正则化协同话题回归的标签推荐方法,其特征在于,于步骤二中,该有社交正则化的CTR模型的建立过程如下: 为每个标签生成隐含变量
【文档编号】G06F17/27GK103488676SQ201310294465
【公开日】2014年1月1日 申请日期:2013年7月12日 优先权日:2013年7月12日
【发明者】李武军, 王灏, 过敏意 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1