基于高阶用户偏好的推荐方法

文档序号:9350071阅读:425来源:国知局
基于高阶用户偏好的推荐方法
【技术领域】
[0001] 本发明涉及机器学习和模式识别领域,特别是基于高阶用户偏好的推荐方法。
【背景技术】
[0002] 近年来,随着网络的飞速发展,人们每天都会面临大量的信息(即信息过载)。面 对成千上万的信息,人们疲于从中发现自己感兴趣的有价值的信息,推荐系统的出现正是 为了解决信息过载问题。推荐系统是一种信息过滤技术,它能够从大量的信息中筛选出用 户感兴趣的有价值的内容并提供给用户,从而使用户从纷杂繁多的信息中解脱出来。常用 的推荐系统技术有基于内容的推荐系统、基于协同过滤的推荐系统和混合推荐系统,其中 最流行的属基于协同过滤的推荐系统。
[0003] 基于协同过滤的推荐系统收集并汇聚用户偏好信息,依托用户和物品的相似性度 量对用户可能的偏好物品进行个性化预测。基于协同过滤的技术又可以分为最近邻协同过 滤和基于模型的协同过滤。最近邻协同过滤利用最相似的若干个用户的偏好来计算目标用 户对目标物品的偏好程度,然后再向目标用户推荐其最感兴趣的物品;基于模型的协同过 滤不直接操作已有评分而得到预测值,而是使用已有评分去训练模型再基于模型对物品进 行评分预测。评分数据集可以分为正态分布数据集和高度偏斜数据集,正态分布数据集的 分布是对称的,评分大多集中在均值附近;高度偏斜数据集的分布是非对称而且是高度偏 斜的,即大多数评分是较低评分或者是较高评分,并不集中在均值附近。已有的协同过滤技 术的研究大多集中在正态分布数据集上,鲜有工作是基于高度偏斜数据集的。
[0004] 在真实的应用场景中,高度偏斜评分数据集是普遍存在的,例如电子商务网站、产 品评论网站和内容提供网站中的数据集。虽然具有高度偏斜的高度偏斜数据集普遍存在, 但是却很少有工作研究用户评分的分布情况,而且传统的协同过滤技术不能很好地处理高 度偏斜的数据集。

【发明内容】

[0005] 有鉴于此,本发明的目的在于提出一种基于高阶用户偏好的推荐系统及方法。本 发明的推荐方法通过利用LeamRP学习算法来最小化OPTRP最优化准则,从而产生各种各样 的协同过滤模型,产生的模型不仅能够处理对称分布的正态分布数据集,而且还能够处理 具有高度偏斜特征的高度偏斜数据集。
[0006] 为了实现上述目的,本发明提出了一种基于高阶用户偏好的推荐方法,包括以下 步骤:
[0007] 步骤S1,利用用户-物品评分数据集,计算用户对成对物品的高阶偏好值,构建用 户-物品-物品成对偏好数据集;
[0008] 步骤S2,构建协同过滤模型,初始化所述协同过滤模型的参数矢量,从正态分布中 随机选取值来对所述协同过滤模型的参数进行初始化;
[0009] 步骤S3,从所述用户-物品评分数据集和用户-物品成对偏好数据集中选择一对 相关的数据;
[0010] 步骤S4,基于所述一对相关数据计算评分预测误差、定量偏好预测误差和用户偏 好相似度,构成最优化准则;
[0011] 步骤S5,计算预测成对偏好对偏好指标的梯度和预测物品相异度对偏好指标的梯 度,并更新所述协同过滤模型的参数;
[0012] 步骤S6,计算预测评分对评分指标的梯度,并更新所述协同过滤模型的参数;
[0013] 步骤S7,重复步骤S3到S6,直到所述协同过滤模型的参数收敛,此时得到的参数 使得最优化准则达到全局最优,所述参数构成学习出来的所述协同过滤模型。
[0014] 基于上述技术方案可知,本发明的推荐方法基于高阶用户偏好,推荐系统框架由 OPTRP最优化准则和LearnRP学习算法组成,该框架通过学习可以产生已有的CF模型,而且 还可以产生新的模型,利用该框架产生的CF模型能够有效地处理高度偏斜的评分数据集, 使得推荐系统的预测精度和推荐准确度都得到提高。本发明方法产生的协同过滤模型,在 高度偏斜数据集上,其效果都比传统的模型要好,在真实的场景中有重要的应用价值。
【附图说明】
[0015] 图1是利用本发明方法产生的MF-RP模型与传统的MF模型在两个高度偏斜数据 集上(Epinions Datasets,Amazon Datasets)收敛快慢的比较。
[0016] 表1是MF-RP与MF预测精确度的比较,表2是本发明方法产生的KNN-RP模型与 传统的KNN模型关于预测精确度的比较,表3是本发明方法产生的两种模型与对应的传统 模型在三个高度偏斜数据集上关于召回率度量指标的比较,表4是本发明方法产生的两种 模型与对应的传统模型在三个高度偏斜数据集上关于排名准确率的比较。
【具体实施方式】
[0017] 为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照 附图,对本发明作进一步的详细说明。
[0018] 现有的研究工作大多集中在正态分布数据集上而没有考虑具有高度偏斜特征的 高度偏斜数据集,本发明提出了一种基于高阶用户偏好的推荐系统框架,采用OPTRP最优 化准则和LearnRP学习算法构成该框架,通过最小化OPTRP最优化准则学习出来的模型不 仅能够处理对称分布的正态分布数据集,而且能够很好地处理具有高度偏斜特征的情感数 据集,提高预测评分的精确度从而进行更好的推荐。在该框架中,利用LearnRP学习算法不 仅能够产生能够处理高度偏斜的数据集的模型,而且还能够学习出已知的模型,从而产生 各种各样的协同过滤模型。
[0019] 本发明公开的基于高阶用户偏好的推荐方法,包括以下步骤:
[0020] 第一步,利用用户-物品评分数据集,计算用户对成对物品的高阶偏好值,构建用 户-物品-物品成对偏好数据集;
[0021] 第二步,建立协同过滤模型,并初始化该模型的参数矢量,从正态分布中随机选取 值来对模型的参数进行初始化;
[0022] 第三步,从评分数据集和成对偏好数据集中选择相关的数据;
[0023] 第四步,计算评分预测误差、定量偏好预测误差和用户偏好相似度,构成最优化准 则;
[0024] 第五步,计算预测的成对偏好对偏好指标的梯度和预测的物品相异度对偏好指标 的梯度,并更新模型的参数;
[0025] 第六步,计算预测的评分对评分指标的梯度,并更新模型的参数;
[0026] 第七步,重复第三步到第六步,直到模型的参数收敛,此时得到的参数使得最优化 准则达到全局最优,这些参数构成了基于本发明系统框架学习出来的新模型。
[0027] 更具体地,本发明提出的基于高阶用户偏好的推荐方法,包括以下步骤:
[0028] 给定用户集U和物品集I,所有用户和所有物品构成集合Dt= UX I,所有用户的 评分rul构成了用户-物品评分数据集,记为Rt。
[0029] Rt={ruiI(u,i)GDj (I)
[0030] 设置LearnRP学习算法中的参数(I、yn、yt、As、An、At,其中7\和y t是学习 率,As是偏好相似度条件的规范化因子,A "和A t是模型参数的规范化因子,0是权重系 数,控制评分指标和偏好指标的重要性。
[0031] 第1步,利用评分数据集Rt,得到成对偏好数据集Dn,
[0032] Bti {{hJ^ j)\{{u J)Au, j)) c~: D.] (2)
[0033] 然后根据成对偏好数据集Dn计算定量成对偏好rU1],所有rul]构成了成对偏好数 据集Rn。
[0034] rulj=rul-ruj (3)
[0035] Rn={rui.jI(u,i,j)GDn} (4)
[0036] 第2步,初始化模型的参数矢量,从正态分布中随机选取值来对模型的参数进行 初始化。例如对于MF-RP模型,用上述初始化方法初始化qi、qP pu三个参数;对于KNN-RP 模型,用上述方法初始化Sin^Ps_jm。
[0037] 第3步,从评分数据集和成对偏好数据集中选择一对相关的数据,例如从评分数 据集Rt中选取一个r U1,然后从成对偏好数据集Rn中随机选取另外一个物品j得到r U1]。
[0038] 第4步,计算评分预测误差xul、定量偏好预测误差xul]、用户偏好相似度s ul]和物 品相异度4,构成最优化准则,其中
[0039] Wfm (5)
[0040] C6)
[0041] 代入rul j的表达式可得
[0042] xm
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1