基于评分和标签构建用户群体模型的电子商务推荐方法

文档序号:9200875阅读:227来源:国知局
基于评分和标签构建用户群体模型的电子商务推荐方法
【技术领域】
[0001] 本发明涉及电子商务智能推荐领域,具体涉及一种基于评分和标签构建用户群体 模型的电子商务推荐方法。特别是适用于用户和资源数量庞大,具有标签的群体用户的资 源推荐,利用群体用户模型的特点可以缓解用户数据稀疏的问题,提高推荐质量。 技术背景
[0002] 网络和在线协同技术的迅速发展,让广大网络用户不仅可以从互联网上获取各种 信息,还可以自由地发布各种信息或对已有数据添加自己观点和态度的社会化标注。社会 化标注系统已经逐渐发展成为重要的网络资源组织与共享平台,成为Web的主要发展方向 之一,出现了如Delicious、豆瓣、Flickr、YouTube等一大批社会化标注的应用和体验。互 联网上大量用户的标注使得社会化标注系统拥有丰富的特征信息,为用户提供了表达自我 和抒发情感的机会。这些主动的标注行为可以反映出用户的兴趣和认知偏好。同时,用户 还可以参考和借鉴其他用户所选择的资源和标签,体现出一定的互动性。如果能够将这些 社会化标注信息合理运用到图书、电影和音乐等推荐系统中,那么就能够使推荐系统比较 准确地把握用户的实时需求并有针对性地进行推荐,从而满足用户的个性化需求,改善推 荐的有效性,对于解决信息过载有一定的促进作用。
[0003] 由于用户数据的稀疏性,异构多源性和社会环境不同等原因,推荐结果受到很大 的影响。本发明结合标签和评分信息,通过用户特征分析建立用户的群体模型,然后基于用 户的群体模型计算用户对资源的兴趣度,从而缓解用户数据稀疏等问题,形成比较好的推 荐结果。

【发明内容】

[0004] 本发明的目的在于解决网络推荐的数据稀疏性问题,提出一种基于评分和标签构 建用户群体模型的电子商务推荐方法。
[0005] 用户(U)是指在网站或网络应用上注册的使用者。网络应用系统中的所有用户组 成了用户集合表示为U = {Ul,U2, ...,U|u|},网络应用系统上所有资源组成的资源集合表示 为I = U1, i2,…,im},用户对资源标注时使用的标签组成标签集合表示为T = It1, t2,… ,t|T|},服务端通过收集用户评分和标注信息建立用户模型,推荐引擎根据推荐算法和用户 模型为用户推荐其可能感兴趣的资源,然后根据用户对推荐结果的反馈,调整推荐参数,优 化推荐结果。其中|υ|、|ι|、|τ|分别表示用户、资源和标签的个数。
[0006] 用户模型用于获取用户的兴趣特征和需求,用户模型的好坏将直接影响到推荐结 果的质量。传统基于评分的用户模型不能准确表达用户的阅读兴趣,例如用户U 1和用户U2 同时阅读了《伟大的博弈》这本书并且评分5分,然而让用户U1感兴趣的原因是"这是一部 金融历史类的图书",而用户U 2的原因只是想了解华尔街的一些情况。上例中用户U1可以 使用"金融"、"历史"等标签,用户U 2可以使用"华尔街"等标签。用户标签和评分模型如图 1所示,从图1中可以看出用户评分与标签是两个相对独立,但又相互补充的过程。它们分 别从总的兴趣程度大小和具体各个兴趣点共同对资源进行描述。以资源为媒介,本发明将 用户对于资源的评分按权重扩展到标签,然后重新收回到资源,从而形成用户推荐。
[0007] 与本发明基于评分和标签构建用户群体模型的电子商务推荐方法相关的定义如 下:
[0008] 定义1 : £群体,用户空间上的非空有限集合U = Iu1, U2,...,U1J,对于U上的任 意用户Ui,定义其£群体为£ (Ui) = {u|u e U, SimUser (u, Ui)彡£},其中0彡£彡1 ;贝丨J 称£ (Ui)为用户Ui相应的£群体;根据用户群体的定义可知,当用户特征相似度阈值£ = 0 时,£ (Ui)包含所有的用户,即用户之间没有区分度;随着£的增大,用户群体包含用户的 个数逐渐减少,不同的用户开始体现出差异性;当£= 1时,用户群体缩小为一个,这时用 户之间的相似度与传统的协同过滤相似度相同;
[0009] 本发明所述的基于评分和标签构建用户群体模型的电子商务推荐方法,包括以下 步骤:
[0010] 步骤1基于用户特征的用户群体构建;
[0011] 用户群体的形成主要是由用户兴趣相关的用户特征所决定,具有相同特征的用户 更容易形成一个兴趣相对稳定的群体;用户特征集UC,是用户个体u本身的多种特征集合, 有年龄、性另II、婚姻、教育、职业和地域,则定义用户特征集为,UC = {Age, Gender, Marriage ,Education, Occupation, Region…};根据用户的特征数据集可以计算用户特征相似度,Cli 表示第i种特征的相似度;
[0012] (1)年龄:用户u和V之间的年龄相似度计算方法如下,
[0014] ⑵性别、婚姻:用1和0分别表示用户的性别为男或女,用1和0分别表示婚姻 "是或否";
[0015] (3)教育背景:按高中以下、高中、本科、硕士、博士,分别记为{1,2, 3, 4, 5},(:13具 体计算如下,
[0017] (4)职业:按不同职业种类记为{0, 1,2,…,η} ;n表示职业的种类数;
[0018] (5)地域:长期居住地相同并且居住地的行政区域单位越小则用户的相似度越 高,(:1 5具体计算方法为,若用户u与用户V的家庭所在地位于同一乡镇或街道则为1,位于 相同县则为0. 8,位于相同市则为0. 6,位于相同省则为0. 4,位于相同国家则为0. 2,其余均 为0 ;用户u和用户V的特征相似度可以定义为所有k个用户特征属性的平均相似度,计算 公式如下,
[0020] 其中,Wi表示第i个用户特征属性的权重;基于群体的用户建模通过联合群体内 所有用户的标注行为建立用户模型,反映了具有相同用户特征的用户可能具有的兴趣偏 好;
[0021 ] 步骤2用户标签初始权重计算;
[0022] 采用基于信息熵的方法来定义标签反映用户兴趣的初始权重,有助于体现用户的 多兴趣性:
[0023] d(t) = log(fu(t)/fu+l) (6)
[0024] 其中,d(t)表示用户u对标签t的初始兴趣权重,fu(t)表示用户u使用标签t进 行标注的频数,f u表示用户u使用标签总频数,d(t) e [0, 1];
[0025] 步骤3标签关联权重计算;
[0026] 本发明定义一个标签关联度来表示这种标签之间相关性;当用户通过一组标签共 同标注一个资源时,则这一组标签之间有一定的语义相关性,用户的整个标签集合可以通 过这种关系联系起来;
[0028] 其中,c (b tp表示标签tj之间的关联系数,R i,Rj分别表示标签t i,\所标注 的资源的集合;
[0029] 用户的标签权重不仅与标签自身的频率有关,还与该标签相关联的其它标签的权 重有关,本发明将标签从其它标签获得的权重定义为关联性权重;标签t从其它标签获得 的关联性权重P (t)为,
[0031] Tu为用户u使用的标签集合;d(t J表示用户u对标签&的初始兴趣权重;
[0032] 步骤4最终用户标签权重计算;
[0033] 通过以上对用户标签的分析,得到最终的用户标签权重Wu(t)为:
[0034] wu(t) = a d(t) + (l-a )p(t) (9)
[0035] 其中a是训练参数,根据用户反馈进行调整;
[0036] 步骤5资源标签分析与计算;
[0037] 资源标签分析用标签权重Wi (t)来刻画各个标签对于资源的不同反映程度,对于 同一个资源,用户使用相同的标签标注的次数越多,则这个标签越能反映用户对该资源的 认知;借鉴TF*IDF公式,则标签t对资源i的权重W i (t)为:
[0039] 其中,TF(i,t)表示所有用户对资源i使用标签t进行标注的频率,111表示所有 资源的个数,n t表示使用标签t标注过的资源的个数,分母为归一化因子;
[0040] 由资源标签分析,将用户对资源的评分分散给每个对资源进行标注的标签,则用 户u对资源i的评分分散给标签t的评分为:
[0042] 其中,Tiu为用户u对资源i使用的标签的集合,ItiuI为Tu,冲标签的个数,R iu 为用户U对资源i的评分;
[0043] 用户u对标签t的兴趣度ru,,为,
[0045] 其中,fu(t)表示用户u使用标签t对资源标注的频数,Tu为用户u使用的标签集 合;
[0046] 标签t对资源i的表示程度ri;t为,
[0048] 其中,fjt)表示资源i被标签t标注的频数,Ti为所有对资源i标注的标签集合;
[0049] 步骤6资源推荐;
[0050] 个性化推荐系统的最终目标是找到与用户兴趣度匹配最高的资源,由于标签是联 系用户和资源的纽带,选择与目标用户具有共同标签的资源组成候选推荐资源集合,并通 过计算用户与资源的相似度,按照一定的方式将候选推荐资源展示给用户;
[0051] 本发明根据用户标签向量和资源标签向量,计算用户兴趣与资源相似度,通过以 标签向量表示的用户与资源的相似度来表示用户u对资源i兴趣度大小,计算用户u对资 源i的兴趣度Q(u,i):
[0053] 其中,1^和A分别表示用户u对标签t的兴趣度和平均兴趣度,riit和A分别为 标签t对资源i的表示程度和平均表示程度,Tiu为用户u和资源i共同拥有的标签集合。
[0054] 本发明的有益效果在于:
[0055] 本发明在用户评分的基础上提出了利用标签分析理解评分的内在含义的方法,克 服了单纯利用评分信息量较少的问题,从而更加准确的把握用户的兴趣点,同时丰富了用 户可用信息,有利于缓解评分稀疏性的问题。
【附图说明】
[0056] 图1是本发明方法的用户评分和标签模型。
【具体实施方式】
[0057] 本发明所述的基于评分和标签构建用户群体模型的电子商务推荐方法,包括以下 步骤:
[0058] 步骤1基于用户特征的用户群体构建;
[0059] 用户特征集 UC = {Age, Gender, Marriage, Education, Occupation, Region…};根 据用户的特征数据集可以计算用户特征相似度,Cli表示第i种特征的相似度;
[0060] (1)年
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1