一种基于用户质量模型的协同过滤标签推荐方法及系统的制作方法

文档序号:9667499阅读:873来源:国知局
一种基于用户质量模型的协同过滤标签推荐方法及系统的制作方法
【技术领域】
[0001] 本发明涉及WEB应用技术领域,尤其涉及一种基于用户质量模型的协同过滤标签 推荐方法及系统。
【背景技术】
[0002] 随着网络技术的深入发展,标签已经成为互联网上的一种标准信息组织方式,在 自由分类法中得到了广泛的应用,自由分类法是一种用户对信息自由存取的方法,这种方 法使得用户能够用自己的语音以"标签"的形式对信息特征进行标注。利用标签对本文、图 片、视频以及音频资源进行信息的分类、组织和检索,实现信息的搜索和共享,是互联网信 息环境中一种独具特色的信息组织工具。在过去的近几年,用户建立、分享元数据的标签系 统已经在internet上得到了探索和应用,例如Flickrtll,Del·icio.us21,Connoteat以及 LibraryThingt等网站都被认为是Web2.0技术应用的实例,因为它们利用网络来收集和整 理信息,这类系统提供了 "团体驱动"和"有机"的方法来对网络信息资源分类,便于信息的 发现、浏览、以及复用。
[0003] 传统分类系统中的分类词汇往往缺乏流行性和相关性,词汇相对过时,并且专业 人士很难通过传统分类词汇搜索获得相关信息和预期结果,且传统分类结构中使用的元数 据成本相对高昂,因为元数据的定义和分类需要耗费专业人士大量的时间和精力,而在标 签系统中,系统将繁琐的元数据定义任务交给用户来完成,标签定义是用户对资源的团体 行为,因此标签系统较之传统的固定层次结构分类系统对用户来说紧密性更强、适应性更 好,更符合当前流行趋势。标签分类通过标签使得搜寻的重点得到更好的显示和突出,与一 般的关键词不同的是,用关键词进行搜索时,只能搜索到内容里包含关键词的文章,但tag 包含了文中没有的关键词,使用tag来搜索,可以搜索到包含关键词以外词汇的文章,扩大 了搜索的宽度和广度。
[0004] 虽然标签在实现信息资源的检索和网页导航时体现出卓越的优势,但标签的使用 要求人们必须预先定义标签,然而手工标签的定义过程往往费时繁琐,为了将人们从费时 繁琐的标签定义工作中解放出来,使自由分类能得到更广泛应用,标签推荐服务的推出迫 在眉睫,该服务实现的是给用户推荐一些潜在的可能为用户所感兴趣的标签,让用户从中 选择,从而使标签定义更为方便快捷。
[0005] 标签推荐是一个伴随着网络技术推广应用而出现的新兴领域,但从整体上看存在 以下问题:
[0006] 1.标签陈旧问题。所推荐的标签来源于固定的标签体系,随着时间的推移,数据量 的不断增大,必需增加一些原有标签体系中所缺乏的,而又适用于新资源的标签,但固定的 标签体系并不能随着时间的推移而演进,势必会造成推荐质量的下降。
[0007] 2.冷启动问题。用户、标签、资源是标签推荐系统的三大要素,推荐时应充分考虑 这三大要素在系统中的出现情况,但现有标签推荐系统大都只从现有的用户模型和资源模 型来提取信息,却忽略了系统在面对一个新用户、新资源时应该必须解决的数据挖掘问题。
[0008] 3.标签源的单一性。资源内容、用户历史标签(也称为用户兴趣标签)、资源历史标 签是标签推荐的三种最主要的标签来源,而且每种标签源都有自身的优缺点,现有的标签 推荐系统大都只专注于其中的某一种,没有把多种标签源结合起来。
[0009] 因此,现有技术还有待于改进和发展。

【发明内容】

[0010] 鉴于现有技术的不足,本发明目的在于提供一种基于用户质量模型的协同过滤标 签推荐方法及系统,旨在解决现有技术中基于协同过滤推荐算法以及现有的大多数标签推 荐算法都存在着标签空间陈旧、冷启动以及标签源过于单一等问题。
[0011] 本发明的技术方案如下:
[0012] -种基于用户质量模型的协同过滤标签推荐方法,其中,方法包括:
[0013] A、检测到用户输入信息,获取标签分类信息数据库中的训练集,提取训练集中所 有标签构成现有系统的标签体系,并根据资源和用户在现有系统中出现的情况对标签体系 进tx完善;
[0014] B、将系统中用户的信息映射到二维矩阵构建用户模型,并以用户-标签二维矩阵 形式进行存储;
[0015] C、获取当前用户的模型向量,计算当前用户与系统中邻居用户的相似度;
[0016] D、计算系统中邻居用户的模型质量;
[0017] E、根据系统中邻居用户的模型质量,根据改进的协同过滤推荐算法产生最佳推 荐;
[0018] F、将最佳推荐结果通过WEB服务器返回至用户界面。
[0019] 所述的基于用户质量模型的协同过滤标签推荐方法,其中,所述步骤A具体包括:
[0020] A1、检测到用户输入信息,获取标签分类信息数据库中的训练集,提取训练集中的 所有标签构成现有系统S的标签体系C{tl,t2,. . .,tn};
[0021 ] A2、判断资源Ri和用户Ui在现有系统S中出现的情况;
[0022] A3、若UieSandRi铉S或是ESandRi运S,若资源没有在现有系统中出 现过,则提取资源心中的前X个权重最高的资源标题关键字加入系统标签体系C中;
[0023] A4、若%gSandRiES,即资源在系统中出现过,用户没有出现过,则提取资 源Ri中的Y个使用频率最高的标签和X个权重最高的资源标题关键字加入系统标签体系C中;
[0024] andR^S,即用户和资源都在系统中出现过,采用历史标签信息。
[0025] 所述的基于用户质量模型的协同过滤标签推荐方法,其中,所述步骤B具体包括:
[0026] B1、将系统中K个用户的信息映射到二维矩阵构建用户模型,并映射结果以用户_ 标签特征矩阵进行存储;
[0027]B2、矩阵中每一行向量. . . ;W(Ti);W(Tn))代表一个用户的用户 模型,其中Ti表示第i个与用户Uk相关的资源,w(Ti)表示标签Ti在向量VUk中的权重,
[0028]
[0029] 其中tfdUk)表示标签被用户Uk使用的次数,N表示系统标签总数,NTj表示至 少使用过一次!\标签的用户数。
[0030] 所述的基于用户质量模型的协同过滤标签推荐方法,其中,所述步骤C具体为:获 取当前用户的模型向量,计算当前用户与系统中邻居用户的相似度sim(profu,profv)
[0031]
[0032]其中profu和profv分别为当前用户u和邻居用户v的用户模型向量。
[0033]所述的基于用户质量模型的协同过滤标签推荐方法,其中,所述步骤D具体包括: 计算系统中邻居用户的模型质量Qu(v),
[0034]
[0035]
[0036] 丨lit k· I
[0037] 上述式子中,lu为用户v的第i个标签L·为k1的用户数规范化值,avgUsinUki iNu 为匕的用户平均相似度,为匕的词频,《(1,1^)为1^的特异性值,邻居用户的模型质量为 Νι 该邻居用户的平均标签质量。
[0038] 所述的基于用户质量模型的协同过滤标签推荐方法,其中,所述步骤E中的改进的 协同过滤推荐算法中的最佳推荐结果记为T(u,r),计算公式为:
[0039]
[0040]
[0041] δ(ν,1,t): =lifδ(ν,1,t)EUXLXT,else0〇,
[0042] 上式中Nu为当前用户u的k个最相近的邻居用户,T(u,r)为算法的最佳推荐结果, sim(profu,profv)为当前用户u和邻居用户v之间的相似度,δ(ν,Γ,t)eUXRXT表示用户v 对资源r存在标签定义关系。
[0043] 一种基于用户质量模型的协同过滤标签推荐系统,其中,系统包括:
[0044]标签体系完善模块,用于检测到用户输入信息,获取标签分类信息数据库中的训 练集,提取训练集中所有标签构成现有系统的标签体系,并根据资源和用户在现有系统中 出现的情况对标签体系进行完善;
[0045]用户模型构建模块,用于将系统中用户的信息映射到二维矩阵构建用户模型,并 以用户-标签二维矩阵形式进行存储;
[0046]相似度计算模块,用于获取当前用户的模型向量,计算当前用户与系统中邻居用 户的相似度;
[0047]模型质量计算模块,用于计算系统中邻居用户的模型质量;
[0048]最佳推荐生成模块,用于根据系统中邻居用户的模型质量,根据改进的协同过滤 推荐算法生成最佳推荐;
[0049]结果反馈模块,用于将最佳推荐结果通过WEB服务器返回至用户界面。
[0050]所述的基于用户质量模型的协同过滤标签推荐系统,其中,所述标签体系完善模 块具体包括:
[0051]标签体系构成单元,用于检测到用户输入信息,获取标签分类信息数据库中的训 练集,提取训练集中的所有标签构成现有系统S的标签体系C{tl,t2,. . .,tn};
[0052] 判断单元,用于判断资源Ri和用户Ui在现有系统S中出现的情况;
[0053]第一处理单元,用于若UieSandRies或是UieSandRigS,若
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1