一种基于用户质量模型的协同过滤标签推荐方法及系统的制作方法

文档序号：9667499阅读：873来源：国知局

一种基于用户质量模型的协同过滤标签推荐方法及系统的制作方法
【技术领域】
[0001] 本发明涉及WEB应用技术领域，尤其涉及一种基于用户质量模型的协同过滤标签推荐方法及系统。
【背景技术】
[0002] 随着网络技术的深入发展，标签已经成为互联网上的一种标准信息组织方式，在自由分类法中得到了广泛的应用，自由分类法是一种用户对信息自由存取的方法，这种方法使得用户能够用自己的语音以"标签"的形式对信息特征进行标注。利用标签对本文、图片、视频以及音频资源进行信息的分类、组织和检索，实现信息的搜索和共享，是互联网信息环境中一种独具特色的信息组织工具。在过去的近几年，用户建立、分享元数据的标签系统已经在internet上得到了探索和应用，例如Flickrtll，Del·icio.us21，Connoteat以及 LibraryThingt等网站都被认为是Web2.0技术应用的实例，因为它们利用网络来收集和整理信息，这类系统提供了 "团体驱动"和"有机"的方法来对网络信息资源分类，便于信息的发现、浏览、以及复用。
[0003] 传统分类系统中的分类词汇往往缺乏流行性和相关性，词汇相对过时，并且专业人士很难通过传统分类词汇搜索获得相关信息和预期结果，且传统分类结构中使用的元数据成本相对高昂，因为元数据的定义和分类需要耗费专业人士大量的时间和精力，而在标签系统中，系统将繁琐的元数据定义任务交给用户来完成，标签定义是用户对资源的团体行为，因此标签系统较之传统的固定层次结构分类系统对用户来说紧密性更强、适应性更好，更符合当前流行趋势。标签分类通过标签使得搜寻的重点得到更好的显示和突出，与一般的关键词不同的是，用关键词进行搜索时，只能搜索到内容里包含关键词的文章，但tag 包含了文中没有的关键词，使用tag来搜索，可以搜索到包含关键词以外词汇的文章，扩大了搜索的宽度和广度。
[0004] 虽然标签在实现信息资源的检索和网页导航时体现出卓越的优势，但标签的使用要求人们必须预先定义标签，然而手工标签的定义过程往往费时繁琐，为了将人们从费时繁琐的标签定义工作中解放出来，使自由分类能得到更广泛应用，标签推荐服务的推出迫在眉睫，该服务实现的是给用户推荐一些潜在的可能为用户所感兴趣的标签，让用户从中选择，从而使标签定义更为方便快捷。
[0005] 标签推荐是一个伴随着网络技术推广应用而出现的新兴领域，但从整体上看存在以下问题：
[0006] 1.标签陈旧问题。所推荐的标签来源于固定的标签体系，随着时间的推移，数据量的不断增大，必需增加一些原有标签体系中所缺乏的，而又适用于新资源的标签，但固定的标签体系并不能随着时间的推移而演进，势必会造成推荐质量的下降。
[0007] 2.冷启动问题。用户、标签、资源是标签推荐系统的三大要素，推荐时应充分考虑这三大要素在系统中的出现情况，但现有标签推荐系统大都只从现有的用户模型和资源模型来提取信息，却忽略了系统在面对一个新用户、新资源时应该必须解决的数据挖掘问题。
[0008] 3.标签源的单一性。资源内容、用户历史标签(也称为用户兴趣标签）、资源历史标签是标签推荐的三种最主要的标签来源，而且每种标签源都有自身的优缺点，现有的标签推荐系统大都只专注于其中的某一种，没有把多种标签源结合起来。
[0009] 因此，现有技术还有待于改进和发展。

【发明内容】

[0010] 鉴于现有技术的不足，本发明目的在于提供一种基于用户质量模型的协同过滤标签推荐方法及系统，旨在解决现有技术中基于协同过滤推荐算法以及现有的大多数标签推荐算法都存在着标签空间陈旧、冷启动以及标签源过于单一等问题。
[0011] 本发明的技术方案如下：
[0012] -种基于用户质量模型的协同过滤标签推荐方法，其中，方法包括：
[0013] A、检测到用户输入信息，获取标签分类信息数据库中的训练集，提取训练集中所有标签构成现有系统的标签体系，并根据资源和用户在现有系统中出现的情况对标签体系进tx完善；
[0014] B、将系统中用户的信息映射到二维矩阵构建用户模型，并以用户-标签二维矩阵形式进行存储；
[0015] C、获取当前用户的模型向量，计算当前用户与系统中邻居用户的相似度；
[0016] D、计算系统中邻居用户的模型质量；
[0017] E、根据系统中邻居用户的模型质量，根据改进的协同过滤推荐算法产生最佳推荐；
[0018] F、将最佳推荐结果通过WEB服务器返回至用户界面。
[0019] 所述的基于用户质量模型的协同过滤标签推荐方法，其中，所述步骤A具体包括：
[0020] A1、检测到用户输入信息，获取标签分类信息数据库中的训练集，提取训练集中的所有标签构成现有系统S的标签体系C{tl，t2,. . .，tn};
[0021 ] A2、判断资源Ri和用户Ui在现有系统S中出现的情况；
[0022] A3、若UieSandRi铉S或是ESandRi运S，若资源没有在现有系统中出现过，则提取资源心中的前X个权重最高的资源标题关键字加入系统标签体系C中；
[0023] A4、若％gSandRiES，即资源在系统中出现过，用户没有出现过，则提取资源Ri中的Y个使用频率最高的标签和X个权重最高的资源标题关键字加入系统标签体系C中；
[0024] andR^S，即用户和资源都在系统中出现过，采用历史标签信息。
[0025] 所述的基于用户质量模型的协同过滤标签推荐方法，其中，所述步骤B具体包括：
[0026] B1、将系统中K个用户的信息映射到二维矩阵构建用户模型，并映射结果以用户_ 标签特征矩阵进行存储；
[0027]B2、矩阵中每一行向量. . . ;W(Ti);W(Tn))代表一个用户的用户模型，其中Ti表示第i个与用户Uk相关的资源，w(Ti)表示标签Ti在向量VUk中的权重，
[0028]
[0029] 其中tfdUk)表示标签被用户Uk使用的次数，N表示系统标签总数，NTj表示至少使用过一次!\标签的用户数。
[0030] 所述的基于用户质量模型的协同过滤标签推荐方法，其中，所述步骤C具体为:获取当前用户的模型向量，计算当前用户与系统中邻居用户的相似度sim(profu，profv)
[0031]
[0032]其中profu和profv分别为当前用户u和邻居用户v的用户模型向量。
[0033]所述的基于用户质量模型的协同过滤标签推荐方法，其中，所述步骤D具体包括：计算系统中邻居用户的模型质量Qu(v)，
[0034]
[0035]
[0036] 丨lit k· I
[0037] 上述式子中，lu为用户v的第i个标签L·为k1的用户数规范化值，avgUsinUki iNu 为匕的用户平均相似度，为匕的词频，《(1，1^)为1^的特异性值，邻居用户的模型质量为 Νι 该邻居用户的平均标签质量。
[0038] 所述的基于用户质量模型的协同过滤标签推荐方法，其中，所述步骤E中的改进的协同过滤推荐算法中的最佳推荐结果记为T(u，r)，计算公式为：
[0039]
[0040]
[0041] δ(ν，1，t): =lifδ(ν，1，t)EUXLXT，else0〇，
[0042] 上式中Nu为当前用户u的k个最相近的邻居用户，T(u，r)为算法的最佳推荐结果， sim(profu，profv)为当前用户u和邻居用户v之间的相似度，δ(ν，Γ，t)eUXRXT表示用户v 对资源r存在标签定义关系。
[0043] 一种基于用户质量模型的协同过滤标签推荐系统，其中，系统包括：
[0044]标签体系完善模块，用于检测到用户输入信息，获取标签分类信息数据库中的训练集，提取训练集中所有标签构成现有系统的标签体系，并根据资源和用户在现有系统中出现的情况对标签体系进行完善；
[0045]用户模型构建模块，用于将系统中用户的信息映射到二维矩阵构建用户模型，并以用户-标签二维矩阵形式进行存储；
[0046]相似度计算模块，用于获取当前用户的模型向量，计算当前用户与系统中邻居用户的相似度；
[0047]模型质量计算模块，用于计算系统中邻居用户的模型质量；
[0048]最佳推荐生成模块，用于根据系统中邻居用户的模型质量，根据改进的协同过滤推荐算法生成最佳推荐；
[0049]结果反馈模块，用于将最佳推荐结果通过WEB服务器返回至用户界面。
[0050]所述的基于用户质量模型的协同过滤标签推荐系统，其中，所述标签体系完善模块具体包括：
[0051]标签体系构成单元，用于检测到用户输入信息，获取标签分类信息数据库中的训练集，提取训练集中的所有标签构成现有系统S的标签体系C{tl，t2,. . .，tn};
[0052] 判断单元，用于判断资源Ri和用户Ui在现有系统S中出现的情况；
[0053]第一处理单元，用于若UieSandRies或是UieSandRigS，若

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冯研;
技术所有人：TCL集团股份有限公司;
我是此专利的发明人

上一篇：文言文搜索方法和装置的制造方法
上一篇：一种读取网页资源的方法、装置及电子设备的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。