一种基于用户质量模型的协同过滤标签推荐方法及系统的制作方法_3

文档序号:9667499阅读:来源:国知局
C{tl,t2,...,tn}是完备的,若当测试集中的所有标签中有些标签不在当 如的标签体系中,则判定当如的标签体系C{tl,t2,. . .,tn}是不完备的,要将进一步的对现 有的标签体系进行完善。具体地,完善标签体系可重新选取训练集,或是将测试集中未出现 的标签加入标签体系中。
[0098] 具体实施时,所述步骤S100具体包括:
[0099]步骤S101、检测到用户输入信息,获取标签分类信息数据库中的训练集,提取训练 集中的所有标签构成现有系统S的标签体系C{tl,t2,. . .,tn};
[0100 ]步骤S102、判断资源Ri和用户Ui在现有系统S中出现的情况;
[0101]步骤S103、若UieSand氏gS或是UieSandRigS,若资源没有在现有系 统中出现过,则提取资源心中的前X个权重最高的资源标题关键字加入系统标签体系C中;
[0102] 步骤S104、若UjgSandRjeS,即资源在系统中出现过,用户没有出现过,则 提取资源心中的Y个使用频率最高的标签和X个权重最高的资源标题关键字加入系统标签 体系C中;
[0103] 步骤S105、若UiESandRiES,即用户和资源都在系统中出现过,采用历史标签信 息。
[0104] 具体实施时,分析资源Ri和用户仏在现有系统S中出现的情况,用户仏和资源心可 以出现以下4种情形:
[0105] ⑴队eSandRi: (65完全为冷启动情形,新用户,新资源;
[0106] (2)UieSand& €S用户在系统中出现过,资源没有出现过;
[0107] (3) 4铉Sand&eS资源在系统中出现过,用户没有出现过;
[0108] (4)UiESandRiES用户和资源都在系统中出现过。
[0109] 针对不同情形的标签完善措施如下:
[0110] 当出现情形(1)与情形(2)时,提取资源心中的前X个权重最高的资源标题关键字 {keyl,key2,key3}加入系统标签体系C中,S卩C-{keyl,key2,key3};
[0111] 当出现情形(3)时,提取资源h中的Y个最流行标签和X个权重最高的资源标题关 键字加入系统标签体系C中;
[0112] 当出现情形(4)时,采用历史标签信息。
[0113] 具体实施时,X可预先设置,优先为3个,Υ的值也可预先设置,优先为2个。
[0114] 步骤S200、将系统中用户的信息映射到二维矩阵构建用户模型,并以用户-标签二 维矩阵形式进行存储。
[0115] 具体实施时,用户模型通过将系统中k个用户的信息映射到二维矩阵来构建,映射 结果将到一个用户一标签特征矩阵QT所示,矩阵中的每一行向量VUk=(w(Ti) ;w(T2) ;···;w (ΤΚ?η))代表一个用户的用户模型,其中表示第i个与用户Uk相关的资源,《(TO表示标 签Ti在向量VUk中的权重。
[0116] 所述步骤S200具体包括:
[0117] 步骤S201、将系统中K个用户的信息映射到二维矩阵构建用户模型,并映射结果以 用户-标签特征矩阵进行存储;
[0118] 步骤S202、矩阵中每一行向量VUk= ;'";W(Ti);W(Tn))代表一个用户 的用户模型,其中Ti表示第i个与用户Uk相关的资源,w(Ti)表示标签Ti在向量VUk中的权重,
[0119]
[0120] 其中tfdUk)表示标签被用户Uk使用的次数,N表示系统标签总数,NTi表示至 少使用过一次!\标签的用户数。
[0121] 步骤S300、获取当前用户的模型向量,计算当前用户与系统中邻居用户的相似度。
[0122] 具体实施时,邻居用户是指与当前用户的相关度较高的用户,比如同在一个地区 的用户。标签推荐系统中的用户模型是以用户-标签二维矩阵的形式存储的,当前用户与系 统中其他用户的相似度可以通过计算它们在矩阵中对应的用户模型向量余弦相似值获得。 具体地获取当前用户的模型向量,计算当前用户与系统中邻居用户的相似度sim(pr〇fu, profv),
[0123]
[0124] 其中profu和profv分别为当前用户u和邻居用户v的用户模型向量。
[0125]步骤S400、计算系统中邻居用户的模型质量。
[0126]具体实施时,由用户模型质量理论得知,用户模型质量受用户使用频度、用户群相 似度、标签表征频度、以及标签特异性的影响。计算系统中邻居用户的模型质量Qu(v),
[0130]上述式子中,ki为用户v的第i个标签,1^为ki的用户数规范化值,avgUsim,i,ki
[0127]
[0128] y)
[0129] 为匕的用户平均相似度,^为匕的词频,《(1,匕)为匕的特异性值,邻居用户的模型质量为 该邻居用户的平均标签质量。
[0131]步骤S500、根据系统中邻居用户的模型质量,根据改进的协同过滤推荐算法产生 最佳推荐。
[0132]具体实施时,在标签推荐系统中,对于当前用户来说,作为推荐者的邻居用户,他 的用户模型质量的高低对推荐效果有重要影响,因此将协同过滤标签推荐算法进行改进, 改进的协同过滤推荐算法中的最佳推荐结果记为T(u,r),计算公式为:
[0133]
[0134]
[0135] δ(ν,1,t): =lifδ(ν,1,t)EUXLXT,else0〇,
[0136]上式中Nu为当前用户u的k个最相近的邻居用户,T(u,r)为算法的最佳推荐结果, sim(profu,profv)为当前用户u和邻居用户v之间的相似度,δ(ν,Γ,t)eUXRXT表示用户v 对资源r存在标签定义关系。
[0137] 步骤S600、将最佳推荐结果通过WEB服务器返回至用户界面。
[0138]具体实施时,将最佳推荐结果通过WEB服务器,返回到用户界面。用户可使用不同 的界面,若用户使用的是电视界面,则返回至用户电视界面。
[0139]本发明还提供了一种基于用户质量模型的协同过滤标签推荐方法的具体应用实 施例的流程图,以用户电视界面为例进行介绍,如图2所示,方法包括:
[0140]具体地,所述电视与WEB服务器连接,所述WEB服务器还与所述数据库连接。所述数 据库中包括存储有用户历史信息的用户信息库,存储资源信息的资源信息库,存储有标签 信息的标签信息库。
[0141]用户通过电视的用户电视界面观看电视时,并将用户观看信息发送至WEB服务器, WEB服务器对观看信息进行数据预处理,并从用户信息库获取用户历史信息,根据用户历史 信息生成当前用户质量模型,根据当前用户质量模型及资源信息库的资源信息和标签信息 库的标签信息生成核心推荐模型,根据核心推荐模型生成推荐结果,并将推荐结果发送至 WEB服务器,WEB服务器通过推荐页面将推荐结果返回至用户电视界面供用户查看。
[0142]本发明还提供了一种基于用户质量模型的协同过滤标签推荐系统的功能原理框 图,如图3所示,其中,方法包括:
[0143]标签体系完善模块100,用于检测到用户输入信息,获取标签分类信息数据库中的 训练集,提取训练集中所有标签构成现有系统的标签体系,并根据资源和用户在现有系统 中出现的情况对标签体系进行完善;具体如上所述。
[0144]用户模型构建模块200,用于将系统中用户的信息映射到二维矩阵构建用户模型, 并以用户-标签二维矩阵形式进行存储;具体如上所述。
[0145]相似度计算模块300,用于获取当前用户的模型向量,计算当前用户与系统中邻居 用户的相似度;具体如上所述。
[0146]模型质量计算模块400,用于计算系统中邻居用户的模型质量;具体如上所述。
[0147]最佳推荐生成模块500,用于根据系统中邻居用户的模型质量,根据改进的协同过 滤推荐算法生成最佳推荐;具体如上所述。
[0148]结果反馈模块600,用于将最佳推荐结果通过WEB服务器返回至用户界面;具体如 上所述。
[0149]所述的基于用户质量模型的协同过滤标签推荐系统,其中,所述标签体系完善模 块具体包括:
[0150]标签体系构成单元,用于检测到用户输入信息,获取标签分类信息数据库中的训 练集,提取训练集中的所有标签构成现有系统S的标签体系C{tl,t2,. . .,tn};
[0151]判断单元,用于判断资源心和用户m在现有系统S中出现的情况;具体如上所述。
[0152]第一处理单元,用于若UieSandRi在S或是UieSandRi这S,若资源没有 在现有系统中出现过,则提取资源心中的前X个权重最高的资源标题关键字加入系统标签 体系C中;具体如上所述。
[0153]第二处理单元,用于若A在Sand&e S,即资源在系统中出现过,用户没有出 现过,则提取资源心中的Y个使用频率最高的标签和X个权重最高的资源标题关键字加入系 统标签体系C中;具体如上所述。
[0154] 第三处理单元,用于andRieS,即用户和资源都在系统中出现过,采用历 史标签信息;具体如上所述。
[0
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1