一种网页资源推荐方法及装置的制作方法

文档序号:6580809阅读:168来源:国知局
专利名称:一种网页资源推荐方法及装置的制作方法
技术领域
本发明涉及计算机领域,尤其涉及一种网页资源推荐方法及装置。
背景技术
随着web2.0的发展,越来越多的网站推出了用户自定义标签的功能,方便用户对 网页资源(比如音乐、电影、图书等)进行标记。用户在这种类型的网站中浏览网页时,如 果遇到自己感兴趣的网页资源,可以定义自己的标签,用自己认为比较贴切网络资源的词 语对网页资源进行个性化描述。目前,这种带有标签的网络资源已经非常丰富,而且基本可 以反映出用户的爱好与倾向。如何充分利用这些标签为用户进行网页资源的推荐,以提高 网页推荐的准确性已经成为一个亟待解决的问题。请参阅图1,图1为现有的一种网络资源推荐方法的流程图。该方法采用了用户的 历史购买记录来对用户进行网页资源推荐。具体包括以下步骤Al、根据用户的购买记录和产品形成用户项目(user-item)矩阵;A2、根据user-item矩阵,计算与当前用户最接近的用户,形成当前用户的邻居;A3、对当前用户进行网页资源推荐时,根据当前用户的邻居的购买记录生成推荐 表,对当前用户进行网页资源推荐。A4、判断是否更新推荐列表,若是,则返回步骤A2 ;反之,执行步骤A5 ;A5、将该推荐列表作为最终的推荐列表。在上述的方法中,利用用户的购买记录进行网页资源推荐,无法达到准确的、及时 的推荐效果。

发明内容
本发明实施例提供了一种网页资源推荐方法及装置,基于标签的应用可以为用户 准确、及时地推荐网页资源。为了解决上述技术问题,本发明实施例提供如下技术方案本发明实施例提供了一种网页资源推荐方法,包括获取用户标记网页资源的总次数,以及用户将网页资源标记为各标签的次数;计算所述将网页资源标记为某标签的次数与所述总次数的比值,当所述某标签对 应的比值大于预设阈值时,标记所述用户为所述某标签的近距离用户,反之标记为所述某 标签的远距离用户;针对所述某标签的近距离用户和远距离用户,得到相应的推荐列表;根据所述相应的推荐列表,向用户输出网页资源。本发明实施例提供了一种网页资源推荐装置,包括获取单元,用于获取用户标记网页资源的总次数,以及用户将网页资源标记为各 标签的次数;识别单元,用于计算所述获取单元获取的所述将网页资源标记为某标签的次数与所述总次数的比值,当所述比值大于预设阈值时,标记所述用户为所述某标签的近距离用 户,反之标记为所述某标签的远距离用户;列表单元,用于针对所述识别单元判断出的某标签的近距离用户和远距离用户, 得到相应的推荐列表;推荐单元,用于根据所述列表单元得到的相应的推荐列表,向用户输出网页资源。与现有的技术相比,本发明实施例通过计算用户将网页资源标记为某标签的次数 与标记网页资源的总次数的比值,在该比值大于预设阈值时,标记该用户为该标签的近距 离用户,反之标记为该标签的远距离用户,然后针对用户所属种类的不同,推荐不同的网页 资源,使得网页资源的推荐更为精确及时,有利于用户快速便捷地找到自己感兴趣的网页 资源。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获 得其他的附图。图1为现有的一种网络资源推荐方法的流程图;图2为用户、网页资源、标签之间的对应关系图;图3为本发明实施例一提供的一种网页资源推荐方法的流程图;图4为本发明实施例二提供的一种网页资源推荐方法的流程图;图5为本发明实施例三提供的一种网页资源推荐方法的流程图;图6为本发明实施例四提供的一种网页资源推荐方法的流程图;图7为本发明实施例五提供的一种网页资源推荐方法的流程图;图8为本发明实施例六提供的一种网页资源推荐装置的结构图;图9为本发明实施例六提供的另一种网页资源推荐装置的结构图;图10为本发明实施例六提供的第一种列表单元的结构图;图11为本发明实施例六提供的第二种列表单元的结构图;图12为本发明实施例六提供的第三种列表单元的结构图;图13为本发明实施例六提供的第四种列表单元的结构图;图14为本发明实施例六提供的第五种列表单元的结构图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。本发明实施例所述的网页资源,应该认为包括网页上的文本作品、图像作品、音频 作品、视频作品或者是网页上其他具有广泛流传性的资源中的任意一类或者任意多类等, 不应将网页资源认为是某一类具体作品。
用户对网页资源标记的标签可能会有作者、风格、地区、性别、特质、关键词等属 性,例如,对于台湾女歌手王若琳的歌曲《Mart From Here》来说,用户可能会标记出王若 琳、爵士、台湾、女声、慵懒、纯净、Start、Here等标签。用户、网页资源、标签之间的对应关系可如图2所示,其中,用U表示用户,T表示 标签,M表示网页资源;用户可以将一个网页资源标记出多个标签,也可以将多个网页资源 标记成一个标签,不同用户可能对同一个网页资源标记出不同的标签。用户对网页资源进行标记的行为,可以看成是用户对特征相同的乐曲进行归类的 过程。因此,根据用户已标记的标签量,将用户归类,计算用户对各类型网页资源的倾向性, 从而根据用户的喜好来推荐用户可能会感兴趣的网页资源,则会取得比一般推荐要好的效果。以下则结合实施例详细说明本发明,请参见图3,图3为本发明实施例一提供的一 种网页资源推荐方法的流程图。如图3所示,该方法可以包括步骤101 获取用户标记网页资源的总次数,以及用户将网页资源标记为各标签的次数。例如,用户Ul对网页资源——歌曲总共标记了 200次标签,其中,标记为“纯净”标 签的次数为138次,标记为“轻音乐”标签的次数为98次,标记为“原创”标签的次数为47次等。102 计算将网页资源标记为某标签的次数与总次数的比值,当某标签对应的比值 大于预设阈值时,标记用户为某标签的近距离用户,反之标记为某标签的远距离用户。例如,用户Ul将歌曲标记为“纯净”标签的比值为138/200 = 0. 69,将歌曲标记 为“轻音乐”标签的比值为98/200 = 0. 49,将歌曲标记为“原创”标签的比值为47/200 = 0. 235ο在预设阈值为0. 5时,只有0. 69为大于0. 5,则标记用户Ul为“纯净”标签的近距 离用户;且标记用户Ul为“轻音乐”标签和“原创”标签的远距离用户。若有多个比值大于预设阈值时,则将用户标记为多个标签的近距离用户。103 针对某标签的近距离用户和远距离用户,得到相应的推荐列表。104 根据相应的推荐列表,向用户输出网页资源。针对某标签的近距离用户,可根据该标签的近距离用户群的热门推荐列表,向用 户推荐网页资源;或者,根据该标签的近距离用户群的新网页资源列表,向用户推荐网页资 源。新网页资源是推出时间较近的,或者是最后更新时间较近的网页资源。针对某标签的远距离用户,可以根据该远距离用户与某近距离用户群的倾向性算 出的近距离用户群的热门推荐列表,向远距离用户推荐网页资源;或者,根据该远距离用户 与某几个近距离用户的倾向性算出的近距离用户的热门推荐列表,向远距离用户推荐网页 资源。本发明实施例通过计算用户将网页资源标记为某标签的次数与标记网页资源的 总次数的比值,在该比值大于预设阈值时,标记该用户为该标签的近距离用户,反之标记为 该标签的远距离用户,然后针对用户所属种类的不同,推荐不同的网页资源,使得网页资源 的推荐更为精确及时,有利于用户快速便捷地找到自己感兴趣的资源。以下再通过几个具体的实施例来详细说明本发明技术方案。
实施例二和实施例三详细说明向某标签的近距离用户进行网页资源推荐的方法, 实施例四和实施例五则详细说明向某标签的远距离用户进行网页资源推荐的方法。实施例二详细说明向某标签的近距离用户推荐所属近距离用户群中热门程度高 的网页资源的方法。请参见图4,图4为本发明实施例二提供的一种网页资源推荐方法的流程图。如图 4所示,该方法可以包括步骤201 识别出某标签的近距离用户。识别的方法可采用实施例一的方法,本发明实施例在此不再赘述。202 将某标签的至少两个近距离用户归入某标签的一个近距离用户群。近距离用户群为标记某标签超过总标签一定比值的用户的集合;近距离用户群中 用户在选择网页资源时,应该具有类似的特质。203:计算某标签对应的网页资源在所述近距离用户群的热门值hot”计算公式 为=^^7 ,其中,Pi代表标记网页资源i的总人数,、代表网页资源i的标签个数,Σ ρ代表近距离用户群的总人数,Σ t代表近距离用户群所标记的标签总数。热门值ho、代表了在该近距离用户群中的用户对该网页资源的认同程度,热门值 ho、越高,说明该网页资源的在该近距离用户群中受欢迎的程度越高,则被该近距离用户 群中的某个用户的接受的程度也就越高,推荐的价值也就越大。例如,对于歌手张靓颖的歌曲《我们在一起》,有100个近距离用户对其进行了标 注,这100个近距离用户共标记了 1000个标签,而“张靓颖”标签对应的近距离用户群的歌 曲的标签总数是1500个,该近距离用户群共有200个近距离用户,则对于《我们在一起》的 热门值计算如下紐=10_0:0.33 ‘200x1500而歌手张靓颖的另一首歌曲《你走以后》,有90个近距离用户对其进行了标注,这90个近距离用户共标记了 1200个标签,则对于《你走以后》的热门值计算如下Γ , 90x1200
权利要求
1.一种网页资源推荐方法,其特征在于,包括获取用户标记网页资源的总次数,以及用户将网页资源标记为各标签的次数; 计算所述将网页资源标记为某标签的次数与所述总次数的比值,当所述某标签对应的 比值大于预设阈值时,标记所述用户为所述某标签的近距离用户,反之标记为所述某标签 的远距离用户;针对所述某标签的近距离用户和远距离用户,得到相应的推荐列表; 根据所述相应的推荐列表,向用户输出网页资源。
2.根据权利要求1所述的网页资源推荐方法,其特征在于,所述针对某标签的近距离 用户和远距离用户,得到相应的推荐列表具体包括将某标签的至少两个近距离用户归入某标签的一个近距离用户群;计算所述某标签对应的网页资源在所述近距离用户群的热门值hot”计算公式为A饵,其中,Pi代表标记网页资源1的总人数,t^代表网页资源i的标签个数,Σ ρ代表近距离用户群的总人数,Σ t代表近距离用户群所标记的标签总数;按照所述热门值从高到低的顺序,将该标签对应的网页资源排序,得到热门推荐列表;则所述根据所述相应的推荐列表,向用户输出网页资源具体包括 根据所述热门推荐列表,向所述近距离用户输出网页资源。
3.根据权利要求1所述的网页资源推荐方法,其特征在于,所述针对某标签的近距离 用户和远距离用户,得到相应的推荐列表具体包括计算所述近距离用户与某近距离用户群的群倾向性
4.根据权利要求1所述的网页资源推荐方法,其特征在于,所述针对某标签的近距离 用户和远距离用户,得到相应的推荐列表具体包括获取被标记为某标签的网页资源列表;按照网页资源的上传时间或者最后更新时间,将所述网页资源列表降序排列,得到新 网页资源列表;则所述根据所述相应的推荐列表,向用户输出网页资源具体包括 根据排序后的所述某标签的新网页资源列表,向所述近距离用户输出排序靠前的网页 资源。
5.根据权利要求4所述的网页资源推荐方法,其特征在于,将所述网页资源列表按照 网页资源的上传时间或者最后更新时间降序排序具体包括按照网页资源的上传时间或者最后更新时间降序,将所述网页资源列表排列后,根据 网页资源的标记数量再次升序排列;或者,根据网页资源的标记数量,将所述网页资源列表升序排列后,按照网页资源的上 传时间或者最后更新时间再次降序排列。
6.根据权利要求1所述的网页资源推荐方法,其特征在于,所述针对近距离用户和远 距离用户,得到相应的推荐列表具体包括将某标签的至少两个近距离用户归入某标签的一个近距离用户群;计算远距离用户对 所述近距离用户群的群倾向性sim(u,g),计算公式为
7.根据权利要求1所述的网页资源推荐方法,其特征在于,所述针对近距离用户和远 距离用户,得到相应的推荐列表具体包括分别计算所述远距离用户与某标签的至少一个所述近距离用户在网页资源上的相似 度Simi (U1, un),计算公式为
8.根据权利要求1所述的推荐方法,其特征在于,在得到相应的推荐列表之后,还包括将所述相应的推荐列表进行融合;融合公式为fialist (ρ) = QL1 (ρ) + β 2(ρ)+…… + λ Ln (ρ),其中α,β, λ是参数,用来动态调整各部分推荐列表Ln的权重,取值范围为0 至1,Ln(P)为网页资源在各推荐列表中的排序序号;所述根据所述相应的推荐列表,向用户输出网页资源包括 根据融合后的推荐列表,向用户输出网页资源。
9.一种网页资源推荐装置,其特征在于,包括获取单元,用于获取用户标记网页资源的总次数,以及用户将网页资源标记为各标签 的次数;识别单元,用于计算所述获取单元获取的所述将网页资源标记为某标签的次数与所述 总次数的比值,当所述比值大于预设阈值时,标记所述用户为所述某标签的近距离用户,反 之标记为所述某标签的远距离用户;列表单元,用于针对所述识别单元判断出的某标签的近距离用户和远距离用户,得到 相应的推荐列表;推荐单元,用于根据所述列表单元得到的相应的推荐列表,向用户输出网页资源。
10.根据权利要求9所述的网页资源推荐装置,其特征在于,所述列表单元具体包括 第一用户群子单元,用于将所述识别单元识别出的某标签的至少两个近距离用户归入某标签的一个近距离用户群;第一热门值计算子单元,用于计算某标签对应的网页资源在所述近距离用户群的热门 值hot”计算公式为
11.根据权利要求9所述的网页资源推荐装置,其特征在于,所述列表单元具体包括 第二热门值计算子单元,用于计算某标签对应的网页资源在近距离用户群的热门值ho、,计算公式为
12.根据权利要求9所述的网页资源推荐装置,其特征在于,所述列表单元具体包括 第三获取网页资源列表子单元,用于获取被标记为某标签的网页资源列表;第三排序子单元,用于按照网页资源的上传时间或者最后更新时间,将所述第三获取 网页资源列表子单元获取的网页资源列表降序排列,得到新网页资源列表;所述推荐单元,具体用于根据排序后的所述某标签的新网页资源列表,向所述近距离 用户输出排序靠前的网页资源。
13.根据权利要求12所述的网页资源推荐装置,其特征在于,所述第三排序子单元,具体用于按照网页资源的上传时间或者最后更新时间,将所 述网页资源列表降序排列后,根据网页资源的标记数量再次升序排列,得到新网页资源列 表;或者,具体用于根据网页资源的标记数量,将所述网页资源列表升序排列后,按照网页 资源的上传时间或者最后更新时间再次降序排列,得到新网页资源列表。
14.根据权利要求9所述的网页资源推荐装置,其特征在于,所述列表单元具体包括 第四用户群子单元,用于将所述识别单元识别出的某标签的至少两个近距离用户归入某标签的一个近距离用户群;第四群倾向性计算子单元,用于计算远距离用户对所述近距离用户群的群倾向性 sim (u,g),计算公式为
15.根据权利要求9所述的网页资源推荐装置,其特征在于,所述列表单元具体包括 第五相似度计算子单元,用于计算所述远距离用户与某标签的至少一个所述近距离用户在网页资源上的相似度Simi (U1, un),计算公式为
16.根据权利要求9所述的网页资源推荐装置,其特征在于,还包括融合单元,用于将列表单元得到的各相应的推荐列表进行融合,融合公式为 finalist (ρ) = α L1 (ρ)+ β L2 (ρ)+……+ XLn(ρ),其中α,β,λ是参数,用来动态调整各部 分推荐列表Ln的权重,取值范围为O至1,Ln(P)为网页资源在各推荐列表中的排序序号; 所述推荐单元,具体用于根据所述融合单元融合后的推荐列表,向用户输出网页资源。
全文摘要
本发明实施例涉及计算机领域,公开了一种网页资源推荐方法及装置,该方法为计算出用户将网页资源标记为各标签的次数与用户标记网页资源的总次数的比值,在某标签对应的比值大于预设阈值时,标记用户为某标签的近距离用户,反之标记为某标签的远距离用户;针对近距离用户和远距离用户相应的推荐列表,向用户输出网页资源。本发明实施例可以针对用户所属种类的不同,推荐不同的网页资源,使得网页资源的推荐更为精确及时有效,有利于用户快速便捷地找到自己感兴趣的网页资源。
文档编号G06F17/30GK102043781SQ20091017799
公开日2011年5月4日 申请日期2009年10月23日 优先权日2009年10月23日
发明者崔宝今, 常富洋, 杨志豪, 林鸿飞, 汪芳山 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1