一种兴趣标签的确定方法及装置的制造方法

文档序号:8258804阅读:249来源:国知局
一种兴趣标签的确定方法及装置的制造方法
【技术领域】
[0001] 本申请涉及互联网技术领域,尤其涉及一种兴趣标签的确定方法及装置。
【背景技术】
[0002] 在社交网络平台中,用户通过关注感兴趣的对象来获取感兴趣的内容,通过挖掘 用户的兴趣,可以向用户推荐信息。比如,当发现用户对互联网感兴趣后,可以向其推荐互 联网名人、新闻等;当发现用户对篮球感兴趣后,可以向其推荐篮球鞋的商品广告,实现广 告点对点精准投放,扩大社交媒体的商业价值。
[0003] 现有技术首先生产一份领域关键词库,即由与各领域明显相关的关键词构成的列 表。然后遍历用户相关的全部博文,例如发表、转发、收藏以及赞的博文,并将这些博文中的 出现频率较高的词语作为用户的兴趣标签,与领域关键词库进行匹配。与某领域的关键词 匹配命中的越多,就意味着用户具有对此领域有更高的兴趣,从而可以以此为依据,向用户 推荐相关信息。
[0004] 比如,领域关键词库中存在"NBA"这一领域的关键词,包括NBA的球队、球员、篮球 鞋的品牌等等。如果用户的博文中多次提到球队、球员、球鞋等关键词,那么通过对博文和 关键词库进行匹配,就会命中很多这一领域的关键词,命中的次数越多,就越能体现用户对 于NBA的兴趣,从而可以为其相对精准地推荐关于此类商品的广告信息。
[0005] 在很多博文中,为了表达一种主题,往往会利用很多领域的关键词,比如:用户发 博文为了表达社会经济状况,往往会提到汽车、地产等,现有技术无法分辨出到底用户是对 经济,汽车还是地产感兴趣。
[0006] 所以,由于用户博文信息与博文主题不一致,现有技术会导致不能准确地确定出 用户兴趣标签。

【发明内容】

[0007] 本申请实施例提供一种兴趣标签的确定方法,用于解决由于会出现用户博文信息 中的关键词与博文主题不一致,而导致不能准确地确定出用户兴趣标签的问题。
[0008] 本申请实施例提供一种兴趣标签的确定装置,用于解决由于会出现用户博文信息 中的关键词与博文主题不一致,而导致不能准确地确定出用户兴趣标签的问题。
[0009] 本申请实施例采用下述技术方案:
[0010] -种兴趣标签的确定方法,包括:获取用户关注对象的能力标签,所述能力标签表 示用户关注对象具备的能力;根据用户关注对象的能力标签与相应能力的匹配程度,确定 用户的兴趣标签。
[0011]一种兴趣标签的确定装置,包括:获取标签单元,用于获取用户关注对象的能力标 签,所述能力标签表示用户关注对象具备的能力;确定标签单元,用于根据用户关注对象的 能力标签与相应能力的匹配程度,确定用户的兴趣标签。
[0012] 本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0013] 由于采用了通过获取用户关注对象的能力标签,并根据能力标签,确定用户的兴 趣标签的方法,因此,根据用户的关注行为就能够确定出用户的兴趣,无需根据用户的博文 信息中的关键词来确定用户的兴趣。从而解决了由于会出现用户博文信息中的关键词与博 文主题不一致,而导致不能准确地确定出用户兴趣标签的问题。
【附图说明】
[0014] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0015] 图1为本申请实施例提供的一种兴趣标签的确定方法的具体实现流程示意图;
[0016] 图2为本申请实施例提供的一种兴趣标签的确定装置的具体结构示意图;
[0017] 图3为本申请实施例提供的一种兴趣标签的确定方法的示意图。
【具体实施方式】
[0018] 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019] 以下结合附图,详细说明本申请各实施例提供的技术方案。
[0020] 本申请实施例提供一种兴趣标签的确定方法,用于解决由于会出现用户博文信息 中的关键词与博文主题不一致,而导致不能准确地确定出用户兴趣标签的问题。该方法的 实现流程示意图如图1所示,包括下述步骤:
[0021] 步骤11,获取用户关注对象的能力标签,所述能力标签表示用户关注对象具备的 能力。
[0022] 以微博为例,这里所说的用户关注对象可以包括用户所关注的其他用户。
[0023] 步骤12,根据用户关注对象的能力标签与相应能力的匹配程度,确定用户的兴趣 标签。
[0024] 采用本实施例提供的该方法,由于采用了通过获取用户关注对象的能力标签,并 根据能力标签,确定用户的兴趣标签的方法,从而解决了由于会出现用户博文信息中的关 键词与博文主题不一致,而导致不能准确地确定出用户兴趣标签的问题。采用该方法也可 以解决现有技术中由于领域关键词库不全面,而导致不能全面地确定出用户兴趣标签的问 题;还可以解决由于会出现用户博文信息很少甚至没有的情况,而导致很难确定出用户兴 趣标签的问题。
[0025] 以下分别详细介绍步骤11至步骤13:
[0026] 针对步骤11而言,能力标签是用于表示用户关注对象具备的能力的一种信息。这 里所说的"能力",可以但不限于包括社交能力(如人际交往、礼仪)、行业专业能力(如金工 **级、钢琴**级、象棋**级等反映出的能力)、经济能力(潘石屹、雷军等行业领头人)、学 习能力(奥林匹克数学、托福英语)等等中的一项或多项。
[0027] 可以对用户的某一项能力做数值上的量化来体现该能力的强弱。
[0028]针对步骤12而言,可以有以下三种方式来确定用户的兴趣标签。
[0029] 第一种方式:根据用户关注对象的能力标签对应的权重值,从获取到的能力标签 中选取权重值大于设定的能力阈值的能力标签;根据选取出的权重值大于设定的能力阈值 的能力标签,确定用户的兴趣标签。
[0030] 其中,能力标签对应的权重值,是根据用户关注对象被分配到以该能力标签作为 分组名称的分组的次数确定的。本申请实施例中,假设权重值是根据上述次数按照特定算 法计算得到的。比如,可以直接将用户关注对象被分配到以某能力标签作为分组名称的分 组的次数,确定为该能力标签的权重值。
[0031] 进一步而言,可以过滤掉权重值低于设定的能力阈值的能力标签。这部分能力标 签认为是关注对象较弱的能力,对于确定用户的兴趣标签意义不大。过滤后剩余的能力标 签即可作为用户的兴趣标签。
[0032] 由于用户所关注的关注对象往往具备多种能力,但往往关注对象比较擅长的能力 才是用户最需要的。为了达到突出关注对象比较擅长的能力,从而精准确定出用户的兴趣 标签,可以采用第二种方式确定用户的兴趣标签。
[0033] 第二种方式:针对每一个选取出的权重值大于设定的能力阈值的能力标签,执行: 确定具备该能力标签(也称当前能力标签)的用户关注对象的数目;以及根据当前能力标 签对应的数目,确定当前能力标签是否为用户的兴趣标签。
[0034]比如,可以将大于设定的数目阈值的当前能力标签,确定为用户的兴趣标签。
[003
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1