一种用户兴趣对象验证方法及装置的制造方法

文档序号:8285338阅读:131来源:国知局
一种用户兴趣对象验证方法及装置的制造方法
【技术领域】
[0001] 本申请涉及互联网技术领域,尤其涉及一种用户兴趣对象验证方法及装置。
【背景技术】
[0002] 微博是一个基于用户关系的信息分享、传播以及获取平台,是基于web2.0平台兴 起的开放互联网社交服务。在微博平台中,用户行为能够体现用户在微博等社交网络上的 兴趣。然而在用户兴趣的挖掘中,结果的准确性成为了重要的问题,兴趣是非常主观的概 念,不同于计算结果的对错,在数据挖掘的计算过程中,不是简单的是非对错之差,而是不 断地提高挖掘结果准确程度,所以对于挖掘出的结果需要进行验证来判断准确程度。
[0003] 现有技术中验证用户兴趣主要有以下两种方法:
[0004] 第一种方法,A/B测试,即在该线上产品的一部分部署中引入推测的兴趣对象,另 一部分部署保持不变。通过一段时间的运行,对线上产品两部分部署的活跃度等参数进行 对比,验证引入推测的兴趣对象是否有效地改善了相关参数。比如,挖掘到10个用户对NBA 感兴趣,将NBA这一类目的新闻,广告,文章等兴趣信息不断推荐给5个用户,另外5个用户 不推送类似兴趣信息,观察一段时间这两部分用户的在线时长,活跃度等参数有没有改善, 如果在线时长延长,活跃度提升则证明挖掘结果较准确。
[0005] 第二种,先选定一批样本用户,将挖掘出的样本用户的推测的兴趣对象分发给每 个相应的用户;然后让用户将对自己的挖掘结果进行判定;最后,将样本用户的判定结果 进行统计,从而对整个样本用户集的挖掘效果进行验证。比如,找到10个样本用户,分别挖 掘每位用户的兴趣,将挖掘出的每位用户感兴趣的信息分别推荐给每个用户,然后让每位 用户对挖掘结果做判定,将判定结果进行统计,从而验证了挖掘结果的准确性。
[0006] 第一种方法由于需要在线上部署信息,所以对线上产品的影响较大,还需要一段 时间的验证。第二种方法对于用户的覆盖面较低,而且需要针对每个人进行操作,验证的代 价较高。总之,现有技术对于用户兴趣的验证效率较低。

【发明内容】

[0007] 本申请实施例提供一种用户兴趣对象验证方法,用于解决现有技术对于用户兴趣 的验证效率较低的问题。
[0008] 本申请实施例提供一种用户兴趣对象验证装置,用于解决现有技术对于用户兴趣 的验证效率较低的问题。
[0009] 本申请实施例采用下述技术方案:
[0010] 一种用户兴趣对象验证方法,包括:获取用户兴趣信息;其中,所述用户兴趣信息 用于表示当前用户感兴趣的对象;根据用户兴趣信息构建兴趣标签集;验证推测的兴趣对 象信息与兴趣标签集是否匹配;并在验证结果为匹配时,确定所述推测的兴趣对象信息属 于当前用户感兴趣的对象。
[0011] 一种用户兴趣对象验证装置,包括:获取信息单元,用于获取用户兴趣信息;其 中,所述用户兴趣信息用于表示当前用户感兴趣的对象;构建信息单元,用于根据用户兴趣 信息构建兴趣标签集;验证信息单元,用于验证推测的兴趣对象信息与兴趣标签集是否匹 配;并在验证结果为匹配时,确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。
[0012] 本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0013] 由于采用了先根据用户兴趣信息构建兴趣标签集,再验证推测的兴趣对象信息与 兴趣标签集是否匹配,并在验证结果为匹配时,确定推测的兴趣对象信息属于当前用户感 兴趣的对象,可以实时地构建每位用户的兴趣标签集,对挖掘出的结果通过对兴趣标签集 进行匹配来验证。相对于现有技术而言,较少影响线上产品,缩短了验证时间,覆盖面更广 阔,验证的代价较低。总之,有效地提升了用户兴趣的验证效率。
【附图说明】
[0014] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0015] 图1为本申请实施例提供的一种用户兴趣对象验证方法的具体实现流程示意图;
[0016] 图2为本申请实施例提供的一种用户兴趣对象验证装置的具体结构示意图;
[0017] 图3为本申请实施例提供的一种用户兴趣对象验证方法的示意图。
【具体实施方式】
[0018] 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019] 以下结合附图,详细说明本申请各实施例提供的技术方案。
[0020] 本申请实施例提供一种用户兴趣对象验证方法,用于解决现有技术对于用户兴趣 的验证效率较低的问题。该方法的实现流程示意图如图1所示,包括下述步骤:
[0021] 步骤11,获取用户兴趣信息;其中,用户兴趣信息用于表示当前用户感兴趣的对 象。
[0022] 步骤12,根据用户兴趣彳目息构建兴趣标签集。
[0023] 步骤13,验证推测的兴趣对象信息与兴趣标签集是否匹配。
[0024] 步骤14,在验证结果为匹配时,确定所述推测的兴趣对象信息属于当前用户感兴 趣的对象。
[0025] 采用实施例提供的该方法,由于采用了先根据用户兴趣信息构建兴趣标签集,再 验证推测的兴趣对象信息与兴趣标签集是否匹配,可以实时地构建每位用户的兴趣标签 集,对挖掘出结果通过对兴趣标签集进行匹配来验证,相对于现有技术而言,较少影响线上 产品,缩短了验证时间,覆盖面更广阔,验证的代价较低。总之,有效地提升了用户兴趣的验 证效率。
[0026] 以下分别详细介绍步骤11至步骤14 :
[0027] 针对步骤11而言,所述用户兴趣信息可以但不限于包括下述一种或多种:用户的 分组名称;用户的自标签;用户关注对象的能力标签;用户的教育信息;用户的职业信息。
[0028] 具体而言,用户的分组名称一般是指:社交网络中的用户按照自己与关注对象的 关系,或按照自己对关注对象产生兴趣的原因,将关注对象划分到不同分组后,为分组取的 名称;用户的自标签一般是指:用户将自己的兴趣以标签的方式填写在自标签信息中,如 "手机"、"NBA"等表示用户兴趣的信息;能力标签一般是指:关注对象在某一专业领域或学 科等具备的能力,如篮球明星姚明的能力标签可能有"NBA"、"休斯顿火箭"等,儿科专家崔 玉涛的能力标签可能有"母婴育儿"、"健康医疗"等,用户关注了这些名人,意义在于该用户 对关注对象的能力感兴趣;获取用户的教育信息的意义在于可以根据该信息,确定用户可 能会对自己学校的相关信息(如学校公众号)感兴趣;可以根据用户的职业信息确定用户 的兴趣,如:律师事务所、证券公司等。
[0029] 针对步骤13而言,可以有以下三种方式实现将推测的兴趣对象信息与兴趣标签 集进行匹配。
[0030] 第一种方式:直接验证推测的兴趣对象信息与兴趣标签集直接是否匹配。
[0031] 在对第一种方式进行详细说明之前,先说明一下兴趣标签库,在服务器中,存在一 个"三层结构兴趣标签库",存在递进和细化的关系,它的具体结构如下表1所示。
【主权项】
1. 一种用户兴趣对象验证方法,其特征在于,包括: 获取用户兴趣信息;其中,所述用户兴趣信息用于表示当前用户感兴趣的对象; 根据用户兴趣信息构建兴趣标签集; 验证推测的兴趣对象信息与兴趣标签集是否匹配;并 在验证结果为匹配时,确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。
2. 如权利要求1所述的方法,其特征在于,所述用户兴趣信息包括下述一种或多种: 用户的分组名称; 用户的自标签; 用户关注对象的能力标签; 用户的教育信息; 用户的职业信息。
3. 如权利要求1或2所述的方法,其特征在于,验证推测的兴趣对象信息与兴趣标签集 是否匹配,具体包括: 利用特定标签,对所述兴趣标签集进行扩展,得到扩展后的兴趣标签集; 验证推测的兴趣对象信息与扩展后的兴趣标签集是否匹配; 其中,所述特定标签包括下述标签中的一种或两种: 与所述兴趣标签集中的标签相关联的标签; 根据用户兴趣标签集构建的公共兴趣标签。
4. 如权利要求1所述的方法,其特征在于,验证推测的兴趣对象信息与兴趣标签集是 否匹配,包括: 根据推测的兴趣对象信息与兴趣标签集的编辑距离,验证推测的兴趣对象信息与兴趣 标签集是否匹配。
5. 如权利要求4所述的方法,其特征在于,所述方法还包括;当推测的兴趣对象信息与 兴趣标签集中某一标签名称的编辑距离等于1,或编辑距离等于2且含有两个及两个W上 相同字符时,得到推测的兴趣对象信息与兴趣标签集匹配的验证结果。
6. 如权利要求1所述的方法,其特征在于,推测的兴趣对象信息,具体包括: 推测的兴趣对象所属类目的名称;或 推测的兴趣对象名称。
7. -种用户兴趣验证装置,其特征在于,包括: 获取信息单元,用于获取用户兴趣信息;其中,所述用户兴趣信息用于表示当前用户感 兴趣的对象; 构建信息单元,用于根据用户兴趣信息构建兴趣标签集; 验证信息单元,用于验证推测的兴趣对象信息与兴趣标签集是否匹配;并在验证结果 为匹配时,确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。
8. 如权利要求7所述的装置,其特征在于,验证信息单元,具体用于: 利用特定标签,对所述兴趣标签集进行扩展,得到扩展后的兴趣标签集; 验证推测的兴趣对象信息与扩展后的兴趣标签集是否匹配; 其中,所述特定标签包括下述标签中的一种或两种: 与所述兴趣标签集中的标签相关联的标签; 根据用户兴趣标签集构建的公共兴趣标签。
9. 如权利要求6所述的装置,其特征在于,验证信息单元,具体用于: 根据推测的兴趣对象信息与兴趣标签集的编辑距离,验证推测的兴趣对象信息与兴趣 标签集是否匹配。
10. 如权利要求9所述的装置,其特征在于,验证信息单元,具体用于: 当推测的兴趣对象信息与兴趣标签集中某一标签名称的编辑距离等于1,或编辑距离 等于2且含有两个及两个W上相同字符时,得到推测的兴趣对象信息与兴趣标签集匹配的 验证结果。
【专利摘要】本申请公开了一种用户兴趣对象验证方法。用于解决现有技术对于用户兴趣的验证效率较低的问题。方法包括:获取用户兴趣信息;其中,所述用户兴趣信息用于表示当前用户感兴趣的对象;根据用户兴趣信息构建兴趣标签集;验证推测的兴趣对象信息与兴趣标签集是否匹配;并在验证结果为匹配时,确定所述推测的兴趣对象信息属于当前用户感兴趣的对象。本申请还公开了一种用户兴趣对象验证装置。
【IPC分类】H04L29-08
【公开号】CN104601670
【申请号】CN201410827157
【发明人】李金奎
【申请人】微梦创科网络科技(中国)有限公司
【公开日】2015年5月6日
【申请日】2014年12月25日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1