一种标签关联程度的确定方法及装置的制造方法

文档序号:8258776阅读:275来源:国知局
一种标签关联程度的确定方法及装置的制造方法
【技术领域】
[0001] 本申请涉及互联网技术领域,尤其涉及一种标签关联程度的确定方法及装置。
【背景技术】
[0002] 目前,针对微博等社交工具,可以把用户的关注对象所在分组的分组名称确定为 用户标签,后续可以根据用户标签实现对用户的查找。
[0003] 比如,基于通过上述方式确定的用户标签"NBA",当需要查找一批对"NBA"感兴趣 的用户时,可以直接以该用户标签作为查询关键词,查找以该用户标签作为分组名称的分 组,进而将查找到分组中的关注对象和/或设置该分组名称的用户确定为对"NBA"感兴趣 的用户。可以理解,与该用户标签相关联的其他用户标签(如"NBA球星"等)作为分组名 中的关注对象,其实也是对"NBA"感兴趣的用户,若能够获知与该用户标签相关联的所有用 户标签,则可查找到非常多的对"NBA"感兴趣的用户。可见,确定用户标签之间的关联关系 对于提高查找对象的全面性是非常重要的。
[0004] 现有技术中,为了确定与某用户标签相关联的标签,首先会建立一个基于常识、文 化、学术等公知内容的多种类目的存在关联关系的标签库。当需要确定出与该用户标签存 在关联关系的用户标签时,计算标签库中用户标签与选定的用户标签的共现频率,并选取 共现频率大于设定的共现频率阈值的用户标签,作为该用户标签的关联标签。
[0005] 一般地,与任一用户标签的关联标签可以分为强关联标签和弱关联标签两种。"强 关联"表示用户标签之间存在较强的关联关系;"弱关联"表示用户标签之间存在较弱的关 联关系。如:"NBA球星"与"NBA"这两个用户标签就具有较强的关联关系,而相对"NBA球 星"与"NBA"之间的关联关系,"球星"与"NBA"这两个用户标签的关联关系就较弱。
[0006] 区分用户标签关联程度的意义在于:后续在基于用户标签进行用户查找时,可以 仅根据查询关键词,以及与查询关键词(某用户标签)之间强关联的其他用户标签,进行用 户查找;而对于虽然与该查询关键词有关联,但关联程度较弱的用户标签,则不再以它们作 为查询关键词。从而可以避免对一些准确度较差的查找结果进行查找而导致资源无谓浪费 的问题。
[0007] 然而,现有技术中还没有提出能够自动区分用户标签关联程度的技术。

【发明内容】

[0008] 本申请实施例提供一种标签关联程度的确定方法,提供一种确定用户标签之间关 联程度的方案。
[0009] 本申请实施例提供一种标签关联程度的确定装置,提供一种确定用户标签之间关 联程度的方案。
[0010] 本申请实施例采用下述技术方案:
[0011] 一种标签关联程度的确定方法,包括:确定同已有标签存在共现关系的用户标签 与已有标签的编辑距离;其中,所述已有标签是根据用户特征信息生成的;根据所述编辑 距离,确定所述同已有标签存在共现关系的用户标签与所述已有标签的关联程度。
[0012] -种标签关联程度的确定装置,包括:计算标签单元,用于确定同已有标签存在共 现关系的用户标签与已有标签的编辑距离;其中,所述已有标签是根据用户特征信息生成 的;确定关系单元,用于根据所述编辑距离,确定所述同已有标签存在共现关系的用户标签 与所述已有标签的关联程度。
[0013] 本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
[0014] 采用根据通过确定同已有标签存在共现关系的用户标签与已有标签的编辑距离, 确定出同已有标签存在共现关系的用户标签与已有标签的关联程度,由于已有标签也是用 户标签,所以等同于确定出用户标签之间的关联程度。
【附图说明】
[0015] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0016] 图1为本申请实施例提供的一种标签关联程度的确定方法的具体实现流程示意 图;
[0017] 图2为本申请实施例提供的一种标签关联程度的确定装置的具体结构示意图;
[0018] 图3为本申请实施例提供的一种标签关联程度的确定方法的示意图。
【具体实施方式】
[0019] 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020] 以下结合附图,详细说明本申请各实施例提供的技术方案。
[0021] 本申请实施例提供一种标签关联程度的确定方法,提供一种确定用户标签之间关 联程度的方案。该方法的实现流程示意图如图1所示,包括下述步骤:
[0022] 步骤11,确定同已有标签存在共现关系的用户标签与已有标签的编辑距离;其 中,已有标签是根据用户特征信息生成的。
[0023] 步骤12,根据编辑距离,确定同已有标签存在共现关系的用户标签与已有标签的 关联程度。
[0024] 采用本实施例提供的该方法,根据通过确定同已有标签存在共现关系的用户标签 与已有标签的编辑距离,确定出同已有标签存在共现关系的用户标签与已有标签的关联程 度,由于已有标签也是用户标签,所以等同于确定出用户标签之间的关联程度。
[0025] 以下分别详细介绍步骤11和步骤12 :
[0026] 在一种实施方式中,可以采用下述方式,生成所述已有标签:获取用户特征信息; 根据设定的标签生成方式以及用户特征信息,生成所述已有标签。
[0027] 其中,用户特征信息可以包括:用户的分组名称、用户的自标签、用户的职业信息、 用户的教育信息。比如,获取到用户的分组名称,分析分组名称的语义,再根据设定的标签 生成方式,生成所述已有标签。
[0028] 具体而言:可以但不限于根据以下述相关规则中的一种或多种生成已有标签:行 业术语;行业认证信息;拼音及拼音缩写;英文表达方式及英文表达方式的缩写;类目体系 词汇。具体可以参考如下表1所示的实例。
[0029]
【主权项】
1. 一种标签关联程度的确定方法,其特征在于
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1