获取用户标签的关联度权值的方法和装置的制造方法

文档序号:9417405阅读:194来源:国知局
获取用户标签的关联度权值的方法和装置的制造方法
【技术领域】
[0001] 本公开一般涉及数据分析技术,具体涉及基于用户行为的数据分析技术,尤其涉 及获取用户标签的关联度权值的方法和装置。
【背景技术】
[0002] 在互联网中,用户行为往往与其感兴趣的内容相关联。例如,当用户对某些特定品 牌、机构、商家感兴趣时,其可能会关注这些品牌、机构或商家的微博、向自己的好友转发这 些品牌、机构、商家发布的内容,或者当品牌、机构、商家发布微博时,对微博内容发表评论。 [0003]目前,准确获取用户的上述行为偏好通常有如下三种:
[0004] a)基于机器学习的方法,收集用户样本或者用户组样本,然后对样本用户行为进 行特征提取和机器学习,再利用模型得到用户行为兴趣标签。
[0005] b)基于文本的关键词提取技术进行用户行为兴趣标签建立,然后利用用户交互关 系建立用户关系图,再利用类似网页排名(PageRank)等方法进行用户行为兴趣的发现。
[0006] c)基于主题模型的算法(Latent Dirichlet Allocation,LDA)进行用户行为兴 趣发现,这种方法利用用户关系信息和用户标签信息进行用户行为兴趣挖掘。
[0007] 然而,如上所述的现有技术存在以下缺陷:
[0008] 针对上述方案a),其局限在于难于进行具有商业标签的样本用户收集样本。
[0009] 针对上述方案b),尽管该方案不需要收集样本,对于挖掘用户在广泛的兴趣爱好 上面准确率尚可,但是在对于本身不具备很强的传递效应的标签,该方法准确率比较低,容 易造成误判。
[0010] 针对上述方案c),对于主题性较弱的用户行为而言,其不便于进行主题的种子词 归类。

【发明内容】

[0011] 鉴于现有技术中的上述缺陷或不足,期望提供一种获取用户标签的关联度权值的 方法和装置,其可以通过统计用户行为准确获得与用户行为相关联的用户标签。
[0012] 第一方面,本申请实施例提供了一种获取用户标签的关联度权值方法,包括:建立 标签数据库,标签数据库包括标签和与标签对应的类别信息;统计用户行为并提取用户行 为事件,其中,用户行为事件包括用户标签,用户标签为标签数据库中与用户行为相关联的 标签;以及基于用户行为事件确定用户标签的关联度权值。
[0013] 第二方面,本申请实施例还提供了一种获取用户标签的关联度权值的装置,包括: 创建模块,配置用于建立标签数据库,标签数据库包括标签和与标签对应的类别信息;提取 模块,配置用于统计用户行为并提取用户行为事件,其中,用户行为事件包括用户标签,用 户标签为标签数据库中与用户行为相关联的标签;以及确定模块,配置用于基于用户行为 事件确定用户标签的关联度权值。
[0014] 本申请实施例提供的的方案,可以准确获得与用户行为相关联的用户标签和与该 用户标签相应的权值。
[0015] 在本申请的一些实现方式中,还可对不同类别的用户行为分别计算与之相应的用 户标签的权值,再将与各用户行为相应的权值叠加,得到该用户标签的权值。
[0016] 在本申请的一些实现方式中,还可以基于先验数据对得到的用户行为的权值进行 校正,从而使得最终得到的用户标签的权值与用户的实际偏好更加统一。
【附图说明】
[0017] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它 特征、目的和优点将会变得更明显:
[0018] 图1示出了根据本申请一个实施例的获取用户标签的关联度权值方法的示意性 流程图;
[0019] 图2示出了图1中基于用户行为事件确定用户标签的关联度权值的示意性结构 图;
[0020] 图3示出了根据本申请一个实施例的获取用户标签的关联度权值装置的示意性 结构图。
【具体实施方式】
[0021] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了 便于描述,附图中仅示出了与发明相关的部分。
[0022] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相 互组合。下面将参考附图并结合实施例来详细说明本申请。
[0023] 参见图1所示,为根据本申请一个实施例的获取用户标签的关联度权值方法的示 意性流程图。
[0024] 具体而言,在步骤110中,建立标签数据库,标签数据库包括标签和与标签对应的 类别信息。
[0025] 在一些实现方式中,可以从各自媒体平台获取符合预设条件的标签,并将这些标 签添加到标签数据库中。自媒体平台例如可以包括微博、微信公众平台、微信朋友圈、各网 站的论坛等。在获取标签时,例如,可以将这些自媒体平台中,经过认证的代表各品牌、机构 或商家的官方账号作为标签,加入至标签数据库中。
[0026] 此外,由于各标签的名称有可能重合,例如,"高尔夫"这一标签,有可能代表一种 汽车的型号,还有可能代表高尔夫球这一球类运动。因此,在一些实现方式中,在建立标签 数据库中,可以为各标签添加相应的类别信息,从而明确该标签的类别,以消除标签的歧 义、避免各标签之间的混淆。
[0027] 接着,在步骤120中,统计用户行为并提取用户行为事件。
[0028] 在一些实现方式中,用户行为事件例如可以包括用户标签,用户标签为标签数据 库中与用户行为相关联的标签。
[0029] 在另一些实现方式中,用户行为事件除了包含用户标签之外,还可以包括用户名、 行为发生时间、用户行为类别中的至少一项。
[0030] 例如,用户U在时间Tl时产生了一与标签数据库中的标签A相关联的行为C1,针 对该用户行为的用户行为事件可以用(U,T1,C1,A)这样的四元组来进行描述。
[0031] 接着,在步骤130中,基于用户行为事件确定用户标签的关联度权值。
[0032] 例如,可以根据用户行为的类别、用户行为发生的时间、用户行为发生的次数等中 的至少一者,来确定用户标签的关联度权值。
[0033] 在一些实现方式中,用户行为类别例如可以包括以下至少一项:
[0034] 用户关注自媒体平台的其他用户。例如,用户U关注的自媒体平台的其他用户为 某品牌的官方账号,那么用户U的这种"关注"的行为,可被认为与该品牌对应的标签产生 了关联,从而,该标签成为了用户U的用户标签。
[0035] 用户关注的其他用户发表的自媒体内容。例如,用户U关注的另一用户K发表的 自媒体内容中,包含了与标签数据库中某一标签g相关的内容,那么用户U也可被认为与该 标签产生了关联,从而,该标签成为了用户U的用户标签。
[0036] 用户发表自媒体内容。例如,用户U发表的自媒体内容中提到了某品牌,那么,用 户U也可被认为与和该品牌对应的标签产生了关联,从而,该标签成为了用户U的用户标 签。
[0037] 用户针对自媒体平台的其他用户发布的自媒体内容发表评论。例如,用户U在对 其他用户发表的自媒体内容进行评论时,提到了某品牌,那么,用户U也可被认为与和该品 牌对应的标签产生了关联,从而,该标签成为了用户U的用户标签。
[0038] 用户转发自媒体平台的其他用户发布的自媒体内容。例如,用户在对其他用户发 表的自媒体内容进行转发时,提到了某品牌,那么,用户U也可被认为与和该品牌对应的标 签产生了关联,从而,该标签成为了用户U的用户标签。
[0039] 在一些实现方式中,基于用户行为事件确定用户标签的关联度权值例如可以包括 步骤131,将与用户标签相关联的各用户行为的权值的叠加作为用户标签的关联度权值。
[0040] 参见图2所示,为图1中步骤130即基于用户行为事件确定用户标签的关联度权 值的示意性结构图200。
[0041] 在图2中示出了通过将与用户标签相关联的各用户行为的权值的叠加作为用户 标签的关联度权值。
[0042] 例如,在201中,用户关注自媒体平台的其他用户为某品牌的官方账号,可基于用 户的该行为计算出用户和与该品牌相应的标签之间的关联度A (211)。
[0043] 类似地,在202中,用户U关注的其他用户发表的自媒体内容中,包含了与标签数 据库中某一标签g相关的内容,那么,可以基于用户的该行为计算出该用户U与标签g之间 的关联度4(212)。
[0044] 类似地,在203中,用户发表的自媒体内容中提到了某品牌,那么,可以基于用户 的该行为计算出该用户和与
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1