一种基于社交网络的转行用户的挖掘方法及装置的制造方法_3

文档序号:9668037阅读:来源:国知局
设分值,则确定为转行用户;或者,如果第二维度的用户能力标签所对应的权 重大于第二预设分值,则确定为转行用户;或者,如果第三维度的用户能力标签所对应的权 重大于第三预设分值,则确定为转行用户;或者,如果第一、第二、第三维度的用户能力标签 均具有权重,则确定为转行用户;或者,如果两个维度的用户能力标签具有权重,且该两个 维度中的一个维度为第三维度,则确定为转行用户。
[0089]上述各功能单元的工作方法或具体实施过程已在前述方法实施例详述,故在此不 再赘述。
[0090] 本发明的实施例的挖掘装置通过构建用户能力标签映射集,结合该用户能力标签 映射集从被分组信息、自填信息、内容信息三个维度分析用户能力标签信息,并基于该三个 维度的用户能力标签信息中的至少其一来确定转行用户进行输出,从而降低了误判率,有 利于提升挖掘转行用户的准确率。
[0091] 本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块 (illustrativelogicalblock),单元,和步骤可以通过电子硬件、电脑软件,或两者的结 合进行实现。为清楚展示硬件和软件的可替换性(:!^丨6代1^1^6313;[1;^7),上述的各种说明 性部件(illustrativecomponents),单元和步骤已经通用地描述了它们的功能。这样的功 能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员 可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为 超出本发明实施例保护的范围。
[0092] 以上所述的【具体实施方式】,对本发明的目的、技术方案和有益效果进行了进一步 详细说明,所应理解的是,以上所述仅为本发明的【具体实施方式】而已,并不用于限定本发明 的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含 在本发明的保护范围之内。
【主权项】
1. 一种基于社交网络的转行用户的挖掘方法,其特征在于,包括: 构建用户能力标签映射集,所述用户能力标签映射集是指与用户能力标签相关的标签 集合; 根据所述用户能力标签映射集和用户的被分组信息分析出第一维度的用户能力标签 信息;其中,所述用户能力标签信息包括用户能力标签及其对应的权重; 根据所述用户能力标签映射集和用户的自填信息分析出第二维度的用户能力标签信 息; 根据所述用户能力标签映射集和用户的内容信息分析出第三维度的用户能力标签信 息; 根据所述第一、第二、第三维度的用户能力标签信息中的至少其一,确定出转行用户。2. 根据权利要求1所述的方法,其特征在于,所述构建用户能力标签映射集包括: 筛选出用户能力标签的种子标签,生成种子标签库; 利用编辑距离算法和共现频次算法将所述种子标签库扩展为用户能力标签映射集。3. 根据权利要求2所述的方法,其特征在于,根据所述用户能力标签映射集和用户的被 分组信息分析出第一维度的用户能力标签信息,包括: 获得用户的包括被分组名称及被分组次数在内的被分组信息; 根据所述用户能力标签映射集,将所述被分组信息映射到第一维度的用户能力标签, 并根据被分组次数计算出所述第一维度的用户能力标签的权重。4. 根据权利要求2所述的方法,其特征在于,根据所述用户能力标签映射集和用户的自 填信息分析出第二维度的用户能力标签信息,包括: 将用户当前的昵称、简介和自标签进行分词; 将分词结果利用所述用户能力标签映射集映射到第二维度的用户能力标签,并根据所 述第二维度的用户能力标签与所述昵称、简介和自标签相匹配的次数计算出所述第二维度 的用户能力标签的权重。5. 根据权利要求2所述的方法,其特征在于,根据所述用户能力标签映射集和用户的内 容信息分析出第三维度的用户能力标签信息,包括: 获取用户的博文,利用分类器给博文打上分类标签,并统计该分类标签对应的分类次 数; 根据所述分类标签和所述用户能力标签映射集确定第三维度的用户能力标签; 根据所述分类标签的分类次数计算出所述第三维度的用户能力标签的权重。6. 根据权利要求1所述的方法,其特征在于,所述根据所述第一、第二、第三维度的用户 能力标签信息中的至少其一,确定出转行用户,包括: 如果第一维度的用户能力标签所对应的权重大于第一预设分值,则确定为转行用户; 或者, 如果第二维度的用户能力标签所对应的权重大于第二预设分值,则确定为转行用户; 或者, 如果第三维度的用户能力标签所对应的权重大于第三预设分值,则确定为转行用户; 或者, 如果第一、第二、第三维度的用户能力标签均具有权重,则确定为转行用户;或者, 如果两个维度的用户能力标签具有权重,且所述两个维度中的一个维度为第三维度, 则确定为转行用户。7. -种基于社交网络的转行用户的挖掘装置,其特征在于,包括: 构建单元,用于构建用户能力标签映射集,所述用户能力标签映射集是指与用户能力 标签相关的标签集合; 第一分析单元,用于根据所述用户能力标签映射集和用户的被分组信息分析出第一维 度的用户能力标签信息;其中,所述用户能力标签信息包括用户能力标签及其对应的权重; 第二分析单元,用于根据所述用户能力标签映射集和用户的自填信息分析出第二维度 的用户能力标签信息; 第三分析单元,用于根据所述用户能力标签映射集和用户的内容信息分析出第三维度 的用户能力标签信息; 确定单元,用于根据所述第一、第二、第三维度的用户能力标签信息中的至少其一,确 定出转行用户。8. 根据权利要求7所述的装置,其特征在于,所述构建单元,具体用于筛选出用户能力 标签的种子标签,生成种子标签库;利用编辑距离算法和共现频次算法将所述种子标签库 扩展为用户能力标签映射集。9. 根据权利要求8所述的装置,其特征在于, 所述第一分析单元,具体包括: 获取子单元,用于获得用户的包括被分组名称及被分组次数在内的被分组信息; 映射子单元,用于根据所述用户能力标签映射集,将所述被分组信息映射到第一维度 的用户能力标签; 计算子单元,用于根据被分组次数计算出所述第一维度的用户能力标签的权重; 和/或,所述第二分析单元,具体包括: 分词子单元,用于将用户当前的昵称、简介和自标签进行分词; 映射子单元,用于将分词结果利用所述用户能力标签映射集映射到第二维度的用户能 力标签; 计算子单元,用于根据所述第二维度的用户能力标签与所述昵称、简介和自标签相匹 配的次数计算出所述第二维度的用户能力标签的权重; 和/或,所述第三分析单元,具体包括: 获取子单元,用于获取用户的博文,利用分类器给博文打上分类标签,并统计该分类标 签对应的分类次数; 映射子单元,用于根据所述分类标签和所述用户能力标签映射集确定第三维度的用户 能力标签; 计算子单元,用于根据所述分类标签的分类次数计算出所述第三维度的用户能力标签 的权重。10. 根据权利要求7所述的装置,其特征在于,所述确定单元,具体用于:如果第一维度 的用户能力标签所对应的权重大于第一预设分值,则确定为转行用户;或者,如果第二维度 的用户能力标签所对应的权重大于第二预设分值,则确定为转行用户;或者,如果第三维度 的用户能力标签所对应的权重大于第三预设分值,则确定为转行用户;或者,如果第一、第 二、第三维度的用户能力标签均具有权重,则确定为转行用户;或者,如果两个维度的用户 能力标签具有权重,且所述两个维度中的一个维度为第三维度,则确定为转行用户。
【专利摘要】本发明的实施例提供一种基于社交网络的转行用户的挖掘方法及装置,该方法包括:构建用户能力标签映射集;根据所述用户能力标签映射集和用户的被分组信息分析出第一维度的用户能力标签信息;根据所述用户能力标签映射集和用户的自填信息分析出第二维度的用户能力标签信息;根据所述用户能力标签映射集和用户的内容信息分析出第三维度的用户能力标签信息;根据所述第一、第二、第三维度的用户能力标签信息中的至少其一,确定出转行用户。该方法有利于提升挖掘转行用户的准确率。
【IPC分类】G06F17/30, G06Q50/00
【公开号】CN105427174
【申请号】CN201510894587
【发明人】李金奎
【申请人】微梦创科网络科技(中国)有限公司
【公开日】2016年3月23日
【申请日】2015年12月8日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1