一种基于交往频度和交往指数的超大规模用户的社交网络分析及家庭关系识别算法的制作方法

文档序号:13761014阅读:来源:国知局
一种基于交往频度和交往指数的超大规模用户的社交网络分析及家庭关系识别算法的制作方法

技术特征:

1.一种基于交往频度和交往指数的超大规模用户的社交网络分析及家庭关系识别算法,其特征在于,包括以下步骤:交往频度/交往指数计算、交往圈模型构建、社交网络模型构建、家庭关系识别模型构建;

基于语音通话信息、短彩信通话信息以及通话频度计算用户交往频度指标,并结合次数、时长等信息计算交往指数;

根据交往指数排名构建用户交往圈模型,同时结合交往时段偏好(工作时段、生活时段、时段不明显),建立工作圈、生活圈、综合圈模型;

构建交往圈的社交网络,找出联系密集群,这里从共同联系人的角度思考,当考虑将两个用户划入一个群组时,希望两个用户有较多的共同联系人。

2.而主体通过快速迭代的方式,将用户逐步加入到对应的群体中;

构建家庭关系识别模型,计算联系双方的相似度,与客户下多号码相似度较高,且交往时段集中于生活时段的,认为与客户同一家庭的可能性较高;

根据权利需求1所述的交往频度/交往指数算法,其特征在于,所述通过话单信息进行汇总,计算两两用户的交往频度、交往指数指标:

交往频度由用户本月有通话日数+周数+旬数除以当月天数计算得出;

交往指数由交往频度、通话次数、通话时长、短彩信次数分别乘以权重累加得出;

根据权利需求1所述的交往圈模型算法,其特征在于,所述通过用户交往行为时段偏好建立工作圈、生活圈、综合圈:

分别将工作时段、生活时段、不区分时段的交往频度、通话次数、通话时长等指标乘以权重累加,计算出工作圈交往指数、生活圈交往指数、综合圈交往指数,指数最大的即为该用户所属的交往圈;

根据权利需求1所述的社交网络模型算法,其特征在于,所述通过交往圈信息进行社交网络模型构建:

根据“六度分割理论”,按照迭代方式分群,将所有用户都分入到一个群体中,计算用户间交往相似度,删除用户间的弱联系。

3.弱连接的删除也避免了所有用户划入同一个群中。

4.进行此步骤后,社交网络会退化成几个内部联系多、外部联系少的次网络,以及很多孤立的节点。

5.每个次网络对应一个群体(group),称为这个群体的核 (kernel);

考虑将剩余用户分成联系密集的小群体,如何保证网络内部联系较为密集,优先将共同联系人较多的用户分到一个群体中,在此前提条件下,通过迭代的方法依照通话记录依次将用户划入相应的群中;

根据权利要求1所述的家庭关系识别算法,其特征在于,所述将所述用户根据交往圈信息划分到相应家庭中:

基于客户家庭套餐、客户账号等信息构建家庭关系骨干模型,然后根据家庭骨干用户的交往圈信息计算交往相似度、交往时段偏好,将生活圈中相似度较高用户识别成同家庭用户。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1