社交关系的挖掘方法及装置、计算机设备与可读介质与流程

文档序号:20029819发布日期:2020-02-28 10:15阅读:来源:国知局

技术特征:

1.一种社交关系的挖掘方法,其特征在于,所述方法包括:

将采集到的多个应用的用户行为数据基于用户进行打通,获取各个用户的行为数据;

基于各所述用户的行为数据,挖掘数对双向关系用户对。

2.根据权利要求1所述的方法,其特征在于,将采集到的多个应用的用户行为数据基于用户进行打通,获取各个用户的行为数据,具体包括:

基于设备id与注册账号id的对应关系、设备id与cookieid的对应关系,和/或不同注册账号id之间的对应关系,从所述多个应用的用户行为数据中挖掘属于同一个用户的id的映射聚合;

根据同一个用户的id的映射聚合,从所述多个应用的用户行为数据中抽取各个所述用户的行为数据。

3.根据权利要求1所述的方法,其特征在于,基于各所述用户的行为数据,挖掘数对双向关系用户对,具体包括:

从各所述用户的部分行为数据中,获取各所述用户对应的单向关系的用户对,得到多个初始单向关系用户对;

清洗所述多个初始单向关系用户对中的不合法的用户对;

根据清洗后剩余的各有效单向关系用户对中的各所述用户的所有行为数据,验证所述有效单向关系用户对实际上为双向关系用户对还是单向关系用户对;

若为所述双向关系用户对时,将对应的所述有效单向关系用户对修正为所述双向关系用户对。

4.根据权利要求3所述的方法,其特征在于,清洗所述多个初始单向关系用户对中的非法用户对,具体包括:

判断各所述初始单向关系用户对中发起单向关系的所述用户是否为预设的黑名单中的用户,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在单位时间内、在每一种社交行为中主动增加的好友的数量是否超出第一预设阈值,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中主动增加的好友的总数量是否超出第二预设阈值,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中的行为模式是否固定,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中被关注的人数是否低于第三预设阈值,若是,确定所述单向关系用户对为非法用户对,并删除;和/或

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中被关注的人数和关注的人数是否小于预设比例,若是,确定所述单向关系用户对为非法用户对,并删除。

5.根据权利要求3所述的方法,其特征在于,根据清洗后剩余的各有效单向关系用户对中的各所述用户的行为数据,验证所述有效单向关系用户对实际上还是单向关系用户对时,所述方法还包括:

根据预先挖掘的各大群组,验证所述单向关系用户对中的两个所述用户是否属于同一大群组中的用户;所述大群组中包括的用户的数量大于或者等于对应的预设数量阈值;

若是,将对应的所述单向关系用户对修正为所述双向关系用户对。

6.根据权利要求5所述的方法,其特征在于,根据预先挖掘的各大群组,验证所述有效单向关系用户对中的两个所述用户是否属于同一大群组中的用户之前,所述方法还包括:

从各所述用户的行为数据中,挖掘多个群组;

判断各所述群组中包括的用户的数量是否大于或者等于对应的所述预设数量阈值,若是,确定对应的所述群组为大群组。

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

若各所述群组中包括的用户的数量小于对应的所述预设数量阈值时,确定对应的所述群组为小群组;

将各所述小群组中任意两个用户所构成的用户对设置为所述双向关系用户对。

8.根据权利要求6所述的方法,其特征在于,基于各所述用户的行为数据,挖掘数对双向关系用户对,具体包括:

从各所述用户的所有行为数据中,挖掘多个初始双向关系用户对;

清洗所述多个初始双向关系用户对中的不合法的用户对,得到多个所述双向关系用户对。

9.根据权利要求6所述的方法,其特征在于,所述方法还包括:

从各所述用户的所有行为数据中,挖掘多个疑似单向关系用户对;

清洗所述多个疑似单向关系用户对中的不合法的用户对,得到多个所述候选单向关系用户对;

根据预先挖掘的多个大群组中包括的用户,验证各所述候选单向关系用户对中的两个所述用户是否属于同一大群组中的用户;所述大群组是从各所述用户的行为数据中挖掘的,所述大群组中的用户的数量大于或者等于预设数阈值;

若是,将对应的所述候选单向关系用户对修正为所述双向关系用户对。

10.根据权利要求1所述的方法,其特征在于,基于各所述用户的行为数据,挖掘数对双向关系用户对之后,所述方法还包括:

根据各所述双向关系用户对中各所述用户的行为数据,分析对应的所述双向关系用户对中两个用户之间的社交关系强度。

11.根据权利要求10所述的方法,其特征在于,根据各所述双向关系用户对中各所述用户的行为数据,分析对应的所述双向关系用户对中两个用户之间的社交关系强度,具体包括:

根据各所述双向关系用户对中两个用户的行为数据,挖掘两个用户中每个用户对对端用户的多个行为特征;

设置各所述行为特征对应的权重;

根据各所述双向关系用户对中各所述用户的多个所述行为特征以及各所述行为特征的权重,计算各所述双向关系用户对的置信度,以标识对应的所述双向关系用户对的社交关系强度。

12.根据权利要求11所述的方法,其特征在于,根据各所述双向关系用户对中两个用户的行为数据,挖掘两个用户中每个用户对另一个用户的多个行为特征之后,根据各所述双向关系用户对中各用户的多个所述行为特征以及各所述行为特征的权重,计算各所述双向关系用户对的置信度之前,所述方法还包括:

根据筛除的所有所述单向关系用户对以及所述大群组,修正各所述双向关系用户对中每个用户的多个行为特征。

13.根据权利要求11所述的方法,其特征在于,所述方法还包括:

根据各所述双向关系用户对中两个用户的行为数据,挖掘两个用户中每个用户的人脉关系特征;

设置各所述人脉关系特征的权重;

根据各所述双向关系用户对中各用户的多个所述行为特征、所述人脉关系特征、各所述行为特征的权重以及所述人脉关系特征的权重,计算各所述双向关系用户对的置信度。

14.根据权利要求1-13任一所述的方法,其特征在于,所述方法还包括:

根据各所述双向关系用户对中各所述用户的行为数据,基于时间轴挖掘对应的各所述用户的关系属性,所述关系属性包括关联关系起始时间、关联关系最新时间、关联用户活跃度、预设时间周期内的关联关系数据切片和/或关联关系互动行为占比。

15.一种社交关系的挖掘装置,其特征在于,所述装置包括:

获取模块,用于将采集到的多个应用的用户行为数据基于用户进行打通,获取各个用户的行为数据;

挖掘模块,用于基于各所述用户的行为数据,挖掘数对双向关系用户对。

16.根据权利要求15所述的装置,其特征在于,所述获取模块,具体用于:

基于设备id与注册账号id的对应关系、设备id与cookieid的对应关系,和/或不同注册账号id之间的对应关系,从所述多个应用的用户行为数据中挖掘属于同一个用户的id的映射聚合;

根据同一个用户的id的映射聚合,从所述多个应用的用户行为数据中抽取各个所述用户的行为数据。

17.根据权利要求15所述的装置,其特征在于,所述挖掘模块,具体包括:

获取单元,用于从各所述用户的部分行为数据中,获取各所述用户对应的单向关系的用户对,得到多个初始单向关系用户对;

清洗单元,用于清洗所述多个初始单向关系用户对中的不合法的用户对;

验证单元,用于根据清洗后剩余的各有效单向关系用户对中的各所述用户的所有行为数据,验证所述有效单向关系用户对实际上为双向关系用户对还是单向关系用户对;

修正单元,用于若为所述双向关系用户对时,将对应的所述有效单向关系用户对修正为所述双向关系用户对。

18.根据权利要求17所述的装置,其特征在于,所述清洗单元,具体用于:

判断各所述初始单向关系用户对中发起单向关系的所述用户是否为预设的黑名单中的用户,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在单位时间内、在每一种社交行为中主动增加的好友的数量是否超出第一预设阈值,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中主动增加的好友的总数量是否超出第二预设阈值,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中的行为模式是否固定,若是,确定所述单向关系用户对为非法用户对,并删除;

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中被关注的人数是否低于第三预设阈值,若是,确定所述单向关系用户对为非法用户对,并删除;和/或

判断各所述初始单向关系用户对中发起单向关系的所述用户在每一种社交行为中被关注的人数和关注的人数是否小于预设比例,若是,确定所述单向关系用户对为非法用户对,并删除。

19.根据权利要求17所述的装置,其特征在于:

所述验证单元,还用于根据预先挖掘的各大群组,验证所述单向关系用户对中的两个所述用户是否属于同一大群组中的用户;所述大群组中包括的用户的数量大于或者等于对应的预设数量阈值;

所述修正单元,还用于若所述单向关系用户对中的两个所述用户是属于同一大群组中的用户,将对应的所述单向关系用户对修正为所述双向关系用户对。

20.根据权利要求19所述的装置,其特征在于,所述挖掘模块还包括挖掘单元;

所述挖掘单元,用于从各所述用户的行为数据中,挖掘多个群组;

所述验证单元,还用于判断各所述群组中包括的用户的数量是否大于或者等于对应的所述预设数量阈值,若是,确定对应的所述群组为大群组。

21.根据权利要求20所述的装置,其特征在于,所述挖掘模板,还包括设置单元;

所述验证单元,还用于若各所述群组中包括的用户的数量小于对应的所述预设数量阈值时,确定对应的所述群组为小群组;

所述设置单元,用于将各所述小群组中任意两个用户所构成的用户对设置为所述双向关系用户对。

22.根据权利要求20所述的装置,其特征在于:

所述挖掘单元,还用于从各所述用户的所有行为数据中,挖掘多个初始双向关系用户对;

所述清洗单元,还用于清洗所述多个初始双向关系用户对中的不合法的用户对,得到多个所述双向关系用户对。

23.根据权利要求22所述的装置,其特征在于:

所述挖掘单元,还用于从各所述用户的所有行为数据中,挖掘多个疑似单向关系用户对;

所述清洗单元,还用于清洗所述多个疑似单向关系用户对中的不合法的用户对,得到多个所述候选单向关系用户对;

所述验证单元,还用于根据预先挖掘的多个大群组中包括的用户,验证各所述候选单向关系用户对中的两个所述用户是否属于同一大群组中的用户;所述大群组是从各所述用户的行为数据中挖掘的,所述大群组中的用户的数量大于或者等于预设数阈值;

所述修正单元,还用于若各所述候选单向关系用户对中的两个所述用户属于同一大群组中的用户,将对应的所述候选单向关系用户对修正为所述双向关系用户对。

24.根据权利要求17所述的装置,其特征在于,所述装置还包括:

分析模块,用于根据各所述双向关系用户对中各所述用户的行为数据,分析对应的所述双向关系用户对中两个用户之间的社交关系强度。

25.根据权利要求24所述的装置,其特征在于,所述分析模块,具体用于:

根据各所述双向关系用户对中两个用户的行为数据,挖掘两个用户中每个用户对对端用户的多个行为特征;

设置各所述行为特征对应的权重;

根据各所述双向关系用户对中各所述用户的多个所述行为特征以及各所述行为特征的权重,计算各所述双向关系用户对的置信度,以标识对应的所述双向关系用户对的社交关系强度。

26.根据权利要求25所述的装置,其特征在于:

所述修正单元,还用于根据筛除的所有所述单向关系用户对以及所述大群组,修正各所述双向关系用户对中每个用户的多个行为特征。

27.根据权利要求25所述的装置,其特征在于:

所述挖掘模块,还用于根据各所述双向关系用户对中两个用户的行为数据,挖掘两个用户中每个用户的人脉关系特征;

所述分析模块,还用于设置各所述人脉关系特征的权重;并根据各所述双向关系用户对中各用户的多个所述行为特征、所述人脉关系特征、各所述行为特征的权重以及所述人脉关系特征的权重,计算各所述双向关系用户对的置信度。

28.根据权利要求15-27任一所述的装置,其特征在于,所述挖掘模块,还用于:

根据各所述双向关系用户对中各所述用户的行为数据,基于时间轴挖掘对应的各所述用户的关系属性,所述关系属性包括关联关系起始时间、关联关系最新时间、关联用户活跃度、预设时间周期内的关联关系数据切片和/或关联关系互动行为占比。

29.一种计算机设备,其特征在于,所述设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-14中任一所述的方法。

30.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-14中任一所述的方法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1