一种挖掘社区用户的方法及装置制造方法

文档序号:6491973阅读:162来源:国知局
一种挖掘社区用户的方法及装置制造方法
【专利摘要】本发明公开了一种挖掘社区用户的方法,属于互联网通信领域。所述方法包括:获取社区用户的社区原始数据;根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,所述亲密度分数用于标识所述社区用户对其他社区用户的亲密程度;根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子;将所述社区用户圈子显示给所述社区用户圈子包括的社区用户,以使所述社区用户圈子包括的各社区用户之间进行相互交流。所述装置包括:第一获取模块、计算模块、聚类模块和显示模块。本发明使社区用户可以与其收听的好友以外的其他社区用户进行互动,提高了社区的互动性。
【专利说明】一种挖掘社区用户的方法及装置
【技术领域】
[0001]本发明涉及互联网通信领域,特别涉及一种挖掘社区用户的方法及装置。
【背景技术】
[0002]随着社区技术的发展,社区已得到用户广泛地应用,用户可以在社区中注册社区账号,并向社区账号添加好友,然后通过该社区账号发送私信给好友、转发好友发布的信息和/或评论好友发布的信息等多种互动方式与好友互动。
[0003]目前在社区中用户可以查看到自身的社区账号包括的好友,而该社区账号包括的好友之间可能无法相互查看到,以致于用户可以与该社区账号包括的好友之间进行互动,而该社区账号包括的好友之间则不可以进行互动,另外,用户也只局限于与该社区账号包括的好友进行互动,而不可以与该社区账号包括的好友以外的其他用户进行互动,导致社区的互动性较差。

【发明内容】

[0004]为了使社区用户可以与其自身的社区账号包括的好友以外的其他用户进行互动,提高社区的互动性,本发明提供了一种挖掘社区用户的方法及装置。所述技术方案如下:
[0005]一种挖掘社区用户的方法,所述方法包括:
[0006]获取社区用户的社区原始数据,所述社区用户的社区原始数据包括所述社区用户对其他社区用户的关注度信息和所述社区用户与所述其他社区用户共同关注的话题个数;
[0007]根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,所述亲密度分数用于标识所述社区用户对其他社区用户的亲密程度;
[0008]根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子;
[0009]将所述社区用户圈子显示给所述社区用户圈子包括的社区用户,以使所述社区用户圈子包括的各社区用户之间进行相互交流。
[0010]所述根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,包括:
[0011]根据所述社区用户对所述其他社区用户的关注度信息,计算所述社区用户对所述其他社区用户的关注度分数;
[0012]根据所述社区用户与所述其他社区用户共同关注的话题个数,计算所述社区用户与所述其他社区用户之间的关注热点分数;
[0013]根据所述社区用户对所述其他社区用户的关注度分数和所述社区用户与所述其他社区用户之间的关注热点分数,计算所述社区用户对所述其他社区用户的亲密度分数。
[0014]所述根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子,包括:[0015]扫描社区用户;
[0016]根据所述扫描的社区用户对除所述扫描的社区用户以外的其他社区用户的亲密度分数和所述其他社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述其他社区用户之间的用户距离;
[0017]选取与所述扫描的社区用户的之间的用户距离小于预设用户距离门限的社区用户,将所述扫描的社区用户与所述选取的社区用户聚类成一个社区用户圈子。
[0018]所述将所述扫描的社区用户与所述选取的社区用户组成一个社区用户圈子之后,还包括:
[0019]将所有社区用户圈子组成圈子集合,设置指针指向所述圈子集合包括的第一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描;
[0020]根据所述指针指向的社区用户圈子包括的社区用户对所述扫描的社区用户圈子包括的社区用户的亲密度分数和所述扫描的社区用户圈子包括的社区用户对所述指针指向的社区用户圈子包括的社区用户的亲密度,计算所述指针指向的社区用户圈子与所述扫描的社区用户圈子之间的圈子距离;
[0021]如果所述圈子距离小于预设圈子距离门限,则合并所述指针指向的社区用户圈子与所述扫描的社区用户圈子。
[0022]所述合并所述指针指向的社区用户圈子与所述扫描的社区用户圈子之后,还包括:
[0023]如果所述指针指向的社区用户圈子不是所述圈子集合包括的最后一个社区用户圈子,则设置所述指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
[0024]如果圈子距离大于或等于预设圈子距离门限,所述方法还包括:
[0025]如果所述扫描的社区用户圈子不是所述圈子集合包括的剩下最后一个社区用户圈子,则在所述圈子子集合包括的剩下社区用户圈子扫描下一个社区用户圈子;
[0026]如果所述扫描的社区用户圈子是所述圈子集合包括的剩下最后一个社区用户圈子且所述指针指向的社区用户圈子不是所述圈子集合包括的最后一个社区用户圈子,则设置指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
[0027]所述根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子,包括:
[0028]第一步,扫描社区用户,将其他社区用户形成第一用户集合,根据所述扫描的社区用户对所述第一用户集合包括的社区用户的亲密度分数和所述第一用户集合包括的社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述第一用户集合包括的社区用户之间的用户距离;
[0029]第二步,从第一用户集合中选取与所述社区用户之间的用户距离最小的社区用户,将所述社区用户和所述选取的社区用户组成第二用户集合,获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多的社区用户的个数;
[0030]第三步,如果所述统计的个数不为零,则将所述边数最多的社区用户添加到所述第二用户集合中,计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的社区用户,如果所述边数最少的社区用户的个数小于二分之一的所述统计的个数,则将所述边数最少的社区用户从所述第二用户集合中排除;
[0031]第四步,对所述第二用户集合包括的社区用户的个数进行判断,如果所述第二用户集合包括的社区用户的个数大于或等于预设第一阈值且小于或等于预设第二阈值,将所述第二用户集合包括的社区用户聚类形成社区用户圈子。
[0032]如果所述第二用户集合包括的社区用户的个数小于预设第一阈值,所述方法还包括:
[0033]获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多的社区用户的个数,如果所述统计的个数为零,则将所述第二用户集合包括的社区用户形成社区用户圈子,如果所述统计的个数不为零,则执行所述第三步和所述第四步的步骤。
[0034]如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,所述方法还包括:
[0035]计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的一个社区用户并从所述第二用户集合排除;如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,则重复执行上述流程,直到所述第二用户集合包括的社区用户的个数小于或等于预设第二阈值时停止并将所述第二用户集合包括的社区用户形成社区用户圈子。
[0036]所述将所述第二用户集合包括的社区用户形成社区用户圈子之后,还包括:
[0037]获取第一社区用户圈子和第二社区用户圈子中相同的社区用户,所述第一社区用户圈子和所述第二社区用户圈子为任一两社区用户圈子,计算所述获取的社区用户在所述第一社区用户圈子中的第一百分比以及在所述第二社区用户圈子中的第二百分比,如果所述第一百分比和/或所述第二百分比大于预设百分比时,将所述第一社区用户圈子和所述第二社区用户圈子合并。
[0038]所述对社区用户进行聚类并形成社区用户圈子之后,还包括:
[0039]获取所述社区用户圈子包括的社区用户关注的社区话题,在所述社区用户圈子中统计关注所述社区话题的社区用户个数,选取社区用户个数最大的预设数值个社区话题,将所述选取的社区话题确定为所述社区用户圈子的属性。
[0040]一种挖掘社区用户的装置,所述装置包括:
[0041]第一获取模块,用于获取社区用户的社区原始数据,所述社区用户的社区原始数据包括所述社区用户对其他社区用户的关注度信息和所述社区用户与所述其他社区用户共同关注的话题个数;
[0042]计算模块,用于根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,所述亲密度分数用于标识所述社区用户对其他社区用户的亲密程度;
[0043]聚类模块,用于根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子;[0044]显示模块,用于将所述社区用户圈子显示给所述社区用户圈子包括的社区用户,以使所述社区用户圈子包括的各社区用户之间进行相互交流。
[0045]所述计算模块包括:
[0046]第一计算单元,用于根据所述社区用户对所述其他社区用户的关注度信息,计算所述社区用户对所述其他社区用户的关注度分数;
[0047]第二计算单元,用于根据所述社区用户与所述其他社区用户共同关注的话题个数,计算所述社区用户与所述其他社区用户之间的关注热点分数;
[0048]第三计算单元,用于根据所述社区用户对所述其他社区用户的关注度分数和所述社区用户与所述其他社区用户之间的关注热点分数,计算所述社区用户对所述其他社区用户的亲密度分数。
[0049]所述聚类模块包括:
[0050]第一扫描单元,用于扫描社区用户;
[0051]第四计算单元,用于根据所述扫描的社区用户对除所述扫描的社区用户以外的其他社区用户的亲密度分数和所述其他社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述其他社区用户之间的用户距离;
[0052]第一聚类单元,用于选取与所述扫描的社区用户的之间的用户距离小于预设用户距离门限的社区用户,将所述扫描的社区用户与所述选取的社区用户聚类成一个社区用户圈子。
[0053]所述装置还包括:
[0054]第一合并模块,用于将所述扫描的社区用户与所述选取的社区用户组成一个社区用户圈子之后,将所有社区用户圈子组成圈子集合,设置指针指向所述圈子集合包括的第一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描;
[0055]根据所述指针指向的社区用户圈子包括的社区用户对所述扫描的社区用户圈子包括的社区用户的亲密度分数和所述扫描的社区用户圈子包括的社区用户对所述指针指向的社区用户圈子包括的社区用户的亲密度,计算所述指针指向的社区用户圈子与所述扫描的社区用户圈子之间的圈子距离;
[0056]如果所述圈子距离小于预设圈子距离门限,则合并所述指针指向的社区用户圈子与所述扫描的社区用户圈子。
[0057]所述装置还包括:
[0058]第一扫描模块,用于如果所述指针指向的社区用户圈子不是所述圈子集合包括的最后一个社区用户圈子,则设置所述指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
[0059]所述装置还包括:
[0060]第二扫描模块,用于如果圈子距离大于或等于预设圈子距离门限,且如果所述扫描的社区用户圈子不是所述圈子集合包括的剩下最后一个社区用户圈子,则在所述圈子子集合包括的剩下社区用户圈子扫描下一个社区用户圈子;
[0061]第三扫描模块,用于如果圈子距离大于或等于预设圈子距离门限,且如果所述扫描的社区用户圈子是所述圈子集合包括的剩下最后一个社区用户圈子且所述指针指向的社区用户圈子不是所述圈子集合包括的最后一个社区用户圈子,则设置指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
[0062]所述聚类模块包括:
[0063]第二扫描单元,用于扫描社区用户,将其他社区用户形成第一用户集合,根据所述扫描的社区用户对所述第一用户集合包括的社区用户的亲密度分数和所述第一用户集合包括的社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述第一用户集合包括的社区用户之间的用户距离;
[0064]第一选取单元,用于从第一用户集合中选取与所述社区用户之间的用户距离最小的社区用户,将所述社区用户和所述选取的社区用户组成第二用户集合,获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多的社区用户的个数;
[0065]第二选取单元,用于如果所述统计的个数不为零,则将所述边数最多的社区用户添加到所述第二用户集合中,计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的社区用户,如果所述边数最少的社区用户的个数小于二分之一的所述统计的个数,则将所述边数最少的社区用户从所述第二用户集合中排除;
[0066]第二聚类单元,用于对所述第二用户集合包括的社区用户的个数进行判断,如果所述第二用户集合包括的社区用户的个数大于或等于预设第一阈值且小于或等于预设第二阈值,将所述第二用户集合包括的社区用户聚类形成社区用户圈子。
[0067]所述聚类模块还包括:
[0068]第三聚类单元,用于如果所述第二用户集合包括的社区用户的个数小于预设第一阈值,获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多的社区用户的个数,如果所述统计的个数为零,则将所述第二用户集合包括的社区用户形成社区用户圈子,如果所述统计的个数不为零,则执行所述第二选取单元和第二聚类单元的步骤。
[0069]所述聚类模块还包括:
[0070]第四聚类单元,用于如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的一个社区用户并从所述第二用户集合排除;如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,则重复执行上述流程,直到所述第二用户集合包括的社区用户的个数小于或等于预设第二阈值时停止并将所述第二用户集合包括的社区用户形成社区用户圈子。
[0071]所述装置还包括:
[0072]第二合并模块,用于将所述第二用户集合包括的社区用户形成社区用户圈子之后,获取第一社区用户圈子和第二社区用户圈子中相同的社区用户,所述第一社区用户圈子和所述第二社区用户圈子为任一两社区用户圈子,计算所述获取的社区用户在所述第一社区用户圈子中的第一百分比以及在所述第二社区用户圈子中的第二百分比,如果所述第一百分比和/或所述第二百分比大于预设百分比时,将所述第一社区用户圈子和所述第二社区用户圈子合并。[0073]所述装置还包括:
[0074]第二获取模块,用于对社区用户进行聚类并形成社区用户圈子之后,获取所述社区用户圈子包括的社区用户关注的社区话题,在所述社区用户圈子中统计关注所述社区话题的社区用户个数,选取社区用户个数最大的预设数值个社区话题,将所述选取的社区话题确定为所述社区用户圈子的属性。
[0075]本发明实施例中,通过获取社区用户的社区原始数据,根据社区原始数据计算社区用户对其他社区用户的亲密度分数,再根据亲密度分数对社区用户进行聚类,形成社区用户圈子并显示给该社区用户圈子中的每个社区用户,社区用户圈子是根据亲密度分数形成的,社区用户圈子中包括的各社区用户都是相互之间亲密程度较高的社区用户,各社区用户之间的互动交流的意愿较高,以及对于社区用户圈子中包括的任一社区用户,社区用户圈子中包括的社区用户可以为该社区用户收听的好友以外的其他社区用户,使该社区用户可以与其收听的好友以外的其他社区用户进行互动,提高了社区的互动性。
【专利附图】

【附图说明】
[0076]图1是本发明实施例1提供的一种挖掘社区用户的方法;
[0077]图2是本发明实施例2提供的一种挖掘社区用户的方法;
[0078]图3是本发明实施例3提供的一种挖掘社区用户的方法;
[0079]图4是本发明实施例4提供的一种挖掘社区用户的方法;
[0080]图5是本发明实施例5提供的一种挖掘社区用户的方法;
[0081]图6是本发明实施例6提供的一种挖掘社区用户的装置。
【具体实施方式】
[0082]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0083]实施例1
[0084]本发明实施例提供了一种挖掘社区用户的方法,参见图1,该方法包括:
[0085]步骤101:获取社区用户的社区原始数据,所述社区用户的社区原始数据包括所述社区用户对其他社区用户的关注度信息和所述社区用户与所述其他社区用户共同关注的话题个数;
[0086]步骤102:根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,所述亲密度分数用于标识所述社区用户对其他社区用户的亲密程度;
[0087]步骤103:根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子。
[0088]步骤104:将所述社区用户圈子显示给所述社区用户圈子包括的社区用户,以使所述社区用户圈子包括的各社区用户之间进行相互交流。
[0089]其中,在本发明实施例中,社区可以为微博,论坛或网络空间等。
[0090]本发明实施例中,通过获取社区用户的社区原始数据,根据社区原始数据计算社区用户对其他社区用户的亲密度分数,再根据亲密度分数对社区用户进行聚类,形成社区用户圈子并显示给该社区用户圈子中的每个社区用户,社区用户圈子是根据亲密度分数形成的,社区用户圈子中包括的各社区用户都是相互之间亲密程度较高的社区用户,各社区用户之间的互动交流的意愿较高,以及对于社区用户圈子中包括的任一社区用户,社区用户圈子中包括的社区用户可以为该社区用户收听的好友以外的其他社区用户,使该社区用户可以与其收听的好友以外的其他社区用户进行互动,提高了社区的互动性。
[0091]实施例2
[0092]本发明实施例提供了一种挖掘社区用户的方法。其中,在本发明实施例中,以微博作为社区为例进行说明,通过本发明实施例提供的方法挖掘微博用户,参见图2,该方法包括:
[0093]步骤201:获取微博用户的微博原始数据,该微博原始数据包括微博用户对其他微博用户的关注度信息和微博用户与其他微博用户共同关注话题的个数;
[0094]具体地,获取微博用户对其他微博用户的关注度信息和微博用户与其他微博用户共同关注话题的个数。
[0095]其中,微博用户对其他微博用户的关注度信息包括:微博用户的收听信息、微博用户转发其他微博用户的微博的转发次数、微博用户评论其他微博用户的微博的评论次数、微博用户发送信息给其他微博用户的信息发送次数和/或微博用户发送私信给其他微博用户的私信发送次数。
[0096]其中,微博用户的收听信息包括该微博用户收听的其他微博用户的身份标识。
[0097]其中,在本发明实施例中,微博服务器中存储有微博包括的每个微博用户的收听信息、每个微博用户转发其他微博用户的微博的转发次数、每个微博用户评论其他微博用户的微博的评论次数、每个微博用户发送信息给其他微博用户的信息发送次数、每个微博用户发送私信给其他微博用户的私信发送次数以及每个微博用户关注的微博话题。
[0098]所以,在本发明实施例中,对于任`一个微博用户,可以从微博服务器中获取该微博用户的收听信息、该微博用户转发其他微博用户的微博的转发次数、该微博用户评论其他微博用户的微博的评论次数、该微博用户发送信息给其他微博用户的信息发送次数、该微博用户发送私信给其他微博用户的私信发送次数和/或该微博用户关注的微博话题,根据该微博用户关注的微博话题和其他微博用户关注的微博话题,获取该微博用户和其他微博用户共同关注的微博话题。
[0099]步骤202:根据微博用户对其他微博用户的关注度信息,计算微博用户对其他微博用户的关注度分数;
[0100]其中,微博用户对其他微博用户的关注度分数包括:微博用户对其他微博用户的收听信息分数、微博用户转发评论其他微博用户的微博的转发评论分数、微博用户发送信息给其他微博用户的信息发送分数和/或微博用户发送私信给其他微博用户的私信发送分数。
[0101]其中,根据微博用户的收听信息,计算微博用户对其他微博用户的收听信息分数,可以为:
[0102]根据微博用户收听其他微博用户的收听信息和公式(1),计算微博用户对其他微博用户的收听分数;
_3] z{ij) = {\ ……(I)
[0104]其中,z(i,j)为微博用户对其他微博用户的收听信息分数函数,i为该微博用户,j为除该微博用户以外其他一个微博用户,如果微博用户i收听微博用户j,Z(i,j) = 1,如果微博用户i没有收听微博用户j,Z(i,j) = O。
[0105]其中,根据微博用户转发其他微博用户微博的转发次数、微博用户评论其他微博用户微博的评论次数,计算微博用户转发评论其他微博用户的微博的转发评论分数,可以为:
[0106]根据微博用户转发其他微博用户微博的转发次数、微博用户评论其他微博用户微博的评论次数和公式(2)计算微博用户转发评论其他微博用户的微博的转发评论分数;
[0107]f (i, j) = x+y......(2)
[0108]其中,f(i,j)为微博用户转发评论其他微博用户的微博的转发评论分数函数,i为该微博用户,j为除该微博用户以外其他一个微博用户,X为微博用户i转发微博用户j微博的转发次数,I为微博用户i评论微博用户j微博的评论次数。
[0109]其中,根据微博用户发送信息给其他微博用户的信息发送次数,计算微博微博用户发送信息给其他微博用户的信息发送分数,可以为:
[0110]根据微博用户发送信息给其他微博用户的信息发送次数和公式(3)计算微博微博用户发送信息给其他微博用户的信息发送分数;
[0111]g(i,j)=x……⑶
[0112]其中,g(i,j)为微博用户发送信息给其他微博用户的信息发送次数函数,i为该微博用户,j为除该微博用户以外其他一个微博用户,X为微博用户i发送信息给微博用户j的信息发送次数。
·[0113]其中,根据微博用户发送私信给其他微博用户的私信发送次数,计算微博微博用户发送私信给其他微博用户的私信发送分数,可以为:
[0114]根据微博用户发送私信给其他微博用户的私信发送次数和公式(4)计算微博微博用户发送私信给其他微博用户的私信发送分数;
[0115]h(i,j)=x......(4)
[0116]其中,h(i,j)为微博用户发送信息给其他微博用户的信息发送次数函数,i为该微博用户,j为除该微博用户以外其他一个微博用户,X为微博用户i发送私信给微博用户j的私信发送次数。
[0117]步骤203:根据微博用户与其他微博用户共同关注的话题个数,计算微博用户与其他微博用户之间的关注热点分数;
[0118]具体地,根据微博用户与其他微博用户共同关注的话题个数和公式(5),计算微博用户与其他微博用户之间的关注热点分数;
[0119]I (i, j, X) = X......(5)
[0120]其中,l(i,j, x)为微博用户与其他微博用户之间的关注热点分数函数,i为该微博用户,j为除该微博用户以外其他一个微博用户,X为微博用户i和微博用户j共同关注话题的个数。
[0121]步骤204:根据微博用户对其他微博用户的关注度分数和微博用户与其他微博用户之间的关注热点分数,计算微博用户对其他微博用户的亲密度分数;
[0122]其中,该亲密度分数用于标识微博用户对其他微博用户的亲密程度。
[0123]具体地,根据微博用户对其他微博用户的关注度分数、微博用户与其他微博用户之间的关注热点分数和公式6,计算微博用户对其他微博用户的亲密度分数;
【权利要求】
1.一种挖掘社区用户的方法,其特征在于,所述方法包括: 获取社区用户的社区原始数据,所述社区用户的社区原始数据包括所述社区用户对其他社区用户的关注度信息和所述社区用户与所述其他社区用户共同关注的话题个数;根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,所述亲密度分数用于标识所述社区用户对其他社区用户的亲密程度; 根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子; 将所述社区用户圈子显示给所述社区用户圈子包括的社区用户,以使所述社区用户圈子包括的各社区用户之间进行相互交流。
2.如权利要求1所述的方法,其特征在于,所述根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,包括: 根据所述社区用户对所述其他社区用户的关注度信息,计算所述社区用户对所述其他社区用户的关注度分数; 根据所述社区用户与所述其他社区用户共同关注的话题个数,计算所述社区用户与所述其他社区用户之间的关注热点分数; 根据所述社区用户对所述其他社区用户的关注度分数和所述社区用户与所述其他社区用户之间的关注热点分数,计算所述社区用户对所述其他社区用户的亲密度分数。
3.如权利要求1所述的方法,其特征在于,所述根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子,包括: 扫描社区用户; 根据所述扫描的社区用户对除所述 扫描的社区用户以外的其他社区用户的亲密度分数和所述其他社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述其他社区用户之间的用户距离; 选取与所述扫描的社区用户的之间的用户距离小于预设用户距离门限的社区用户,将所述扫描的社区用户与所述选取的社区用户聚类成一个社区用户圈子。
4.如权利要求3所述的方法,其特征在于,所述将所述扫描的社区用户与所述选取的社区用户组成一个社区用户圈子之后,还包括: 将所有社区用户圈子组成圈子集合,设置指针指向所述圈子集合包括的第一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描; 根据所述指针指向的社区用户圈子包括的社区用户对所述扫描的社区用户圈子包括的社区用户的亲密度分数和所述扫描的社区用户圈子包括的社区用户对所述指针指向的社区用户圈子包括的社区用户的亲密度,计算所述指针指向的社区用户圈子与所述扫描的社区用户圈子之间的圈子距离; 如果所述圈子距离小于预设圈子距离门限,则合并所述指针指向的社区用户圈子与所述扫描的社区用户圈子。
5.如权利要求4所述的方法,其特征在于,所述合并所述指针指向的社区用户圈子与所述扫描的社区用户圈子之后,还包括: 如果所述指针指向的社区用户圈子不是所述圈子集合包括的最后一个社区用户圈子,则设置所述指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
6.如权利要求4所述的方法,其特征在于,如果圈子距离大于或等于预设圈子距离门限,所述方法还包括: 如果所述扫描的社区用户圈子不是所述圈子集合包括的剩下最后一个社区用户圈子,则在所述圈子子集合包括的剩下社区用户圈子扫描下一个社区用户圈子; 如果所述扫描的社区用户圈子是所述圈子集合包括的剩下最后一个社区用户圈子且所述指针指向的社区用户圈子不是所述圈子集合包括的最后一个社区用户圈子,则设置指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
7.如权利要求1所述的方法,其特征在于,所述根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子,包括: 第一步,扫描社区用户,将其他社区用户形成第一用户集合,根据所述扫描的社区用户对所述第一用户集合包括的社区用户的亲密度分数和所述第一用户集合包括的社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述第一用户集合包括的社区用户之间的用户距离; 第二步,从第一用户集合中选取与所述社区用户之间的用户距离最小的社区用户,将所述社区用户和所述选取的社区用户组成第二用户集合,获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多 的社区用户的个数; 第三步,如果所述统计的个数不为零,则将所述边数最多的社区用户添加到所述第二用户集合中,计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的社区用户,如果所述边数最少的社区用户的个数小于二分之一的所述统计的个数,则将所述边数最少的社区用户从所述第二用户集合中排除; 第四步,对所述第二用户集合包括的社区用户的个数进行判断,如果所述第二用户集合包括的社区用户的个数大于或等于预设第一阈值且小于或等于预设第二阈值,将所述第二用户集合包括的社区用户聚类形成社区用户圈子。
8.如权利要求7所述的方法,其特征在于,如果所述第二用户集合包括的社区用户的个数小于预设第一阈值,所述方法还包括: 获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多的社区用户的个数,如果所述统计的个数为零,则将所述第二用户集合包括的社区用户形成社区用户圈子,如果所述统计的个数不为零,则执行所述第三步和所述第四步的步骤。
9.如权利要求7或8所述的方法,其特征在于,如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,所述方法还包括: 计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的一个社区用户并从所述第二用户集合排除;如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,则重复执行上述流程,直到所述第二用户集合包括的社区用户的个数小于或等于预设第二阈值时停止并将所述第二用户集合包括的社区用户形成社区用户圈子。
10.如权利要求7至9任一项权利要求所述的方法,其特征在于,所述将所述第二用户集合包括的社区用户形成社区用户圈子之后,还包括: 获取第一社区用户圈子和第二社区用户圈子中相同的社区用户,所述第一社区用户圈子和所述第二社区用户圈子为任一两社区用户圈子,计算所述获取的社区用户在所述第一社区用户圈子中的第一百分比以及在所述第二社区用户圈子中的第二百分比,如果所述第一百分比和/或所述第二百分比大于预设百分比时,将所述第一社区用户圈子和所述第二社区用户圈子合并。
11.如权利要求1所述的方法,其特征在于,所述对社区用户进行聚类并形成社区用户圈子之后,还包括: 获取所述社区用户圈子包括的社区用户关注的社区话题,在所述社区用户圈子中统计关注所述社区话题的社区用户个数,选取社区用户个数最大的预设数值个社区话题,将所述选取的社区话题确定为所述社区用户圈子的属性。
12.一种挖掘社区用户的装置,其特征在于,所述装置包括: 第一获取模块,用于获取社区用户的社区原始数据,所述社区用户的社区原始数据包括所述社区用户对其他社区用户的关注度信息和所述社区用户与所述其他社区用户共同关注的话题个数; 计算模块,用于根据所述社区用户的社区原始数据,计算所述社区用户对其他社区用户的亲密度分数,所述亲密度分数用于标识所述社区用户对其他社区用户的亲密程度; 聚类模块,用于根据所述社区用户对其他社区用户的亲密度分数对所述社区用户进行聚类并形成社区用户圈子; 显示模块,用于将所述社区用户圈子显示给所述社区用户圈子包括的社区用户,以使所述社区用户圈子包括的各社区用户之间进行相互交流。
13.如权利要求1所述的装置,其特征在于,所述计算模块包括: 第一计算单元,用于根据所述社区用户对所述其他社区用户的关注度信息,计算所述社区用户对所述其他社区用户的关注度分数; 第二计算单元,用于根据所述社区用户与所述其他社区用户共同关注的话题个数,计算所述社区用户与所述其他社区用户之间的关注热点分数; 第三计算单元,用于根据所述社区用户对所述其他社区用户的关注度分数和所述社区用户与所述其他社区用户之间的关注热点分数,计算所述社区用户对所述其他社区用户的亲密度分数。
14.如权利要求12所述的装置,其特征在于,所述聚类模块包括: 第一扫描单元,用于扫描社区用户; 第四计算单元,用于根据所述扫描的社区用户对除所述扫描的社区用户以外的其他社区用户的亲密度分数和所述其他社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述其他社区用户之间的用户距离; 第一聚类单元,用于选取与所述扫描的社区用户的之间的用户距离小于预设用户距离门限的社区用户,将所述扫描的社区用户与所述选取的社区用户聚类成一个社区用户圈子。
15.如权利要求14所述的装置,其特征在于,所述装置还包括: 第一合并模块,用于将所述扫描的社区用户与所述选取的社区用户组成一个社区用户圈子之后,将所有社区用户圈子组成圈子集合,设置指针指向所述圈子集合包括的第一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描; 根据所述指针指向的社区用户圈子包括的社区用户对所述扫描的社区用户圈子包括的社区用户的亲密度分数和所述扫描的社区用户圈子包括的社区用户对所述指针指向的社区用户圈子包括的社区用户的亲密度,计算所述指针指向的社区用户圈子与所述扫描的社区用户圈子之间的圈子距离; 如果所述圈子距离小于预设圈子距离门限,则合并所述指针指向的社区用户圈子与所述扫描的社区用户圈子。
16.如权利要求12所述的装置,其特征在于,所述装置还包括: 第一扫描模块,用于如果所述指针指向的社区用户圈子不是所述圈子集合包括的最后一个社区用户圈子,则设置所述指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
17.如权利要求12所述的装置,其特征在于,所述装置还包括: 第二扫描模块,用于如果圈子距离大于或等于预设圈子距离门限,且如果所述扫描的社区用户圈子不是所述圈子集合包括的剩下最后一个社区用户圈子,则在所述圈子子集合包括的剩下社区用户圈子扫描下一个社区用户圈子; 第三扫描模块,用于如果圈子距离大于或等于预设圈子距离门限,且如果所述扫描的社区用户圈子是所述圈子集合包括的剩下最后一个社区用户圈子且所述指针指向的社区用户圈子不是所述圈子集合·包括的最后一个社区用户圈子,则设置指针指向所述圈子集合包括的下一个社区用户圈子,从所述圈子集合包括的剩下第一个社区用户圈子开始扫描。
18.如权利要求12所述的装置,其特征在于,所述聚类模块包括: 第二扫描单元,用于扫描社区用户,将其他社区用户形成第一用户集合,根据所述扫描的社区用户对所述第一用户集合包括的社区用户的亲密度分数和所述第一用户集合包括的社区用户对所述扫描的社区用户的亲密度分数,计算所述扫描的社区用户与所述第一用户集合包括的社区用户之间的用户距离; 第一选取单元,用于从第一用户集合中选取与所述社区用户之间的用户距离最小的社区用户,将所述社区用户和所述选取的社区用户组成第二用户集合,获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多的社区用户的个数; 第二选取单元,用于如果所述统计的个数不为零,则将所述边数最多的社区用户添加到所述第二用户集合中,计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的社区用户,如果所述边数最少的社区用户的个数小于二分之一的所述统计的个数,则将所述边数最少的社区用户从所述第二用户集合中排除; 第二聚类单元,用于对所述第二用户集合包括的社区用户的个数进行判断,如果所述第二用户集合包括的社区用户的个数大于或等于预设第一阈值且小于或等于预设第二阈值,将所述第二用户集合包括的社区用户聚类形成社区用户圈子。
19.如权利要求18所述的装置,其特征在于,所述聚类模块还包括: 第三聚类单元,用于如果所述第二用户集合包括的社区用户的个数小于预设第一阈值,获取第一用户集合包括的未选择的社区用户与所述第二用户集合的边数,选取与所述第二用户集合的边数最多的社区用户,统计所述边数最多的社区用户的个数,如果所述统计的个数为零,则将所述第二用户集合包括的社区用户形成社区用户圈子,如果所述统计的个数不为零,则执行所述第二选取单元和第二聚类单元的步骤。
20.如权利要求18或19所述的装置,其特征在于,所述聚类模块还包括: 第四聚类单元,用于如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,计算所述第二用户集合包括的任一社区用户与所述第二用户集合包括的其他社区用户之间的边数,选取边数最少的一个社区用户并从所述第二用户集合排除;如果所述第二用户集合包括的社区用户的个数大于预设第二阈值,则重复执行上述流程,直到所述第二用户集合包括的社区用户的个数小于或等于预设第二阈值时停止并将所述第二用户集合包括的社区用户形成社区用户圈子。
21.如权利要求18至20任一项权利要求所述的装置,其特征在于,所述装置还包括: 第二合并模块,用于将所述第二用户集合包括的社区用户形成社区用户圈子之后,获取第一社区用户圈子和第二社区用户圈子中相同的社区用户,所述第一社区用户圈子和所述第二社区用户圈子为任一两社区用户圈子,计算所述获取的社区用户在所述第一社区用户圈子中的第一百分比以及在所述第二社区用户圈子中的第二百分比,如果所述第一百分比和/或所述第二百分比大于预设百分比时,将所述第一社区用户圈子和所述第二社区用户圈子合并。
22.如权利要求12所述的装置,其特征在于,所述装置还包括:· 第二获取模块,用于对社区用户进行聚类并形成社区用户圈子之后,获取所述社区用户圈子包括的社区用户关注的社区话题,在所述社区用户圈子中统计关注所述社区话题的社区用户个数,选取社区用户个数最大的预设数值个社区话题,将所述选取的社区话题确定为所述社区用户圈子的属性。
【文档编号】G06F17/30GK103853726SQ201210499292
【公开日】2014年6月11日 申请日期:2012年11月29日 优先权日:2012年11月29日
【发明者】程刚, 潘璇, 庄子明, 周静, 李鹤 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1