社交网络的用户社团划分方法和装置的制造方法

文档序号:10656695阅读:203来源:国知局
社交网络的用户社团划分方法和装置的制造方法
【专利摘要】本发明实施例提供了一种社交网络的用户社团划分方法和装置,该方法包括:获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络信息;根据信息交互关系针对社交网络中的用户创建社交网络图谱;利用深度优先算法对社交网络图谱进行搜索,得到强连通的用户群;将强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;将强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团。本发明无需对所有用户进行社团划分,减少了信息计算量;并且,本发明得到的多个用户社团是以需要分析的主题为基础进行划分的,允许了同一用户出现在多个社团的情况,并提高了社团划分的精准度和分析用途。
【专利说明】
社交网络的用户社团划分方法和装置
技术领域
[0001]本发明涉及数据挖掘技术领域,特别是涉及一种社交网络的用户社团划分方法和
目.0
【背景技术】
[0002]随着互联网和大数据的不断发展,在复杂的网络平台中逐渐形成了一种具有重要信息发布和信息交换功能的社交网络。其中,在社交网络中,具有相同爱好和兴趣的用户可以相互讨论和传播与兴趣相关的资讯信息,而这种有信息交流的用户聚集就形成了一种用户社团。
[0003]而为了结合社交网络中的信息进行舆情分析或者进行视频、资讯等信息的推荐,往往需要将社交网络中的众多用户划分为多个用户社团。其中,在传统的用户社团划分方法中,主要是基于用户交互关系(即交流情况)来将社交网络中的用户划分为多个不存在信息交流或者信息交流少的多个用户社团,以形成不相交的多个小网络。
[0004]但是,随着社交网络中数据量的不断增长,在进行社团划分时的计算量也在不断增加,因此,传统的用户社团划分方法很难精准对所有用户进行社团划分;另外,传统的用户社团划分方法是以用户为单位进行社团划分的,也就是说,一个用户只能属于一个社团,并不存在一个用户参加多个社团的情况,那么以此方法划分得到的用户社团在进行舆情分析或是信息推荐时效果不佳。
[0005]由此可见,现有技术中的用户社团划分方法普遍存在着用户社团间的用户不重合、社团划分计算量大、划分结果不精准以及划分结果的分析用途差的问题。

【发明内容】

[0006]本发明实施例所要解决的技术问题是提供一种社交网络的用户社团划分方法和装置,以解决现有的用户社团划分方法所存在的用户社团间的用户不重合、社团划分计算量大、划分结果不精准以及划分结果的分析用途差的问题。
[0007]为了解决上述问题,根据本发明的一个方面,本发明公开了一种社交网络的用户社团划分方法,包括:
[0008]获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络信息;
[0009]根据所述信息交互关系对所述社交网络中的用户创建社交网络图谱;
[0010]利用深度优先算法针对所述社交网络图谱进行搜索,得到强连通的用户群;
[0011]将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;
[0012]将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团,得到对应不同主题的多个第一用户社团。
[0013]根据本发明的另一方面,本发明还公开了一种社交网络的用户社团划分装置,包括:
[0014]第一获取模块,用于获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络信息;
[0015]创建模块,用于根据所述信息交互关系针对所述社交网络中的用户创建社交网络图谱;
[0016]第一搜索模块,用于利用深度优先算法对所述社交网络图谱进行搜索,得到强连通的用户群;
[0017]第一匹配模块,用于将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;
[0018]第一划分模块,用于将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团,得到对应不同主题的多个第一用户社团。
[0019]与现有技术相比,本发明实施例包括以下优点:
[0020]本发明实施例可以利用用户间的信息交互关系和深度优先算法搜索社交网络中强连通的用户群,从而实现了信息交流活跃的用户群的快速搜索;并且,以强连通的用户群为基础,根据该用户群内用户间的交互信息和需要分析的主题对活跃用户群进行进一步的社团划分,从而形成了与所需要分析的不同主题密切相关的多个社团,该多个社团由活跃用户构成。在此实施例中,无需对所有用户进行社团划分,减少了信息计算量;并且,得到的多个用户社团是以需要分析的主题为基础进行划分的,允许了同一用户出现在多个社团的情况,并提高了社团划分的精准度和分析用途。
[0021]此外,本发明实施例可以对网络用户有效的划分出活跃用户和不活跃用户,再分别针对两类用户基于所要分析的主题进行进一步细化的社团划分,使得划分得到的用户社团内的成员从属于相同的主题,利于后续的舆情分析和信息推荐。
【附图说明】
[0022]图1是本发明的一种社交网络的用户社团划分方法实施例的步骤流程图;
[0023]图2是本发明的另一种社交网络的用户社团划分方法实施例的步骤流程图;
[0024]图3是本发明的又一种社交网络的用户社团划分方法实施例的步骤流程图;
[0025]图4是本发明的一种社交网络的用户社团划分装置实施例的结构框图;
[0026]图5是本发明的另一种社交网络的用户社团划分装置实施例的结构框图。
【具体实施方式】
[0027]为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和【具体实施方式】对本发明作进一步详细的说明。
[0028]本发明实施例的核心构思之一在于,利用用户间的信息交互关系和深度优先算法搜索社交网络中强连通的用户群,从而实现了信息交流活跃的用户群的快速搜索;并且,以强连通的用户群为基础,根据该用户群内用户间的交互信息和需要分析的主题对活跃用户群进行进一步的社团划分,从而形成了与所需要分析的不同主题密切分别对应的由活跃用户构成的多个社团。
[0029]参照图1,示出了本发明的一种社交网络的用户社团划分方法实施例的步骤流程图,具体可以包括如下步骤:
[0030]步骤101,获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络?目息;
[0031 ]其中,可以借助于网络数据采集工具来抓取社交网络信息,其中,该社交网络信息可以包括社交网络中各个用户间的信息交互转发关系(例如,用户A向用户B发送消息,用户B将该消息转发给C)以及存在信息交互的两个用户间交流的信息,即上述消息。
[0032]步骤103,根据所述信息交互关系针对所述社交网络中的用户创建社交网络图谱;
[0033]其中,由于信息交互关系中包括信息发送者和接收者或者转发者,并且具有信息流向的方向性,因此,可以根据网络抓取的信息交互关系建立有向的社交网络图谱。
[0034]步骤105,利用深度优先算法对所述社交网络图谱进行搜索,得到强连通的用户群;
[0035]其中,可以利用深度优先搜索(depth-firstsearch)算法搜索社交网络图谱中活跃重要的用户群;其中,强连通的用户群是指考虑社交网络图谱中信息流向的方向时,用户群中任意一用户的信息都有潜在路径传播到此用户群中另外任意其他用户。
[0036]步骤107,将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;
[0037]其中,在搜索到信息交流频繁的活跃重要用户群体后,就可以将该强连通的用户群中用户交流内容与需要分析的主题列表进行匹配。其中,可以预先建立需要分析的舆情主题列表,并且,各个舆情主题可以用一个或一系列的关键词代表。
[0038]步骤109,将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团,得到对应不同主题的多个第一用户社团。
[0039]其中,在强连通的用户群中,各个用户间交流的内容如果与同一个主题(例如舆情主题)相符,那么就可以将这些用户从强连通的用户群中再划分出来,形成第一用户社团。例如,用户I?用户3交流的内容与“音乐”主题匹配,那么可以将用户I?用户3划分为第一用户社团;而用户4?用户6交流的内容与“电影”主题匹配,那么可以将用户4?用户6划分为第一用户社团。也就是说,本发明实施例所限定的第一用户社团只是一种社团种类,并非用户社团数量,而划分得到的每种用户社团都可以包括多个用户社团。
[0040]借助于本发明上述实施例的技术方案,本发明实施例可以利用用户间的信息交互关系和深度优先算法搜索社交网络中强连通的用户群,从而实现了信息交流活跃的用户群的快速搜索;并且,以强连通的用户群为基础,根据该用户群内用户间的交互信息和需要分析的主题对活跃用户群进行进一步的社团划分,从而形成了与所需要分析的不同主题密切分别对应的由活跃用户构成的多个社团。在此实施例中,无需对所有用户进行社团划分,减少了信息计算量;并且,得到的多个用户社团是以需要分析的主题为基础进行划分的,允许了同一用户出现在多个社团的情况,并提高了社团划分的精准度和分析用途。
[0041]参照图2,示出了本发明的另一种社交网络的用户社团划分方法实施例的步骤流程图,具体可以包括如下步骤:
[0042]步骤201,获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络?目息;
[0043]步骤203,根据需要分析的主题对所述社交网络信息进行筛选;
[0044]其中,为了避免划分得到的用户社团交流的信息与所要分析的舆情主题无关,增加无效社团的情况。可以预先建立需要分析的舆情主题列表,并且,各个舆情主题可以用一个或一系列的关键词代表;并根据该舆情主题列表对获取的社交网络信息进行筛选。
[0045]步骤205,删除所述社交网络信息中不符合所述主题的社交网络信息,得到筛选后的社交网络信息;
[0046]其中,一个舆情主题可以由多个关键词构成,那么在进行社交网络信息的筛选时,就可以将社交网络信息中用户间交流的内容与任意一个关键词都不相同,或者不包含在任意一个关键词中的社交网信息删除(这里删除的社交网络信息包括用户间的信息交互关系和对应的交流内容,其中,如果社交网络信息还包括用户的属性,则将对应的用户属性也删除)。
[0047]步骤207,根据所述筛选后的社交网络信息中的信息交互关系对所述社交网络中的用户创建社交网络图谱;
[0048]其中,所述社交网络图谱可以包括:用于表示信息发送方、信息接收方或信息转发方的若干个节点,以及用于表示信息发送方、信息接收方或信息转发方之间的信息交互关系的若干条边。具体而言,其中,信息发布者可以作为社交网络图谱中某个有向连接的起点,信息接收者或者转发者可以作为社交网络图谱中该有向连接的终点。其中,由于具有同样兴趣爱好的用户会相互交流,这样就形成了相互连接的群体。
[0049]步骤209a,利用深度优先算法对所述社交网络图谱进行搜索,得到强连通的用户群;
[0050]步骤211a,将所述强连通的用户群中的用户数量与第一预定阈值比较;
[0051]其中,为了便于后续的进一步划分,可以将每个活跃用户群体的用户总数量与预先设定的活跃用户数量阈值作比较;
[0052]步骤213a,将用户数量小于所述第一预定阈值的强连通的用户群直接划分为第二用户社团;
[0053]其中,对于用户数量小于预先设定的活跃用户数量阈值的强连通群,如果再进行进一步划分则会造成所包含的用户数量过少的情况,这样不利于后续的数据分析,因此,对用户数量过少的强连通的用户群可以不再进行后续划分。
[0054]步骤215a,在所述用户数量大于等于所述第一预定阈值时,将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;
[0055]步骤217a,将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团;
[0056]可选的,在另一个实施例中,为了对划分的第一用户社团进行细化,根据本发明图2所示实施例的划分方法还可以包括:计算所述第一用户社团中每对用户间的信息交互次数;将所述第一用户社团中对应于所述信息交互次数大于等于第二预定阈值的用户划分为第三用户社团。
[0057]通过本发明实施例的技术方案,可以将活跃社团中用户间交流次数较多的用户细化为另一用户社团,提高划分结果的分析用途。
[0058]步骤209b,利用所述深度优先算法对所述社交网络图谱进行搜索,得到弱连通的用户群;
[0059]其中,在利用深度优先算法对社交网络图谱进行搜索时,可以忽略社交网络图谱中的方向性,这样所有被连接在一起的用户群体都可以形成弱连通的用户群。
[0060]步骤211b,将所述弱连通的用户群中的用户数量与第三预定阈值比较;
[0061]其中,为了便于后续的进一步划分,可以将每个不活跃用户群体的用户总数量与预先设定的不活跃用户数量阈值作比较;
[0062]步骤213b,将用户数量小于所述第三预定阈值的弱连通的用户群直接划分为第五用户社团;
[0063]其中,对于用户数量小于预先设定的不活跃用户数量阈值的弱连通群,如果再进行进一步划分则会造成所包含的用户数量过少的情况,这样不利于后续的数据分析,因此,对用户数量过少的弱连通的用户群可以不再进行后续划分,以此得到的第五用户社团基本是由不存在信息交互的用户构成。
[0064]步骤215b,在所述用户数量大于等于所述第三预定阈值时,将所述弱连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;
[0065]其中,对于用户数量高于预先设定的不活跃用户数量阈值的弱连通的用户群,可以基于用户间交流的内容细分为属于某个舆情主题下的某个用户社团,因此,可以将用户间交流的内容与需要分析的主题列表分别进行匹配。
[0066]步骤217b,将所述弱连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第四用户社团。
[0067]其中,可以将弱连通的用户群中与同一个主题匹配成功的交流内容所对应的用户细化为第四用户社团。
[0068]可选的,在一个实施例中,为了利用上述流程划分得到的用户社团进行分析和资讯推荐,根据本发明实施例的划分方法还包括:获取划分得到的每个用户社团内的用户的属性(例如、兴趣爱好、个人简介、交流的信息、用户头像、用户标签等);然后,根据所述用户的属性确定每个用户社团的共同特征;最后,根据每个用户社团的所述共同特征对每个用户社团进行信息推荐和/或舆情分析。
[0069]举例来说,对于划分得到的某一个用户社团,如果该社团内的成员大多为女生,出生日期在1990年?1998年,交流的信息主要为热播的韩剧,那么就可以根据这些共同特征对该社团内的每个成员进行热播韩剧的推荐,和/或做出舆情分析。
[0070]通过以上描述可以看成,借助本发明实施例的上述技术方案,本发明实施例可以对网络用户有效的划分出活跃用户和不活跃用户,再分别针对两类用户基于所要分析的主题进行进一步细化的社团划分,使得划分得到的用户社团内的成员从属于相同的主题,利于后续的舆情分析和信息推荐。
[0071]为了更好的理解本发明的上述技术方案,下面结合一具体实施例来对本发明的上述技术方案进行详细阐述。
[0072]参照如图3,示出了本发明的另一种社交网络的用户社团划分方法实施例的步骤流程图,具体可以包括如下步骤:
[0073]步骤301,获取社交网络中用户和交流信息数据;
[0074]其中,可以借助网络数据采集工具,抓取社交网络信息,包括用户间信息交互转发关系,用户交流内容,用户属性等;同时,建立所要分析的舆情主题列表,各个舆情主题可以用一个或一系列的关键词代表。
[0075]步骤303,匹配交流信息到舆情主题(关键词)列表;
[0076]其中,可以匹配所获得社交网络中用户交流内容是否与所要分析的主题相符;
[0077]步骤305,如果为否,则信息不纳入分析;
[0078]其中,与舆情主题(关键词)列表不符合的社交网络信息全部不纳入分析,其余的社交网络信息作为后继分析的数据源。
[0079]步骤307,建立社交网络图谱,利用强(弱)连通划分用户群体;
[0080]其中,可以利用抓取的用户间交互转发关系和方向性建立有向社交关系图谱,其中信息发布者作为关系图中某个有向连接的起点,信息接收者(或者转发者)作为关系图中此有向连接的终点。有同样兴趣的用户会相互交流,或者通过类似的渠道获得信息,从而形成相连的群体;
[0081]然后,利用深度优先搜索算法可以初步划分用户到强、弱连通群体。这里弱连通的用户群是指忽略社交关系图谱中方向性时,所有被连接在一起的用户群体。强连通的用户群是指考虑社交关系图谱中方向性时,用户群中的任一用户的信息都有潜在路径传播到此群中的另外任一其他用户,其中,强连通的用户群体属于活跃重要的用户群体。
[0082]其中,深度优先搜索是一种经典的在图中搜索用户间链接路径的方法。具体过程如下:在社交网络关系图中,从任一用户开始,跟随图中有向或无向链接关系,向外探索。如果此用户有相邻的用户而且从未被访问过,则访问邻居用户,然后从此邻居用户再寻找其他的未被访问的邻居。如果找不到,则返回到上一个用户。重复这个过程直到图中所有相连接的用户都被访问过为止。这样从图中任一用户开始,到任一其他用户的所有路径都可以被找到。进而获得图中所有用户间的消息传播路径,用于确定强或弱连通的用户群。
[0083]步骤309,利用信息内容划分用户到舆情主题相关社团;
[0084]其中,利用用户间交互关系获得初步划分的用户群后,用户的交流内容等可以被用于进一步的用户划分。这样就可以将同一连通用户群中交流相同内容的用户细分为属于某个舆情主题下的某个用户社团。
[0085]下面对弱连通的用户群和强连通的用户群的后续划分分别进行阐述:
[0086]对于弱连通的用于群,在利用用户信息交换转发关系划分所有用户到多个弱连通用户群后,会将某个用户群的用户数量与第一阈值作比较;如果某个用户群中用户的数量过小(比如小于第一阈值),则认为他们为一个社团,不再进行继续划分。
[0087]如果群中用户数量大于第一阈值,则利用确定的舆情主题继续划分用户团体。根据用户的交流内容与所要分析舆情主题(关键词)的相符度,划分弱关联用户群中涉及到某个舆情主题的信息发布者和接收转发者到一个舆情相关的用户社团中。比如舆情主题为影视节目A和影视节目B,则弱连通用户群会被继续细分为社团A和社团B。这里舆情相关的用户社团允许重合的情况,即某些用户可以属于多个舆情相关社团。
[0088]对于强连通的用户群,群体中包含着社交网络图谱中的活跃、重要、有影响的用户,那么和他们有紧密联系的用户所组成的社团很大可能是舆情分析或者营销的中心。因此,寻找和划分某个特定舆情主题下的活跃用户社团能够为相关分析提供重要的数据支持。
[0089]当完全集中在强连通的用户群的挖掘时,可以利用强连通关系,对强连通的用户群的用户数量与预先设定的第二阈值作比较,如果某个用户群中用户的数量过小(比如小于第二阈值),则认为他们为一个社团,不再进行继续划分。
[0090]如果强连通的用户群中用户数量大于第二阈值,则确定用户数量大于第二阈值的强连通用户群为活跃的用户群。然后,就可根据用户的交流内容与所要分析舆情主题(关键词)的相符度,继续划分涉及到某个舆情主题的信息发布者和接收转发者到一个舆情相关的用户社团。比如舆情主题为影视节目A和影视节目B,则某个强连通活跃重要用户群会被继续分为社团A和社团B。同样用户社团的划分允许重合。
[0091]更进一步地,可以考虑将同一对用户间的交流次数记为社交关系图谱中的有向连接权重,多次有向连接代表高权重。然后,根据有向连接的权重,就可以继续划出用户交流转发关系权重都大于某个阈值的活跃团体。其中,社团中用户间交流次数越多,社团越活跃,用户的信息被转发越多,用户越重要。
[0092]步骤311,各种社团内和社团间的分析。
[0093]其中,上述流程划分的用户社团为后继更多分析提供了基础。比如可以利用社团中用户的兴趣爱好、个人简介、交流信息和用户画像,提取某个舆情下的潜在内容特征。另夕卜,由于这里社团可重合,当舆情主题比较相近且社团中用户高度重合时,可为未来的分析和营销等提供借鉴。
[0094]其中,本实施例所用的系统开发工具为R语言开发工具和Java,但是本发明对于开发工具并不做具体限定,可以根据不同的应用场景做出灵活调整。
[0095]从以上描述可以看成,本发明实施例的划分方法,相对于传统方法中追求对社交网络中每一个用户都精准划分团体的划分方式,本发明实施例的划分发法能够区分出社交网络中的活跃用户,并划分他们到需要分析的舆情主题下。而且,不同于许多社团划分方法只划分用户到唯一社团的情况,这里允许用户涉及到多个舆情主题社团中。此外,和众多的社团划分方法一样,本发明实施例的方法并不应用于包含社交网络水军的场景。
[0096]需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
[0097]参照图4,示出了本发明一种社交网络的用户社团划分装置实施例的结构框图,具体可以包括如下模块:
[0098]第一获取模块41,用于获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络信息;
[0099]创建模块42,用于根据所述信息交互关系针对所述社交网络中的用户创建社交网络图谱;
[0100]第一搜索模块43,用于利用深度优先算法对所述社交网络图谱进行搜索,得到强连通的用户群;
[0101]第一匹配模块44,用于将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;
[0102]第一划分模块45,用于将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团,得到对应不同主题的多个第一用户社团。
[0103]借助于本发明上述实施例的技术方案,本发明实施例可以利用用户间的信息交互关系和深度优先算法搜索社交网络中强连通的用户群,从而实现了信息交流活跃的用户群的快速搜索;并且,以强连通的用户群为基础,根据该用户群内用户间的交互信息和需要分析的主题对活跃用户群进行进一步的社团划分,从而形成了与所需要分析的不同主题密切分别对应的由活跃用户构成的多个社团。在此实施例中,无需对所有用户进行社团划分,减少了信息计算量;并且,得到的多个用户社团是以需要分析的主题为基础进行划分的,允许了同一用户出现在多个社团的情况,并提高了社团划分的精准度和分析用途。
[0104]需要注意的是,上述方法实施例中涉及的第一、第二、第三、第四和第五用户社团表示的是用户社团的类别,即借助于本发明上述实施例的技术方案至少可以将用户划分为五种社团,而每种社团所包含的社团个数并不作具体限定,即,并不限制为一个,每种社团所包含的社团个数根据实际应用场景灵活划分得到;另外,在各种用户社团之间以及从属于同一种用户社团的多个用户社团之间还可以存在重叠用户的情况。
[0105]另外,在一个实施例中,参照图5,示出了包含本发明图4所示的另一种社交网络的用户社团划分装置实施例的结构框图,具体还可以包括如下模块:
[0106]第一筛选模块46,用于根据需要分析的主题对所述社交网络信息进行筛选;
[0107]第一删除模块47,用于删除所述社交网络信息中不符合所述主题的社交网络信息,得到筛选后的社交网络信息;
[0108]所述创建模块42,用于根据所述第一筛选模块筛选后的社交网络信息中的信息交互关系对所述社交网络中的用户创建社交网络图谱;
[0109]其中,所述社交网络图谱包括:用于表示信息发送方、信息接收方或信息转发方的若干个节点,以及用于表示信息发送方与信息接收方或信息转发方之间的信息交互关系的若干条边。
[0110]第一比较模块48,用于将所述强连通的用户群中的用户数量与第一预定阈值比较;
[0111]第二划分模块49,用于将用户数量小于所述第一预定阈值的强连通的用户群直接划分为第二用户社团;
[0112]所述第一匹配模块44,用于在所述用户数量大于等于所述第一预定阈值时,将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配。
[0113]计算模块50,用于计算所述第一用户社团中每对用户间的信息交互次数;
[0114]第三划分模块51,用于将所述第一用户社团中对应于所述信息交互次数大于等于第二预定阈值的用户划分为第三用户社团;
[0115]第二搜索模块52,用于利用所述深度优先算法对所述社交网络图谱进行搜索,得到弱连通的用户群;
[0116]第二比较模块53,用于将所述弱连通的用户群中的用户数量与第三预定阈值比较;
[0117]第五划分模块54,用于将用户数量小于所述第三预定阈值的弱连通的用户群直接划分为第五用户社团;
[0118]第二匹配模块55,用于在所述用户数量大于等于所述第三预定阈值时,将所述弱连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配。
[0119]第四划分模块56,用于将所述弱连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第四用户社团;
[0120]第二获取模块57,用于获取划分得到的每个用户社团内的用户的属性;
[0121]确定模块58,用于根据所述用户的属性确定每个用户社团的共同特征;
[0122]推荐模块59,用于根据每个用户社团的所述共同特征对每个用户社团进行信息推荐;和/或
[0123]舆情分析模块60,用于根据每个用户社团的所述共同特征对每个用户社团进行舆情分析。
[0124]本发明实施例的装置可以快速寻找到社交网络中相关的用户群,用以确立舆情主题相关的受众目标;并且,可以确立用户群中活跃重要用户,用以分析舆情传播中的高影响力用户;为后续的社团内和社团间的分析提供基础。
[0125]此外,本发明实施例的装置在社交网络的舆情分析方面有广泛的应用前景,尤其能够为不同舆情(比如相同和不同题材的视频节目,IP,公众人物和重要事件的舆情)的关联发现和营销策略的制定提供重要数据支持。
[0126]对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0127]本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0128]本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0129]本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0130]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0131]这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0132]尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0133]最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0134]以上对本发明所提供的一种社交网络的用户社团划分方法和一种社交网络的用户社团划分装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
【主权项】
1.一种社交网络的用户社团划分方法,其特征在于,包括: 获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络信息; 根据所述信息交互关系针对所述社交网络中的用户创建社交网络图谱; 利用深度优先算法对所述社交网络图谱进行搜索,得到强连通的用户群; 将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团,得到对应不同主题的多个第一用户社团。2.根据权利要求1所述的方法,其特征在于,所述社交网络图谱包括:用于表示信息发送方、信息接收方或信息转发方的若干个节点,以及用于表示信息发送方、信息接收方或信息转发方之间的信息交互关系的若干条边。3.根据权利要求1所述的方法,其特征在于,在所述根据所述信息交互关系对所述社交网络中的用户创建社交网络图谱的步骤之前,所述方法还包括: 根据需要分析的主题对所述社交网络信息进行筛选; 删除所述社交网络信息中不符合所述主题的社交网络信息,得到筛选后的社交网络信息; 所述根据所述信息交互关系对所述社交网络中的用户创建社交网络图谱包括: 根据所述筛选后的社交网络信息中的信息交互关系对所述社交网络中的用户创建社交网络图谱。4.根据权利要求1所述的方法,其特征在于,在所述将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配的步骤之前,所述方法还包括: 将所述强连通的用户群中的用户数量与第一预定阈值比较; 将用户数量小于所述第一预定阈值的强连通的用户群直接划分为第二用户社团。5.根据权利要求1所述的方法,其特征在于,在所述将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团,得到对应不同主题的多个第一用户社团的步骤之后,所述方法还包括: 计算所述第一用户社团中每对用户间的信息交互次数; 将所述第一用户社团中对应于所述信息交互次数大于等于第二预定阈值的用户划分为第三用户社团。6.根据权利要求1所述的方法,其特征在于,在所述将根据所述信息交互关系对所述社交网络中的用户创建社交网络图谱的步骤之后,所述方法还包括: 利用所述深度优先算法对所述社交网络图谱进行搜索,得到弱连通的用户群; 将所述弱连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配;将所述弱连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第四用户社团。7.根据权利要求6所述的方法,其特征在于,在所述将所述弱连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配的步骤之前,所述方法还包括: 将所述弱连通的用户群中的用户数量与第三预定阈值比较; 将用户数量小于所述第三预定阈值的弱连通的用户群直接划分为第五用户社团。8.根据权利要求1至7中任意一项所述的方法,其特征在于,所述方法还包括: 获取划分得到的每个用户社团内的用户的属性; 根据所述用户的属性确定每个用户社团的共同特征; 根据每个用户社团的所述共同特征对每个用户社团进行信息推荐和/或舆情分析。9.一种社交网络的用户社团划分装置,其特征在于,包括: 第一获取模块,用于获取社交网络中各个用户间的信息交互关系和交互信息以形成社交网络信息; 创建模块,用于根据所述信息交互关系针对所述社交网络中的用户创建社交网络图谱; 第一搜索模块,用于利用深度优先算法对所述社交网络图谱进行搜索,得到强连通的用户群; 第一匹配模块,用于将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配; 第一划分模块,用于将所述强连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第一用户社团,得到对应不同主题的多个第一用户社团。10.根据权利要求9所述的装置,其特征在于,所述社交网络图谱包括:用于表示信息发送方、信息接收方或信息转发方的若干个节点,以及用于表示信息发送方与信息接收方或信息转发方之间的信息交互关系的若干条边。11.根据权利要求9所述的装置,其特征在于,所述装置还包括: 第一筛选模块,用于根据需要分析的主题对所述社交网络信息进行筛选; 第一删除模块,用于删除所述社交网络信息中不符合所述主题的社交网络信息,得到筛选后的社交网络信息; 所述创建模块,用于根据所述第一筛选模块筛选后的社交网络信息中的信息交互关系对所述社交网络中的用户创建社交网络图谱。12.根据权利要求9所述的装置,其特征在于,所述装置还包括: 第一比较模块,用于将所述强连通的用户群中的用户数量与第一预定阈值比较; 第二划分模块,用于将用户数量小于所述第一预定阈值的强连通的用户群直接划分为第二用户社团; 所述第一匹配模块,用于在所述用户数量大于等于所述第一预定阈值时,将所述强连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配。13.根据权利要求9所述的装置,其特征在于,所述装置还包括: 计算模块,用于计算所述第一用户社团中每对用户间的信息交互次数; 第三划分模块,用于将所述第一用户社团中对应于所述信息交互次数大于等于第二预定阈值的用户划分为第三用户社团。14.根据权利要求9所述的装置,其特征在于,所述装置还包括: 第二搜索模块,用于利用所述深度优先算法对所述社交网络图谱进行搜索,得到弱连通的用户群; 第二匹配模块,用于将所述弱连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配; 第四划分模块,用于将所述弱连通的用户群中与同一主题匹配成功的交互信息所对应的用户划分为第四用户社团。15.根据权利要求14所述的装置,其特征在于,所述装置还包括: 第二比较模块,用于将所述弱连通的用户群中的用户数量与第三预定阈值比较; 第五划分模块,用于将用户数量小于所述第三预定阈值的弱连通的用户群直接划分为第五用户社团; 所述第二匹配模块,用于在所述用户数量大于等于所述第三预定阈值时,将所述弱连通的用户群中各个用户间的交互信息与需要分析的主题列表进行匹配。16.根据权利要求9至15中任意一项所述的装置,其特征在于,所述装置还包括: 第二获取模块,用于获取划分得到的每个用户社团内的用户的属性; 确定模块,用于根据所述用户的属性确定每个用户社团的共同特征; 推荐模块,用于根据每个用户社团的所述共同特征对每个用户社团进行信息推荐;和/或 舆情分析模块,用于根据每个用户社团的所述共同特征对每个用户社团进行舆情分析。
【文档编号】G06Q50/00GK106022938SQ201610389793
【公开日】2016年10月12日
【申请日】2016年6月2日
【发明人】胡晓亮, 蔡龙军, 王雷
【申请人】北京奇艺世纪科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1