一种基于网络结构优化的节点属性划分朋友圈的方法

文档序号:6633596阅读:317来源:国知局
一种基于网络结构优化的节点属性划分朋友圈的方法
【专利摘要】本发明公开了一种基于网络结构优化的节点属性划分朋友圈的方法,包括:建立特征向量步骤;计算朋友之间的曼哈顿距离步骤;选定核心朋友步骤;划分社团步骤;社团优化调整步骤。本发明先使用节点属性进行初步的社团划分,然后利用网络结构信息对于划分结果进一步优化调整,充分利用在线社交网络中可以获取到的信息,能够获得更加准确的社团划分结果,从而实现对用户的朋友圈自动分组,能够有效完善社交网络平台功能,适用于社交网络平台功能的应用和优化。
【专利说明】—种基于网络结构优化的节点属性划分朋友圈的方法

【技术领域】
[0001]本发明属于数据处理【技术领域】,尤其是涉及一种根据社交网络中用户朋友圈中朋友的档案信息,进行分组划分,然后利用朋友圈中朋友连接关系对分组进行优化的朋友圈分组方法。

【背景技术】
[0002]社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系,这些个体成员拥有共同的兴趣、同属某一特定的主题或是共有某种属性。随着社交网络的发展,我们可能在一个社交网络平台上拥有几百甚至上千在线朋友组成的朋友圈,我们“粉”(建立社交关系)的人会产生大量的信息,为了处理信息过载问题,就需要管理我们的个人社交网络。当社交朋友数量越来越庞大时,对朋友圈进行分组就成为必然。而当前的社交网络平台中没有提供自动分组功能,对于在社交平台上拥有上千乃至上万朋友的用户来说,手工对朋友圈进行分组是一件耗时费力的事情。


【发明内容】

[0003]为解决上述问题,本发明公开了基于网络结构优化的节点属性划分朋友圈的方法,它先采用朋友圈中用户的档案信息作为依据进行粗略的分组,然后利用朋友圈的网络结构对分组进行调整,实现对于朋友圈自动分组的功能。
[0004]为了达到上述目的,本发明提供如下技术方案:
[0005]一种基于网络结构优化的节点属性划分朋友圈的方法,包括以下步骤:
[0006]建立特征向量:根据当前用户朋友圈中每个朋友的档案信息建立朋友的特征向量;
[0007]计算朋友之间的曼哈顿距离:先对两个朋友之间的特征向量取并,然后对得到的结果向量取模;
[0008]选定核心朋友:选取与其他任意朋友距离都小于阈值α的朋友作为核心;
[0009]划分社团:针对每个核心朋友,找到其余用户与核心朋友共同的特征,根据共同特征扩展具有相同特征的朋友形成社团;
[0010]社团优化调整:将朋友调整至与其连接数最大的分组中。
[0011]进一步的,所述特征向量包括以下信息中的至少一种:年龄、性别、所在地、出生地、教育经历、工作单位、工作地点、爱好。
[0012]优选的,阈值α的取值范围如下:1/3特征向量维度数彡阈值α ( 1/2特征向量维度数。
[0013]具体的,所述特征向量维度数与建立特征向量步骤中选取的档案信息数量一致。
[0014]具体的,所述社团优化调整步骤具体为:计算每个朋友与其所属的多个分组的连接数,选其最大连接数的分组作为该朋友的分组,循环迭代,直到分组不再发生变化或者达到一定的次数。
[0015]与现有技术相比,本发明具有如下优点和有益效果:
[0016]本发明基于网络结构优化的节点属性划分朋友圈,有效组织个人朋友圈,从而可以过滤冗杂无用的信息,有效避免信息过载问题。本发明先使用节点属性进行初步的社团划分,然后利用网络结构信息对于划分结果进一步优化调整,充分利用在线社交网络中可以获取到的用户档案信息和结构信息,能够获得更加准确的社团划分结果,从而实现对用户的朋友圈自动分组,避免有一方信息缺失时带来的缺陷。本发明能够有效完善社交网络平台功能,适合于各类社交网络平台给用户提供自动分组朋友圈的功能,适用于社交网络平台功能的应用和优化。

【专利附图】

【附图说明】
[0017]图1为本发明的步骤流程图。

【具体实施方式】
[0018]以下将结合具体实施例对本发明提供的技术方案进行详细说明,应理解下述【具体实施方式】仅用于说明本发明而不用于限制本发明的范围。
[0019]本发明步骤流程图如图1所示,具体包括如下步骤:
[0020]步骤10,采用个人用户在某一社交网络的朋友圈中朋友档案信息中的各类信息——如年龄、性别、所在地、出生地、教育经历、工作单位、工作地点、爱好等等建立朋友圈中每个朋友的特征向量Xi,Xi = (X1, X2,..., Xm),其中Xj (I彡j彡m)是档案信息中某一信息的整数表示,比如I代表男性O代表女性。假设朋友圈中有N个朋友,则i e [0,N),根据选取档案信息的项数特征向量有相应的维度m,在同一朋友圈中为朋友建立特征向量时应选取相同的档案信息。
[0021]步骤20,计算任意两个朋友之间的曼哈顿距离du ((Iij表示朋友i与朋友j之间的曼哈顿距离)。计算两个特征向量的曼哈顿距离本质上就是计算两个用户拥有相同特征的多少,在同一社团的用户更倾向于有更多的相同特征。曼哈顿距离的计算方法是:先对两个特征向量取并,然后对得到的结果向量取模,即du = I |\&χ」I。
[0022]步骤30,选取与朋友圈中其他所有朋友的曼哈顿距离都小于α的朋友作为核心朋友。这样选出来的朋友具有独特的特征,和其他朋友相互之间拥有同样特征的可能性最小,能够相互区分开,根据这样的核心扩展能够得到较好的社团划分结果。α的取值根据步骤10中建立的特征向量维度的大小来选取,一般是经验值。朋友圈中的朋友联系得松散,阈值α的取值就要小一些;朋友圈中的朋友联系得紧密,阈值α的取值就要相应大一些,一般以选在特征向量维度数的1/3到1/2之间为佳。
[0023]步骤40,基于核心朋友,寻找其余朋友与核心朋友的共同特征并进行分组。当找到当前用户与核心朋友共同的特征时,当记录特征在特征向量Xi中的位置,以此为根据在其余非核心朋友中继续寻找拥有这些特征的朋友扩展进一个分组中,并标识该分组为Ck(k e [O, K),K是核心朋友的总数,k表示当前核心朋友的标号),本方法允许一个朋友属于多个社团。这些特征标示着这个分组(即社团)的特征,比如一个核心朋友与当前用户有着类似的年龄和相同的大学教育经历,那么这个核心朋友扩展出的分组必定是当前用户的大学同学;对每一个核心朋友进行此项操作,遍历每一个用户,形成初步的社团划分结果。
[0024]步骤50,档案信息不全或者出于隐私考虑并不对外公开,上述步骤就不能有效划分了,所以在本步骤利用朋友的连接关系,对于前边得到的社团进行调整。
[0025]使用朋友圈的网络结构对分组调整。
[0026]步骤501,计算每一个朋友相对于每一个分组Ck中的朋友有边相连(即指人与人之间具有关联)的连接数,存储到Iik中,其中i表示第i个朋友,k表示第k个分组,Iik表示第i个朋友与社团Ck中的多少个朋友有边相连。
[0027]步骤502,找出当前朋友i与所有分组的连接数最大的那个分组的标号(即朋友i的Iik最大时的k值)。如果指朋友i未被划分到连接数最大的那个分组中,那么调整这个朋友的分组为连接数最大的分组,转到步骤501循环迭代,直到分组不再发生变化或者迭代达到一定的次数。
[0028]本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
【权利要求】
1.一种基于网络结构优化的节点属性划分朋友圈的方法,其特征在于,包括以下步骤: 建立特征向量:根据当前用户朋友圈中每个朋友的档案信息建立朋友的特征向量;计算朋友之间的曼哈顿距离:先对两个朋友之间的特征向量取并,然后对得到的结果向量取模; 选定核心朋友:选取与其他任意朋友距离都小于阈值α的朋友作为核心; 划分社团:针对每个核心朋友,找到其余用户与核心朋友共同的特征,根据共同特征扩展具有相同特征的朋友形成社团; 社团优化调整:将朋友调整至与其连接数最大的分组中。
2.根据权利要求1所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于,所述特征向量包括以下信息中的至少一种:年龄、性别、所在地、出生地、教育经历、工作单位、工作地点、爱好。
3.根据权利要求1或2所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于,所述阈值α的取值范围如下:1/3特征向量维度数<阈值α ( 1/2特征向量维度数。
4.根据权利要求3所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于:所述特征向量维度数与建立特征向量步骤中选取的档案信息数量一致。
5.根据权利要求1或2所述的基于网络结构优化的节点属性划分朋友圈的方法,其特征在于:所述社团优化调整步骤具体为:计算每个朋友与其所属的多个分组的连接数,选其最大连接数的分组作为该朋友的分组,循环迭代,直到分组不再发生变化或者达到一定的次数。
【文档编号】G06F17/30GK104391887SQ201410629873
【公开日】2015年3月4日 申请日期:2014年11月10日 优先权日:2014年11月10日
【发明者】马廷淮, 王耀, 唐美丽, 薛羽, 钟水明, 曹杰 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1