一种结合节点信息和网络结构的社区发现方法与流程

文档序号:11138302阅读:来源:国知局

技术特征:

1.一种结合节点信息和网络结构的社区发现方法,其特征在于,具体步骤包括:

(1)根据节点特征对社区划分的影响程度,对节点特征进行分类;

(2)根据节点特征对节点进行内容相似度计算;

(3)根据网络结构,得到网络的邻接矩阵A;

(4)设定阈值,更新网络权重,生成有权网络;

(5)根据实际需要设置参数,选择社区发现算法,对步骤(4)得到的有权网络进行处理,得到最终社区划分。

2.根据权利要求1所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(1),具体包括:

a、根据节点特征对社区划分的影响程度,人为地为节点特征分类;设定将某一节点特征分为n类特征;

b、对社区划分的影响程度比较大的节点的某类特征,为该类特征赋予较大的权值,对社区划分影响程度比较小的节点的某类特征,则为该类特征赋予较小权值;n类特征的权值依次设为n1,n2,...,nn,n1+n2+...+nn=1。

3.根据权利要求2所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(2),具体包括:

c、采用余弦相似度计算方法,分别计算节点的每一类特征的局部相似度,计算公式如式(Ⅰ)所示:

<mrow> <msub> <mi>S</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mrow> <mo>(</mo> <msub> <mover> <mi>f</mi> <mo>&RightArrow;</mo> </mover> <mi>i</mi> </msub> <mo>,</mo> <msub> <mover> <mi>f</mi> <mo>&RightArrow;</mo> </mover> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mover> <mi>f</mi> <mo>&RightArrow;</mo> </mover> <mi>i</mi> </msub> <mo>&CenterDot;</mo> <msub> <mover> <mi>f</mi> <mo>&RightArrow;</mo> </mover> <mi>j</mi> </msub> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mover> <mi>f</mi> <mo>&RightArrow;</mo> </mover> <mi>i</mi> </msub> <mo>|</mo> <mo>|</mo> <mo>|</mo> <mo>|</mo> <msub> <mover> <mi>f</mi> <mo>&RightArrow;</mo> </mover> <mi>j</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mi>I</mi> <mo>)</mo> </mrow> </mrow>

式(Ⅰ)中,Sij指网络中节点i和节点j的相似度,分别是指节点i、节点j的节点特征组成的特征向量;

d、对节点的每一类特征的局部相似度加权求和,求出全局相似度,节点i、节点j的全局相似度计算公式如式(Ⅱ)所示:

Simij=n1Sim1+n2Sim2+...+nnSimn (Ⅱ)

式(Ⅱ)中,Sim1,Sim2,...,Simn分别代表n类节点特征的局部相似度;Simij是指节点i和节点j的总相似度,即全局相似度。

4.根据权利要求3所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(3),具体步骤包括:

对于无向网络,若网络中的任意两个节点i,j之间有连接,则设置Aij=Aji=1,若无连接,则设置Aij=0,通过这种方式,得到网络连接的邻接矩阵A,Aij、Aji分别是指矩阵A中第i行j列的元素和第j行i列的元素。

5.根据权利要求4述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(4),具体步骤包括:

e、对于无向网络,网络中的任意两个节点i,j之间连接边的权重Qij设置公式如式(Ⅲ)所示:

Qij=kAij+(1-k)Simij (Ⅲ)

根据式(Ⅲ),得到网络中所有节点中任意两个节点之间的权重,k为常数,k的取值为(0,1);

f、根据权重Qij的取值范围,设置阈值q,设置公式如式(Ⅳ)所示:

q=Qijmin+p*(Qijmax-Qijmin) (Ⅳ)

式(Ⅳ)中,p为百分数,p的取值为(0,1),Qijmax、Qijmin分别指Qij取值的最大值和最小值;

g、生成有权网络,具体如下:

若Qij>q,则在节点i,j之间建立一条连接边,并给这条边赋予权重Qij,若Qij<q,则舍弃权重权重Qij,且节点i,j之间不建立连接边,根据此规则,对原始网络进行重建,生成有权网络。

6.根据权利要求1所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(5),具体步骤包括:选择社区发现算法,对该有权网络进行处理,得到最终社区划分。

7.根据权利要求6所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述社区发现算法包括派系过滤算法、标签传播算法、GN算法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1