1.一种结合节点信息和网络结构的社区发现方法,其特征在于,具体步骤包括:
(1)根据节点特征对社区划分的影响程度,对节点特征进行分类;
(2)根据节点特征对节点进行内容相似度计算;
(3)根据网络结构,得到网络的邻接矩阵A;
(4)设定阈值,更新网络权重,生成有权网络;
(5)根据实际需要设置参数,选择社区发现算法,对步骤(4)得到的有权网络进行处理,得到最终社区划分。
2.根据权利要求1所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(1),具体包括:
a、根据节点特征对社区划分的影响程度,人为地为节点特征分类;设定将某一节点特征分为n类特征;
b、对社区划分的影响程度比较大的节点的某类特征,为该类特征赋予较大的权值,对社区划分影响程度比较小的节点的某类特征,则为该类特征赋予较小权值;n类特征的权值依次设为n1,n2,...,nn,n1+n2+...+nn=1。
3.根据权利要求2所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(2),具体包括:
c、采用余弦相似度计算方法,分别计算节点的每一类特征的局部相似度,计算公式如式(Ⅰ)所示:
式(Ⅰ)中,Sij指网络中节点i和节点j的相似度,分别是指节点i、节点j的节点特征组成的特征向量;
d、对节点的每一类特征的局部相似度加权求和,求出全局相似度,节点i、节点j的全局相似度计算公式如式(Ⅱ)所示:
Simij=n1Sim1+n2Sim2+...+nnSimn (Ⅱ)
式(Ⅱ)中,Sim1,Sim2,...,Simn分别代表n类节点特征的局部相似度;Simij是指节点i和节点j的总相似度,即全局相似度。
4.根据权利要求3所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(3),具体步骤包括:
对于无向网络,若网络中的任意两个节点i,j之间有连接,则设置Aij=Aji=1,若无连接,则设置Aij=0,通过这种方式,得到网络连接的邻接矩阵A,Aij、Aji分别是指矩阵A中第i行j列的元素和第j行i列的元素。
5.根据权利要求4述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(4),具体步骤包括:
e、对于无向网络,网络中的任意两个节点i,j之间连接边的权重Qij设置公式如式(Ⅲ)所示:
Qij=kAij+(1-k)Simij (Ⅲ)
根据式(Ⅲ),得到网络中所有节点中任意两个节点之间的权重,k为常数,k的取值为(0,1);
f、根据权重Qij的取值范围,设置阈值q,设置公式如式(Ⅳ)所示:
q=Qijmin+p*(Qijmax-Qijmin) (Ⅳ)
式(Ⅳ)中,p为百分数,p的取值为(0,1),Qijmax、Qijmin分别指Qij取值的最大值和最小值;
g、生成有权网络,具体如下:
若Qij>q,则在节点i,j之间建立一条连接边,并给这条边赋予权重Qij,若Qij<q,则舍弃权重权重Qij,且节点i,j之间不建立连接边,根据此规则,对原始网络进行重建,生成有权网络。
6.根据权利要求1所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述步骤(5),具体步骤包括:选择社区发现算法,对该有权网络进行处理,得到最终社区划分。
7.根据权利要求6所述的一种结合节点信息和网络结构的社区发现方法,其特征在于,所述社区发现算法包括派系过滤算法、标签传播算法、GN算法。