一种属性图聚类方法及系统

文档序号:34845687发布日期:2023-07-22 11:26阅读:32来源:国知局
一种属性图聚类方法及系统

本发明属于计算机数据处理,具体涉及一种属性图聚类方法及系统。


背景技术:

1、目前,现有的基于图卷积网络的属性图聚类方法主要是通过有效地学习节点的表示,然后将学习到的节点表示与现有的聚类方法结合来完成属性图聚类任务。然而,这些方法并不是专门针对于属性图聚类任务提出的,因为在这类方法的目标函数中并不包含可以直接对属性图聚类任务进行优化的目标,可见它们主要目的更多地是为了对属性图中的节点进行更好地表示。因此,这就使得这类方法在网络学习过程中不能专门针对于属性图聚类任务进行优化,进而也就不能得到更好的聚类结果。

2、尽管有一些直接将聚类目标融合到图卷积网络中的属性图聚类方法被提出,但它们所得到的聚类结果在准确性上表现欠佳。


技术实现思路

1、本发明的目的在于克服现有技术在将聚类目标融合到图卷积网络中的属性图聚类中得到的聚类结果准确性差的缺陷。

2、为了实现上述目的,本发明提出了一种属性图聚类方法,所述方法包括:

3、将属性图输入训练好的属性图聚类模型,输出隶属度矩阵,将属性图中的每个节点划分到其隶属度最大的簇中,从而实现聚类;所述属性图聚类模型为图卷积神经网络模型;

4、所述属性图聚类模型的训练过程为:

5、根据属性图中所有节点的集合,以及两节点之间边的集合,构成属性图的邻接矩阵,根据节点相关联的所有属性的集合,构成属性图的特征矩阵;构建归一化的邻接矩阵和节点属性关联度矩阵;构建关于隶属度矩阵的损失函数;构建图卷积神经网络模型,迭代更新直到损失函数收敛。

6、作为上述方法的一种改进,所述属性图聚类模型的训练过程具体包括:

7、步骤1:预处理属性图数据:

8、根据属性图中所有节点的集合v={vi}(1≤i≤nv)、所有边的集合e={eij},构建属性图的邻接矩阵a,vi表示第i个节点,nv表示节点数量,eij表示第i个节点和第j个节点相连接的边;根据与节点相关联的所有属性的集合λ={λm}(1≤m≤nλ),构建属性图的特征矩阵x,λm表示第m个属性;

9、步骤2:根据属性图的邻接矩阵,获得归一化的邻接矩阵;根据属性图的邻接矩阵和特征矩阵,构建节点属性关联度矩阵;

10、步骤3:基于属性图的特征矩阵、归一化的邻接矩阵和节点属性关联度矩阵,获得隶属度矩阵,构建关于隶属度矩阵的损失函数;

11、步骤4:输入模型参数,构建图卷积神经网络模型,对损失函数进行优化,获得最优的隶属度矩阵。

12、作为上述方法的一种改进,步骤2中获得归一化的邻接矩阵具体包括:

13、对邻接矩阵a进行归一化处理,得到归一化后的邻接矩阵具体的归一化方法如下:

14、

15、其中,i表示和a维度相同的单位矩阵;d表示(a+i)的度矩阵。

16、作为上述方法的一种改进,步骤2中构建节点属性关联度矩阵具体包括:

17、由余弦相似度方法先初步计算出节点vi和vj间的属性关联度r′(vi,vj):

18、

19、其中,xim表示第i个节点的第m个属性值;xjm表示第j个节点的第m个属性值;

20、通过节点vi和vj之间的邻接情况,获得最终的属性关联度r(vi,vj):

21、r(vi,vj)=aij×r′(vi,vj)

22、其中,aij表示邻接矩阵a中第i行第j列元素;

23、根据节点间的属性关联度获得属性关联度矩阵r,矩阵r中第i行第j列节点

24、rij=r(vi,vj)。

25、作为上述方法的一种改进,步骤3中所述获得隶属度矩阵具体包括:

26、构建图卷积编码方式为:

27、hl+1=σ(ξlhlwl)

28、其中,l从0至l递增,l表示图卷积神经网络的层数;hl是所有节点在第l层图卷积神经网络中的表示矩阵,当l=0时,hl=x;wl表示在第l层图卷积神经网络中的可训练参数;σ(·)表示relu激活函数;ξl表示在第l层图卷积神经网络中衡量节点与邻居节点之间重要性的注意力系数矩阵;

29、对于ξl的计算,首先需要采用注意力机制计算出节点间的相关矩阵ml,计算方式为:

30、

31、其中,和表示维度为1×nv的可训练参数,⊙表示广播类逐元素相乘运算;表示归一化后的邻接矩阵;得到节点间相关矩阵ml之后,对其进行归一化得到最终的注意力系数矩阵ξl:

32、

33、其中,ni表示节点i的所有邻居节点构成的集合;表示矩阵ξl第i行第j列元素;表示矩阵ml第i行第j列元素;表示ml第i行第t列元素;

34、根据图卷积编码方式,当图卷积网络层数达到所设置的最大层,即l=l时,获得所有节点的表示矩阵hl,将最终的节点表示矩阵记为h,即h=hl;

35、根据所有节点的表示矩阵h,计算重构的邻接矩阵

36、

37、其中,hi和hj分别代表节点表示矩阵h中节点i和节点j的表示向量;

38、构建图卷积解码方式为:

39、

40、其中,l从l至0递减,当l=l时,ξl和wl分别对应于图卷积编码过程中的ξl和wl;

41、根据图卷积解码方式,当l=0时,获得重构的特征矩阵即

42、获得节点的目标分布矩阵q:

43、

44、其中,qif表示目标分布矩阵q中第i行第f列元素;μf表示第f个聚类中心的表示向量;k表示聚类中心的数量;||·||表示向量的模;

45、获得节点理想的目标分布矩阵p:

46、

47、其中,pif表示理想的目标分布矩阵p中第i行第f列元素;

48、获得隶属度矩阵u:

49、

50、其中,uif表示隶属度矩阵中第i行第f列元素;

51、作为上述方法的一种改进,步骤3中构建损失函数如下:

52、

53、其中,a表示邻接矩阵;x表示特征矩阵;r表示属性关联强度矩阵;u表示隶属度矩阵;矩阵s中的元素表示节点i与其它节点在簇f上的不一致性,nv表示图中节点数量,k表示聚类个数,aij表示邻接矩阵a中第i行第j列元素,ujg表示矩阵u中第j行第g列元素;矩阵矩阵矩阵q和矩阵p都是在网络模型优化过程中得到的中间产物,分别表示:重构的特征矩阵、重构的邻接矩阵、节点的目标分布矩阵和节点理想的目标分布矩阵;λ1,λ2,λ3,α,β,θ,表示人为指定的模型参数;θ表示整个图卷积神经网络模型中可训练的参数;||·||f表示frobenius范数;tr代表矩阵对角元素之和。

54、作为上述方法的一种改进,所述将属性图中的每个节点划分到其隶属度最大的簇中具体为:遍历隶属度矩阵的所有行,在每行中找出其元素值最大的类并将节点划分到该类中,直到所有的节点都划分完毕;若存在没有包含任何节点的类,则将其剔除。

55、本技术还提供一种属性图聚类系统,基于上述任一方法实现,所述系统包括:

56、模型训练模块,用于训练属性图聚类模型;和

57、聚类实现模块,用于根据训练好的属性图聚类模型,输入属性图,输出隶属度矩阵,将属性图中的每个节点划分到其隶属度最大的簇中。

58、作为上述系统的一种改进,所述模型训练模块包括:

59、图信息整合子模块,用于构建属性图邻接矩阵和特征矩阵;

60、数据预处理子模块,用于对邻接矩阵进行归一化处理,获得属性关联度矩阵;

61、网络模型构建子模块,用于构建属性图聚类模型;和

62、模型优化子模块,用于优化属性图聚类模型参数。

63、作为上述系统的一种改进,所述系统还包括:

64、结果展示模块,用于显示聚类实现模块得到的聚类结果;根据聚类实现模块得到的结果,将每个类作为一行,其中的节点作为行中的元素,将所有类处理为文本文件进行输出展示。

65、与现有技术相比,本发明的优势在于:

66、本发明公开的一种属性图聚类方法从以下方面解决现有技术在属性图聚类时的缺陷:在算法设计过程中,将基于模糊的聚类目标融合到图卷积网络中来完成属性图聚类任务,通过图卷积网络模型对构建的损失函数进行优化,提高了属性图聚类的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1