基于G-GCN模型的社会团体节点表示方法及设备

文档序号:32221852发布日期:2022-11-16 10:06阅读:68来源:国知局
基于G-GCN模型的社会团体节点表示方法及设备
基于g-gcn模型的社会团体节点表示方法及设备
技术领域
1.本发明实施例涉及模式识别技术领域,尤其涉及一种基于g-gcn模型的社会团体节点表示方法及设备。


背景技术:

2.在一些公共社会事件中,社会事件的影响往往很广泛,如果没有提前发现或者及时管控,将会产生严重的后果。比如在一次的暴力事件中,暴力事件的出现往往伴随着极大的影响,然而暴力事件的相关人物却很难捕捉,暴力事件中的直接相关人物往往背后有着一个团伙操纵,而这些幕后人物正是暴力事件形成的核心,也是解决暴力事件的核心。但是,发现背后团体,从直接相关人物找到全部的参与人物目前还没有相关技术能够实现。因此,开发一种基于g-gcn模型的社会团体节点表示方法及设备,可以有效克服上述相关技术中的缺陷,就成为业界亟待解决的技术问题。


技术实现要素:

3.针对现有技术存在的上述问题,本发明实施例提供了一种基于g-gcn模型的社会团体节点表示方法及设备。
4.第一方面,本发明的实施例提供了一种基于g-gcn模型的社会团体节点表示方法,包括:图中的一节点首先学习邻居节点的特征表示,由于中心节点与邻居节点的相连接的边的方向可能不同,即不同出度入度的边构成了中心节点的邻接矩阵,其中邻接矩阵中表示为不同特征的不同聚合方式;完成邻居节点的特征表示后,再对自身节点特征进行一次传播,即进行自连接,完成中心节点与自身节点,邻居节点的特征表示,完成第一次节点的特征表示学习;进行节点的团体特征聚合,根据节点所在的团体进行再一次的节点表示嵌入,在一次特征聚合后,结果获取到节点的信息以及所有节点所在的团体,此时提取团体的特征表示,再对团体的特征表示,得到的第一次节点特征表示;再次根据上述的方式进行聚合,自此完成所有节点的全部信息。
5.在上述方法实施例内容的基础上,本发明实施例中提供的基于g-gcn模型的社会团体节点表示方法,所述根据节点所在的团体进行再一次的节点表示嵌入,包括:
[0006][0007]
其中σ()是激活函数,n为节点的集合,j为在关系r下的邻居节点的集合,包括全部的出度节点和入度节点,i为当前节点,即中心节点,h
i(l)
是指输入的自己节点的特征,h
j(l)
是指输入的邻居节点的特征,h
i(l+1)
是指更新后的自己节点的特征,r为所有节点之间的关系集合,关系包括多种关系,关系不同则影响节点嵌入权重不同,即学习wr,通过不同关系下的线性变换矩阵,来表示不同关系下的权重学习,w0为节点自传播的参数学习,为当前中心节点的特征的自传播。c
i,r
为正则化向量。
[0008]
在上述方法实施例内容的基础上,本发明实施例中提供的基于g-gcn模型的社会
团体节点表示方法,所述进行节点的团体特征聚合,包括:
[0009][0010]
其中,g为团体的最终特征向量,g为随机取样到的节点的集合,n为团体中获取到的参与运算的节点个数,即g的总数,团体中总节点数的二分之一,xh表示参与运算的节点的特征向量,最终形成该团体的特征向量表示g,1
×
d的特征向量,d为特征的维数。
[0011]
在上述方法实施例内容的基础上,本发明实施例中提供的基于g-gcn模型的社会团体节点表示方法,所述完成中心节点与自身节点,邻居节点的特征表示,完成第一次节点的特征表示学习,包括:
[0012][0013]
其中,σ()是激活函数,h为节点和团体的集合,j为节点i在关系r下的邻居节点的集合,包括出度节点和入度节点,i为节点自己的特征信息表示,h
i(l)
是指输入的自己节点的特征,h
j(l)
是指输入的邻居节点的特征,h
i(l+1)
是指更新后的自己节点的特征,g为节点所在的团体,r为节点之间的关系集合,关系包括多种关系,关系不同则影响节点不同,即学习wr,不同关系下的线性变换矩阵,来表示不同关系下的权重学习,w
rl
是对应关系特征权重矩阵,w0为节点自传播的参数学习,为当前节点的特征,g为节点所在的团体集合,wg为所在的团体的特征的影响不同。c
i,r
为正则化向量。
[0014]
在上述方法实施例内容的基础上,本发明实施例中提供的基于g-gcn模型的社会团体节点表示方法,所述g-gcn模型损失函数使用最小交叉熵损失函数,包括:
[0015][0016]
其中,y是节点的集合,k是团体的标签,t是指是期望的团体标签,表示在第l层的,第i个节点的第k个团体的标签得分。
[0017]
第二方面,本发明的实施例提供了一种基于g-gcn模型的社会团体节点表示装置,包括:第一主模块,用于实现图中的一节点首先学习邻居节点的特征表示,由于中心节点与邻居节点的相连接的边的方向可能不同,即不同出度入度的边构成了中心节点的邻接矩阵,其中邻接矩阵中表示为不同特征的不同聚合方式;第二主模块,用于实现完成邻居节点的特征表示后,再对自身节点特征进行一次传播,即进行自连接,完成中心节点与自身节点,邻居节点的特征表示,完成第一次节点的特征表示学习;第三主模块,用于实现进行节点的团体特征聚合,根据节点所在的团体进行再一次的节点表示嵌入,在一次特征聚合后,结果获取到节点的信息以及所有节点所在的团体,此时提取团体的特征表示,再对团体的特征表示,得到的第一次节点特征表示;第四主模块,用于实现再次根据上述的方式进行聚合,自此完成所有节点的全部信息。
[0018]
第三方面,本发明的实施例提供了一种电子设备,包括:
[0019]
至少一个处理器;以及
[0020]
与处理器通信连接的至少一个存储器,其中:
[0021]
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方
面的各种实现方式中任一种实现方式所提供的基于g-gcn模型的社会团体节点表示方法。
[0022]
第四方面,本发明的实施例提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种实现方式中任一种实现方式所提供的基于g-gcn模型的社会团体节点表示方法。
[0023]
本发明实施例提供的基于g-gcn模型的社会团体节点表示方法及设备,解决了在一个时序知识图的子图中所有节点的特征表示问题,避免了仅仅关注节点之间的关系对于节点的表示学习影响,突出了团体的特征对于节点表示学习的影响,能够有效挖掘事件背后的团体人物关系网。
附图说明
[0024]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]
图1为本发明实施例提供的基于g-gcn模型的社会团体节点表示方法流程图;
[0026]
图2为本发明实施例提供的基于g-gcn模型的社会团体节点表示装置结构示意图;
[0027]
图3为本发明实施例提供的电子设备的实体结构示意图;
[0028]
图4为本发明实施例提供的g-gcn流程示意图。
具体实施方式
[0029]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外,本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合,以形成可行的技术方案,这种结合不受步骤先后次序和/或结构组成模式的约束,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
[0030]
本发明实施例提供了一种基于g-gcn模型的社会团体节点表示方法,参见图1,该方法包括:图中的一节点首先学习邻居节点的特征表示,由于中心节点与邻居节点的相连接的边的方向可能不同,即不同出度入度的边构成了中心节点的邻接矩阵,其中邻接矩阵中表示为不同特征的不同聚合方式;完成邻居节点的特征表示后,再对自身节点特征进行一次传播,即进行自连接,完成中心节点与自身节点,邻居节点的特征表示,完成第一次节点的特征表示学习;进行节点的团体特征聚合,根据节点所在的团体进行再一次的节点表示嵌入,在一次特征聚合后,结果获取到节点的信息以及所有节点所在的团体,此时提取团体的特征表示,再对团体的特征表示,得到的第一次节点特征表示;再次根据上述的方式进行聚合,自此完成所有节点的全部信息。
[0031]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示方法,所述根据节点所在的团体进行再一次的节点表示
嵌入,包括:
[0032][0033]
其中,n为节点的集合,j为在关系r下的邻居节点的集合,包括全部的出度节点和入度节点,i为当前节点,即中心节点,r为所有节点之间的关系集合,关系包括多种关系,关系不同则影响节点嵌入权重不同,即学习wr,通过不同关系下的线性变换矩阵,来表示不同关系下的权重学习,w0为节点自传播的参数学习,为当前中心节点的特征的自传播。
[0034]
具体地,根据r-gcn做第一次的节点信息嵌入表示,即先根据中心节点,找到中心节点的全部邻居节点,再根据全部邻居节点的特征向量,按照中心节点与邻居节点的不同的边的关系,出度,入度进行不同的嵌入表示,然后再对中心节点进行自身节点特征向量的特征表示,形成第一次中心节点特征表示后的特征向量,这次特征聚合不包括团体的信息,所以第一次进行节点信息嵌入的信息包括:从自身节点的信息,以及相邻节点的信息,公式如(1)式所示。
[0035]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示方法,所述进行节点的团体特征聚合,包括:
[0036][0037]
其中,g为团体的最终特征向量,g为随机取样到的节点的集合,n为团体中获取到的参与运算的节点个数,即g的总数,团体中总节点数的二分之一,xh表示参与运算的节点的特征向量,最终形成该团体的特征向量表示g,1
×
d的特征向量,d为特征的维数。
[0038]
具体地,在第一次节点间的特征表示后初步可以得到第一次团体的划分,针对这次得到的团体的团体特征聚合到下一次的节点特征表示中,团体的初步特征获取的方法本文采取随机采样的方式获取。其中获取团体的特征方法详细为:根据团体内的节点随机采样二分之一的节点,再对随机采样出的节点进行特征的抽取,形成一个整体的特征向量代表该团体的特征向量,所以在下次进入神经网络作为输入时,团体的特征向量会加入一起进行学习训练,公式如(2)式所示。
[0039]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示方法,所述完成中心节点与自身节点,邻居节点的特征表示,完成第一次节点的特征表示学习,包括:
[0040][0041]
其中,h为节点和团体的集合,j为节点i在关系r下的邻居节点的集合,包括出度节点和入度节点,i为节点自己的特征信息表示,g为节点所在的团体,r为节点之间的关系集合,关系包括多种关系,关系不同则影响节点不同,即学习wr,不同关系下的线性变换矩阵,来表示不同关系下的权重学习,w0为节点自传播的参数学习,为当前节点的特征,g为节点所在的团体集合,wg为所在的团体的特征的影响不同。
[0042]
具体地,假设有知识图,其中知识图有n个节点,节点具有自己的特征,节点的特征如果有d维,则这些节点的特征组成一个n
×
d维的矩阵x,与中心节点相关的邻居节点组成
邻接矩阵,即一个n
×
n维的矩阵a,对于边的不同指向,分为入度邻接矩阵和出度邻接矩阵,即a分为a1和a2。由于需要聚合节点自身的特征表示,所以对节点自身的1
×
d的特征向量进行聚合。而对于节点所在的团体特征向量,是由按照上述计算出的节点所在的团体特征向量g。上述便是本文模型的输入,特征表示计算公式如(3)式所示。
[0043]
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示方法,所述g-gcn模型损失函数使用最小交叉熵损失函数,包括:
[0044][0045]
其中,y是节点的集合,k是团体的标签,t是指是期望的团体标签,表示在第l层的,第i个节点的第k个团体的标签得分。
[0046]
具体地,基于团体的节点表示模型g-gcn采用relu作为激活函数,本文采用的激活函数为relu,公式为:f(x)=max(0,x)其中,x为当前变量的值。针对需要考虑到的梯度消失问题,如果使用tanh,sigmod等激活函数,梯度消失问题特别严重,而relu激活解决了这个问题,以此relu帮助解决梯度消失的问题和加快训练的速度。损失函数使用最小交叉熵损失函数,其公式如(4)式所示。
[0047]
本发明实施例提供的基于g-gcn模型的社会团体节点表示方法,解决了在一个时序知识图的子图中所有节点的特征表示问题,避免了仅仅关注节点之间的关系对于节点的表示学习影响,突出了团体的特征对于节点表示学习的影响,能够有效挖掘事件背后的团体人物关系网。
[0048]
本发明提出了基于团体的节点表示模型g-gcn。基于团体的节点表示模型主要是解决了在一个时序知识图的子图中所有节点的特征表示问题,在之前的研究中,主要关注节点之间的关系对于节点的表示学习影响,而对于团体发现任务来说,忽略了团体的特征对于节点表示学习的影响,而节点所在团体对节点特征表示有着重要影响,所以为了解决节点和团体的关系对节点特征的影响,提出了基于团体的节点表示模型g-gcn,即引入了团体特征表示,嵌入到节点特征表示的节点特征表示学习方法。算法的主要流程可以参见图4:在模型中,节点的特征依赖于:自身节点的信息,自身邻居节点的信息和所在团体的特征信息,由于所在的团体不同特征不同,所以根据节点所在的不同团体的团体特征来进行节点嵌入表示,优化节点特征的表示学习过程,增强节点的表示。具体来说,基于团体的节点表示模型g-gcn首先需要完成第一次的节点特征表示,第一次的节点特征表示聚合了中心节点自身的特征,中心节点的邻居节点的特征,根据节点之间的不同关系进行不同方式的聚合,得到了第一次的节点表示,首次的团体划分;然后,再根据首次的团体划分,找到团体中的节点,将团体中的节点聚合其所在团体的特征,得到最新的节点表示,此时节点的特征已经聚合了其所在团体的特征,增强了节点表示,这是针对于社会团体发现的团体表示的节点表示方式。
[0049]
本发明各个实施例的实现基础是通过具有处理器功能的设备进行程序化的处理实现的。因此在工程实际中,可以将本发明各个实施例的技术方案及其功能封装成各种模块。基于这种现实情况,在上述各实施例的基础上,本发明的实施例提供了一种基于g-gcn模型的社会团体节点表示装置,该装置用于执行上述方法实施例中的基于g-gcn模型的社
会团体节点表示方法。参见图2,该装置包括:第一主模块,用于实现图中的一节点首先学习邻居节点的特征表示,由于中心节点与邻居节点的相连接的边的方向可能不同,即不同出度入度的边构成了中心节点的邻接矩阵,其中邻接矩阵中表示为不同特征的不同聚合方式;第二主模块,用于实现完成邻居节点的特征表示后,再对自身节点特征进行一次传播,即进行自连接,完成中心节点与自身节点,邻居节点的特征表示,完成第一次节点的特征表示学习;第三主模块,用于实现进行节点的团体特征聚合,根据节点所在的团体进行再一次的节点表示嵌入,在一次特征聚合后,结果获取到节点的信息以及所有节点所在的团体,此时提取团体的特征表示,再对团体的特征表示,得到的第一次节点特征表示;第四主模块,用于实现再次根据上述的方式进行聚合,自此完成所有节点的全部信息。
[0050]
本发明实施例提供的基于g-gcn模型的社会团体节点表示装置,采用图2中的若干模块,解决了在一个时序知识图的子图中所有节点的特征表示问题,避免了仅仅关注节点之间的关系对于节点的表示学习影响,突出了团体的特征对于节点表示学习的影响,能够有效挖掘事件背后的团体人物关系网。
[0051]
需要说明的是,本发明提供的装置实施例中的装置,除了可以用于实现上述方法实施例中的方法外,还可以用于实现本发明提供的其他方法实施例中的方法,区别仅仅在于设置相应的功能模块,其原理与本发明提供的上述装置实施例的原理基本相同,只要本领域技术人员在上述装置实施例的基础上,参考其他方法实施例中的具体技术方案,通过组合技术特征获得相应的技术手段,以及由这些技术手段构成的技术方案,在保证技术方案具备实用性的前提下,就可以对上述装置实施例中的装置进行改进,从而得到相应的装置类实施例,用于实现其他方法类实施例中的方法。例如:
[0052]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示装置,还包括:第一子模块,用于实现所述根据节点所在的团体进行再一次的节点表示嵌入,包括:
[0053][0054]
其中,n为节点的集合,j为在关系r下的邻居节点的集合,包括全部的出度节点和入度节点,i为当前节点,即中心节点,r为所有节点之间的关系集合,关系包括多种关系,关系不同则影响节点嵌入权重不同,即学习wr,通过不同关系下的线性变换矩阵,来表示不同关系下的权重学习,w0为节点自传播的参数学习,为当前中心节点的特征的自传播。
[0055]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示装置,还包括:第二子模块,用于实现所述进行节点的团体特征聚合,包括:
[0056][0057]
其中,g为团体的最终特征向量,g为随机取样到的节点的集合,n为团体中获取到的参与运算的节点个数,即g的总数,团体中总节点数的二分之一,xh表示参与运算的节点的特征向量,最终形成该团体的特征向量表示g,1
×
d的特征向量,d为特征的维数。
[0058]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示装置,还包括:第三子模块,用于实现所述完成中心节点
与自身节点,邻居节点的特征表示,完成第一次节点的特征表示学习,包括:
[0059][0060]
其中,h为节点和团体的集合,j为节点i在关系r下的邻居节点的集合,包括出度节点和入度节点,i为节点自己的特征信息表示,g为节点所在的团体,r为节点之间的关系集合,关系包括多种关系,关系不同则影响节点不同,即学习wr,不同关系下的线性变换矩阵,来表示不同关系下的权重学习,w0为节点自传播的参数学习,为当前节点的特征,g为节点所在的团体集合,wg为所在的团体的特征的影响不同。
[0061]
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于g-gcn模型的社会团体节点表示装置,还包括:第四子模块,用于实现所述g-gcn模型损失函数使用最小交叉熵损失函数,包括:
[0062][0063]
其中,y是节点的集合,k是团体的标签,t是指是期望的团体标签,表示在第l层的,第i个节点的第k个团体的标签得分。
[0064]
本发明实施例的方法是依托电子设备实现的,因此对相关的电子设备有必要做一下介绍。基于此目的,本发明的实施例提供了一种电子设备,如图3所示,该电子设备包括:至少一个处理器(processor)、通信接口(communications interface)、至少一个存储器(memory)和通信总线,其中,至少一个处理器,通信接口,至少一个存储器通过通信总线完成相互间的通信。至少一个处理器可以调用至少一个存储器中的逻辑指令,以执行前述各个方法实施例提供的方法的全部或部分步骤。
[0065]
此外,上述的至少一个存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个方法实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0066]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0067]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括
若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的一些部分所述的方法。
[0068]
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。基于这种认识,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0069]
需要说明的是,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括
……
"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0070]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1