一种基于一致性的图异常检测方法和装置

文档序号:37475813发布日期:2024-03-28 18:58阅读:21来源:国知局
一种基于一致性的图异常检测方法和装置

本发明属于图领域,尤其涉及一种基于一致性的图异常检测方法和装置。


背景技术:

1、异常检测算法是一种基于图的节点分类算法,图数据是一种包括节点属性和节点之间连接关系的拓扑网络数据。异常检测算法主要以图数据为研究对象,根据节点属性和节点之间的连接关系,利用图神经网络技术,将节点属性映射到低维表征空间,识别偏离图大部分节点的罕见模式或行为。在网络入侵检测、社交垃圾邮件发送者检测和金融欺诈检测等领域中,通过用户和商户实体之间的关系和属性特征构建网络拓扑图,使用本发明可以识别出异常用户。

2、最近的进展是利用图神经网络通过聚合来自相邻节点的信息来进行表示学习。这是由于观察到现实世界图中的节点往往表现出与其邻域一致的行为。然而,这种一致性可能会被多种方式的异常破坏,导致在图神经网络中使用消息传递机制时节点表示和异常检测性能不理想。如何减轻异常引起的邻域不一致,同时以无监督的方式充分利用剩余的一致性对于图异常检测至关重要,但仍有待解决。本发明利用多任务约束下的一致性损失,减轻异常引起的邻域不一致,同时以无监督的方式充分利用剩余的一致性,解决了一致性在端到端图节点分类的应用空缺问题。在电商领域,通过用户和商户实体之间的关系和属性特征构建得到的网络拓扑图,使用本发明可以进一步得到异常用户的识别结果。


技术实现思路

1、本发明要克服现有技术的上述缺点,提供一种基于一致性的图异常检测方法和装置。

2、本发明的目的是通过以下技术方案来实现的:

3、本发明的第一个方面涉及一种基于一致性的图异常检测方法,包括:

4、s110:通过获取用户和商户数据,根据用户和商户实体之间的关系和属性特征构建网络拓扑图;

5、s120:对网络拓扑图进行不同的编码模块,得到三种分离的编码,分别是特征空间编码、结构空间编码、联合空间编码;

6、s130:在编码空间,使用自适应融合模块,获得更为准确的特征空间编码和结构空间编码;

7、s140:根据编码不同的来源设计不同任务,联合训练;

8、s150:在联合训练的基础上,使用一致性损失解耦三种编码;

9、s160:计算损失分数,输出最终分类结果。

10、进一步地,步骤s110中,通过获取用户和商户数据,根据用户和商户实体之间的关系和属性特征构建网络拓扑图,具体包括:

11、s1101:用户输入节点属性数据和节点之间的连接关系数据;

12、s1102:处理用户输入,得到一个图数据g=(v,e),其中e={v1,v2,…,vn}表示节点集合,表示边集合,n=|v|表示节点数量。

13、s1103:根据每个用户的属性特征,定义一个节点属性矩阵用a∈{0,1}n×n表示邻接矩阵,f表示节点特征维度。

14、进一步地,步骤s120中,对网络拓扑图进行不同的编码模块,得到三种分离的编码,分别是特征空间编码、结构空间编码、联合空间编码,具体包括:

15、s1201:将图经过三个独立的编码器,其中节点特征经过一次多层感知机,得到节点特征在低维空间的表征ha;节点结构经过一次多层感知机,得到节点结构在低维空间的表征ht,公式如下:

16、ha=fa(x)   (1)

17、ht=ft(a)   (2)

18、其中fa(·)和ft(·)是两个多层感知机。

19、s1202:对节点特征和节点结构经过一次图注意力神经网络,得到节点特征和节点结构的耦合信息在低维空间的表征hc,每一条边的注意力分数ei,j公式如下:

20、ei,j=att(xi,xj)=leakyrelu(at·[wencxi||wencxj])   (3)

21、其中att(·)是单层注意力网络,at和wenc是可学习参数,||表示拼接函数,xi表示节点vi的特征,那么权重经过归一化的边注意力分数αi,j如下所示:

22、

23、其中ni表示节点vi的邻居,那么节点vi最终的耦合信息hc为:

24、

25、进一步地,步骤s130中,在编码空间,使用自适应融合模块,获得更为准确的特征空间编码和结构空间编码,具体包括:

26、s1301:使用自适应模块,融合节点特征信息ha和耦合信息hc得到一致性增强的节点特征信息za;融合节点结构信息ht和耦合信息hc得到一致性增强的节点结构信息zt。首先计算不同输入信息的权重:

27、imp=tanh(τ(h(1)||h(2)))   (6)

28、其中τ为单层感知机,是每一维的权重向量,tanh表示激活函数,h(1)和h(2)是输入的两种信息,n表示输入信息的维度。

29、s1302:根据权重向量线性耦合两个输入信息:

30、aif(h(1)||h(2))=imp:n·h(1)+impn:·h(2)   (7)

31、s1303:得到一致性增强的节点特征信息za和一致性增强的节点结构信息zt:

32、za=aif(ha,hc)   (8)

33、zt=aif(ht,hc)   (9)

34、进一步地,步骤s140中,根据编码不同的来源设计不同任务,联合训练,具体包括:

35、s1401:一致性增强的节点特征信息za经过图神经网络层还原得到,拟合原始特征,差值作为特征损失lattr,公式如下:

36、

37、

38、其中,表示l2范数损失,ga(·)表示还原层,这里用图神经网络层r实现,公式如下:

39、

40、其中,是正则化的邻接矩阵,是a*=a+i的度矩阵,i是单位阵,r(l)是第l层的嵌入表示,是可学习参数,r(0)=za。对于l层的图神经网络,

41、s1402:一致性增强的节点结构信息zt经过内积还原得到拟合原始结构,差值作为结构损失ltopo,公式如下:

42、

43、

44、其中gt(·)表示zt及其转置z′t的内积函数。

45、s1403:耦合信息和图节点均值池化差值lcons,作为节点偏离整体的度量函数,公式如下:

46、

47、其中eg=readout(hc)是图嵌入,readout(·)是一种池化函数,zc,i表示节点vi经过图注意力神经网络得到的耦合信息,e表示自然对数。

48、s1404:三种损失用超参权重计算,得到最后的多任务损失l,公式如下:

49、l=λ1·lattr+(1-λ1)·ltopo+λ2·lcons   (16)

50、其中λ1和λ2是人为设定的超参,以上目标函数能够实现多任务下编码的共同优化。

51、进一步地,步骤s150中,在联合训练的基础上,使用一致性损失解耦三种编码,具体包括:

52、s1501:增加了三种嵌入的协方差约束,使得三种任务指导下的嵌入含有不同的信息,解耦信息,这里采用了协方差作为信息耦合程度的度量函数,以一致性增强的节点特征信息za和耦合信息hc的协方差约束为例,协方差值计算如下:

53、

54、其中cov(·)是两个矩阵间的相关系数,var(·)是矩阵的协方差,abs(·)是绝对值函数。acor(za,zt)表示一致性增强的节点特征信息za和一致性增强的节点结构信息zt的协方差约束,acor(hc,zt)表示耦合信息hc和一致性增强的节点结构信息zt的协方差约束,采用类似方式计算。

55、s1502:三种信息两两计算协方差得到相关性约束的损失,那么协方差约束的损失lcc如下:

56、lcc=acor(za,zt)+acor(hc,zt)+acor(za,hc)   (18)最终模型优化目标lfinal是协方差约束的损失lcc和多任务损失l之和,公式如下:

57、lfinal=l+lcc   (19)

58、进一步地,步骤s160中,计算损失分数,输出最终分类结果,具体包括:

59、s1601:将原始图输入最终训练完成后的模型,从节点vi还原部分得到异常分数,公式如下:

60、

61、其中xi表示节点vi的原始特征,表示节点vi的还原特征,ai表示节点vi的原始结构,表示节点vi的还原结构,zc,i表示节点vi经过图注意力神经网络得到的耦合信息,e表示自然对数。

62、s1602:按照异常分数排序的节点顺序,并计算相对应的召回和roc-auc指标。

63、本发明的第二个方面涉及基于邻域一致性的图异常检测装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现本发明的基于邻域一致性的图异常检测方法。

64、本发明的第三个方面涉及一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现本发明的基于邻域一致性的图异常检测方法。

65、本发明解决了一致性在端到端图节点分类的应用空缺问题。在电商领域,通过用户和商户实体之间的关系和属性特征构建得到的网络拓扑图,使用本发明可以进一步得到异常用户的识别结果。

66、本发明的有益效果是:本发明提供的基于一致性的图异常检测方法,其中,所述方法通过获取用户和商户数据,根据用户和商户实体之间的关系和属性特征构建网络拓扑图;对网络拓扑图进行不同的编码模块,得到三种分离的编码,分别是特征空间编码、结构空间编码、联合空间编码;在编码空间,使用自适应融合模块,获得更为准确的特征空间编码和结构空间编码;根据编码不同的来源设计不同任务,联合训练;在联合训练的基础上,使用一致性损失解耦三种编码;计算损失分数,输出最终分类结果。

67、该发明利用多任务约束下的一致性损失,减轻异常引起的邻域不一致,同时以无监督的方式充分利用剩余的一致性,解决了一致性在端到端图节点分类的应用空缺问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1