基于视图级图对比学习的无监督属性网络异常检测方法及系统

文档序号:36334698发布日期:2023-12-13 01:44阅读:26来源:国知局
基于视图级图对比学习的无监督属性网络异常检测方法及系统

本发明属于网络异常检测领域,具体公开了基于视图级图对比学习的无监督属性网络异常检测方法及系统。背景介绍属性网络广泛的存在于多种现实世界应用程序中,相比于传统的只包含节点之间交互关系的普通网络,属性网络包含了节点自身丰富的特征信息,为建模更为复杂的交互系统提供了可能。检测属性网络中的异常节点对许多安全相关的应用有着重要的意义,已成为当下迫切关注的研究问题,如社交垃圾邮件检测、金融欺诈检测和网络入侵检测。然而,属性网络中的节点异常不仅与它们与其他节点的交互方式相关,还和节点属性的不一致相关,因此检测属性网络上的异常极具挑战性。为了解决上述问题,研究者们致力于研究异常检测,早期的异常检测方法采用cur矩阵分解、子空间选择、自我网络分析和残差分析等浅层机制来识别异常节点,但是这些方法通常依赖于特征工程或所观察到的节点交互,不能很好的捕获网络中的高度非线性属性。近年来,图神经网络被广泛的应用于异常检测任务,旨在使用深度神经网络来捕获网络的非线性并学习异常模式下的节点表示,但由于标记异常是一项昂贵且大致不可能的工作,因此采用无监督方式识别异常更为可靠。此外,对比学习技术的兴起为属性网络中的异常检测任务提供了新的方向。对比学习是一种自监督学习方法,通过让模型学习没有标签的节点是相似的还是不同的,来建模网络的一般特征。近年来,对比学习在计算机视觉方面表现出了具有竞争力的表现,并在图表示学习中越来越受欢迎。图对比学习遵循互信息最大化的原则,即将具有相似语义信息的节点的表示拉近,同时远离不相关节点的表示。然而,现有的基于对比学习的异常检测方法通常基于节点图构造正负实例对,通过最大化目标节点与正实例之间的互信息,最小化目标节点与负实例之间的互信息来学习节点表示。这种方式更多地关注了节点的局部信息,而忽略了对全局信息的利用。因此,如何充分的利用局部信息和全局信息,提取高质量的结构和属性信息并将两者有效地融合,从而在没有外部信息指导的情况下有效地检测属性网络中的异常节点值得更深入的研究。


背景技术:


技术实现思路

1、为了克服现有技术中存在现有的异常检测方法中遇到的不能很好的识别异常节点和其他对应节点之间的异常交互和属性差异且识别异常网络准确率低的问题,本发明提供了一种基于视图级图对比学习的无监督属性网络异常检测方法及系统。

2、本发明提供了一种基于视图级图对比学习的无监督属性网络异常检测方法,包括如下步骤:

3、s1.对有效数据进行预处理,通过人工向干净的属性网络中注入属性异常和结构异常,得到具有异常模式的现实世界属性网络,将所述现实世界属性网络整合为原始输入图数据集;

4、s2.通过所述步骤s1中得到的原始输入图数据集中的原始输入图邻接矩阵、原始输入图节点属性矩阵和原始输入图的边缘属性矩阵构建目标视图;通过自增强视图学习器对所述步骤s1中得到的原始输入图数据集中的原始输入图建模生成全连接的自增强视图邻接矩阵,基于所述全连接的自增强视图邻接矩阵,为每个节点选择语义上与其最相似的前k个节点,并将这k个节点作为每个节点的邻域节点,构建出稀疏的自增强视图邻接矩阵,通过所述稀疏的自增强视图邻接矩阵构建自增强视图;

5、s3.规范化步骤s2中得到的所述目标视图和自增强视图,且保证所述目标视图和自增强视图中的邻接矩阵对称且邻接矩阵中的每个元素非负,利用两个权重共享的图卷积神经网络对规范化之后的所述目标视图和自增强视图进行建模生成目标视图的嵌入表示和自增强视图的嵌入表示,根据所述目标视图的嵌入表示和所述自增强视图的嵌入表示构造所述目标视图和自增强视图之间的对比学习损失,将所述目标视图和自增强视图之间的对比学习损失作为图对比学习模块的损失函数;

6、s4.通过结构重构解码器对步骤s3得到的所述自增强视图的嵌入表示进行解码得到解码向量,根据所述解码向量预测每对节点之间是否存在链接,生成重构的原始输入图邻接矩阵并计算结构重构误差;通过属性重构解码器对步骤s3得到的所述自增强视图的嵌入表示进行解码得到重构的原始输入图节点属性矩阵并计算属性重构误差;

7、s5.通过步骤s4得到的所述重构的原始输入图邻接矩阵和重构的原始输入图节点属性矩阵得到重构的原始输入图结构向量和重构的原始输入图属性向量,构建异常得分函数计算每个节点的异常分数,根据每个节点的所述异常分数对节点进行排序来识别异常节点;通过步骤s4得到的所述结构重构误差和所述属性重构误差,构造网络重构模块的损失函数,结合所述图对比学习模块的损失函数和所述网络重构模块的损失函数,得到基于视图级图对比学习的无监督属性网络异常检测模型的总体损失函数,通过联合训练得到基于视图级图对比学习的无监督属性网络异常检测模型;

8、s6.将待检测的属性网络输入所述基于视图级图对比学习的无监督属性网络异常检测模型中,得到检测结果。

9、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测方法,所述步骤s2中,构建所述目标视图包括读取所述原始输入图的数据构建所述原始输入图邻接矩阵和原始输入图节点特征矩阵,使用所述原始输入图中两个相连节点的相似性指标计算原始输入图中每条边的边缘属性得到所述原始输入图的边缘属性矩阵;

10、构造所述原始输入图的边缘属性矩阵并计算具有边缘属性的原始输入图邻接矩阵at,如公式(1)所示:

11、

12、其中,λea是由两个连接节点的相似性指标计算出的所述原始输入图的边缘属性矩阵,°表示哈达玛积,表示原始输入图的邻接矩阵,其中,n为节点数;

13、使用所述具有边缘属性的原始输入图邻接矩阵at和所述原始输入图的节点属性矩阵x构建目标视图其中,表示原始输入图的节点属性矩阵,其中,n为节点数,d为节点的特征维数;

14、所述自增强视图学习器采用全图参数化方法,通过一个独立的参数直接对所述原始输入图的邻接矩阵的每个元素进行建模,生成所述全连接的自增强视图邻接矩阵如公式(2)所示:

15、

16、其中,表示原始输入图的节点属性矩阵,其中,n为节点数,d为节点的特征维数,ω=w表示参数矩阵,σ为非线性激活函数;

17、为每个节点保留了与其连接值最高的前k个节点作为每个节点的邻域节点,构建出所述稀疏的自增强视图邻接矩阵s;使用k-最近邻算法通过稀疏的自增强视图邻接矩阵s构建自增强视图,如公式(3)所示:

18、

19、其中,表示行向量的前k个最大值的集合,表示全连接的自增强视图邻接矩阵的第i行第j列的值,sij表示稀疏的自增强视图邻接矩阵s的第i行第j列的值,使用稀疏的自增强视图邻接矩阵s构建自增强视图

20、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测方法,所述步骤s3中:规范化所述目标视图和所述自增强视图保证目标视图的邻接矩阵at、和自增强视图的邻接矩阵s对称并且邻接矩阵中的每个元素非负,如公式(4)和公式(5)所示:

21、

22、

23、其中,sym(.)为对称化函数,nor(.)为归一化函数,σ为一个非线性激活函数,它将元素值映射到[0,1]区间,(.)t为转置操作;

24、所述目标视图的嵌入表示zt如公式(6)所示,所述自增强视图的嵌入表示zs如公式(7)所示:

25、

26、

27、其中,表示对所述目标视图的邻接矩阵at执行对称归一化操作,表示对自增强视图的邻接矩阵s执行对称归一化操作,表示原始输入图节点属性矩阵,w(0),w(1),w(2)是图卷积网络编码器中的可学习的权重矩阵,dt是(at+i)的度矩阵,ds是(s+i)的度矩阵,i为单位矩阵。

28、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测方法,所述步骤s3中,所述图对比学习模块的损失函数计算如公式(8)-公式(10)所示:

29、

30、

31、

32、其中,n表示原始输入图中节点的总数,sim(.)是计算两个节点表示之间相似度的相似度函数,θ表示控制该分布浓度水平的温度因子。

33、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测方法,所述步骤s4中,所述结构重构解码器通过图卷积网络对自增强视图嵌入表示zs进行解码得到解码向量h,如公式(11)所示:

34、

35、其中,w(3),w(4)为结构重构解码器中的可学习的权重矩阵,是对原始输入图邻接矩阵a执行对称归一化操作,d是(a+i)的度矩阵,i是单位矩阵,

36、根据所述解码向量h预测每对节点之间是否存在链接,生成所述重构的原始输入图邻接矩阵如公式(12)所示:

37、

38、其中,sigmoid(.)表示sigmoid函数,(.)t为转置操作,

39、根据所述重构的原始输入图邻接矩阵计算结构重构误差,如公式(13)所示:

40、

41、其中,rs表示结构重构误差,表示矩阵的f范数的平方,

42、所述属性重构解码器通过图卷积网络对自增强视图嵌入表示zs进行解码得到所述重构的原始输入图节点属性矩阵如公式(14)所示:

43、

44、其中,w(5),w(6),w(7)是属性重构解码器中的可学习的权重矩阵,

45、根据所述重构的原始输入图节点属性矩阵计算属性重构误差,如公式(15)所示:

46、

47、其中,ra表示属性重构误差,表示矩阵的f范数的平方。

48、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测方法,所述步骤s5中,所述异常得分函数如公式(16)所示:

49、

50、其中,vi表示节点,α是平衡结构重构和属性重构影响的重要控制参数,xi为节点vi的原始输入图属性向量,为节点vi的重构的原始输入图属性向量,ai为原始输入图邻接矩阵a的第i行向量,表示节点vi的原始输入图结构向量,为重构的原始输入图邻接矩阵的第i行向量,表示节点vi的重构的原始输入图结构向量。

51、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测方法,所述步骤s5中,通过所述结构重构误差rs和所述属性重构误差ra,得所述网络重构模块的损失函数如公式(17)所示:

52、

53、其中,α是平衡结构重构和属性重构影响的重要控制参数,表示矩阵的f范数的平方;

54、所述基于视图级图对比学习的无监督属性网络异常检测模型的总体损失函数如公式(18)所示:

55、

56、其中,μ是一个非负的调优参数,用于衡量所述图对比学习模块和网络重构模块的重要性;

57、所述联合训练包括利用自适应矩估计优化器最小化总体损失函数采用反向传播方法更新模型中图对比学习模块和网络重构模块权重参数,得到基于视图级图对比学习的无监督属性网络异常检测模型。

58、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测方法,还包括目标视图更新机制,根据不断学习的所述自增强视图的嵌入表示zs计算每对节点之间存在链接的概率更新所述目标视图的目标结构,从而不断修正所述目标视图中存在的异常模式,缓解所述目标视图中的结构异常,使所述自增强视图更趋向于正常模式,具体为:

59、使用所述自增强视图的嵌入表示zs预测每对节点之间存在链接的概率p,如公式(19)所示:

60、

61、对所述目标视图更新,如公式(20)所示:

62、at=δat+(1-δ)p   (20)

63、其中,δ表示衰减率,δ∈[0,1],用于调节所述目标视图更新的速度。

64、本发明还公开了一种基于视图级图对比学习的无监督属性网络异常检测系统,包括:

65、数据预处理模块,对有效数据进行预处理,通过人工向干净的属性网络中注入属性异常和结构异常,获取具有异常模式的现实世界属性网络,将所述现实世界属性网络整合为原始输入图数据集;

66、图对比学习模块,包括

67、目标视图生成组件,用于通过原始输入图的邻接矩阵、原始输入图中节点属性矩阵和原始输入图边缘属性矩阵构建目标视图;

68、自增强视图学习组件,用于通过自增强视图学习器对原始输入图建模生成全连接的自增强视图邻接矩阵;基于所述全连接的自增强视图邻接矩阵,为每个节点选择语义上与其最相似的前k个节点,并将这k个节点作为每个节点的邻域节点,构建出稀疏的自增强视图邻接矩阵,通过所述稀疏的自增强视图邻接矩阵构建自增强视图;

69、对比学习组件,用于规范化所述目标视图和自增强视图,且保证所述目标视图和自增强视图中的邻接矩阵对称并且邻接矩阵中的每个元素非负;利用两个权重共享的图卷积神经网络对规范化之后的所述目标视图和自增强视图进行建模生成目标视图的嵌入表示和自增强视图的嵌入表示;根据所述目标视图的嵌入表示和自增强视图的嵌入表示,构造所述目标视图和自增强视图之间的对比学习损失,将所述目标视图和自增强视图之间的对比学习损失作为图对比学习模块的损失函数;

70、网络重构模块,包括

71、结构重构组件,用于通过结构重构解码器对所述自增强视图的嵌入表示进行解码得到解码向量,根据所述解码向量预测每对节点之间是否存在链接,生成重构的原始输入图邻接矩阵并计算结构重构误差;

72、属性重构组件,用于通过属性重构解码器对所述自增强视图的嵌入表示进行解码得到重构的原始输入图节点属性矩阵并计算属性重构误差;

73、异常节点检测组件,用于通过得到的所述重构的原始输入图邻接矩阵和重构的原始输入图节点属性矩阵得到重构的原始输入图结构向量和重构的原始输入图属性向量,构建异常得分函数计算每个节点的异常分数,根据每个节点的所述异常分数对节点进行排序来识别异常节点;通过所述结构重构误差和所述属性重构误差构造网络重构模块的损失函数,结合所述图对比学习模块的损失函数和所述网络重构模块的损失函数,得到基于视图级图对比学习的无监督属性网络异常检测模型的总体损失函数,通过联合训练得到基于视图级图对比学习的无监督属性网络异常检测模型。

74、根据本技术一些实施例的一种基于视图级图对比学习的无监督属性网络异常检测系统,还包括目标视图更新机制模块,用于根据不断学习的所述自增强视图嵌入表示计算每对节点之间存在链接的概率更新所述目标视图的目标结构,从而不断修正所述目标视图中存在的异常模式,缓解所述目标视图中的结构异常,使所述自增强视图更趋向于正常模式。

75、本发明提出的一种基于视图级图对比学习的无监督属性网络异常检测方法及系统,解决了现有的异常检测方法中遇到的不能很好的识别异常节点和其他对应节点之间的异常交互和属性差异的问题,能够在没有外部信息指导的情况下准确的识别属性网络中的异常节点,通过边缘属性信息构建目标视图,并构建可学习的自增强视图,使用视图级图对比学习方法最大化目标视图和自增强视图之间的一致性,从而没有外部信息指导的情况下编码网络深层信息;通过网络重构模块解码自增强视图的编码信息,以便重构原始输入图的节点属性和网络结构;联合训练图对比学习模块和网络重构模块这两个互补的模块,根据各个节点的重构损失进行排序来发现异常节点,从而实现无监督属性网络异常检测任务,本发明在无监督异常属性网络检测方面具有很高的准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1