一种融合图注意力机制和随机近邻的异常检测方法及系统

文档序号:37642354发布日期:2024-04-18 18:05阅读:32来源:国知局
一种融合图注意力机制和随机近邻的异常检测方法及系统

本发明属于数据处理,具体涉及一种融合图注意力机制和随机近邻的异常检测方法及系统。


背景技术:

1、异常检测是数据挖掘中的关键任务之一,是指从众多数据中识别那些与大多数数据不同的罕见观察结果。许多实际应用都需要异常检测,例如金融欺诈检测,网络分析,医疗诊断,智能农业,甚至天文学中新星的发现。异常值有两个显著特征:在整个数据集的占比较小;特征明显偏离其余数据对象。

2、因此,检测异常数据往往需要考虑对象及其邻居之间的关系,基于近邻的异常检测在不需假定数据分布的情况下,表现出卓越的性能。为满足不同的应用场景,基于近邻的异常检测演化出以下五类,基于距离的方法,在非高维数据集中检测精确率高且运行速度快,如k近邻(k-nearest neighbors,knn),通过计算每个数据点与其最近k个邻居的距离,根据距离判断是否为异常。基于密度的方法,适用于密度不均匀的数据集,能够识别局部异常,如局部离群因子(local outlier factor,lof),通过比较数据点周围的密度与其邻居的密度来识别异常。基于子空间的方法,适用于异常存在于不同的子空间的情况,能检测到异常簇,如局部相关性积分算法(local correlation integral,loci),将数据划分为不同子空间中,检测其在子空间中的表现。基于图的方法,随着图网络的发展而越来越受到关注。这类方法将数据点表示为图中的节点,根据节点在图中的连接情况来判断异常,能有效处理存在复杂关系的数据。基于深度学习的方法在需要非线性建模的情况下表现出色,但通常需要更多的训练数据,如自编码器(autoencoder)。

3、尽管这些模型在不同的场景和分布下已经取得了显著的成功,但在处理多模态或大规模数据时的性能往往不够理想,其中模型参数的选择通常是一个难点问题,极具挑战性,需要领域知识或交叉验证以确定最佳参数。


技术实现思路

1、为了解决当前模型参数选择困难,导致异常检测准确性较低的技术问题,本发明提供一种融合图注意力机制和随机近邻的异常检测方法及系统。

2、第一方面

3、本发明提供了一种融合图注意力机制和随机近邻的异常检测方法,包括:

4、s1:获取多个独立的原始数据点;

5、s2:为各个所述原始数据点随机地连接多个近邻,构造随机近邻图;

6、s3:运用图注意力机制实现个性化局部嵌入,通过最小化损失函数,重构所述原始数据点,得到重构数据点;

7、s4:计算所述原始数据点与所述重构数据点之间的位秩差;

8、s5:根据所述原始数据点与所述重构数据点之间的位秩差,计算所述原始数据点的异常分数;

9、s6:对各个所述原始数据点按照异常分数由高到低的顺序进行排序,将排序靠前的预设数量的数据点判定为异常数据点。

10、第二方面

11、本发明提供了一种融合图注意力机制和随机近邻的异常检测系统,包括处理器和用于存储处理器可执行指令的存储器;所述处理器被配置为调用所述存储器存储的指令,以执行第一方面中的融合图注意力机制和随机近邻的异常检测方法。

12、与现有技术相比,本发明至少具有以下有益技术效果:

13、在本发明中,为各个原始数据点随机地连接多个近邻,构造随机近邻图,运用图注意力机制实现个性化局部嵌入,对数据点进行重构,越正常的数据点越难被重构,越异常的数据点越容易被重构,根据原始数据点与重构数据点之间的位秩差,评估原始数据点的异常分数,对各个原始数据点按照异常分数由高到低的顺序进行排序,之后将排序靠前的预设数量的数据点自动化判定为异常数据点,无需过度关注模型参数,实现从众多数据中准确地判别出异常点。



技术特征:

1.一种融合图注意力机制和随机近邻的异常检测方法,其特征在于,包括:

2.根据权利要求1所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述s2具体包括:

3.根据权利要求1所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述s3具体包括:

4.根据权利要求3所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述s301具体包括:

5.根据权利要求3所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述损失函数具体为:

6.根据权利要求3所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述约束条件具体为:

7.根据权利要求3所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述s304具体包括:

8.根据权利要求1所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述s4具体包括:

9.根据权利要求8所述的融合图注意力机制和随机近邻的异常检测方法,其特征在于,所述s5具体为:

10.一种融合图注意力机制和随机近邻的异常检测系统,其特征在于,包括处理器和用于存储处理器可执行指令的存储器;所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至9中任意一项所述的融合图注意力机制和随机近邻的异常检测方法。


技术总结
本发明公开了一种融合图注意力机制和随机近邻的异常检测方法及系统,属于数据处理技术领域,方法包括:获取多个独立的原始数据点;为各个所述原始数据点随机地连接多个近邻,构造随机近邻图;运用图注意力机制实现个性化局部嵌入,通过最小化损失函数,重构所述原始数据点,得到重构数据点;计算所述原始数据点与所述重构数据点之间的位秩差;根据所述原始数据点与所述重构数据点之间的位秩差,计算所述原始数据点的异常分数;对各个所述原始数据点按照异常分数由高到低的顺序进行排序,将排序靠前的预设数量的数据点判定为异常数据点。本发明可以无需过度关注模型参数,实现从众多数据中准确地判别出异常点。

技术研发人员:刘华文,万毅,赵利平
受保护的技术使用者:绍兴文理学院
技术研发日:
技术公布日:2024/4/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1