告警和根因定位方法、模型训练方法、装置、设备及介质与流程

文档序号:36266486发布日期:2023-12-06 11:29阅读:30来源:国知局
告警和根因定位方法与流程

本发明涉及计算机,尤其涉及一种告警和根因定位方法、模型训练方法、装置、设备及介质。


背景技术:

1、随着互联网的快速发展,计算机分布式系统成为了现代社会中不可或缺的基础设施,为各种业务和应用程序提供了通信、数据传输和业务计算的基础。然而,在系统运行过程中,可能会由于各种原因,例如硬件故障、软件错误、配置问题或恶意攻击等,导致网络中的问题和故障。这些问题可能会对业务和应用程序的可用性和性能产生负面影响,因此,需要及时地进行故障告警和根因定位。

2、现有技术中,通常采用设置固定阈值或异常检测的方法判断是否产生告警。然后,基于告警触发根因分析故障定位。具体的,可以采用告警因果图,或者基于应用指标的相关程度和关系图的深度进行根因提取。

3、但是,现有技术中的故障告警与根因定位是分割开的。由于告警的产生本身会有假阳性率,采用告警因果图进行根因定位,在发生了告警,但实际上并没有产生故障的情况下,会影响根因定位效果,甚至导致根因定位结果偏离实际。其次,尽管发生了告警,但由于基于应用指标的相关程度和关系图的深度进行根因提取的方法,和告警不相关(只是由告警触发),可能会存在找不到根因或找错根因的问题。


技术实现思路

1、本发明提供了一种告警和根因定位方法、模型训练方法、装置、设备及介质,以将故障与根因定位纳入到一个框架下,提高了根因定位的准确性和可靠性。

2、第一方面,提供了一种基于图神经网络的告警和根因定位模型训练方法,该方法包括:

3、采集系统运行中的原始历史数据进行预处理生成目标历史数据,并根据告警信息生成与目标历史数据对应的告警数据标签或非告警数据标签;

4、根据历史拓扑图数据、历史指标数据,以及告警数据标签或非告警数据标签,生成训练样本数据;

5、将训练样本数据输入至预设图神经网络中进行分类训练,得到全局告警模型;

6、将训练样本数据输入至预设图解释性模型中进行模型训练,得到根因定位模型;

7、其中,根因定位模型输出与目标历史数据对应的目标历史子数据;全局告警模型对目标历史数据及对应的目标历史子数据的识别结果相同;目标历史子数据与目标历史数据中的分布差异满足预设条件。

8、可选的,采集系统运行中的原始历史数据进行预处理生成目标历史数据,包括:采集系统运行中与告警信息对应的原始告警历史数据,并确定与原始告警历史数据对应的告警时间段;以告警时间段为基础,通过滑动区间方式,确定多个预设时间长度的故障区间;将与各故障区间对应的原始历史数据,作为与各故障区间对应的目标历史数据。

9、可选的,采集系统运行中的原始历史数据进行预处理生成目标历史数据,包括:根据告警时间段与预设时间长度,确定故障区间数量;根据告警时间段,确定非告警时间段;并根据非告警时间段,生成与故障区间数量个数相同的非故障区间;将与各非故障区间对应的原始历史数据,作为与各非故障区间对应的目标历史数据。

10、可选的,根据历史拓扑图数据、历史指标数据,以及告警数据标签或非告警数据标签,生成训练样本数据,包括:根据历史拓扑图数据以及历史指标数据,确定目标历史数据中的各个节点,并生成与各个节点对应的特征向量;将历史数据中的各节点、各节点的特征向量,以及告警数据标签或非告警数据标签,生成训练样本数据。

11、可选的,将训练样本数据输入至预设图神经网络中进行分类训练,得到全局告警模型,包括:将训练样本数据输入至预设图神经网络中进行特征提取,得到与目标历史数据中各节点对应的表征变量,并根据各节点的表征变量得到目标历史数据的表征向量;根据表征向量,并采用损失函数对预设图神经网络进行分类训练,得到全局告警模型。

12、可选的,将训练样本数据输入至预设图解释性模型中进行模型训练,得到根因定位模型,包括:将训练样本数据输入至预设图解释性模型中,得到与目标历史数据对应的目标历史子数据;根据目标历史数据、目标历史子数据、以及预设损失函数,进行模型训练,得到根因定位模型;其中,预设损失函数中包括目标历史数据与目标历史子数据之间的分布差异,以及全局告警模型对目标历史数据及目标历史子数据识别结果中的变量差异。

13、第二方面,提供了一种基于图神经网络的告警和根因定位方法,该方法包括:

14、实时采集系统运行中的待分析数据,并将待分析数据进行预处理生成目标待分析数据;

15、将目标待分析数据输入至,采用本发明任一实施例的基于图神经网络的告警和根因定位模型训练方法生成的全局告警模型中,得到告警分析结果;

16、当告警分析结果为产生告警时,将目标待分析数据输入至,采用本发明任一实施例的基于图神经网络的告警和根因定位模型训练方法生成的根因定位模型中,得到目标待分析数据对应的目标待分析子数据;

17、将目标待分析子数据作为根因定位结果。

18、第三方面,提供了一种基于图神经网络的告警和根因定位模型训练装置,该装置包括:

19、数据标签生成模块,用于采集系统运行中的原始历史数据进行预处理生成目标历史数据,并根据告警信息生成与目标历史数据对应的告警数据标签或非告警数据标签;

20、训练样本数据生成模块,用于根据历史拓扑图数据、历史指标数据,以及告警数据标签或非告警数据标签,生成训练样本数据;

21、预设图神经网络训练模块,用于将训练样本数据输入至预设图神经网络中进行分类训练,得到全局告警模型;

22、预设图解释性模型训练模块,用于将训练样本数据输入至预设图解释性模型中进行模型训练,得到根因定位模型;其中,根因定位模型输出与目标历史数据对应的目标历史子数据;全局告警模型对目标历史数据及对应的目标历史子数据的识别结果相同;目标历史子数据与目标历史数据中的分布差异满足预设条件。

23、第四方面,提供了一种基于图神经网络的告警和根因定位装置,该装置包括:

24、目标待分析数据生成模块,用于实时采集系统运行中的待分析数据,并将待分析数据进行预处理生成目标待分析数据;

25、告警分析结果确定模块,用于将目标待分析数据输入至,采用本发明任一实施例的基于图神经网络的告警和根因定位模型训练方法生成的全局告警模型中,得到告警分析结果;

26、目标待分析子数据获取模块,用于当告警分析结果为产生告警时,将目标待分析数据输入至,采用本发明任一实施例的基于图神经网络的告警和根因定位模型训练方法生成的根因定位模型中,得到目标待分析数据对应的目标待分析子数据;

27、根因定位结果确定模块,用于将目标待分析子数据作为根因定位结果。

28、第五方面,提供了一种电子设备,电子设备包括:

29、至少一个处理器;以及

30、与至少一个处理器通信连接的存储器;其中,

31、存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的基于图神经网络的告警和根因定位模型训练方法或者,基于图神经网络的告警和根因定位方法。

32、第六方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的基于图神经网络的告警和根因定位模型训练方法或者,基于图神经网络的告警和根因定位方法。

33、本发明实施例的技术方案,通过采集系统运行中的原始历史数据进行预处理生成目标历史数据,并根据告警信息生成与目标历史数据对应的告警数据标签或非告警数据标签;根据历史拓扑图数据、历史指标数据,以及告警数据标签或非告警数据标签,生成训练样本数据;将训练样本数据输入至预设图神经网络中进行分类训练,得到全局告警模型;将训练样本数据输入至预设图解释性模型中进行模型训练,得到根因定位模型;其中,根因定位模型输出与目标历史数据对应的目标历史子数据;全局告警模型对目标历史数据及对应的目标历史子数据的识别结果相同;目标历史子数据与目标历史数据中的分布差异满足预设条件的技术手段,解决了现有的根因定位方法独立于告警,导致无法找到故障产生的根本原因的问题。通过根因定位模型可得到故障的根因定位结果,通过图神经网络与图解释性模型对故障情况进行分析和根因定位,将故障与根因定位纳入到一个框架下,提高了根因定位的准确性和可靠性。

34、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1