本发明涉及故障分析,尤其涉及一种告警聚类的根因分析方法、装置、设备及存储介质。
背景技术:
1、大型企业的业务流程十分复杂,其网络服务系统中具有大量的不同种类的业务活动,而不同的业务活动之间形成了多个业务流,每个业务流依赖于不同的服务、组件和基础设施。
2、当某一个业务发生故障,会影响到其他下游的业务,因此准确且高效地定位到业务中的异常,寻找到异常的根因至关重要。而业务流本身的复杂性和多样性也进一步提高了对于其告警的分析难度。
技术实现思路
1、本发明提供了一种告警聚类的根因分析方法、装置、设备及存储介质,以提高根因定位的准确性与稳定性。
2、根据本发明的一方面,提供了一种告警聚类的根因分析方法,包括:
3、根据关键告警确定异常节点和异常边,并根据所述异常节点和异常边生成候选异常传播图;
4、对所述候选异常传播图中异常节点进行异常偏离度过滤,得到有效异常传播图;
5、对所述有效异常传播图中异常节点进行聚类和根因分析,得到候选根因节点和各候选根因节点的根因可能性概率。
6、根据本发明的另一方面,提供了一种告警聚类的根因分析装置,包括:
7、异常信息确定模块,用于根据关键告警确定异常节点和异常边,并根据所述异常节点和异常边生成候选异常传播图;
8、异常信息筛选模块,用于对所述候选异常传播图中异常节点进行异常偏离度过滤,得到有效异常传播图;
9、异常根因确定模块,用于对所述有效异常传播图中异常节点进行聚类和根因分析,得到候选根因节点和各候选根因节点的根因可能性概率
10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的告警聚类的根因分析方法。
14、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的告警聚类的根因分析方法。
15、本发明实施例通过构建异常传播图,再利用告警聚类分析技术,对异常传播图中节点进行聚类和筛选,最终得到关键告警的可能根因和各可能根因的可能性高低,提高了根因定位的准确性与稳定性。
16、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种告警聚类的根因分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述候选异常传播图中异常节点进行异常偏离度过滤,得到有效异常传播图包括:
3.根据权利要求2所述的方法,其特征在于,所述计算所述候选异常传播图中各异常节点的异常偏离度包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述有效异常传播图中异常节点进行聚类和根因分析,得到候选根因节点和各候选根因节点的根因可能性概率包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述聚类簇生成候选根因图包括:
6.根据权利要求4所述的方法,其特征在于,所述聚类算法包括knn算法、dbscan算法和kde算法。
7.根据权利要求1所述的方法,其特征在于,所述根据关键告警确定异常节点和异常边,并根据所述异常节点和异常边生成候选异常传播图包括:
8.根据权利要求7所述的方法,其特征在于,所述部署关系数据包括配置管理数据库数据和知识图谱;所述人工规则包括关联关系的删除规则和补充规则。
9.一种告警聚类的根因分析装置,其特征在于,所述装置包括:
10.一种电子设备,其特征在于,所述电子设备包括:
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-8中任一项所述的告警聚类的根因分析方法。