故障定位方法、装置、电子设备及计算机存储介质与流程

文档序号:35958325发布日期:2023-11-08 20:28阅读:26来源:国知局
故障定位方法、装置、电子设备及计算机存储介质与流程

本申请涉及计算机,具体涉及一种故障定位方法、装置、电子设备及计算机存储介质。


背景技术:

1、在电信运营商公司中,通常软件业务架构不同的层次都由不同的团队来负责运维管理,同层次不同的硬件/系统/应用都由不同的小组来负责运维管理。对于基础设施即服务层,随着it设备规模的不断增加,it设备故障的告警种类与告警数量也随之急剧增加。告警的多面性、冗余性、耦合性,导致某些核心层面的故障会引起大面积告警的现象,而这些告警又有可能分属不同小组,运维人员处理故障会增加排查问题的难度以及增加小组间沟通成本。同时因为对故障信息缺乏统一的管理,无法对告警系统进行反馈优化,致使误报漏报频出。同样也无法进行全面的故障信息统计分析,不知道如何对基础设施资源进行风险管理。

2、目前的故障根因分析技术方案分为基于链路调用关系的分析方法、基于传统的规则配置分析方法、知识图谱和机器学习算法的分析方法等三类。但是,采用上述三类方法进行故障分析得到的故障根因均存在较大的偏差,导致当前进行故障分析时的效率低。


技术实现思路

1、本申请实施例提供一种故障定位方法、装置、电子设备及计算机存储介质,用以解决当前进行故障分析时的效率低的技术问题。

2、第一方面,本申请实施例提供一种故障定位方法,包括:

3、基于告警信息确定发生故障的异常指标,并基于所述异常指标进行链路分析与相关性分析,得到初始指标数据列表;

4、基于所述初始指标数据列表进行指标数据的贡献度和差异度计算,并基于计算得到的贡献度与差异度从所述初始指标数据列表中确定目标指标数据列表;

5、计算所述目标指标数据列表中各指标数据的差异权重,并根据各所述差异权重与所述目标指标数据列表确定所述告警信息的故障根因。

6、在一个实施例中,所述基于所述异常指标进行链路分析与相关性分析,得到初始指标数据列表的步骤包括:

7、对所述异常指标进行链路分析,得到与所述异常指标存在链路关系的第一指标数据;

8、对所述第一指标数据中的各指标数据进行相关性系数计算,得到所述第一指标数据中各指标数据的相关性系数值;

9、基于所述第一指标数据中各指标数据的相关性系数值确定初始指标数据列表。

10、在一个实施例中,所述基于所述第一指标数据中各指标数据的相关性系数值确定初始指标数据列表的步骤包括:

11、根据所述第一指标数据中各指标数据的相关性系数值与预设系数阈值的比较,确定第二指标数据;

12、计算所述第二指标数据中各指标数据的标准差;

13、基于各所述标准差对所述第二指标数据进行指标数据筛选,得到初始指标数据列表。

14、在一个实施例中,所述基于所述初始指标数据列表进行指标数据的贡献度和差异度计算的步骤包括:

15、对所述初始指标数据列表中的各指标数据进行数据对齐处理;

16、计算数据对齐处理后的初始指标数据列表中各指标数据的贡献度与差异度。

17、在一个实施例中,所述基于计算得到的贡献度与差异度从所述初始指标数据列表中确定目标指标数据列表的步骤包括:

18、将计算得到的各贡献度分别与预设贡献度阈值进行对比,得到第一对比结果;

19、将计算得到的各差异度分别与预设差异度阈值进行对比,得到第二对比结果;

20、将各所述差异度分别与各所述差异度的平均值进行对比,得到第三对比结果;

21、基于所述第一对比结果、所述第二对比结果与所述第三对比结果从所述初始指标数据列表中确定目标指标数据列表。

22、在一个实施例中,所述计算所述目标指标数据列表中各指标数据的差异权重的步骤包括:

23、分别确定所述目标指标数据列表中各指标数据的均值及标准差;

24、分别根据所述目标指标数据列表中各指标数据的均值及标准差计算所述目标指标数据列表中各指标数据的差异权重。

25、在一个实施例中,所述根据各所述差异权重与所述目标指标数据列表确定所述告警信息的故障根因的步骤包括:

26、根据各所述差异权重对所述目标指标数据列表进行数据更新;

27、对数据更新后的所述目标指标数据列表进行排序;

28、基于排序结果确定所述告警信息的故障根因。

29、第二方面,本申请实施例提供一种故障定位装置,包括:

30、分析模块,用于基于告警信息确定发生故障的异常指标,并基于所述异常指标进行链路分析与相关性分析,得到初始指标数据列表;

31、计算模块,用于基于所述初始指标数据列表进行指标数据的贡献度和差异度计算,并基于计算得到的贡献度与差异度从所述初始指标数据列表中确定目标指标数据列表;

32、确定模块,用于计算所述目标指标数据列表中各指标数据的差异权重,并根据各所述差异权重与所述目标指标数据列表确定所述告警信息的故障根因。

33、第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面或第二方面所述的故障定位方法的步骤。

34、第四方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质为计算机可读存储介质,包括计算机程序,所述计算机程序被处理器执行时实现第一方面或第二方面所述的故障定位方法的步骤。

35、本申请实施例提供的故障定位方法、装置、电子设备及计算机存储介质,基于由告警信息确定的异常指标进行链路分析与相关性分析得到初始指标数据列表,可以对故障分析范围进行初步收敛;基于初始指标数据列表进行指标数据的贡献度和差异度计算,并基于得到的贡献度与差异度从初始指标数据列表中确定目标指标数据列表,可以对故障分析范围进行进一步收敛;最后根据目标指标数据列表中各指标数据的差异权重结合目标指标数据列表准确得到告警信息的故障根因,通过得到准确的故障根因,可以提高进行故障分析时的效率。



技术特征:

1.一种故障定位方法,其特征在于,包括:

2.根据权利要求1所述的故障定位方法,其特征在于,所述基于所述异常指标进行链路分析与相关性分析,得到初始指标数据列表的步骤包括:

3.根据权利要求2所述的故障定位方法,其特征在于,所述基于所述第一指标数据中各指标数据的相关性系数值确定初始指标数据列表的步骤包括:

4.根据权利要求1所述的故障定位方法,其特征在于,所述基于所述初始指标数据列表进行指标数据的贡献度和差异度计算的步骤包括:

5.根据权利要求1所述的故障定位方法,其特征在于,所述基于计算得到的贡献度与差异度从所述初始指标数据列表中确定目标指标数据列表的步骤包括:

6.根据权利要求1所述的故障定位方法,其特征在于,所述计算所述目标指标数据列表中各指标数据的差异权重的步骤包括:

7.根据权利要求1所述的故障定位方法,其特征在于,所述根据各所述差异权重与所述目标指标数据列表确定所述告警信息的故障根因的步骤包括:

8.一种故障定位装置,其特征在于,包括:

9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的故障定位方法的步骤。

10.一种计算机存储介质,所述计算机存储介质为计算机可读存储介质,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的故障定位方法的步骤。


技术总结
本申请涉及计算机技术领域,提供一种故障定位方法、装置、电子设备及计算机存储介质。包括:基于告警信息确定发生故障的异常指标,并基于所述异常指标进行链路分析与相关性分析,得到初始指标数据列表;基于所述初始指标数据列表进行指标数据的贡献度和差异度计算,并基于计算得到的贡献度与差异度从所述初始指标数据列表中确定目标指标数据列表;计算所述目标指标数据列表中各指标数据的差异权重,并根据各所述差异权重与所述目标指标数据列表确定所述告警信息的故障根因。本申请可以准确得到告警信息的故障根因,通过得到准确的故障根因,可提高进行故障分析时的效率。

技术研发人员:陈霞,王伟坚,欧洋洋,孙康,王凯
受保护的技术使用者:中国移动通信集团北京有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1