本发明涉及运维数据处理,具体涉及一种业务异常根因分析处理方法及装置。
背景技术:
1、排障树是一种将运维知识、数据和算法相结合的一种树状结构,其核心目的是以一种故障因果传播的方式解释系统故障。它由三部分构成:树的定义、节点的定义和边的定义。其中,树的定义决定了树的形状,其语义代表了运维人员在发现业务故障后手动排查故障流程;节点的定义代表数据和算法,当运维人员排查到该节点后,应该查询哪些指标数据,应该选择哪种算法分析这些数据;边的定义代表父节点应该如何触发孩子节点。
2、基于排障树进行故障因果分析时,当父节点异常触发子节点根因分析时,通常子节点是进行全量指标数据分析,这就存在两个问题:(1)未考虑父子节点指标之间的对应关系,父节点某些指标可能与子节点某些指标之间存在对应关系,当父节点这些指标异常时,应只需对子节点与之有对应关系的指标进行分析,而不是全量指标分析,造成资源浪费,影响结果精度;(2)只考虑了单一全量触发规则,在一些复杂场景需求情况下无法满足。
技术实现思路
1、针对现有技术中的问题,本发明实施例提供一种业务异常根因分析处理方法及装置,能够至少部分地解决现有技术中存在的问题。
2、一方面,本发明提出一种业务异常根因分析处理方法,包括:
3、获取关系矩阵;所述关系矩阵的行表示父节点路径集合,所述关系矩阵的列表示子节点路径集合,所述关系矩阵的矩阵元素表示对应位置的父节点路径与子节点路径之间的触发规则优先级;
4、根据预先建立的故障树对业务监控指标进行监控,并根据监控结果和所述关系矩阵确定待进行故障树搜索的目标子节点路径;
5、对所述目标子节点路径先后进行汇总和去重处理,并对保留下来的目标子节点路径进行故障树搜索,得到业务异常根因分析结果。
6、其中,所述获取关系矩阵,包括:
7、根据父节点数据聚簇结构、子节点数据聚簇结构和异常传播触发规则,生成所述关系矩阵;
8、其中,所述异常传播触发规则包括全量匹配、模糊匹配和精准匹配。
9、其中,所述根据父节点数据聚簇结构、子节点数据聚簇结构和异常传播触发规则,生成所述关系矩阵,包括:
10、根据所述父节点数据聚簇结构确定初始化关系矩阵的行,以及根据所述子节点数据聚簇结构确定初始化关系矩阵的列;所述初始化关系矩阵的矩阵元素初始值都为零;
11、根据与所述全量匹配相对应的第一触发规则优先级数值更新各矩阵元素初始值,得到完成全量匹配后的矩阵元素;
12、根据与所述模糊匹配相对应的第二触发规则优先级数值更新完成全量匹配后的矩阵元素,得到完成模糊匹配后的矩阵元素;
13、根据与所述精准匹配相对应的第三触发规则优先级数值更新完成精准匹配后的矩阵元素,将完成精准匹配后的矩阵元素作为所述关系矩阵的矩阵元素。
14、其中,所述模糊匹配为将父节点分析的结果按照层级对应关系一一对应地发送给子节点对应组件,未匹配到的组件不再进行算法分析。
15、其中,所述精准匹配为将父节点分析的结果按照唯一确定的对应关系发送给子节点唯一对应组件。
16、其中,所述根据监控结果和所述关系矩阵确定待进行故障树搜索的目标子节点路径,包括:
17、根据所述监控结果确定出现异常指标的目标父节点,根据所述目标父节点在所述关系矩阵中的目标行和所述关系矩阵的行列对应关系,以及触发规则优先级确定所述目标子节点路径。
18、其中,所述根据所述目标父节点在所述关系矩阵中的目标行和所述关系矩阵的行列对应关系,以及触发规则优先级确定所述目标子节点路径,包括:
19、根据所述目标行和所述行列对应关系确定目标列,并比较各目标列中的触发规则优先级数值,将触发规则优先级数值最大的目标列作为所述目标子节点路径。
20、一方面,本发明提出一种业务异常根因分析处理装置,包括:
21、获取单元,用于获取关系矩阵;所述关系矩阵的行表示父节点路径集合,所述关系矩阵的列表示子节点路径集合,所述关系矩阵的矩阵元素表示对应位置的父节点路径与子节点路径之间的触发规则优先级;
22、确定单元,用于根据预先建立的故障树对业务监控指标进行监控,并根据监控结果和所述关系矩阵确定待进行故障树搜索的目标子节点路径;
23、分析单元,用于对所述目标子节点路径先后进行汇总和去重处理,并对保留下来的目标子节点路径进行故障树搜索,得到业务异常根因分析结果。
24、再一方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
25、所述处理器和所述存储器通过所述总线完成相互间的通信;
26、所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
27、获取关系矩阵;所述关系矩阵的行表示父节点路径集合,所述关系矩阵的列表示子节点路径集合,所述关系矩阵的矩阵元素表示对应位置的父节点路径与子节点路径之间的触发规则优先级;
28、根据预先建立的故障树对业务监控指标进行监控,并根据监控结果和所述关系矩阵确定待进行故障树搜索的目标子节点路径;
29、对所述目标子节点路径先后进行汇总和去重处理,并对保留下来的目标子节点路径进行故障树搜索,得到业务异常根因分析结果。
30、本发明实施例提供一种非暂态计算机可读存储介质,包括:
31、所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:
32、获取关系矩阵;所述关系矩阵的行表示父节点路径集合,所述关系矩阵的列表示子节点路径集合,所述关系矩阵的矩阵元素表示对应位置的父节点路径与子节点路径之间的触发规则优先级;
33、根据预先建立的故障树对业务监控指标进行监控,并根据监控结果和所述关系矩阵确定待进行故障树搜索的目标子节点路径;
34、对所述目标子节点路径先后进行汇总和去重处理,并对保留下来的目标子节点路径进行故障树搜索,得到业务异常根因分析结果。
35、本发明实施例提供的业务异常根因分析处理方法及装置,获取关系矩阵;所述关系矩阵的行表示父节点路径集合,所述关系矩阵的列表示子节点路径集合,所述关系矩阵的矩阵元素表示对应位置的父节点路径与子节点路径之间的触发规则优先级;根据预先建立的故障树对业务监控指标进行监控,并根据监控结果和所述关系矩阵确定待进行故障树搜索的目标子节点路径;对所述目标子节点路径先后进行汇总和去重处理,并对保留下来的目标子节点路径进行故障树搜索,得到业务异常根因分析结果,能够提高排障树搜索效率,进而提高业务异常根因分析效率。
1.一种业务异常根因分析处理方法,其特征在于,包括:
2.根据权利要求1所述的业务异常根因分析处理方法,其特征在于,所述获取关系矩阵,包括:
3.根据权利要求2所述的业务异常根因分析处理方法,其特征在于,所述根据父节点数据聚簇结构、子节点数据聚簇结构和异常传播触发规则,生成所述关系矩阵,包括:
4.根据权利要求2所述的业务异常根因分析处理方法,其特征在于,所述模糊匹配为将父节点分析的结果按照层级对应关系一一对应地发送给子节点对应组件,未匹配到的组件不再进行算法分析。
5.根据权利要求2所述的业务异常根因分析处理方法,其特征在于,所述精准匹配为将父节点分析的结果按照唯一确定的对应关系发送给子节点唯一对应组件。
6.根据权利要求1至5任一所述的业务异常根因分析处理方法,其特征在于,所述根据监控结果和所述关系矩阵确定待进行故障树搜索的目标子节点路径,包括:
7.根据权利要求6所述的业务异常根因分析处理方法,其特征在于,所述根据所述目标父节点在所述关系矩阵中的目标行和所述关系矩阵的行列对应关系,以及触发规则优先级确定所述目标子节点路径,包括:
8.一种业务异常根因分析处理装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。