一种故障指标采集方法、装置、设备及存储介质与流程

文档序号:37179163发布日期:2024-03-01 12:35阅读:13来源:国知局
一种故障指标采集方法、装置、设备及存储介质与流程

本发明实施例涉及金融科技领域,尤其涉及一种故障指标采集方法、装置、设备及存储介质。


背景技术:

1、在金融科技领域,当服务器、数据库或中间件等关键组件发生异常,需要定位和分析错误发生的操作系统、中间件、数据库的组件或参数,排查过程需要调取大量的监控,包括与故障相关的节点上的操作系统日志、数据库日志、中间件日志、错误发生时的异常文件等,同时,分析过程还需要大量的监控指标,包括内存使用量,内存使用率,中央处理器(central processing unit,cpu)利用率、网络连接、输入/输出(input/output,io)、慢查询和大事务等,在综合以上分析的基础上,推导出故障原因。对于那些只在特殊情况下发生一次的问题,在测试或生产环境上复现故障往往非常困难,这就使得捕获和保存异常发生时的相关监控指标、数据和文件变得非常重要。实际上,因为生产服务器众多,每时每刻都会产生大量的监控数据,在这些数据中抓取有效的监控数据需要专业知识和运维经验。

2、传统方式的监控跟踪所有指标,往往产生数据海洋,对于问题的分析一般不太容易定位。而且现有监控工具实时监控全部指标,指标一般保存7-30天,分散在不同的监控日志或文件中。如不及时处理,相关指标有遗失风险,且系统管理人员需要登录各个节点检查各个日志,工作耗时,且容易出错,如错误分析了其他时间其他节点的日志,不利于故障分析。


技术实现思路

1、本发明提供了一种故障指标采集方法、装置、设备及存储介质,以解决现有技术中无法准确地获取与故障有关的指标,从而不利于故障分析的问题。

2、根据本发明的一方面,提供了一种故障指标采集方法,所述方法包括:

3、通过故障场景指标模型预估业务系统的故障;

4、确定所述故障对应的故障指标子集以及故障指标采集条件;

5、当所述故障指标采集条件被触发时,根据所述故障指标子集采集故障指标。

6、根据本发明的另一方面,提供了故障指标采集装置,所述装置包括:

7、预估模块,用于通过故障场景指标模型预估业务系统的故障;

8、确定模块,确定所述故障对应的故障指标子集以及故障指标采集条件;

9、采集模块,当所述故障指标采集条件被触发时,根据所述故障指标子集采集故障指标。

10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:至少一个处理器;以及

11、与所述至少一个处理器通信连接的存储器;其中,

12、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的故障指标采集方法。

13、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的故障指标采集方法。

14、本发明实施例的一种故障指标采集方法、装置、设备及存储介质,所述方法包括:通过故障场景指标模型预估业务系统的故障;确定所述故障对应的故障指标子集以及故障指标采集条件;当所述故障指标采集条件被触发时,根据所述故障指标子集采集故障指标。该方法通过对业务系统中的故障预估,并确定与故障对应的故障指标子集以及故障指标采集条件,在当故障指标采集条件被触发时,根据故障指标子集采集与故障相关的故障指标,从而能够准确地获取与故障相关的指标,以通过故障指标对故障进行分析,解决了现有技术中无法准确地获取与故障有关的指标,从而不利于故障分析的问题。

15、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种故障指标采集方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述故障对应的故障指标子集,包括:

3.根据权利要求1所述的方法,其特征在于,所述当所述故障指标采集条件被触发时,根据所述故障指标子集采集故障指标,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过所述捕获程序确定所述故障指标采集条件是否被触发,包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述故障指标子集采集故障指标,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种故障指标采集装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的故障指标采集方法。


技术总结
本发明公开了一种故障指标采集方法、装置、设备及存储介质。所述方法包括:通过故障场景指标模型预估业务系统的故障;确定所述故障对应的故障指标子集以及故障指标采集条件;当所述故障指标采集条件被触发时,根据所述故障指标子集采集故障指标。该方法通过对业务系统中的故障预估,并确定与故障对应的故障指标子集以及故障指标采集条件,在当故障指标采集条件被触发时,根据故障指标子集采集与故障相关的故障指标,从而能够准确地获取与故障相关的指标,以通过故障指标对故障进行分析。

技术研发人员:刘伟,张旭春,吴海存,赵轩
受保护的技术使用者:中国农业银行股份有限公司
技术研发日:
技术公布日:2024/2/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1