基于云平台的故障检测方法、装置、故障检测系统及介质与流程

文档序号:34590347发布日期:2023-06-28 17:04阅读:34来源:国知局
基于云平台的故障检测方法、装置、故障检测系统及介质与流程

本技术涉及故障检测技术,尤其涉及一种基于云平台的故障检测方法、装置、故障检测系统及介质。


背景技术:

1、随着故障检测技术的发展,以及金融机构业务的不断增长,为了使业务正常进行,需要采取故障检测方法以及时监测到这些节点和容器的使用状态。

2、目前,将故障检测系统整合到paas云平台中,通过故障检测系统逐个识别银行paas云平台中的各节点和容器的状态,当节点、容器和应用无法正常访问时,确定该节点和容器为异常,标记为不可用状态并输出,以供运维人员进行检修。

3、然而,银行paas云平台的节点、容器数量通常非常多,逐个检测节点、容器状态的检测方式,检测故障效率较低。


技术实现思路

1、本技术提供一种基于云平台的故障检测方法、装置、故障检测系统及介质,用以解决现有技术中,检测故障效率较低的技术问题。

2、第一方面,本技术提供一种基于云平台的故障检测方法,包括:

3、在接收到检测指令时,获取所述云平台的节点信息和接口信息,所述云平台的节点信息包括每级节点的名称和标识,以及最后一级节点下每个容器的名称和标识,所述云平台的接口信息包括所述云平台的各级节点之间、以及最后一级各节点与最后一级节点下各容器之间进行数据传输时的上下游关系;

4、根据所述云平台的节点信息和接口信息,生成节点树;所述节点树是以树的层级结构表示的云平台的多级节点以及最后一级节点下所对应的多个容器,所述节点树的层级结构表征所述云平台的各级节点之间、以及最后一级各节点与最后一级节点下各容器之间进行数据传输时的上下游关系;

5、根据所述节点树的层级结构,逐层级的对所述节点树进行遍历,以确定所述云平台的故障节点和故障容器。

6、在一个实施例中,所述在接收到检测指令时,获取云平台的节点信息和接口信息,包括:

7、在接收到检测指令时,向所述云平台发送部署信息获取指令;

8、获取所述云平台响应于所述部署信息获取指令所返回的部署信息;

9、根据所述部署信息,获取所述云平台的节点信息和接口信息。

10、在一个实施例中,所述根据所述节点树的层级结构,逐层级的对所述节点树进行遍历,以确定所述云平台的故障节点和故障容器,包括:

11、根据所述节点树的层级结构以及按照自下而上的遍历方式,从所述节点树的最底层开始逐层级的对所述节点树的各层级进行遍历,以确定所述云平台的故障节点和故障容器。

12、在一个实施例中,所述根据所述节点树的层级结构以及按照自下而上的遍历方式,从所述节点树的最底层开始逐层级的对所述节点树的各层级进行遍历,以确定所述云平台的故障节点和故障容器,包括:

13、根据所述节点树的层级结构,触发所述节点树最底层的多个容器的数据获取请求,以获取各容器的返回数据;

14、将各容器的返回数据不符合预设返回数据条件的容器,均确定为故障容器,并触发各所述故障容器的上一级节点的数据获取请求,以获取各所述故障容器的上一级节点的返回数据;

15、若确定各所述故障容器的上一级节点的返回数据符合所述预设返回数据条件,则终止对所述故障容器所在的数据传输链路进行遍历。

16、在一个实施例中,在所述对所述节点树进行遍历,以确定所述云平台的故障节点和故障容器之后,还包括:

17、根据所述故障节点和所述故障容器,确定对应的预先设置的状态测试用例;

18、通过各所述状态测试用例分别对所述故障节点和所述故障容器进行测试,获得对应的测试结果,所述测试结果为故障节点或故障容器的状态;

19、基于预先存储的节点状态表与各所述测试结果,确定所述故障节点和所述故障容器的状态标识,所述节点状态表中存储有节点和容器的状态及对应的状态标识;

20、根据预先存储的第一维护表,确定所述故障节点和所述故障容器的状态标识所对应的运维方式并输出,所述第一维护表中存储有故障节点和故障容器的状态标识及各状态标识所对应的运维方式。

21、在一个实施例中,所述在接收到检测指令时,获取云平台的节点信息和接口信息之后,还包括:

22、将所述云平台的节点信息和接口信息,存储于功能接口数据库;

23、则在所述对所述节点树进行遍历,以确定所述云平台的故障节点和故障容器之后,所述方法还包括:

24、调用所述功能接口数据库中存储的所述故障节点和所述故障容器的关键功能,使用预先封装好的功能测试用例发送第三数据获取请求访问所述故障节点和所述故障容器的关键功能的接口,获得通过所述故障节点和所述故障容器的关键功能返回的测试数据,所述第三数据获取请求包括预期返回的数据结构,所述关键功能是容器和节点最频繁用于进行数据传输时的功能;

25、将各所述测试数据的数据结构,与所述预期返回的数据结构进行对比,以确定故障节点和所述故障容器的关键功能是否出现异常;

26、响应于所述故障节点和所述故障容器的关键功能出现异常,确定对应的异常原因;

27、基于所预先存储的第二维护表和所述异常原因确定对应的运维方式并输出,所述第二维护表中存储有节点和容器的关键功能发生异常时的异常原因,及各异常原因所对应的运维方式。

28、在一个实施例中,所述将各所述测试数据的数据结构,与所述预期返回的数据结构进行对比,以确定故障节点和所述故障容器的关键功能是否出现异常,包括:

29、将各所述测试数据的数据结构,与所述预期返回的数据结构进行对比;

30、判断各所述测试数据的数据结构,与所述预期返回的数据结构的对比结果是否相同;

31、响应于所述对比结果不相同,确定所述故障节点和所述故障容器的关键功能出现异常;

32、响应于所述对比结果相同,确定所述故障节点和所述故障容器的关键功能未出现异常。

33、在一个实施例中,在所述在接收到检测指令时,获取云平台的节点信息和接口信息之后,所述方法还包括:

34、将返回码不为预设值的节点和容器,分别确定为异常节点和异常容器;

35、通过预设的检测工具对所述异常节点和所述异常容器进行检测,确定所述异常节点和异常容器的网络和/或软硬件的故障原因;

36、基于预先存储的第三维护表和所述故障原因确定对应的运维方式并输出,所述第三维护表中存储有节点和容器的网络和/或软硬件出现故障时的故障原因,各所述故障原因所属的故障类别,以及各所述故障类别所对应的运维方式。

37、第二方面,本技术提供一种基于云平台的故障检测装置,位于故障检测系统,所述装置包括:

38、信息获取模块,用于在接收到检测指令时,获取所述云平台的节点信息和接口信息,所述云平台的节点信息包括每级节点的名称和标识,以及最后一级节点下每个容器的名称和标识,所述云平台的接口信息包括所述云平台的各级节点之间、以及最后一级各节点与最后一级节点下各容器之间进行数据传输时的上下游关系;

39、节点树生成模块,用于根据所述云平台的节点信息和接口信息,生成节点树;所述节点树是以树的层级结构表示的云平台的多级节点以及最后一级节点下所对应的多个容器,所述节点树的层级结构表征所述云平台的各级节点之间、以及最后一级各节点与最后一级节点下各容器之间进行数据传输时的上下游关系;

40、节点树遍历模块,用于根据所述节点树的层级结构,逐层级的对所述节点树进行遍历,以确定所述云平台的故障节点和故障容器。

41、第三方面,本技术提供一种故障检测系统,包括:处理器,以及与所述处理器通信连接的存储器;

42、所述存储器存储计算机执行指令;

43、所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的方法。

44、第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。

45、第五方面,本技术提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。

46、本技术提供的基于云平台的故障检测方法、装置、故障检测系统及介质,在接收到检测指令时,获取所述云平台的节点信息和接口信息,所述云平台的节点信息包括每级节点的名称和标识,以及最后一级节点下每个容器的名称和标识,所述云平台的接口信息包括所述云平台的各级节点之间、以及最后一级各节点与最后一级节点下各容器之间进行数据传输时的上下游关系;根据所述云平台的节点信息和接口信息,生成节点树;所述节点树是以树的层级结构表示的云平台的多级节点以及最后一级节点下所对应的多个容器,所述节点树的层级结构表征所述云平台的各级节点之间、以及最后一级各节点与最后一级节点下各容器之间进行数据传输时的上下游关系;根据所述节点树的层级结构,逐层级的对所述节点树进行遍历,以确定所述云平台的故障节点和故障容器。本技术在接收到检测指令时,基于云平台的节点信息和接口信息生成节点树,并通过逐层级的遍历节点树,以确定云平台的故障节点和故障容器。由于逐层级遍历可以同时遍历多个容器或多个节点,因此,相比于传统方式中逐个遍历节点或容器的状态,本技术能够明显提升检测效率,从而更快地确定云平台的故障节点和故障容器。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1