一种软件运行监控方法、系统、电子设备及存储介质与流程

文档序号:36927943发布日期:2024-02-02 21:53阅读:18来源:国知局
一种软件运行监控方法、系统、电子设备及存储介质与流程

本发明涉及计算机,更具体地说,涉及一种软件运行监控方法、系统、电子设备及存储介质。


背景技术:

1、gtp是目标使用最广泛的文件传输类产品之一,可以提供稳定的点对点文件传输能力;一个gtp的传输网络中的节点数量可能成百上千,为了保证文件传输的时效,需要对当前的各个节点、通道和队列的运行情况进行监控,以便针对存在异常状态通道和队列及时发出相应的预警。

2、通常产品自身对具备自愈能力的异常场景存在一定的容错能力,也就是说,具备自愈能力的异常场景不在发出对应的预警,但是由于受gtp产品特性的限值,只要gtp的传输网络中的任意一个节点重启或网络抖动,都可能会造成关联节点瞬时的连接失败,并发出相应的预警。

3、因此,如何提供一种软件运行监控方式,以避免因gtp发生瞬时连接失败、节点重启、网络抖动等具备自愈能力的异常场景所触发相应的预警,提高运维智能化水平和效率,是本技术当前亟需解决的问题。


技术实现思路

1、有鉴于此,本发明提供一种软件运行监控方法、系统、电子设备及存储介质,以避免因gtp发生瞬时连接失败、节点重启、网络抖动等具备自愈能力的异常场景所触发相应的预警,提高运维智能化水平和效率为目的。

2、本发明第一方面提供一种软件运行监控方法,适用于gtp,所述方法包括:

3、当检测到所述gtp的进程,获取所述gtp在第一预设时间段内的连通性状态矩阵;其中,所述连通性状态矩阵包括所述gtp的每个的通道在所述第一预设时间段内依次采集的多个通道信息;

4、遍历各个所述通道,从各个所述通道中确定目标通道;其中,所述目标通道为未进行过通道异常检测的通道;

5、根据所述目标通道的各个通道信息,判断所述目标通道是否存在异常;

6、若所述目标通道存在异常,输出所述目标通道对应的预警指示,将所述目标通道标记为已进行过通道异常检测的通道,并返回执行遍历各个所述通道,从各个所述通道中确定目标通道这一步骤;

7、若所述目标通道不存在异常,生成所述目标通道对应的队列列表;

8、遍历所述队列列表,从所述队列列表中确定未进行状态监测的队列,并获取所述未进行状态监测的队列的第一排队消息数;

9、若所述第一排队消息数大于预设消息数阈值,获取所述未进行状态监测的队列在所述第二预设时间段内的队列状态矩阵;其中,所述第二预设时间段小于所述第一预设时间段;

10、根据所述未进行状态监测的队列的队列状态矩阵,判断所述未进行状态监测的队列是否存在异常;

11、若所述未进行状态监测的队列存在异常,输出所述未进行状态监测的队列对应的预警指示,将所述未进行状态监测的队列更新为已进行状态监测的队列,并返回执行遍历所述队列列表,从所述队列列表中获取未进行状态监测的队列的第一排队消息数这一步骤。

12、可选的,所述目标通道的通道信息至少包括端口连通性和通道状态;

13、根据所述目标通道的各个通道信息,判断所述目标通道是否存在异常,包括:

14、根据所述目标通道的各个端口连通性,判断所述目标通道是否存在端口异常;

15、若所述目标通道存在端口异常,输出相应的预警提示;

16、若所述目标通道不存在端口异常,根据所述目标通道的各个通道状态,判断所述目标通道是否存在通道状态异常;

17、若所述目标通道存在通道状态异常,确定所述目标通道存在异常。

18、可选的,根据所述目标通道的各个端口连通性,判断所述目标通道是否存在端口异常,包括:

19、判断所述目标通道的各个端口连通性是否均为开通状态;

20、若所述目标通道存在不为开通状态的端口连通性,确定所述目标通道存在端口异常;

21、若所述目标通道的各个端口连通性均为开通状态,确定所述目标通道不存在端口异常。

22、可选的,所述若所述目标通道不存在端口异常,根据所述目标通道的各个通道状态,判断所述目标通道是否存在通道状态异常,包括:

23、所述若所述目标通道不存在端口异常,判断所述目标通道是否存在至少预设数值个表征连接异常的通道状态;

24、若所述目标通道存在至少预设数值个表征连接异常的通道状态,确定所述目标通道存在通道状态异常;

25、若所述目标通道不存在至少预设数值个表征连接异常的通道状态,确定所述目标通道不存在通道状态异常。

26、可选的,所述队列状态矩阵包括所述未进行状态监测的队列在所述第二预设时间段内依次采集的多个队列信息;所述队列消息包括第二排队消息数、发送中消息数、消息id和readseq变化率;

27、根据所述未进行状态监测的队列的队列状态矩阵,判断所述队列是否存在异常,包括:

28、判断各个所述队列信息中的最后一个队列消息中的第二排队消息数是否大于所述预设消息数阈值;

29、若最后一个队列消息中的第二排队消息数大于所述预设消息数阈值,根据所述未进行状态监测的队列的各个队列消息中的发送中消息数、消息id和readseq变化率,判断所述队列是否存在异常。

30、可选的,所述根据所述未进行状态监测的队列的各个队列消息中的发送中消息数、消息id和readseq变化率,判断所述队列是否存在异常,包括:

31、判断所述未进行状态监测的各个队列消息中的发送中消息数是否均等于目标阈值的;

32、若各个队列消息中存在不等于所述目标阈值的发送中消息数,确定所述未进行状态监测的队列存在发送链表异常;

33、若各个队列消息中的发送中消息数据均等于所述目标阈值,判断各个所述队列消息中的消息id是否一致;

34、若各个队列消息中的消息id一致,确定所述未进行状态监测的队列存在发送状态异常;

35、若各个队列消息中的消息id不一致,计算各个所述队列消息中的readseq变化率之间的差值;

36、若存在不大于预设readseq变化率的差值,确定所述未进行状态监测的队列存在发送速率异常。

37、可选的,所述方法还包括:

38、若最后一个队列消息中的第二排队消息数不大于所述预设消息数阈值,确定所述所述未进行状态监测的队列不存在异常;

39、将所述未进行状态监测的队列更新为已进行状态监测的队列,并返回执行遍历所述队列列表,从所述队列列表中获取未进行状态监测的队列的第一排队消息数。

40、本发明第二方面提供一种软件运行监控系统,适用于gtp,所述系统包括:

41、第一获取单元,用于当检测到所述gtp的进程,获取所述gtp在第一预设时间段内的连通性状态矩阵;其中,所述连通性状态矩阵包括所述gtp的每个的通道在所述第一预设时间段内依次采集的多个通道信息;

42、第一遍历单元,用于遍历各个所述通道,从各个所述通道中确定目标通道;其中,所述目标通道为未进行过通道异常检测的通道;

43、第一判断单元,用于根据所述目标通道的各个通道信息,判断所述目标通道是否存在异常;

44、第一输出单元,用于若所述目标通道存在异常,输出所述目标通道对应的预警指示,将所述目标通道标记为已进行过通道异常检测的通道,并返回执行第一遍历单元;

45、队列列表生成单元,用于若所述目标通道不存在异常,生成所述目标通道对应的队列列表;

46、第二遍历单元,用于遍历所述队列列表,从所述队列列表中确定未进行状态监测的队列,并获取所述未进行状态监测的队列的第一排队消息数;

47、第二获取单元,用于若所述第一排队消息数大于预设消息数阈值,获取所述未进行状态监测的队列在所述第二预设时间段内的队列状态矩阵;其中,所述第二预设时间段小于所述第一预设时间段;

48、第二判断单元,用于根据所述未进行状态监测的队列的队列状态矩阵,判断所述未进行状态监测的队列是否存在异;

49、第二输出单元,用于若所述未进行状态监测的队列存在异常,输出所述未进行状态监测的队列对应的预警指示,将所述未进行状态监测的队列更新为已进行状态监测的队列,并返回执行第二遍历单元。

50、本发明第三方面提供一种电子设备,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如本发明第一方面提供的软件运行监控方法。

51、本发明第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行如本发明第一方面提供的软件运行监控方法。

52、本发明提供一种软件运行监控方法、系统、电子设备及存储介质,本发明提供一种软件运行监控方法,适用于gtp,可以当检测到gtp的进程,获取gtp在第一预设时间段内的连通性状态矩阵;其中,连通性状态矩阵包括gtp的每个的通道在第一预设时间段内依次采集的多个通道信息;遍历各个通道,从各个通道中确定目标通道;其中,目标通道为未进行过通道异常检测的通道;根据目标通道的各个通道信息,判断目标通道是否存在异常;若目标通道存在异常,输出目标通道对应的预警指示,将目标通道标记为已进行过通道异常检测的通道,并返回遍历各个通道,从各个通道中确定目标通道这一步骤;若目标通道不存在异常,生成目标通道对应的队列列表;遍历队列列表,从队列列表中确定未进行状态监测的队列,并获取未进行状态监测的队列的第一排队消息数;若第一排队消息数大于预设消息数阈值,获取未进行状态监测的队列在第二预设时间段内的队列状态矩阵;其中,第二预设时间段小于第一预设时间段;根据未进行状态监测的队列的队列状态矩阵,判断未进行状态监测的队列是否存在异常;若未进行状态监测的队列存在异常,输出未进行状态监测的队列对应的预警指示,将未进行状态监测的队列更新为已进行状态监测的队列,并返回执行遍历队列列表,从队列列表中获取未进行状态监测的队列的第一排队消息数这一步骤。本发明提供的技术方案,通过将时间维度引入软件运行监控中,以便尽量压缩的第一预设时间段内的时间窗口中,通过根据第一预设时间段内的连通性状态矩阵的目标通道的多个通道信息,综合评估对应的目标通道是否存在异常,只有在目标通道存在异常的情况下,才输出对应的预警指示;以及对于不存在异常的通道,可以进一步根据该目标通道下的每个队列在第二预设时间段内的队列状态矩阵,综合评估该队列是否存在异常,只有在该队列存在异常的情况下,才输出对应的预警指示,对于具备自愈能力的异常场景,则不进行预警指示,能够有效避免因gtp发生瞬时连接失败、节点重启、网络抖动等具备自愈能力的异常场景触发相应的预警,进而达到提高运维智能化水平和效率的目的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1