系统故障恢复预案的优化方法、装置及计算机存储介质与流程

文档序号:22626844发布日期:2020-10-23 19:35阅读:来源:国知局

技术特征:

1.一种系统故障恢复预案的优化方法,其特征在于,所述方法包括:

基于业务系统的模拟故障信息,触发所述业务系统的多个故障定位模型在各自对应的故障检测点组中并行执行故障点定位操作,以定位出目标故障点;

获取与所述目标故障点预先关联的多个恢复预案,按照多个所述恢复预案当前的优先级顺序执行各所述恢复预案,得到各所述恢复预案当前的执行结果;

根据各所述恢复预案当前的执行结果,对应更新各所述恢复预案的执行记录,所述执行记录至少记录有被执行次数以及被执行后的故障恢复次数;

根据各所述恢复预案更新后的执行记录,对多个所述恢复预案当前的优先级顺序进行优化。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

根据所述业务系统的多个维度,预先构建多个所述故障定位模型;

其中,多个所述维度包括应用容器运行状态、中间件运行状态、数据库运行状态、信息系统前台基础资料维护状态、网络服务状态、服务器硬件状态、存储硬件状态、平台服务运行状态和安全态势中的至少两个。

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

确定定位出所述目标故障点的故障定位模型以及所述目标故障点所属的故障检测点组;

判断所述目标故障点所属的故障检测点组中是否包含所述模拟故障信息对应的模拟故障点,若包含,则确定定位出所述目标故障点的故障定位模型有效,否则,则确定定位出所述目标故障点的故障定位模型无效。

4.根据权利要求1至3任一所述的方法,其特征在于,所述根据各所述恢复预案更新后的执行记录,对多个所述恢复预案当前的优先级顺序进行优化,包括:

根据各所述恢复预案更新后的执行记录,确定每个所述恢复预案当前的被执行次数以及被执行后的故障恢复次数;

根据每个所述恢复预案当前的被执行次数以及被执行后的故障恢复次数,计算每个所述恢复预案当前的执行成功率;

基于每个所述恢复预案当前的执行成功率从大到小的顺序,对多个所述恢复预案当前的优先级顺序进行优化。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

针对与所述目标故障点预先关联的任意一个所述恢复预案,判断所述恢复预案当前的执行成功率是否低于预设值;

若低于,则解除所述恢复预案与所述目标故障点的关联关系。

6.根据权利要求1至3任一所述的方法,其特征在于,所述恢复预案的执行结果还包括被执行后的执行时长,所述恢复预案的执行记录还包括所述恢复预案被执行后的平均执行时长,所述方法还包括:

针对与所述目标故障点预先关联的任意一个所述恢复预案,根据所述恢复预案更新后的执行记录,判断所述恢复预案被执行后的平均执行时长是否超过预设时长;

若超过,则解除所述恢复预案与所述目标故障点的关联关系。

7.一种系统故障恢复预案的优化装置,其特征在于,所述装置包括:

故障定位模块,用于基于业务系统的模拟故障信息,触发所述业务系统的多个故障定位模型在各自对应的故障检测点组中并行执行故障点定位操作,以定位出目标故障点;

预案执行模块,用于获取与所述目标故障点预先关联的多个恢复预案,按照多个所述恢复预案当前的优先级顺序执行各所述恢复预案,得到各所述恢复预案当前的执行结果;

记录更新模块,用于根据各所述恢复预案当前的执行结果,对应更新各所述恢复预案的执行记录,所述执行记录至少记录有被执行次数以及被执行后的故障恢复次数;

预案优化模块,用于根据各所述恢复预案更新后的执行记录,对多个所述恢复预案当前的优先级顺序进行优化。

8.根据权利要求7所述的装置,其特征在于,所述装置还包括模型验证模块,所述模型验证模块具体用于:

确定定位出所述目标故障点的故障定位模型以及所述目标故障点所属的故障检测点组;

判断所述目标故障点所属的故障检测点组中是否包含所述模拟故障信息对应的模拟故障点,若包含,则确定定位出所述目标故障点的故障定位模型有效,否则,则确定定位出所述目标故障点的故障定位模型无效。

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的系统故障恢复预案的优化方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的系统故障恢复预案的优化方法的步骤。


技术总结
本发明公开一种系统故障恢复预案的优化方法、装置及计算机存储介质,属于计算机技术领域。方法包括:基于业务系统的模拟故障信息,触发业务系统的多个故障定位模型在各自对应的故障检测点组中并行执行故障点定位操作,以定位出目标故障点;获取与目标故障点预先关联的多个恢复预案,按照多个恢复预案当前的优先级顺序执行各恢复预案,得到各个恢复预案当前的执行结果;根据各个恢复预案当前的执行结果,对应更新各个恢复预案的执行记录,执行记录至少记录有被执行次数以及被执行后的故障恢复次数;根据各个恢复预案更新后的执行记录,对多个恢复预案当前的优先级顺序进行优化。本发明能够避免业务系统实际发生故障时导致故障无法快速恢复的问题。

技术研发人员:易玉凤;何俊敏;杨微;孟波;马兴
受保护的技术使用者:上海燕汐软件信息科技有限公司
技术研发日:2020.07.08
技术公布日:2020.10.23
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1