故障处理方法、装置、计算机设备及存储介质与流程

文档序号:29414452发布日期:2022-03-26 12:41阅读:95来源:国知局
故障处理方法、装置、计算机设备及存储介质与流程

1.本技术涉及云监控技术领域,具体而言,本技术涉及一种故障处理方法、装置、计算机设备及存储介质。


背景技术:

2.随着技术不断发展,应用系统的业务需求在逐步增多,需求实现时效也越来越高,导致生产环境频繁发布新的版本,以进行版本变更,而频繁的版本变更则会增大系统故障的概率。
3.对于已发生的系统故障,现有一般通过在系统每次发生故障时,就遍历当前系统的所有变更信息,以判断是否有变更,处理故障。但当一个系统比较大,涉及模块比较多时,则难以在短时间内确定导致故障的变更信息,以及时处理故障,导致系统故障的修复效率较慢,影响用户体验。


技术实现要素:

4.本技术的主要目的为提供一种故障处理方法、装置、计算机设备及存储介质,以在系统出现故障时,快速找到变更信息并对其进行处理,提高系统故障的修复效率。
5.为了实现上述发明目的,本技术提供一种故障处理方法,其包括:
6.构建变更记录表,每隔预设时间获取当前系统的变更信息,对所述变更信息进行预处理,得到第一变更信息;
7.确定所述第一变更信息的变更类型,按照所述变更类型将所述第一变更信息记录在所述变更记录表中,并标记所述第一变更信息记录在所述变更记录表中的时间戳;
8.当检测到系统发生故障时,遍历所述变更记录表的第一变更信息的时间戳,从所述变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息;
9.提取所述故障的故障类型,计算所述故障类型与所述目标变更信息的变更类型的关联度;
10.当确定所述关联度大于预设关联度时,则判定所述故障有对应的目标变更信息,基于所述目标变更信息对所述故障进行处理。
11.优选地,所述每隔预设时间获取当前系统的变更信息,包括:
12.每隔预设时间检测当前系统的需求变更;
13.在检测到需求变更时,获取变更版本信息;
14.将所述变更版本信息与所述系统中的初始版本信息进行比对,获得差异版本信息,将所述差异版本信息确定为变更信息。
15.优选地,所述基于所述目标变更信息对所述故障进行处理,包括:
16.接收系统发生故障时生成的告警提示,确定所述告警提示对应的告警位置;
17.当所述告警位置为所述目标变更信息对应的改动点时,对所述目标变更信息对应的改动点进行调整,以处理故障。
18.优选地,所述系统包括一个主服务器及多个从服务器,所述检测到系统发生故障,包括:
19.定时扫描所述主服务器及多个从服务器;
20.当监测到所述主服务器或任一个从服务器处于警告状态或故障状态时,则确定所述系统发生故障。
21.优选地,所述定时扫描所述主服务器,包括:
22.为所述主服务器设置定时器,使所述主服务器定期提取运行时的性能参数;其中,所述性能参数包括cpu总利用率、内存利用率和网络带宽占用率;
23.接收所述主服务器发送的性能参数;
24.根据所述性能参数判断所述主服务器是否存在故障;
25.若是,则监测到所述主服务器处于警告状态或故障状态。
26.优选地,所述计算所述故障类型与所述目标变更信息的变更类型的关联度,包括:
27.提取表征所述故障类型的关键词,得到第一关键词;
28.提取表征所述目标变更信息的变更类型的关键词,得到第二关键词;
29.利用预设的词向量工具分别将所述第一关键词及第二关键词转换为向量,得到所述第一关键词对应的第一词向量、所述第二关键词对应的第二词向量;
30.计算所述第一词向量与第二词向量的余弦距离,得到所述故障类型与所述目标变更信息的变更类型的关联度。
31.进一步地,所述计算所述故障类型与所述目标变更信息的变更类型的关联度之后,还包括:
32.当确定所述关联度不大于预设关联度时,则查询与当前系统相关的其他系统的变更信息;
33.基于其他系统的变更信息对所述故障进行处理。
34.本技术还提供一种故障处理装置,其包括:
35.构建模块,用于构建变更记录表,每隔预设时间获取当前系统的变更信息,对所述变更信息进行预处理,得到第一变更信息;
36.确定模块,用于确定所述第一变更信息的变更类型,按照所述变更类型将所述第一变更信息记录在所述变更记录表中,并标记所述第一变更信息记录在所述变更记录表中的时间戳;
37.检测模块,用于当检测到系统发生故障时,遍历所述变更记录表的第一变更信息的时间戳,从所述变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息;
38.计算模块,用于提取所述故障的故障类型,计算所述故障类型与所述目标变更信息的变更类型的关联度;
39.处理模块,用于当确定所述关联度大于预设关联度时,则判定所述故障有对应的目标变更信息,基于所述目标变更信息对所述故障进行处理。
40.本技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
41.本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算
机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
42.本技术所提供的一种故障处理方法、装置、计算机设备及存储介质,通过构建变更记录表,每隔预设时间获取当前系统的变更信息,对变更信息进行预处理,得到第一变更信息,确定第一变更信息的变更类型,按照变更类型将第一变更信息记录在变更记录表中,并标记第一变更信息记录在变更记录表中的时间戳,当检测到系统发生故障时,遍历变更记录表的第一变更信息的时间戳,从变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息,提取故障的故障类型,计算故障类型与目标变更信息的变更类型的关联度,当确定关联度大于预设关联度时,则判定故障有对应的目标变更信息,基于目标变更信息对故障进行处理,从而通过定期收集以系统为主线的变更信息,以供故障发生时能快速获取到最近的相关变更信息,用于确定恢复方案,提高系统故障的修复效率,提升用户体验。
附图说明
43.图1为本技术一实施例的故障处理方法的流程示意图;
44.图2为本技术一实施例的故障处理装置的结构示意框图;
45.图3为本技术一实施例的计算机设备的结构示意框图。
46.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
47.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
48.本技术提出的一种故障处理方法,以系统为执行主体,该系统包括多个服务器,该服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
49.该故障处理方法用于解决现有一般在系统每次发生故障时,通过遍历当前系统的所有变更信息,以判断是否有变更,处理故障,但当一个系统比较大,涉及模块比较多时,则难以在短时间内确定导致故障的变更信息,以及时处理故障,导致系统故障的修复效率较慢的技术问题。参考图1,其中一个实施例中,该故障处理方法包括:
50.s11、构建变更记录表,每隔预设时间获取当前系统的变更信息,对所述变更信息进行预处理,得到第一变更信息;
51.s12、确定所述第一变更信息的变更类型,按照所述变更类型将所述第一变更信息记录在所述变更记录表中,并标记所述第一变更信息记录在所述变更记录表中的时间戳;
52.s13、当检测到系统发生故障时,遍历所述变更记录表的第一变更信息的时间戳,从所述变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息;
53.s14、提取所述故障的故障类型,计算所述故障类型与所述目标变更信息的变更类型的关联度;
54.s15、当确定所述关联度大于预设关联度时,则判定所述故障有对应的目标变更信
息,基于所述目标变更信息对所述故障进行处理。
55.如上述步骤s11所述,本实施例可构建变更记录表,该变更记录表用于记录系统的变更情况,系统可包括多个服务器,然后每隔预设时间收集以系统为主线的变更信息,对变更信息进行预处理,预处理过程可包括对变更信息进行格式转换、删除无意义字符、以及分类处理等等,最终得到第一变更信息。其中,变更信息可包括:请求的变更信息、应用程序版本的变更信息、系统发生变更的参数、运营发起的生产变更等。请求中涉及中间件、网络、主机、数据库及安全等变更,是生产变更的主要来源,变更名称中会注明是哪一个服务器相关的变更;运营发起的生产变更主要是运营提的部署请求和应用配置,数据库的数据修改,数据库的批处理的相关变更,此类会有系统和部署单元信息;另外就是开发提的功能开关,会影响批量的业务功能,会有系统相关标示;版本信息来源于系统的应用程序的版本更新。
56.具体的,本实施例可连通每个服务器的请求接口,自动从每个服务器的请求接口获取变更信息,无需人工查找、搜索。此外,若有提供对外数据接口,就调用对外数据接口获取变更信息,此时需要设置数据库连接数和读取频率2次/天,避免对系统造成压力。
57.如上述步骤s12所述,本实施例确定第一变更信息的变更类型,按照变更类型将第一变更信息记录在变更记录表中,并标记第一变更信息记录在所述变更记录表中的时间戳,如标记为2021年11月23日。其中,变更类型包括应用程序的变更、存储数据的变更等等。
58.如上述步骤s13-s15所述,当检测到系统发生故障时,则获取系统的当前时间,并遍历变更记录表的每个第一变更信息的时间戳,根据该时间戳,从变更记录表中找到距离当前时间最近的第一变更信息,则将距离当前时间最近的第一变更信息作为目标变更信息。
59.例如,当检测到系统发生故障时,变更记录表中记录了第一变更信息a、b、c三个,分别对应的时间戳为2021年10月23日、2021年10月29日、2021年11月20日,而系统的当前时间为2021年11月23日,则距离当前时间最近的时间戳为2021年11月20日,则将2021年11月20日对应的第一变更信息c作为目标变更信息。
60.此外,本实施例提取故障的故障类型,故障类型可包括系统的cpu使用率大于预设使用率、显示界面出错等等,然后计算故障类型与目标变更信息的变更类型的关联度,该关联度用于表征故障类型与目标变更信息的相关性,并判断关联度是否大于预设关联度,当确定关联度大于预设关联度时,则判定故障有对应的目标变更信息,基于目标变更信息对所述故障进行处理,从而快速找到影响当前系统故障的目标变更信息,并基于目标变更信息对故障进行处理,如对目标变更信息进行调整,以解决故障,以在系统发生故障时,优先查看此系统最近一次的相关变更,提高故障的排除效率。
61.本技术所提供的一种故障处理方法,通过构建变更记录表,每隔预设时间获取当前系统的变更信息,对变更信息进行预处理,得到第一变更信息,确定第一变更信息的变更类型,按照变更类型将第一变更信息记录在变更记录表中,并标记第一变更信息记录在变更记录表中的时间戳,当检测到系统发生故障时,遍历变更记录表的第一变更信息的时间戳,从变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息,提取故障的故障类型,计算故障类型与目标变更信息的变更类型的关联度,当确定关联度大于预设关联度时,则判定故障有对应的目标变更信息,基于目标变更信息对故障进行处理,从而通过定期收集以系统为主线的变更信息,以供故障发生时能快速获取到最近的相关变更信
息,用于确定恢复方案,提高系统故障的修复效率,提升用户体验。
62.在一实施例中,所述每隔预设时间获取当前系统的变更信息,可具体包括:
63.每隔预设时间检测当前系统的需求变更;
64.在检测到需求变更时,获取变更版本信息;
65.将所述变更版本信息与所述系统中的初始版本信息进行比对,获得差异版本信息,将所述差异版本信息确定为变更信息。
66.在本实施例中,可每隔预设时间检测当前系统的需求变更,如每隔两天检测系统是否有应用程序版本的变更、是否增加了新的功能等等;在检测到需求变更时,则获取需求的变更版本信息,变更版本信息一般为最新的版本信息,变更版本信息中包括需求的变更类型、变更代码等等,同时获取系统中的初始版本信息,将变更版本信息与系统中的初始版本信息进行比对,得到比对结果,比对结果中包含变更版本信息与系统中的初始版本信息的差异信息,即差异版本信息,将差异版本信息确定为变更信息,以实时记录当前系统的变更情况。
67.在一实施例中,所述基于所述目标变更信息对所述故障进行处理,可具体包括:
68.接收系统发生故障时生成的告警提示,确定所述告警提示对应的告警位置;
69.当所述告警位置为所述目标变更信息对应的改动点时,对所述目标变更信息对应的改动点进行调整,以处理故障。
70.在本实施例中,在接收到系统发生故障时生成的告警提示时,确定告警提示对应的告警位置,如发生故障所在的服务器,当告警位置为差异版本信息对应的改动点时,对差异版本信息进行调整,以精确地找到系统故障出现的改动点,实现快速对故障进行处理,无需回退原版本。其中,告警提示中包括告警等级、告警类型,该告警等级用于表征故障的严重性。
71.例如,在确定告警提示对应的告警位置为某个数据库无法存储数据时,差异版本信息对应的改动点为数据库中存储功能的相关代码,则对数据库中存储功能的相关代码进行调整,以确保数据的正常存储。
72.在一实施例中,服务器可获取改动点的风险类型,根据改动点的风险类型划分改动点的风险等级,在改动点的风险等级为预设级别时,根据预设范围影响因子或预设概率影响因子调整预设的初始风险值,得到改动点的总风险评分,生成包含总风险评分的改动点明细报告,以使服务器或开发人员基于该改动点明细报告对目标变更信息对应的改动点进行调整,解决故障。
73.其中,改动点的风险类型可包括流程风险、接口风险、网络风险、数据库风险等等,对应的改动点为目标变更信息中与流程、接口、网络或数据库相关代码的改动,服务器中预存有风险类型与风险等级的映射表,可根据映射表查询风险类型对应的风险等级。服务器在确定风险等级之后,根据风险等级调整初始风险值,即在改动点的风险等级为预设级别,如一级时,该改动点出现风险的概率不会随时间变化,且该改动点的影响面较大,根据预设范围影响因子或预设概率影响因子调整所述初始风险值,得到改动点的总风险评分,如将预设范围影响因子或预设概率影响因子乘以所述初始风险值之后,得到改动点的总风险评分。其中,预设范围影响因子可以根据访问数量等灵活设置,预设概率影响因子可以根据业务情况等灵活设置。
74.例如,风险类型为接口类型风险,接口类型风险对应的风险等级为一级,在风险等级为一级总风险评分超过预设风险总值,对应的调整预案为版本回滚,则服务器对目标变更信息对应的改动点进行删除,回到原始版本;又如,风险类型为网络类型风险,网络类型风险对应的风险等级为二级,在风险等级为二级总风险评分超过预设风险总值,对应的处理预案为限流。
75.在一实施例中,所述系统包括一个主服务器及多个从服务器,所述检测到系统发生故障,可具体包括:
76.定时扫描所述主服务器及多个从服务器;
77.当监测到所述主服务器或任一个从服务器处于警告状态或故障状态时,则确定所述系统发生故障。
78.本实施例可在线程内定时扫描主服务器及多个从服务器,获取主服务器及多个从服务器的状态信息,在主服务器或从服务器运行正常的情况下,该状态信息显示为正常状态,当接收到主服务器或任一个从服务器发送的状态信息为警告状态时,则确定系统发生故障,以实时监测系统的状态,及时告警。
79.在一实施例中,所述定时扫描所述主服务器,可具体包括:
80.为所述主服务器设置定时器,使所述主服务器定期提取运行时的性能参数;其中,所述性能参数包括cpu总利用率、内存利用率和网络带宽占用率;
81.接收所述主服务器发送的性能参数;
82.根据所述性能参数判断所述主服务器是否存在故障;
83.若是,则监测到所述主服务器处于警告状态或故障状态。
84.在本实施例中,系统可为主服务器设置一个定时器,在到达定时器的定时时间时,主服务器定期提取运行时的性能参数;该性能参数包括主服务器的cpu总利用率、内存利用率和网络带宽占用率等等,然后接收主服务器发送的性能参数,将主服务器的性能参数与标准性能参数进行一一比对,得到比对结果,根据比对结果性能参数判断主服务器是否存在故障,例如,当主服务器的内存利用率大于最高内存利用率时,则确定该主服务器存在故障;或当主服务器的温度大于最高允许的温度时,则确定该主服务器存在故障。从服务器的故障监测方式同理,在此不再赘述,当多个从服务器中,监测到至少一个从服务器处于警告状态或故障状态,则检测到系统发生故障。
85.在一实施例中,所述计算所述故障类型与所述目标变更信息的变更类型的关联度,可具体包括:
86.提取表征所述故障类型的关键词,得到第一关键词;
87.提取表征所述目标变更信息的变更类型的关键词,得到第二关键词;
88.利用预设的词向量工具分别将所述第一关键词及第二关键词转换为向量,得到所述第一关键词对应的第一词向量、所述第二关键词对应的第二词向量;
89.计算所述第一词向量与第二词向量的余弦距离,得到所述故障类型与所述目标变更信息的变更类型的关联度。
90.其中,第一关键词为描述故障类型的词,一般为名词,第二关键词为描述目标变更信息的变更类型的词,一般也为名词。当故障类型及变更类型都为文本形式时,本实施例可直接从故障类型中提取出关键词,得到第一关键词;可直接从目标变更信息的变更类型中
提取出关键词,得到第二关键词。
91.其中,所述词向量工具包括distributed representation和word2vec。distributed representation是通过训练将每个词映射成k维实数向量(k一般为模型中的超参数),通过词之间的距离(比如余弦相似度、欧氏距离等)来判断它们之间的语义相似度。word2vec是将词表征为实数值向量的高效工具,利用深度学习思想,通过训练,把对文本内容的处理简化为k维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。
92.本实施例可利用词向量工具word2vec将第一关键词转换为词向量,得到第一词向量,同时利用词向量工具word2vec将第二关键词转换为词向量,得到第二词向量,然后分别计算第一词向量与第二词向量的余弦距离,将其作为所述故障类型与所述目标变更信息的变更类型的关联度。
93.其中,词向量是为了让计算机能够处理的一种词的表示。自然语言处理相关任务中,要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,以使机器能够识别处理。向量是人把自然界的东西抽象出来交给机器处理的东西,基本上可以说向量是人对机器输入的主要方式。
94.word2vec输出的词向量可以被用来做很多自然语言处理相关的工作,比如聚类、找同义词、词性分析等等。如果把词当做特征,则word2vec就可以把特征映射到k维向量空间,可以为文本数据寻求更加深层次的特征表示。具体的,word2vec将一个词所在的上下文中的词作为输入,而那个词本身作为输出,也就是说,看到一个上下文,希望大概能猜出这个词和它的意思。通过在一个大的语料库训练,得到一个从输入层到隐含层的权重模型,训练完成后,就得到了每个词到隐含层的每个维度的权重,就是每个词的向量。
95.在一实施例中,当表征所述故障类型的第一关键词为多个时,则利用词向量工具word2vec将每个第一关键词分别转换为词向量,得到多个目标词向量,计算多个目标词向量的平均值,将该平均值作为第一词向量。
96.同理,当表征目标变更信息的变更类型的第二关键词也为多个时,则利用词向量工具word2vec将每个第二关键词分别转换为词向量,得到多个参考词向量,计算多个参考词向量的平均值,将该平均值作为第二词向量。
97.在一实施例中,所述计算所述故障类型与所述目标变更信息的变更类型的关联度之后,还可包括:
98.当确定所述关联度不大于预设关联度时,则查询与当前系统相关的其他系统的变更信息;
99.基于其他系统的变更信息对所述故障进行处理。
100.在本实施例中,当确定故障类型与目标变更信息的变更类型的关联度不大于预设关联度时,则查询与当前系统相关的其他系统的变更信息,获取其他系统的变更信息对应的解决措施,利用该解决措施对所述故障进行处理,以及时处理故障。
101.参照图2,本技术实施例中还提供一种故障处理装置,包括:
102.构建模块11,用于构建变更记录表,每隔预设时间获取当前系统的变更信息,对所述变更信息进行预处理,得到第一变更信息;
103.确定模块12,用于确定所述第一变更信息的变更类型,按照所述变更类型将所述
第一变更信息记录在所述变更记录表中,并标记所述第一变更信息记录在所述变更记录表中的时间戳;
104.检测模块13,用于当检测到系统发生故障时,遍历所述变更记录表的第一变更信息的时间戳,从所述变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息;
105.计算模块14,用于提取所述故障的故障类型,计算所述故障类型与所述目标变更信息的变更类型的关联度;
106.处理模块15,用于当确定所述关联度大于预设关联度时,则判定所述故障有对应的目标变更信息,基于所述目标变更信息对所述故障进行处理。
107.本实施例可构建变更记录表,该变更记录表用于记录系统的变更情况,系统可包括多个服务器,然后每隔预设时间收集以系统为主线的变更信息,对变更信息进行预处理,预处理过程可包括对变更信息进行格式转换、删除无意义字符、以及分类处理等等,最终得到第一变更信息。其中,变更信息可包括:请求的变更信息、应用程序版本的变更信息、系统发生变更的参数、运营发起的生产变更等。请求中涉及中间件、网络、主机、数据库及安全等变更,是生产变更的主要来源,变更名称中会注明是哪一个服务器相关的变更;运营发起的生产变更主要是运营提的部署请求和应用配置,数据库的数据修改,数据库的批处理的相关变更,此类会有系统和部署单元信息;另外就是开发提的功能开关,会影响批量的业务功能,会有系统相关标示;版本信息来源于系统的应用程序的版本更新。
108.具体的,本实施例可连通每个服务器的请求接口,自动从每个服务器的请求接口获取变更信息,无需人工查找、搜索。此外,若有提供对外数据接口,就调用对外数据接口获取变更信息,此时需要设置数据库连接数和读取频率2次/天,避免对系统造成压力。
109.本实施例确定第一变更信息的变更类型,按照变更类型将第一变更信息记录在变更记录表中,并标记第一变更信息记录在所述变更记录表中的时间戳,如标记为2021年11月23日。其中,变更类型包括应用程序的变更、存储数据的变更等等。
110.此外,当检测到系统发生故障时,则获取系统的当前时间,并遍历变更记录表的每个第一变更信息的时间戳,根据该时间戳,从变更记录表中找到距离当前时间最近的第一变更信息,则将距离当前时间最近的第一变更信息作为目标变更信息。
111.例如,当检测到系统发生故障时,变更记录表中记录了第一变更信息a、b、c三个,分别对应的时间戳为2021年10月23日、2021年10月29日、2021年11月20日,而系统的当前时间为2021年11月23日,则距离当前时间最近的时间戳为2021年11月20日,则将2021年11月20日对应的第一变更信息c作为目标变更信息。
112.此外,本实施例提取故障的故障类型,故障类型可包括系统的cpu使用率大于预设使用率、显示界面出错等等,然后计算故障类型与目标变更信息的变更类型的关联度,该关联度用于表征故障类型与目标变更信息的相关性,并判断关联度是否大于预设关联度,当确定关联度大于预设关联度时,则判定故障有对应的目标变更信息,基于目标变更信息对所述故障进行处理,从而快速找到影响当前系统故障的目标变更信息,并基于目标变更信息对故障进行处理,如对目标变更信息进行调整,以解决故障,以在系统发生故障时,优先查看此系统最近一次的相关变更,提高故障的排除效率。
113.如上所述,可以理解地,本技术中提出的所述故障处理装置的各组成部分可以实
现如上所述故障处理方法任一项的功能,具体结构不再赘述。
114.参照图3,本技术实施例中还提供一种计算机设备,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储所述故障处理方法的相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种故障处理方法。
115.上述处理器执行上述的故障处理方法,包括:
116.构建变更记录表,每隔预设时间获取当前系统的变更信息,对所述变更信息进行预处理,得到第一变更信息;
117.确定所述第一变更信息的变更类型,按照所述变更类型将所述第一变更信息记录在所述变更记录表中,并标记所述第一变更信息记录在所述变更记录表中的时间戳;
118.当检测到系统发生故障时,遍历所述变更记录表的第一变更信息的时间戳,从所述变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息;
119.提取所述故障的故障类型,计算所述故障类型与所述目标变更信息的变更类型的关联度;
120.当确定所述关联度大于预设关联度时,则判定所述故障有对应的目标变更信息,基于所述目标变更信息对所述故障进行处理。
121.本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种故障处理方法,包括步骤:
122.构建变更记录表,每隔预设时间获取当前系统的变更信息,对所述变更信息进行预处理,得到第一变更信息;
123.确定所述第一变更信息的变更类型,按照所述变更类型将所述第一变更信息记录在所述变更记录表中,并标记所述第一变更信息记录在所述变更记录表中的时间戳;
124.当检测到系统发生故障时,遍历所述变更记录表的第一变更信息的时间戳,从所述变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息;
125.提取所述故障的故障类型,计算所述故障类型与所述目标变更信息的变更类型的关联度;
126.当确定所述关联度大于预设关联度时,则判定所述故障有对应的目标变更信息,基于所述目标变更信息对所述故障进行处理。
127.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram
(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
128.综上所述,本技术的最大有益效果在于:
129.本技术所提供的一种故障处理方法、装置、计算机设备及存储介质,通过构建变更记录表,每隔预设时间获取当前系统的变更信息,对变更信息进行预处理,得到第一变更信息,确定第一变更信息的变更类型,按照变更类型将第一变更信息记录在变更记录表中,并标记第一变更信息记录在变更记录表中的时间戳,当检测到系统发生故障时,遍历变更记录表的第一变更信息的时间戳,从变更记录表中提取距离当前时间最近的第一变更信息,得到目标变更信息,提取故障的故障类型,计算故障类型与目标变更信息的变更类型的关联度,当确定关联度大于预设关联度时,则判定故障有对应的目标变更信息,基于目标变更信息对故障进行处理,从而通过定期收集以系统为主线的变更信息,以供故障发生时能快速获取到最近的相关变更信息,用于确定恢复方案,提高系统故障的修复效率,提升用户体验。
130.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
131.以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1