一种IT运维风险预警方法及相关装置与流程

文档序号:16914992发布日期:2019-02-19 18:54阅读:263来源:国知局
一种IT运维风险预警方法及相关装置与流程

本申请涉及计算机技术领域,特别涉及一种it运维风险预警方法、it运维风险预警装置、服务器以及计算机可读存储介质。



背景技术:

随着信息技术的不断发展,信息技术不仅改变了生产方式还提高了生产效率,同时信息技术对企业正常业务和管理业务有着巨大的支撑作用。因此,企业中it(信息技术)的基础设施的数量不断增加,海量的运维和业务数据以这些it基础设施为硬件基础,进行保存。可以想到的是,当企业的it的基础设施出现故障时,对企业的安全生产和管理造成巨大的影响。因此,对于各种组织中的it运维情况需要进行相应的风险分析,当面对运维问题时有备无患。

但是,现有技术通常使用的it运维管控,只偏向于事件管理的被动式管控,也就是只有当故障事件发生,或故障相关事件发生后才对对应的故障进行管控,对于故障的风险无法做到很好的预识别,难于识别故障先发的征兆,进而无法采取有效的预防处理措施消除风险。

因此,如何提高it运维过程中对故障风险识别的效率以及准确率是本领域技术人员关注的重点问题。



技术实现要素:

本申请的目的是提供一种it运维风险预警方法、it运维风险预警装置、服务器以及计算机可读存储介质,通过将待分析故障与案例库中的案例进行匹配得到接近的目标案例,也就是通过案例推理的形式识别出目前故障对应的案例,并且案例是已经记录过故障原因和解决方案,也就是直接识别出是什么样的问题,进而进行预警操作,提高了风险的识别率,使得it运维可以对风险进行提前预防,提高了it运维速度和可靠性。

为解决上述技术问题,本申请提供一种it运维风险预警方法,包括:

获取待分析故障;

根据所述待分析故障的故障征兆将所述待分析故障和案例库的备选案例进行匹配,得到案例集合;

根据灰色关联算法对所述案例集合的案例与所述待分析故障进行相似度计算匹配,得到目标案例;

根据所述目标案例执行风险预警操作。

可选的,根据所述待分析故障的故障征兆将所述待分析故障和案例库的备选案例进行匹配,得到案例集合,包括:

将所述待分析故障和所述案例库中的每个备选案例分别进行征兆交集获取处理,得到多个征兆集合;

分别将每个所述征兆集合中的所有征兆权重系数进行相加,得到多个权重隶属度;

将所述权重隶属度大于预设隶属度的备选案例添加到所述案例集合中。

可选的,根据灰色关联算法对所述案例集合的案例与所述待分析故障进行相似度计算匹配,得到目标案例,包括:

根据所述灰色关联算法对所述案例集合中的每个案例的单个征兆指标与所述待分析故障进行局部相似度计算,得到多个局部相似度;

根据每个所述案例对应的局部相似度对所述案例和所述待分析故障进行复合相似度计算,得到多个复合相似度;

将所述复合相似度最大的案例作为所述目标案例。

可选的,还包括:

根据所述风险预警操作的结果判断所述风险预警操作是否执行成功;

若是,则对所述目标案例进行正反馈修正处理,得到修正案例;

将所述修正案例保存在所述案例库。

可选的,还包括:

当所述风险预警操作未执行成功时,根据执行失败信息对所述目标案例进行负反馈修正处理,得到新案例;

将所述新案例添加到所述案例库中。

可选的,其特征在于,根据所述目标案例执行风险预警操作,包括:

从所述案例库中获取所述目标案例的故障原因数据和解决方案数据;

将所述故障原因数据和所述解决方案数据以风险预警路径进行提示操作,以便完成风险预警操作。

本申请还提供一种it运维风险预警装置,包括:

故障获取模块,用于获取待分析故障;

案例集合获取模块,用于根据所述待分析故障的故障征兆将所述待分析故障和案例库的备选案例进行匹配,得到案例集合;

目标案例获取模块,用于根据灰色关联算法对所述案例集合的案例与所述待分析故障进行相似度计算匹配,得到目标案例;

风险预警模块,用于根据所述目标案例执行风险预警操作。

可选的,所述案例集合获取模块,包括:

征兆集合获取单元,用于将所述待分析故障和所述案例库中的每个备选案例分别进行征兆交集获取处理,得到多个征兆集合;

权重隶属度获取单元,用于分别将每个所述征兆集合中的所有征兆权重系数进行相加,得到多个权重隶属度;

案例集合获取单元,用于将所述权重隶属度大于预设隶属度的备选案例添加到所述案例集合中。

本申请还提供一种服务器,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上所述的it运维风险预警方法的步骤。

本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的it运维风险预警方法的步骤。

本申请所提供的一种it运维风险预警方法,包括:获取待分析故障;根据所述待分析故障的故障征兆将所述待分析故障和案例库的备选案例进行匹配,得到案例集合;根据灰色关联算法对所述案例集合的案例与所述待分析故障进行相似度计算匹配,得到目标案例;根据所述目标案例执行风险预警操作。

通过将待分析故障与案例库中的案例进行匹配得到接近的目标案例,也就是通过案例推理的形式识别出目前故障对应的案例,并且案例是已经记录过故障原因和解决方案,也就是直接识别出是什么样的问题,进而进行预警操作,提高了风险的识别率,使得it运维可以对风险进行提前预防,提高了it运维速度和可靠性。

本申请还提供一种it运维风险预警装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种it运维风险预警方法的流程图;

图2为本申请实施例所提供的it运维风险预警方法的匹配方法的流程图;

图3为本申请实施例所提供的it运维风险预警方法的相似度匹配方法的流程图;

图4为本申请实施例所提供的it运维风险预警方法的案例库更新方法的流程图;

图5为本申请实施例所提供的一种it运维风险预警装置的结构示意图。

具体实施方式

本申请的核心是提供一种it运维风险预警方法、it运维风险预警装置、服务器以及计算机可读存储介质,通过将待分析故障与案例库中的案例进行匹配得到接近的目标案例,也就是通过案例推理的形式识别出目前故障对应的案例,并且案例是已经记录过故障原因和解决方案,也就是直接识别出是什么样的问题,进而进行预警操作,提高了风险的识别率,使得it运维可以对风险进行提前预防,提高了it运维速度和可靠性。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前基本所有企业会选择使用信息化技术,对企业业务进行管理。并且随着信息技术的不断更新,通过信息化进行企业管理的深度更深,管理的角度更加全面,信息化管理的结构网也就更加复杂和巨大。因此,在该结构网中出现的故障也就更加复杂和繁多。

而现有技术中,对信息化管理中出现的故障一般是偏向于事件管理的被动式管控,也就是出现了故障事件后才进行相应的管理操作,无法对即将发生的风险进行识别,同时也无法实施相应的预防措施。也就是对风险的识别较低,进而无法采取有效的预防处理措施消除风险。

因此,本实施例提供一种it运维风险预警方法,通过将待分析故障与案例库中的案例进行匹配得到接近的目标案例,也就是通过案例推理的形式识别出目前故障对应的案例,并且案例是已经记录过故障原因和解决方案,也就是直接识别出是什么样的问题,进而进行预警操作,提高了风险的识别率,使得it运维可以对风险进行提前预防,提高了it运维速度和可靠性。

具体的,请参考图1,图1为本申请实施例所提供的一种it运维风险预警方法的流程图。

该方法可以包括:

s101,获取待分析故障;

本实施例是在it运维的过程中不断地进行故障检测,进而判断是否进行预警操作。可知,本步骤中的待分析故障可以是it系统运行中的大故障或小故障,也可以是已经发生紧急情况所对应的故障,还可以是不影响系统运行的隐形故障,因此,在本实施例中并不对故障作唯一的限定。

在本实施例中的后续步骤需要对待分析故障进行案例匹配,因此本步骤首先需要获取待分析故障。一般的在it系统运行的过程中会实时监控系统的运行状态,以判断此时系统是否运行出现故障,据此,本实施例中获取的待分析故障就是当判断系统运行出现故障时,获取到的故障数据。

s102,根据待分析故障的故障征兆将待分析故障和案例库的备选案例进行匹配,得到案例集合;

在步骤s101的基础上,本步骤旨在将待分析故障与案例库中的备选案例进行初步筛选,得到案例集合。其中,初步筛选主要是根据待分析故障的故障征兆指标数据与案例库中的备选案例的征兆指标数据进行比较判断。

需要说明的是,本实施例中的待分析故障是由一个或多个故障征兆组合而成的,例如,某次待分析故障可以由温度故障征兆、硬件资源利用率故障征兆以及机器振动故障征兆组成,也可以是由一个温度故障征兆组成。进一步的,针对不同的故障征兆还存在对应的故障征兆指标数据,也就是对应的不同的故障征兆的量化数据大小,例如,待分析故障中的温度故障征兆的指标数据可以是98摄氏度,或机器振动的故障征兆的指标数据为3级振动。

进一步的,案例库中的每个案例同样都对应的了一个或多个的故障征兆,并且每个案例中对于每个其包括的故障征兆都有对应的征兆权重系数。其中,征兆权重系数就是确定该故障征兆对于发生该案例故障的重要程度,有的故障征兆的征兆权重系数高,就表示该故障征兆对于确定是否为该案例有着决定性作用。

具体的,本步骤中对案例库的案例所进行的初步筛选主要是根据待分析故障所包含的故障征兆筛选出合适的备选案例,得到案例集合。

s103,根据灰色关联算法对案例集合的案例与待分析故障进行相似度计算匹配,得到目标案例;

在步骤s102的基础上,本步骤旨在根据灰色关联算法对案例集合中的案例与待分析故障进行相似度计算,将相似度最大的案例作为目标案例。其中,相似度在本步骤中主要是通过灰色关联算法计算得到。

一般的,对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的量度,称为关联度。在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。因此,本步骤中的灰色关联算法就是求取灰色关联度的算法。

具体的,需要根据灰色管理算法将待分析故障与案例集合中的每个案例进行相似度计算,得到待分析故障对应每个案例的相似度,选择相似度最大的案例作为目标案例,也就是将与待分析故障最相似的案例作为目标案例。

s104,根据目标案例执行风险预警操作。

在步骤s103的基础上,本步骤旨在根据目标案例所记录的原因和解决方案进行风险预警操作。也就是,将当前所发生的待分析故障与目标案例视为等同,根据目标案例的处理方法执行风险预警操作。

可选的,s104还可以包括:

步骤一、从案例库中获取目标案例的故障原因数据和解决方案数据;

步骤二、将故障原因数据和解决方案数据以风险预警路径进行提示操作,以便完成风险预警操作。

本可选方案主要是将故障原因数据和解决方案数据作为进行风险预警操作的基础数据,本实施例中的预警操作也就是将这些数据对技术人员进行提示,以便排除故障。

其中,风险预警路径是指进行风险预警提示的信息路径,例如,通过手机电话语音进行提示,通过电子邮件进行提示,或者是通过现场的语音播报进行预警提示。因此,在本可选方案中并不唯一限定进行提示操作的路径。

综上,本实施例通过将待分析故障与案例库中的案例进行匹配得到接近的目标案例,也就是通过案例推理的形式识别出目前故障对应的案例,并且案例是已经记录过故障原因和解决方案,也就是直接识别出是什么样的问题,进而进行预警操作,提高了风险的识别率,使得it运维可以对风险进行提前预防,提高了it运维速度和可靠性。

为了提高案例合集匹配的准确度,上一实施例的s102的匹配方法还可以采用如下提供的匹配方法。

具体的,请参考图2,图2为本申请实施例所提供的it运维风险预警方法的匹配方法的流程图。

该方法可以包括:

s201,将待分析故障和案例库中的每个备选案例分别进行征兆交集获取处理,得到多个征兆集合;

本步骤旨在选取待分析故障的故障征兆与每个备选案例的故障征兆之间的交集,作为征兆集合。例如,待分析故障有a、b、c、d、e五个故障征兆,第一备选案例的故障征兆为a、b、c、x、y,第二备选案例的故障征兆为c、d、e、m、n。因此,待分析故障与第一备选案例的征兆集合即为a、b、c,与第二备选案例的征兆集合即为c、d、e。

本步骤通过将待分析故障与每个备选案例进行如上处理,即可得到多个征兆集合。

s202,分别将每个征兆集合中的所有征兆权重系数进行相加,得到多个权重隶属度;

在步骤s201的基础上,本步骤旨在将每个征兆集合中的每个故障征兆的征兆权重系数相加,得到每个征兆集合对应的权重隶属度。

也就是,上一步骤的例子中的a、b、c每个故障征兆对应的征兆权重系数进行相加得到对应的权重隶属度。其中,每个故障征兆的征兆权重系数记录在对应的备选案例中。每个备选案例中对于不同的故障征兆应有不同的征兆权重系数,因此通过本步骤的权重隶属度,就可以将有较多故障征兆匹配,但匹配的故障征兆并不重要的备选案例进行排除,提高备选案例匹配的准确度。

s203,将权重隶属度大于预设隶属度的备选案例添加到案例集合中。

在步骤s202的基础上,本步骤旨在将权重隶属度大于预设隶属度的备选案例添加到案例集合,将所有的符合要求的备选案例的添加到案例集合后,就得到了需要的案例集合。

本实施例通过权重隶属度对备选案例进行匹配,可以将不太可能发生了此案例的故障进行排除,保证了将系统中所有可能发生的故障纳入到案例集合中,提高了备选案例匹配的准确度。

基于以上所有实施例,为了提高选取目标案例的准确度,图1所示实施例的s104的相似度匹配方法还可以采用如下提供的匹配方法。

具体的,请参考图3,图3为本申请实施例所提供的it运维风险预警方法的相似度匹配方法的流程图。

该方法可以包括:

s301,根据灰色关联算法对案例集合中的每个案例的单个征兆指标与待分析故障进行局部相似度计算,得到多个局部相似度;

s302,根据每个案例对应的局部相似度对案例和待分析故障进行复合相似度计算,得到多个复合相似度;

s303,将复合相似度最大的案例作为目标案例。

具体的,本实施例中的s301可以采用一种改进后的局部灰色关联算法,如下:在风险识别时,它们彼此之间的关系是灰色的,灰色关联分析正是为了适应灰色系统相关性分析的客观需要,通过对灰色系统动态过程发展态势的量化比较分析,把系统有关因素之间的各种关系梳理清楚,利用各特征指标的灰色关联度来表示指标的局部相似度,再将各局部相似度加权平均得到总体相似度。然后,结合各个指标的重要程度不一样,在计算局部相似度时将权重纳入到比较环境的计算中,进一步得到改进的局部灰色关联算法。

其中,复合相似度的计算方法具体如下:待分析故障和候选案例的故障征兆集合包含多个征兆指标,通过公式计算出单个征兆的相似度。由于单个相似度的信息过于分散,不便于比较,因此要将各个指标的关联系数集中起来,以一个综合值的形式来反映两个征兆向量的总体相似度,从而形成基于灰色关联理论的相似度计算模型,实现计算待分析故障与各案例之间的灰色相似度,并推荐相似度最大的故障案例作为目标案例。

因此通过本实施例中的局部相似度计算和复合相似度计算,可以得到多个案例相对于待分析故障之间的复合相似度,然后将复合相似度最大的案例作为目标案例,就可以得到更加复合待分析故障的目标案例,提高故障预警的准确度。

基于以上所有实施例,本实施例还提供一种对案例库进行更新的方法。

具体的,请参考图4,图4为本申请实施例所提供的it运维风险预警方法的案例库更新方法的流程图。

该方法可以包括:

s401,根据风险预警操作的结果判断风险预警操作是否执行成功;若是,则执行s402;若否,则执行s403;

s402,对目标案例进行正反馈修正处理,得到修正案例;将修正案例保存在案例库;

s403,根据执行失败信息对目标案例进行负反馈修正处理,得到新案例;将新案例添加到案例库中。

本实施例主要是根据风险预警操作的执行结果进行判断,根据判断结果将本次的风险预警操作作为案例添加到案例库中。

其中,如果风险预警操作执行成功,也就是说明目标案例待分析故障基本相符,可以根据本次处理中所遇到的新数据对目标案例进行正反馈修正处理,例如,如果有新数据那么就将新数据作为案例的数据添加进去,得到修正案例,并将修正案例保存在案例库中。

具体的,如果案例库的存储空间有限,那么可以将修正案例覆盖原有的目标案例进行保存,如果案例库的存储空间较为宽裕,那么可以将修正案例作为新案例进行保存,并且修正案例与目标案例进行保存时可以公用相同数据,例如,目标案例和修正案例的故障征兆与其指标数据不相同,可以分开存储,但是故障原因与解决方案相同,可以公用,因此可以将这两者的数据公用,在案例库中只用保存一份,以最大化存储空间利用率。

另一方面,如果风险预警操作没有执行成功,那么就在目标案例的基础上进行负反馈修正处理,也就是此时目标案例与待分析故障差距较大,需要根据执行失败信息对目标案例进行较大的修改,以得到符合待分析故障对应的新案例,将得到的新案例直接保存在案例库中。

因此,通过本实施例可以不断的对案例库添加新的案例,以便更新案例库的数据,增加案例库中案例的数量,增加通过案例进行风险预警的准确率,以及可靠性。

下面对本申请实施例提供的一种it运维风险预警装置进行介绍,下文描述的一种it运维风险预警装置与上文描述的一种it运维风险预警方法可相互对应参照。

具体的,请参考图5,图5为本申请实施例所提供的一种it运维风险预警装置的结构示意图。

该装置可以包括:

故障获取模块100,用于获取待分析故障;

案例集合获取模块200,用于根据待分析故障的故障征兆将待分析故障和案例库的备选案例进行匹配,得到案例集合;

目标案例获取模块300,用于根据灰色关联算法对案例集合的案例与待分析故障进行相似度计算匹配,得到目标案例;

风险预警模块400,用于根据目标案例执行风险预警操作。

可选的,该案例集合获取模块200,可以包括:

征兆集合获取单元,用于将待分析故障和案例库中的每个备选案例分别进行征兆交集获取处理,得到多个征兆集合;

权重隶属度获取单元,用于分别将每个征兆集合中的所有征兆权重系数进行相加,得到多个权重隶属度;

案例集合获取单元,用于将权重隶属度大于预设隶属度的备选案例添加到案例集合中。

本申请实施例还提供一种服务器,包括:

存储器,用于存储计算机程序;

处理器,用于执行计算机程序时实现如以上实施例的it运维风险预警方法的步骤。

本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如以上实施例的it运维风险预警方法的步骤。

该计算机可读存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种it运维风险预警方法、it运维风险预警装置、服务器以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1