对事件根本原因的分析予以支援的管理系统以及方法_6

文档序号:8926989阅读:来源:国知局
上升率相等的情况下,诊断执行程序224参照结论对象1504c。在这种情况下,可以突出显示成为参照结论对象1504c的主要原因的“服务器B的ethO(标识符为SVIF2)的发送包数的性能信息”和作为比较对象的“网络开关D的端口 O (标识符为SWP0RT1)的发送丢包数的性能信息”。在执行诊断执行程序224时,可以通过将在步骤S2010中获取的信息和步骤S2012的判断结果保存在管理计算机201的存储器212等的存储区域内,来显示这些信息。
[0205]另外,可以在对事件分析程序222导出的一个候选原因执行了多个展开诊断过程的情况下,针对每个展开诊断过程,显示诊断结果的画面。
[0206]另外,诊断执行程序224将在步骤S2009中收集的信息保存在管理计算机201的存储器212等的存储区域内,并保存规定期间,在执行其他诊断时针对同一管理对象组件执行收集同一信息的步骤时,可以使用已经保存在存储器212等的存储区域内的信息。还可以在输出设备217上显示收集到的信息时,显示收集时的时刻。
[0207]另外,诊断执行程序224将在步骤S2012中接收的判断结果保存在管理计算机201的存储器212等的存储区域内,并保存规定时间,在执行其他诊断时基于同一管理对象组件的同一信息进行判断时,可以不执行判断程序而直接使用所保存的判断结果。可以在输出设备217显示判断结果时,显示判断时的时刻。
[0208]如上所述,根据第一实施例,对由事件分析程序222导出的原因故障候选执行关联的诊断,在诊断中,执行诊断所需的信息收集,对收集到的信息进行判断,能够根据从判断结果得到的结论来确定故障的原因事件。由此,管理者能够迅速地确定故障的原因事件,从而能够缩短因IT系统的故障而引起的停机期间。
[0209]第二实施例
[0210]接着,对第二实施例进行说明。在以下的说明中,以与第一实施例的不同点为中心进行说明,针对同等的结构要素、具有同等的功能的程序、具有同等的项目的表格,省略或简略记载。
[0211 ] 在第一实施例中,对由事件分析程序导出的作为多个故障的传播源的故障执行诊断,并且作为传播源的故障的发生原因,提示通过诊断得出的结论。在第一实施例中例示的方法有助于,在通过事件分析程序在一定范围内确定了原因之后,进一步调查详细的原因。另一方面,作为诊断的有效的利用方法,还举出提高由事件分析程序导出的候选原因的确信度的精度(例如提高确信度的值)的方法。
[0212]在第二实施例中,对在根据事件分析程序导出候选原因之后,执行诊断,并使诊断结果反映于根据事件分析功能导出的候选原因的确信度的例子进行说明。
[0213]图23示出第二实施例中的元规则2300的结构例。
[0214]第二实施例中的元规则2300的结构在实质上与第一实施例中的元规则1100的结构相同。在第一实施例的元规则1100中,为了保存由事件接收程序227接收的事件的种类,利用装置种类1101、组件种类1102、事件种类1103来构成IF部1111的条件要素1121。与之相对,第二实施例中的元规则2300为了反映诊断的结果,还可以具有用于保存元诊断过程1200的标识符的字段2311,来作为IF部1111的条件要素。
[0215]图24示出第二实施例中的展开规则2400的结构例。
[0216]第二实施例中的展开规则2400的结构在实质上与第一实施例中的展开规则1150的结构相同。与元规则同样地,第一实施例的展开规则1150为了保存事件接收程序227可能接收的事件,利用装置IDl 161、组件IDl 162以及事件种类1163来构成IF部1151的条件要素。与之相对,为了反映诊断的结果,第二实施例中的展开规则2400还可以具有用于保存展开诊断过程的标识符的字段2411,来作为IF部1151的条件要素。
[0217]图25示出第二实施例中的展开诊断过程的结构例。
[0218]第二实施例中的展开诊断过程2500的结构在实质上,与第一实施例中的展开诊断过程1500的结构相同。为了反映诊断的结果,展开诊断过程2500可以在结论对象1504的Conclus1nl543中保存更新指示,在此的更新指示是指,对与保存有展开规则2400的展开诊断过程的标识符的字段2411对应的接收标记1164进行更新的指示。
[0219]图26示出在第二实施例中由故障分析程序221执行的故障原因分析处理的例子的流程图。故障分析程序221的开始时间可以为第一实施例记载的时间。
[0220]在步骤S1701中,故障分析程序221执行事件分析程序222。所执行的处理与在第一实施例中说明的步骤S1701的处理相同。
[0221]在步骤S1702中,故障分析程序221将在步骤S1701中选择的候选原因的信息作为输入,启动诊断过程展开程序223。所执行的处理实质上与在第一实施例中说明的步骤S1702或图19的处理相同。在此,诊断过程展开程序223在步骤S1909中生成了展开诊断过程2500之后,获取在步骤S1902中获取的展开规则2400和作为该展开规则2400的基础的元规则2300。然后,在生成的展开诊断过程2500具有与保存在元规则2300的条件要素字段2311中的元诊断过程的标识符相同的元诊断过程ID的情况下,诊断过程展开程序223将展开诊断过程ID保存在与元规则2300关联的展开规则2400的条件要素的字段2411中。
[0222]此外,在基于将展开规则的IF部的组件ID的值作为起点的拓扑信息而生成了展开诊断过程的情况下,诊断过程展开程序223可以仅针对具有作为起点的组件的ID的展开规则,将展开诊断过程ID保存在条件要素的字段2411中。另外,诊断过程展开程序223可以仅在生成展开诊断过程时获取的拓扑信息与在生成展开规则时获取的拓扑信息相等的情况下,将展开诊断过程ID保存在条件要素的字段2411中。
[0223]在步骤S1703中,故障分析程序221将展开诊断过程作为输入,启动诊断执行程序224。所执行的处理与在第一实施例中说明的步骤S1703的处理相同。
[0224]在步骤S2601中,故障分析程序221从诊断执行程序224接收展开诊断过程,基于展开诊断过程的路径列表1515,参照诊断执行程序224所参照的展开诊断过程2400的结论对象1504。
[0225]在步骤S2602中,故障分析程序221搜索特定展开规则,特定展开规则是指,使条件要素具备从诊断执行程序224接收的展开诊断过程2400的展开诊断过程ID的展开规贝1J。然后,按照在步骤S2601中参照的结论对象1504的Conclus1nl543中保存的指示,更新展开规则2400的条件要素2411的接收标记1164。
[0226]例如,在从诊断执行程序224接收的展开诊断过程为图25的展开诊断过程2500,并且在步骤S2061中参照了结论对象1504d的情况下,故障分析程序221将与展开规则2400的条件要素的字段2411对应的接收标记1164更新为“ 1”,其中展开规则2400的条件要素具备展开诊断过程2500的ID即“ExpandedDeagnosticProclO-l”。
[0227]在步骤S2603中,故障分析程序221计算出各展开规则的事件接收率。如在第一实施例中说明的那样,事件接收率的计算式可以为“事件接收率=(接收标记1164为“I”的条件要素数)/ (条件要素的总数)”。
[0228]在步骤S2604中,故障分析程序221启动显示程序225。显示程序225基于在步骤S2603中计算出的事件接收率,在事件分析结果画面1800中,更新在步骤S1701中选择的候选原因的确信度。
[0229]如上所述,根据第二实施例,对由事件分析程序导出的候选原因执行关联的诊断,并基于根据诊断结果得到的结论来更新候选原因的确信度,由此,能够向管理者优先提示更可靠的故障候选原因。由此,管理者能够迅速确定故障原因。
[0230]以上,说明了几个实施例,但本发明不限于这些实施例。例如,元规则1100包括与该元规则1100建立了关联的元诊断过程1200的元诊断过程ID以及起点,取而代之或者在此基础上,还可以使元诊断过程1200包括与该元诊断过程1200建立了关联的元规则1100的元规则ID和起点。无论采用哪一种结构,都能够以多对多的方式对元规则100和元诊断过程1200建立关联。
[0231]附图标记说明
[0232]201:管理计算机
【主权项】
1.一种管理系统,其进行一个以上的发生事件的原因分析,所述一个以上的发生事件是指,在多个管理对象组件中的一个以上的管理对象组件中发生的一个以上的事件,所述管理系统的特征在于, 具有: 存储设备;和 与所述存储设备连接的处理器, 所述存储设备存储结构管理信息、多个规则以及多个通用诊断过程, 所述结构管理信息是与所述多个管理对象组件的结构有关的信息, 所述多个规则的每一个是表示一个以上的条件事件与在发生了所述一个以上的条件事件的情况下成为原因的结论事件之间的关联的规则, 所述多个通用诊断过程的每一个分别与所述多个规则的某一个建立了关联,并且是利用一个或多个组件种类定义的不依存于管理对象组件的通用的诊断过程, 所述处理器以所述多个规则中的一个以上的对象规则为基础,确定一个以上的候选原因,所述一个以上的对象规则是指,与和所述一个以上的发生事件关联的一个以上的条件事件建立了关联的一个以上的规则, 所述处理器确定所述多个通用诊断过程中的、与作为所述一个以上的候选原因中的所选的候选原因的基础的对象规则建立了关联的通用诊断过程,基于所述确定出的通用诊断过程和所述结构管理信息,生成展开诊断过程,所述展开诊断过程是对一个以上的管理对象组件执行的诊断过程,用于确定所述所选的候选原因的更具体的原因或更新所述所选的候选原因的可靠度。2.如权利要求1所述的管理系统,其特征在于, 所述处理器显示表示所述生成的展开诊断过程的信息。3.如权利要求1所述的管理系统,其特征在于, 所述处理器针对如下拓扑生成所述展开诊断手段:以所述确定出的通用诊断过程和所述结构管理信息为基础而确定出的拓扑,并且是以作为所述一个以上的对象规则中的一个以上的条件事件的对象的管理对象组件或作为所述一个以上的对象规则中的一个以上的结论事件的对象的管理对象组件为起点的拓扑。4.如权利要求1所述的管理系统,其特征在于, 所述处理器除了生成所述确定出的通用诊断过程和所述结构管理信息之外,还以所述一个以上的发生事件的信息为基础,来生成所述展开诊断过程。5.如权利要求1所述的管理系统,其特征在于, 所述多个通用诊断过程的每一个均是一个以上的信息收集定义、一个以上的判断定义以及多个结论定义的组合, 所述一个以上的信息收集定义的每一个示出信息收集和信息收集源的组件种类, 所述一个以上的判断定义的每一个示出基于收集到的信息来进行判断这一事项,其判断的结果与至少一个结论定义和至少一个信息收集定义中的至少一方对应, 所述一个以上的结论定义的每一个示出结论, 至少一个判断定义与至少一个结论定义建立了关联。6.如权利要求5所述的管理系统,其特征在于, 所述展开诊断过程是通过针对所述确定出的通用诊断过程中的组件种类,以所述结构管理信息为基础对与该组件种类对应的管理对象组件建立关联来生成的, 所述处理器以所述展开诊断过程为基础来决定结论,并显示决定出的结论。7.如权利要求1所述的管理系统,其特征在于, 所述处理器仅在与作为所述所选的候选原因的基础的对象规则建立了关联的一个以上的条件事件中的与发生事件吻合的条件事件所占的比例在固定值以上的情况下,将与作为所述所选的候选原因的基础的对象规则建立了关联的通用诊断过程,作为用于生成展开诊断过程的基础。8.如权利要求6所述的管理系统,其特征在于, 所述处理器显示执行了的定义以及收集到的信息中的至少一方。9.如权利要求1所述的管理系统,其特征在于, 所述处理器以作为所述所选的候选原因的基础的对象规则和所述一个以上的发生事件为基础,计算出所述一个以上的候选原因的每一个的确信度, 所述处理器基于计算出的一个以上的确信度,从所述一个以上的候选原因中选择作为诊断对象的候选原因。10.如权利要求5所述的管理系统,其特征在于, 所述处理器以作为所述所选的候选原因的基础的对象规则和所述一个以上的发生事件为基础,计算出所述一个以上的候选原因的每一个的确信度, 所述多个结论定义中的一部分结论定义表示更新计算出的确信度, 所述处理器以所述展开诊断过程为基础来决定结论,若决定出的结论为更新确信度,则更新所述所选的候选原因的确信度。11.如权利要求5所述的管理系统,其特征在于, 所述处理器显示所述展开诊断过程,此后,接收表示所述展开诊断过程示出的判断的结果的信息的输入,基于接收到的信息所表示的判断结果,决定要执行的定义。12.如权利要求5所述的管理系统,其特征在于, 所述处理器显示所述展开诊断过程,此后,显示基于所述展开诊断过程收集到的信息中的满足判断结果的信息。13.如权利要求5所述的管理系统,其特征在于, 所述处理器向所述存储设备写入在执行所述展开诊断过程时收集到的信息和收集时亥IJ、及在执行所述展开诊断过程时的判断结果和判断时刻中的至少一方,在执行其他展开诊断过程时,若为针对与向所述存储设备写入的信息或判断结果相同的管理对象组件进行的信息收集或判断,并且从向所述存储设备写入的收集时刻或判断时刻起没有经过规定时间,则将存储在所述存储设备中的信息或判断结果作为所述其他展开诊断过程中的收集信息或判断结果。14.一种管理方法,其对一个以上的发生事件的原因分析予以支援,所述一个以上发生事件是指,在多个管理对象组件中的一个以上的管理对象组件中发生的一个以上的事件,所述管理方法的特征在于, 包括如下的步骤: 以分别表示一个以上的条件事件与在发生了所述一个以上的条件事件的情况下成为原因的结论事件之间的关联的多个规则中的一个以上的对象规则为基础,确定一个以上的候选原因,所述一个以上的对象规则是指,与和所述一个以上的发生事件关联的一个以上的条件事件建立了关联的一个以上的规则, 确定多个通用诊断过程中的、与作为所述一个以上的候选原因中的所选的候选原因的基础的对象规则建立了关联的通用诊断过程,所述多个通用诊断过程中的每一个分别与所述多个规则的某一个建立了关联,并且是利用一个或多个组件种类定义的不依存于管理对象组件的通用的诊断过程, 基于所述确定出的通用诊断过程和结构管理信息,生成展开诊断过程,所述结构管理信息是与所述多个管理对象组件的结构有关的信息,所述展开诊断过程是对一个以上的管理对象组件执行的诊断过程,用于确定所述所选的候选原因的更具体的原因或更新所述所选的候选原因的可靠度。15.一种计算机程序,其特征在于, 用于使计算机执行如下的步骤: 以分别表示一个以上的条件事件与在发生了所述一个以上的条件事件的情况下成为原因的结论事件之间的关联的多个规则中的一个以上的对象规则为基础,确定一个以上的候选原因,所述一个以上的对象规则是指,与和所述一个以上的发生事件关联的一个以上的条件事件建立了关联的一个以上的规则, 确定多个通用诊断过程中的、与作为所述一个以上的候选原因中的所选的候选原因的基础的对象规则建立了关联的通用诊断过程,所述多个通用诊断过程中的每一个分别与所述多个规则的某一个建立了关联,并且是利用一个或多个组件种类定义的不依存于管理对象组件的通用的诊断过程, 基于所述确定出的通用诊断过程和结构管理信息,生成展开诊断过程,所述结构管理信息是与所述多个管理对象组件的结构有关的信息,所述展开诊断过程是对一个以上的管理对象组件执行的诊断过程,用于确定所述所选的候选原因的更具体的原因或更新所述所选的候选原因的可靠度。
【专利摘要】准备多个通用诊断过程。各通用诊断过程与多个规则的某一个建立了关联,并且是利用一个或多个组件种类定义的通用的诊断过程。各规则示出一个以上的条件事件与结论事件之间的关联。管理系统以一个以上的对象规则为基础,确定一个以上的候选原因,并确定与作为一个以上的候选原因中的所选的候选原因的基础的对象规则建立了关联的通用诊断过程,其中,一个以上的对象规则与和一个以上的发生事件关联的一个以上的条件事件建立了关联。管理系统基于确定出的通用诊断过程和结构管理信息,生成展开诊断过程,其中,结构管理信息是与多个管理对象组件的结构有关的信息,展开诊断过程是对一个以上的管理对象组件执行的诊断过程,用于确定所选的候选原因的更具体的原因或更新所选的候选原因的可靠度。
【IPC分类】G06N5/04, G06F11/22
【公开号】CN104903866
【申请号】CN201380070015
【发明人】仲野香绪里, 名仓正刚, 永井崇之
【申请人】株式会社日立制作所
【公开日】2015年9月9日
【申请日】2013年11月29日
【公告号】DE112013006475T5, WO2015079564A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1