对事件根本原因的分析予以支援的管理系统以及方法_5

文档序号:8926989阅读:来源:国知局
手段1400,来生成展开收集手段1600。通过向元收集手段1400中的变量代入拓扑信息中的ID,来生成展开收集手段1600(展开收集手段1602例如图16所示)O
[0162]在步骤S1911中,诊断过程展开程序223基于元诊断过程1200、在步骤S1909中获取的拓扑信息和在步骤S1910中生成的展开收集手段1600,生成展开诊断过程1500。
[0163]在步骤S1912中,诊断过程展开程序223将在步骤S1911中生成的展开诊断过程1500登录到展开诊断过程库235中。
[0164]在步骤S1913中,诊断过程展开程序223将生成的或从展开诊断过程库235获取的展开诊断过程1500返回至调用源程序。
[0165]此外,在步骤S1904中,可以在对象展开规则1150的事件接收率在固定值以下的情况下,将对象展开规则设为与展开规则关联的元诊断过程的展开对象以及执行诊断的对象外。由此,将诊断执行程序224执行的展开诊断过程限定于与事件接收率在固定值以上的展开规则关联的展开诊断过程,从而能够削减执行不必要的诊断。
[0166]图19的处理的具体例如下所述。在步骤S1901中,作为事件分析程序222的结论,接收了“网络开关D (ID为SwD)的端口 0(ID为SWP0RT1)的发送丢包数异常(事件种类的标识符为TxDropPacketNumError) ”这个信息的情况下,在步骤S1902中,诊断过程展开程序223获取图1lB的展开规则1150a和1150b。以展开规则1150a为例,在步骤S1904中,诊断过程展开程序223获取图12的元诊断过程1200。在步骤S1906中判断为没有展开完毕的情况下,在步骤S1908中,诊断过程展开程序223获取图13的拓扑条件1300a。在步骤S1909中,诊断过程展开程序223获取三个拓扑信息(SWP0RT1-SWP0RT2-SVIF1、SffPORTl-SWP0RT3-SVIF2、SWP0RT1-SWP0RT4-SVIF3)。由于在元诊断过程1200的两个信息收集对象1202的手段ID1223中分别保存有“Getlnfol ”和“GetInfo2”,所以在步骤S1910中,诊断过程展开程序223基于图14的元收集手段1400a和拓扑信息生成展开收集手段1600a,并且基于元收集手段1400b和拓扑信息生成展开收集手段1600b、1600c以及1600d。在步骤S1911中,诊断过程展开程序223根据元诊断过程1200和所获取的拓扑信息,生成图15示出的展开诊断过程1500。然后,在步骤S1912中,诊断过程展开程序223将展开诊断过程1500保存在展开诊断过程库235中,在步骤S1913中,诊断过程展开程序223将生成的展开诊断过程1500返回至故障分析程序221。
[0167]〈诊断执行程序的处理〉
[0168]图20示出通过诊断过程展开程序223执行的处理的例子的流程图(步骤S1703)。
[0169]在步骤S2001中,诊断执行程序224接收展开诊断过程1500。诊断执行程序224针对在步骤S2001中接收的所有展开诊断过程重复执行步骤S2003到S2014的处理。以下,例举一个展开诊断过程(以下,在图20的说明中称为“对象展开诊断过程”)。
[0170]在步骤S2003中,诊断执行程序224参照构成对象展开诊断过程1500的对象中的类型为“Start”的基本对象1501。
[0171]在步骤S2004中,诊断执行程序224在基本对象1501的路径列表1515中追加所参照的对象的ID。
[0172]在步骤S2005中,诊断执行程序224参照所参照的对象的下一个对象。在所参照的对象为基本对象1501或者信息收集对象1502的情况下,诊断执行程序224参照具有在NextID1516或NextID1524中保存的ID的对象。在参照判断对象1503的情况下,在后述的步骤S2013中,诊断执行程序224基于Decis1n Mapl535,决定下一个对象。
[0173]在步骤S2006中,诊断执行程序224判断在步骤S2005中参照的对象的类型是否为“End”。在该判断结果为真的情况(S2006:是)下,处理前进至步骤S2007,在该判断结果为假的情况(S2006:否)下,处理前进至步骤S2014。
[0174]在步骤S2007中,诊断执行程序224判断在步骤S2005中参照的对象的类型是否为“Collectlnfo”。在该判断的结果为真的情况(S2007:是)下,处理前进至步骤S2008,在该判断的结果为假的情况(S2007:否)下,处理前进至步骤S2010。
[0175]在步骤S2008中,诊断执行程序224从展开收集手段库237中获取利用在所参照的对象的展开手段ID1523中保存的标识符识别出的展开收集手段1600。
[0176]在步骤S2009中,诊断执行程序224基于在步骤S2008中获取的展开收集手段,从管理对象装置、管理计算机201具备的库获取信息。
[0177]在步骤S2010中,诊断执行程序224基于保存在所参照的对象的引数1534中的信息,获取在步骤S2009中收集的信息。
[0178]在步骤S2011中,诊断执行程序224将在步骤S2010中获取的信息作为输入,启动判断程序226,该判断程序226是利用保存在所参照的对象的判断程序ID1533中的标识符识别出的。
[0179]在步骤S2012中,诊断执行程序224从在步骤S2011中执行的判断程序226接收判断结果。
[0180]在步骤S2013中,诊断执行程序224将在步骤S2012中接收的判断结果作为键,获取保存在所参照的对象的Decis1n Map 1535内的NextID1537,决定下一个要参照的对象。
[0181]在步骤S2014中,诊断执行程序224向基本对象1501的路径列表1515追加要参照的对象的ID。
[0182]在步骤S2015中,诊断执行程序224将所接收的展开诊断过程1500返回至调用源程序。
[0183]图20的处理的具体例如下所述。例如,在步骤S2001中接收了图15示出的展开诊断过程1500的情况下,在步骤S2003中,诊断执行程序224参照基本对象1501a,在步骤S2004中,向路径列表1515追加对象的ID“Procl-l-0”。接着,在步骤S2005中,诊断执行程序224基于NextID1516示出的标识符“Procl-1-l”,参照信息收集对象1502。由于信息收集对象1502a的类型为“Collectlnfo”,所以处理前进至步骤S2008。在步骤S2008中,诊断执行程序224基于展开手段ID “ExpandedGetlnfol-l”,获取图16的展开信息手段1600a。然后,诊断执行程序224基于在展开收集手段1602中描述的SQL查询语句,从性能表格238中收集信息。然后,返回步骤S2004,诊断执行程序224向路径列表1515追加对象的ID“Procl-l-l”。接着,由于在步骤S2005中参照的对象为判断对象1503a,所以处理前进至步骤S2010。在步骤S2010中,诊断执行程序224获取基于展开信息手段1600a获取的性能信息,在步骤S2011中,诊断执行程序224将该性能信息作为输入,启动“判断程序I”。在步骤S2012中从“判断程序I”接收了“否”的值的情况下,诊断执行程序224基于Decis1n Mapl535,将具有ID“Procl-l_4”的结论对象1504a决定为下一个要参照的对象。再次返回步骤S2004,诊断执行程序224向路径列表1515追加对象的ID “Procl-1-3”,在步骤S2005中,参照结论对象1504a。由于结论对象1504a的类型为“End”,所以处理前进至步骤S2014,诊断执行程序224向路径列表1515追加对象的ID “Procl-l_4”。然后,诊断执行程序224将路径列表1515被更新的展开诊断过程1500返回至作为调用源的故障分析程序221。
[0184]通过进行以上的处理,基于通过诊断过程展开程序223生成的展开诊断过程,诊断执行程序224能够执行用于确定在IT系统中发生的故障的原因事件的诊断。
[0185]此外,在步骤S2009中,诊断执行程序224在输出设备217上显示收集到的信息,在步骤S2011中执行的判断程序226在输出设备217上显示判断基准和供管理者输入判断结果的输入界面(例如按钮),在步骤S2012中接收的判断结果可以为管理者经由输入界面输入的判断结果。
[0186]另外,在步骤S2010中诊断执行程序224没能获取用于判断的信息的情况下,在步骤S2011中,判断程序226返回多个判断结果,诊断执行程序224基于多个判断结果的每一个继续执行诊断过程,参照多个结论对象1504,显示程序225可以基于这些多个结论对象1504,显示多个原因事件。
[0187]另外,诊断执行程序224可以不按照展开诊断过程中对象的顺序执行基于信息收集对象1502的信息收集处理以及基于判断对象1503的判断程序226的判断处理,而并行执行这些处理。
[0188]〈显示程序的处理〉
[0189]图21示出根据显示程序225执行的处理的例子的流程图(步骤S1704)。
[0190]在步骤S2101中,显示程序225接收展开诊断过程1500。
[0191]在步骤S2102中,显示程序225根据接收到的展开诊断过程1500和保存在基本对象1501的路径列表1515中的列表,获取诊断执行程序224最终参照的结论对象1504,并作为诊断结果进行显示。
[0192]在步骤S2103中,显示程序225基于接收到的展开诊断过程,显示所使用的诊断过程。
[0193]在步骤S2104中,显示程序225基于接收到的展开诊断过程1500的基本对象1501的路径列表1515,显示诊断执行程序224所使用的诊断过程中执行过的过程。
[0194]此外,根据步骤2101?S2104,依次显示信息,取而代之地,显示程序225还可以将显示对象的信息写入存储器212,在将所有显示对象都写入存储器212的情况下,显示包含这些显示对象的画面(例如图22的画面)。
[0195]图22示出诊断结果画面的一个例子。
[0196]诊断结果画面2200为显示诊断执行程序224执行的诊断过程和其诊断结果的画面,该诊断结果画面2200显示在输出设备217上。具体来说,该画面2200示出图15的展开诊断过程和执行了该过程而得到的结果。诊断结果画面2200可以由诊断结果字段2201和诊断过程字段2202构成,诊断结果字段2201显示由诊断执行程序224导出的诊断结果,诊断过程字段2202显示在诊断执行程序224中所使用的展开诊断过程1500的信息。另外,诊断结果画面2200还可以具有诊断对象拓扑字段2203和诊断对象数据字段2204,诊断对象拓扑字段2203显示执行了诊断的拓扑的信息,诊断对象数据字段2204显示在执行诊断时收集到的用于判断的信息。
[0197]在诊断结果字段2201显示的信息为在步骤S2102中通过显示程序225显示的信息(诊断结果)的一个例子。基于接收到的展开诊断过程1500的路径列表1515,获取诊断执行程序224最终参照的结论对象1504,将该结论对象1504作为诊断结果显示在字段2201 中。
[0198]在诊断过程字段2202中显示的信息为在步骤S2103中通过显示程序225显示的信息(诊断过程)的一个例子。基于接收到的展开诊断过程1500的信息,获取诊断执行程序224所使用的诊断过程,在字段2202中显示有该诊断过程。在图22中,作为显示诊断过程的一个例子,显示有判断对象1503的引数1534所表示的值、根据判断对象1503识别出的判断程序226的判断基准以及由结论对象1504导出的结论的信息。图22的路径2223为,在步骤S2104中显示程序225基于路径列表1515显示的“执行过的过程”的一个例子。如图22所示,就诊断过程2221而言,可以突出显示表示“执行过的过程”的流程的部分(箭头),也可以显示执行过的过程的一览表。
[0199]在诊断对象拓扑字段2203中显示的信息是表示作为展开诊断过程1500的对象的拓扑的信息。诊断过程展开程序223在图19的处理中,与展开诊断过程1500相关联地将拓扑信息保存在管理计算机201的存储器212等的存储区域内,在启动显示程序225时,显示程序225可以在字段2203中显示该保存的信息。
[0200]在诊断对象数据字段2204中,显示有在诊断执行程序224参照展开诊断过程1500的信息收集对象1502时获取的信息。诊断执行程序224在图20的处理中,将在步骤S2009中获取的信息与展开诊断过程1500相关联地保存在管理计算机201的存储器212等的存储区域内,在启动显示程序225时,显示程序225可以在字段2204中显示该保存的信息。
[0201]另外,可以在诊断对象拓扑字段2203中,针对每个判断的过程,显示与作为判断对象的管理对象组件有关的信息。例如,在图22的显示例中,当管理者选择显示有判断对象1503的判断基准的判断显示2222时,可以突出显示与判断对象1503关联的判断程序226作为判断对象的管理对象组件的信息。例如,在管理者选择了显示有判断对象1503a的判断基准的判断显示2222a的情况下,判断对象1503a的引数1534所表示的信息为"Procl-1-1的返回值”,过程“Procl-1-l”收集到的信息为“网络开关D的端口 O (标识符为SWP0RT1) ”的性能信息,因此,可以突出显示“网络开关D的端口 O”。
[0202]另外,在诊断对象拓扑字段2203中,可以针对每个判断的过程,显示与作为决定判断结果的要素的管理对象组件有关的信息。例如,在图22的显示例中,当管理者选择显示有展开诊断过程1500的判断对象1503的判断基准的判断显示2222时,可以突出显示特定管理对象组件的信息,在此的特定管理对象组件为,在诊断对象拓扑字段2203中显示的管理对象组件中的、作为决定判断结果的要素的管理对象组件。例如,与判断显示2222b关联的判断对象1503b为,具有“分别比较网络开关D的端口 O的发送丢包数的上升率与服务器A的ethO、服务器B的ethO、服务器C的ethO的发送包数的上升率。然后,在只要有一个服务器的发送包数的上升率与网络D的端口 O的发送丢包数的上升率相等的情况下,就参照与结论显示2223a关联的结论对象1504c,否则,就参照结论对象1504b”这个判断信息的展开诊断过程1500的对象。在仅有服务器B与网络开关D的端口 O的发送丢包数的上升率相等的情况下,诊断执行程序224参照结论对象1504c。在这种情况下,可以突出显示作为参照结论对象1504c的主要原因的“服务器B的ethO (标识符为SVIF2) ”和作为比较对象的“网络开关D的端口 O (标识符为SWP0RT1) ”。在执行诊断执行程序224时,可以通过将在步骤S2010中获取的信息和步骤S2012的判断结果保存在管理计算机201的存储器212等的存储区域内,来显示这些信息。以判断对象1503b为例,可以是,调用判断程序ID1533所表示的“判断程序2”并进行判断,在“判断程序2”为返回性能信息的上升率相等的组件的ID组的程序的情况下,将“判断程序2”的返回值保存在管理计算机201的存储器212等的存储区域内,显示程序225显示具有这些ID的管理对象组件的信息。
[0203]另外,在诊断对象数据字段2204中,可以针对每个判断的过程,显示作为判断对象的信息。例如,在图22的显示例中,当管理者选择显示有判断对象1503的判断基准的判断显示2222时,可以突出显示判断对象1503的引数1534所表示的信息。例如,可以在管理者选择了显示有判断对象1503a的判断基准的判断显示2222a的情况下,突出显示判断对象1503a的引数1534所表示的信息2241b。
[0204]另外,在诊断对象数据字段2204中,可以针对每个判断的过程,显示成为决定判断结果的要素的信息。例如,在图22的显示例中,当管理者选择显示有展开诊断过程1500的判断对象1503的判断基准的判断显示2222时,可以突出显示如下的信息:显示在诊断对象数据字段2204中的信息中的、作为决定判断结果的要素的信息。例如,与判断显示2222b关联的判断对象1503b为,具有“分别比较网络开关D的端口 O的发送丢包数的上升率与服务器A的ethO、服务器B的ethO、服务器C的ethO的发送包数的上升率。然后,在只要有一个服务器的发送包数的上升率与网络D的端口 O的发送丢包数的上升率相等的情况下,就参照与结论显示2223a关联的结论对象1504c,否则就参照结论对象1504b”这个判断信息的展开诊断过程1500的对象。在仅有服务器B与网络开关D的端口 O的发送丢包数的
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1