管理计算机系统的管理系统及其管理方法

文档序号:9240022阅读:749来源:国知局
管理计算机系统的管理系统及其管理方法
【技术领域】
[0001]本发明涉及管理计算机系统的管理系统及其管理方法。
【背景技术】
[0002]专利文献I公开了如下的技术:通过选择成为性能降低的原因的原因事件和由原因事件引起的关联事件组,来确定故障原因。具体来说,解析引擎将事先规定的由条件语句和解析结果构成的解析规则应用于管理下的机器中的性能值超过阈值的事件,来选择事件,其中,解析引擎用于对在管理下的机器中发生的多个故障事件的因果关系进行解析。
[0003]专利文献2示出了在发生故障时由用于确定故障的日志(log)进行的原因诊断、和利用了诊断结果的用于调用恢复模块的过程。
[0004]现有技术文献
[0005]专利文献
[0006]专利文献1:日本特开2010-86115号公报
[0007]专利文献2:美国专利申请公开第2004/0225381号说明书

【发明内容】

[0008]在应对根据专利文献I公开的技术而确定的故障的情况下,存在如下的问题:不知道具体要如何进行故障恢复,从发生故障到进行故障恢复要花费成本。专利文献2的技术在获取用于确定故障原因的日志诊断方法与利用了诊断结果的恢复模块的调用方法之间的映射的基础上,在确定故障原因时能够迅速执行恢复,从而具有能够解决该问题的可能性。
[0009]然而,在计算机系统中,通常多个服务器计算机、存储装置经由网络连接。就这种结构而言,某个装置的处理可能会影响其他装置,在此的处理不限于恢复处理。因此,需要在自动执行处理之前暂且停止系统,在运行管理者确认了处理的内容之后再执行。
[0010]本发明的一个方案为管理系统,该管理系统管理包括多个监视对象装置的计算机系统,其包括存储器和处理器。所述存储器保持:所述计算机系统的结构信息;解析规则,其对在所述计算机系统中可能发生的原因事件与受到该原因事件的影响而可能发生的派生事件建立关联,并利用所述计算机系统的组件的种类来定义所述原因事件和所述派生事件;和方案执行影响规则,其示出受到所述计算机系统中的结构变更的影响的组件种类及内容。所述处理器利用所述方案执行影响规则及所述结构信息来确定在执行第一方案的情况下可能发生的第一事件,所述第一方案是指变更所述计算机系统的结构的方案,并利用所述解析规则及所述结构信息,来确定所述第一事件的影响波及的范围。
[0011]发明效果
[0012]根据本发明的一个方案,能够考虑由计算机系统的结构变更带来的影响而更恰当地管理计算机系统。
【附图说明】
[0013]图1是表示第一实施方式的计算机系统的概念图。
[0014]图2是表示计算机系统的物理结构例的图。
[0015]图3是表不第一实施方式中说明的状况的概念图。
[0016]图4是表示在第一实施方式中,管理服务器计算机所具有的装置性能管理表的结构例的图。
[0017]图5是表示在第一实施方式中,管理服务器计算机所具有的文件拓扑管理表的结构例的图。
[0018]图6是表示在第一实施方式中,管理服务器计算机所具有的网络拓扑管理表的结构例的图。
[0019]图7是表示在第一实施方式中,管理服务器计算机所具有的VM(虚拟机)结构管理表的结构例的图。
[0020]图8是表示在第一实施方式中,管理服务器计算机所具有的事件管理表的结构例的图。
[0021]图9A是表示在第一实施方式中,管理服务器计算机所具有的解析规则的结构例的图。
[0022]图9B是表示在第一实施方式中,管理服务器计算机所具有的解析规则的结构例的图。
[0023]图10是表示在第一实施方式中,管理服务器计算机所具有的解析结果管理表的结构例的图。
[0024]图11是表示在第一实施方式中,管理服务器计算机所具有的通用方案的结构例的图。
[0025]图12是表示在第一实施方式中,管理服务器计算机所具有的展开方案的结构例的图。
[0026]图13是表示在第一实施方式中,管理服务器计算机所具有的规则/方案对应管理表的结构例的图。
[0027]图14是表示在第一实施方式中,管理服务器计算机所具有的方案执行影响规则的结构例的图。
[0028]图15是用于说明在第一实施方式中,管理服务器计算机所执行的从性能信息获取处理到故障原因解析、方案展开处理、方案执行影响解析处理的流程的流程图。
[0029]图16是用于说明在第一实施方式中,管理服务器计算机所执行的方案展开处理的流程图。
[0030]图17是用于说明在第一实施方式中,管理服务器计算机所执行的方案执行影响特定处理的流程图。
[0031]图18是表不在第一实施方式中,向管理者提不的对策方案一览图像的一个例子的图。
[0032]图19是表示在第二实施方式中,管理服务器计算机所具有的方案执行记录管理表的结构例的图。
[0033]图20是用于说明在第二实施方式中,管理服务器计算机所执行的针对其他方案的方案执行影响特定处理的流程图。
[0034]图21是表示在第二实施方式中,向管理者提示的对策方案一览图像的一个例子的图。
【具体实施方式】
[0035]以下,根据附图,详细说明实施方式。此外,本发明不限于在以下说明的例子。此夕卜,在以下的说明中,以“aaa表”、“aaa目录”等表现形式来说明本实施方式的信息,但这些信息也可以用表、目录等数据结构以外的形式来表现。
[0036]为了表示不依存于数据结构,有时将“aaa表”、“aaa目录”等称为“aaa信息”。而且,在说明各信息的内容时,利用“标识符”、“名”、“ID”等表现形式,对此能够互相置换。
[0037]在以下的说明中,存在将“程序”作为主语来进行说明的情况,但程序是通过由处理器执行而利用存储器及通信端口(通信控制设备)进行规定的处理,因此,也可以将处理器作为主语进行说明。
[0038]可以将以程序为主语公开的处理看作是由管理服务器计算机等计算机、信息处理装置进行的处理。程序的一部分或全部可以由专用硬件来实现。各种程序可以通过程序分发服务器、计算机可读的存储介质而安装在各计算机中。
[0039]以下,有时将管理信息处理系统且显示本申请发明的显示用信息的一个以上的计算机的集合称为管理系统。在管理计算机对显示用信息进行显示的情况下,管理计算机为管理系统。管理计算机和显示用计算机的组合也为管理系统。为了实现管理处理的高速化、高可靠性化,可以通过多个计算机实现与管理计算机同等的处理,在该情况下,该多个计算机(在显示用计算机进行显示的情况下,还包括显示用计算机)为管理系统。
[0040]第一实施方式
[0041]〈概要〉
[0042]本实施方式事先将计算机系统的结构变更方案和在执行该方案时有可能直接受到影响的某个组件形式化,以体现影响波及关系的解析规则为基础来确定计算机系统的结构信息和有可能二次间接受到影响的某个装置。
[0043]本实施方式在向运行管理者提示对计算机系统执行的方案时,一并提示执行该方案的影响。本实施方式能够对运行管理者判断方案可否执行进行支援。例如,在发生故障时制定了用于恢复的方案的情况下,缩短直到故障恢复为止花费的时间。
[0044]图1是第一实施方式中的计算机系统的概念图。该计算机系统包括管理对象计算机系统1000和经由网络等与该管理对象计算机系统1000连接的管理服务器1100。
[0045]装置性能获取程序1110和结构管理信息获取程序1120监视着管理对象计算机系统1000。结构管理信息获取程序1120在每次结构变更时,向结构信息库1130记录结构信息。当装置性能获取程序1110根据所获取的装置性能信息检测出管理对象计算机系统1000中发生故障时,为了确定原因而调用故障原因解析程序1140。
[0046]故障原因解析程序1140确定故障原因。在故障波及关系规则1150中定义有规则化了的故障波及关系。故障原因解析程序1140通过对照故障波及关系规则1150和从结构信息库1130获取的结构信息,来确定故障原因。
[0047]故障原因解析程序1140为了制定针对所确定的原因的应对方案而调用方案制定程序1160。方案制定程序1160利用事先将故障与对应的方案之间的关系形式化了的通用方案1170,来制定具体的应对方案(展开方案)。
[0048]方案执行影响解析程序1180确定由于执行方案制定程序1160所制定的应对方案而受到影响的装置、构成装置的部件及程序。以下,分别将装置、装置内的部位(硬件部件或程序)称为组件。
[0049]方案执行影响解析程序1180通过对照所制定的应对方案、结构信息库1130示出的结构信息以及故障波及关系规则1150,来确定因执行应对方案而带来的影响。
[0050]图像显示程序1190向运行管理者一并显示所制定的应对方案和因执行该应对方案而引起的波及关系。第一实施方式中,对伴随着基于故障原因解析程序1140对故障原因的确定而制定出的应对方案进行说明,但本发明不限于对故障原因的确定,还能够适用于对伴随着计算机系统中的结构变更的、各种各样的方案的影响的确定。
[0051]图2示出本实施方式中的计算机系统的物理结构例。该计算机系统具有存储装置20000、主机计算机10000、管理服务器计算机30000、WEB(网页)浏览器启动服务器计算机35000以及IP(Internet Protocol:网络之间互连的协议)开关40000,这些装置经由网络45000而连接。也可以省略图2中的一部分装置,也可以仅使一部分装置相互连接。
[0052]主机计算机10000至10010例如从与它们连接的未图示的客户端计算机接收文件的I/o请求,并基于该I/O请求实现向存储装置20000至20010的访问。在此,主机计算机10000至10010为服务器计算机。
[0053]主机计算机10000至10010彼此经由网络45000而在程序之间执行通信来交换文件。因此,主机计算机10000至10010具有用于与网络45000连接的端口 11010。管理服务器计算机30000管理该计算机系统整体的运行。
[0054]WEB浏览器启动服务器计算机35000经由网络45000与管理服务器计算机30000的图像显示程序1190进行通信,而在WEB浏览器上显示各种信息。用户通过参照在WEB浏览器启动服务器上的WEB浏览器上显示的信息,来管理计算机系统内的装置。不过,管理服务器计算机30000和WEB浏览器启动服务器计算机35000可以由一台服务器计算机构成。
[0055]<系统结构例>
[0056]图3是说明与以下说明的管理服务器计算机30000所保持的表对应的系统结构例的概念图。在该图中,IP开关40000、40010各自的ID分别为IPSWl、IPSW2。IP开关IPSWl、IPSW2分别具有用于与网络45000连接的端口 40010。
[0057]IP开关IPSWl的端口 40010的ID分别为端口 1、端口 2、端口 8。IP开关IPSW2的端口 40010的ID分别为端口 1、端口 8。端口的ID在IP开关内是唯一的。
[0058]主机计算机10000、10005、10010 各自的 ID 分别为 SERVER10、SERVER11、SERVER20。主机计算机10000、10005、10010分别经由端口 11010与网络45000连接。各端口的ID为端口 101、端口 111、端口 201。
[0059]在本结构例中,在各个主机计算机10000、10005、10010上,服务器虚拟化机构(服务器虚拟化程序)进行动作。在主机计算机10000、10005上,虚拟机(VM) 11000进行动作。各VM11000的ID为HOSTlO至H0ST13。虽未图示,但在各VM11000上安装有OS(操作系统),在该OS上,WEB服务进行动作。
[0060]
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1