精确地检测系统故障的技术的制作方法

文档序号:6456882阅读:103来源:国知局
专利名称:精确地检测系统故障的技术的制作方法
技术领域
本发明涉及精确地检测系统故障的技术。具体地,本发明涉及在多个 服务器装置相互进行通信的系统中,精确地检测故障的技术。
背景技术
近年来,大规模的网站并非由单个服务器装置实现,而是由包含多个 服务器装置的系统而实现。这样的系统称为多层级服务器系统,例如包括
进行与HTTP协议有关的控制的小服务程序服务器、使被调用的应用工作 的应用服务器、执行数据库的事务的数据库服务器等。为了检测在这样的 多层级服务器系统中产生的故障,以往,使用了独立于这些服务器组而设 置的监视用服务器。
监视用服务器定期地从系统内的各服务器收集其状态。例如,收集供 给电压、CPU的温度以及CPU繁忙率等硬件状态,并在其状态与正常情 况不同时,判断为在该系统中发生了异常。不过,仅利用这种监视用服务 器,有时会不能够判断发生于软件中的异常。因此,在各服务器中,都被 形成为能够计测从该服务器向另一服务器请求的事务的所需时间,并通过 判断该时间的长度是否在预定的范围内,来检测软件引起的故障。
作为与故障检测有关的参考技术,参考下列的专利文献l-2。
专利文献l:特开2001-282759号公报
专利文献2:特开2003-196178号7>报。
在上述的多层级服务器系统中,有第一服务器向第二服务器请求处 理,并且接受了请求的第二服务器进一步向第三服务器请求处理的情况。 在这样的情况下,即便返回至第一服务器的处理响应延迟,在第一服务器中也无法得知在第二服务器以及第三服务器的任意一个中是否产生了故 障。在这样的情况下,如果认为在笫二服务器中产生了故障从而改变处理 请求的发送路径等,则有可能非刻意地使处理效率降低。
再者,当工作于服务器上的程序是用Java语言(注册商标)描述的时, 有时Java的中间件会定期地执行垃圾收集(GC)。所谓GC,是这样的 处理与其程序的操作独立地且例如定期地释》文虽然由程序保留但已不需 要的存储区域。在此情况下,虽然服务器中的处理暂时地延迟,但只要 GC结束,便会立即返回到原始的状态。如果因为这样的暂时的状态而判 断为在服务器中产生了故障,则从有效地使用系统的观点来看,是不适宜 的。

发明内容
因此,本发明的目的在于提供能够解决上述问题的系统、方法以及程 序。该目的可以利用权利要求的范围内的独立权利要求中所记载的特征的 组合来实现。此外,从属权利要求限定本发明的更为有利的具体例子。
为了解决上述问题,在本发明的一个方面,提供一种系统,其包括分 配从外部的终端装置请求的处理的多个调度装置、进行所分配的相应处理
的多个第一层级服务器以及响应于从第一层级服务器接收的请求而进行 相应处理的一部分的至少一个第二层级服务器,其中各个调度装置包括 存储装置,其用于存储指示各个第二层级服务器的工作状态的状态表;传 送单元,其将从外部的终端装置接收的处理请求传送至从多个第一层级服 务器中选择的一个第一层级服务器,以便分配所请求的处理;表生成单元, 其接收包含在与所传送的处理请求对应的处理响应中的各个第二层级服 务器的工作状态,并根据所接收的工作状态评价每一第二层级服务器的工
作状态,从而生成指示每一第二层级服务器的工作状态的状态表,并存储 在存储装置中;表发送单元,其响应于状态表的生成,从存储装置中读出 所生成的状态表,并发送至各个第一层级服务器;以及第一表更新单元, 其响应于来自任意一个第一层级服务器的状态表的接收,利用所接收的状态表更新存储在存储装置中的状态表;各个第一层级服务器包括存储装 置,其用于存储指示各个第二层级服务器的工作状态的状态表;请求发送 单元,其响应于从调度装置的传送单元接收到处理请求的传送的情况,向 笫二层级服务器发送处理请求,以使第二层级服务器处理所请求的处理的 一部分;状态回送单元,其将与发送至第二层级服务器的上述处理请求相 对的处理响应的状态,作为该第二层级服务器的工作状态,包含在与从调 度装置的传送单元接收到的处理请求相对的处理响应内,回送至该调度装 置;第二表更新单元,其响应于从调度装置的表发送单元接收到状态表的 情况,根据所接收的该状态表,更新已经存储在存储装置中的状态表;以 及表回送单元,其响应于状态表的更新,回送更新后的状态表至各个调度 装置。此外,提供利用该系统管理各服务器的状态的方法以及使多个信息 处理装置作为该系统发挥作用的程序。
此外,上述的发明概要并未列举出本发明的必要特征的全部,并且这 些特征组的子组合也能够构成为发明。


图1示出了信息系统10的结构的一例; 图2示出了本实施例的信息系统10的整体结构; 图3示出了调度装置100-1的功能结构; 图4示出了小服务程序服务器110-1的功能结构; 图5示出了存储装置300或存储装置400所存储的状态表的数据结构 的一例;
图6示出了调度装置100-1发送接收处理请求以及处理响应的处理的 具体例子;
图7示出了 S640中的处理的详细的例子;
图8示出了小服务程序服务器110-1发送接收处理请求以及处理响应 的处理的具体例子;
图9是在S860中顺序更新的工作状态的状态转移图;图10示出了由本实施例的信息系统10顺序更新工作状态的过程;以及图11示出了作为调度装置100-1或小服务程序服务器110-1发挥作用 的信息处理装置500的硬件结构的一例。 符号说明10信息系统,100调度装置,110小服务程序服务器,120APP服务 器,130DB服务器,135数据库,140系统监视装置,150信息共享装置, 300存储装置,310传送单元,320表生成单元,330表发送单元,340 第一表更新单元,350停止判断单元,400存储装置,410请求发送单元, 420状态回送单元,430第二表更新单元,440表回送单元,500信息 处理装置。
具体实施方式
以下,通过发明的实施例来说明本发明,但是,以下的实施例并非要 限定与权利要求的范围有关的发明,此外,在实施例中说明的特征的组合 的全部不一定都M明的解决手段所必须的。图1示出了信息系统10的结构的一例。信息系统10包括调度装置 100-1 2、小服务程序服务器110-1~4、APP服务器120-1-3、DB服务器130、 数据库135、系统监视装置140以及信息共享装置150。调度装置100-1-2 的各个直接连接至小服务程序服务器110-1 4。并且,调度装置100-1~2 向小服务程序服务器110-1-4分配从外部的终端装置请求的处理。举例来说,调度装置100-1-2的各个,可以利用轮询调度方式将顺序 接收的处理请求传送至小服务程序服务器110-1-4的各个。换句话说,调 度装置100-1,将第一次接收的处理请求传送至小服务程序服务器110-1, 将第二次接收的处理请求传送至小服务程序服务器110-2,将第三次接收 的处理请求传送至小服务程序服务器110-3,将第四次接收的处理请求传 送至小服务程序服务器110-4。从第五次开始,返回原样,将处理请求传 送至小服务程序服务器110-1。小服务程序服务器no-i~4的各个是本发明的第一层级服务器的一例,具体地,例如是HTTP服务器等。并且,小服务程序服务器110-1~4 的各个,根据从调度装置100-1 2分配来的处理请求进行处理。在处理的 过程中,有时会需要调用预定的应用程序、对数据库进行访问等。在这样 的情况下,小服务程序服务器110-1-4的各个,对APP (应用)服务器 120-1~3或者DB服务器130进一步发送处理请求,使它们处理从外部的终 端装置请求的处理的至少一部分。APP服务器120-1 3的各个,是本发明 的第二层级服务器的一例,其根据从小服务程序服务器110-1 4接收的请 求,处理外部的终端装置所请求的处理的一部分。DB服务器130,可以在 处理的过程中从数据库135读取数据,或更新数据库135。此外,DB服务 器130也是第二层级服务器的一例。换句话说,在第二层级服务器中,除 了从小服务程序服务器接收直接请求的服务器之外,还包含经由另 一服务 器/装置(在此为APP服务器100-1-3 )间接地接收请求从而根据该请求处 理被请求的处理的一部分的服务器。系统监视装置140从在调度装置100-1-2、小服务程序服务器110-1-4、 APP服务器120-1~3以及DB服务器130的各个中工作的代理软件等,接 收表示这各个装置/服务器的状态的数据。举例来说,接收表示下列内容的 数据各个装置/服务器中的CPU的利用率、硬盘驱动器的访问频率等硬 件的工作状态,CPU、机箱的温度等物理状态等。并且,信息共享装置150 根据系统监视装置140所接收到的这各个数据,判断是否在信息系统10 所具有的某一种装置/服务器中发生了异常,并且将其判断结果通知给外 部,从而进行使发生了异常的装置/服务器停止等的处理。根据图1所示的信息系统10,考虑也能够监视信息系统10中的各装 置/服务器的状态,从而检测在信息系统IO中发生的异常。然而,有一种 情况是,利用这样的信息系统10的结构,不能够适宜地检测出以软件为主 要原因而发生的异常。举例来说,因为软件的设计等的不良而引起的死锁, 因为软件其本身仍如设计那样正常工作,所以不能够利用CPU的状态等 适宜地检测出其的发生。此外,除了原本所需的服务器/装置之外,由于系统监视装置140以及信息共享装置150也是需要的,所以即便其它服务器/ 装置均正常,也仍有可能因为系统监视装置140及信息共享装置150本身的异常而导致错误从而检测出系统异常。相对于此,根据将会在下面说明的信息系统IO,通过将用于检测异常 的机制组入到发送接收处理请求、处理响应等的机制中,能够不会对信息 系统10的原本的工作造成不良影响地检测各种不同种类的异常。以下,具体地进行说明。图2示出了本实施例的信息系统10的整体结构。与图l相同,信息系 统10包括调度装置100-1-2、小服务程序服务器110-1-4、 APP服务器 120-1-3、 DB服务器130、数据库135。然而,不同于图l所示的信息系统 10,图2的信息系统10不包括系统监视装置140以及信息共享装置150。 调度装置100-1 2、小服务程序服务器110-1-4、 APP服务器120-1 3、 DB 服务器130以及数据库135的各个中的处理的概要,与图1所示的相同。 然而,除了处理请求以及处理响应的发送接收之外,在各个服务器/装置中, 还进行用于检测异常的处理。此外,为了用于检测异常,各个服务器/装置 包括这样的机制在向另一服务器/装置发送处理请求之后,计测直到接收 到其处理响应为止的所需时间。图3示出了调度装置100-1的功能结构。调度装置100-1具有存储装 置300、传送单元310、表生成单元320、表发送单元330、第一表更新单 元340以及停止判断单元350。首先,对于这各部件与硬件资源的关系简 单地进行描述。存储装置300存储其他各部件所需的信息,其利用例如后 面描述的RAM 1020或硬盘驱动器1040来实现。传送单元310以及表发 送单元330进行信息的发送接收等,其通过使后面描述的CPU 1000及通 信接口 1030根据所安装的程序进行操作来实现。表生成单元320、第一表 更新单元340以及停止判断单元350进行信息的计算、处理以及条件判断, 其通过使后面描述的CPU IOOO根据所安装的程序进行操作来实现。存储装置300为了存储状态表而设置,该状态表表示各装置/服务器的 工作状态。所谓状态表,具体地,指表示小服务程序服务器110-1 4、 APP服务器120-1 3以及DB服务器130的各个的工作状态的表。此外,所谓 工作状态,是例如以下状态中的任意一种正常状态;虽然工作、但处理 需要大于等于阈值的时间的高负荷状态;不工作的异常状态;存在高负荷 状态的可疑性的疑高负荷状态;以及存在异常状态的可疑性的疑异常状 态。传送单元310,为了分配被请求的处理,将从外部的终端装置接收的 处理请求传送至从多个小服务程序服务器110-1 4中选择的一个小服务程 序服务器110。如同上面所描述的,小服务程序服务器的选择可以用轮询 调度方式来进行。表生成单元320接收包含于与所传送的处理请求相应的 处理响应内的、各APP服务器120-1~3以及DB服务器130的工作状态。在此,所谓包含在处理响应内而接收的工作状态,优选地,是表示小 服务程序服务器110-1 4向APP服务器120-1-3请求的处理的所需时间的 信息。换句话说,在传送单元310传送某处理请求A至小服务程序服务器 110-1,且接收到了其的小服务程序服务器110-1根据该请求A、向APP 服务器120-1发送了处理请求B的情况下,与该处理请求B相应的处理的 所需时间被包含在与处理请求A相对的处理响应A中而^皮接收。作为各工作状态的具体例子,例如,异常状态表示所需时间超过5秒; 高负荷状态表示所需时间超过2秒且少于或等于5秒;正常状态表示所需 时间少于或等于2秒。从表生成单元320接收的时间的观点出发,工作状 态可以是表示这样的所需时间的数值本身,也可以表示已经根据该数值而 判断出的各状态。此外,工作状态,除了是所需时间之外,也可以是表示 各服务器/装置中的处理的状态的其他指标值。作为指标值的一例,可以列举出处理的吞吐量、等待时间等。此外,表生成单元320也可以不接收与各处理有关的所需时间来作为工作状态,均来作为工作状态。并且,表生成单元320根据所接收的工作状态评价关 于APP服务器120-1-3及DB服务器130的各个的工作状态,生成表示所 评价的各工作状态的状态表,并存储于存储装置300。所谓工作状态的评价,可以是使用关于某APP服务器120接收到的工 作状态本身来作为该APP服务器120的工作状态的处理,也可以是当关于 同一 APP服务器120接收到了不同的多个工作状态时,根据这多个工作状 态确定单个工作状态的处理。进而,表生成单元320也可以根据从对小服 务程序服务器110-1 4的各个发送了处理请求之后直至接收到针对该处理 请求的处理响应为止的所需时间,来评价每个小服务程序服务器110的工 作状态,从而将其包含在其中地生成状态表。表发送单元330响应状态表的生成,从存储装置300读取所生成的该 状态表,并且发送至各个小服务程序服务器110-1 4。第一表更新单元340 响应接收到来自某一个小服务程序服务器110-1 4的状态表,利用所接收 的该状态表来更新已经存储在了存储装置300中的状态表。以在存储于存 储装置300中的状态表中,任何一个小服务程序服务器110的工作状态都 不是正常状态的情况为条件,停止判断单元350停止表生成单元320所进 行的工作状态的接收以及表发送单元330所进行的状态表的发送。此外,关于调度装置100-2所具有的各功能,由于与调度装置100-1 大致相同,所以省略说明。图4示出了小服务程序服务器110-1的功能结构。小服务程序服务器 110-1具有存储装置400、请求发送单元410、状态回送单元420、第二表 更新单元430以及表回送单元440。与调度装置100-1的情况相同,首先 描述与硬件资源的关联。存储装置400存储其他各部件所需的信息,其利 用例如后面描述的RAM 1020或硬盘驱动器1040来实现。请求发送单元 410以及表回送单元440进行处理响应等的发送接收,其通过使后面描述 的CPU IOOO及通信接口 1030根据所安装的程序进行操作来实现。状态回 送单元420以及第二表更新单元430进行信息的计算、处理以及条件判断,存储装置400为了存储状态表而设置,该状态表表示小服务程序服务 器110-1 4、 APP服务器120-1 3以及DB服务器130的各个的工作状态。 请求发送单元410响应于从调度装置(举例来说调度装置110-1)的存储装置300接收到处理请求的传送的情况,向APP服务器120-1-3或DB服 务器130 (以下称为APP服务器120-1等)发送处理请求,以使得APP 服务器120-1等处理被请求的处理的一部分。状态回送单元420将与请求 发送单元410已经发送至APP服务器120-1等的处理请求相对的处理响应 的状态,包含在与从调度装置100-1的存储装置300接收到了传送的处理 请求相对的处理响应内并回送至调度装置100-1,以作为该APP服务器 120-1的工作状态。在此,所谓处理响应的状态,举例来说,指从处理请求的发送开始直 至处理响应的接收为止的所需时间。换句话说,作为处理的一例,请求发 送单元410在发送了处理请求至APP服务器120-1时重置计时器,在接收 到了针对该处理请求的处理响应时参照该计时器的值,从而计测处理的所 需时间。并且,该所需时间成为该处理响应的状态。第二表更新单元430响应于从调度装置(举例来说,调度装置100-1 ) 的表发送单元330接收到状态表的情况,根据所接收的该状态表来更新已 经存储在存储装置400中的状态表。当没有状态表存储在存储装置400中 时,第二表更新单元430也可以将所接收的该状态表存储于存储装置400 中。响应于状态表的更新,表回送单元440将更新了的该状态表回送至各 个调度装置。回送目的地并不局限于对于第二表更新单元430的状态表的 发送源,而是直接连结至小服务程序服务器110-1的所有调度装置100。 再者,被回送的状态表可以包含在针对调度装置100-1 2的处理响应的消 息中从小服务程序服务器110-1-4发送。以上,如同参照图3及图4所说明的,在信息系统10中,调度装置 100以及小服务程序服务器IIO彼此发送状态表来相互反映其内容。由此, 便能够在调度装置100-1~2及小服务程序服务器110-1 4间适宜地共享各 服务器/装置的工作状态。通过根据各个服务器/装置所接收的多个状态表 更新已经存储的状态表,即使在处于正常状态的处理仅偶然地需要处理时 间的情况下,也能够防止错误地判断状态的情况。图5示出了存储装置300或存储装置400所存储的状态表的数据结构的一例。存储装置300及400的各个,与服务器ID对应地存储由该服务 器ID标识的服务器/装置的工作状态,作为状态表。此外,存储装置300 及400的各个进一步与状态表对应地存储版本ID,版本ID表示该状态表 的修改时间。此外,存储装置300及400,分别在调度装置100和小服务 程序服务器110中被独立地进行管理。作为具体例子,存储装置300,对于小服务程序服务器110-1这样的 服务器ID,对应地存储正常状态,作为该服务器的工作状态。另一方面, 存储装置300,对于APP服务器120-1这样的服务器ID,对应地存储疑高 负荷状态,作为该服务器的工作状态。此外,存储装置300,对于DB服 务器130这样的服务器ID,对应地存储正常状态,作为该服务器的工作状 态。版本ID能够标识修改的时间、顺序等,利用其,便可以判断状态表 更新的与否。具体如下。作为与存储装置300中的版本ID相关的处理,表生成单元320,每当 新生成状态表时,便与该状态表对应地生成版本ID并存储于存储装置300 中,版本ID指示出该状态表是在上一次生成的状态表之后修改而生成的。 举例来说,在版本ID作为整数值被进行管理的情况下,表生成单元320, 每当新生成状态表时,便使已经存储的版本ID递增并且存储于存储装置 300中。生成状态表的周期是例如每几分钟或每几秒钟等对于调度装置 100-1-2共同确定的。因此,虽然所生成的状态表的ID大致是同步的,但 因为并不进行用于在调度装置100-1 2间维持同步的处理,所以并不一定 是完全同步的。此外,表发送单元330,与版本ID对应地从存储装置300读取由表生 成单元320生成且存储在了存储装置300中的状态表,并且发送至各个小 服务程序服务器110-1-4。作为与存储装置400中的版本ID相关的处理, 第二表更新单元430,以与状态表对应地接收到的版本ID与存储于存储装 置400中的版本ID比较、指示着同时间或之后的时间的修改的情况为条 件,根据所接收的该状态表更新存储在存储装置400中的状态表。在此情 况下,第二表更新单元430将所接收的该版本ID与更新后的状态表对应地存储到存储装置400中。此外,表回送单元440,响应于状态表的更新,将更新后的该状态表 与对应于在更新中使用的状态表的版本ID对应起来,回送给各个调度装 置100。接收该回信,第一表更新单元340,以与状态表对应地接收到的版 本ID与存储在存储装置300中的版本ID比较、指示着同时间或之后的时 间的修改的情况为条件,利用所接收的该状态表来更新存储在存储装置 300中的状态表。如上面所述,通过使状态表与版本ID相对应地被进行管理,即使在 一部分状态表因通信流量的集中等而延迟达到的情况下,也仍可能仅选择 且参考最新的状态表。图6示出了调度装置100-1发送接收处理请求以及处理响应的处理的 具体例子。调度装置100-1例如定期地或每当接收到某一请求/响应时,进 行以下的处理。调度装置100-1,在从外部的终端装置接收到处理请求时 (S600:是),将该处理请求传送至从多个小服务程序服务器110-1~4中 选择的一个小服务程序服务器i10 (S610)。传送单元310,在接收到传 送来的与处理请求相对的处理响应时(S620:是),对外部的终端装置回 送该处理响应(S630)。接着,表生成单元320,根据该处理响应的消息生成状态表(S640)。 具体地,表生成单元320从该处理响应的消息中获得各个APP服务器 120-l 3及DB服务器130的工作状态,并根据所获得的该工作状态,评价 关于各个APP服务器120-1 3以及DB服务器130的各服务器/装置的工作 状态。此外,表生成单元320根据从传送处理请求开始直至接收到其处理 响应为止的所需时间,评价小服务程序服务器110-1~4的工作状态。将所 评价的工作状态包含于其中地生成状态表。新生成的状态表取代已经存储 在存储装置300中的状态表,被存储在存储装置300中。此外,版本ID 被递增。再者,工作状态的评价是基于包含于在过去的、预定的期间内接 收的多个处理响应中的工作状态的,也可以对于同一服务器/装置根据多个 工作状态进行评价。详细内容将在后面进行描述。此外,表生成单元320,表进行比较并且相同的情况下,也可以不利用新生成的状态表来更新存储装置300。在此情况下,后面说明的表 发送单元330可以不在S660发送状态表。接着,停止判断单元350判断应该停止状态表的发送接收的条件是否 满足(S650)。所谓应该停止的条件,例如是小服务程序服务器110-1~4 的任何一个的工作状态都并非正常状态的情况。其原因是,在这样的情况 下,在调度装置100-1 2与小服务程序服务器110-1-4之间不能够顺畅地 进行状态表的彼此传送。如果停止条件没有满足(S650:否),则表发送 单元330从存储装置300读取所生成的状态表并且对各个小服务程序服务 器110进行发送(S660)。如果停止条件满足(S650:是),则表发送单 元330不发送状态表,而转移到下一处理。此外,即便是在停止条件满足的情况下,停止判断单元350也可以以 条件满足后经过了预定的期间为条件,使由表生成单元320进行的工作状 态的接收及表发送单元330所进行的状态表的发送再开始。在再开始而停 止条件又立即满足的情况下,停止判断单元350停止工作状态的接收以及 状态表的发送,并等待比前述预定的期间更长的期间。在该期间经过后, 停止判断单元350使工作状态的接收以及状态表的发送再开始。以此方式, 通过依故障恢复的延迟而延长等待时间,能够尽可能减轻故障发生时的信 息系统10的负荷,从而促进从故障中的恢复。再者,第一表更新单元340判断是否从小服务程序服务器110-1 4接 收到了新的状态表(S670)。换句话说,第一表更新单元340,响应于从 某一小服务程序服务器110-1-4接收到状态表的情况,判断与该状态表对 应地接收到的版本ID是否与已存储在存储装置300中的版本ID比较、指 示同时间或之后的时间的修改。所谓指示同时间或之后的时间的修改,是以接收到新的状态表位条件(S670:是),第一表更新单元340利用所接 收的该状态表来更新存储在存储装置300中的状态表(S680)。此外,在进行生成新的状态表的处理的期间,在从小服务程序服务器110接收到状态表时,优选地,在表发送单元330发送新生成的状态表之 后,第一表更新单元340尝试更新状态表。依此方式,通过使基于处理的 所需时间进行的工作状态的评价优先进行,能够在整个信息系统10中使工 作状态的评价所用的所需时间等信息增加,因此能够提高工作状态的评价 的准确度。图7示出了 S640中的处理的详细的例子。参照图7,说明根据传送单 元310所接收的处理响应的消息,表生成单元320评价各装置/服务器的工 作状态的处理的细节。表生成单元320接收包含于在过去的预定时间内从 小服务程序服务器110-1-4接收的多个处理响应中的、各服务器/装置的工 作状态,并且对所接收的工作状态进行总计(S700)。具体的处理的一例 将在下面描述。首先,表生成单元320对于各处理响应进行以下的处理。表生成单元时间。这是通过在表生成单元320中在发送处理请求时重置计时器,且在 接收处理响应时参考该计时器来实现的。将此时间设定为时间A。此外, 表生成单元320从该处理响应的消息中,获得小服务程序服务器110响应 于该处理请求而向APP服务器120请求的处理的所需时间。将此时间设定 为时间B。然后,表生成单元320通过从时间A减去时间B,来计算小服 务程序服务器110中的处理的所需时间。在伴随着该处理请求,APP服务器120对DB服务器130进一步请求 了处理的情况下,表生成单元320进一步从消息中获得该所需时间。将此 时间设定为时间C。在此情况下,表生成单元320通过从小服务程序服务 器110中所计测的所需时间B减去该时间C,来计算APP服务器120中 的处理的所需时间。以此方式,表生成单元320对于从某一处理请求衍生 地被依次请求的多个处理的各个,计算其所需时间。所需时间以前述的5 秒及2秒为阈值,被转换为工作状态的信息。表生成单元320对于上述的 在过去的预定时间内接收的各个处理响应,进行以上的处理。然后,表生 成单元320对于小服务程序服务器110-1 4、 APP服务器120-1-3及DB服务器130的各个,对以这种方式判断的工作状态进行总计。接着,表生成单元320对于各个小服务程序服务器110-1 4,判断对 于该小服务程序服务器110总计的工作状态的某一个是否指示着高负荷状 态或异常状态(S710)。对于某一小服务程序服务器110,以所总计的工 作状态的某一个指示着高负荷状态或异常状态为条件(S710:是),停止 判断单元350判断为应该停止状态表的发送接收的条件满足(S720),并 结束本图的处理。在此情况下,表生成单元320也可以不生成状态表。接着,表生成单元320对于APP服务器120-1~3及DB服务器130的 各个(以下,将处理的对象称为该服务器),进行以下的处理(S730)。 表生成单元320,以关于该服务器所接收到的工作状态中,指示着该服务 器正常的工作状态的比例是预定的基准值(N)的情况为条件(S740:是), 评价为该服务器处于正常状态(S750)。优选地,该基准值(N)为大于 0的极小值。这是因为,在服务器中一旦发生异常时,以下的处理有进一 步延迟的倾向,并且甚至状况都罕能会暂时地改善。换句话说,是因为, 当仅观测到能够判断为正常的处理时,很难考虑到处理是在异常状态下碰 巧正常地完成的,而是很自然地考虑到是在正常状态下碰巧其他处理在占 用时间这种情况。因此,只要包含一个指示正常状态的工作状态,表生成 单元320便可以评价为该服务器处于正常状态。在未被评价为正常状态的情况下(S740),接着,表生成单元320判 断关于该服务器所接收到的工作状态中,指示着该服务器高负荷的工作状 态的比例是否大于等于预定的基准值(K) (S760)。以大于等于基准值 (K)的情况为条件(S760:是),表生成单元320评价为该服务器处于 高负荷状态(S770)。优选地,该基准值(K)也是大于0的极小值,只 要包含一个指示高负荷状态的工作状态,即使其他的工作状态全部指示异 常状态,表生成单元320也可以判断为该服务器处于高负荷状态。以指示 处于高负荷的工作状态的比例小于基准值(K)的情况为条件(S760:否), 表生成单元320判断为该服务器处于疑异常状态(S780 )。表生成单元320 对于APP服务器120-1 3及DB服务器130的各个重复以上的处理。图8示出了小服务程序服务器110-1发送接收处理请求以及处理响应 的处理的具体例子。请求发送单元410,响应于从调度装置(举例来说, 调度装置100-1)的存储装置300接收到处理请求的传送的情况(S800: 是),为了使APP服务器120-1 3等处理所请求的处理的一部分,发送处 理请求至APP服务器120-1等(S810)。举例来说,设定发送目的地为 APP服务器120-1。当请求发送单元410接收到与已经传送至APP服务器 120-1的处理请求相对的处理响应时(S820,是),状态回送单元420获 得该处理响应的状态,作为该APP服务器120-1的工作状态(S830)。举 例来说,可从APP服务器120-1获得从处理请求至处理响应的所需时间。 并且,状态回送单元420将APP服务器120-1的工作状态包含在与从调度 装置100-1的存储装置300传送的处理请求相对的处理响应内,回送至该 调度装置100-1 ( S840 )。接着,第二表更新单元430判断是否从调度装置(举例来说调度装置 100-1)接收到新的状态表(S850)。换句话说,响应于从调度装置100-1 接收到状态表的情况,以与该状态表对应地接收的版本ID与已经存储在 存储装置400中的版本ID比较、指示着同时间或之后的时间的修改的情 况为条件,第二表更新单元430判断为接收到新的状态表。以接收到新的 状态表的情况为条件(S850:是),第二表更新单元430根据所接收的该 状态表,更新存储在存储装置400中的状态表(S860)。由于状态表的更 新以此方式、在每当接收到状态表时进行,所以从调度装置100-1~2的各 个接收到的状态表的信息被综合地反映在存储装置400的状态表中。接着, 表回送单元440便回送更新了的该状态表至调度装置100-1 2的各个 (S870)。图9是在S860中顺序更新的工作状态的状态转移图。第二表更新单 元430按照图9所示的状态转换图来更新在状态表中进行管理的APP服务 器120-1 3与DB服务器130的各工作状态。具体来说,以作为处理对象 的服务器的工作状态,在已经存储于存储装置400中的状态表中不是正常 状态,并且在从调度装置100的表发送单元330接收到的状态表中是正常状态的情况为条件,第二表更新单元430将该服务器的工作状态更新为正 常状态。换句话说,以接收到正常状态的情况为条件,高负荷、异常、疑 高负荷或者疑异常状态中的任何一种状态都被更新为正常状态。此外,以作为处理对象的服务器的工作状态,在已经存储于存储装置 400中的状态表中是正常状态,并且在从小服务程序服务器110的表发送二表更新单元430将该服务器的工作状态更新为疑异常状态。换句话说, 尽管接收到了异常状态,但第二表更新单元430也不立即判断为异常状态。 并且,以在将工作状态更新为疑异常状态之后、经过了预定的期间工作状 态都未返回至正常状态的情况为条件,第二表更新单元430将该工作状态 更新为异常状态。再者,以作为处理对象的服务器的工作状态,在已经存储于存储装置 400中的状态表中是正常状态,并且在从小服务程序服务器110的表发送 单元330接收到的状态表中是高负荷状态的情况为条件,第二表更新单元 430将该服务器的工作状态更新为疑高负荷状态。换句话说,尽管接收到 了高负荷状态,但第二表更新单元430也不立即判断为高负荷状态。并且, 以在将工作状态更新为疑高负荷状态之后、经过了预定的期间工作状态都 未返回至正常状态的情况为条件,第二表更新单元430将该工作状态更新 为高负荷状态。图IO示出了由本实施例的信息系统IO顺序更新工作状态的过程。在 此,为了便于说明,设定信息系统10包括调度装置100-1-2、小服务程序 服务器110-1以及APP服务器120-1-3,而没有包括小服务程序服务器 110-2以及DB服务器130。此外,在表中将APP服务器120-1-3分别表示 为A C。再者,将版本ID的初始值设定为0。换句话说,所有的服务器/ 装置中的存储装置都存储了数值0作为版本ID。此外,设定状态表包含 APP服务器120-1 3的工作状态,而没有包含小服务程序服务器110-1-2 的工作状态。在初始状态、即时间O的时刻,调度装置100-1的存储装置300存储有一状态表,该状态表中将APP服务器120-1 3的各个的工作状态皆设定 为正常状态。将此状态表表示为A、 B、 C。对于调度装置100-2的存储装 置300及小服务程序服务器110-1的存储装置400也是同样。在时间0的 下一时间1,表生成单元320判断为APP服务器120-3的工作状态为疑异 常状态。举例来说,这是因为在固定期间内接收到来自调度装置100-1的 请求而在APP服务器120-1中执行的处理的任何一个,都需要应该被判断 为异常状态的所需时间。将此时的状态表的状态表示为A、 B、 C (-)。 符号"-"表示异常状态,而符号"(-)"则表示疑异常状态。在此时刻, 调度装置100-1的存储装置300中的版本ID递增,从而变为1。然而,由 于小服务程序服务器110-1中的版本ID仍然为0,所以在图中将版本ID 表示为0。在时间2,小服务程序服务器110-1的第二表更新单元430从调度装 置100-1的表发送单元330接收到状态表。在已经存储在存储装置300中 的状态表中,APP服务器120-3处于正常状态,但是在所接收到的状态表 中,APP服务器120-3处于疑异常状态。因此,小服务程序服务器110-1 的第二表更新单元430更新工作状态为疑异常状态。因此,小服务程序服 务器110-1中的状态表也成为A、 B、 C(-)。此外,在相同的时间2,调度装置100-2的表生成单元320,与调度装 置100-1相比稍迟地、独立于调度装置100-1地生成状态表。此时,表生 成单元320判断为APP服务器120-2的工作状态为疑异常状态。举例来说, 这是因为在固定期间内接收到来自调度装置100-2的请求而在APP服务器 120-2中执行的处理的任何一个,都需要应该被判断为异常状态的所需时 间。作为结果生成的状态表是A、 B (-) 、 C。在此时刻,在所有的调度 装置100-1 2及小服务程序服务器110-1中,版本ID都变成1。在时间3,小服务程序服务器110-1的表回送单元440传送状态表至 调度装置100-1及调度装置100-2。在调度装置100-1中,由于已存储的状 态表与所接收的状态表相同,所以不执行任何处理。在调度装置100-2中, 由于已存储的状态表及所接收的状态表中的版本ID同是1从而相等,所以第一表更新单元340利用所接收的状态表更新已存储的状态表。举例来 说,利用所接收的状态表来置换已存储的状态表。其结果,在调度装置100-2 的存储装置300中,状态表为A、 B、 C(-)。在时间4,调度装置100-2的表生成单元320再次判断为APP服务器 120-2的工作状态为疑异常状态。这是因为在下一个固定期间内也接收到 来自调度装置100-2的请求而在APP服务器120-2中执行的处理的任何一 个,都需要应该被判断为异常状态的所需时间。作为结果生成的状态表是 A、 B (-) 、 C。此外,所生成的版本ID为2。接着,在下一个时间5, 调度装置100-2的表发送单元330传送所生成的该状态表至小服务程序服 务器110-1。小服务程序服务器110-1的第二表更新单元430,因为所接收到的版 本ID是2,比已存储的版本ID、即1大,所以利用所接收的该状态表来 更新已存储的状态表。关于APP服务器120-2,因为已存储的工作状态是 正常状态,而所接收的工作状态为疑异常状态,所以笫二表更新单元430 将APP服务器120-2的工作状态更新为疑异常状态。关于APP服务器 120-3,因为已存储的工作状态是疑异常状态,而所接收的工作状态为正常 状态,所以第二表更新单元430将APP服务器120-3的工作状态更新为正 常状态。其结果,状态表成为A、 B (-) 、 C。在下一个时间6.小服务程序服务器110-1的表回送单元440回送更 新了的状态表至调度装置100-1 2的各个。在调度装置100-2中,因为已 存储的状态表及所接收的状态表相同,所以第一表更新单元340不执行任 何处理。另一方面,小服务程序服务器110-1因为接收到与已存储的状态 表不同的状态表A、 B(-) 、 C,并且版本ID也指示着同时间的修改,所 以利用所接收的该状态表来置换已存储的状态表。在下一时间7及8,调度装置100-1 2的表生成单元320评价APP服 务器120-1~3的工作状态,但是由于与评价前是相同状态,所以图10中的 标记没有变化。同样,小服务程序服务器110-1的第二表更新单元430从 调度装置100-1-2接收状态表,但是由于与已经存储的状态表相同,所以图10中的标记没有变化。在时间9,小服务程序服务器110-1的第二表更新单元430,因为在将 APP服务器120-2的工作状态更新至疑异常状态之后经过了预定的时间, 所以将APP服务器120-2的工作状态更新为异常状态。此更新的工作状态 包含在状态表中被回送至调度装置100-1-2。其结果,状态表成为A、 B-、 C。在时间10,调度装置100-1-2的第一表更新单元340利用接收到的状 态表来更新已经存储的状态表。其结果,状态表成为A、 B-、 C。图11示出了作为调度装置100-1或小服务程序服务器110-1发挥作用 的信息处理装置500的硬件结构的一例。信息处理装置500包括CPU外 围单元、输入输出单元以及传统输入输出单元,其中CPU外围单元包括 通过主控制器1082互相连接的CPU 1000、RAM 1020及图形控制器1075, 输入输出单元包括通过输入输出控制器1084连接至主控制器1082的通信 接口 1030、硬盘驱动器1040及CD-ROM驱动器1060。传统输入输出单 元包括连接至输入输出控制器1084的ROM 1010、软盘驱动器1050以及 输入输出芯片1070。主控制器1082将RAM 1020与以较高传输速率访问RAM 1020的 CPU 1000及图形控制器1075相连接。CPU 1000根据存储在ROM 1010 及RAM 1020中的程序来工作,进行各单元的控制。图形控制器1075获 取CPU 1000等在设置于RAM 1020内的帧緩沖器上生成的图像数据,并 且使其显示在显示装置1080上。代之,图形控制器1075也可将存储CPU IOOO等生成的图像数据的帧緩沖器包含在其内部。输入输出控制器1084将主控制器1082与作为相对高速的输入输出装 置的通信接口 1030、石更盘驱动器1040以及CD-ROM驱动器1060相连接。 通信接口 1030经由网络与外部的装置通信。硬盘驱动器1040存储信息处 理装置500所使用的程序及数据。CD-ROM驱动器1060从CD-ROM 1095 读取程序或数据,并且提供给RAM 1020或;更盘驱动器1040。此外,在输入输出控制器1084上,连接有ROM 1010、软盘驱动器 1050、输入输出芯片1070等相对低速的输入输出装置。ROM 1010存储在信息处理装置500的启动时CPU IOOO所执行的引导程序、依赖于信息处 理装置500的硬件的程序等。软盘驱动器1050从软盘IO卯读取程序、数 据等,并且经由输入输出芯片1070提供给RAM 1020或硬盘驱动器1040。 输入输出芯片1070连接软盘1090、经由例如并行端口、串行端口、键盘 端口、鼠标端口等连接各种输入输出装置。要提供给信息处理装置500的程序,由使用者存储在软盘1090、 CD-ROM 1095或IC卡等记录介质中来提供。程序经由输入输出芯片1070 以及/或者输入输出控制器1084从记录介质^^皮读出,并且被安装在信息处 理装置500上来执行。由于程序使信息处理装置500等工作从而使其执行 的操作,与在图1至图10中所说明的调度装置100-1以及小服务程序服务 器110-1的操作相同,所以省略说明。此外,对于调度装置100-2及小服 务程序服务器110-2 4的操作/硬件结构,因为与图11所示的信息处理装 置500大致相同,所以省略说明。以上所示的程序,也可以存储在外部的存储介质中。作为存储介质, 除了软盘10卯、CD-ROM 1095之外,还能够使用DVD、 PD等光学记录 介质、MD等光磁记录介质、带介质、IC卡等半导体存储器等。此外,也 可以使用在连接到了专用通信网络、因特网等的服务器系统中设置的硬盘 或者RAM等存储装置作为记录介质,经由网络将程序提供至信息处理装 置500。如上所述,根据本实施例的信息系统IO,由于能够使工作状态包含在 处理请求/处理响应等的消息中来进行发送接收,所以除了原本所需的装置 /服务器之外,不需要额外的装置,并且能够检测包含了源自软件的故障的 宽范围种类的故障。此外,即便在如某一服务器A向另一服务器B请求处 理,且服务器B进而向服务器C请求处理这样调用关系为层级性的情况下, 也能够精确地判断故障发生位置。进而,通过在调度装置IOO与小服务程 序服务器110之间交换工作状态的评价结果,能够改正错误的评价、暂时 性的评价的错误等。举例来说,能够避免错误地将由于Java (注册商标) 的GC等而暂时延迟的处理判断为故障的情况,能够提高工作状态评价的精确性。以上,使用实施例对本发明进行了说明,但是本发明的技术范围并不 限于在上述实施例中记载的范围。对于本领域技术人员来说很明显的是, 可以对上述实施例加以多种变形或改进。从权利要求的范围的记载可以看 出,加以了这样的变形或改进而得到的方式也包含在本发明的技术范围 中。
权利要求
1.一种系统,其包括分配从外部的终端装置请求的处理的多个调度装置、进行所分配的相应处理的多个第一层级服务器以及响应于从第一层级服务器接收的请求而进行相应处理的一部分的至少一个第二层级服务器,其中各个上述调度装置包括存储装置,其用于存储指示各个第二层级服务器的工作状态的状态表;传送单元,其将从外部的终端装置接收的处理请求传送至从上述多个第一层级服务器中选择的一个第一层级服务器,以便分配所请求的处理;表生成单元,其接收包含在与所传送的上述处理请求对应的处理响应中的各个上述第二层级服务器的工作状态,并根据所接收的工作状态评价每一第二层级服务器的工作状态,从而生成指示每一第二层级服务器的工作状态的状态表,并存储在存储装置中;表发送单元,其响应于上述状态表的生成,从存储装置中读出所生成的上述状态表,并发送至各个上述第一层级服务器;以及第一表更新单元,其响应于来自任意一个第一层级服务器的状态表的接收,利用所接收的上述状态表更新存储在存储装置中的上述状态表;各个上述第一层级服务器包括存储装置,其用于存储指示各个第二层级服务器的工作状态的状态表;请求发送单元,其响应于从调度装置的传送单元接收到处理请求的传送的情况,向第二层级服务器发送处理请求,以使第二层级服务器处理所请求的处理的一部分;状态回送单元,其将与发送至第二层级服务器的上述处理请求相对的处理响应的状态,作为该第二层级服务器的工作状态,包含在与从调度装置的传送单元接收到的处理请求相对的处理响应内,回送至该调度装置;第二表更新单元,其响应于从调度装置的表发送单元接收到状态表的情况,根据所接收的该状态表,更新已经存储在存储装置中的状态表;以及表回送单元,其响应于状态表的更新,回送更新后的上述状态表至各个上述调度装置。
2. 如权利要求l所述的系统,其中调度装置以及第一层级服务器的各个中的存储装置,进一步与状态表 对应地存储版本ID,版本ID指示该状态表的修改时间;上述表生成单元,在每当新生成状态表时,与该状态表对应地生成版 本ID,并且存储于存储装置中,该版本ID指示该新状态表是与上一次生 成的状态表相比通过之后的修改而生成的;上迷表发送单元,与版本ID对应地从存储装置读出所生成的状态表, 并发送至各个上述第 一层级服务器;上述第二表更新单元,以与状态表对应地接收到的版本ID与存储于 存储装置中的版本ID比较、指示同时间或之后的时间的修改的情况为条 件,根据所接收的该状态表更新存储在存储装置中的上述状态表,进而将 所接收到的该版本ID与更新后的该状态表对应地存储在存储装置中;上述表回送单元,响应于状态表的更新,将更新后的该状态表,与对 应于在更新中使用的状态表的版本ID对应地回送至各个调度装置;第一表更新单元,以与状态表对应地接收到的版本ID与存储于存储 装置中的版本ID比较、指示同时间或之后的时间的修改的情况为条件, 利用所接收的该状态表更新存储在存储装置中的上述状态表。
3. 如权利要求l所述的系统,其中上述状态回送单元,在与从调度装置的传送单元接收的处理请求相对 的处理响应中,包含指示与该处理请求对应地向第二层级服务器请求的处 理的所需时间的信息,作为上述工作状态,回送至该调度装置;上述表生成单元,从上述一个第一层级服务器,接收包含在与对该一 个第一层级服务器传送的上述处理请求相对的处理响应内的、与该处理请求对应的处理的所需时间,作为上述工作状态。
4. 如权利要求l所述的系统,其中上述表生成单元,进一步根据从对各个上述第一层级服务器发送处理 请求之后直至接收到针对于该处理请求的处理响应为止的所需时间,评价 每一第一层级服务器的工作状态,并且将工作状态包含于其中地生成上述 状态表;上述调度装置进一步包括停止判断单元,该停止判断单元以在所生成 的上述状态表中,任意一个上述第一层级服务器的工作状态都不是正常状 态的情况为条件,使上述表生成单元所进行的工作状态的接收以及上述表 发送单元所进行的状态表的发送停止。
5. 如权利要求l所述的系统,其中第二层级服务器的工作状态是以下状态中的任意一种正常状态;虽 然工作、但处理需要大于等于阈值的时间的高负荷状态;以及不工作的异 常状态;上述表生成单元,关于同一第二层级服务器接收多个上述工作状态, 并且对于每一第二层级服务器,以在关于该第二层级服务器接收的上述工 作状态中、指示该第二层级服务器正常的工作状态的比例大于等于预定的 基准值的情况为条件,评价为该第二层级服务器处于正常状态。
6. 如权利要求5所述的系统,其中上述表生成单元,对于未被评价为处于正常状态的第二层级服务器的 各个,以在关于该第二层级服务器所接收的上述工作状态中、指示该第二 层级服务器处于高负荷的工作状态的比例大于等于预定的基准值的情况 为条件,评价为该第二层级服务器处于高负荷状态。
7. 如权利要求l所述的系统,其中第二层级服务器的工作状态是以下状态中的任意一种正常状态;虽 然工作、但处理需要大于等于阈值的时间的高负荷状态;不工作的异常状 态;存在高负荷状态的可疑性的疑高负荷状态;以及存在异常状态的可疑 性的疑异常状态;上述第二表更新单元,对于每一第二层级服务器,以该第二层级服务 器的工作状态,在已经存储于存储装置中的状态表中不是正常状态,并且 在从调度装置的表发送单元接收到的状态表中是正常状态的情况为条件, 将该第二层级服务器的工作状态更新为正常状态。
8. 如权利要求7所迷的系统,其中上迷第二表更新单元,对于每一第二层级服务器,以该第二层级服务 器的工作状态,在已经存储于存储装置中的状态表中是正常状态,并且在 从调度装置的表发送单元接收到的状态表中是异常状态或疑异常状态的 情况为条件,将该第二层级服务器的工作状态更新为疑异常状态,进而, 以在将工作状态更新为疑异常状态之后、经过了预定的期间都未返回至正 常状态的情况为条件,将该工作状态更新为异常状态。
9. 如权利要求7所述的系统,其中上述第二表更新单元,对于每一第二层级服务器,以该第二层级服务 器的工作状态,在已经存储于存储装置中的状态表中是正常状态,并且在 从调度装置的表发送单元接收到的状态表中是高负荷状态的情况为条件, 将该第二层级服务器的工作状态更新为疑高负荷状态,进而,以在将工作状态更新为疑高负荷状态之后、经过了预定的期间都未返 回至正常状态的情况为条件,将该工作状态更新为高负荷状态。
10. —种管理工作状态的方法,其在以下的系统中管理工作状态,该 系统包括分配从外部的终端装置请求的处理的多个调度装置、进行所分配 的相应处理的多个笫 一层级服务器以及响应于从第 一层级服务器接收的 请求而进行相应处理的一部分的至少一个第二层级服务器,并且各个上述 调度装置包括用于存储指示各个第二层级服务器的工作状态的状态表的 存储装置,各个第一层级服务器包括用于存储指示各个第二层级服务器的 工作状态的状态表的存储装置,其中,该方法在作为调度装置发挥作用的各个计算机中包括 利用传送单元,将从外部的终端装置接收的处理请求传送至从上述多 个第一层级服务器中选择的一个第一层级服务器,以便分配所请求的处理;利用表生成单元,接收包含在与所传送的上述处理请求对应的处理响 应中的各个上述第二层级服务器的工作状态,并根据所接收的工作状态评 价每一第二层级服务器的工作状态,从而生成指示每一第二层级服务器的 工作状态的状态表,并存储在存储装置中;利用表发送单元,响应于上述状态表的生成,从存储装置中读出所生 成的上述状态表,并发送至各个上述第一层级服务器;以及利用第一表更新单元,响应于来自任意一个第一层级服务器的状态表 的接收,利用所接收的上述状态表更新存储在存储装置中的上述状态表;在作为第一层级服务器发挥作用的各个计算机中包括利用请求发送单元,响应于从调度装置的传送单元接收到处理请求的 传送的情况,向第二层级服务器发送处理请求,以使第二层级服务器处理 所请求的处理的一部分;利用状态回送单元,将与发送至第二层级服务器的上述处理请求相对 的处理响应的状态,作为该第二层级服务器的工作状态,包含在与从调度 装置的传送单元接收到的处理请求相对的处理响应内,回送至该调度装 置;利用第二表更新单元,响应于从调度装置的表发送单元接收到状态表的情况,根据所接收的该状态表,更新已经存储在存储装置中的状态表; 以及利用表回送单元,响应于状态表的更新,回送更新后的上述状态表至 各个上述调度装置。
11. 一种程序,其使多个信息处理装置作为以下的系统发挥作用,该 系统包括分配从外部的终端装置请求的处理的多个调度装置、进行所分配 的相应处理的多个第一层级服务器以及响应于从第一层级服务器接收的 请求而进行相应处理的一部分的至少一个第二层级服务器,其中,该程序使各个信息处理装置作为包括以下部分的调度装置发挥作用存储装置,其用于存储指示各个第二层级服务器的工作状态的状态表;传送单元,其将从外部的终端装置接收的处理请求传送至从上述多个第一辰级月良分^T迅伴的一zi、矛一辰议月良分^,以i史分配尸/p^承的处埋;表生成单元,其接收包含在与所传送的上述处理请求对应的处理响应 中的各个上述第二层级服务器的工作状态,并根据所接收的工作状态评价 每一第二层级服务器的工作状态,从而生成指示每一第二层级服务器的工 作状态的状态表,并存储在存储装置中;表发送单元,其响应于上述状态表的生成,从存储装置中读出所生成 的上述状态表,并发送至各个上述第一层级服务器;以及第一表更新单元,其响应于来自任意一个第一层级服务器的状态表的 接收,利用所接收的上述状态表更新存储在存储装置中的上述状态表;使其他的各个信息处理装置作为包括以下部分的第一层级服务器发 挥作用存储装置,其用于存储指示各个第二层级服务器的工作状态的状态表;请求发送单元,其响应于从调度装置的传送单元接收到处理请求的传 送的情况,向第二层级服务器发送处理请求,以使第二层级服务器处理所 请求的处理的一部分;状态回送单元,其将与发送至第二层级服务器的上述处理请求相对的 处理响应的状态,作为该第二层级服务器的工作状态,包含在与从调度装 置的传送单元接收到的处理请求相对的处理响应内,回送至该调度装置;第二表更新单元,其响应于从调度装置的表发送单元接收到状态表的 情况,根据所接收的该状态表,更新已经存储在存储装置中的状态表;以 及表回送单元,其响应于状态表的更新,回送更新后的上述状态表至各 个上述调度装置。
全文摘要
本发明精确地检测在系统中产生的故障。本发明提供一种系统,其包括调度装置、多个第一层级服务器、至少一个第二层级服务器。各调度装置将从外部的终端装置接收的处理请求传送至一个第一层级服务器;接收包含在与所传送的该处理请求对应的处理响应中的各个第二层级服务器的工作状态,并根据所接收的工作状态生成指示每一第二层级服务器的工作状态的状态表;以及将状态表发送至各第一层级服务器。此外,利用从任意一个第一层级服务器接收的状态表,更新已经存储的状态表。
文档编号G06F11/34GK101568905SQ20078004831
公开日2009年10月28日 申请日期2007年12月26日 优先权日2006年12月27日
发明者堀井洋, 山本学, 田井秀树 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1