通过单一管理模块简化逻辑节点的管理的设备、系统和方法

文档序号:6649847阅读:504来源:国知局
专利名称:通过单一管理模块简化逻辑节点的管理的设备、系统和方法
技术领域
本发明涉及数据存储计算机系统。具体地说,本发明涉及通过单一管理模块简化(facilitate)逻辑节点的管理的设备、系统和方法。
背景技术
计算机和信息技术在其能力和复杂性方面不断进步和发展。特别地,数据存储系统不断发展,以满足不断增大的对物理数据存储系统及其硬件、软件和各种其它组件的可靠性、可用性和可服务性的需求。数据存储系统通常处理紧要使命数据。从而,根据24/7时间表,数据存储系统应该保持在线并且可用。此外,数据存储系统应该处理停电和服务中断,硬件和软件故障,甚至日常系统维护,而不会显著损害处理来自主机的数据输入/输出(I/O)的可靠性和可用性。
图1图解说明常规的数据存储系统100。系统100包括通过网络106,比如存储区域网(SAN)106,与存储子系统104连接的一个或多个主机102。主机102向存储子系统104传送数据I/O。主机102在本领域中众所周知,包含配置成向存储子系统104传送数据I/O的任何计算机系统。
适合于供本发明使用的存储子系统104的一个例子是可从Armonk,New York的国际商用机器公司(IBM)获得的IBMEnterprise Storage Server。为了提供可靠性、可用性和冗余性,存储子系统104包括通过独立的通道与SAN 106连接的多个主机适配器(未示出)。主机适配器108可支持高速通信协议,比如光纤通道。当然,各种其它主机适配器108可被用于支持其它协议,包括(但不限于)因特网小型计算机接口(iSCSI),IP光纤通道(FCIP),企业系统连接(ESCON),InfiniBand和以太网。存储子系统104利用一个或多个大容量存储设备108,例如(但不限于)直接存取存储设备、磁带存储设备等,存储和取回(retrieve)数据。
随着硬件成本的下降,由于包括冗余的硬件和硬件子系统,数据存储系统100已变得更复杂。通常,硬件组件对故障非常敏感。从而,存储子系统10可包括一个或多个处理器,电子存储装置,主机适配器等。
一般来说,为了最有效地利用冗余硬件,硬件被明确分配或者在多个逻辑节点110之间共用。逻辑节点110代表存储子系统104的计算硬件资源的分配,以致每个逻辑节点110能够独立于另一逻辑节点110执行操作系统(OS)112。另外,每个逻辑节点110运行一组独立的应用114。逻辑节点110表现为主机102的独立物理计算系统。
协调模块116(也称为“管理程序”(PHYP)116)协调两个或更多规定的逻辑节点110之间专用和共用硬件资源的使用。可用专用处理器上的固件实现PHYP 116。一般来说,逻辑节点110共用存储器。PHYP116可确保逻辑节点110不访问存储器的不适当扇区。
把存储子系统104分成多个逻辑节点110使可靠性更高。如果由于软件或硬件问题,一个逻辑节点110崩溃/发生故障,那么一个或多个其它逻辑节点110可被用于继续或者重新开始崩溃的逻辑节点110正在执行的任务。
多个逻辑节点110的管理和控制是一项挑战。任何管理、控制、维护、监视、故障排除或服务操作应与恒定不变的I/O处理相协调,以致不损害存储子系统104的24/7可用性。一般来说,管理控制台118通过和I/O通道分离的控制通信(这里称为“带外通信”)管理存储子系统104。
存储子系统104可包括用于带外通信的网络适配器,例如以太网卡。管理控制台118可包括独立的计算机系统,例如执行独立的OS和一组管理应用程序的工作站。管理控制台118允许管理员与PHYP116面接,从而启动(创建)、停止和配置逻辑节点110。
不幸的是,管理控制台118的管理能力严重受限。具体地说,逻辑节点110完全独立和不相干。从而,为了管理多个逻辑节点110,例如设置存储空间限额,管理员必须分别登录到每个节点110,实现所述变化,随后退出。该过程非常冗长乏味,并且随着操作中涉及的逻辑节点110的数目的增大,会导致错误。由于在每个节点110上,可能存在不同的OS 112和/或存储应用114,因此这样的管理任务变得复杂。从而,管理员可能不得不对每个节点110使用不同的命令集和不同的参数。
在节点110可能高度一致,并且在配置方面只存在诸如名称之类的较小差别的存储子系统104中,这种变化的重复性被加剧。单独管理节点110可能需要大量的时间和费用。另外,管理员可能是唯一了解两个类似的节点110将被类似配置的人,因为在节点110之间不存在内部关系。
此外,管理控制台118提供很少的管理命令。一般来说,管理控制台118局限于启动(创建)、停止和配置逻辑节点110本身的命令。管理控制台118不能允许管理员向一个或更多逻辑节点110的OS 112或应用114发送管理命令。相反,管理员必须登录到每个节点,手动关闭应用114,随后手动关闭OS 112。然后,管理员能够停止节点110,以便执行一些维护操作。管理控制台118还不能同时向一个以上的节点110发送管理命令,与两个或更多的节点110是否共有关系无关。
管理控制台118按照惯例只控制单个存储子系统104的节点。为了控制多个存储子系统104(这在现代企业系统中常见),管理员必须单独登录到每个节点110,并且可能不得不物理移动到不同的管理控制台118,以便完成管理操作。大量必须单独管理的节点110限制了管理员的效率。另外,独立的节点110使自动化的管理工具更难以实现和配置。
根据上面的说明,显然需要一种通过单个管理模块,简化逻辑节点的管理的设备、系统和方法。有利地,这样的设备、系统和方法可提供管理和控制根本不同的节点110以及节点110的OS 112和应用程序114的公共命令集。另外,所述设备、系统和方法支持节点110之间的关系,从而发送给一个节点110的管理命令自动在共有该关系的所有节点上被实现。此外,所述设备、系统和方法支持从单个管理模块管理多个硬件平台,例如存储子系统104。每个平台可包括一个或多个逻辑节点110。

发明内容
鉴于本领域的现有状态,特别是鉴于本领域中还未被满足的通过单一管理模块,简化逻辑节点的管理的问题和需要,做出了本发明。因此,做出了本发明,以便提供一种通过单一管理模块,简化逻辑节点的管理的设备、系统和方法,其克服了现有技术中的许多或全部上述缺陷。
根据本发明的设备包括通信模块,转换模块和定向模块(directionmodule)。通信模块有选择地把管理命令从单一管理模块传递给一个或多个逻辑节点。对于每个逻辑节点来说,管理命令是相同的。两个或更多的逻辑节点可被联系起来,以便提供专用于每个逻辑节点的硬件的冗余。在一个实施例中,通信模块自动把管理命令传送给每个逻辑节点。
转换模块把管理命令转换成一个或多个功能上等同的软件层命令。软件层命令由一个或多个逻辑节点的软件层之一识别。另外,软件层命令被配置成适合每个逻辑节点的兼容性要求。例如,根据接收软件层命令的逻辑节点,转换模块提供恰当的软件层命令语法和语义。定向模块根据管理命令范围(scope),把一个或多个软件层命令引向恰当的一个或多个软件层。在一个实施例中,软件层包含至少一个应用层、系统层和固件层。管理范围确定管理命令被引向什么层。
在一个实施例中,一个或多个逻辑节点包含对等域中的至少一对逻辑节点,以致该对逻辑节点中的第一逻辑节点镜像该对逻辑节点中的第二逻辑节点的数据处理操作。总起来说,在另一实施例中,该对逻辑节点定义可独立管理的存储设施映像(SFI)。通信模块可被配置成直接把管理命令发送给多个SFI。另一方面或者另外,该对逻辑节点定义可独立管理的存储应用映像(SAI),其中通信模块还被配置成把管理命令发送给多个SAI。
在一个实施例中,设备包括配置成允许用户把管理命令引向某一域的用户界面,所述域包含至少两个逻辑节点。用户界面可与所述单一管理模块通信,在一些实施例中,所述单一管理模块包含专用的硬件管理装置。
通信模块、转换模块和定向模块协作,以通过链接管理模块和一个或多个逻辑节点的管理子系统,传递软件层命令。管理子系统可包含表示存在于逻辑节点上的固件、软件、硬件和逻辑实体的对象模型。在一些实施例中,一个或多个逻辑节点包含公共硬件平台的逻辑分区(LPARS)。LPARS可被配置成以致每个LPAR在公共硬件平台的独立的中央电子集合体(Central Electronics ComplexCEC)上执行。这些LPARS还可被联系起来,以致在一个LPAR上执行的命令自动地在另一LPAR上被实现。
还提供了本发明的信号承载介质,它包括配置成执行通过单一管理模块,简化逻辑节点的管理的操作的机器可读指令。在一个实施例中,所述操作包括把管理命令有选择地从单一管理模块传送给一个或多个逻辑节点的操作。另一操作把管理命令转换成由一个或多个逻辑节点的软件层之一识别的一个或多个功能上等同的软件层命令。软件层命令被配置,以便与每个逻辑节点兼容。最后,执行根据管理命令范围,把一个或多个软件层命令引向至少一个软件层的操作。管理命令范围反映管理命令打算寻址的管理命令的逻辑节点的层次。
本发明还包括安排成包含与上面关于设备和方法说明的组件及步骤基本相同功能的系统、方法和设备的实施例。根据下面的说明和附加权利要求,本发明的特征和优点将变得更加明显,或者通过如后所述的本发明的实践,可获悉本发明的特征和优点。


为了容易地理解本发明的优点,将参考在附图中图解说明的具体实施例更详细地说明上面简要描述的发明。这些附图只描述本发明的典型实施例,并不是对其范围的限制,通过使用附图,将关于更多的特性和细节说明和解释本发明,其中图1是图解说明管理多个无关的独立逻辑节点的常规系统的方框图;图2是图解说明根据本发明,通过单个管理模块,简化逻辑节点的管理的设备的一个实施例的逻辑方框图;图3是图解说明根据本发明,通过单个管理模块,简化逻辑节点的管理的设备的备选实施例的逻辑方框图;图4是图解说明适于实现本发明的一些实施例的代表性系统的示意方框图;图5是图解说明根据本发明的一个实施例,利用在图4中图解说明的系统组件的实体的逻辑表示法的示意方框图;图6是图解说明通过单个管理模块,简化逻辑节点的管理的方法的示意流程图。
具体实施例方式
易于理解,这里在附图中说明和例证的本发明的组件可被安排和设计在各种不同的结构中。从而,附图中表现的本发明的设备、系统和方法的实施例的下述更详细说明并不意图限制要求保护的本发明的范围,而只是表示本发明的精选实施例。
参考附图将更好地理解本发明的例证实施例,附图中,相同的部件由相同的附图标记表示。下面的说明只是作为例子,仅仅举例说明与这里要求保护的发明一致的设备、系统和过程的一些选择实施例。
图2图解说明可被组织成通过单个管理模块,简化逻辑节点的管理的组件和模块的逻辑方框图。一般来说,管理命令202来源于管理模块204。在一个实施例中,管理模块204可包含在专用管理硬件设备上工作的软件或固件。另一方面,管理模块204可在与其它逻辑节点206通信的逻辑节点206上工作。管理模块204与一个或多个逻辑节点206通信。
最好,管理模块204包括预定的一组管理命令202和管理模块204被配置以便管理的逻辑节点206的注册表(registry)。管理命令202最好是可被应用于一个或多个逻辑节点206,以便监视、管理、服务或控制逻辑节点206的一般化命令。此外,可根据管理命令范围,把管理命令202分组。
管理命令202被设计成控制协同限定逻辑节点206的多层硬件、固件和软件。所述各层从低级硬件组件到在逻辑节点206上工作的高级应用程序、线程和进程不等。低级硬件组件的一个例子包括由管理命令202点亮,以便识别一组网络适配器中的特定网络适配器的LED。下面更详细地说明不同各层的其它例子。这里使用的管理范围意味着影响限定逻辑节点206的特定一层硬件和软件/固件的所有管理命令。
在一些实施例中,管理命令202可包括表示管理范围的指示符。另一方面,用于管理命令202的通信体系结构可定义恰当的管理范围。例如,在面向对象的实施例中,对象间的遗传层次可定义恰当的管理范围。一些从属对象可单独取决于单一管理范围。从而,通过对象之间的遗传关系,传递管理范围。
管理命令202连同明确或含蓄的管理范围被传送给通信模块20。在一个实施例中,通信模块208有选择地确定哪些逻辑节点206将接收特定的管理命令202。本领域的技术人员认识通信模块208可利用各种技术来实现所述确定。
在一个实施例中,通信模块208参考由管理模块204定义的一组逻辑节点206。该组可包括管理模块204管理的所有或一些逻辑节点206。可用各种数据结构,包括列表、数组、结构、对象等定义所述一组逻辑节点206。在一些实施例中,至少两个逻辑节点206被组织成一个域。域代表至少两个逻辑节点206的分组。
通过用户界面(UI)210,用户可手动指定意图接收管理命令202的域或逻辑节点206。UI 210允许用户控制和配置管理模块204的操作。UI 210可由管理模块204呈现。另一方面,代替或者除了手动逻辑节点206指定之外,脚本或其它自动化工具可指定管理命令202的域和/或逻辑节点206。
一旦识别了管理命令202的逻辑节点206,通信模块208就把管理命令202发送给恰当的逻辑节点206。最好,图解说明的实施例中的管理命令202仍然采取类属(generic)格式。
在一个实施例中,转换模块212接收类属格式的管理命令202,并把管理命令转换成一个或多个功能上等同的软件层命令。一般来说,单个管理模块202映射成单个软件层命令。但是,由于每个逻辑节点206可能不同,因此为了在特定的逻辑节点206上正确实现,单个管理命令202可能需要多个软件层命令。转换模块212被配置成把管理命令映射成具有特定逻辑节点206所需的语法和语义、包括变元的软件层命令。这样,类属管理命令被自动转换成与每个特定逻辑节点206相适应的功能上等同的软件层命令。
此外,转换模块212可增加软件层命令,以适应不同于另一逻辑节点206的一个逻辑节点206的某些硬件或软件从属性。例如,运行LINUX的逻辑节点206要求在执行关闭命令之前,清除未决的打印作业。运行高级IBM Unix(AIX)的逻辑节点206不存在这样的限制。从而,转换模块212可包括仅仅用于LINUX逻辑节点206的清除打印作业命令。
在一些实施例中,转换模块212把软件层命令传送给定向模块214。定向模块214把软件层命令引向逻辑节点206的软件层中的恰当一层。软件层定义对定义逻辑节点206的硬件和软件分组的抽象级别。
在一个实施例中,按照从最抽象的到最不抽象的顺序,定义软件层的抽象级别包括应用层216、系统层218、固件层220硬件层222。应用层216包含在逻辑节点206的操作系统(OS)内运行或者配置成在之内运行的应用、软件和进程。系统层218定义共同确定OS的应用、线程和进程。系统层218应用可包括文件系统、设备驱动程序、进程调度程序、后台驻留程序、系统监视程序等。固件层220包含嵌入只读存储器(ROM),例如电可编程只读存储器(EPROM)中的微代码和其它软件。硬件层222代表分配给逻辑节点206的硬件。硬件可以是专用的,共享的,或者共享和专用的组合。
定向模块214把软件层命令引向一个或多个软件层216、218、220。最好,硬件层222可由给软件层216、218、220之一的软件层命令控制。另一方面,软件层命令可被明确地引向硬件层222。
在一个实施例中,定向模块214根据管理范围,确定把软件层命令传送给哪个软件层。管理范围可作为标识符和管理命令一起被传递,并包括在软件层命令中。另一方面,该体系结构可含蓄地指示管理范围。最好,管理范围可能性对应于上述软件层216、218、220。
在一些实施例中,一对逻辑节点206被相互配置成对等域224。在对等域224中,两个或更多的计算系统(即逻辑节点206)具有等同的能力和责任。在一个实施例中,对等域224包括配置成镜像第二逻辑节点206的数据处理操作的第一逻辑节点206。这样,第一逻辑节点206起第二逻辑节点206的故障修复(failover)和/或备份的作用。每个逻辑节点206积极服务I/O通信,以致如果一个逻辑节点206发生故障,那么另一逻辑节点206能够继续服务另外的I/O通信,而不存在任何中断。这种冗余性改进了数据处理系统的总体可靠性和性能。
最好,通信模块208被配置成把管理命令202直接(由箭头226指示)传递给作为单一实体的对等域224。这使利用UI 210发送管理命令202的管理员免于逐一地把每个管理命令202发送给对等域224中的独立逻辑节点206。在一些实施例中,通信模块208可根据需要,把某些管理命令202引向对等域224的特定逻辑节点206。例如,如果对等域224的逻辑节点206发生故障,那么通信模块208可专门把恢复专用管理命令202发送给发生故障的逻辑节点206。
现在参见图3,图中图解说明了通过单个管理模块,简化逻辑节点的管理的备选设备300。设备300与包括对等域304的多个逻辑节点302通信,所述对等域包含至少两个独立的逻辑节点302。在一些实施例中,设备300包括转换模块306、定向模块308、通信模块310和UI 312。
转换模块306实现和关于图2说明的转换模块212基本相同的功能。但是,在图解说明的实施例中,转换模块306被集中,而不是分配给每个逻辑节点206。从而,转换模块306可保持与每个逻辑节点206相关的配置信息,例如,使一般的管理命令与功能上等同并且兼容的软件层命令相联系的映射表。此外,配置信息可包括特定于特殊逻辑节点206的管理命令相依性。配置信息还可识别哪些软件层命令可被发送给对等域304,哪些应被发送给对等域304中的独立逻辑节点302。配置信息可以文件、数据库等的形式被保存在存储器或者持久存储设备中。
定向模块308实现和关于图2说明的定向模块214基本相同的功能。但是,在图解说明的实施例中,定向模块308被集中,而不是分配给每个逻辑节点206。从而,定向模块308可访问配置信息,从而根据管理命令范围,确定如何把一个或多个软件层命令发送给逻辑节点302的软件层。在一个实施例中,配置信息识别在应用层314执行的特定应用。通过把标识符附到软件层命令上,定向模块308可把软件层命令发送给特定的应用。类似的技术可被用于把软件层命令发送给系统层316或者固件层318。应用层314、系统层316和固件层318对应于关于图2说明的类似各层216、218、220。
通信模块310实现和关于图2说明的通信模块208基本相同的功能。但是,在图解说明的实施例中,通信模块310传递软件层命令,而不是管理命令。换句话说,把管理命令处理成一个或多个软件层命令的逻辑由设备300实现,以致只有软件层命令需要被有选择地传递给相应的逻辑节点302或对等域304。
在一个实施例中,形成设备300和设备300与逻辑节点302之间的通信基础结构,作为一组原始的软件模块。另一方面,现有的通信基础结构被扩展并被加入,以便提供本发明的所需功能。在一个实施例中,通信模块310通过逻辑链接设备300和逻辑节点302的管理子系统320,传递一个或多个软件层命令。充当根据本发明的管理子系统30的基础的这样的子系统的一个例子是可从Armonk,New York的国际商用机器公司(IBM)获得的资源监视和控制(RMC)子系统。本领域的技术人员会认识到管理子系统320不同于它所依赖于的常规RMC子系统。
基于RMC的管理子系统320是一般包含在诸如AIX之类操作系统中的功能模块。当然,可在其它操作系统,包括LINUX、UNIX、Windows等中实现管理子系统320。管理子系统320的赠送组件可驻留在设备300和逻辑节点302上。
管理子系统320监视资源,比如磁盘空间、处理器应用、设备驱动程序、适配卡状态等。管理子系统320被设计成响应预定的条件,执行某一动作。但是,常规的RMC不能同时与对等域304中的一对逻辑节点302进行接口。相反,常规的RMC子系统每次与一个逻辑节点302通信。从而,常规的RMC子系统显示出和关于图1中描述的管理控制台118讨论的类似局限性(管理命令的重复发出)。
在本发明的一些实施例中,常规的RMC子系统被扩展和修改,以便创建能够与作为单一实体的对等域304中的一对逻辑节点302进行接口的管理子系统320。管理子系统320包括一个对象模型,所述对象模型包含代表一个或多个逻辑节点302的每个可管理资源的对象。
这里使用的“资源”指的是物理分配给逻辑节点302,或者逻辑上为逻辑节点302定义的固件、软件、硬件和逻辑实体。资源的例子包括物理存储设备、存储设备控制器、I/O设备、I/O设备驱动器、存储器设备、存储器控制器、处理器、对称多处理器控制器、固件设备、固件可执行代码、操作系统、应用、进程、线程、操作系统服务等。对象代表物理和逻辑资源的特征和属性。对象可保存信息,比如通信地址、版本信息、特征信息、兼容性信息、操作状态信息等。在一些实施例中,对象包含软件对象,所述软件对象包括属性和方法。属性保存关于所述对象的数据。方法包含专门配置的实现所述对象的某一功能性的逻辑。例如,一种方法可包含I/O卡的关闭例程。
最好,管理子系统320保持对象模型,以便包括对资源的各种变化,比如对逻辑节点302的资源的增加、删除和修改。管理子系统320使资源定义在设备300和逻辑节点302之间保持同步。通过扩展常规RMC的功能性,本发明的实施例可访问当前并且一致的对象模型,以便识别哪些资源将被包括在管理命令中。
管理子系统320还包括一组资源管理器。在一个实施例中,资源管理器包括解释管理命令,并把管理命令应用于在对象模型中定义的资源的逻辑。在一些实施例中,资源管理器的各个部分可驻留在一个逻辑节点上。各个资源部分可实现关于上述转换模块212和定向模块214说明的功能性。具体地说,管理子系统320可包括专门用来解释和实现作为单一实体的对等域304的管理命令的资源管理器。
图4图解说明适合于实现通过单个管理模块,简化逻辑节点的管理的系统400的系统硬件。如上所述,随着越来越廉价的硬件被组合到单一物理外壳中,数据处理系统变得越来越复杂。从而硬件或者在物理上、逻辑上被划分,或者物理和逻辑组合地划分成多个逻辑节点206(参见图2)。
在适合于用作存储子系统的一个实施例中,系统400包括由公用硬件平台402结合的至少两个物理独立的中央电子集合体(CEC)。公用硬件平台402可包含简单的物理外壳。
CEC是与公共协调模块16,例如PHYP 116(参见图1)连接的一批独立的物理计算设备。CEC包括组织成处理器集合体404的多个对称多处理器,多个电子存储器设备406,多个直接存取存储设备(DASD)408,多个网络I/O接口设备410,例如主机适配器410,和多个管理接口设备412,例如网络适配器412。CEC包括电源耦接器和电源基础结构以及通风和冷却系统。每个CEC可以独立地循环供电。甚至一些子系统可以循环供电,而不影响CEC的其它部分的性能。当然,本领域的技术人员会认识到上面描述的一些硬件设备可被组织成子系统,并且包括与本发明无关,但是使CEC能够支持多个逻辑节点206的各种控制器。
在一个实施例中,系统400包括第一CEC 414和第二CEC 416。最好,第二CEC 416包括与第一CEC 414基本相同数量、类型、商标和配置的硬件。具有公共硬件减少了解决问题中所涉及的变数。在一个实施例中,第一CEC 414和第二CEC 416可由通过网络适配器412连接的单个硬件管理控制台(HMC)418管理和控制。在一个实施例中,HMC 418是专用硬件管理设备,比如运行LINUX操作系统和适当的管理应用程序的个人计算机。
应注意即使在单个CEC内,管理硬件的这种集合体系统400仍然非常具有挑战性。尤其是如果要保持24/7可用性的目标的话更是如此。从而,HMC 418包括集合体服务和维护脚本和例程,以便指导管理员服务CEC,从而能够保持最高级别的可用性。个别错误会产生惊人的后果。在一些实施例中,管理逻辑被包含在多个资源管理器中。各个资源管理器监视和检查EXX的各个硬件和软件子系统的健康状况。软件模块和脚本指导维护技师和系统管理员诊断和确定问题,以及进行预防性维护。一般来说,在剩余的硬件组件仍然在线的时候,这些例程恰当地关闭(动力循环)子组件和/或系统。当然,这些例程也可实现更复杂的维护和管理程序。例如,这些脚本和例程可使执行应用程序无效,关闭各个硬件组件的电源,实现固件更新,自动反转自动过程。这可被完成,以致固件被恰当地更新,按照正确的顺序使组件离线和恢复在线,以便确保在I/O服务中没有任何中断。
图5图解说明图4的硬件系统400,包括作用于硬件的软件和逻辑实体。系统400包括在公共硬件平台402内的第一CEC 414和第二CEC 416。在一个实施例中,CEC 414、416完全独立,并且在存储子系统内工作。
系统400包括第一逻辑分区(LPAR)502、第二LPAR 504、第三LPAR 506和第四LPAR 508。某些系统40可包括比图解所示更多的LPAR。如上所述,每个LPAR 502-508包含计算资源的分配,所述计算资源包括一个或多个处理器510、一个或多个I/O通道512和永久和/或非永久存储器514。一些计算硬件可以是共享的,其它硬件可被专用于特定的逻辑节点LPAR。这里使用的LPAR指的是一个或多个处理器、存储器和I/O通信的管理和分配,以致每个LPAR能够与其它LPAR无关地执行操作系统。通常用于描述LPAR的其它术语包括虚拟机和逻辑节点206(参见图2)。
在一个实施例中,第一LPAR 502和第二LPAR 504相似,以致处理器510、I/O 512和存储器514的配置相同。类似地,在存储器514中执行的软件可以相似。相应的LPAR 502、504存储器514可执行相同的OS 516和资源管理器518。
最好,资源管理器518包括管理特定LPAR 502、04的逻辑。资源管理器518可包括转换模块520和定向模块522。转换模块520和定向模块522可包括与关于图2说明的转换模块212和定向模块214基本相同的逻辑。在一些实施例中,资源管理器518是在每个LPAR502上执行的现有RMC模块的软件扩展。资源管理器518可扩展面向对象的RMC模块或者按照程序设计的RMC模块。
在一个实施例中,作用于第一CEC 414的第一LPAR 502与作用于第二CEC 416的第二LPAR 504呈对等关系524地工作。第一LPAR502和第二LPAR 504一起定义存储设施映像(SFI)526。所有数据存储处理一般在LPAR 502和LPAR 504之间被逻辑划分,当一个LPAR不可用时,剩余的LPAR处理所有工作。最好,SFI 526包括一个作用于与第二LPAR 504的物理硬件完全无关的物理硬件的LPAR 502。从而,在优选实施例中,SFI 526包含硬件的物理划分。这样,一个CEC 416可以离线或者被物理关闭,而SFI 526可保持在线。一旦CEC416恢复在线,资源管理器518可使存储器514与存储装置同步,以致第二LPAR 504再次匹配第一LPAR 502。
SFI 526可被进一步分成逻辑存储设备。最好,SFI 526只包括存储和取回数据所必需的软件。例如,一个SFI 526包含允许数据的存储和取回的OS中的文件系统。
系统400还可包括由呈对等关系524的第三LPAR 506和第四LPAR 508构成的存储应用映像(SAI)528。最好,定义SAI 528的LPAR506、508包括相同的OS 516和相同的资源管理器518。在一些实施例中,SFI 526的OS 516和/或资源管理器518可不同于SAI 528的OS516和/或资源管理器518。
SAI 528把存储应用组织成可独立于SFI 526的逻辑和物理存储设备408(参见图4)管理的单一逻辑单元。SAI 528还包括冗余,因为第三LPAR 506和第四LPAR 508镜像彼此的操作,以致如果一个LPAR506、508发生故障,根据需要简化切换。虽然镜像是对等关系524的一个特征,不过取决于实现,某些操作可被镜像或者不可被镜像。最好,SFI 526包括作用于完全与第四LPAR 508的物理硬件无关的物理硬件的第三LPAR 506。从而,在优选实施例中,SAI 528包含硬件的物理划分。这样,一个CEC 416可以离线或者被物理关闭,SAI 528可保持在线。SAI 528的存储应用530包括专用于管理数据的存储和取回的应用。存储应用的例子包括IBMr Tivoli Storage Manager,数据库管理系统等。
管理模块532被配置成有选择地把管理命令传递给SFI 526和/或SAI 528。另一方面或者另外,管理模块532可根据需要,直接把管理命令发送给各个LPAR 502-508。管理模块532包括通信模块534和UI 536,通信模块534和UI 536包括和关于图2说明的类似组件基本相同的功能。有利地,管理模块532抽取表示单一SFI 526的多个LPAR502、504的细节,在确保对每个LPAR 502、504的具体变化将被实现的情况下,允许用户把管理命令引向整个SFI 526。在一个实施例中,LPAR之一,例如LPAR 502接收管理命令。借助对等关系,第二LPAR504可由第一LPAR 502指导,从而也实现所述管理命令,而不是直接接收所述管理命令。
在一些实施例中,管理模块532起多个SFI 526、SAI 528,以及其中定义的相关LPAR 502-508的中心管理点的作用。管理模块532可通过带外通信网络与多个硬件平台538耦接。管理模块532最好被配置成把一个或多个软件层命令或管理命令发送给分布在多个平台538内的SFI 526和SAI 528。此外,每个SFI 526和/或SAI 528可包括不同的OS 516和/或一组应用530。SFI 526和/或SAI 528可被组织成公共目的、功能或者其它特征的管理域。管理模块532允许发布命令,以便选择包含SFI 526、SAI 528,或者SFI 526和SAI 528的组合的域。
本发明便于管理模块532发布抽象和类属的管理命令。例如,不同的SFI 526将不仅在LPAR配置层,而且在OS 516和应用530层正确地遵从命令。例如,管理员可确定一定数目的主机适配卡要被更换。管理模块532可执行发出有选择地关闭软件模块,和断开硬件组件的电源,以致受影响的SFI 526和SAI 528仍然在线的管理命令的脚本。在这样的例子中,管理模块可分阶段工作。首先,受影响的SFI 526的一个LPAR的应用层软件模块被关闭。这可包括OS 516和某些设备驱动程序。随后,受影响的SFI 526的一个LPAR的系统层软件模块被关闭。这可包括OS 516,可能还有一些微代码。最后,由从管理模块532到CEC 414的电源控制器的命令,断开实际硬件(主机适配器卡或者主机适配器卡子系统)的电源。管理员随后可物理更换这些卡。管理模块532随后可反转所述过程,以便依次激活硬件、系统层软件和应用层软件。一些管理命令可寻址SFI 526或SAI 528的单一LPAR,以致保持恒定的可用性。
管理模块532连同本发明的LPAR 502-508上的赠送的资源管理器518提供公共管理和控制接口,可被称为应用程序接口。本发明便于类属抽象命令有选择地控制选择可具有非常不同的特定命令的SFI526、SAI 528和LPAR 502-508,并控制命令和变数。
图6图解说明根据一个实施例,通过单一管理模块简化逻辑节点的管理的方法600的流程图。一旦用户或自动化软件模块确定管理命令应被发送给逻辑节点206(参见图2),方法600就开始602。例如,用户可选择特定的域,例如包含单一SFI 526或单一SAI 528的两个LPAR的管理域。另一方面,SFI 526和SAI 528或各个LPAR 502-508的域可由UI 536寻址。
随后,通信模块534有选择地把管理命令传递给一个或多个逻辑节点206(LPAR 502-508)。在一些实施例中,通过诸如改进RMC之类的管理子系统320传递命令。所述命令由所涉及的逻辑节点206的资源管理器接收。用户不必专门登录到每个逻辑节点206。
转换模块212把管理命令转换成一个或多个功能上等同的软件层命令。软件层命令与逻辑节点206的预定软件层兼容,并由其识别。
随后,确定608管理命令范围。如上所述,可利用伴随管理命令的指示符传递管理命令范围。如果管理命令范围是固件层,那么定向模块214把软件层命令引向610逻辑节点206的固件层220。给固件层220的软件层命令可实现低级维护,例如关闭特定卡的电源,重复硬件组件,执行微代码更新覆盖等。
如果管理命令范围是系统层,那么定向模块214把软件层命令引向612逻辑节点206的系统层218。给系统层218的软件层命令可实现中等维护,比如更新设备驱动程序,终止失控线程或进程,重置OS516等。
如果管理命令范围是应用层,那么定向模块214把软件层命令引向614逻辑节点206的应用层216。给应用层216的软件层命令可实现诸如安装和删除软件,安装或删除软件功能,配置软件应用之类的维护。
一旦定向模块214已正确定向了软件层命令,就确定616是否需要来自逻辑节点206的响应。所述响应可包含简单的确认。另一方面,响应可包括状态信息或出错信息。如果不需要对管理命令的响应,那么方法600返回,以便传递604后续的管理命令。在一个实施例中,如果需要响应,那么每个逻辑节点206的资源管理器可把响应中继(relay)给管理模块532。方法600随后返回,以便传递604后续的管理命令。
本领域的技术人员将很快认识到本发明提供的潜在优点。单独地或集体地管理SFI 526和SAI 528和/或各个LPAR 502-508的能力显著节省了管理员的时间,并且显著降低了错误和过失的可能性。从而,公共硬件平台和SFI 526及SAI 528较长时间并且更始终如一地保持在线。此外,控制具有不同的操作系统和管理软件,例如存储管理应用程序的SFI 526和SAI 528的能力减少了用户必须知道的管理命令的数目。这也确保在管理和维护具有多个逻辑节点的公共硬件平台的硬件和软件中,遵循正确的硬件/软件依存关系和操作顺序。
在不脱离本发明的精神或基本特征的情况下,可用其它具体形式体现本发明。在各上方面,所描述的实施例应被看作对本发明的举例说明,而不是对本发明的限制。于是,本发明的范围由附加的权利要求限定,而不是由前面的说明限定。包括在权利要求的等同物的含意和范围内的所有变化都将包含在权利要求的范围内。
本说明书中描述的许多功能单元被标记为模块,以便更显著地强调它们的实现独立性。例如,模块可被实现成包含定制的VLSI电路或门阵列,现成的半导体,比如逻辑芯片、晶体管或者其它离散组件的硬件电路。也可用诸如现场可编程门阵列,可编程阵列逻辑,可编程逻辑装置等实现模块。
也可用供各种处理器执行的软件实现模块。例如,可执行代码的识别模块可包括计算机指令的一个或多个物理或逻辑块,所述计算机指令可被组织成对象、程序、函数或者其它结构。然而,识别模块的各个可执行部分不必物理地在一起,相反可包含保存在不同存储单元中的不同指令,当被逻辑结合在一起时,它们构成所述模块,并实现所述模块的规定用途。
实际上,可执行代码的模块可以是单一指令,或者许多指令,甚至中分布在几个不同的代码段中,不同的程序之间,以及几个存储设备中。类似地,这里操作数据可在模块内被识别和例示,并且可用任何适当的形式来具体体现,并在任何恰当类型的数据结构内被组织。操作数据可被集合成单一数据集,或者可分布在包括不同存储设备的不同存储单元内,并且至少部分地,可以仅以系统或网络上的电信号的形态存在。
本说明书中对“选择的实施例”或者“一个实施例”的引用意味着结合该实施例说明的特定特征、结构或特性包括在本发明的至少一个实施例中。从而,短语“选择的实施例”或“在一个实施例中”在本说明书内的不同地方的出现不一定指的都是同一实施例。
此外,在一个或多个其它实施例中,可按照任何适当的方式组合所描述的特征、结构或特性。在下面的描述中,提供了众多的具体细节,例如程序设计、软件模块、用户选择、用户界面、网络事务、数据库查询、数据库结构、硬件模块、硬件电路、硬件芯片等的例子,以便彻底理解本发明。但是,相关领域中的技术人员会认识到在不存在一个或多个所述具体细节,或者利用其它方法、组件、材料等的情况下,也可实践本发明。在其它情况下,没有详细表示或说明公知结构、材料或操作,以避免使本发明的各个方面不明显。
权利要求
1.一种通过单一管理模块简化逻辑节点的管理的设备,所述设备包括通信模块,所述通信模块被配置成有选择地把管理命令从单一管理模块传递给一个或多个逻辑节点;转换模块,所述转换模块被配置成把管理命令转换成由一个或多个逻辑节点的软件层之一识别的一个或多个功能上等同的软件层命令;和定向模块,所述定向模块被配置成根据管理命令范围,把一个或多个软件层命令引向恰当的一个软件层。
2.按照权利要求1所述的设备,其中一个或多个逻辑节点包含对等域中的至少一对逻辑节点,以致该对逻辑节点中的第一逻辑节点镜像该对逻辑节点中的第二逻辑节点的数据处理操作。
3.按照权利要求2所述的设备,其中该对逻辑节点定义可独立管理的存储设施映像(SFI),其中通信模块还被配置成把管理命令发送给多个SFI。
4.按照权利要求2所述的设备,其中该对逻辑节点定义可独立管理的存储应用映像(SAI),其中通信模块还被配置成把管理命令发送给多个SAI。
5.按照权利要求1所述的设备,还包括配置成允许用户把管理命令引向某一域的用户界面,所述域包含至少两个逻辑节点。
6.按照权利要求1所述的设备,其中通信模块、转换模块和定向模块协作,以通过链接管理模块和一个或多个逻辑节点的管理子系统,传递软件层命令。
7.按照权利要求6所述的设备,其中管理子系统包含表示存在于逻辑节点上的固件、软件、硬件和逻辑实体的对象模型。
8.按照权利要求1所述的设备,其中软件层选自包括应用层、系统层和固件层的组。
9.按照权利要求1所述的设备,其中所述单一管理模块包含专用管理硬件装置。
10.按照权利要求1所述的设备,其中一个或多个逻辑节点包含公共硬件平台的逻辑分区(LPARS),LPARS被配置使每个LPAR在公共硬件平台的独立的中央电子集合体(CEC)上执行。
11.一种通过单一管理模块简化逻辑节点的管理的设备,所述设备包括转换模块,所述转换模块被配置成把管理命令转换成由多个逻辑节点的软件层识别的一个或多个功能上等同的软件层命令,所述软件层命令被配置以便与每个逻辑节点兼容;定向模块,所述定向模块被配置成根据管理命令范围,把一个或多个软件层命令路由给恰当的一个软件层;和通信模块,所述通信模块被配置成有选择地把软件层命令传递给逻辑节点。
12.按照权利要求11所述的设备,其中一个或多个逻辑节点包含定义可独立管理的存储设施映像(SFI)的至少一对逻辑节点,其中通信模块把所述一个或多个软件层命令中继给多个SFI的对应软件层。
13.按照权利要求12所述的设备,其中该对逻辑节点定义可独立管理的存储应用映像(SAI),其中通信模块把所述一个或多个软件层命令中继给多个SAI的对应软件层。
14.按照权利要求13所述的设备,其中通信模块把所述一个或多个软件层命令传送给多个SFI和SAI的对应软件层。
15.按照权利要求11所述的设备,还包括配置成允许用户把管理命令引向某一域的用户界面,所述域包含至少两个逻辑节点。
16.按照权利要求11所述的设备,其中通信模块通过链接所述设备和一个或多个逻辑节点的管理子系统,传递所述一个或多个软件层命令。
17.按照权利要求16所述的设备,其中管理子系统包含表示存在于逻辑节点上的固件、软件、硬件和逻辑实体的对象模型。
18.按照权利要求11所述的设备,其中软件层选自包括应用层、系统层和固件层的组。
19.按照权利要求11所述的设备,其中所述设备包含专用管理硬件装置。
20.按照权利要求11所述的设备,其中一个或多个逻辑节点包含公共硬件平台的逻辑分区(LPARS),LPARS被配置使每个LPAR在公共硬件平台的独立的中央电子集合体(CEC)上执行。
21.一种通过单一管理模块简化逻辑节点的管理的系统,包含操作上与硬件平台耦接的第一中央电子集合体(CEC),第一CEC包含组织成第一处理器集合体的多个对称多处理器,多个电子存储装置,多个直接存取存储装置,多个网络输入/输出(I/O)接口装置,和多个管理接口装置,第一CEC的每个装置被电子耦接,以便交换数据和控制信息;操作上与硬件平台耦接的第二CEC,第二CEC包含组织成第二处理器集合体的多个对称多处理器,多个电子存储装置,多个直接存取存储装置,多个网络输入/输出(I/O)接口装置,和多个管理接口装置,第二CEC的每个装置被电子耦接,以便交换数据和控制信息;至少一个存储设施映像(SFI),所述至少一个存储设施映像(SFI)包含定义成利用第一CEC的计算资源工作的第一逻辑分区(LPAR),和定义成利用第二CEC的计算资源工作的第二LPAR,第一LPAR与第二LPAR在对等域中,以致第二LPAR镜像第一LPAR的数据处理操作,第一LPAR和第二LPAR专用于数据的存储和取回;至少一个存储应用映像(SAI),所述至少一个存储应用映像(SAI)包含定义成利用第一CEC的计算资源工作的第三逻辑分区(LPAR),和定义成利用第二CEC的计算资源工作的第四LPAR,第三LPAR与第四LPAR在对等域中,以致第四LPAR镜像第三LPAR的数据处理操作,第三LPAR和第四LPAR专用于数据存储应用;与通信模块通信的管理模块,所述通信模块被配置成有选择地把管理命令从单一管理模块传递给所述至少一个SFI和至少一个SAI中的一个或多个;配置成把管理命令转换成由包括在所述至少一个SFI和至少一个SAI中的LPAR的软件层之一识别的一个或多个功能上等同的软件层命令的转换模块,软件层命令被配置以便与每个LPAR兼容;和配置成根据管理命令范围,把一个或多个软件层命令引向恰当的一个软件层的定向模块。
22.按照权利要求21所述的系统,其中通信模块把一个或多个软件层命令传递给为多个硬件平台定义的多个SFI和SAI的对应软件层。
23.按照权利要求21所述的系统,还包括配置成允许用户把管理命令引向一个或多个域的用户界面,每个域包含SFI、SAI或者SFI和SAI的组合。
24.按照权利要求21所述的系统,其中通信模块通过链接管理模块与所述至少一个SFI和至少一个SAI的管理子系统,传递所述一个或多个软件层命令。
25.按照权利要求24所述的系统,其中管理子系统包含表示存在于所述至少一个SFI和至少一个SAI上的固件、软件、硬件和逻辑实体的对象模型。
26.按照权利要求21所述的系统,其中软件层选自包括应用层、系统层和固件层的组。
27.按照权利要求21所述的系统,其中管理模块包含专用的管理硬件装置。
28.一种确实包含机器可读指令的信号承载介质,所述指令可由数字处理设备执行,从而实现通过单一管理模块简化逻辑节点的管理的操作,所述操作包含有选择地把管理命令从单一管理模块传送给一个或多个逻辑节点的操作;把管理命令转换成由一个或多个逻辑节点的软件层之一识别的一个或多个功能上等同的软件层命令的操作,软件层命令被配置以便与每个逻辑节点兼容;和根据管理命令范围,把一个或多个软件层命令引向至少一个软件层的操作。
29.按照权利要求28所述的信号承载介质,其中所述一个或多个逻辑节点包含对等域中的至少一对逻辑节点,以致所述一对逻辑节点中的第一逻辑节点镜像所述一对逻辑节点中的第二逻辑节点的数据处理操作。
30.按照权利要求29所述的信号承载介质,其中该对逻辑节点定义可独立管理的存储设施映像(SFI),其中所述传送还包含把管理命令发送给多个SFI。
31.按照权利要求28所述的信号承载介质,还包括呈现配置成允许用户把管理命令引向某一域的用户界面的操作,所述域包含至少两个逻辑节点。
32.按照权利要求28所述的信号承载介质,其中引向所述一个或多个软件层命令的操作还包含通过链接管理模块和一个或多个逻辑节点的管理子系统,传递软件层命令的操作。
33.按照权利要求32所述的信号承载介质,其中管理子系统包含表示存在于逻辑节点上的固件、软件、硬件和逻辑实体的对象模型。
34.按照权利要求28所述的信号承载介质,其中软件层选自包括应用层、系统层和固件层的组。
35.按照权利要求28所述的信号承载介质,其中所述单一管理模块包含专用管理硬件装置。
36.按照权利要求28所述的信号承载介质,其中一个或多个逻辑节点包含公共硬件平台的逻辑分区(LPARS),LPARS被配置使每个LPAR在公共硬件平台的独立的中央电子集合体(CEC)上执行。
37.按照权利要求28所述的信号承载介质,还包括把响应消息从一个或多个逻辑节点中继给单一管理模块的操作。
38.按照权利要求28所述的信号承载介质,其中软件层命令被带外传送。
39.一种通过单一管理模块简化逻辑节点的管理的方法,所述方法包括有选择地把管理命令从单一管理模块传送给一个或多个逻辑节点;把管理命令转换成由一个或多个逻辑节点的软件层之一识别的一个或多个功能上等同的软件层命令,软件层命令被配置以便与每个逻辑节点兼容;和根据管理命令范围,把一个或多个软件层命令引向至少一个软件层。
40.一种通过单一管理模块简化逻辑节点的管理的设备,所述设备包含有选择地把管理命令从单一管理模块传送给一个或多个逻辑节点的装置;把管理命令转换成由一个或多个逻辑节点的软件层之一识别的一个或多个功能上等同的软件层命令的装置,软件层命令被配置以便与每个逻辑节点兼容;和根据管理命令范围,把一个或多个软件层命令引向至少一个软件层的装置。
全文摘要
提供通过单一管理模块,简化逻辑节点的管理的设备、系统和方法。本发明包括有选择地把管理命令从单一管理模块传递给一个或多个逻辑节点的通信模块。转换模块把管理命令转换成由一个或多个逻辑节点的软件层之一识别的一个或多个功能上等同的软件层命令。定向模块根据管理命令范围,把一个或多个软件层命令引向恰当的一个软件层。本发明可把管理命令发送给具有不同的操作系统和执行应用程序的多个逻辑节点。
文档编号G06F15/177GK1760851SQ20051011363
公开日2006年4月19日 申请日期2005年10月11日 优先权日2004年10月12日
发明者约翰·爱德华·希科曼, 史蒂文·理查德·范·冈迪 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1