平衡信息技术系统中的功耗和高可用性的系统和方法

文档序号:6431867阅读:193来源:国知局
专利名称:平衡信息技术系统中的功耗和高可用性的系统和方法
技术领域
本发明涉及信息技术系统和子系统中的可用性与活动冗余组件数。
背景技术
一种表示信息技术系统或子系统中高可用性需求的方式是通过指定恢复系统中的故障所需的时间的恢复时间目标(RTO)。现有技术使用功耗、冗余组件来提高系统和子系统的恢复时间目标。因此,在系统或子系统中提供高可用性的成本包括功耗的增加。美国专利7043650(专利申请号10000703,2001年10月31日申请)描述了一种提供高可用性的方法,该方法披露了在必须降低功耗期间对分布式服务的功耗进行智能控制的系统和方法。分布式服务由计算机系统提供并且有关本发明的系统和方法选择性地关闭服务。

发明内容
因此,本发明的目标是提供用于平衡信息技术系统中的功耗和高可用性的方法和系统,避免现有技术中所述的缺点。该目标通过独立的权利要求实现。有利的实施例在从属权利要求中列出。本发明提出了在选择由信息技术系统或子系统的恢复时间目标(RTO)所确定的可用性级别的同时管理信息技术系统或子系统中的功率的系统和方法。导出并存储从一组功率值中的每个功率值到与启用功率的(power enabled)若干组件对应的恢复时间目标值的转换。然后,当需要预定的RTO值时,系统将根据系统活动和计划自动设置省电模式以实现预定的恢复时间目标。所述省电模式是根据预定的恢复时间目标,通过将选定的冗余组件断电实现的。如果在将选定的冗余组件断电期间或之后,一个或多个组件出现故障,系统将自动将一个或多个选定的冗余组件通电。根据配置的RT0,所发明的系统配置最适合的功率模式。用户可以配置一定时间范围内的RT0。基于配置的RT0,根据本发明的示例性实施例的系统选择性地将诸如图1中的200所示的存储系统的冗余组件断电。因此,图2中所示的根据本发明的示例性实施例的系统部署了三种功率模式。在第一操作模式下,所有组件均是活动的,提供最低的RT0,不节省功率。在另一操作模式下,将某些功率相关的冗余组件断电以节省一些功率。此操作模式提供了中等RT0。在第三操作模式下,将更多的冗余组件断电以节省更多的功率,但是提供更高的RT0。针对第二和第三功率模式,提供了更多的方法以通过自动激活更多的电源来防止停电。


图1示出带有根据高可用性需求配置功率的功率控制模块的存储系统的创造性功率设计,以及图2示出图1中的创造性存储系统的不同功率模式转换。
具体实施例方式图1中所示的创造性功率设计的示例性实施例提供了仅包含两个冗余主电源 102、104的存储系统200,所述冗余主电源为所有组件(控制器118、119和盘系统120)提供所有必要的电压。该设计去除了电源108、110、112和114并且使存储系统200更省电地运行,因为所去除的电源的附加效率不再起作用。此外,该示例性实施例向存储系统200提供了创造性的功率控制模块206。功率控制模块206与主电源102和104相连。该连接允许功率控制模块指示电源102和104通电或断电。功率控制模块206允许用户根据时间范围配置高可用性需求。所述高可用性需求通过通常以秒数表示的RTO进行配置。根据配置的高可用性需求,功率控制模块定义三种功率模式高可用性(HA)模式提供RTO = 0。所有组件均是活动的。省电模式1 提供30秒< RTO < 60秒。所有冗余电源均被断电(例如,104,108, 112)。省电模式2 提供20分钟< RTO < 30分钟。与功率模式2相同,此外一个系统控制器(例如,118)被断电。用户可以配置需要高可用性的时间。在这些时间,设置高可用性模式并且所有组件均是活动的。不节省任何功率。用户可以配置不需要高可用性的时间,并且在这些时间,如果出现功率故障,系统必须在60秒之后恢复(省电模式1)。在这些时间,配置省电模式1-将电源104、108和112 断电-并且节省一些功率。预计功率节省在5-20%。用户可以配置不需要高可用性的时间,并且在这些时间,如果出现功率故障,系统必须在30分钟之后恢复(省电模式2)。在这些时间,配置省电模式2-将电源104、108和 112断电,另外将控制器118断电-并且节省更多的功率。在此省电模式下,预计功率节省在 20-40%。根据功率控制模块206中的功率模式配置,功率控制模块启动对磁盘系统200的必要更改。这些更改并发地执行。如图2所示,系统内存在六种转换。这六种转换如下所示302 从高可用性模式转换到省电模式1 控制模块将电源104、108和112断电,让系统100带着电源102、110、114以及控制器118和119和盘盒(disk enclosure) 120运行。304 从高可用性模式转换到省电模式2 控制模块将电源104、108和112以及控制器118断电,让系统100带着电源102、110、114以及控制器119和磁盘盒120运行。306 从省电模式1转换到省电模式2 控制模块将控制器118断电。308 从省电模式2转换到省电模式1 控制模块将控制器118通电。310 从省电模式2转换到高可用性模式控制模块将电源104、108和112以及控制器118通电。312从省电模式1转换到高可用性模式控制模块将电源104、108和112通电。在省电模式1和省电模式2下,具有有限的冗余。如果,例如,电源线130或电源 102出现故障,存储系统200可完全断电。因此,创造性的功率控制模块206提供了其他方法。这些方法检测电源线130和电源102的功率故障,并自动激活诸如电源104之类的其他组件。为了提供不间断操作,使用电池122作为缓冲,来桥接从活动电源102出现故障到第二电源104运行的这一段时间。因此,功率控制模块206将电源切换到电池。在此恢复期间,控制器118和119以及盘盒120通过电池供电。省电模式1也容忍控制器118的控制器电源108出现故障,因为控制器119仍是活动的并能够提供服务。省电模式2不容忍上述故障。在优选实施例中,恢复时间目标的配置基于用户可通过用户界面输入的时间。此类用户界面已经在现有技术中的存储系统内提供。在备选实施例中,存储系统200且更确切地说功率配置模块206观察存储系统200 随时间的使用。根据功率控制模块206所观察的使用,导出反复的低频率活动或无活动的时间。所述功率控制模块将系统活动与阈值Al和A2进行比较,其中Al >A2。所述活动可以用每秒或每分钟内的I/O操作数度量。如果活动降到低于阈值Al但是仍高于阈值A2,则功率控制模块206自动进入省电模式1(转换302)。如果活动降到低于阈值A2,则功率控制模块206自动进入省电模式2 (转换304和306)。类似地,如果系统200处于功率模式2 并且活动高于阈值A2并低于阈值Al,则系统进入省电模式1 (转换308)。或者如果活动高于阈值Al,则系统进入高可用性模式(转换310和312)。在任何时候,用户都能否决这些策略,并且可以手动切换到另一功率/HA模式。本发明还能扩展到服务器或其他具有冗余功率组件的IT组件。本发明另外还声明了具有镜像(复制)关系的存储子系统或具有冗余功率组件且作为包含多个服务器的群集的一部分的服务器。如果存储子系统200检测到任何缺陷(例如,在后端),则省电模块206可决定再次进入HA模式以允许在修复期间具有最大冗余。因此,系统在出现故障时自动切换到更多冗余模式。存储子系统可以额外地具有与其他存储子统的镜像(复制)关系,每个单独的系统具有冗余功率组件。这可以例如是对等远程拷贝(Peer-to-Peer Remote Copy)复制,甚至是级联镜像。具有镜像关系的存储系统实现不同的功率模式例如,主存储系统可在HA模式 (完全冗余)下工作,二级存储系统(以及三级存储系统,如果适用的话)可在省电模式 1 (冗余电源被断电)或省电模式2下工作。具有镜像关系的存储系统根据错误自动更改功率模式如果主系统处于HA模式下并出现故障,则二级系统自动切换到HA模式。或者如果主系统处于省电模式下并且二级系统出现故障,则主系统自动切换到HA模式。本发明可以扩展到服务器或其他具有冗余功率组件的IT系统。服务器可以包括冗余功率组件。根据本发明的功率模式也可适用于服务器。这些服务器或类似的IT组件可以是包含多个节点的群集的一部分,其中每个节点具有冗余功率组件。另外在这种情况下, 可以考虑根据客户的允许,在特定时间将部分或全部服务器的冗余功率组件置于较低的功率级别,此时群集中的每个节点仍提供常规服务,但是处于诸如省电模式1之类的较低个别冗余级别,而当群集中的其他节点成员出现故障时,一个或全部节点将再次进入诸如HA 模式之类的较高冗余级别。
应该指出,所述实施例可以采取完全硬件实施例、完全软件实施例或同时包含软件和硬件元素的实施例的形式。在优选实施例中,本发明通过软件实现,包括但不限于固件、驻留软件和微代码。在一个实施例中,用于在数据处理系统中执行的数据处理程序可被提供为包含当所述程序在数据处理系统上运行时,用于执行上述方法的软件代码部分。所述数据处理系统可以是通过通信装置与资产管理系统相连的计算机或计算机系统。此外,实施例可以采取可从计算机可用或计算机可读介质访问的计算机程序产品的形式,所述计算机可用或计算机可读介质提供由计算机或任何指令执行系统使用或与所述计算机或任何指令系统结合的程序代码。为了此描述的目的,计算机可用或计算机可读介质可以是任何包含用于存储、传送、传播或传输由指令执行系统、装置或设备使用或与所述指令执行系统、装置或设备结合的程序的机制的装置。所述介质可以是电、磁、光、电磁、红外线或半导体传播介质系统。计算机可读介质的示例可包括半导体或固态存储器、磁带、可拆装计算机软盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘的当前示例包括光盘-只读存储器(CD-ROM)、光盘-读 /写(CR-R/W)、DVD和蓝光光盘。还应该指出,本发明的实施例已参考不同的主题进行了描述。具体而言,某些实施例参考方法类型权利要求进行了描述,而其他实施例参考装置类型权利要求进行了描述。 但是,本领域的技术人员将通过上面和下面的说明理解,除非另有说明,否则,除了属于一类主题的特征的任意组合之外,认为本文档还披露与不同主题相关的特征之间的任意组合 (具体而言,方法类型权利要求的特征和装置类型权利要求的特征之间的任意组合)。本发明的上述方面以及进一步的方面将通过下文中描述的实施例示例变得显而易见,并且参考所述实施例示例进行说明,但是本发明并不限于所述实施例示例。
权利要求
1.一种用于在选择由信息技术系统或子系统的恢复时间目标(RTO)确定的可用性级别的同时平衡信息技术系统或子系统中的功耗和高可用性的方法,包括以下步骤导出并存储从一组功率值中的每个功率值到与启用功率的若干组件对应的恢复时间目标的转换,根据系统的活动和计划自动设置省电模式以实现预定的恢复时间目标,以及根据预定的恢复时间目标,通过将选定的冗余组件断电实现所述省电模式。
2.如权利要求1中所述的方法,进一步包括以下步骤在将选定的冗余组件断电期间或之后出现组件故障时自动将更多冗余组件通电。
3.如权利要求1中所述的方法,其中所述省电模式是通过功率控制模块进行配置的。
4.如权利要求3中所述的方法,其中所述功率控制模块定义高可用性模式和至少一个省电模式,其中在所述高可用性模式下,所有组件均是活动的,并且其中在所述至少一个省电模式下,所有冗余组件均被断电。
5.如权利要求1中所述的方法,在检测到故障时自动进入所述高可用性模式。
6.一种用于在选择由信息技术系统或子系统的恢复时间目标(RTO)所确定的可用性级别的同时平衡信息技术系统或子系统中的功耗和高可用性的系统,所述系统包括用于导出并存储从一组功率值中的每个功率值到与启用功率的若干组件对应的恢复时间目标值的转换的装置,用于根据系统的活动和计划自动设置省电模式以实现预定的恢复时间目标的装置,以及用于根据预定的恢复时间目标,通过将选定的冗余组件断电实现所述省电模式的装置。
7.如权利要求6中所述的系统,进一步包括用于在将选定的冗余组件断电期间或之后出现组件故障时自动将更多冗余组件通电的装置。
8.如权利要求6中所述的系统,其中所述信息技术系统为存储系统。
9.如权利要求8中所述的系统,其中所述存储系统具有与另一存储系统的远程复制关系,并且在其复制存储系统出现故障时进入高可用性模式。
10.如权利要求6中所述的系统,其中所述信息技术系统为服务器系统。
11.如权利要求10中所述的系统,其中所述服务器系统为服务器群集的一部分并且在所述群集中的其他节点出现故障时进入高可用性模式。
全文摘要
本发明披露了用于平衡通过冗余活动组件实现的高可用性需求和通过较少的活动组件实现的省电的系统和方法。所述高可用性需求可通过指定恢复系统中的故障所需的时间的恢复时间目标(RTO)表示。根据配置的RTO,所发明的系统配置最适合的功率模式。
文档编号G06F1/32GK102478955SQ20111025229
公开日2012年5月30日 申请日期2011年8月30日 优先权日2010年11月30日
发明者N·豪施泰因, P·希梅尔, T·加德勒根 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1