用于在刀片中心机架内加强供电控制的方法和装置的制作方法

文档序号:7967386阅读:189来源:国知局
专利名称:用于在刀片中心机架内加强供电控制的方法和装置的制作方法
技术领域
本发明一般涉及数据处理系统,并且具体地涉及被称作刀片式服务器的通信网络设备。
背景技术
将服务器作为通信网络内的设备的使用是在本领域中众所周知的。服务器是让访问该服务器所服务的网络的客户终端/站能获得可用的文件、数据库、打印、传真、通信或其它服务的装置。当服务器允许客户/终端站访问外部通信网络时,它有时被称作网关。服务器可具有不同尺寸、外形和种类。服务器可以遍布整个网络或者它们可以集中在集中式数据中心内。
集中式数据中心的发展已导致服务器设备的更小形状因子(formfactor),并导致处理单元密集度的增加,由此减少了计算基础设施的空间需求。在本领域中已将一个常用的形状因子命名为“刀片式服务器”,该服务器包括被构造为垂直插入机架的设备,该机架可容纳在公共背板(即,刀片中心)上共享电源和其他连接的多个设备。就像书架中的书一样,薄的可进行热交换的刀片式服务器(这里又称“刀片”)装配在单个机架内,而且每个服务器带有它自己的处理器、存储器、存储装置、网络控制器、操作系统以及应用的独立服务器。刀片式服务器滑入机架内的机架并插入中间板或背板,与其他刀片式服务器共享电源、风扇、软盘驱动器、开关和端口。对于仅添加和移除服务器却要担负着将数百条电缆拧起来穿过机架这一任务的任何人来说,刀片式服务器的方案的好处是很明显的。通过共享的开关和电源单元,释放了宝贵的空间,而且刀片式服务器能够容易得多地实现更高密集度。通过单个机架内的大量高性能服务器刀片,刀片技术实现了高层次的密集度。
尽管随着刀片中心的使用,单位处理能力的功耗和设备复杂度实际上可能降低了,但是由于计算设备的物理密集度已增加,并且由于整体计算能力已增加,所以对处理能力和冷却的功耗需求也已增强。刀片中心机架具有像供电和冷却这样的由机壳内多个组件共享的资源。在每个机架内提供负责管理机架内所有组件以及它们之间关系的管理模块。每个刀片分配有固定的功率值或冷却能力。如果任何刀片超过了其分配值,它可能促使整个机架超过阀值,这接下来将可能促使公共电源关闭,这导致其他刀片被关掉。另一个风险在于,任何超过其分配值的刀片都可能会导致其他刀片由于温度超过了它们的临界阀从而被关闭。
很可能地,与服务器相关联的最为紧迫的问题之一是可管理性,并且具体而言是被应用于安装在机架上的服务器的可管理性。这种类型的服务器内的可管理性的一个方面涉及分配供电资源,在过去的配置中已经由系统体系结构解决了该方面。当管理模块提出请求时,刀片上的服务处理器需要征求管理模块允许来进行加电或关闭。在这种配置中,刀片式服务器继续保持对它自己的功耗的控制。在过去的系统体系结构中,这种特征被保存下来,使得刀片式服务器可在不存在管理模块的环境下继续工作。尽管过去的体系结构如此处理了大多数情况,但是它们没有处理刀片式服务器误操作(即,没有恰当地响应管理模块的指示)的情况。因此,过去的刀片中心系统体系结构容易受到单个刀片不遵循供电管理所需协议的误操作(例如在不恰当的情形下选择加电)的影响,由此危及机架内其他刀片的工作。
考虑到上面的问题,需要有一种更可靠的系统和方法来加强刀片中心机架内的供电控制,以防止由于违规误操作的刀片式服务器引起供电和冷却资源过载。

发明内容
本发明通过提供一种用于改变刀片物理供电的所有权的机制来解决上述需求。当存在管理模块时,管理模块将维持刀片的供电控制。当不存在管理模块时,将刀片的供电控制切换给刀片上的服务处理器。这种对刀片供电控制的仲裁是通过在管理模块和控制刀片供电的开关之间的监视计时器机制来完成的。当管理模块存在于机架内并正常工作时,管理模块负责反馈(tickle)(即在离散的时间间隔上连续触发)该监视计时器。这种机制给管理模块提供了对供电的控制。如果管理模块误操作或被移除,那么只要监视计时器没有被管理模块所反馈就将供电控制切换给本地服务处理器。
本发明的一个目的是提供一种用于控制刀片中心内的刀片式服务器的供电的机制,由此当管理模块存在于机架中时供电控制由管理模块保留。
本发明的另一个目的是阻止机架误操作或有故障并因此不再遵从用于供电控制的体系结构协议的刀片式服务器在刀片中心机架内加电。
本发明的另一个目的是当管理模块做出指示时强制误操作的刀片式服务器断电。
因此,本发明的另一个目的是保护刀片中心机架内的刀片式服务器免于误操作或有故障的刀片式服务器的不利影响,例如由于公共电源过载引起的刀片中心机架内的全部供电损失,或者保护刀片中心机架内的刀片式服务器不会遭受过热负载。
本发明的另一个目的是通过提供针对像公共电源过载或过热负载这样的误操作或有故障的刀片式服务器的不利影响的容错来提供刀片中心机架内的刀片式服务器的安全和可靠工作。
本发明的另一个目的是提供一种可将供电独立地切换给占据刀片中心机架的插槽的刀片的装置。
本发明的另外一个目的是提供一种监视计时器机制,当管理模块不存在或者管理模块被询问时没有响应时,该机制可将供电开关的控制返还给各个刀片式服务器。
前述内容已经相当广地概括了本发明的特征和技术优点,以便使接下来的对本发明的详细描述可被更好地理解。在下文中将描述本发明附加的特征和优点,它们形成本发明的权利要求的主体。


为了更完整地理解本发明以及其优点,现在结合附图来参考后面的描述,在附图中图1说明了现有技术的刀片中心内的系统组件的实施例。
图2说明了本发明一实施例中的系统组件。
图3说明了本发明一实施例中的系统组件。
图4是现有技术的供电循环过程的流程图。
图5是本发明一实施例中的供电循环过程中加电部分的流程图。
图6是本发明一实施例中的供电循环过程中断电部分的流程图。
图7说明了刀片中心管理子系统的示意图。
图8说明了根据本发明实施例的刀片中心机架的前侧、顶侧和右侧的分解透视图。
图9说明了根据本发明实施例的刀片中心机架背部的背侧、顶侧和左侧的透视图。
具体实施例方式
在下面的描述中,给出了许多像具体的字或字节长度等等这样的具体细节,以提供对本发明的精确理解。然而,对于本领域技术人员而言,显然可以不以这种具体细节来实践本发明。在其他例子中,已经用方框图的形式示出了众所周知的电路,以便不让不必要的细节混淆本发明。对于绝大多数部分,关于计时考虑等等的细节已经被省略,因为这些细节对于获得对本发明的完整理解是不必要的,并且是属于本领域普通技术人员的技能之中的。
现在参看附图,其中所描述的单元不是必然按比例显示,并且其中同样或类似的单元在多个图中用同一标号来指定。
图1和4分别说明了现有技术的在刀片中心机架内用来控制供电的系统组件和体系结构。参考图1,刀片中心机架100包含下列与控制供电有关的组件驻留于机架插槽120中的刀片式服务器130;可包含其本身的管理模块处理器117的管理模块(MM)110;公共电源140和通风器150;以及这些组件间的通信接口125、141、151和131。在典型的现有技术的系统中,刀片130上的服务处理器(SP)135需要经由双向接口125向MM 110上的MM处理器117征求允许在由MM 110提出请求时加电或关闭。在这样的体系结构中,公共电源140经由电源总线145被路由给机架100内的所有插槽120。没有任何可供MM 110用来直接约束各个刀片130的供电的机制。MM 110经由总线141控制公共电源140,并且经由总线151控制通风器150。MM处理器117和SP 135之间的双向接口可以是多点RS-485接口。可以实现用于125的其它接口协议。控制总线141、151、131可以是I2C接口。
在图4中,通过刀片中心机架100的机架插槽120中的服务器刀片130的加电过程410和断电过程450的例子,说明了图1中的现有技术的系统的工作。在加电过程410中,除非存在刀片130否则不会采取任何行动411。如果不存在MM 110 412,那么刀片130不用外部控制就加电416。如果存在MM 110,那么刀片130需要从MM 110请求允许来加电413。MM 110负责决定414刀片130是否可以加电。MM 110将遵循有效地确定供电操作是否应该进行的任何规则。如果MM 110决定拒绝加电请求,那么刀片130可以用及时方式重复请求413用以重新考虑。如果MM 110允许加电请求413,那么MM 110向刀片130发出加电命令415,基于该命令,刀片被允许加电416。
在现有技术的情况下值得注意的是,刀片130维持由SP 135执行的在物理上和逻辑上的加电控制416,SP 135在总线131上为开关模块132发出命令以接通从公共电源140到刀片130的供电145。物理控制是指控制提供电源连接(例如,向关闭功率继电器开关的继电器线圈提供电流)的执行器阶段。逻辑控制是指发出命令以启用供电连接,由此控制供电决定的策略和时机。在一个例子中,可以使用像静态12V直流数字输出这样的数字控制信号来声明逻辑控制。在另外一个例子中,可以首先通过向控制单元发送二进制命令来声明逻辑控制,该控制单元接着直接响应于该二进制命令而执行另外的逻辑控制。在另外的例子中,可以使用合适的接口和驱动程序按并行或串行的顺序逐位地发送二进制命令。重要的是要注意可以使用逻辑电路或通过响应于软件命令的电路来转移逻辑控制。物理控制的转移一般将会包括对用来切换电源的控制路径进行重新路由。
同样重要之处在于在这种现有技术的体系结构中,刀片130可能会误操作以及忽略经由接口125来自MM 110、117的命令,或者可能在任何时候违背体系结构协议410。这种错误模式给该机架内其他刀片造成了极大的风险,尤其在误操作刀片130加电416的情况下更是如此。刀片的这种类型的违规可以导致功耗超过阀值,这样可以导致对整个刀片中心机架100的供电损失。可替换地,误操作刀片可以导致其他刀片因为温度超过它们的阀值而关闭。因此,单个误操作刀片130可能破坏MM 110将刀片机架100内的供电和温度维持在阀值以内的努力。
在450中说明了现有技术的断电过程。如果不存在MM 451,那么刀片可在任何时间直接进行断电454。如果存在MM 451,那么系统一直处于加电状态,直到该MM决定452发出断电命令453。在其他例子中,该MM在决定断电452时可以响应像供电切换或关闭命令这样的外部输入。一旦刀片从该MM接收到断电命令,它就必须使它自己进行断电454。注意在450的这种情况下,刀片130的误操作可能会拒绝断电453,这样就发生像上面针对情况410所提及的同样的对于资源管理的负面暗示。由于该MM处理器117不拥有对用于切换对刀片132供电的电路的物理控制,也不拥有对SP 135的逻辑控制,所以当误操作刀片130拒绝断电454时误操作刀片130同样会破坏MM 110管理供电和温度的努力。
本发明提供了一种用于改变刀片物理供电的所有权的机制。在图2中,说明了本发明的实施例的硬件配置。刀片230上的SP 235维持到刀片式服务器230上的开关模块232的接口231。然而,来自刀片230的电源总线接口222被路由通过位于机架插槽220上的附加控制开关225,出于这个目的对该开关225进行修改。机架200内的每个机架插槽220均包含附加的开关模块225,用于各自将供电221从公共电源240切换到刀片230。SP 235经由接口226与该MM处理器217进行通信。修改后的MM 210包含监视计时器模块215,MM处理器217经由总线212反馈该模块215。该监视计时器215可以经由总线接口211声明对该机架插槽控制开关225的控制。如果该MM 210出于任何原因不响应或者不存在,则该监视计时器215释放对开关225的控制(在一个例子中是通过关闭该开关),而同时由SP 235注册接口226中的超时,SP 235通过经由接口231来重新声明对开关232的本地控制而进行响应。图2的硬件配置中值得注意的是,在MM 210在机架200内管理供电和温度的努力中,可以强制刀片230遵循MM 210的决定,而不给刀片230留下误操作以及危害该机架200内其他装置的可能性。
在图3中,说明了本发明的硬件配置的可选实施例。刀片330上的SP335维持到机架插槽320内的开关模块325的接口331,开关模块325相应地进行修改。来自刀片330的电源总线接口322被直接路由通过控制开关325;刀片330不再需要它自己的电源切换电路。机架300内的每个机架插槽320都包含开关模块325,用于各自将供电321从公共电源340直接切换到刀片330。SP 335经由接口326与MM处理器317进行通信。修改后的MM 310包含监视计时器模块315,该MM处理器317经由总线312反馈该模块315。该监视计时器315可以经由总线接口311声明对该机架插槽控制开关325的控制。如果该MM出于任何原因不响应或不存在,则该监视计时器315释放对开关325的控制,而同时由SP 335注册接口326中的超时,SP 335通过经由接口331来重新声明对开关325的控制而进行响应。图3的硬件配置中值得注意的是,在MM 310在机架300内管理供电和温度的努力中,可以强制刀片330遵循MM 310的决定,而不给刀片330留下误操作以及危害该机架300内其他装置的可能性。
图5说明了本发明的一实施例中的供电循环过程中的加电部分510。当MM 210、310存在时,它将声明对刀片230、330的供电221的控制513。在一个例子中,MM 210通过经由接口226命令SP 235不操作开关232来声明控制。在另外一个例子中,MM 310通过经由接口326命令SP 335不操作开关325以及通过监视计时器315来声明控制,监视计时器315经由接口311增强325的控制。在另外一个例子中,MM 210通过在首先开启开关225的同时强制开关232关闭来声明控制。在本发明的实施例中可以实施用于可由MM 210或310声明对刀片供电的物理或逻辑控制的其他机制。在声明了控制之后,MM处理器217、317开始经由接口212、312反馈514监视计时器215、315。反馈包括以预定时间间隔向监视计时器215、315发送触发脉冲或消息。在本发明的范围内可以实施监视计时器215、315的其他配置,例如对通信226、326的直接监视,或者在机架插槽220、320上安装监视计时器215、315。尽管监视计时器215、315已被反馈,但是刀片230、330还可以从MM 210、310请求515加电。MM 210、310可决定516对刀片230、330加电,并且接下来在本发明的一个例子中,经由开关模块225、325来进行加电517。MM可以决定516不对刀片230、330加电,并且只要MM 210、310存在并进行响应518,刀片就可以继续发布另外的加电请求515,因为只要监视计时器215、315被反馈,刀片230、330就不具有对供电开关225、325的控制。如果MM 210、310停止518反馈监视计时器215、315,则监视计时器215、315经由到SP 235、335的总线211、311对供电开关225、325的控制进行重置519。在此时,刀片230、330接下来可以进行加电520。
图6说明了本发明的一实施例中的供电循环过程中的断电部分610。注意,可以在MM 210、310的控制下(其中情形503表示该过程的继续路径)或者在SP 235、335的控制下(其中情形504表示该过程的继续路径)来达到加电状态。如果刀片230、330由SP 235、335经由504加电520,那么如果MM 210、310被插入611,则MM 210、310声明控制513并且开始反馈514监视计时器215、315。如果MM 210、310没有被插入,那么控制保留在SP 235、335,并且刀片230、330可以将自己关闭614。如果MM 210、310存在并且正在反馈监视计时器215、315,那么路径503一直表示刀片230、330的加电状态,直到刀片发布断电请求616为止。如果MM 210、310决定对刀片230、330断电613,那么MM 210、310可以通过开启开关225、325并且中断到刀片的机架插槽220、320的电源总线221来对该刀片断电613。在本发明的其他实施例中可以实现用于执行断电613的其他辅助机制,例如经由总线231指示SP 235物理地使开关232断电,或经由总线331指示SP 335物理地使开关325断电。然而,MM 210、310总是维持对开关225、325的优先的物理和逻辑控制,以加强在刀片230、330误操作情况下的供电策略。如果MM 210、310决定612不对刀片230、330断电并且MM 210、310继续反馈监视计时器615,那么刀片就没有别的选择而只有发布另外一个断电请求。如果MM 210、310停止615反馈监视计时器215、315,则监视计时器215、315经由到SP 235、335的总线211、311对供电开关225、325的控制进行重置519。在此时,刀片230、330接下来可以进行断电614。在断电状态,机架插槽220、320没有排除对于操作SP 235、335来说足够的补救性的电源以及刀片230、330上其他必要的控制电路。
图7是刀片中心机架管理子系统的示意图,其示出了之前通过MM210、310示意性表示的各个管理模块MM1-MM4的工程细节,并且示出了在之前对刀片中心机架200、300示意性的表示中所包含的各个组件。参考该图,每个管理模块具有到从开关模块SM1至SM4中的每个的独立的以太网链路。这样,管理模块MM1经由以太网链路MM1-ENet1至MM1-ENet4被链接到开关模块SM1至SM4,并且管理模块MM2经由以太网链路MM2-ENet1至MM2-ENet4被链接到开关模块。此外,管理模块还经由两种众所周知的串行I2C总线SM-I2C-BusA和SM-I2C-BusB耦合到开关模块,这两种串行总线提供了在管理模块和开关模块间的“带外”通信。类似地,管理模块还经由两种串行I2C总线(对应于接口241、341)PM-I2C-BusA和PM-I2C-BusB耦合到供电模块(之前用240、340来示意性地表示)PM1至PM4。另外两种I2C总线Panel-I2C-BusA和Panel-I2C-BusB耦合到媒体盘MT和背板。通过独立的串行总线Fan1和Fan2(对应于接口251、351)来控制吹风机BL1和BL2(之前用250、350来示意性地表示)。两种众所周知的RS485串行总线RS485-A和RS485-B(对应于接口226和326)耦合到服务器刀片PB1至PB14,用于管理模块和服务器刀片之间的“带外”通信。
图8说明了服务器刀片系统的前侧、顶侧和右侧的分解透视图,其示出了之前对刀片中心机架200、300的示意性描述中所包含的各个组件的工程细节。参考该图,主机架CH1容纳有服务器刀片系统的所有组件。可将多至14个处理器刀片PB1至PB14(或像存储刀片这样的其他刀片)热插入进机架CH1前面的14个插槽内。虽然在整个说明书和权利要求书中使用术语“服务器刀片”、“刀片式服务器”、“处理器刀片”或者只是“刀片”,但是应当理解的是这些术语并不限于只执行“处理器”或“服务器”功能的刀片,而是还包括执行其他功能的刀片,例如典型地包括硬盘驱动器并且首要功能是数据存储的存储刀片。
处理器刀片提供工业标准服务器的固件、处理器、存储器和硬盘存储装置。此外,它们包括经由控制面板的键盘、视频和鼠标(“KVM”)选项、板上服务处理器和对媒体盘内的软盘和CD-ROM驱动器的访问。子卡可以经由板上PCI-X接口来进行连接并且被用于提供到多种模块的额外的高速链路。每个处理器刀片还有前面板,该前面板具有5个用来指示当前状态的LED,加上用于加电/断电、选择处理器刀片、重置和用于本地控制的信息转储的NMI的四个按钮开关。
刀片可以进行“热交换”,而不会影响系统内其他刀片的工作。服务器刀片典型地实现成单个插槽卡(394毫米×227毫米);然而,在某些情况下单个处理器刀片可能需要两个插槽。只要处理器刀片符合服务器刀片系统的供电和冷却需求以及机械和电接口,它就可以使用任何微处理器技术。
为了冗余,处理器刀片有两个信号和电源连接器;一个连接到中间板MP的相应插槽的上连接器(如下面所描述),而另一个连接到中间板的相应的下连接器。处理器刀片经由中间板接口与服务器刀片系统内的其他组件相接口,该中间板接口包括1)吉比特以太网;2)光纤信道;3)管理模块串行链路;4)VGA模拟视频链路;5)键盘/鼠标USB链路;6)CD-ROM和软盘驱动器(“FDD”)USB链路;7)12VDC电源;以及8)各种混杂的控制信号。这些接口提供了与服务器刀片系统内像管理模块、开关模块、CD-ROM和FDD这样的其他组件进行通信的能力。在中间板上复制这些接口以提供冗余。典型地,处理器刀片支持从媒体盘CDROM或FDD、网络(光纤信道或以太网)、或者它的本地硬盘驱动器上进行的引导。
媒体盘MT包括可被耦合到14个刀片中的任何一个刀片的软盘驱动器和CD-ROM驱动器。媒体盘还容纳有其上安装着接口LED、用于测量进气温度的热敏电阻和4端口USB控制器集线器的接口板。系统级接口控制由电源、位置、过热、信息以及通用故障LED和USB端口所组成。
中间板电路板MP大致位于机架CH1的中间,并且包括两行连接器;顶上一行包括连接器MPC-S1-R1至MPC-S14-R1,而底下一行包括连接器MPC-S1-R2至MPC-S14-R2。因此,这14个插槽中的每个包括一对中间板连接器,其中一个位于另一个上(例如,连接器MPC-S1-R1和MPC-S1-R2),而每对中间板连接器与位于每个处理器刀片后沿的一对连接器(图8中不可见)相配对。
图9是服务器刀片系统背部的背侧、顶侧和左侧的透视图。参考图8和9,机架CH2容纳有用来冷却、供电、控制和切换的各种可热插入的组件。机架CH2滑进并锁入主机架CH1的背部。
两种可热插入的吹风机BL1和BL2(之前由250、350来示意性地表示)包括反向弯曲叶轮式吹风机并且给服务器刀片系统组件提供冗余的冷却。气流是从机架CH1的前部到机架CH1的背部。处理器刀片PB1至PB14中的每个包括前格栅以允许空气进入,并且使用了基于小尺寸的蒸汽室的散热器来冷却刀片内的处理器。穿过系统机架的整个气流在0.7英寸的H2O静态压降下为大约300CFM机架。在吹风机故障或被移除的事件中,其余吹风机的速度自动增长以维持所需的气流,直到安装了替代单元为止。吹风机速度控制也是经由不间断地监视入气温度的热敏电阻来控制的。服务器刀片系统组件的温度也被监视,并且响应于由各种温度传感器所报告的温度上升程度,吹风机的速度将自动增加。
四个可热插入的电源模块PM1至PM4(之前由240、340示意性地表示)给处理器刀片和其他组件提供DC工作电压。一对电源模块给所有管理模块和开关模块加上任何插入插槽1-6的刀片供电。其他对的电源模块给插槽7-14中的任何刀片供电。在每对电源模块内,一个电源模块在第一个电源模块出故障或被移除的事件中充当其他电源模块的备份。因此,最少需要两个有效电源模块来给装载有14个处理器刀片、4个开关模块、2个吹风机和2个管理模块210的具有全部特征和完整配置的机架供电。然而,需要四个电源模块来提供完整的冗余和备份能力。电源模块被设计成在50/60Hz的200VAC至240VAC的AC输入电压范围之间进行工作,并且使用IEC320C14的插入式电器耦合器。电源模块将+12VDC的输出提供给所有服务器刀片系统组件从中获得它们的供电的中间板。两个+12VDC的中间板电源总线被用于冗余,并且执行在冗余的电源模块之间的输出负载的有效电流共享。
管理模块MM1至MM4(之前面由210、310来示意性地表示)是可热插入的组件,其提供像控制、监视、警告、重启和诊断这样的基本管理功能。参考图2和3,在本发明的实施例中,管理模块210、310包含MM处理器217、317和带有到各个开关模块225、325的接口211、311的监视计时器215、315。管理模块还提供管理共享资源所需的其他功能,例如在处理器刀片之间切换公共键盘、视频和鼠标信号的能力。
虽然已经详细地描述了本发明及其优点,但是应当理解,在不背离如权利要求所限定的精神和范围的情况下,可以在此做出各种改变、替代和变型。
权利要求
1.一种用于控制对刀片中心机架内的刀片式服务器的供电的方法,其中管理模块被安装在所述刀片中心机架内,所述方法包括以下步骤将已切换到占据所述刀片中心机架内的机架插槽的刀片式服务器的电源连接的物理和逻辑控制转移给所述管理模块。
2.根据权利要求1所述的方法,还包括以下步骤启用由所述管理模块进行反馈的监视计时器。
3.根据权利要求1所述的方法,其中当在所述刀片中心机架内安装所述刀片式服务器时,所述刀片式服务器占据多个机架插槽。
4.根据权利要求1所述的方法,其中所述将物理和逻辑控制转移给所述管理模块还包括以下步骤所述管理模块与位于所述刀片式服务器上的服务处理器进行双向通信;所述服务处理器将对位于所述刀片式服务器上的电源切换电路的所述控制释放给所述管理模块;以及所述管理模块声明对位于所述机架上用于将供电切换给由所述刀片式服务器所占据的各个机架插槽的电源切换电路的控制。
5.根据权利要求4所述的方法,还包括以下步骤所述管理模块强制位于所述刀片式服务器上的电源切换电路关闭。
6.根据权利要求4所述的方法,还包括以下步骤所述服务处理器将对位于所述机架上用于将供电切换给由所述刀片式服务器所占据的各个机架插槽的所述电源切换电路的所述控制释放给所述管理模块。
7.根据权利要求2所述的方法,还包括以下步骤当所述管理模块在已经超时后仍无法反馈所述监视计时器时,触发所述监视计时器转移所述控制;以及将已切换到所述刀片式服务器的所述电源连接的所述控制转移给所述服务处理器,其中所述电源连接包括位于所述刀片式服务器上的电源切换电路和位于所述机架中的电源切换电路,用来将供电切换给由所述刀片式服务器所占据的所述机架插槽。
8.一种刀片中心机架装置,机架包括多个用来接收刀片式服务器的机架插槽;管理模块;由所述多个机架插槽公用的、用来给占据所述多个机架插槽的多个刀片式服务器供电的电源;以及装在所述机架中用于独立地将供电切换给由刀片式服务器所占据的所述多个机架插槽中的每个机架插槽的电路,其中当从所述机架插槽中移除所述刀片式服务器时,所述机架内的所述电路保持可以工作。
9.根据权利要求8所述的装置,还包括由所述管理模块进行反馈的监视计时器,其中所述监视计时器还包括用来将对位于所述机架内用于独立地将供电切换给由刀片式服务器所占据的所述多个机架插槽中的每个机架插槽的所述电路的物理和逻辑控制转移给所述管理模块或者转移给占据机架插槽的刀片式服务器的电路。
10.根据权利要求8所述的装置,其中所述管理模块还包括用来对位于所述机架内用于独立地将供电切换给由刀片式服务器所占据的所述多个机架插槽中的每个机架插槽的电路进行物理和逻辑控制的电路。
11.根据权利要求8所述的装置,其中所述管理模块还包括用来对位于所述刀片式服务器上的电源切换电路进行物理和逻辑控制的电路。
12.一种刀片式服务器,包括用于通信和资源管理功能的服务处理器,其中所述服务处理器还包括被使能将对用来把供电切换给刀片式服务器的电源切换电路的物理和逻辑控制释放给刀片中心管理模块的电路;以及被使能响应于与所述管理模块的通信中的超时,向所述刀片式服务器重新声明对用于将供电切换给所述刀片式服务器的电源切换电路的物理和逻辑控制。
13.根据权利要求12所述的刀片式服务器,还包括用于在位于刀片中心机架上用来将供电切换给由所述刀片式服务器所占据的各个机架插槽的电路与被使能用于数据处理功能的包括CPU、存储器和本地总线的电路之间的逻辑上不可中断的供电连接的电路。
14.根据权利要求12所述的刀片式服务器,其中用来将供电切换给所述刀片式服务器的所述电源切换电路位于所述刀片式服务器上。
15.根据权利要求12所述的刀片式服务器,其中用来将供电切换给所述刀片式服务器的所述电源切换电路位于用来独立地将供电切换给由所述刀片式服务器所占据的机架插槽的刀片中心机架内。
全文摘要
一种用于改变对刀片中心机架内的刀片式服务器的物理供电的所有权的机制,所述机制防止误操作刀片危及所述机架内的其他组件。当管理模块不存在时,将对所述刀片的供电控制切换给所述刀片上的服务处理器。这种对刀片的供电控制的仲裁是通过实现监视计时器机制来完成的。当所述管理模块存在于所述机架内并正常工作时,所述管理模块负责对所述监视计时器进行反馈。这种机制给所述管理模块提供了对供电的控制。如果所述管理模块误操作或被移除,那么只要所述监视计时器没有被反馈就将供电控制切换给所述刀片式服务器上的本地服务处理器。
文档编号H04L12/24GK1920746SQ20061011599
公开日2007年2月28日 申请日期2006年8月22日 优先权日2005年8月23日
发明者A·E·默金, T·M·布雷, J·E·伯兰 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1