用于将服务从第一服务器转移到第二服务器的方法和系统的制作方法

文档序号:7952713阅读:330来源:国知局
专利名称:用于将服务从第一服务器转移到第二服务器的方法和系统的制作方法
技术领域
本发明一般地涉及刀片服务器。
背景技术
纤细、可热插拔的刀片服务器像书架中的书一样安装在单个机架中。每个刀片服务器都是独立的服务器,具有其自己的处理器、存储器、存储设备、网络控制器、操作系统和应用。刀片服务器只是滑入机架中的凹槽并插入中间背板或底板,与其他刀片服务器共享电源、风扇、软盘驱动器、交换机和端口。
刀片方法的优点包括消除了只是为添加和移除服务器而在机架中连接数以百计的电缆的需要。借助共享交换机和电源部分,释放了宝贵的空间,并且刀片服务器容易地实现了更高的密度。
真正、直接、实际的优点使刀片服务器技术成为迈向按需计算的正在进行的变革的重要贡献者。连同其他快速涌现的技术(网格计算、自主计算、Web服务、分布计算等),刀片服务器的效率、灵活性和成本高效正有助于使得对于计算能力,人们将联想到类似于电力的公用事业服务,即,在需要时随意使用。
刀片技术旨在帮助消除由传统服务器设计施加的旧有限制(其中每个服务器只能容纳一种类型的处理器)。机架中的每个刀片都是独立的服务器,运行其自己的操作系统和软件。复杂的冷却和电源技术因此可以支持具有不同速度和处理器类型的刀片的混合。
如此处所批判地认识的,刀片服务器机架中的刀片服务器可以累积客户设备并且其处理需要可以增加服务需求,并因此可以变得拥塞,降低了性能。本发明涉及平衡刀片服务器之间的负载。

发明内容
一种用于将客户端计算机的服务从第一刀片服务器转移到第二刀片服务器的方法,所述方法包括从所述第一刀片服务器将属于所述客户端计算机的客户端计算机标识符和存储信息发送到所述第二刀片服务器。所述第二刀片服务器使用所述存储信息和所述客户端计算机标识符来恢复对所述客户端计算机的服务。
在某些实现中,在所述发送行为之前,希望冻结所述客户端计算机和第一刀片服务器。另外,所述客户端计算机已被冻结的状况消息可以被发送给所述客户端计算机。当如根据数据率或存储的总字节所确定的,所述第一刀片服务器变得拥塞时,或当刀片故障即将发生时,所述方法可以被执行。
所述存储信息可以包括来自所述第一刀片服务器的直接访问存储设备信息,并且在特定的实现中,可以包括指向与所述客户端计算机关联的虚拟存储的指针,并且包括所述第一刀片服务器中与所述客户端计算机关联的精确存储器映射。所述客户端计算机标识符可以是所述客户端计算机的IP地址。在任何情况下,所述第二刀片服务器都可以使用所述存储信息在所述第二刀片服务器处重建与所述客户端计算机相关的所述第一刀片服务器的数据存储状态。
在另一个方面中,提供了一种计算机系统,所述系统包括为客户端计算机提供服务的第一刀片服务器和试图将为所述客户端计算机提供服务转移到其的第二刀片服务器。提供了逻辑以便在所述第二刀片服务器上重建与所述客户端计算机相关的所述第一刀片服务器的确切状态,同时所述第二刀片服务器被指向与所述客户端计算机关联的虚拟存储器。以这种方式,所述第二刀片服务器可以从所述第一刀片服务器恢复为所述客户端计算机提供服务。
在另一个方面中,提供了一种用于将为客户端计算机提供服务从第一刀片服务器转移到第二刀片服务器的服务,所述服务包括提供用于将存储信息和客户机信息从所述第一刀片服务器发送到所述第二刀片服务器的装置,以及提供用于使用所述存储信息和所述客户机信息在所述第二刀片服务器上重建所述第一刀片服务器的客户端计算机专用部分的确切状态的装置。所述服务还可以包括提供用于在所述客户端计算机与所述第二刀片服务器之间建立服务通信链路的装置。
参考附图可以最佳地理解关于本发明的结构和操作的详细说明,其中相同的标号指相同的部件,这些附图是


图1是本发明的服务器刀片系统的正面、俯视和右侧面分解透视图;图2是所述服务器刀片系统的后面部分的背面、俯视和左侧面透视图;图3是“旧”刀片的非限制性逻辑的流程图;图4是主管的非限制性逻辑的流程图;以及图5是“新”刀片的非限制性逻辑的流程图。
具体实施例方式
本受让人的美国专利No.6,771,499(在此引入作为参考)提出了一种可以与本发明一起使用的非限制性刀片服务器系统。为方便起见,图1和2示出了这样一个系统(通常被指定为10),其中一个或多个客户端计算机12通过有线或无线路径与刀片服务器中心(通常被指定为14)进行通信。本发明可以被用来平衡单个刀片中心中的刀片之间或分布在多个可能相同的刀片中心(每个都具有其自己的刀片服务器机架)中的刀片之间的负载。例如,图1示出了在配置和操作的所有重要方面都与刀片中心14相同并与其通信的第二刀片中心16。任何适当的计算设备都可以用作客户端计算机。
相应地,关注第一刀片中心14的非限制性实现,主机架CH1容纳了服务器刀片中心14的所有组件。多达十四或更多的处理器刀片PB1到PB14(或其他刀片,例如存储刀片)可以热插拔到机架CH1正面的十四个插槽中。术语“服务器刀片”、“处理器刀片”或只是“刀片”在此可互换地使用,但是应当理解,这些术语不限于仅执行“处理器”或“服务器”功能的刀片,还包括执行其他功能的刀片,如存储刀片,它通常包括硬盘驱动器并且其主要功能是数据存储。
处理器刀片提供了工业标准服务器的处理器、存储器、硬盘存储设备和固件。此外,它们还包括通过控制面板的键盘、视频和鼠标(“KVM”)选择、板载服务处理器和到媒体盒中的软盘和CD-ROM驱动器的入口。子卡通过板载PCI-X接口来连接并用于提供到交换机模块SM1-4的附加高速链路。每个处理器刀片还具有前面板,其带有五个LED以指示当前状况,加上四个按钮开关,用于电源开/关、处理器刀片的选择、复位和用于本地控制的核心转储的NMI。
刀片可以被“热插拔”而不影响系统中其他刀片的运行。服务器刀片通常被实现为单个槽插卡(394.2毫米乘226.99毫米);但是,在某些情况下单个处理器刀片可能需要两个插槽。处理器刀片可以使用任何微处理器技术,只要其符合服务器刀片系统的机械和电气接口以及电源和冷却要求。
为了冗余,处理器刀片具有两个信号和电源连接器;一个连接到中间背板MP的相应插槽的上部连接器,另一个连接到中间背板的相应下部连接器。处理器刀片通过以下中间背板接口与服务器刀片系统中的其他组件接口1)千兆比特以太网(每个刀片两个;必需);2)光纤通道(每个刀片两个;可选);3)管理模块串行链路;4)VGA模拟视频链路;5)键盘/鼠标USB链路;6)CD-ROM和软盘驱动器(“FDD”)USB链路;7)12VDC电源;以及8)各种控制信号。这些接口提供了与服务器刀片系统中的其他组件(如管理模块、交换机模块、CD-ROM和FDD)通信的能力。这些接口在中间背板上是成双的以便提供冗余。处理器刀片通常支持从媒体盒CDROM或FDD、网络(光纤通道或以太网)或其本地硬盘驱动器来引导。
媒体盒MT包括可以被连接到任何一个刀片的软盘驱动器和CD-ROM驱动器。媒体盒还容纳了接口板,其上安装了接口LED、用于测量入口空气温度的热敏电阻器和四端口USB控制器集线器。系统级接口控制包括电源、位置、过热、信息、通用缺省LED以及USB端口。
中间背板电路板MP被大约放置在机架CH1的中部并包括两行连接器;顶部行包括连接器MPC-S1-R1到MPC-S14-R1,底部行包括连接器MPC-S1-R2到MPC-S14-R2。因此,每一个刀片插槽都包括一对其中一个位于另一个之上的中间背板连接器(例如,连接器MPC-S1-R1和MPC-S1-R2),并且每对中间背板连接器都与每个处理器刀片的后端(在图1中不可见)处的一对连接器组成一对。
图2是所述服务器刀片系统的后面部分的背面、俯视和左侧面透视图。参考图1和2,机架CH2容纳了各种用于冷却、电源、控制和切换的热插拔组件。机架CH2滑入并闭锁在主机架CH1的后部中。
两个热插拔吹风机BL1和BL2包括向后弯曲的叶轮吹风机并提供对服务器刀片系统组件的冗余冷却。气流是从机架CH1的正面到背面。每个处理器刀片PB1到PB14都包括正面格栅以通入空气,并且基于矮版(low-profile)汽室的散热器被用来冷却刀片内的处理器。通过系统机架的总气流在1.778厘米(十分之七英寸)H2O静态压降时大约是每分钟8.495立方米(三百立方英尺)。在吹风机故障或移除的情况下,剩余吹风机的速度自动增加以维持所需的空气流量直到安装了替代单元为止。吹风机速度控制也通过不断监视入口空气温度的热敏电阻器来控制。服务器刀片系统组件的温度也被监视并且吹风机速度将自动增加以响应由各种温度传感器报告的上升温度级别。
四个热插拔电源模块PM1到PM4为处理器刀片和其他组件提供直流运行电压。一对电源模块为所有管理模块和交换机模块,以及插入插槽一到六的任何刀片提供电源。另一对电源模块为插槽七到十四中的任何刀片提供电源。在每对电源模块中,在第一电源模块出现故障或被移除的情况下,一个电源模块将用作另一个电源模块的备份。因此,至少需要两个有效的电源模块来为加载有十四个处理器刀片、四个交换机模块、两个吹风机和两个管理模块的完全功能和配置的机架提供电源。但是,需要四个电源模块来提供完全冗余和备份能力。电源模块被设计为在50/60Hz的200VAC到240VAC的交流输入电压范围之间运行并使用IEC320C14阳性设备连接器。电源模块将+12VDC输出提供给中间背板,所有服务器刀片系统组件都从该中间背板处获得电源。两个+12VDC中间背板电源总线被用于冗余并且执行冗余电源模块之间的输出负载的有效电流共享。
管理模块MM1到MM4是提供了基本管理功能(如控制、监视、报警、重新启动和诊断)的热插拔组件。管理模块还提供了管理共享资源所需的其他功能,如在处理器刀片之间切换公用键盘、视频和鼠标信号的能力。
在查看了一个非限制性刀片服务器系统14之后,现在将注意力转到图3,图3示出了可以由被看作“旧”刀片(即,会经历拥塞并且必须根据此处的逻辑将工作转移到“新”非拥塞刀片的刀片)的刀片中的一个或多个处理器执行的逻辑。图3-5的逻辑可以由刀片处理器、主管处理器和/或其他处理器中的一个或它们的组合来执行,并且所述逻辑可以被存储在诸如但不限于硬盘驱动器或固态存储器器件之类的数据存储设备上。
从图3的块20开始,每个刀片(包括所述“旧”刀片)监视自身(或者其将监视信息发送给下面讨论的主管)的拥塞。拥塞可以由被超过的数据速率阈值、和/或由被超过的存储的总字节阈值、和/或由其他度量、和/或由即将出现故障或需要维护(例如,在经过阈值数量的运行时间之后)的指示(例如高温、高噪音或震动等)来判定。如果在决策菱形块22判定拥塞,则在块24将拥塞警报发送给刀片中心14中的主管处理器。然后,所述“旧”刀片等待进一步的指令。
块26指示当在“旧”刀片处接收到来自主管的转移命令时,所述“旧”刀片将清单(payroll)消息发送给下面讨论的“新”刀片,并冻结客户端计算机操作。所述清单消息包括同时属于所述客户端计算机和被用来为客户端计算机12提供服务的刀片服务器中心14中的关联的直接访问存储设备(DASD,例如,硬盘驱动器)的信息。在特定的实施例中,在所述“清单”中发送的刀片中心存储信息可以包括指向拥塞的刀片中的所述客户端计算机的虚拟存储中的当前寻址位置的指针和与所述客户端计算机关联的所述拥塞的刀片中的精确的当前存储器映射,而所述客户机信息可以包括客户端计算机12的IP地址。转移后,所述“旧”刀片可以在块28被释放。
图4示出了可以被刀片中心14中的一个或多个主管处理器遵循的逻辑,其可以由专用刀片处理器来实现(如果需要)。在块30,监视刀片的性能,包括接收任何拥塞警报。如果接收到拥塞警报,则在块32进入DO循环,之后逻辑移动到块34以查找新的、非拥塞的刀片,该刀片可能在第二刀片中心16中,其优选地与所述拥塞的“旧”刀片基本相同。当在块36找到这样的“新”刀片时,上述转移命令被发送给所述“旧”刀片以使其冻结所述客户端计算机(或至少是涉及由所述刀片提供服务的客户机部分)并发送所述清单消息。如果需要,可以将指示所述客户机已被冻结的状况消息发送给所述客户端计算机。“冻结”表示不允许所述客户端计算机与所述拥塞的刀片之间的进一步交互,以便客户端计算机12不会以任何方式警告所述拥塞的刀片。
图5示出了可以被在图4中的块34处查找到的“新”刀片遵循的逻辑。开始于块38,接收并加载所述清单信息。在块40,所述“新”刀片使用所述清单信息来重建关于客户端计算机12的所述拥塞的“旧”刀片的旧DASD(存储器)状态。换言之,关于客户端计算机12的“旧”的拥塞刀片的确切状态在“新”刀片上被重建,同时“新”刀片借助清单中发送的指针被指向客户端计算机的虚拟存储中的正确位置。然后如果需要,所述“新”刀片认证所述客户端计算机并使用清单中发送的IP地址来恢复对客户端计算机12的服务。
尽管此处示出并详细描述的特定的“用于在刀片服务器中重新分配客户机的系统和方法”完全能够获得本发明的上述目的,但是应当理解,它是本发明的当前优选实施例,并且因此表示由本发明广泛地构想的主题,本发明的范围完全包括对本领域的技术人员显而易见的其他实施例,并且因此本发明的范围仅由所附权利要求来限制,其中除非明确声明,否则以单数引用的元素并非旨在表示“一个并且仅有一个”,而是表示“一个或多个”。设备或方法解决每个将由本发明来解决的问题是不必要的,因为它将被包括在本权利要求中。另外,本公开中的元素、组件或方法步骤都并非旨在专门用于公众,与这些元素、组件或方法步骤是否在权利要求中被明确地陈述无关。在此处没有明确的定义的情况下,权利要求项被给予与本说明书和申请历史并不矛盾的所有常规和惯用含义。
权利要求
1.一种用于将客户端计算机的服务从第一刀片服务器转移到第二刀片服务器的方法,所述方法包括从所述第一刀片服务器至少将属于所述客户端计算机的客户端计算机标识符和存储信息发送到所述第二刀片服务器;以及在所述第二刀片服务器处,使用所述存储信息和客户端计算机标识符来恢复对所述客户端计算机的服务。
2.根据权利要求1的方法,包括在所述发送行为之前冻结所述客户端计算机和第一刀片服务器。
3.根据权利要求1的方法,其中所述方法至少在所述第一刀片服务器变得拥塞时被执行,所述第一刀片服务器变得拥塞由以下各项中的至少一项来确定数据速率、存储的总字节,或即将发生刀片故障。
4.根据权利要求1的方法,其中所述第二刀片服务器在构造上与所述第一刀片服务器基本相同。
5.根据权利要求2的方法,包括将所述客户端计算机已被冻结的状况消息发送给所述客户端计算机。
6.根据权利要求1的方法,其中所述存储信息包括来自所述第一刀片服务器的直接访问存储设备信息。
7.根据权利要求1的方法,其中所述存储信息包括指向与所述客户端计算机关联的虚拟存储的指针和所述第一刀片服务器中的精确存储器映射,所述存储器映射与所述客户端计算机相关联。
8.根据权利要求7的方法,其中所述客户端计算机标识符包括所述客户端计算机的IP地址。
9.根据权利要求8的方法,其中所述第二刀片服务器使用所述存储信息在所述第二刀片服务器处重建与所述客户端计算机相关的所述第一刀片服务器的数据存储状态。
10.一种计算机系统,所述计算机系统包括为客户端计算机提供服务的至少第一刀片服务器;试图将为所述客户端计算机提供服务转移到其的至少第二刀片服务器;以及用于在所述第二刀片服务器上重建与所述客户端计算机相关的所述第一刀片服务器的确切状态的逻辑,所述第二刀片服务器被指向与所述客户端计算机关联的虚拟存储器中的位置,由此所述第二刀片服务器可以从所述第一刀片服务器恢复为所述客户端计算机提供服务。
11.根据权利要求10的系统,其中所述用于重建的逻辑使用从所述第一刀片服务器发送到所述第二刀片服务器的存储信息。
12.根据权利要求11的系统,其中所述存储信息包括来自所述第一刀片服务器的直接访问存储设备信息。
13.根据权利要求12的系统,其中所述存储信息包括指向与所述客户端计算机关联的虚拟存储的指针和所述第一刀片服务器中的精确存储器映射,所述存储器映射与所述客户端计算机相关联。
14.根据权利要求10的系统,其中所述第二刀片服务器在构造上与所述第一刀片服务器基本相同。
15.一种用于将为客户端计算机提供服务从第一刀片服务器转移到第二刀片服务器的服务,所述服务包括提供用于将存储信息和客户机信息从所述第一刀片服务器发送到所述第二刀片服务器的装置;提供用于使用所述存储信息和客户机信息在所述第二刀片服务器上重建与所述第一刀片服务器相关的客户端计算机专用部分的确切状态的装置;以及提供用于在所述客户端计算机与所述第二刀片服务器之间建立服务通信链路的装置。
16.根据权利要求15的服务,其中所述客户机信息包括IP地址。
17.根据权利要求15的服务,其中所述第二刀片服务器在构造上与所述第一刀片服务器基本相同。
18.根据权利要求15的服务,其中所述存储信息包括来自所述第一刀片服务器的直接访问存储设备信息。
19.根据权利要求15的服务,其中所述存储信息包括指向与所述客户端计算机关联的虚拟存储的指针和所述第一刀片服务器中的精确存储器映射,所述存储器映射与所述客户端计算机相关联。
全文摘要
当为客户端计算机提供服务的第一刀片服务器变得拥塞时,通过冻结所述第一刀片和客户机,然后将指向所述客户机的虚拟存储中的当前寻址位置的指针、与所述客户端计算机关联的所述第一刀片服务器中的精确存储器映射,连同所述客户机的IP地址一起发送到可能在不同刀片中心中的第二刀片服务器来将服务转移到所述第二刀片服务器。所述指针、映射和IP地址被用来在所述第二刀片中重建所述第一刀片的状态,在重建后,所述第二刀片恢复为所述客户机提供服务。
文档编号H04L29/06GK1821967SQ20061000768
公开日2006年8月23日 申请日期2006年2月17日 优先权日2005年2月18日
发明者D·C·克罗默, H·J·洛克, R·S·斯普林菲尔德, R·D·瓦尔特曼 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1