丛集系统之系统管理架构的制作方法

文档序号:7654772阅读:262来源:国知局
专利名称:丛集系统之系统管理架构的制作方法
技术领域
本发明系关于一种丛集系统的系统管理,特别是一种安装于单一机体上之
小型丛集系统之机体层级(chassis-level)系统管理架构。
背景技术
图1系显示机架安装(rack-mount)式丛集系统的典型实现。每一机架型服 务器ll系为一具有区域管理硬件/韧体之独立的服务器,例如BMC (基板管 理控制器;Baseboard Management Controller)型模块。此种区域管理硬件包括 小型微处理器,以监控各个机架型服务器ll。网络切换器12连接机架型服务器 ll和外部管理主机B。在某些例子中,网络可分成"管理网络"和"数据通讯网 络"。外部管理主机系为一独立的计算机,以执行整个系统阶层管理以及处理工 作排定和/或平衡。因此一丛集系统有可能透过多个外部管理主机来监控。为了 建立以机架安装式系统为基础之丛集系统,必须进行许多系统/网络改变。虽然 此类系统上能支持丛集,但仍必须有一专用的系统阶层之中央管理模块来管理
换句话说,小型丛集系统通常不支持机体层级中央管理。仅某些特定之高阶 系统具有专用之机体层级中央管理模块。虽然在丛集系统中,计算节点可能可 以在不需先启动主节点的状态下启动,但使用者仍必须一个节点接着一个节点 地起动系统,亦即使用者将需要按压大量的按钮。
图2系显示刀锋式(bladetype)丛集系统的典型实现。同样地,计算节点
23系为具有远程管理之区域管理硬件/韧体的独立计算机。为了实现专用之机体
层级的中央管理模块21,机体管理链路22作为除了远程管理之网络接口 (数据
通讯网络24和网络切换器25)以外之特定接口。外部管理主机26可为独立计
算机,透过网络切换器监控整个刀锋系统20的丛集工作,并透过一通讯路径27
(标准网络接口,例如以太网络)和中央管理模块21存取系统管理信息。基
本上,机体层级的中央管理模块21将如同一个具有机体层级管理之服务处理器
(Service processor)的独立计算机般的运作,藉以将整个机体内的多数单元管理成 「一个单一系统」。
此类型系统需要专用的服务处理器或机体层级中央管理模块及一特定接口 (机体管理链路22),以从服务处理器存取各个计算节点23。因此,许多模块 必须被客制化,以支持该特定界面。然而,发展专用之服务处理器,并运用具 有低阶装置和管理应用之独立操作系统(OS),着实太过于复杂。

发明内容
鉴于以上的问题,在一预设计算节点上,本发明利用与其它计算节点相同/常用的硬件,实现丛集/系统管理网络架构的特殊拓扑(topology),并提供机体 层级(chassis-level)中央管理模块的功能。本发明将为具有成本效益之系统管 理解决方案。在此架构下,小型丛集系统将能提供一机体中的高阶伺服系统所 具有的类似功能。
根据本发明一实施例,本发明提供一丛集系统,此丛集系统包含一特定之系 统管理架构以管理其复数计算节点。此系统管理架构主要包含复数个BMC(基 板管理控制器;Baseboard Management Controller),分别设置于计算节点上,以 远程监控计算节点;以及包含管理网络切换器和复数个第一网络接口,以提供 于此些计算节点之BMC之间的私有网络链接;其中,在此些计算节点中之某预 设计算节点上,额外网络接口取代第一网络接口连接管理网络切换器,且其BMC 透过第一网络接口连接一外部管理主机。
根据本发明一实施例,每个计算节点包含一芯片组,并且在此些计算节点中 之预设计算节点上,芯片组系透过一系统输入/输出总线(system I/O bus)直接 连接第一网络接口,并透过BMC间接连接第一网络接口。在某些情况下,在此 些计算节点中之该预设计算节点上,芯片组系透过KSC (键盘控制器型; Keyboard Controller Style)接口连接BMC。此外,每一第一网络接口和额外网 络接口中可包括一网络接口控制器。并且,在此些计算节点中之该预设计算节 点上,其BMC可透过一边带(sideband)系统管理总线(SMBus)连接网络接口 控制器。
根据本发明一实施例,在此些计算节点中之预设计算节点上, 一操作系统可 提供网络地址转发服务(NetworkAddress Translation Service),以允许外部管理 主机存取每一计算节点。此系统管理架构可进一步包括 一数据网络切换器, 并且每个计算节点具有一第二网络接口,以连接数据网络切换器,而作为讯息 传递接口 (MPI)或网络储存的应用。
此系统管理架构可进一步包括一高速网络切换器,以连接每一计算节点并利 于计算节点间之高频宽通讯。 一附加网络接口控制器可设置在高速网络切换器 或每一计算节点上。在某些情况下,每一第一网络接口和额外网络接口系兼容 于IPMI (智能型平台管理接口 ; Intelligent Platform Management Interface)规格。
本发明更进一步之应用范围将变的明显的从以下详细之描述。然而,当举 出本发明较佳之具体实施例时,藉由图解之方式详细描述及具体例子应容易被 了解,在技艺中从这详细之发明各种修饰与变更在本发明之本意及范围内将变 成显而易知的技术。


图1系为习知技术中,机架安装(rack-mount)式丛集系统的典型实现之概 要结构图。 —
图2系为习知技术中,刀锋式(bladetype)丛集系统的典型实现之概要结 构图。
图3系为根据本发明一实施例之小型丛集系统之系统管理架构的概要结构图。
图4系为根据本发明另一实施例之预设计算节点的可应用设计之一的细部 概要结构图。
图5系为根据本发明另一实施例之小型丛集系统之系统管理架构的概要结 构图。
图6系为根据本发明另一实施例之预设计算节点的可应用设计之另一个的 细部概要结构图。
图7系为根据本发明另一实施例之小型丛集系统之系统管理架构的概要结 构图。
具体实施例方式
以下举出具体实施例以详细说明本发明之内容,并以图式作为辅助说明。说 明中提及之符号系参照图式符号。
请参阅图3,系为在具有复数个计算节点之小型丛集系统上,根据本发明一 实施例之系统管理架构的概要方块图。基本上,在本发明中,所有计算节点几 乎系相同的。仅一预设计算节点具有些许变化,即其应用且重新配置共同的硬 件。如图3所示,仅预设计算节点CN310不同于其它计算节点CN320、 CN330、 CN340、 CN350。
每个计算节点CN320/CN330/CN340/CN350主要包括二个处理器CPU、 一 个或多个芯片组以及一个基板管理控制器BMC。计算节点CN320、 CN330、 CN340、 CN350的典型实现系相当类似于1-U型独立的伺服硬件。在每个计算 节点CN320/CN330/CN340/CN350上,诸如南桥(South Bridge)或其它积体桥 芯片之类的芯片组系与BMC相连;并且BMC系连接至一对应之第一网络接口 321/331/341/351,以提供与管理切换器360的连结并形成私有网络链接。管理切 换器360主要系用来执行系统管理,其如同于丛集系统的丛集管理。于各个计 算节点CN320/CN330/CN340/CN350上,BMC撷取系统管理信息(包括操作参 数,例如系统事件、温度、冷却风扇转速、电力模式、操作系统(OS)状态 等),并送出通知给远程主机,以分别管理计算节点CN320、 CN330、 CN340、 CN350的运作。接续将更进一步的说明于外部管理主机与各个计算节点CN320/ CN330/CN340/CN350之BMC之间的通讯路径。
为了避免造成于习知技术中因服务处理器或机体层级中央管理模块而生的 基础系统改变,仅在预设计算节点CN310上加入并调整共同硬件。预设计算节 点CN310包括一额外网络接口 312,其取代第一网络接口 311与管理网络切换 器360和芯片组连接,藉以允许预设计算节点CN310加入与管理网络切换器360 和其它计算节点CN320、 CN330、 CN340、 CN350的私有网络链接。换句话说, 于预设计算节点CN310上之BMC可透过第一网络接口 311连接一外部管理主 机。同时,于预设计算节点CN310上之芯片组亦透过系统输入/输出总线(system I/O bus) 313,例如PCI (周边组件互连)或PCI-Express (高速周边组件互连), 连接第一网络接口311。换言之,于预设计算节点CN310上,芯片组系透过系统输入/输出总线313"直接"连接该第一网络接口311,其如同于透过BMC"间接" 连接第一网络接口 311。此种设计将允许预设计算节点CN310提供与习知技术 中之伺服控制器或中央管理模块相同之功能。请参阅图4,其系显示根据本发明另一实施例之预设计算节点的可应用设计 中之1的细部结构。在预设计算节点CN310上,芯片组透过系统输A/输出总线 313连接网络接口控制器NICO 。网络接口控制器NICO透过端口接口和外部网 络链接进一步地连接至外部管理主机。另一系统输入/输出总线316连接芯片组 和另一网络接口控制器NIC1。网络接口控制器NIC1透过另一端口接口和私有 网络连结(例如网络缆线)进一步地连接管理网络切换器360。实际上,第一 网络接口 311主要包括网络接口控制器NICO和端口接口。同样地,额外网络接 口312主要包括网络接口控制器NIC1和另一端口接口。在某些状况下,第一网 络接口 311和额外网络接口如同于图3中之计算节点CN320/CN330/ CN340/CN350的第一网络接口 321/331/341/351,其系与IPMI (智能型平台管理 接口)规格兼容。此外,在预设计算节点CN310上,BMC透过KSC (键盘控 制器型)接口314连接芯片组,并且透过边带SMBus (系统管理总线)315连 接网络藉面控制器NICO。依靠那些修改,在预设计算节点CN310上将可提供如 同于习知技术中之伺服控制器或中央管理模块的功能。首先,透过第一网络接口 311外部管理主机将可存取预设计算节点CN310 上之BMC。此BMC可直接从设置于预设计算节点CN310上的传感器撷取系统 信息,以及从芯片组(透过KSC接口314)和硬件监控器(未显示)间接取得。 然后,再将系统信息透过BMC、边带SMBus315、网络接口控制器NICO及端 口接口,即透过BMC和第一网络接口311,传送给外部管理主机。相对地,外 部管理主机可透过BMC传送直接指令以控制预设计算节点CN310,并可管理预 设计算节点CN310。在实际实施上,由于预设计算节点CN310具有机体层级管理功能的特征, 因此其必需先启动。为了启动预设计算节点CN310,使用者需使用远程开机(power-on)机制(如IPMI (智能型平台管理接口)式接口)或简单地按压物 理电源钮。 一但预设计算节点CN310重新启动(boot-up),名为"系统管理软件 (System Management Software)"之应用程序将会自动执行。系统管理软件可透 过所有计算节点与管理网络切换器360之间的私有网络链接启动图3中其余的 计算节点CN320、 CN330、 CN340、 CN350。抑或使用者可使用物理按钮手动起 动其余的计算节点。于预设计算节点CN310上运作之系统管理软件可要求设置于图3中其余的 计算节点CN320、 CN330、 CN340、 CN350上之BMC,以监控传感器,并且像 服务处理器一样透过所有计算节点与管理网络切换器360之间的私有网络链接 发送部份系统事件信息。为了从外部网络主机存取各个计算节点CN31 (VCN320/ CN330/CN340/CN350,于预设计算节点CN310上运作之OS (操作系统)必需 提供网络地址转发服务(NetworkAddress Translation Service)。即藉由网络地址 转发服务,外部管理主机将能透过元来发送的数据而定义网络接口控制器MCO或NIC1。最后,外部管理主机可透过第一网络接口 311和BMC与预设计算节 点CN310取得联系,其如同于透过额外网络接口312、芯片组、系统输入/输出总线313和第一网络接口 311与其它计算节点CN320、 CN330、 CN340、 CN350取得联系。请参阅图5。于小型丛集系统内能进一步提供其它内部的私有网络链接。每 个计算节点CN310/CN320/CN330/CN340/CN350提供有一第二网络接口 317/322/332/342/352,以连结对应之芯片组和数据网络切换器370,并且形成其 它内部的私有网络链接。数据网络切换器370系作为MPI (讯息传递接口)或 网络储存的应用。在典型丛集系统中,MPI通常用于数据通讯。图6系显示根 据本发明另一实施例之预设计算节点CN310的可应用设计中之另I个的细部结 构。于此,预设计算节点CN310包括三个网络接口控制器NIC0、 NIC1、 NIC2, 以执行丛集系统上的所有网络功能。其它计算节点CN320、 CN330、 CN340、 CN350会只具有二个网络接口控制器。此外,其它网络接口,例如以太网络(Ethernet)、无限宽带(InfmiBand)、 10 Giga-bit Ethernet (百亿位以太网络) 等,亦可设置于各个计算节点CN310/CN320/CN330/CN340/CN350上。请参阅图7,计算节点CN310、 CN320、 CN330、 CN340、 CN350连接至高 速网络切换器380,即提供高频宽网络之网络切换器,例如10 Giga-bit Ethernet 或InfmiBand。高速网络切换器380有助于形成另一内部之私有网络于丛集系统 上,以助于计算节点CN310、 CN320、 CN330、 CN340、 CN350之间的高频宽 通讯。对此种设计而言, 一定必须设置额外网络接口控制器;不过此网络接口 控制器可任意设置于高速网络切换器380或各个计算节点上CN310、 CN320、 CN330、 CN340、 CN350。综上所述,本发明可在不需诸如专用之服务处理器模块之特殊硬件的情况 下,提供机体层级中央管理功能。本发明仅利用共有硬件来达成此特征,并且 其系为相当有经济效益的之小型丛集系统的实现。此外,其将完全涵盖所有内 部网络拓扑,且使用者不需涉及内部网络结构。就使用者的观点,此类型的实 现就像是单一的计算机系统。并且,使用者可免除相当复杂的网络设定以组成丛集系统。此外,本发明仅利用系统管理的共有和标准接口,例如IPMI。因 此,在提供服务处理器应用的发展上系容易的。于此,系以标准规格定义大部分的基本功能,且实际发展系为在预设计算节点上执行标准os的应用层级,此预设计算节点实际上系扮演类似于主节点(headnode)的脚色。其会比利用独 立式OS、低阶装置驱动器和管理应用来发展专用服务处理器简单许多。
权利要求
1. 一种系统管理架构,用以管理一丛集系统的复数个计算节点,其特征在于该系统管理架构包括复数个基板管理控制器,分别设置于该些计算节点上,以远程监控该些计算节点;以及一管理网络切换器及复数个第一网络接口,提供该些计算节点之该些基板管理控制器之间的私有网络链接;其中,在该些计算节点中之一预设计算节点上,一额外网络接口取代该第一网络接口连接该管理网络切换器,且该基板管理控制器透过该第一网络接口连接一外部管理主机。
2. 如权利要求i所述之系统管理架构,其中每一该计算节点各包括一芯片 组,且在该些计算节点中之该预设计算节点上,该芯片组透过一系统输入/输出总线(system I/O bus)直接连接该第一网络接口 ,如同透过该基板管理控制 器间接连接该第一网络接口 。
3. 如权利要求2所述之系统管理架构,其中在该些计算节点中之该预设计 算节点上,该芯片组透过KSC (键盘控制器型)接口连接该基板管理控制器。
4. 如权利要求1所述之系统管理架构,其中每一该些第一网络接口和该额 外网络接口均包括一网络接口控制器。
5. 如权利要求4所述之系统管理架构,其中在该些计算节点中之该预设计 算节点上,该基板管理控制器透过一边带系统管理总线(SMBus)连接该网络接 口控制器。
6. 如权利要求1所述之系统管理架构,其中在该些计算节点中之该预设计 算节点上, 一操作系统提供网络地址转发服务(Network Address Translation service)以允许该外部管理主机存取每一该计算节点。
7. 如权利要求1所述之系统管理架构,更包括 一数据网络切换器,且每 一该计算节点具有一第二网络接口,以连接作为讯息传递接口 (MPI)或网络储 存的应用之该数据网络切换器。
8. 如权利要求1所述之系统管理架构,更包括 一高速网络切换器,以连 接每一该计算节点,并协助该些计算节点之间的高频宽通讯。
9. 如权利要求8所述之系统管理架构,其中一额外网络接口控制器设置在 该高速网络切换器或每一该计算节点上。
10. 如权利要求1所述之系统管理架构,其中该些第一网络接口和该额外网 络接口中之每一个与IPMI (智能型平台管理接口)规格兼容。
全文摘要
一种系统管理架构,应用于管理一丛集系统中之复数个计算节点。每一计算节点基本上包括一基板管理控制器(BMC),以进行区域管理。于这些计算节点中,一预设计算节点将其基板管理控制器透过一额外网络接口连接一管理网络切换器,以进行丛集/系统管理。一个通常用以连接管理网络切换器而与计算节点通讯之第一网络接口,于此用于此预设计算节点的基板管理控制器,以连接外部管理主机。于此预设计算节点上之一芯片组亦透过一系统输入/输出总线(system I/O bus)和第一网络接口连接外部管理主机。于此预设计算节点上,操作系统提供网络地址转发服务(Network Address Translation service)以允许外部管理主机存取各个计算节点。
文档编号H04L12/28GK101227355SQ20071011165
公开日2008年7月23日 申请日期2007年6月7日 优先权日2006年8月16日
发明者平井智则 申请人:环达电脑(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1