一种机架服务器系统及其监控方法

文档序号:6337779阅读:218来源:国知局
专利名称:一种机架服务器系统及其监控方法
技术领域
本发明是有关于一种监控机制,且特别是有关于一种机架服务器系统的监控系统与方法。
背景技术
由于电脑工业日益进步,且企业对于工业电脑系统的依赖也逐日提升,工业电脑通常特指非个人电脑或非消费性的电子系统,举例来说,工业电脑包含了使用在工厂自动化的核心控制设备、网页服务器、企业的资料备份服务器等等。随着电子技术与工业电脑相关应用的进展,业界对于服务器系统的要求自然相对提高。而为应对企业的成长,许多企业通常将为数众多的服务器单元整合于电脑机箱当中, 并可利用多组电脑机箱搭配组成工业电脑机组,以应付大量产生的资料量或网络流量等需求,同时也能应对日后服务器系统的扩充与升级等需求。一般来说,一套工业电脑机组可能包含多个系统机架,而每一个系统机架中进一步包含多个电脑服务器(如刀片式电脑)。此外,一般工业电脑需要长期处于运作的状态下,一旦有任何硬件发生故障等问题时,企业往往要求服务器系统在不停机的状态下进行维修或更换该硬件。因此,主机板的热插拔(Hot Swap)需求、电力功率供应分配以及散热风扇相互支持等系统功能也因应而生。此外,为了提高工业电脑设备中电力供应的稳定性,也发展出了许多系统电力状态监控、电源模组纠错、电压电流控管等保护机制。实际应用中,使用者或电脑系统的管理员需要监控各个机架上每一服务器的运作状态。在现有的电脑机组上,使用者可通过浏览程序或其他连线软件的控制介面,藉由特定的网络通讯协议(如SSH加密网络协议)连线到各个机架上的基板管理控制器,来查看特定机架上特定服务器的状态信息。然而,一套电脑机组可能具有数个甚至数十个机架,而每一机架又可包含多个服务器,若每次需要监控的时候都需要逐一登陆每个机架上的监控介面,并等待密码验证,使用上殊为不便。此外,现有的监控介面并无法刷新目前的状态信息,也就是说,当使用者需重新连线到各个机架上的控制单元(如机架基板管理控制器)才能得到最新的状态信息,更造成监控管理上的困扰。

发明内容
为了解决上述问题,本发明提出一种机架服务器系统及监控方法,通过管理单元与各个机架上的控制单元通讯连接,管理单元可由相对应的控制单元读取使用者指定的机架的状态信息,并可将其内容整合显示在一显示器上,方便使用者检阅。此外,在管理单元取得状态信息时,同时建立一自动程序,每隔一段预定周期,自动程序便可触发将状态信息主动回传至管理单元以进行更新。如此一来,便可省下反复的登陆认证手续与等待时间,让使用者或系统管理者可更方便地掌握机架服务器系统的整体状态。
因此,本发明内容目的之一是提供一种机架服务器系统,其包含多个机架以及一管理单元。其中,机架各自包含多个服务器以及一控制单元。该控制单元与服务器连接并获取各服务器的一状态信息,该控制单元随时间更新状态信息。管理单元用以与各机架上的该控制单元通讯连接,该管理单元由控制单元取得服务器的状态信息以生成一状态信息表,且同时该管理单元建立一自动程序。其中,每隔一预定周期,该自动程序触发各机架上的该控制单元并将该状态信息更新至该管理单元。根据本发明内容的一实施例,其中服务器各自包含一服务器基板管理控制器,以接收各服务器的一温度值。根据本发明内容的一实施例,其中各机架的控制单元为一机架基板管理控制器。根据本发明内容的一实施例,其中各机架进一步包括多个风扇,各机架上的该控制单元接收风扇的多个转速值,并控制风扇的转速。根据本发明内容的一实施例,其中该状态信息表包括机架的多个网络地址、服务器的多个温度值以及风扇的多个转速值。根据本发明内容的一实施例,其中该管理单元根据使用者操作由机架中选取一部分的机架,该管理单元针对被选中的机架由相对应的该控制单元取得该状态信息并建立该自动程序。根据本发明内容的一实施例,其中该自动程序建立并执行在该些机架的一运算处理器或该控制单元上。根据本发明内容的一实施例,其中该管理单元将该状态信息表的内容显示在一显不器上。本发明内容的另一目的是提供一种监控方法,用于一机架服务器系统,该机架服务器系统包含多个机架以及一管理单元,机架分别具有多个服务器以及一控制单元,其中该监控方法包含下列步骤(1)在机架中,分别通过该控制单元获取各该服务器的一状态信息,且该控制单元随时间更新该状态信息;(2)由该管理单元通讯连接至控制单元以取得状态信息;以及(3)建立一自动程序,藉以触发各该机架上的该控制单元每隔一预定周期将状态信息传送至该管理单元。根据本发明内容的一实施例,监控方法更包含下列步骤根据使用者操作由系统单元中选取一部分的系统单元,并且于上述步骤( 及步骤C3)当中,该管理单元针对被选中的机架由相对应的控制单元取得该状态信息以及建立该自动程序。如此便可省下反复的登陆认证手续与等待时间,让使用者或系统管理者可更方便地掌握机架服务器系统的整体状态。


为让本发明的上述和其它目的、特征、优点与实施例能更明显易懂,所附附图的详细说明如下图1绘示根据本发明的一实施例中一种机架服务器系统的示意图。图2绘示根据本发明的一实施例中一种监控方法的方法流程图。
图3绘示图2中的监控方法其操作实例的流程示意图。主要元件符号说明100 机架服务器系统120 机架122 服务器IM 控制单元126 风扇140 管理单元160 显示器SlOO 步骤S102 步骤S104 步骤S200 步骤S202 步骤S204 步骤S2O6 步骤S208 步骤S210 步骤
具体实施例方式请参阅图1,其绘示根据本发明的一实施例中一种机架服务器系统100的示意图。 如图ι所示,机架服务器系统100中包含多个机架120、管理单元140以及显示器160。在本实施例中,管理单元140可用来对应管理多组机架120,图1中仅绘示三组机架120作为举例,但本发明并不以三组为限,举例来说,在部份实施例中,作为中央资料服务器(data center)的机架服务器系统100可包含共数十组以上机架120。其中,每一组机架120中包含多个服务器(server) 122以及一控制单元124,图1 中以每一机架中包含两组服务器122为例,但本发明并不以此为限。在本实施例中,每一服务器122可各自包含服务器基板管理控制器(baseboard management controller, BMC), 服务器基板管理控制器可用以接收各服务器122运作时的温度值。在本实施例中,控制单元IM是机架120上的机架基板管理控制器(BMC),控制单元IM可与各别服务器122上的服务器基板管理控制器连接并获取各服务器122的一状态信息,控制单元124随时间更新状态信息。其中各机架120可进一步包括多个风扇126,各机架120上的控制单元1 (机架 BMC)接收风扇126的转速值,并控制风扇1 的转速,图1中以各机架120包含两组风扇 126为例,但本发明并不以此为限。控制单元124则可获得各服务器122的状态信息,并可获知及控制机架120上的风扇转速,但本发明并不以此为限。实际应用中,控制单元1 可监控的项目可进一步涵盖温度、湿度、电源电压、风扇速度、通信参数和操作系统函数等等各种机架上的运行参数。此夕卜,在本实施例中,控制单元IM可随时间更新状态信息,以维持状态信息的即时性。管理单元140用来与控制单元IM通讯连接,因此,管理单元140由控制单元124 取得服务器122的状态信息以及机架120上的各种信息,管理单元140进而据此生成状态信息表,其中状态信息表的内容可包括机架120的网络地址(如IP address)、服务器122 的温度值以及风扇126的转速值。在本实施例中,管理单元140通过网络协议与控制单元 IM通讯连接。为了增进传输上的安全性,并进行使用者的身分认证,在实际应用中此处的网络协议可采用安全壳层(Secure Shell, SSH)加密网络协议。当使用者通过SSH加密网络协议登陆控制单元124,需要输入使用者名称及密码,需要一定的认证程序与认证时间。须注意的是,管理单元140取得状态信息并同时建立一自动程序。这一自动程序是用以触发机架120上的控制单元IM每隔一预定周期便将状态信息传送至管理单元140。 在本实施例中,自动程序可以是建立在控制单元1 上的软件脚本(software script), 但本发明并不以此为限。在另一实施例中,机架120可另包含一运算处理器(未绘示),自动程序也可以是建立并执行于运算处理器上的软件脚本。如此一来,每隔一段预定周期,自动程序便可触发机架120将状态信息主动回传至管理单元140以进行更新。这样便可省下反复的登陆控制单元124的认证手续与等待时间,管理单元140可将产生的状态信息表的内容显示于显示器160上,让使用者或系统管理者可更方便地掌握机架服务器系统100的整体状态。此外需补充的是,为了使用上的便利或处理效能的考虑,管理单元140并不限于同时读取所有机架120的状态信息,在实际应用中,机架服务器系统100可提供使用者一个操作介面(如键盘、鼠标等输入装置、切换按钮、触控介面等等),管理单元140可根据使用者操作由机架120中选取一部分的机架,例如选取其中第一组与第二组机架。管理单元140 针对被选中的机架120,由相对应的控制单元IM取得状态信息并建立自动程序。请参阅图2,其绘示根据本发明的一实施例中一种监控方法的方法流程图。在本实施例中,监控方法可用于一机架服务器系统,该机架服务器系统包含多个机架以及一管理单元,机架分别具有多个服务器以及一控制单元。关于此处机架服务器系统的内部硬件结构可与先前实施例中的机架服务器系统100大致相似,请一并参考本发明前述实施例以及图1中的机架服务器系统100。如图2所示,本发明的监控方法首先执行步骤S100,在机架中分别通过该控制单元获取各服务器的一状态信息,其中,控制单元随时间更新状态信息。接着,执行步骤S102,管理单元通讯连接至控制单元,并且管理单元从控制单元取得状态信息。最后,执行步骤S104,建立自动程序,藉以触发机架每隔一预定周期将状态信息传送至管理单元,管理单元可以此进一步建立状态信息表。如此一来,自动程序便可周期性地将状态信息主动回传至管理单元,以便管理单元刷新状态信息表的内容。如此一来,便可省下反复的形成通讯连接的手续与时间,且使用者或系统管理者可更方便地监视机架服务器系统的整体状态。此外,本发明的监控方法中并不限于同时读取所有机架的状态信息表。在另一实施例中,本发明的监控方法可更进一步执行一步骤,以根据使用者操作由机架中选取一部分的机架,而相对应地在上述步骤S102及步骤S104当中,管理单元针对被选中的机架由相对应的控制单元取得状态信息以及建立自动程序,藉此可提高资料处理效率。此外,请一并参阅图3,其绘示图2中的监控方法其操作实例的流程示意图。在实际应用中,机架中的控制单元可预设为自动性地产生状态信息(即图2中的步骤S100)。如图3所示,在系统管理员或使用者操作实例中,可先执行步骤S200,在机架上开启浏览器上相对应的连接页面。接着,执行步骤S202,允许使用者在连接页面上点选目前想显示出来个别机架或机架群组。接着,管理单元便会执行步骤S204,判断管理单元上是否已存在被选取的机架的状态信息。此时,若不存在上述状态信息表,表示管理单元尚不曾与被选取的机架连线过,此时便可执行步骤S206-S208(可参见前述段落中的步骤S102-S104),藉以取得状态信息并建立自动程序。接着便可执行步骤S210,根据取得的状态信息建立状态信息表,并将其内容显示在浏览器相对应的连接页面上,且自动程序会将状态信息表的内容进行自动更新。若执行步骤S204中,判断已存在上述状态信息,表示之前管理单元已与被选取的机架完成连线,且已取得状态信息并建立自动程序,此时,可直接执行步骤S210,将其内容显示在浏览器相对应的连接页面上。由此可知,管理单元只有在第一次连接至特定机架时,需要通过网络协议(如SSH 协议)从机架取得状态信息表并建立自动程序(即图2中的步骤S102-S104或图3中的步骤S206-S208),之后,机架便会主动地刷清管理单元上状态信息表的内容。如此一来,便可省下反复的登陆认证手续与等待时间,让使用者或系统管理者可更方便地掌握机架服务器系统的整体状态。虽然本发明已以实施方式揭示如上,然其并非用以限定本发明,任何本领域的普通技术人员,在不脱离本发明的精神和范围内,当可作各种更动与润饰,因此本发明的保护范围当视后附的申请专利范围所界定者为准。
权利要求
1.一种机架服务器系统,其特征在于,所述系统包括多个机架,各所述机架包含多个服务器;以及一控制单元,所述控制单元与所述服务器连接并获取各所述服务器的一状态信息,所述控制单元随时间更新所述状态信息;以及一管理单元,用以与各所述机架上的所述控制单元通讯连接,所述管理单元由所述控制单元取得所述服务器的状态信息以生成一状态信息表,且建立一自动程序;其中,每隔一预定周期,所述自动程序触发各所述机架上的所述控制单元并将所述状态信息更新至所述管理单元。
2.根据权利要求1所述的机架服务器系统,其特征在于,所述服务器各自包含一服务器基板管理控制器,以接收各所述服务器的一温度值。
3.根据权利要求1所述的机架服务器系统,其特征在于,各所述机架的所述控制单元是一机架基板管理控制器。
4.根据权利要求1所述的机架服务器系统,其特征在于,各所述机架进一步包括多个风扇,各所述机架上的所述控制单元接收所述风扇的多个转速值,并控制所述风扇的转速。
5.根据权利要求1所述的机架服务器系统,其特征在于,所述状态信息表包括所述机架的多个网络地址、所述服务器的多个温度值以及所述风扇的多个转速值。
6.根据权利要求1所述的机架服务器系统,其特征在于,所述管理单元根据使用者操作由所述机架中选取一部分的机架,所述管理单元系针对被选中的机架由相对应的所述控制单元取得所述状态信息并建立所述自动程序。
7.根据权利要求1所述的机架服务器系统,其特征在于,所述自动程序是建立并执行在所述机架的一运算处理器或所述控制单元上。
8.根据权利要求1所述的机架服务器系统,其特征在于,所述管理单元将所述状态信息表的内容显示在一显示器上。
9.一种监控方法,用于一机架服务器系统,所述机架服务器系统包含多个机架以及一管理单元,所述机架分别具有多个服务器以及一控制单元,其特征在于,所述监控方法包含下列步骤在所述机架中,分别通过所述控制单元获取各所述服务器的一状态信息,且所述控制单元随时间更新所述状态信息;由所述管理单元通讯连接至所述控制单元以取得所述状态信息;以及建立一自动程序,以触发各所述机架上的所述控制单元每隔一预定周期将所述状态信息传送至所述管理单元。
10.根据权利要求9所述的监控方法,其特征在于,更包含下列步骤根据使用者操作由所述机架中选取一部分的机架,而所述管理单元针对被选中的机架由相对应的所述控制单元取得所述状态信息以及建立所述自动程序。
全文摘要
本发明提供了一种机架服务器系统及其监控方法,其中机架服务器系统包含多个机架以及一管理单元。其中,机架各自包含多个服务器以及一控制单元。该控制单元与服务器连接并获取各服务器的一状态信息,该控制单元随时间更新状态信息。管理单元用以与各机架上的控制单元通讯连接,该管理单元由控制单元取得服务器的状态信息以生成一状态信息表,且同时该管理单元建立一自动程序。其中,每隔一预定周期,该自动程序触发各该机架上的控制单元并将该状态信息更新至该管理单元。如此便可省下反复的登陆认证手续与等待时间,让使用者或系统管理者可更方便地掌握机架服务器系统的整体状态。
文档编号G06F11/32GK102479142SQ20101057518
公开日2012年5月30日 申请日期2010年11月30日 优先权日2010年11月30日
发明者王晓华, 王浩皓 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1