利用基板管理控制器取得储存装置故障信号的方法

文档序号:6335616阅读:220来源:国知局
专利名称:利用基板管理控制器取得储存装置故障信号的方法
技术领域
本发明涉及一种取得储存装置故障信号的方法,特别涉及一种利用基板管理控制器(Baseboard Management Controller, BMC)取得储存装置故障信号的方法。
背景技术
随着计算机的普及与网络技术的快速发展,仅由普通计算机或设备所能提供的服务以不敷使用,故发展出了服务器的技术。服务器是为一种善于处理网络技术的计算机平台,其可连结至各种网络系统,并对通过网络系统相连结的计算机提供各种的应用服务。服务器大多具有大容量的储存装置,以提供诸如多媒体播放、网络硬盘或是企业用数据库等服务。由此可知,储存装置是服务器中相当重要的一个组件,一旦发生故障就会对服务器乃至提供给客户的服务造成严重的不良影响。而为了管理服务器,智能型平台管理界面(Intelligent Platform Management Interface, IPMI)的技术应运而生。管理者可以通过IPMI以及配置于服务器中的基板管理控制器(Baseboard Management Controller,BMC)监控服务器。但是目前的服务器在储存装置故障后,是通过独立运作的硬件发出故障信号再点亮服务器上的灯号,储存装置故障的信号并不会通过智能型平台管理界面传送至管理软件。也就是说,现有的故障信号是直接由硬件译码控制。因此造成现有的服务器无法整合并行的故障信号与管理机制,也无法有效率地通知管理员故障事件的问题。

发明内容
为了解决上述问题,本发明所要解决的技术问题在于提供一种利用基板管理控制器(Baseboard Management Controller, BMC)取得储存装置故障信号的方法。利用 BMC取得储存装置故障信号的方法适用于具有一 BMC以及一储存装置的一服务器。利用基板管理控制器取得储存装置故障信号的方法包括定义BMC所监控的一检测器,其中检测器的值用以表示储存装置的状态;利用一硬件编码手段,将储存装置的一储存装置控制器产生的一储存装置故障信号转换成一电信号;以及由一输入输出扩展器(input/output expander, 1/0 expander)读取电信号,并将读取的电信号的值指定为检测器的值。根据一实施范例,硬件编码手段可以是一复杂可程序逻辑装置(Complex Programmable Logic Device, CPLD),且输入输出扩展器由CPLD读取电信号。而储存装置控制器可监测储存装置的状态,并据以发送储存装置故障给CPLD。其中储存装置控制器可以通过序列式通用型输入输出(serial general purpose input/output,SGPI0)发送电信号给CPLD。BMC的检测器则可通过内部整合电路总线(inter integrated circuit bus, I2C bus)由输入输出扩展器读取电信号。此外,利用BMC取得储存装置故障信号的方法还可包括令CPLD依据电信号点亮 (驱动)对应于储存装置的一发光二极管(light emitting diode, LED)组。根据一实施范例,利用BMC取得储存装置故障信号的方法也可包括依据检测器的值执行一储存装置管理程序。其中储存装置管理程序可包括通知通过一智能平台管理总线(Intelligent Platform Management Bus,IPMB)与BMC相连的一远程管理程序。而储存装置管理程序也可包括依据电信号暂停储存装置的至少一储存单元。其中储存装置可以包括多个储存单元,而电信号系对应于这些储存单元。综上所述,利用BMC取得储存装置故障信号的方法产生电信号后,点亮对应的LED 组并通过检测器告知BMC。因此由硬件控制的磁盘故障点灯机制被整合入BMC管理的事件之中,使管理界面得以统一而增进管理效率。以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。


图1为一实施范例的服务器的示意图;图2为一实施范例的利用基板管理控制器取得储存装置故障信号的方法的流程图;图3为另一实施范例的利用基板管理控制器取得储存装置故障信号的方法的流程图;图4为另一实施范例的服务器的示意图。其中,附图标记20服务器21基板管理控制器212检测器22储存装置222,222a,222b,222c 储存单元23 南桥232储存装置控制器25输入输出扩展器24硬件编码手段26发光二极管组262, 262a, 262b, 262c 发光二极管灯号30远程计算机32远程管理程序
具体实施例方式以下在实施方式中详细叙述本发明的详细特征以及优点,其内容足以使任何本领域技术人员了解本发明的技术内容并据以实施,且根据本说明书所揭露的内容、权利要求范围及图式,任何本领域技术人员可轻易地理解本发明相关的目的及优点。本发明是关于一种利用基板管理控制器(Baseboard Management Controller, BMC)取得储存装置故障信号的方法,其适用于具有一基板管理控制器(BMC)以及一储存装置的一服务器。
请参照1图,其是为一实施范例的服务器的示意图。服务器20包括BMC21、储存装置22以及一中央处理器(central processing unit, CPU,未绘示)的一南桥(south bridge) 23,其中南桥23通过一储存装置控制器232与储存装置22电性相连。储存装置22 可以例如是各种大容量的硬盘,或是磁盘阵列(redundant array of inexpensive disk, RAID)系统。服务器20并可通过网络与一远程计算机(remote computer) 30相连,而远程计算机30则可通过一远程管理程序32以及BMC 21管理服务器20。服务器20可支持智能型平台管理界面Gntelligent Platform Management Interface, IPMI),并通过上述硬件运行一操作系统。其中服务器20可使用Unix的Linux、 FreeBSD或是微软(Microsoft)的Windows (窗口操作系统)Server 2003等操作系统,也可为磁盘操作系统(Disk Operating System, DOS)或是可延伸固件接口(可扩展固件接口, Extensible Firmware Interface,EFI)的系统。且服务器20也可各种厂牌的各种服务器产品,本发明并不对其限制。更详细地说,智能型平台管理界面是一种服务器管理平台的标准架构,它包含BMC 21、一系统界面(System Interface)、一非挥发性储存单元(Non-volatile Storage)、一智能平台管理总线(Intelligent Platform Management Bus, IPMB)以及一智能型机箱管理总线(Intelligent Chassis Management Bus, ICMB)等5项组件。而其中最重要的就是 BMC 21。BMC 21就像是一台独立的计算机,包括自己的处理器以及记忆体等资源。且BMC 21的运作均使用自己具有的资源,而不会占用服务器20的硬件模块的其它资源。举例而言,远程计算机30可使用惠普(HP)公司的iLO系统、戴尔(DELL)公司的iDRAC系统,或是英特尔antel)公司的ESB2系统。请配合图1并参照图2,图2是为一实施范例的利用BMC取得储存装置故障信号的方法的流程图。首先定义BMC 21所监控的一检测器(sensor) 212,其中检测器212的值用以表示储存装置22的状态,例如是否故障等(步骤S100)。BMC 21本身可包括多个其它的检测器以监控服务器20的CPU等硬件,并于步骤S100中额外定义此检测器212。储存装置控制器232随时监测储存装置22的状态;而当储存装置22发生故障时, 储存装置控制器232可产生并发送一储存装置故障信号给服务器20的一硬件编码手段对。 利用硬件编码手段对,服务器20将储存装置22的储存装置控制器232发出的储存装置故障信号转换成一电信号(步骤S110)。其中硬件编码手段M可以是一复杂可程序逻辑装置(Complex Programmable Logic Device, CPLD)。CPLD 中可包含多个可程序逻辑阵列(Programmable Array Logic, PAL),并用来实现各种运算和组合逻辑(combinational logic)。各个PAL之间的互接连线也可以进行程序性的规划以及烧录。CPLD运用这种多合一(All-In-One)的整合作法,使其能实现数千个逻辑闸,甚至数十万个逻辑闸才能构成的电路。而在本实施范例中CPLD被程序化以执行硬件编码手段M所需的功能。例如CPLD可接收储存装置控制器232通过序列式通用型输入输出(serial general purpose input/output, SGP10)发送的电信号,再将其重新编码为电信号。接着,由一输入输出扩展器(input/outputexpander, 1/0 expander) 25 读取电信号,并将读取的电信号的值指定为检测器的值(步骤S120)。也就是说,输入输出扩展器 25可由CPLD读取电信号,BMC 21的检测器212再由输入输出扩展器25读取电信号。其中BMC 21与输入输出扩展器25之间可由一内部整合电路总线(inter integrated circuit bus, I2C bus, I2C总线)连接。检测器212定期通过I2C总线由读取电信号,并将电信号的内容作为自己的值。请参照图3,其是为另一实施范例的利用BMC取得储存装置故障信号的方法的流程图。利用BMC取得储存装置故障信号的方法还可以令硬件编码模块M (例如CPLD)依据电信号点亮(即驱动)对应于储存装置22的一发光二极管(light emitting diode,LED) 组26(步骤S130)。请配合参照4图,其是为另一实施范例的服务器的示意图。储存装置22可包括多个储存单元222,例如储存单元22 、储存单元222b以及储存单元222c ;而LED组沈则可包括与储存单元222数量相同的多个LED灯号沈2,例如LED灯号^2a、LED灯号以及LED灯号^2c。经重新编码的电信号对应这些储存单元222,并用以点亮LED灯号沈2。 通过步骤S130,可以使得服务器20的管理员能够轻松地得知储存装置22的故障情况。利用BMC取得储存装置故障信号的方法并可依据检测器212的值执行一储存装置管理程序(步骤S140)。BMC 21可纪录储存装置22发生故障的事件,并依照储存装置管理程序进行后续处置。而储存装置管理程序可以依据电信号暂停储存装置22的至少一个故障的储存单元222,或是通知通过IPMB与BMC 21相连的远程计算机30的远程管理程序32。需注意的是,对于步骤S130以及步骤S140的执行顺序并没有限制。以下是为利用BMC取得储存装置故障信号的方法实际运作时的一实施范例。例如当储存单元222b发生故障时,储存装置控制器232会据以发出储存装置故障信号。硬件编码手段M接收到储存装置故障信号后将其转换为电信号。例如可以序列的二进制代码对应表示所有的储存单元222,且以“0”表示正常时,“010”的电信号辨识表示现在只有储存单元222b发生故障。硬件编码手段M接着将电信号传送给输入输出扩展器 25,并依据“010”的电信号将LED灯号点亮为红灯。而没发生故障的储存单元22 以及222b所对应的LED灯号沈加以及可以不点灯也可以维持点亮绿灯以表示正常状态。BMC 21定期读取检测器212的值,也可以视为通过检测器212读取输入输出扩展器25输出的值。若检测器212的值都是0,表示一切正常。而当BMC21收到值不为0的电信号后,便执行储存装置管理程序以经由网络以及通知远程计算机30通知管理人。如此一来,管理人便可实时前往维修或更换故障的储存单元222b。综上所述,利用BMC取得储存装置故障信号的方法利用硬件编码手段产生电信号后,不但用以点亮对应的LED组,也通过检测器告知BMC。也就是说,原先独立由硬件控制的磁盘故障点灯机制被整合入BMC管理的事件之中,使管理界面得以统一。如此一来,可以解决现有技术像多头马车并行般的杂乱的管理方式,而能以更简洁且有效率的方法管理服务器,并有效率地再发生故障事件时通知管理员。当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
权利要求
1.一种利用基板管理控制器BMC取得储存装置故障信号的方法,适用于具有一基板管理控制器BMC以及一储存装置的一服务器,其特征在于,该利用基板管理控制器取得储存装置故障信号的方法包括定义该BMC所监控的一检测器,其中该检测器的值用以表示该储存装置的状态;利用一硬件编码手段,将该储存装置的一储存装置控制器产生的一储存装置故障信号转换成一电信号;以及由一输入输出扩展器读取该电信号,并将读取的该电信号的值指定为该检测器的值。
2.根据权利要求1所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,该硬件编码手段是一复杂可程序逻辑装置CPLD,且该输入输出扩展器由该CPLD读取该电信号。
3.根据权利要求2所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,该储存装置控制器监测该储存装置的状态,并据以发送该储存装置故障信号给该 CPLD。
4.根据权利要求3所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,该储存装置控制器通过序列式通用型输入输出发送该电信号给该CPLD。
5.根据权利要求2所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,还包括令该CPLD依据该电信号点亮对应于该储存装置的一发光二极管组。
6.根据权利要求1所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,该BMC的该检测器通过内部整合电路总线由该输入输出扩展器读取该电信号。
7.根据权利要求1所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,还包括依据该检测器的值执行一储存装置管理程序。
8.根据权利要求7所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,该储存装置管理程序包括通知通过一智能平台管理总线IPMB与该BMC相连的一远程管理程序。
9.根据权利要求7所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,该储存装置管理程序包括依据该电信号暂停该储存装置的至少一储存单元。
10.根据权利要求1所述的利用基板管理控制器取得储存装置故障信号的方法,其特征在于,该储存装置包括多个储存单元,该电信号对应于该些储存单元。
全文摘要
一种利用基板管理控制器BMC取得储存装置故障信号的方法包括定义BMC所监控的检测器,其中检测器的值用以表示储存装置的状态;利用硬件编码手段,将储存装置控制器产生的储存装置故障信号转换成一电信号;以及由输入输出扩展器读取电信号,并将读取的电信号的值指定为检测器的值。本发明是利用BMC取得储存装置故障信号的方法产生电信号后,点亮对应的LED组并通过检测器告知BMC。因此由硬件控制的磁盘故障点灯机制被整合入BMC管理的事件之中,使管理界面得以统一而增进管理效率。
文档编号G06F11/22GK102467425SQ20101053911
公开日2012年5月23日 申请日期2010年11月5日 优先权日2010年11月5日
发明者卢晓芬, 陈志伟 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1