一种服务器机柜的监测方法及相关装置与流程

文档序号:12733431阅读:238来源:国知局
一种服务器机柜的监测方法及相关装置与流程

本申请涉及互联网技术领域,尤其是涉及一种服务器机柜的监测方法及相关装置。



背景技术:

随着互联网技术对数据存储量的需求越来越大,服务器机柜得到了越来越广泛的应用。

服务器机柜包括机柜管理控制器(Rack Management Controler,英文:RMC)和服务器节点。其中,每个服务器节点中都设置有单板管理控制器(Baseboard Management Controler,英文:BMC),BMC用于对服务器节点进行监控并生成对应的报警信息。

目前在对服务器机柜进行监测时,主要通过维护人员人工采集每个服务器节点的报警信息,不仅耗费大量的人力资源,而且服务器节点在报警之后很有可能迅速解除报警,显然这种方式不能及时采集服务器节点的报警信息,导致安全性较低。



技术实现要素:

本申请解决的技术问题在于提供一种服务器机柜的监测方法及相关装置,不仅能够节约资源,而且能够及时采集服务器节点的报警信息,提高了安全性。

为此,本申请解决技术问题的技术方案是:

本发明提供了一种服务器机柜的监测方法,所述服务器机柜包括机柜管理控制器和多组服务器节点,每组服务器节点包括多个服务器节点,每个服务器节点中设置有对应的单板管理控制器:所述方法包括:

每个单板管理控制器实时监测对应的服务器节点的状态,若服务器节点的状态异常则将单板管理控制器的状态标志位设置为报警标志位;

每个单板管理控制器分别接收所述机柜管理控制器发送的状态查询请求;

每个单板管理控制器接收到状态查询请求后,若该单板管理控制器的状态标志位设置为报警标志位,则向所述机柜管理控制器返回对应的报警信息,并将报警标志位清除。

可选的,所述方法还包括:

所述机柜管理控制器接收至少一个单板管理控制器发送的报警信息;

所述机柜管理控制器通过显示设备显示接收到的报警信息。

可选的,所述服务器机柜还包括多个中板管理模块,每个中板管理模块与一组服务器节点相连;

每个单板管理控制器分别接收所述机柜管理控制器发送的状态查询请求,包括:每个单板管理控制器分别通过相连的中板管理模块,接收机柜管理控制器发送的状态查询请求;

每个单板管理控制器向所述机柜管理控制器返回对应的报警信息,包括:每个单板管理控制器分别通过相连的中板管理模块,向所述机柜管理控制器返回对应的报警信息。

可选的,所述状态查询请求为基于智能平台管理接口IPMI协议的获取状态信息指令。

可选的,所述服务器机柜为SmartRack机柜。

本发明提供了一种服务器机柜,包括机柜管理控制器和多组服务器节点,每组服务器节点包括多个服务器节点,每个服务器节点中设置有对应的单板管理控制器:

所述机柜管理控制器,用于向每个服务器节点的单板管理控制器发送状态查询请求;

每个单板管理控制器,用于实时监测对应的服务器节点的状态,若服务器节点的状态异常则将单板管理控制器的状态标志位设置为报警标志位,分别接收所述机柜管理控制器发送的状态查询请求,接收到状态查询请求后,若该单板管理控制器的状态标志位设置为报警标志位,则向所述机柜管理控制器返回对应的报警信息,并将报警标志位清除。

可选的,所述机柜管理控制器,还用于接收至少一个单板管理控制器发送的报警信息,通过显示设备显示接收到的报警信息。

可选的,还包括多个中板管理模块,每个中板管理模块与一组服务器节点相连;

分别接收所述机柜管理控制器发送的状态查询请求时,每个单板管理控制器具体用于,分别通过相连的中板管理模块,接收机柜管理控制器发送的状态查询请求;

向所述机柜管理控制器返回对应的报警信息时,每个单板管理控制器具体用于,分别通过相连的中板管理模块,向所述机柜管理控制器返回对应的报警信息。

可选的,所述状态查询请求为基于智能平台管理接口IPMI协议的获取状态信息指令。

可选的,所述服务器机柜为SmartRack机柜。

通过上述技术方案可知,本发明实施例中,每个单板管理控制器实时监测对应的服务器节点的状态,若服务器节点的状态异常则将单板管理控制器的状态标志位设置为报警标志位;每个单板管理控制器分别接收所述机柜管理控制器发送的状态查询请求,并在接收到状态查询请求后,若该单板管理控制器的状态标志位设置为报警标志位,则向所述机柜管理控制器返回对应的报警信息,并将报警标志位清除。可见,本发明实施例中提供了一种通过自动获取报警信息监测服务器机柜的方式,相比于人工检测节约了资源,而且本发明实施例中单板管理控制器通过报警标志位记录服务器节点的异常状态,并且报警标志位只有在接收到机柜管理控制器发送的状态查询请求,并向机柜管理控制器返回报警信息后才能清除,因此即使在服务器节点解除了报警时,也能够及时获取服务器节点的报警信息,避免报警信息的遗漏,从而提高了安全性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的服务器机柜的一种装置实施例的结构示意图;

图2为本发明实施例提供的一种方法实施例的流程示意图;

图3为本发明实施例提供的另一种方法实施例的流程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

一种服务器机柜包括RMC、中板管理模块和服务器节点。其中,RMC分别与每个中板管理模块相连,每个中板管理模块用于管理一组服务器节点,例如每个中板管理模块用于管理4个服务器节点。每个服务器节点中都设置有BMC,BMC用于对服务器节点进行监控并生成对应的报警信息。例如图1所示,服务器机柜包括RMC、中板管理模块1、中板管理模块2和2组服务器节点,第一组服务器节点包括服务器节点1至服务器节点4,第二组服务器节点包括服务器节点5至服务器节点8。中板管理模块1用于管理第一组服务器节点,中板管理模块2用于管理第二组服务器节点。

在对服务器机柜进行监测时,需要获取每个服务器节点的报警信息,然而BMC虽然能够监测每个服务器节点的报警信息,但是不能将监测到的报警信息实时传输至RMC并向用户显示。目前,主要通过维护人员人工采集每个服务器节点的报警信息,不仅耗费大量的人力资源,而且服务器节点在报警之后很有可能迅速解除报警,显然这种方式不能及时采集服务器节点的报警信息,导致安全性较低。

本发明解决的技术问题在于提供一种服务器机柜的监测方法及相关装置,不仅能够节约资源,而且能够及时采集服务器节点的报警信息,提高了安全性。

请参阅图2,本发明提供了服务器机柜的监测方法的一种方法实施例。

在本发明实施例中,服务器机柜包括RMC和多组服务器节点,每组服务器节点包括多个服务器节点,每个服务器节点中设置有对应的BMC。本发明实施例中的服务器机柜可以为SmartRack机柜。

本实施例的所述方法包括:

S201:每个BMC实时监测对应的服务器节点的状态,若服务器节点的状态异常则将BMC的状态标志位设置为报警标志位。

本发明实施例中,每个服务器节点中都可以设置有对应的BMC和状态传感器,BMC可以通过传感器信息监测服务器节点的工作状态。其中,传感器信息可以包括以下状态信息中的至少一项:中央处理器(英文:Central Processing Unit,简称:CPU)状态信息、内存状态传感器信息、温度传感器信息和电压传感器信息等。

其中,状态标志位至少具有两个标志位,即初始标志位和报警标志位,报警标志位表示服务器节点出现状态异常。

S202:每个BMC分别接收所述RMC发送的状态查询请求。

RMC可以定时向每个BMC分别发送状态查询请求。

其中,RMC可以向每个BMC发送智能平台管理接口(英文:Intelligent Platform Management Interface,简称:IPMI)协议的获取状态信息指令,从而轮询每个服务器节点的状态。每个BMC接收RMC发送的获取状态信息指令。

S203:每个BMC接收到状态查询请求后,若该BMC的状态标志位设置为报警标志位,则向所述RMC返回对应的报警信息,并将报警标志位清除。

当任一个BMC接收到状态查询请求后,若该BMC的状态标志位设置为报警标志位,表示该BMC对应的服务器节点出现状态异常,因此该BMC生成报警信息并发送至RMC。因此,若有至少一个服务器节点出现状态异常时,RMC将接收至少一个BMC分别发送的报警信息。RMC接收报警信息之后,还可以记录接收到的报警信息,和/或,通过显示设备实时显示接收到的报警信息。例如,RMC将报警信息发送至远端服务器进行记录,用户可以通过终端实时查询并显示远端服务器记录的报警信息。

在本发明实施例中,在发送报警信息之前,BMC的状态标志位只能从初始标志位向报警标志位单向跳变,也就是说,当BMC的状态标志位设置为报警标志位之后,状态标志位保持在报警标志位,直至BMC向RMC反馈报警信息之后才会进行清除报警标志位,即,将状态标志位设置为初始标志位。因此即使在服务器节点解除了报警时,也能够及时获取服务器节点的报警信息,避免报警信息的遗漏。当清除报警标志位之后,BMC可以继续通过设置状态标志位对服务器节点的异常状态进行记录。

通过上述技术方案可知,本发明实施例中,每个BMC实时监测对应的服务器节点的状态,若服务器节点的状态异常则将BMC的状态标志位设置为报警标志位;每个BMC分别接收所述RMC发送的状态查询请求,并在接收到状态查询请求后,若该BMC的状态标志位设置为报警标志位,则向所述RMC返回对应的报警信息,并将报警标志位清除。可见,本发明实施例中提供了一种通过自动获取报警信息监测服务器机柜的方式,相比于人工监测节约了资源,而且本发明实施例中RMC向每一个BMC发送状态查询请求,BMC通过报警标志位记录服务器节点的异常状态,并且报警标志位只有在接收到RMC发送的状态查询请求,并向RMC返回报警信息后才能清除,因此即使在服务器节点解除了报警时,也能够及时获取服务器节点的报警信息,避免报警信息的遗漏,从而提高了安全性。因此,本发明实施例提供的监测方法在实际应用中具有较高的应用价值。

本发明实施例中的所述服务器机柜还可以包括多个中板管理模块,每个中板管理模块与一组服务器节点相连。因此,每个BMC分别通过相连的中板管理模块,接收RMC发送的状态查询请求;并且,每个BMC分别通过相连的中板管理模块,向所述RMC返回对应的报警信息。RMC通过中板管理模块1向服务器节点3中的BMC发送状态查询请求,服务器节点3中的BMC通过中板管理模块1向RMC返回报警信息。

下面以图1所示的服务器机柜为例,提供一种具体实施例。

请参阅图3,本发明提供了服务器机柜的监测方法的另一种方法实施例。

在本发明实施例中,服务器机柜为SmartRack机柜,具体结构如图1所示,包括RMC、中板管理模块1、中板管理模块2和2组服务器节点。其中第一组服务器节点包括服务器节点1至服务器节点4,第二组服务器节点包括服务器节点5至服务器节点8。RMC分别与中板管理模块1和中板管理模块2相连,中板管理模块1用于管理第一组服务器节点,中板管理模块2用于管理第二组服务器节点。每个服务器节点中都设置有对应的BMC,BMC用于对服务器节点进行监控并生成对应的报警信息。

本实施例的所述方法包括:

S301:每个服务器节点中的BMC实时监测对应的服务器节点的状态,若服务器节点的状态异常则将BMC的状态标志位设置为报警标志位。

例如,若服务器节点3中的BMC监测出服务器节点3的状态异常,则将服务器节点3的BMC对应的状态标志位设置为报警标志位。若服务器节点5中的BMC监测出服务器节点5的状态异常,则将服务器节点5的BMC对应的状态标志位设置为报警标志位。其余服务器节点的BMC若监测出对应的服务器节点的状态正常,则状态标志位保持在初始标志位。

S302:RMC分别向中板管理模块1和中板管理模块2发送IPMI协议的获取状态信息指令。

S303:中板管理模块1向服务器节点1至服务器节点4共4个服务器节点分别发送IPMI协议的获取状态信息指令,中板管理模块2向服务器节点5至服务器节点8共4个服务器节点分别发送IPMI协议的获取状态信息指令。

S304:每个服务器节点中的BMC接收到获取状态信息指令后,若该BMC的状态标志位设置为报警标志位,则通过服务器节点连接的中板管理模块向所述RMC返回对应的报警信息,并将报警标志位清除。

例如,若服务器节点3的BMC对应的状态标志位为报警标志位,则服务器节点3的BMC通过中板管理模块1向RMC返回报警信息,并将服务器节点3的BMC对应的状态标志位设置为初始标志位。若服务器节点5的BMC对应的状态标志位为报警标志位,则服务器节点5的BMC通过中板管理模块2向RMC返回报警信息,并将服务器节点5的BMC对应的状态标志位设置为初始标志位。

S305:RMC接收到至少一个BMC发送的报警信息之后,记录并且通过显示设备实时显示接收到的报警信息。

对应上述方法实施例,本发明实施例提供了相应的装置实施例,下面具体说明

本发明实施例提供了服务器机柜的一种装置实施例,包括机柜管理控制器和多组服务器节点,每组服务器节点包括多个服务器节点,每个服务器节点中设置有对应的单板管理控制器。其中,服务器机柜可以如图1所示。

所述机柜管理控制器,用于向每个服务器节点的单板管理控制器发送状态查询请求。

每个单板管理控制器,用于实时监测对应的服务器节点的状态,若服务器节点的状态异常则将单板管理控制器的状态标志位设置为报警标志位,分别接收所述机柜管理控制器发送的状态查询请求,接收到状态查询请求后,若该单板管理控制器的状态标志位设置为报警标志位,则向所述机柜管理控制器返回对应的报警信息,并将报警标志位清除。

可选的,所述机柜管理控制器,还用于接收至少一个单板管理控制器发送的报警信息,通过显示设备显示接收到的报警信息。

可选的,还包括多个中板管理模块,每个中板管理模块与一组服务器节点相连;

分别接收所述机柜管理控制器发送的状态查询请求时,每个单板管理控制器具体用于,分别通过相连的中板管理模块,接收机柜管理控制器发送的状态查询请求;

向所述机柜管理控制器返回对应的报警信息时,每个单板管理控制器具体用于,分别通过相连的中板管理模块,向所述机柜管理控制器返回对应的报警信息。

可选的,所述状态查询请求为基于智能平台管理接口IPMI协议的获取状态信息指令。

可选的,所述服务器机柜为SmartRack机柜。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体结构和工作过程,可以参考前述方法实施例中的对应描述,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置的间接耦合或通信连接,可以是电性,机械或其它的形式。

另外,在本申请各个实施例中的各控制器可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上控制器集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,物流管理服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1