一种低成本高可靠服务器集群开关机系统及方法与流程

文档序号:32992712发布日期:2023-01-17 23:44阅读:131来源:国知局
一种低成本高可靠服务器集群开关机系统及方法与流程

1.本发明属于计算机服务器集群控制技术领域,特别是涉及一种低成本高可靠服务器集群开关机系统及方法。


背景技术:

2.服务器是信息时代数据处理的关键设备,随着服务器技术的持续发展,服务器功能单元的数量种类不断增加,保证服务器各功能单元合法开关机对服务器信息安全至关重要。基板管理控制器(baseboardmanagercontroller)是监控和管理服务器的关键部件,允许进行带外服务器管理,其中远程管理功能是bmc的重要功能,一般包括开机、关机、重启、维护等功能。
3.目前常用的服务器开关机主要方式:一种是服务器电源接通开关用于整个服务器集群的开机操作,关机操作通过远程登录到各个功能单元完成关机。此方式的关机操作繁琐,不适用于大型服务器集群,一般不具备掉电保护功能。另一种方式利用bmc实现服务器各个功能单元的开关机操作,即通过pc发送开关机指令给服务器各功能单元bmc完成服务器集群开关机。此方式相对成本较高,往往不具备掉电保护功能。


技术实现要素:

4.本发明的目的在于解决现有技术中的服务器开关机方式操作繁琐,不适用于大型服务器集群,一般不具备掉电保护功能,或相对成本较高的问题。
5.为了实现本发明目的,本发明公开了一种低成本高可靠服务器集群开关机系统,包括硬件设备和服务软件;硬件设备包括开关机装置、服务器管理单元;开关机装置设置有开关量输入端口di,两路开关量输出端口do,rs232端口;服务器管理单元通过i2c总线或网络与服务器集群中的各个功能单元(如计算单元、存储单元)相连,各功能单元中均配备有基板管理控制器bmc;开关量输入端口di用于识别开机关机操作,两路开关量输出端口do分别用于控制开关机装置和服务器集群的电源通断;rs232端口与服务器管理单元连接;服务软件采用cs结构,包括服务端和客户端,服务端部署于开关机装置中,客户端部署于服务器管理单元中,rs232端口用于服务端与客户端之间的通信;
6.进行服务器集群开机时,开关量输入端口di识别到系统开机操作后,两路开关量输出端口do接通开关机装置和服务器集群的电源;服务端通过rs232端口发送开机指令至客户端,客户端确认开机指令后通过基板管理控制器bmc控制各功能单元,执行服务器集群开机操作;进行服务器集群关机时,开关量输入端口di识别到系统关机操作后,服务端通过rs232端口发送关机指令至客户端,客户端确认关机指令后通过基板管理控制器bmc控制各功能单元,执行服务器集群关机操作。
7.进一步地,服务器集群开机完成后,客户端发送开机完成状态至服务端;服务器集群关机完成后,客户端发送关机完成状态至服务端,随后服务器管理单元执行自关机;服务端接收关机完成状态后,两路开关量输出端口do断开开关机装置和服务器集群的电源。
8.进一步地,开关机装置设置有两路rs232端口,一路rs232端口与服务器管理单元连接,用于服务软件服务端与客户端之间的通信;另一路rs232端口与ups电源连接,用于ups电源电量的实时监测。
9.进一步地,开关机装置的服务端通过rs232端口实时监测ups电源电量,依据电量信息进行关机操作决策,当ups电源电量低于预设下限值时发起自动关机操作,防止系统异常断电造成重要信息丢失及系统文件损坏。
10.进一步地,进行服务器集群开机时,开关量输入端口di识别到系统开机操作后,两路开关量输出端口do接通开关机装置和服务器集群的电源,服务端周期发送开机指令到客户端,直到服务端接收到来自客户端的开机指令应答后停止发送,此时服务端堵塞并等待接收服务器集群开机完成状态,收到来自客户端的开机完成状态后解除堵塞状态。
11.进一步地,进行服务器集群关机时,开关量输入端口di识别到系统关机操作后,服务端周期发送关机指令到客户端,直到服务端接收到来自客户端的关机指令应答后停止发送,此时服务端堵塞并等待接收服务器集群关机完成状态,收到来自客户端的关机完成状态后,先后断开服务器集群、开关机装置电源,完成服务器集群关机操作。
12.进一步地,客户端接收到来自服务端的开机指令后,首先发送开机指令应答至服务端,然后执行服务器集群开机操作,通过分别发送开机指令到各个功能单元的基板管理控制器bmc进行开机操作;待确认所有功能单元开机完成后,客户端发送开机完成状态到服务端。
13.进一步地,客户端接收到来自服务端的关机指令后,首先发送关机指令应答至服务端,然后执行服务器集群关机操作,通过分别发送关机指令到各个功能单元的基板管理控制器bmc进行关机操作;待确认所有功能单元关机完成后,发送关机完成状态到服务端,并执行自关机操作。
14.进一步地,当开关量输入端口di识别系统开机操作后,开关机装置通过rs232端口读取ups电源电量,若ups电源电量低于预设的下限值,则不执行后续的开机操作。
15.进一步地,开关机装置为单片机,服务器管理单元为微型计算机。
16.为了实现本发明的目的,本发明还公开了一种低成本高可靠服务器集群开关机方法,包括以下步骤:
17.步骤1、通过开关量输入端口di识别系统开机操作,两路开关量输出端口do接通开关机装置和服务器集群的电源;
18.步骤2、服务端通过rs232端口发送开机指令至客户端,客户端确认开机指令后向服务端发送开机应答指令,并通过基板管理控制器bmc控制各功能单元,执行服务器集群开机操作;
19.步骤3、服务端接收到开机应答指令后进入堵塞状态,直到服务器集群全部开机完成后,客户端向服务端发送开机完成状态,服务端解除堵塞状态并设置开机完成标记;
20.步骤4、通过开关量输入端口di识别系统关机操作,服务端通过rs232端口发送关机指令至客户端;
21.步骤5、客户端确认关机指令后向服务端发送关机应答指令,并通过基板管理控制器bmc控制各功能单元,执行服务器集群关机操作;
22.步骤6、服务端接收到关机应答指令后进入堵塞状态,直到服务器集群全部关机完
成后,客户端向服务端发送关机完成状态,服务端解除堵塞状态并设置关机完成标记;
23.步骤7、客户端发送关机完成状态后执行自关机,服务端设置关机完成标记后通过两路开关量输出端口do断开开关机装置和服务器集群的电源。
24.与现有技术相比,本发明的显著进步在于:1)实现了大型服务器集群的一键开关机功能,保证各个功能单元有序合法开关机;2)主要硬件设备采用低成本单片机,可有效控制服务器集群开关机装置的成本;3)服务器的开关机指令采用应答机制,开关机操作采用状态上报机制,确保开关机操作安全可靠;4)实时监测ups电源电量,具备掉电保护功能,确保信息安全。
25.为更清楚说明本发明的功能特性以及结构参数,下面结合附图及具体实施方式进一步说明。
附图说明
26.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
27.图1为本发明的一种低成本高可靠服务器集群开关机系统结构框图;
28.图2为本发明的一种低成本高可靠服务器集群开关机方法流程示意图;
29.图3为本发明的服务器端软件执行流程图;
30.图4为本发明的客户端软件执行流程图。
具体实施方式
31.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.如图1所示,开关机装置设置有开关量输入端口di,两路开关量输出端口do,两路rs232端口;服务器管理单元通过i2c总线或网络与服务器集群中的各个功能单元(如计算单元、存储单元)相连,各功能单元中均配备有基板管理控制器bmc;开关量输入端口di用于识别开机关机操作,两路开关量输出端口do分别用于控制开关机装置和服务器集群的电源通断;rs232端口一路与服务器管理单元连接,另一路rs232端口与ups电源连接;通过rs232端口监测ups电源电量具备掉电保护功能,用于防止系统异常断电造成重要信息丢失及系统文件损坏。服务软件采用cs结构,包括服务端和客户端,服务端部署于开关机装置中,客户端部署于服务器管理单元中。
33.具体地,在本实施例中,进行服务器集群开机时,开关量输入端口di识别到系统开机操作后,两路开关量输出端口do接通开关机装置和服务器集群的电源;服务端通过rs232端口发送开机指令至客户端,客户端确认开机指令后通过基板管理控制器bmc控制各功能单元,执行服务器集群开机操作;进行服务器集群关机时,开关量输入端口di识别到系统关机操作后,通过rs232端口发送关机指令至客户端,客户端确认关机指令后通过基板管理控制器bmc控制各功能单元,执行服务器集群关机操作。开关机装置的服务端通过rs232端口实时监测ups电源电量,依据电量信息进行关机操作决策,当ups电源电量低于预设下限值
时发起自动关机操作。
34.具体地,在本实施例中,开关机装置采用双供电方式,执行开机操作时,开关机装置通过开关机按键手动接通装置电源,随后开关机装置通过开关量输出端口do再次自动接通电源;执行关机操作时,开关机装置通过开关机按键手动断开装置电源,开关机装置依靠开关量输出端口do接通的电源继续工作,待服务器集群关机完成,通过开关量输出端口do自动断开装置电源。
35.如图2所示,一种低成本高可靠服务器集群开关机方法,包括以下步骤:
36.步骤1、通过开关量输入端口di识别系统开机操作,两路开关量输出端口do接通开关机装置和服务器集群的电源;
37.步骤2、服务端通过rs232端口发送开机指令至客户端,客户端确认开机指令后向服务端发送开机应答指令,并通过基板管理控制器bmc控制各功能单元,执行服务器集群开机操作;
38.步骤3、服务端接收到开机应答指令后进入堵塞状态,直到服务器集群全部开机完成后,客户端向服务端发送开机完成状态,服务端解除堵塞状态并设置开机完成标记;
39.步骤4、通过开关量输入端口di识别系统关机操作,服务端通过rs232端口发送关机指令至客户端;
40.步骤5、客户端确认关机指令后向服务端发送关机应答指令,并通过基板管理控制器bmc控制各功能单元,执行服务器集群关机操作;
41.步骤6、服务端接收到关机应答指令后进入堵塞状态,直到服务器集群全部关机完成后,客户端向服务端发送关机完成状态,服务端解除堵塞状态并设置关机完成标记;
42.步骤7、客户端发送关机完成状态后执行自关机,服务端设置关机完成标记后通过两路开关量输出端口do断开开关机装置和服务器集群的电源。
43.如图3所示,一种低成本高可靠服务器集群开关机系统服务端(开关机装置)工作流程如下:开关量输入端口di识别到系统开机操作后,两路开关量输出端口do接通开关机装置和服务器集群的电源;随后对开关机装置线程初始化后执行开机或关机操作;当执行关机操作后,判断服务器集群是否关机完成,若已完成则断开服务器集群和开关机装置电源。开关机装置线程初始化包括开关机操作监测线程初始化、ups电源监测线程初始化、开关机指令确认线程初始化。
44.具体地,在本实施例中,初始化开关机操作监测线程后,接通服务器集群电源时,服务端能够向客户端周期发送开机指令,当接收到客户端返回的开机应答指令后停止发送开机指令(此时服务端进入堵塞状态,等待客户端返回的开机完成状态);当识别到关机操作时,向客户端周期发送关机指令,接收到客户端返回的关机应答指令后停止发送关机指令(此时服务端进入堵塞状态,等待客户端返回的关机完成状态)。
45.具体地,在本实施例中,初始化ups电源监测线程后,服务端能够实时获取ups电源电量,当电量低于预设下限值时,服务端向客户端周期发送关机指令;若服务端收到客户端返回的关机应答指令则停止发送关机指令,否则继续向客户端发送关机指令。
46.具体地,在本实施例中,初始化开关机指令确认线程后,服务端能够判断是否接收到开机完成状态或关机完成状态。当接收到客户端传回的开机完成状态时,服务端解除堵塞状态并设置开机完成标志。当接收到客户端传回的关机完成状态时,服务端解除堵塞状
态并设置关机完成标志。服务端接收关机完成状态后,通过两路开关量输出端口do断开开关机装置和服务器集群的电源。
47.如图4所示,一种低成本高可靠服务器集群开关机系统客户端(服务器管理单元)工作流程如下:服务器管理单元通电后,客户端堵塞等待服务端发来的开机指令,若接收到开机指令则向服务端发送确认指令(开机应答指令)并执行服务器集群开机操作,当服务器集群开机完成,向服务端发送开机完成状态。开机完成后,客户端堵塞等待服务端发来的关机指令,若接收到关机指令则向服务端发送确认指令(关机应答指令)并执行服务器集群关机操作,当服务器集群关机完成,向服务端发送关机完成状态,随后服务器管理单元执行自关机。
48.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
49.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1