一种用于集群的UPS供电方法和装置与流程

文档序号:11153766阅读:995来源:国知局
一种用于集群的UPS供电方法和装置与制造工艺

本发明涉及集群领域,具体来说,涉及一种用于集群的UPS供电方法和装置。



背景技术:

UPS(Uninterruptible Power System/Uninterruptible Power Supply,不间断电源)是将蓄电池与主机相连接,通过主机逆变器等模块电路将直流电转换成市电的系统设备,其中,UPS系统对于高性能计算集群系统至关重要,由于高性能计算集群系统建设成本高昂,其承载的数据也至关重要,异常断掉导致的系统异常停机不仅可能直接损坏系统硬件,而且可能对系统内数据造成不可预知的损坏,因此,目前建设的高性能计算集群系统都会配置以UPS提供不间断供电,例如:在当市电输入正常时,UPS将市电稳压后供应给集群使用,同时向电池充电;当市电中断(如事故停电)时,UPS立即将电池的直流电能,通过逆变零切换转换的方法向集群继续供应,以维持集群系统不间断的正常工作,但是目前技术主要存在以下不足:

UPS支撑时间短:受限于UPS成本和技术,不可能配置无限制容量的UPS电池来支撑高性能计算集群系统长时间运行,例如通常只会配置能够支撑系统不间断运行30分钟的UPS电池容量;

需人工干预:当突然出现市电中断时,需要管理人员在UPS电池供电时间内完成所有设备的关机操作,而当市电恢复时,需要人工前往机房完成所有设备开机;

人工响应不及时:当市电异常中断后,由于受制于人工反应,极有可能无法在UPS支撑供电时间内完成所有设备关机,造成所有设备断电异常关闭,从而可能引起硬件故障或数据异常。

针对相关技术中的问题,目前尚未提出有效的解决方案。



技术实现要素:

针对相关技术中的问题,本发明提出一种用于集群的UPS供电方法和装置,能够实现UPS电池供电的短时间内,快速有序的对集群系统进行自动关闭,避免市电意外中断后,人工响应慢,导致整套系统异常关闭带来的硬件和数据损坏风险。

本发明的技术方案是这样实现的:

根据本发明的一个方面,提供了一种用于集群的UPS供电方法。

该UPS供电方法包括:获取市电输入的中断信息;根据中断信息,打开UPS电池给集群供电,并且获取UPS电池的供电时间;根据供电时间,依次关闭集群中的节点。

根据本发明的一个实施例,获取市电输入的中断信息包括:定时获取市电的输入电压;在输入电压等于0的情况下,获取市电输入的中断信息。

根据本发明的一个实施例,集群中的节点包括:管理节点、非管理节点。

根据本发明的一个实施例,根据供电时间,依次关闭集群中的节点包括:根据供电时间,确定供电时间的阈值;在供电时间达到阈值的情况下,依次关闭非管理节点、管理节点。

根据本发明的一个实施例,通过远程操作的方式关闭非管理节点。

根据本发明的另一方面,提供了一种用于集群的UPS供电装置。

该UPS供电装置包括:获取模块,用于获取市电输入的中断信息;打开获取模块,用于根据中断信息,打开UPS电池给集群供电,并且获取UPS电池的供电时间;关闭模块,用于根据供电时间,依次关闭集群中的节点。

根据本发明的一个实施例,获取模块包括:定时获取模块,用于定时获取市电的输入电压;获取子模块,用于在输入电压等于0的情况下,获取市电输入的中断信息。

根据本发明的一个实施例,集群中的节点包括:管理节点、非管理节点。

根据本发明的一个实施例,关闭模块包括:确定模块,用于根据供电时间,确定供电时间的阈值;关闭子模块,用于在供电时间达到阈值的情况下,依次关闭非管理节点、管理节点。

根据本发明的一个实施例,关闭子模块包括:远程操作模块,用于通过远程操作的方式关闭非管理节点。

本发明的有益技术效果在于:

本发明通过获取市电输入的中断信息,随后根据中断信息,打开UPS电池给集群供电,并且获取UPS电池的供电时间,最后根据供电时间,依次关闭集群中的节点,从而能够在UPS电池供电时间内,快速有序的对集群系统进行自动关闭,避免市电意外中断后,人工响应慢,导致整套系统异常关闭带来的硬件和数据损坏风险。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的用于集群的UPS供电方法的流程图;

图2是根据本发明实施例的用于集群的UPS供电方法的具体流程图;

图3是根据本发明实施例的用于集群的UPS供电装置的框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

根据本发明的实施例,提供了一种用于集群的UPS供电方法。

如图1所示,根据本发明实施例的UPS供电方法包括:

步骤S101,获取市电输入的中断信息;

步骤S103,根据中断信息,打开UPS电池给集群供电,并且获取UPS电池的供电时间;

步骤S105,根据供电时间,依次关闭集群中的节点。

通过本发明的上述方案,通过获取市电输入的中断信息,随后根据中断信息,打开UPS电池给集群供电,并且获取UPS电池的供电时间,最后根据供电时间,依次关闭集群中的节点,从而能够在UPS电池供电时间内,快速有序的对集群系统进行自动关闭,避免市电意外中断后,人工响应慢,导致整套系统异常关闭带来的硬件和数据损坏风险。

根据本发明的一个实施例,获取市电输入的中断信息包括:定时获取市电的输入电压;在输入电压等于0的情况下,获取市电输入的中断信息。

根据本发明的一个实施例,集群中的节点包括:管理节点、非管理节点。

根据本发明的一个实施例,根据供电时间,依次关闭集群中的节点包括:根据供电时间,确定供电时间的阈值;在供电时间达到阈值的情况下,依次关闭非管理节点、管理节点。

根据本发明的一个实施例,通过远程操作的方式关闭非管理节点。

为了更好的描述本发明,通过具体的实施例对本发明进行详细的描述。

如图2所示,步骤S1,新循环开始;

步骤S2,用于判断UPS电池是否供电,通过在高性能计算集群的管理节点上部署监控软件,通过SNMP(Simple Network Management Protocol,简单网络管理协议)与UPS进行通信,定时根据OID(Object Identifier,对象标识符)号获取UPS的市电输入电压情况,当获取到输入电压为0时,说明市电供应已经中断,从而将UPS的电池状态设置为开启,表明UPS已经进入电池供电状态,执行步骤S3,若未获取到输入电压为0时,继续通过市电正常供应,执行步骤S13,其中,本发明通过SNMP实现集群与UPS的通信,以获取UPS信息,如输入电压,输出电压,电池余量等,OID号可表示UPS的各项参数,如输入电压,均有唯一的OID与之对应,因此,本发明通过查询对应的OID值获取UPS相关参数;

步骤S3,判断市电供应是否恢复正常,若恢复正常,则执行步骤S4,若未恢复正常,执行步骤S6;

步骤S4,通过日志输出市电恢复正常,同时,删除标记1、标记2,其中,标记1为UPS_BATTERY_ON,标记2为NODES_OFF;

步骤S5,进入下一轮循环;

步骤S6,判断电池供电时间是否大于用户设定的供电时间的阈值,若供电时间大于阈值,则执行步骤S7,若供电时间小于阈值,则执行步骤S12,当然可以理解,此处,用户设定的阈值适用于UPS电池充满以及集群全部工作的情况,当然可以理解,存在着电池未充满以及集群的节点未全部开启的情况,这种情况下,可根据电池的电量计算供电阈值,从而具有更大的适用性;

步骤S7,判断标记2是否存在,若标记2存在,则执行步骤S8,若标记2不存在,则执行步骤S10;

步骤S8,标记2存在则表明列表中的节点已经关机,并且通过日志输出;

步骤S9,进入下一循环;

步骤S10,设置标记2,并关闭列表中的节点;

步骤S11,进入下一循环;

步骤S12,进入下一循环;

步骤S13,判断市电供应是否恢复正常,若恢复正常,则执行步骤S14,若未恢复正常,执行步骤S15;

步骤S14,进入下一循环;

步骤S15,通过日志输出市电中断,并且设置标记1,以及准备关机列表;

步骤S16,进入下一循环。

通过上述方法,在市电供应异常中断后,管理节点能够自动发现市电供应异常,并将供电时间与用户设置的关机时间阈值(或计算的阈值)进行比对,当UPS供电时间达到阈值后,管理节点通过IPMI(Intelligent Platform Management Interface,智能平台管理接口)对其余节点进行远程关机操作,并且关机操作会按照计算节点、协处理器节点、其他计算资源节点、登录节点、存储系统的顺序有序进行关闭,其中,IPMI是一种开放标准的硬件管理接口规格,定义了嵌入式管理子系统进行通信的特定方法,本发明通过IPMI向高性能计算集群发出远程开关机操作,其中,时间阈值为设置关机时间上限的值,当UPS电池供电时间达到此值,会发出系统有序关闭的指令,当然可以理解,可根据实际UPS配置容量等情况计算该阈值。

此外,上述方法不仅仅适用于高性能计算集群系统,同时适用于接入UPS的任何Linux系统服务器或工作站,实现对关键服务器设备的智能供电功能。

根据本发明的实施例,还提供了一种用于集群的UPS供电装置。

如图3所示,根据本发明实施例的UPS供电装置包括:

获取模块31,用于获取市电输入的中断信息;

打开获取模块32,用于根据中断信息,打开UPS电池给集群供电,并且获取UPS电池的供电时间;

关闭模块33,用于根据供电时间,依次关闭集群中的节点。

根据本发明的一个实施例,获取模块31包括:定时获取模块(未示出),用于定时获取市电的输入电压;获取子模块(未示出),用于在输入电压等于0的情况下,获取市电输入的中断信息。

根据本发明的一个实施例,集群中的节点包括:管理节点、非管理节点。

根据本发明的一个实施例,关闭模块33包括:确定模块(未示出),用于根据供电时间,确定供电时间的阈值;关闭子模块(未示出),用于在供电时间达到阈值的情况下,依次关闭非管理节点、管理节点。

根据本发明的一个实施例,关闭子模块包括:远程操作模块(未示出),用于通过远程操作的方式关闭非管理节点。

综上所述,借助于本发明的上述技术方案,通过获取市电输入的中断信息,随后根据中断信息,打开UPS电池给集群供电,并且获取UPS电池的供电时间,最后根据供电时间,依次关闭集群中的节点,从而能够在UPS电池供电时间内,快速有序的对集群系统进行自动关闭,避免市电意外中断后,人工响应慢,导致整套系统异常关闭带来的硬件和数据损坏风险。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1