集群系统综合调度节能方法及装置的制造方法

文档序号:9765662阅读:551来源:国知局
集群系统综合调度节能方法及装置的制造方法
【技术领域】
[0001]本发明涉及一种集群系统综合调度节能方法及装置,属于集群计算系统节能技术领域。
【背景技术】
[0002]集群计算系统是一种由互相连接的计算机分机组成的并行或分布式系统,可以作为单独、统一的计算资源来使用。这些集群计算系统(比如大型的云计算系统、超级计算机系统等)的运行设备或分机较多,但是在日常情况下利用率不足,能耗巨大。以天河2号超级计算机为例,其功耗超过20兆瓦,一年仅电费就要I亿元人民币,但是目前的利用率不到50%。而现有集群计算系统通常的节能做法是对整个柜体的全部计算机进行全开和全关来错峰用电,不能有效地针对局部的分机采取灵活的节能手段。

【发明内容】

[0003]本发明的目的是克服上述现有技术的不足,提供一种集群系统综合调度节能方法及装置,结合局部分机的负载压力、运行状况、环境因素以及虚拟化技术,整合分机资源实现有效的节能。
[0004]本发明采用的技术方案一方面提供一种集群系统综合调度节能方法,包括如下步骤:
A、获取集群系统中每个分机的负载数据和环境数据以及定期监控分机的运行状况数据,并且记录所述负载数据、环境数据和运行状况数据到一调度表;
B、动态刷新所述调度表,利用调度表中的负载数据且以排序方式确定每一分机的利用率优先级,如果所述调度表中相应分机的环境数据和/或运行状态数据的超过一临界值,则向相应的分机分配超临界标识;
C、按照利用率优先级从高到低的顺序依次向带有超临界标识的并且是低于预设利用率优先级的分机发送调度请求,触发该分机完成当前工作或者完成工作转移操作,然后通过执行器调度处理闲置运行的分机,其中所述调度处理包括对分机进行的开启、关闭、预热或迀移操作。
[0005]进一步,所述负载数据包括处理器占用率、运行内存使用率或用户连接数;所述环境数据包括分机所处的机柜区域的温度值;所述运行状况数据包括分机的持续运行时间。
[0006]作为本发明方法的进一步改进,在所述步骤B中,分机的利用率优先级的排序方式包括:
处理器占用率平均值更高的分机的利用率优先级高于处理器占用率平均值更低的分机的利用率优先级;运行内存使用率平均值更高的分机的利用率优先级高于运行内存使用率平均值更低的分机的利用率优先级;用户连接数更多的分机的利用率优先级高于用户连接数更少的分机的利用率优先级;运行中的分机的利用率优先级高于关闭的分机的利用率优先级。
[0007]作为本发明方法的进一步改进,所述步骤B还包括:根据所述集群系统的整体负荷强度动态调整所述临界值。
[0008]优选地,所述步骤B还包括:当集群系统的整体负荷强度超过预设的上限水平时,增大所述临界值;并且当集群系统的整体负荷强度低于预设的下限水平时,减少所述临界值。
[0009]作为本发明方法的进一步改进,所述步骤C还包括:当集群系统的整体负荷强度超过预设的上限水平时,开启和预热低于所述的预设利用率优先级的分机;当集群系统的整体负荷强度低于预设的下限水平时,迀移和关闭低于所述的预设利用率优先级的分机。
[0010]优选地,所述步骤C还包括:在一部分低于预设利用率优先级或闲置运行的分机中创建虚拟机,用于利用虚拟化技术迀移其他分机的工作以及为其他分机提供开机加速。
[0011]优选地,所述步骤C还包括:从高于预设的上限利用率优先级的分机向低于预设的下限利用率优先级或闲置运行的分机中迀移虚拟机。
[0012]作为本发明方法的进一步改进,所述方法还包括以下步骤:如果在一机柜区域的分机的环境数据和/或运行状况数据的超出危险临界值,则直接将该机柜区域的全部分机迀移,然后进行关闭。
[0013]本发明采用的技术方案一方面提供一种集群系统综合调度节能装置,包括:
监控模块,用于获取集群系统中每个分机的负载数据和环境数据以及定期监控分机的运行状况数据,并且记录所述负载数据、环境数据和运行状况数据到一调度表;
优先级处理模块,用于动态地刷新所述调度表,利用调度表中的负载数据且以排序方式确定每一分机的利用率优先级,如果所述调度表中相应分机的环境数据和/或运行状态数据的超过一临界值,则向相应的分机分配超临界标识;
调度模块,用于按照利用率优先级从高到低的顺序依次向带有超临界标识的并且是低于预设利用率优先级的分机发送调度请求,触发该分机完成当前工作或者完成工作转移操作,然后通过执行器调度处理闲置运行的分机,其中所述调度处理包括对分机进行的开启、关闭、预热或迀移操作,所述负载数据包括处理器占用率、运行内存使用率或用户连接数,所述环境数据包括分机所处的机柜区域的温度值,所述运行状况数据包括分机的持续运行时间。
[0014]本发明的有益效果为:有效地针对局部的分机采取灵活的节能手段;结合局部分机的负载压力、运行状况、环境因素以及虚拟化技术,整合分机资源实现综合节能;可以为集群计算机系统提供分机智能错峰关闭、开机预热家属、过热耗电保护等功能,实现了灵活的节能减排方案。
【附图说明】
[0015]图1所示为根据本发明实施例的方法步骤框图;
图2所示为根据本发明实施例的装置框图;
图3所示为根据本发明实施例的示例性框图;
图4所示为本发明另一优选实施例的示例性框图。
【具体实施方式】
[0016]下面结合附图和实施例对本发明作进一步说明。
[0017]图1和2所示为根据本发明一实施例的示例性原理框图。在一个实施例中,根据本发明的方法包括如下步骤:A、获取集群系统中每个分机的负载数据和环境数据以及定期监控分机的运行状况数据,并且记录所述负载数据、环境数据和运行状况数据到一调度表;B、动态刷新所述调度表,利用调度表中的负载数据且以排序方式确定每一分机的利用率优先级,如果所述调度表中相应分机的环境数据和/或运行状态数据的超过一临界值,则向相应的分机分配超临界标识;C、按照利用率优先级从高到低的顺序依次向带有超临界标识的并且是低于预设利用率优先级的分机发送调度请求,触发该分机完成当前工作或者完成工作转移操作,然后通过执行器调度处理闲置运行的分机,其中所述调度处理包括对分机进行的开启、关闭、预热或迀移操作。在一个实施例中,在步骤A中,所述负载数据包括处理器占用率、运行内存使用率或用户连接数,所述环境数据包括分机所处的机柜区域的温度值,所述运行状况数据包括分机的持续运行时间。在一个实施例中,在所述步骤B中,分机的利用率优先级的排序方式包括:处理器占用率平均值更高的分机的利用率优先级高于处理器占用率平均值更低的分机的利用率优先级;运行内存使用率平均值更高的分机的利用率优先级高于运行内存使用率平均值更低的分机的利用率优先级;用户连接数更多的分机的利用率优先级高于用户连接数更少的分机的利用率优先级;运行中的分机的利用率优先级高于关闭的分机的利用率优先级。优选地,所述步骤B还包括根据所述集群系统的整体负荷强度动态调整所述临界值,例如当集群系统的整体负荷强度超过预设的上限水平时,增大所述临界值,以及,当集群系统的整体负荷强度低于预设的下限水平时,减少所述临界值。在一个实施例中,所述步骤C还包括:当集群系统的整体负荷强度超过预设的上限水平时,开启和预热低于所述的预设利用率优先级的分机;当集群系统的整体负荷强度低于预设的下限水平时,迀移和关闭低于所述的预设利用率优先级的分机。在另一个实施例中,所述步骤C还包括:在一部分低于预设利用率优先级或闲置运行的分机中创建虚拟机,用于利用虚拟化技术迀移其他分机的工作以及为其他分机提供开机加速。优选地,所述步骤C还包括:从高于预设的上限利用率优先级的分机向低于预设的下限利用率优先级或闲置运行的分机中迀移虚拟机。作为一个可选的实施例,根据本发明的方法,还包括步骤:如果在一机柜区域的分机的环境数据和/或运行状况数据的超出危险临界值,则直接将该机柜区域的全部分机迀移,然后进行关闭。
[0018]在一些实施例中,根据本发明的集群系统综合调度节能装置包括用于储存应用程序存储器和处理器,其中所述处理器包括:监控模块,用于获取集群系统中每个分机的负载数据和环境数据以及定期监控分机的运行状况数据,并且记录所述负载数据、环境数据和运行状况数据到一调度表;优先级处理模块,用于动态地刷新所
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1