分布式集群设备功耗监控方法、装置、系统及相关组件与流程

文档序号:18179220发布日期:2019-07-17 05:06阅读:182来源:国知局
分布式集群设备功耗监控方法、装置、系统及相关组件与流程

本发明涉及分布式集群技术领域,特别涉及一种分布式集群设备功耗监控方法、装置、系统、一种管理设备及一种可读存储介质。



背景技术:

分布式集群系统可以横向扩展到200到300个节点,按单节点功耗500w计算,整个集群的功耗相当巨大,在实际运行过程中,为便于调节和优化系统的能耗,需要获取集群设备的总功耗进行相应的分析。

而实际使用过程中,对集群功耗做监控一般使用功耗分析仪,接在集群前端电源输入端测试。这种功耗测试方法需要接入特定的测试仪器,集群功耗监控成本较高,且无法实现长时间的在线监控。

因此,如何实现整体集群的实时监控,同时控制监控成本,是本领域技术人员需要解决的技术问题。



技术实现要素:

本发明的目的是提供一种分布式集群设备功耗监控方法,该方法通过管理设备获取每台设备的功耗,并经过统计计算得出集群的实际功耗,可以实现整体集群的实时监控,同时监控成本低;本发明的另一目的是提供一种分布式集群设备功耗监控装置、系统、一种管理设备及可读存储介质,具有上述有益效果。

为解决上述技术问题,本发明提供一种分布式集群设备功耗监控方法,包括:

管理设备向分布式集群各节点中功耗采集部件发布功耗采集任务;

接收到各节点返回的功耗信息后,从所述功耗信息中提取各节点功耗值;

根据预先存储的分布式集群节点信息对所述各节点功耗值进行统计计算,得到集群整体功耗;

根据所述集群整体功耗调整集群工作状态。

优选地,所述根据所述集群整体功耗调整集群工作状态,包括:

判断所述集群整体功耗是否超过预设门限;

如果超过所述预设门限,根据预设节点功耗降低策略向集群节点发送调节指令。

优选地,所述根据预设节点功耗降低策略向集群节点发送调节指令,包括:

向业务负载低于负载阈值的集群节点发送功耗调节指令;其中,所述功耗调节指令包括:cpu休眠指令、硬盘休眠指令、pcie芯片休眠指令、sas芯片休眠指令。

优选地,当所述集群整体功耗超过预设门限后,还包括:生成功耗告警提示信息并输出。

优选地,所述功耗采集部件的功耗采集方法包括:

各节点中bmc通过电源接口读取电源输入功耗,得到各节点输入功耗;

将所述各节点输入功耗作为节点功耗发送至所述管理设备。

本发明公开一种分布式集群设备功耗监控装置,包括:

指令发送单元,用于向分布式集群各节点中功耗采集部件发送功耗采集发送指令;

功耗值提取单元,用于接收到各节点返回的功耗信息后,从所述功耗信息中提取各节点功耗值;

集群功耗统计单元,用于根据预先存储的分布式集群节点信息对所述各节点功耗值进行统计计算,得到集群整体功耗;

集群工作调整单元,用于根据所述集群整体功耗调整集群工作状态。

优选地,所述集群工作调整单元包括:

门限判断子单元,用于判断所述集群整体功耗是否超过预设门限;

工作调整子单元,用于如果超过所述预设门限,根据预设节点功耗降低策略向集群节点发送调节指令。

本发明公开一种管理设备,包括:

存储器,用于存储程序;

处理器,用于执行所述程序时实现所述分布式集群设备功耗监控方法的步骤。

本发明公开一种分布式集群设备功耗监控系统,包括:

管理设备,用于向分布式集群各节点中功耗采集部件发送功耗采集发送指令;接收到各节点返回的功耗信息后,从所述功耗信息中提取各节点功耗值;根据预先存储的分布式集群节点信息对所述各节点功耗值进行统计计算,得到集群整体功耗;

若干集群设备,用于根据所述功耗采集发送指令进行功耗数据的采集,并将采集得到的节点功耗数据返回至所述管理设备;

一端与所述管理设备连接,另一端与所述各集群设备连接的交换机,用于对所述管理设备与所述各集群设备间产生的交互信息进行信息传递。

本发明公开一种可读存储介质,所述可读存储介质上存储有程序,所述程序被处理器执行时实现所述分布式集群设备功耗监控方法的步骤。

本发明所提供的分布式集群设备功耗监控方法,管理设备与各集群节点连接,控制各节点的功耗采集部件进行实时功耗采集,并将接收到的各节点功耗进行统计汇总,集群整体功耗相当于各节点功耗的综合,通过对各节点功耗进行统计即可得到实时集群整体功耗,根据功耗值进行集群整体工作状态的调整可以从全局出发提升数据分析的整体性,实现对集群设备总功耗的实时监控;同时该方法无需额外设置集群功耗测试仪器等设备,只需利用现有架设的线路进行监控即可,监控成本低,且可以实现集群节点的连续功耗监控。

本发明还提供了一种分布式集群设备功耗监控装置、系统、一种管理设备及可读存储介质,具有上述有益效果,在此不再赘述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种分布式集群设备功耗监控方法的流程图;

图2为本发明实施例提供的一种分布式集群设备功耗监控装置的结构框图;

图3为本发明实施例提供的一种管理设备的结构框图;

图4为本发明实施例提供的一种管理设备的结构示意图;

图5为本发明实施例提供的一种分布式集群设备功耗监控系统网络拓扑图。

具体实施方式

本发明的核心是提供一种分布式集群设备功耗监控方法,该方法通过管理设备获取每台设备的功耗,并经过统计计算得出集群的实际功耗,可以实现整体集群的实时监控,同时监控成本低;本发明的另一核心是提供一种分布式集群设备功耗监控装置、系统、一种管理设备及可读存储介质。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参考图1,图1为本实施例提供的分布式集群设备功耗监控方法的流程图;该方法主要可以包括:

步骤s110、管理设备向分布式集群各节点中功耗采集部件发送功耗采集发送指令。

本发明中采用管理设备通过管理网络实现分布式设备的集群管理,其中,管理网络指管理设备与集群各节点间的数据传输网络,可参照相关技术中进行网络的架设,比如架设nfs网络、http网络等。

本实施例中对各节点进行自身功耗采集的方法不做限定,可以参照相关技术中的步骤,在此不再赘述。其中,优选地,可以将节点电源的输入功耗作为节点功耗,则具体地,功耗采集部件的功耗采集发送包括以下步骤:

各节点中bmc通过电源接口读取电源输入功耗,得到各节点输入功耗;

将各节点输入功耗作为节点功耗发送至管理设备。

每各集群节点通过bmc作单台设备管理,读取电源输入功耗作为节点功耗,数据读取方便且较为精准。

此外,也可以获取节点的cpu功耗等节点重要部件的功耗作为节点功耗进行相应计算,在此不做限定。

管理设备通过管理网络向各集群节点发布功耗采集任务,由于本实施例中对各节点进行自身功耗采集的方法不做限定,则相应地,本实施例中对管理设备具体向节点中何种设备进行任务的发布也不做限定。节点在接受到采集任务后调用相关设备进行实时功耗的采集,并将采集得到的数据通过管理网络返回至管理设备。

步骤s120、管理设备接收到各节点返回的功耗信息后,从功耗信息中提取各节点功耗值。

接收到节点返回的功耗信息后,由于返回信息中还包括帧头、帧尾等无用信息,需要从返回的信息中提取有用的功耗数据,具体数据识别提取过程可以参照相关技术,在此不再赘述。

步骤s130、管理设备根据预先存储的分布式集群节点信息对各节点功耗值进行统计计算,得到集群整体功耗。

统计计算的过程具体可以直接对所有节点功耗值相加,将求和的结果作为集群整体功耗值,也可以根据节点进行相应功耗比例的设定等。

步骤s140、管理设备根据集群整体功耗调整集群工作状态。

得到集群整体功耗数据后,可以依据整体功耗进行相应工作状态的调整,功耗数据与工作状态的调整过程可以相辅相成,根据功耗调整工作状态,同时根据集群工作状态又进行集群功耗策略的调整,从而实现集群最优状态。

由于目前集群整体功耗测试过程的高成本以及低回报,对集群功耗的监控通常基于单节点,即在每个节点上设置功耗的采集以及调整,而从节点进行功耗的监控规程不仅繁琐,而且无法适应集群整体功耗策略,通过对集群功耗进行分析,可以全面地从整体进行功耗的分析,避免了从单节点进行功耗监控的繁琐,可以根据集群整体负载情况进行相应策略的调整,从而实现集群整体的最优运作方案。

本实施例中对具体的集群工作状态的调整策略设置不做限定,当为实现集群的节能降耗时,可以为集群整体功耗设限,当超过某个限值后进行相应调整,比如可以向空闲节点发送休眠指令、向低负载高功耗节点发送某些高耗能部件工作状态调整命令等,其中,优选地,可以向业务负载低于负载阈值的集群节点发送功耗调节指令;其中,功耗调节指令包括:cpu休眠指令、硬盘休眠指令、pcie芯片休眠指令、sas芯片休眠指令(本实施例中以上述功耗调节指令为例,但不限于此),以降低集群整体功耗。

此外,当集群整体功耗超过预设门限后,还可以生成功耗告警提示信息并输出,以实现集群功耗状态信息的及时输出,以便进行相应策略的调整。

以上以单次功耗采集过程为例进行介绍,本发明实施例提供的上述功耗监控方法适用于长时间持续监控场景,则可以由管理设备向节点发送定时功耗采集发送指令,即由节点控制定时采集;也可以定时触发管理设备的任务发布,在此不做限定。通过实时对集群节点的功耗的监控以及调节,可以实现实时集群功耗收集和计算,以及工作状态的调整,从而真正实现节能降耗。

基于上述介绍,本发明实施例公开的分布式集群设备功耗监控方法,管理设备与各集群节点连接,控制各节点的功耗采集部件进行实时功耗采集,并将接收到的各节点功耗进行统计汇总,集群整体功耗相当于各节点功耗的综合,通过对各节点功耗进行统计即可得到实时集群整体功耗,根据功耗值进行集群整体工作状态的调整可以从全局出发提升数据分析的整体性,实现对集群设备总功耗的实时监控;同时该方法无需额外设置集群功耗测试仪器等设备,只需利用现有架设的线路进行监控即可,监控成本低,且可以实现集群节点的连续功耗监控。

请参考图2,图2为本发明实施例提供的分布式集群设备功耗监控装置的结构框图;可以包括:指令发送单元210、功耗值提取单元220、集群功耗统计单元230以及集群工作调整单元240。本实施例提供的分布式集群设备功耗监控装置可与上述分布式集群设备功耗监控方法相互对照。

其中,指令发送单元210主要用于向分布式集群各节点中功耗采集部件发送功耗采集发送指令;

功耗值提取单元220主要用于接收到各节点返回的功耗信息后,从功耗信息中提取各节点功耗值;

集群功耗统计单元230主要用于根据预先存储的分布式集群节点信息对各节点功耗值进行统计计算,得到集群整体功耗;

集群工作调整单元240主要用于根据集群整体功耗调整集群工作状态。

其中,优选地,集群工作调整单元具体可以包括:门限判断子单元以及工作调整子单元。

门限判断子单元主要用于判断集群整体功耗是否超过预设门限;

工作调整子单元主要用于如果超过预设门限,根据预设节点功耗降低策略向集群节点发送调节指令。

进一步地,工作调整子单元具体可以用于:向业务负载低于负载阈值的集群节点发送功耗调节指令;其中,功耗调节指令包括:cpu休眠指令、硬盘休眠指令、pcie芯片休眠指令、sas芯片休眠指令。

集群工作调整单元中可以进一步包括:功耗提示单元,功耗提示单元与门限判断子单元连接,主要用于当集群整体功耗超过预设门限后,生成功耗告警提示信息并输出。

功耗采集部件的功耗采集方法包括:

各节点中bmc通过电源接口读取电源输入功耗,得到各节点输入功耗;

将各节点输入功耗作为节点功耗发送至管理设备。

本实施例提供的分布式集群设备功耗监控装置通过管理设备获取每台设备的功耗,并经过统计计算得出集群的实际功耗,可以实现整体集群的实时监控,同时监控成本低。

请参考图3,图3为本实施例提供的一种管理设备的结构框图;该设备可以包括:存储器300以及处理器310。管理设备可参照上述分布式集群设备功耗监控方法的介绍。

其中,存储器300主要用于存储程序;

处理器310主要用于执行程序时实现上述分布式集群设备功耗监控方法的步骤。

请参考图4,为本实施例提供的管理设备的结构示意图,该管理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在管理设备301上执行存储介质330中的一系列指令操作。

管理设备301还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

上面图1所描述的分布式集群设备功耗监控方法中的步骤可以由管理设备的结构实现。

本实施例公开了一种可读存储介质,可读存储介质上存储有程序,程序被处理器执行时实现分布式集群设备功耗监控方法的步骤,其中,分布式集群设备功耗监控方法可参照图1对应的实施例,在此不再赘述。

该可读存储介质具体可以为u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可存储程序代码的可读存储介质。

本实施例公开一种分布式集群设备功耗监控系统,图5所示为一种分布式集群设备功耗监控系统网络拓扑图,该系统主要包括:一台管理设备、若干台集群设备以及一端与管理设备连接,另一端与各集群设备连接的交换机。

其中,管理设备主要用于向分布式集群各节点中功耗采集部件发送功耗采集发送指令;接收到各节点返回的功耗信息后,从功耗信息中提取各节点功耗值;根据预先存储的分布式集群节点信息对各节点功耗值进行统计计算,得到集群整体功耗;

各集群设备主要用于根据功耗采集发送指令进行功耗数据的采集,并将采集得到的节点功耗数据返回至管理设备;

由于集群节点数量众多,进行信息的传递以及汇总需要交换机,交换机主要用于对管理设备与各集群设备间产生的交互信息进行信息传递。其中,在现有的分布式存储网络中集群外部网络中架设有多台交换机,可以直接利用已架设的外部网络交换机实现信息的传输。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上对本发明所提供的分布式集群设备功耗监控方法、装置、系统、管理设备及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1