一种确定集群的节能策略的方法与流程

文档序号:11215977阅读:330来源:国知局
一种确定集群的节能策略的方法与流程

本发明涉及计算机领域,具体来说,涉及一种确定集群的节能策略的方法。



背景技术:

随着计算机网络的快速发展,数据中心的能耗问题日益突出,其不仅增加成本、降低稳定性还对环境造成重大影响。根据调查显示,it设备能耗最高,约占数据中心总能耗的50%左右。因此,服务器节能技术是对数据中心进行节能减排探索中的重要组成部分。此外,集群可以根据cpu利用率、内存利用率、磁盘i/o(input/output,输入/输出)利用率及网络i/o利用率等负载情况分为计算密集型、密集型、空闲型、其他等。每一种应用类型的服务器都可以采用不同的服务器节能技术,如空闲型服务器可以设置为最低功耗策略,使该服务器在运行时消耗最低功耗。

然而,现有的服务器负载分析技术大多数都是用于实现负载均衡以及负载预测方面,基本上没有和服务器应用类型关联应用于服务器节能领域。

针对相关技术中的问题,目前尚未提出有效的解决方案。



技术实现要素:

针对相关技术中的问题,本发明提出一种确定集群的节能策略的方法,其能够对集群以及服务器根据负载数据与预定义的应用类型数据进行相关度分析,从而提出建议的最佳节能策略。

本发明的技术方案是这样实现的:

根据本发明的一个方面,提供了一种确定集群的节能策略的方法。

该确定集群的节能策略的方法包括:

获取集群的负载利用率;

根据预先设定的周期,将负载利用率切分为若干个切分片段,并将每个切分片段进行位移计算,以获得若干个位移数据;

计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数,并根据第一皮尔逊相关系数,确定集群的最佳节能策略。

根据本发明的一个实施例,负载利用率至少包括:cpu利用率、磁盘利用率、内存利用率、和网络利用率。

根据本发明的一个实施例,每个切分片段包括多个时间点对应的负载利用率。

根据本发明的一个实施例,计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数包括:

根据第一皮尔逊相关系数的第一计算公式,计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数,其中,第一计算公式为:

其中,rxy为第一皮尔逊相关系数,n为周期,x为应用类型数据,y为位移数据,i为时间点。

根据本发明的一个实施例,根据第一皮尔逊相关系数,确定集群的最佳节能策略包括:

根据第一皮尔逊相关系数,确定集群的应用类型,从而确定集群的应用类型对应的节能策略,其中,应用类型至少包括:计算密集型、密集型、空闲型。

根据本发明的一个实施例,应用类型数据包括:计算密集型数据、密集型数据、空闲型数据。

根据本发明的一个实施例,还包括:

根据负载利用率的第一历史数据,确定集群和最佳节能策略是否匹配;

在集群和最佳节能策略匹配的情况下,确定集群运行正常;

在集群和最佳节能策略不匹配的情况下,发出报警信号。

根据本发明的一个实施例,根据负载利用率的第一历史数据,确定集群和最佳节能策略是否匹配包括:

获取集群实际功耗的第二历史数据;

计算第一历史数据和第二历史数据的第二皮尔逊相关系数,并根据第二皮尔逊相关系数,确定集群和最佳节能策略是否匹配。

根据本发明的一个实施例,第二历史数据包括多个时间点对应的实际功耗数据。

根据本发明的一个实施例,计算第一历史数据和第二历史数据的第二皮尔逊相关系数包括:

根据第二皮尔逊相关系数的计算公式,计算第一历史数据和第二历史数据的第二皮尔逊相关系数,其中,第二计算公式为:

其中,r为第二皮尔逊相关系数,n为周期,x为第一历史数据,为第一历史数据的平均值,y为第二历史数据,为第二历史数据的平均值,i为时间点。

本发明的有益技术效果在于:

本发明通过获取集群的负载利用率,随后根据预先设定的周期,将负载利用率切分为若干个切分片段,并将每个切分片段进行位移计算,以获得若干个位移数据,最后计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数,并根据第一皮尔逊相关系数,确定集群的最佳节能策略,从而能够对集群以及服务器根据负载数据与预定义的应用类型数据进行相关度分析,进而提出建议的最佳节能策略。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的确定集群的节能策略的方法的流程图;

图2是根据本发明实施例的典型的web应用服务器负载趋势的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

根据本发明的实施例,提供了一种确定集群的节能策略的方法。

如图1所示,根据本发明实施例的确定集群的节能策略的方法包括:

步骤s101,获取集群的负载利用率;

步骤s103,根据预先设定的周期,将负载利用率切分为若干个切分片段,并将每个切分片段进行位移计算,以获得若干个位移数据;

步骤s105,计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数,并根据第一皮尔逊相关系数,确定集群的最佳节能策略。

借助于本发明的技术方案,通过获取集群的负载利用率,随后根据预先设定的周期,将负载利用率切分为若干个切分片段,并将每个切分片段进行位移计算,以获得若干个位移数据,最后计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数,并根据第一皮尔逊相关系数,确定集群的最佳节能策略,从而能够对集群以及服务器根据负载数据与预定义的应用类型数据进行相关度分析,进而提出建议的最佳节能策略。

根据本发明的一个实施例,负载利用率至少包括:cpu利用率、磁盘利用率、内存利用率、和网络利用率。

根据本发明的一个实施例,每个切分片段包括多个时间点对应的负载利用率。

根据本发明的一个实施例,计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数包括:

根据第一皮尔逊相关系数的第一计算公式,计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数,其中,第一计算公式为:

其中,rxy为第一皮尔逊相关系数,n为周期,x为应用类型数据,y为位移数据,i为时间点。

根据本发明的一个实施例,根据第一皮尔逊相关系数,确定集群的最佳节能策略包括:

根据第一皮尔逊相关系数,确定集群的应用类型,从而确定集群的应用类型对应的节能策略,其中,应用类型至少包括:计算密集型、密集型、空闲型。

根据本发明的一个实施例,应用类型数据包括:计算密集型数据、密集型数据、空闲型数据。

根据本发明的一个实施例,还包括:

根据负载利用率的第一历史数据,确定集群和最佳节能策略是否匹配;

在集群和最佳节能策略匹配的情况下,确定集群运行正常;

在集群和最佳节能策略不匹配的情况下,发出报警信号。

根据本发明的一个实施例,根据负载利用率的第一历史数据,确定集群和最佳节能策略是否匹配包括:

获取集群实际功耗的第二历史数据;

计算第一历史数据和第二历史数据的第二皮尔逊相关系数,并根据第二皮尔逊相关系数,确定集群和最佳节能策略是否匹配。

根据本发明的一个实施例,第二历史数据包括多个时间点对应的实际功耗数据。

根据本发明的一个实施例,计算第一历史数据和第二历史数据的第二皮尔逊相关系数包括:

根据第二皮尔逊相关系数的计算公式,计算第一历史数据和第二历史数据的第二皮尔逊相关系数,其中,第二计算公式为:

其中,r为第二皮尔逊相关系数,n为周期,x为第一历史数据,为第一历史数据的平均值,y为第二历史数据,为第二历史数据的平均值,i为时间点。

为了更好的描述本发明的技术方案,下面通过具体的实施例对本发明的技术方案进行详细的描述。

集群的数据中心服务器一般都是作为特定类型服务器,该中心服务器上固定的运行某种应用程序,此外,还对该中心服务器的cpu利用率、内存利用率、磁盘i/o(input/output,输入/输出)利用率及网络i/o利用率等负载情况进行统计分析后发现,该中心服务器的某种负载数据呈周期性有规律的波动,例如,某中心服务器的cpu利用率长期处于100%,而某中心服务器的负载长期处于0%等。同时,服务器的负载是指cpu、内存、磁盘、网络等。

此外,集群可以根据cpu利用率、内存利用率、磁盘i/o利用率及网络i/o利用率等负载情况进行应用类型的分类,具体如下:

计算密集型:服务器运行需要使用大量的cpu资源,例如高并发的web/mail服务器、图像/视频处理的服务器、科学计算的服务器等都可被视作计算密集型的应用;

io密集型(或密集型):io密集型的相关应用通常用来处理大量数据,其需要大量内存和存储,频繁的通过磁盘的输入/输出操作读写数据,而对cpu资源的要求则较少,大部分时候cpu都在等待硬盘,例如,数据库服务器、文件服务器等;

空闲型:对cpu资源、网络资源、磁盘i/o资源等需求量都很低的应用类型服务器;

其他类型:除了计算密集型、io密集型、空闲型以及用户定义的应用类型都默认视为其他类型。

另外,如图2示出了典型的web应用服务器,其示出了在不同的时间cpu利用率变化规律,例如,图2示出了一周内周一到周五的cpu利用率,其中,图2的横坐标代表了时间(单位为小时),纵坐标代表cpu利用率,根据图2可以确定,该web应用服务器的cpu利用率在不同时间是不同变化的,例如,该web服务器在2~6点的cpu利用率趋向于0,同时段其他资源的利用率也较低,即在2~6点,该web服务器的应用类型为空闲型,而该web服务器在12~20点的cpu利用率较高,即在12~20点,该web服务器的应用类型为计算密集型。

因此,每一种应用类型的集群都有其特有的变化趋势,我们可以根据实际情况去分析应用类型,预定义一些常用的应用类型的数据,根据预定义的应用类型数据能够判断集群的应用类型,例如,表1-3分别示出了三种应用类型数据,当然可以理解,预定义的应用类型的数据可根据实际需求进行设置。

表1

上述表1示出了预定义的计算密集型数据,根据表1可以确定,该计算密集型的集群对cpu资源的需求较高,同时,本领域人员能够理解,由于cpu和内存是相关联的,在集群对cpu的需求较大时,其内存的利用率也是较高的,即计算密集型的数据在用作计算时,仅参考cpu利用率的数据,而无需参考其他数据。

表2

上述表2示出了预定义的密集型数据,根据表2可以确定,该密集型的集群对磁盘的i/o资源的需求较高,同时,本领域人员能够理解,由于磁盘和内存是相关联的,在集群对磁盘的i/o资源的需求较大时,其内存利用率也是较高的,即密集型的数据在用作计算时,仅参考io利用率的数据,而无需参考其他数据。此外,应当理解,表1-3中的io利用率为磁盘的i/o的利用率。

表3

上述表2示出了预定义的空闲型数据,根据表3可以确定,该空闲型的集群对所有资源的需求均较低,因此,空闲型的数据在用作计算时,需参表3中的四项数据。

此外,在客户实际环境中,首先获取集群的cpu利用率、内存利用率、磁盘i/o利用率及网络i/o利用率等负载利用率的相关数据,随后对获取的负载利用率的相关数据进行切分,根据周期特性对负载的相关数据进行切片,以获取多个单片(或切分片段),其中,周期的具体数值可根据实际需求进行选择,例如,根据本发明的一个实施例,该切片周期为24小时,从而切分后的单片为每个小时的负载利用率,随后对切片后的每个单片进行位移计算以便进行全面的相关线计算,该位移计算可根据实际需求进行位移计算公式的选择,把位移后的数据与预定义的应用类型数据(如表1和表2所示的数据)进行第一皮尔逊相关系数计算。把预定义的应用类型数据作为变量x,把用户时间环境下负载情况作为变量y,两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:

其中,rxy为第一皮尔逊相关系数,n为周期,x为应用类型数据,y为位移数据,i为时间点,xi、yi分别是指对应于每个时间点的负载利用率。此外,第一皮尔逊相关系数rxy的取值范围是:-1≤r≤+1,正的表示正相关,负的表示负相关。

利用第一皮尔逊相关系数判断相关关系的密切程度,通常认为:

表4

上述表4表示了第一皮尔逊相关系数的绝对值和直线相关程度的关系,同时表4中的从上往下的相关程度依次增强。

此外,为了方便说明第一皮尔逊相关系数和直线相关程度的关系下面以一个具体的例子进行说明,例如,根据上述第一皮尔逊相关系数的计算公式,求得关于集群的负载利用率和预定义的计算密集型数据的皮尔逊相关系数为r1,以及关于集群的负载利用率和预定义的密集型数据的皮尔逊相关系数为r2,其中,r1=0.3,r2=1,根据表4可以确定,该集群的负载利用率和预定义的密集型数据完全相关,因此,能够确定该集群为密集型。此外,可根据表4中的直线相关程度,确定集群的应用类型或该集群与何种应用类型的集群最为接近,从而将对应于该集群的应用类型的节能策略选为最佳的节能策略。

此外,该集群的节能策略如下:

表5

上述表5示出了集群的应用类型和节能策略的对应关系,例如,空闲型对应最小功耗节能策略,密集型对应自动调整节能策略,计算密集型对应着最大性能节能策略,而剩余的节能策略,可根据实际需求进行选择。

另外,在集群采用完确定的节能策略后,还可对该确认的节能策略进行测试。具体地:

当用户采用节能测试时,以集群的负载利用率数据(如cpu利用率、cpu频率等)的历史数据为x变量数据,以集群实际功耗的历史数据为y变量数据,计算第二皮尔逊积差相关系数:

其中,r为第二皮尔逊相关系数,n为周期,x为负载利用率数据的历史数据,为负载利用率数据的的历史数据的平均值,y为集群实际功耗的历史数据,为集群实际功耗的历史数据的平均值,i为时间点。

此外,如果第二皮尔逊积差相关系数0.5<|r|≤1,说明当前集群的节能模式和功率相关,当前集群的的系统运行正常,当前集群的节能模式能够起到节能作用;而如果第二皮尔逊积差相关系数0<|r|≤0.5,说明当前集群的节能模式和功率不相关,当前集群的节能模式能够不能起到节能作用,系统会报异常。

综上所述,借助于本发明的上述技术方案,通过获取集群的负载利用率,随后根据预先设定的周期,将负载利用率切分为若干个切分片段,并将每个切分片段进行位移计算,以获得若干个位移数据,最后计算位移数据和预定义的应用类型数据的第一皮尔逊相关系数,并根据第一皮尔逊相关系数,确定集群的最佳节能策略,从而能够对集群以及服务器根据负载数据与预定义的应用类型数据进行相关度分析,进而提出建议的最佳节能策略。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1