一种服务器集群管理方法、装置、电子设备及存储介质与流程

文档序号:29308986发布日期:2022-03-19 19:30阅读:107来源:国知局
一种服务器集群管理方法、装置、电子设备及存储介质与流程

1.本技术涉及计算机技术领域,尤其涉及一种服务器集群管理方法、装置、电子设备及存储介质。


背景技术:

2.目前在服务器集群运维场景下,服务器带内系统的变更和升级一直是核心工作,为了避免服务器系统升级影响服务器的正常工作,如何选取服务器系统加固时间窗是不可以避免的问题。
3.在现有技术中,通常按照用户的生活习惯,将服务器系统加固时间窗选择在凌晨。但是,对于高性能计算场景,作业一般都是以无人值守的方式运行的,凌晨可能正是服务器业务繁忙的时间,现有技术选择的服务器系统加固时间窗可靠性较低。


技术实现要素:

4.本技术提供一种服务器集群管理方法、装置、电子设备及存储介质,以解决现有技术选择的服务器系统加固时间窗可靠性较低等缺陷。
5.本技术第一个方面提供一种服务器集群管理方法,包括:获取服务器集群中各服务器的历史功耗数据;根据各所述服务器的历史功耗数据,确定所述服务器集群的功耗周期信息;其中,所述功耗周期信息表征服务器集群在不同时间的业务处理情况;根据所述服务器集群的功耗周期信息,确定所述服务器集群中每个服务器的系统加固时间窗。
6.可选的,所述根据各所述服务器的历史功耗数据,确定所述服务器集群的功耗周期信息,包括:根据各所述服务器的历史功耗数据之间的相似度,对所述服务器进行聚类,以将所述服务器集群划分为若干个服务器组;针对每个所述服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的功耗周期信息;根据每个所述服务器组的功耗周期信息,确定所述服务器集群的功耗周期信息。
7.可选的,所述针对每个所述服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的功耗周期信息,包括:针对每个所述服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的平均历史功耗数据;根据该服务器组的平均历史功耗数据,确定该服务器组的功耗周期信息。
8.可选的,所述根据该服务器组的平均历史功耗数据,确定该服务器组的功耗周期信息,包括:基于预设的自回归滑动平均模型,根据该服务器组的平均历史功耗数据,拟合对
应的历史功耗曲线;根据所述历史功耗曲线,确定该服务器组的功耗周期信息。
9.可选的,各所述服务器的历史功耗数据和服务器组的平均历史功耗数据均为时间序列数据。
10.可选的,所述服务器集群的功耗周期信息包括每个所述服务器组的功耗周期信息。
11.可选的,所述根据所述服务器集群的功耗周期信息,确定所述服务器集群中每个服务器的系统加固时间窗,包括:根据所述服务器集群的功耗周期信息所反映的每个服务器组在不同时间的业务处理情况,确定所述服务器集群中每个服务器组中服务器的系统加固时间窗。
12.本技术第二个方面提供一种服务器集群管理装置,包括:获取模块,用于获取服务器集群中各服务器的历史功耗数据;确定模块,用于根据各所述服务器的历史功耗数据,确定所述服务器集群的功耗周期信息;其中,所述功耗周期信息表征服务器集群在不同时间的业务处理情况;管理模块,用于根据所述服务器集群的功耗周期信息,确定所述服务器集群中每个服务器的系统加固时间窗。
13.可选的,所述确定模块,具体用于:根据各所述服务器的历史功耗数据之间的相似度,对所述服务器进行聚类,以将所述服务器集群划分为若干个服务器组;针对每个所述服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的功耗周期信息;根据每个所述服务器组的功耗周期信息,确定所述服务器集群的功耗周期信息。
14.可选的,所述确定模块,具体用于:针对每个所述服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的平均历史功耗数据;根据该服务器组的平均历史功耗数据,确定该服务器组的功耗周期信息。
15.可选的,所述确定模块,具体用于:基于预设的自回归滑动平均模型,根据该服务器组的平均历史功耗数据,拟合对应的历史功耗曲线;根据所述历史功耗曲线,确定该服务器组的功耗周期信息。
16.可选的,各所述服务器的历史功耗数据和服务器组的平均历史功耗数据均为时间序列数据。
17.可选的,所述服务器集群的功耗周期信息包括每个所述服务器组的功耗周期信息。
18.可选的,所述管理模块,具体用于:根据所述服务器集群的功耗周期信息所反映的每个服务器组在不同时间的业务处理情况,确定所述服务器集群中每个服务器组中服务器的系统加固时间窗。
19.本技术第三个方面提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。
20.本技术第四个方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一个方面以及第一个方面各种可能的设计所述的方法。
21.本技术技术方案,具有如下优点:本技术提供一种服务器集群管理方法、装置、电子设备及存储介质,该方法包括:获取服务器集群中各服务器的历史功耗数据;根据各服务器的历史功耗数据,确定服务器集群的功耗周期信息;其中,功耗周期信息表征服务器集群在不同时间的业务处理情况;根据服务器集群的功耗周期信息,确定服务器集群中每个服务器的系统加固时间窗。上述方案提供的方法,通过根据服务器集群在不同时间的业务处理情况,选择服务器的系统加固时间窗,以确保最终选择的系统加固时间窗在服务器业务较少或空闲的时间,提高了最终选择的系统加固时间窗的可靠性。
附图说明
22.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
23.图1为本技术实施例基于的服务器集群管理系统的结构示意图;图2为本技术实施例提供的服务器集群管理方法的流程示意图;图3为本技术实施例提供的示例性的服务器集群管理方法的流程示意图;图4为本技术实施例提供的服务器集群管理装置的结构示意图;图5为本技术实施例提供的电子设备的结构示意图。
24.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
25.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
26.此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
27.在现有技术中,通常按照用户的生活习惯,将服务器系统加固时间窗选择在凌晨,按照经验此时的系统业务量较少,操作风险较低。但按照经验选取时间窗的方式并非最优。例如,对于高性能计算场景,作业一般都是以无人值守的方式运行,并不能按照人的生活经验来选取最优的时间窗,凌晨可能正是服务器业务繁忙的时间,现有技术选择的服务器系
统加固时间窗存在可靠性较低的缺陷。
28.针对上述问题,本技术实施例提供的服务器集群管理方法、装置、电子设备及存储介质,通过获取服务器集群中各服务器的历史功耗数据;根据各服务器的历史功耗数据,确定服务器集群的功耗周期信息;其中,功耗周期信息表征服务器集群在不同时间的业务处理情况;根据服务器集群的功耗周期信息,确定服务器集群中每个服务器的系统加固时间窗。上述方案提供的方法,通过根据服务器集群在不同时间的业务处理情况,选择服务器的系统加固时间窗,以确保最终选择的系统加固时间窗在服务器业务较少或空闲的时间,提高了最终选择的系统加固时间窗的可靠性。
29.下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明实施例进行描述。
30.首先,对本技术所基于的服务器集群管理系统的结构进行说明:本技术实施例提供的服务器集群管理方法、装置、电子设备及存储介质,适用于为服务器集群选择服务器系统加固时间窗。如图1所示,为本技术实施例基于的服务器集群管理系统的结构示意图,主要包括服务器集群、数据采集装置及用于为服务器集群选择服务器系统加固时间窗的服务器集群管理装置。具体地,可以基于该数据采集装置采集当前服务器集群中各服务器的历史功耗数据,然后再将采集到的数据发送到服务器集群管理装置,该服务器集群管理装置根据得到的数据,确定服务器集群中每个服务器的系统加固时间窗。
31.本技术实施例提供了一种服务器集群管理方法,用于为服务器集群选择服务器系统加固时间窗。本技术实施例的执行主体为电子设备,比如服务器、台式电脑、笔记本电脑、平板电脑及其他可用于为服务器集群选择服务器系统加固时间窗的电子设备。
32.如图2所示,为本技术实施例提供的服务器集群管理方法的流程示意图,该方法包括:步骤201,获取服务器集群中各服务器的历史功耗数据。
33.需要说明的是,服务器功耗的高低可以反映服务器的繁忙程度,一般功耗越低,代表系统业务越不繁忙。历史功耗数据具体可以是服务器在前一天的功耗数据,也可以是过去一周的平均功耗数据,在实际应用中可以根据实际的数据采集能力和需求,获取相应的历史功耗数据。
34.步骤202,根据各服务器的历史功耗数据,确定服务器集群的功耗周期信息。
35.其中,功耗周期信息表征服务器集群在不同时间的业务处理情况。
36.具体地,可以根据服务器集群中各服务器的历史功耗数据,分析该服务器集群在不同时间的业务处理情况,以得到对应的服务器集群的功耗周期信息。
37.步骤203,根据服务器集群的功耗周期信息,确定服务器集群中每个服务器的系统加固时间窗。
38.其中,系统加固时间窗具体指用于对服务器进行系统加固的时间段。
39.具体地,可以根据服务器集群的功耗周期信息,确定服务器集群在哪个时间段的功耗最小,功耗最小也就代表业务处理量最少,在该时间段进行服务器系统加固对服务器的业务处理影响最小,即可以将该时间段确定为服务器集群中每个服务器的系统加固时间窗。
40.在上述实施例的基础上,由于对于大规模服务器场景下,无法保证所有服务器具备相同的最优系统加固时间窗。
41.为了解决上述问题,作为一种可实施的方式,在一实施例中,根据各服务器的历史功耗数据,确定服务器集群的功耗周期信息,包括:步骤2021,根据各服务器的历史功耗数据之间的相似度,对服务器进行聚类,以将服务器集群划分为若干个服务器组;步骤2022,针对每个服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的功耗周期信息;步骤2023,根据每个服务器组的功耗周期信息,确定服务器集群的功耗周期信息。
42.具体地,可以基于每个服务器的历史功耗数据,为每个服务器构建对应的历史功耗向量,根据不同服务器的历史功耗向量之间的距离,如欧式距离,确定各服务器的历史功耗数据之间的相似度。然后再根据各服务器的历史功耗数据之间的相似度,对服务器进行聚类,将相似度较高的服务器划分为一类,经过聚类将服务器集群划分为若干个服务器组。其中,一个服务器组中的多个服务器的历史功耗数据的相似度较高,达到了聚类标准。
43.示例性的,可以根据每个服务器的历史功耗数据,构建服务器集群功耗矩阵:其中,服务器集群功耗矩阵中的每一行向量代表一个服务器的历史功耗向量,表示服务器集群中第个服务器的第个历史功耗元素。
44.进一步地,可以根据如下公式计算各服务器的历史功耗数据之间的相似度:其中,和表示两个不同的服务器,表示服务器的第个历史功耗元素,表示服务器的第个历史功耗元素。
45.具体地,一个服务器组中的多个服务器的历史功耗数据的相似度达到了聚类标准,也就代表一个服务器组中的服务器的业务处理规律相近,为了在确保最终选择的系统加固时间窗的可靠性的同时,提高服务器集群管理效率,可以以服务器组为最小管理单位,进行功耗周期信息的分析。在一实施例中,针对每个服务器组,可以根据该服务器组中各服务器的历史功耗数据,确定该服务器组的平均历史功耗数据;根据该服务器组的平均历史功耗数据,确定该服务器组的功耗周期信息。
46.需要说明的是,每个服务器的历史功耗数据都可以按照同一数据采集周期来采集,如每30分钟作为一个采集点进行一次历史功耗数据的采集。
47.具体地,通过对服务器组中的多个服务器的历史功耗数据进行均值计算,可以将同一组内的数据均值化为一维时间序列的向量(平均历史功耗数据),然后再根据平均历史功耗数据的线性特征,确定该服务器组的功耗周期信息。以此类推,可以得到每个服务器组的功耗周期信息,进而确定服务器集群的功耗周期信息。
48.进一步地,在一实施例中,可以基于预设的自回归滑动平均模型,根据该服务器组的平均历史功耗数据,拟合对应的历史功耗曲线;根据历史功耗曲线,确定该服务器组的功耗周期信息。
49.其中,各服务器的历史功耗数据和服务器组的平均历史功耗数据均为时间序列数据。
50.需要说明的是,自回归滑动平均模型(auto-regressive moving average model,简称arma模型)是一种时间序列数据分析模型。
51.具体地,通过将任一服务器组的平均历史功耗数据输入到arma模型,可以基于该arma模型得到该服务器组的平均历史功耗数据对应的历史功耗曲线,然后根据该历史功耗曲线的线性特征,确定该服务器组的功耗周期信息。
52.具体地,在一实施例中,服务器集群的功耗周期信息包括每个服务器组的功耗周期信息。
53.相应地,在一实施例中,可以根据服务器集群的功耗周期信息所反映的每个服务器组在不同时间的业务处理情况,确定服务器集群中每个服务器组中服务器的系统加固时间窗。
54.具体地,为了进一步提高服务器集群管理效率,可以根据服务器组的功耗周期信息所反映的该服务器组在不同时间的业务处理情况,统一确定该服务器组中每个服务器的系统加固时间窗,具体可以根据服务器组的功耗周期信息,确定该服务器组的功耗最低点的时间段,进而将该时间段确定为该服务器组中每个服务器的系统加固时间窗。以此类推,确定服务器集群中每个服务器的系统加固时间窗。
55.示例性的,如图3所示,为本技术实施例提供的示例性的服务器集群管理方法的流程示意图,图3中将服务器集群中的服务器作为样本,样本数据即为服务器的历史功耗数据,样本组即为服务器组,一维时间序列样本即为服务器组的平均历史功耗数据。其中,如图3所示的方法是如图2所示的方法的一种示例性的实施方式,二者实现原理相同,不再赘述。
56.本技术实施例提供的服务器集群管理方法,通过获取服务器集群中各服务器的历史功耗数据;根据各服务器的历史功耗数据,确定服务器集群的功耗周期信息;其中,功耗周期信息表征服务器集群在不同时间的业务处理情况;根据服务器集群的功耗周期信息,确定服务器集群中每个服务器的系统加固时间窗。上述方案提供的方法,通过根据服务器集群在不同时间的业务处理情况,选择服务器的系统加固时间窗,以确保最终选择的系统加固时间窗在服务器业务较少或空闲的时间,提高了最终选择的系统加固时间窗的可靠性。并且,通过对服务器集群中的服务器的功耗周期信息进行分组分析,提高了数据分析效率,进而提高了服务器集群管理效率。
57.本技术实施例提供了一种服务器集群管理装置,用于执行上述实施例提供的服务器集群管理方法。
58.如图4所示,为本技术实施例提供的服务器集群管理装置的结构示意图。该服务器集群管理装置40包括:获取模块401、确定模块402和管理模块403。
59.其中,获取模块,用于获取服务器集群中各服务器的历史功耗数据;确定模块,用于根据各服务器的历史功耗数据,确定服务器集群的功耗周期信息;其中,功耗周期信息表
征服务器集群在不同时间的业务处理情况;管理模块,用于根据服务器集群的功耗周期信息,确定服务器集群中每个服务器的系统加固时间窗。
60.具体地,在一实施例中,确定模块,具体用于:根据各服务器的历史功耗数据之间的相似度,对服务器进行聚类,以将服务器集群划分为若干个服务器组;针对每个服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的功耗周期信息;根据每个服务器组的功耗周期信息,确定服务器集群的功耗周期信息。
61.具体地,在一实施例中,确定模块,具体用于:针对每个服务器组,根据该服务器组中各服务器的历史功耗数据,确定该服务器组的平均历史功耗数据;根据该服务器组的平均历史功耗数据,确定该服务器组的功耗周期信息。
62.具体地,在一实施例中,确定模块,具体用于:基于预设的自回归滑动平均模型,根据该服务器组的平均历史功耗数据,拟合对应的历史功耗曲线;根据历史功耗曲线,确定该服务器组的功耗周期信息。
63.具体地,在一实施例中,各服务器的历史功耗数据和服务器组的平均历史功耗数据均为时间序列数据。
64.具体地,在一实施例中,服务器集群的功耗周期信息包括每个服务器组的功耗周期信息。
65.具体地,在一实施例中,管理模块,具体用于:根据服务器集群的功耗周期信息所反映的每个服务器组在不同时间的业务处理情况,确定服务器集群中每个服务器组中服务器的系统加固时间窗。
66.关于本实施例中的服务器集群管理装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
67.本技术实施例提供的服务器集群管理装置,用于执行上述实施例提供的服务器集群管理方法,其实现方式与原理相同,不再赘述。
68.本技术实施例提供了一种电子设备,用于执行上述实施例提供的服务器集群管理方法。
69.如图5所示,为本技术实施例提供的电子设备的结构示意图。该电子设备50包括:至少一个处理器51和存储器52。
70.存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如上实施例提供的服务器集群管理方法。
71.本技术实施例提供的一种电子设备,用于执行上述实施例提供的服务器集群管理方法,其实现方式与原理相同,不再赘述。
72.本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上任一实施例提供的服务器集群管理方法。
73.本技术实施例的包含计算机可执行指令的存储介质,可用于存储前述实施例中提
供的服务器集群管理方法的计算机执行指令,其实现方式与原理相同,不再赘述。
74.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
75.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
76.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
77.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
78.本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
79.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1