一种云计算数据中心能耗优化方法及系统与流程

文档序号:36244583发布日期:2023-12-02 08:33阅读:28来源:国知局
一种云计算数据中心能耗优化方法及系统与流程

本发明涉及电子数字数据处理,具体涉及一种云计算数据中心能耗优化方法及系统。


背景技术:

1、数据中心的能源消耗量较大,其能源成本占据了其运营成本的重要部分,通过优化能耗可以降低能源成本进而提高运营效率。有效的管理和规划数据中心的能源需求,可以满足不断增长的计算需求,推动数据中心的可扩展性和业务发展。而对于数据中心的诸多服务器,不同服务器的功耗有所差异,为了避免部分服务器过载而导致的能耗较高的问题,需要将负载较高的服务器进行负载均衡化处理,以节约资源消耗。

2、对于数据中心的诸多服务器,采用孤立森林算法,对于负载较高或较低的服务器进行检测。而在传统的孤立森林算法中,将每个非叶子节点分割成两个子节点的过程中,采用的是随机超平面的方式进行划分的,但这样的划分方式会由于各点对应的特征取值范围的不同、不同特征的重要性或权重的差异,而导致选取的特征不能很好地划分出异常样本,进而造成算法检测效果较差的问题。


技术实现思路

1、本发明提供一种云计算数据中心能耗优化方法及系统,以解决现有的问题。

2、本发明的一种云计算数据中心能耗优化方法及系统采用如下技术方案:

3、本发明一个实施例提供了一种云计算数据中心能耗优化方法,该方法包括以下步骤:

4、获取数据中心中各服务器的多种运行数据所形成的多维数据集,一个服务器对应一个多维数据集;

5、对任意多维数据集进行降维获得若干个主成分数据,将若干个相同层的主成分数据所形成的集合记为对应层下的一个样本簇类;将任意主成分数据的一阶差分结果记为主成分数据对应的差分数据;根据样本簇类中所有差分数据和主成分数据中数据点的平均值获得样本簇类的离散程度;对样本簇类进行随机划分获得子簇类,根据子簇类之间的差异获得划分优度,根据划分优度的大小获得新子簇类;

6、利用样本簇类的划分方法对其他层的样本簇类进行划分,获取不同层的新子簇类之间的差异获得余-主成分数据,将余-主成分数据重新划分获得最终的孤立森林;

7、利用孤立森林对所有服务器进行能耗优化。

8、进一步的,所述对任意多维数据集进行降维获得若干个主成分数据,包括的具体方法为:

9、利用主成分分析算法将所有服务器对应的多维数据集进行降维,获得若干个主成分数据,一个服务器对应若干层的主成分数据;

10、获取各主成分数据的方差贡献率,选取服务器对应若干层的主成分数据中方差贡献率大于预设超参数的前个主成分数据。

11、进一步的,所述根据样本簇类中所有差分数据和主成分数据中数据点的平均值获得样本簇类的离散程度,包括的具体方法为:

12、首先,将任意主成分数据中所有数据点的平均值记为主成分数据的均值参数;获取任意主成分数据的一阶差分结果记为主成分数据对应的差分数据;

13、然后,任意样本簇类的离散程度的具体计算方法为:

14、

15、其中,表示样本簇类的离散程度;表示样本簇类中主成分数据的数量;表示主成分数据中数据点的数量;表示样本簇类中第个主成分数据对应差分数据的第个数据点的数值;表示获取绝对值;表示以自然常数为底数的指数函数;表示样本簇类中第个主成分数据的均值参数;表示样本簇类中所有主成分数据的均值参数的平均值。

16、进一步的,所述对样本簇类进行随机划分获得子簇类,根据子簇类之间的差异获得划分优度,根据划分优度的大小获得新子簇类,包括的具体方法为:

17、首先,构建随机树,将一个样本簇类作为随机树中的一个节点,将样本簇类中的主成分数据随机划分为两个含有若干主成分数据的集合,记为样本簇类的子簇类;将子簇类在随机树中对应的节点作为样本簇类对应节点的子节点;

18、然后,根据子簇类中所有主成分数据的所有数据点的平均值以及差分数据中数据点的数值,获得子簇类的差异因子,将两个子簇类的差异因子的差值记为两个子簇类之间的差异性;

19、最后,将子类簇包含的主成分数据的数量与子类簇的离散程度的乘积记为子簇类的第一数值,将两个子簇类的第一数值的和值记为两个子簇类的第二数值,将两个子簇类的差异性与第二数值的比值记为两个子簇类时对应的划分优度,划分优度最大时,将样本簇类划分的两个子簇类记为样本簇类的新子簇类。

20、进一步的,所述差异因子的具体获取方法为:

21、

22、其中,表示第个子簇类的差异因子;表示第个子簇类中所有主成分数据的所有数据点的平均值;表示第个子类簇包含的主成分数据的数量;表示主成分数据中数据点的数量;表示预设的主成分数据对应差分数据中第个数据点的权重系数;表示第个主成分数据对应差分数据的第个数据点的数值。

23、进一步的,所述获取不同层的新子簇类之间的差异获得余-主成分数据,包括的具体方法为:

24、获取第层和第层样本簇类的新子簇类,当第层样本簇类的任意新子簇类与第层样本簇类的任意新子簇类对应交集中,元素数量最大时,将两个新子簇类记为匹配簇类,将两个匹配簇类中所有元素作为全集,并获取第层样本簇类的匹配簇类的补集中各元素对应的主成分数据,记为余-主成分数据。

25、进一步的,所述将余-主成分数据重新划分获得最终的孤立森林,包括的具体方法为:

26、首先,判断第层的余-主成分数据所对应的服务器,与第层样本簇类的第一个新子簇类中主成分数据对应服务器之间的异同,设置调整参数;根据余-主成分数据的余-主成分数据与主成分数据之间的皮尔逊相关系数、方差贡献率以及调整参数获得余-主成分数据的划分系数;

27、然后,当余-主成分数据的划分系数大于等于0时,将余-主成分数据划分至第一个新子簇类中,当余-主成分数据的划分系数小于0时,将余-主成分数据划分至第二个新子簇类中;通过孤立森林算法,并结合划分优度和划分系数将所有服务器的所有主成分数据进行划分,获得若干个随机树形成的孤立森林,所述最终的孤立森林中每一个叶节点对应一个服务器。

28、进一步的,所述判断第层的余-主成分数据所对应的服务器,与第层样本簇类的第一个新子簇类中主成分数据对应服务器之间的异同,设置调整参数;根据余-主成分数据的余-主成分数据与主成分数据之间的皮尔逊相关系数、方差贡献率以及调整参数获得余-主成分数据的划分系数,包括的具体方法为:

29、首先,当第层的余-主成分数据所对应的服务器与第层样本簇类的第一个新子簇类中主成分数据对应服务器相同,设置调整参数为1,当第层的余-主成分数据所对应的服务器与第层样本簇类的第二个新子簇类中主成分数据对应服务器相同,设置调整参数为-1;

30、然后,对于第层和第层样本簇类的新子簇类,将任意余-主成分数据所在的匹配簇类记为余簇类,获取任意余-主成分数据的划分系数,具体计算方法为:

31、

32、其中,表示余-主成分数据的划分系数;表示线性归一化函数;表示余-主成分数据的方差贡献率;表示余-主成分数据的相关因子;表示调整参数;表示余簇类中主成分数据的数量;表示余簇类的所有主成分数据中,除余-主成分数据以外的第个主成分数据与余-主成分数据之间的皮尔逊相关系数。

33、进一步的,所述利用孤立森林对所有服务器进行能耗优化,包括的具体方法为:

34、利用孤立森林算法对孤立森林进行异常检测,获取各个节点的异常评分,当节点的异常评分大于预设的评分标准时,将节点对应的服务器标记为负载异常的服务器,通过数据中心降低负载异常的服务器的任务量,降低负载异常的服务器的能耗。

35、进一步的,一种云计算数据中心能耗优化系统包括以下模块:

36、数据采集模块:用于获取数据中心中各服务器的多种运行数据所形成的多维数据集,一个服务器对应一个多维数据集;

37、划分优度模块:用于对任意多维数据集进行降维获得若干个主成分数据,将若干个相同层的主成分数据所形成的集合记为对应层下的一个样本簇类;将任意主成分数据的一阶差分结果记为主成分数据对应的差分数据;根据样本簇类中所有差分数据和主成分数据中数据点的平均值获得样本簇类的离散程度;对样本簇类进行随机划分获得子簇类,根据子簇类之间的差异获得划分优度,根据划分优度的大小获得新子簇类;

38、孤立森林模块:用于利用样本簇类的划分方法对其他层的样本簇类进行划分,获取不同层的新子簇类之间的差异获得余-主成分数据,将余-主成分数据重新划分获得最终的孤立森林;

39、能耗优化模块:用于利用孤立森林对所有服务器进行能耗优化。

40、本发明的技术方案的有益效果是:通过将多维数据集降维获取若干个主成分数据在一定程度上降低了数据量,将样本簇类进行划分获得子簇类后,根据子簇类之间的差异获得随机树中各节点对应的子节点,使多个随机树形成的孤立森林中样本簇类对应节点的两个子节点差异最大,提高异常检测的准确性,进一步提高了对服务器的能耗优化效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1