基于树回归的虚拟化云平台能耗测量方法及系统的制作方法

文档序号:6632107阅读:556来源:国知局
基于树回归的虚拟化云平台能耗测量方法及系统的制作方法
【专利摘要】本发明提供了一种基于树回归的虚拟化云平台能耗测量方法及系统,该方法包括如下步骤:信息采集步骤,物理机周期性地将采集到的信息发送给指定的控制节点,采集的信息包括物理机和虚拟机的资源信息、以及从测量计得到的能耗信息;参数训练步骤,由控制节点负责使用树回归算法将数据集分段进行线性拟合,得到每个子集合中资源能耗模型参数α、γ;能耗计算步骤,控制节点根据拟合的参数和虚拟机信息进行计算,得到虚拟机的能耗。本发明的有益效果是:本发明采用基于回归树的方法对不同资源的使用率分段建立线性模型,改进了传统单一线性模型的准确度不够高的缺点;回归树模型计算简单、高效,对实时性的能耗模型参数更新体现为效率更高。
【专利说明】基于树回归的虚拟化云平台能耗测量方法及系统

【技术领域】
[0001] 本发明涉及数据处理领域,尤其涉及基于树回归的虚拟化云平台能耗测量方法及 系统。

【背景技术】
[0002] 当前云计算迅速发展,各企业纷纷投入大量资金建起自己的数据中心。因此,能耗 的细粒度监控和管理是当前急需解决的主要技术问题。传统的数据中心采用电表方式对 各种设备的能耗进行监控,但仍然有诸多的数据中心调度策略依赖于实时获取服务器的能 耗、其上运行的应用、以及虚拟机的能耗信息。尤其是对于虚拟化云平台的服务器能耗、其 上运行的软件能耗、以及其上运行的虚拟机能耗,以软件方式实时获取对于构建未来数据 中心的调度、节能、计费具有重要意义。已有技术如下:
[0003] (1)物理机的能耗采用了电表或者服务器内置电表来测量物理机能耗。
[0004] (2)对运行不同虚拟机的系统内部分别采集虚拟机内部的资源信息,利用各个虚 拟机的几种资源总和与服务器电表值进行建模,特点是虚拟机内部安插一定的代理程序。 获取相关数据进行建模,对于复杂多机情况没有考虑。
[0005] Eg:北京邮电大学提出了一种基于虚拟机内部资源监控的虚拟机能耗测量方法, 不足之处是虚拟机内部显示的资源信息并不准确反映了虚拟机的真实物理资源使用情况, 对于异构的虚拟机运行不同的程序来说就相对不实用,而且准确度也不够高。
[0006] (3)结合虚拟化底层的hypervisor,监控物理资源,包括CPU,内存,Disk,网络1/ 〇情况,以及每个虚拟机在使用物理资源时候的一些特征信息的采集,结合能耗信息进行建 模。首先建模,物理机资源和能耗的关系,然后通过获取各个虚拟机使用的各种物理资源情 况来进行能效计算转换,难点在于提取物理硬件上的各个虚拟机分别执行的特征信息。
[0007] Eg :微软,中国电信,IBM等公司发表的专利采取了基于事件和基于资源对虚拟机 划分的方式进行能耗分配计算模型评估虚拟机能耗,但仍然存在针对不同的场景下的模型 效果误差大的情况,因此需要一种优化技术来对目前的单一模型采取自适应的方法以及对 结果进行优化的解决方案从而提高虚拟机能耗评估的准确度。
[0008] (4)国外发表的相关论文在关于能耗测量技术方面采用了诸多的模型,其中典型 的有线性模型、多项式模型、支持向量回归的方法。
[0009] 专利列表如下:
[0010]

【权利要求】
1. 一种基于树回归的虚拟化云平台能耗测量方法,其特征在于,包括如下步骤: 信息采集步骤,物理机周期性地将采集到的信息发送给指定的控制节点,采集的信息 包括物理机和虚拟机的资源信息、以及从测量计得到的能耗信息; 参数训练步骤,由控制节点负责使用树回归算法将数据集分段进行线性拟合,得到每 个子集合中资源能耗模型参数a、Y ; 能耗计算步骤,控制节点根据拟合的参数和虚拟机信息进行计算,得到虚拟机的能耗, 并评估物理机能耗准确率。
2. 根据权利要求1所述的虚拟化云平台能耗测量方法,其特征在于,该虚拟化云平台 能耗测量方法还包括: 测量系统的基础功率步骤,当物理机处于空闲状态时,周期性地采集测量计的功率值, 求得一段时间内的平均值作为基础功率。
3. 根据权利要求2所述的虚拟化云平台能耗测量方法,其特征在于,在所述信息采集 步骤中,通过在物理机内部署采集程序的黑盒方法,采集物理机和虚拟机的资源信息以及 功率值。
4. 根据权利要求3所述的虚拟化云平台能耗测量方法,其特征在于,在所述参数 训练步骤中,将采集到的功率值和物理机的资源特征信息组成训练数据集D,集合D = {dl, d2,. . .,dn},某个记录di为m元组(f 1,f2, f3, Psys),其中前f 1?fn-1代表资源事件 相关信息,Psys是m元组最后一个元素。
5. 根据权利要求4所述的虚拟化云平台能耗测量方法,其特征在于,在所述参数训 练步骤中,在集合中选择最优分割点,以此将数据集分割为两个子集,并在子集上递归完 成树的构建;函数SplitData根据最优分割点切分数据集,如将集合中对应feature部件 的资源特征信息值小于分割点中value的划分为子集leftdata,大于等于的记录划分为 rightdata〇
6. 根据权利要求5所述的虚拟化云平台能耗测量方法,其特征在于,在函数 SelectFeat中引入阀值s,当子集分割到样本数目小于阈值s时,则停止划分,作为叶节点 处理;SelectFeat计算最优分割点的方法是遍历集合中所有属性的取值,寻找能带来最小 的错误率的点。
7. 根据权利要求6所述的虚拟化云平台能耗测量方法,其特征在于,在数据集合可逆 的情况下进行线性拟合,从而得到该集合下的资源能耗模型参数;若是数据结合不可逆,则 采用模型树的方法,用集合内功率的平均值作为预测值。
8. 根据权利要求7所述的虚拟化云平台能耗测量方法,其特征在于,树模型将数据集 合D根据分割点集合B,划分为子集合;在叶节点的子集合中,通过模型树或回归树进行预 测,回归树根据线性拟合方法得到模型参数,模型树返回某个预测值。
9. 根据权利要求8所述的虚拟化云平台能耗测量方法,其特征在于,在所述能耗计算 步骤中,虚拟机资源信息集合D,D中每个记录为(fvl, fv2, fv3),分别表示某时刻某虚拟机 的CPU、内存和磁盘的资源信息,遍历树模型找到对应的叶节点,计算出各个部件功率,并得 到虚拟机在该时刻的功率。
10. -种基于树回归的虚拟化云平台能耗测量系统,其特征在于,包括多个物理机、多 个虚拟机、多个能耗测量计、多个控制节点、以及web服务器,在物理机上通过虚拟化层管 理虚拟机,物理机内采用黑盒方法采集资源特征信息,通过能耗测量计周期性测量物理机 的瞬时功率;控制节点负责数据存储和处理,包括资源能耗模型参数训练,物理机能耗测量 准确度和各个虚拟机某段时间的能耗信息;树回归算法在控制节点中运行,用来进行资源 能耗模型参数训练;物理机和虚拟机的能耗结果通过访问Web服务器查看。
【文档编号】G06F1/28GK104407688SQ201410592305
【公开日】2015年3月11日 申请日期:2014年10月29日 优先权日:2014年10月29日
【发明者】黄荷姣, 顾崇林, 史鹏宙, 石帅 申请人:哈尔滨工业大学深圳研究生院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1