一种节能的虚拟存储服务器系统及其调度方法

文档序号:8445371阅读:191来源:国知局
一种节能的虚拟存储服务器系统及其调度方法
【技术领域】
[0001] 本发明属于大数据技术领域,更具体地,涉及一种节能的虚拟存储服务器及其调 度方法。
【背景技术】
[0002] 大数据计算需要大量的存储服务器用于处理和保存数据。典型的单个存储服务 器包括一个或者多个服务器级的处理器,数十个GB级内存,高性能主板,这些可以称之为 计算子系统,同时服务器需要配置8-16个磁盘,通过磁盘阵列形式构成存储子系统。这 种配置的核心思想是单个服务器就近处理本地存储中的数据。不幸的是,现实数据中心 负载呈现非常大的波动。现实应用表明,绝大部分时候,存储服务器及其中计算与存储 部件很少处于峰值工作状态,而是面临中低强度负载。但是即使中低负载强度都需要计 算子系统和存储子系统的参与,且当前处理器采用DVFS具有较好的负载能耗正比特性 (power-proportionality),但是就整个计算子系统而言,内存和主板还不能达到较好的负 载能耗正比型,越是高性能计算子系统,其空闲能耗越大。计算子系统一般具有50-200瓦 的功耗范围,其实际功率随着负载的变化而变化。而存储子系统基本不具备负载能耗正比 特性,存储子系统只要工作就处于相对稳定的功耗范围,即使是少量负载也会让存储子系 统消耗接近峰值的能耗。例如典型16个硬盘的能耗基本为100瓦,而存储控制器为50-100 瓦,存储子系统的整体功耗为150-250瓦,几乎不随负载变化为变化。
[0003] 就目前针对计算和存储的能耗调度粒度而言,计算子系统能耗调度对于负载强度 变化的响应速度是微秒级,具有较大的调度范围;而存储子系统能耗调度对于I/O负载强 度的响应速度是分钟级,仅具有较小调度范围。现有的存储服务器系统没能对计算资源和 存储资源进行更合理的分配及使用,这就造成了不必要的能耗浪费。

【发明内容】

[0004] 本发明的目的在于提供一种节能的虚拟存储服务器及其调度方法,其目的在于, 解决现有数据中心存在的高能耗的技术问题,减小电费开销,降低全球碳污染。
[0005] 为了实现上述目的,按照本发明的一个方面,提供了一种虚拟存储服务器系统,所 述系统包括一个计算节点和若干个存储节点,其中:
[0006] 所述计算节点包含CPU、内存、主板以及存储部件,所述存储部件由若干固态盘构 成;所述存储节点包含一个低能耗存储控制器和一组磁盘;所述计算结点和存储结点之间 通过网络互联,计算结点的存储空间和存储结点的存储空间共同构成一个虚拟存储空间;
[0007] 在任何时间点,计算结点和存储结点中存在一个作为主存储控制器,整体管理整 个虚拟存储空间,对外提供一个存取本虚拟存储空间数据的入口;
[0008] 计算型任务运行在计算结点上,如果一段时间没有计算型任务,则关闭计算结点, 把数据存取型任务放到存储结点上执行;一旦有计算任务到达本虚拟存储服务器,则启动 计算结点。
[0009] 在本发明的一个实施例中,所述低能耗存储控制器为ARM或ATOM处理器。
[0010] 在本发明的一个实施例中,连接所述计算结点和存储结点的网络为千兆或者万兆 以太网、Inifiniband网络、光纤通道,或者PCIe网络。
[0011] 按照本发明的另一方面,还提供了一种基于上述虚拟存储服务器系统的主存储管 理器,所述主存储管理器由若干个控制器和核心全局数据结构构成,其中:
[0012] 所述控制器包括I/O选择器、域文件分配器、负载监控和能耗调度器、数据预取 器和一致性控制器,其中所述I/O选择器用于根据请求文件名通过域文件分配表(Domain FileAllocationTable,DFAT)查询该文件相应的物理位置;所述域文件分配器用于在写 过程中根据文件大小和存储结点上的负载选择分配的存储结点;所述负载监控和能耗调度 器用于监测每次文件操作,维护热文件表(HotFilesTable,HFT);所述数据预取器用于负 责对SSD中数据的预取;所述一致性控制器用于保证计算结点和存储结点数据上的一致;
[0013] 所述核心全局数据结构包括域文件分配表、热文件表、缓存文件表,其中DFAT表 以条目的方式记录全局文件GFileID和物理子文件SCID之间的映射关系,SCID包含存储结 点和内部文件ID两个部分;其中DFAT表中至少包括L字段、S字段、S#字段、Ver字段、B 字段;其中L表示该文件是否在计算结点上;S表示是否是分条文件;S#表示分配编号,Ver 表示版本域,B表示文件最新版本是否已经同步;所述热文件表,用于记录每个文件的最后 存取时间、创建时间、上一个统计段存取次数以及记录数据处理程序处理的文件集合,以方 便文件预取到计算结点中;所述缓存文件表(BufferedFilesTable,BFT),用于记录缓存 在SSD中的文件。
[0014] 按照本发明的另一方面,还提供了一种基于上述主存储管理器的节能调度方法, 所述方法包括:
[0015] (1)当计算结点为活动状态的时候,处理流程如下:
[0016] (I. 1)主实例运行在计算结点上,判断在处理任务完成之后的一个阀值T。时间内 是否有数据处理任务,如果有则进入步骤(1.2),如果没有,进入步骤(1.3);
[0017] (1. 2)完成对数据任务的处理,返回步骤(I. 1);
[0018] (1. 3)主实例把计算结点上的最新元数据和数据更新到存储结点,选择一个热点 文件最多的存储结点作为下一个主实例,然后关闭计算结点,结束。
[0019] (2)当存储结点为活动状态的时候,处理流程如下:
[0020] (2. 1)判断主实例是否在存储结点上,若不在则进入步骤(2. 2),若在则进入步骤 (2. 5);
[0021] (2. 2)判断在预设阈值时间Ts之内是否有I/O访问,若没有则进入步骤(2. 3),若 有则进入步骤(2. 4);
[0022] (2. 3)关闭该节点或将该节点置为休眠状态,结束;
[0023] (2. 4)对存储结点节点进行数据操作,返回步骤(2. 2);
[0024] (2. 5)判断预设时间Tsd之内存储结点每个磁盘是否有数据存取访问,若有则进入 步骤(2. 6),若没有则进入步骤(2. 7);
[0025] (2. 6)对存储结点节点进行数据存取操作,返回步骤(2. 5);
[0026](2. 7)将该磁盘关闭,或者根据处理器的节能策略把处理器处于低能耗状态,结 束。
[0027] 在本发明的一个实施例中,所述方法还包括:
[0028] 读操作:对于读文件的情况,I/O选择器根据请求文件名通过DFAT查询该文件相 应的物理位置,如果计算结点处于活动状态,并且文件在计算结点上,则从计算结点上读 取;否则,I/O选择器通过查询DFAT表找到相应文件所处的存储结点,并读出相应文件;
[0029] 写操作:针对写过程,域文件分配器根据文件大小和存储结点上的负载选择分配 存储结点,如果文件大小大于阈值,则分条到多个存储结点上;如果文件大小小于阈值,则 无需分条并保存到一个存储结点上;
[0030] 更新操作:在更新文件情况下,保留文件名,更新文件内容;为了减少对于DFAT的 操作次数,采用创建新文件,然后修改DFAT表形式,按照写操作先进行更新文件的分配写, 然后删除旧的文件分配项,增加新的文件分配项;
[0031] 数据处理操作:计算结点上能够安装多个数据处理应用的运行环境,当数据处理 请求到达时,提取该请求中的运行参数和处理文件列表,如果相应的文件不在计算结点的 SSD中,则查询DFAT表从存储结点中读取相应文件,之后按照要求启动相应的应用程序,对 这些数据集进行处理;之后如果仅需要结果数据,则返还给外部调用程序;如果需要创建 新文件则在本地计算结点中存放,并尽快更新到存储结点,同时同步DFAT。
[0032] 总体而言,通过本发明所构思的基本方案,能够取得如下收益效果:
[0033] (1)虚拟存储服务器结点分离的设计,能够明显减少计算和存储弱相关依赖所产 生的能耗浪费。
[0034] (2)虚拟存储服务器在计算结点端安装SSD硬盘,仅仅从IOPS(Input/Output OperationsPerSecond,每秒进行读写I/O操作的次数)角度来看,如果工作数据集在SSD 中,SSD比硬盘的IOPS有数量级上的提升。
[0035] (3)对性能影响主要体现在能够尽早精确的获取工作数据集。获取工作数据集的 方法有很多种,对于大型任务,可以在分配任务时把工作数据集迀移到计算结点中的SSD 上。对于工作数据集缺失的情况,由于多个存储结点通过并行的方法把工作数据集快速迀 移到SSD上。对于少量数据缺失,存储结点会增加一点响应时间。对于仅需要传输数据的 任务,存储控制器能够自行完成,无需计算结点参与。
[0036] (4)本方法带来的额外好处是,多个存储结点可以协同完成并行数据传输任务,提 供数据存取的带宽。另一个方面,但一个计算结点关闭时,存储结点依然可以提供数据服 务。
【附图说明】
[0037] 图1是本发明中虚拟存储服务器物理结构示意图;
[0038] 图2是本发明中虚拟存储服务管理器结构示意图;
[0039] 图3是本发明中计算结点为活动状态时调度策略流程图;
[0040] 图4是本发明中存储结点为活动状态时调度策略流程图。
【具体实施方式】
[0041] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要 彼此之间未构成冲突就可以相互组合。
[0042] 本发明的整体设计思路如
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1