使用大规模非活动磁盘阵列和自适应数据布局的电源和性能管理的制作方法

文档序号:6479959阅读:238来源:国知局
专利名称:使用大规模非活动磁盘阵列和自适应数据布局的电源和性能管理的制作方法
技术领域
本发明涉及用于计算机系统中的数据存储设备。
背景技术
随着对电子方式数据通信的信赖提高,有效和经济地存储大量数据的不同模型已 被提出。一种数据存储机制不仅需要足够数量的物理磁盘空间以存储数据,而且需要在一 个或多个磁盘故障事件中用来保持数据完整性的不同等级的容错和冗余(基于所述数据 有多关键)。一组用于容错数据存储的方案包括公知的RAID(独立磁盘冗余阵列)等级或配 置。多个RAID等级(例如,RAID-0, RAID-1, RAID-3, RAID-4, RAID-5等)被设计用来为不 同数据存储应用提供容错和冗余。在RAID环境中的数据文件可被存储在所述RAID配置中 的任意一个中,基于所述数据文件的内容有多关键,与为在磁盘故障事件中提供冗余或备 份可买得起多大的物理磁盘空间相比较。当通过选择所述RAID配置能够获得容错或冗余 的等级时,操作的经济性是难于控制的。用于存储大量数据的可替代方法是使用MAID系统。MAID系统是大规模非活动磁 盘阵列。MAID系统采用上百至上千硬盘驱动器用于近线数据存储。MAID被设计用于一次 写入/随机可读(WORO)应用中。在MAID系统中,每一个驱动器仅仅根据访问被存储在所 述驱动器上的数据所需来起旋。MAID系统受益于存储密度、和降低的成本、电力以及冷却要 求。但是,这种期望的经济效益以延迟、吞吐量以及冗余为代价。因此,存在一种平衡操作的经济性与数据访问及可靠性要求的需求。

发明内容
相应地,本公开的一个实施例涉及一种存储数据的方法,包括将数据划分成多个 相同大小的段;将所述相同大小的段存储在多个存储机制中;监视对被存储在所述多个存 储机制上的相同大小的段的访问以确定访问模式;监视在多个磁盘之间的访问模式;监视 所述多个存储机制的性能特性以确定所述多个存储机制的性能需求;以及响应至少一个访 问模式或性能需求,从所述多个存储机制的第一存储机制将所述多个相同大小的段的至少 一个段迁移到所述多个存储机制的第二存储机制。本发明的又一个实施例涉及一种大容量存储系统,包括处理器,所述处理器被配 置用以执行指令;多个存储装置,所述多个存储装置连接到处理器并被配置用以存储横跨 所述多个存储装置连续分块的第一数据集,以及在所述多个存储装置中的至少一个内连续 地存储第二数据集;和控制器,所述控制器可操作地连接到多个存储装置,所述控制器被配 置用以控制所述多个存储装置的操作;其中所述多个存储装置不在同一时间全被启用。本发明的另一个实施例涉及一种存储数据的方法,包括将数据划分成多个相同大 小的段;将所述相同大小的段存储在多个存储机制中;监视对被存储在所述多个存储机制上的相同大小的段的访问以确定访问模式;监视在多个磁盘之间的访问模式;监视所述多 个存储机制的性能特性以确定所述多个存储机制的性能需求;响应至少一个访问模式或性 能需求,从所述多个存储机制的第一存储机制将所述多个相同大小的段的至少一个段迁移 到所述多个存储机制的第二存储机制;识别所述多个存储机制中的至少一个上的备用容 量;在被识别为具有备用容量的所述多个存储机制中的至少一个上实施所述相同大小的段 的至少一个的工作备份;在所述多个存储机制的至少一个上存储所述相同大小的段的至少 一个的工作备份,其中所述多个存储机制的至少一个是可访问的;以及在所述多个存储机 制的至少一个被启用并且被一当前相同大小的段更新时,丢弃所述多个存储机制的至少一 个上的所述相同大小的段的至少一个的所述工作备份。应当理解,所述一般描述和下列具体描述都仅仅是示范性和说明性,并不是对所 请求发明的必要限制。被结合进来并组成了本说明书一部分的附图,描述了本发明的实施 例,并与所述一般描述一起用来解释本发明的原理。


通过参考附图,本发明的众多优点可以被本领域的技术人员更好地理解,其中图1是说明在大规模非活动磁盘阵列中存储数据的方法的流程图;图2是说明在大规模非活动磁盘阵列中存储数据的方法的流程图;和图3是说明在大规模非活动磁盘阵列中存储数据的系统的方框图。
具体实施例方式现在针对本发明先前优选实施例进行介绍,在附图中举例进行说明。下面参照方法的流程图说明对本公开进行描述。应当理解,所述流程图说明的每 一块和/或所述流程图说明中的块组合,能够通过计算机程序指令来实现。这些计算机程 序指令可被提供给通用计算机、专用计算机或其他可编程数据处理设备的处理器以生成一 种机器,使得通过所述计算机或其他可编程数据处理设备的处理器来实施的指令,创建用 来实现所述流程图中所述功能/动作的手段。这些计算机程序指令也可被存储在能够引导 计算机或其他可编程数据处理设备以特定方式来操作的计算机可读有形介质(因而包括 计算机程序产品)上,使得被存储在所述计算机可读有形介质产品中的指令产生包括实施 所述流程图中所述功能/动作的教学手段的产品。总体参照图1-3,示出了管理大容量数据存储的电源和性能的方法和系统。图1是描述了根据本发明示范性实施例的数据存储方法的流程图。所述方法100 可包括将数据划分成多个相同大小的段的步骤102。例如,当接收到数据量时可将其划分 成1MB的数据块,所述数据块的每一个可被分布在多个存储机制中。当1MB的相同大小数 据块如此处上所述时,其他尺寸可实现保持相同。这种相同允许根据相关需求和电源管理 来移动和替换数据块。方法100可包括步骤104,连续地跨越磁盘存储所述相同大小的数据块的每一个。 例如,主机发送要被写进并分散在存储机制中的数据。所述数据块的主副本可跨越所有驱 动器连续地存储在MAID系统中。所述数据块的次副本可连续地安置和存储在磁盘内。而 且,所述多个存储机制可包括一具有始终在线特性的第一组存储机制和一具有被访问以外其它时候不运转特性的第二组存储机制。方法100可包括步骤106,监视对所述相同大小数据段的访问。例如,设置一访问 协议用以在所述多个存储机制的至少一个上访问所述相同大小的段以及根据所述访问协 议确定对所述相同大小的段的访问拓扑。方法100可包括步骤108,监视多个磁盘之间的访问模式。例如,当访问所述数据 段时,监视步骤识别出任意当前访问模式。方法100可包括步骤110,监视存储系统的性能特性。例如,为所述多个存储机制 设置性能说明,以及确定性能拓扑以获取为所述多个存储机制所设置的性能说明。方法100可包括步骤112,迁移相同大小的段。例如,通过所述监视过程,在确保数 据冗余和减少延迟时,可将数据从一个磁盘位置移到另一个磁盘位置以减少电耗。而且,迁 移所述数据以将所述正被访问的数据置于符合冗余和性能需求的最少的存储机制中。进一 步地,所述第一存储机制和所述第二存储机制可根据一存储拓扑分配给所述第一和第二组 存储机制。方法100可包括镜像所述多个相同大小的段的步骤202,当将所述多个相同大小 的段标作所述多个相同大小的段的镜像段204,以及在多个存储机制上存储所述相同大小 的段的镜像段的步骤206。例如,在每一个磁盘内,当所述数据被划分成1MB的相同大小的 段时每一个段连续地被镜像和存储在所述多个磁盘上。方法100可进一步包括识别在所述多个存储机制的至少一个上的备用容量的步 骤208。进一步地,在被识别为具有备用容量的所述多个存储机制的至少一个上实施所述相 同大小的段的至少一个的工作备份的步骤210。方法100可进一步包括在所述多个存储机制的至少一个上存储所述相同大小的 段的工作备份的步骤212,其中所述多个存储机制的至少一个是可访问的。进一步地,方法 100可包括在所述多个存储机制的至少一个被启用并被一当前相同大小的段更新时丢弃所 述多个存储机制的至少一个上的所述相同大小的段的至少一个的工作备份的步骤214。在本公开的又一个实施例中,示出了根据本公开示范性实施例的存储数据的系统 300。所述系统300可包括处理器302。所述处理器302可被配置用以执行指令。例如,所 述处理器可被配置用以将所述数据单元预处理/划分成1MB的块。系统300可包括多个存储机制304。存储装置304可被连接到所述处理器并被配 置用来跨越多个存储装置连续地存储分块形式的第一数据集以及在所述多个存储装置304 的至少一个内连续地存储第二数据集。在本系统300中,多个存储装置304可在同一时间 不全被启用和旋转,但是,当接收到对存储数据的访问请求时,多个存储装置304的至少一 个将响应于所述请求时间如果该装置空闲其将被起旋。系统300可包括控制器306。所述控制器306可操作地连接到多个存储装置,控制 器306被配置用以控制所述多个存储装置的操作。例如,所述控制器306可被配置用来监 视对存储在所述多个存储装置304上的数据的访问模式。进一步地,所述控制器306可被 配置用来监视所述多个存储装置的性能特性。以及更进一步地,所述控制器306可被配置 用来通过响应于访问模式和性能需求通过迁移来移动数据。系统300可包括数据存储布局308。所述数据存储布局308可被配置用来在所述 多个存储装置304的至少一个上的预留空间内存储至少一个数据集的工作备份,并在对应于所述工作备份的至少一个数据集被更新处丢弃所述工作备份。应当理解,所述公开方法中的步骤的指定顺序或层次是示例方法的例子。应当理 解,基于设计偏好,所述方法中的步骤的指定顺序或层次可以重新排列,而仍在本公开的主 题精神内。所附方法权利要求以样本顺序呈现了不同步骤的要素,并不必意味着被限于所 呈现的指定次序或层次。应当相信,通过前述将理解本公开和许多其伴随的优点。同样应当相信,其组成的 形式、结构和布置很明显可以进行不同的变化,而不脱离本公开的范围和精神或不牺牲所 有其物质优点。这里以前所述的形式只是示例说明,下列权利要求的目的是包含和包括此
类变化。
权利要求
1.一种存储数据的方法,包括 将数据划分成多个相同大小的段;将所述的相同大小的段存储在多个存储机制中,所述多个存储机制包括一具有始 终在线特性的第一组存储机制和一具有被访问以外其它时候不运转特性的第二组存储机 制;监视对被存储在所述多个存储机制上的所述相同大小的段的访问以确定一访问模式;监视所述多个磁盘之间的访问模式;监视所述多个存储机制的性能特性以确定所述多个存储机制的一性能需求;和 响应所述访问模式或所述性能需求中的至少一个,将所述多个相同大小的段的至少一 个段从所述第一组存储机制的一第一存储机制迁移到所述第二组存储机制的一第二存储 机制,所述第一存储机制和所述第二存储机制根据一存储拓扑分配给所述第一组和第二组 存储机制。
2.如权利要求1所述的方法,进一步包括 镜像所述多个相同大小的段;将所述多个相同大小的段标作所述多个相同大小的段的镜像段;和 在多个存储机制上存储所述相同大小的段的所述镜像段。
3.如权利要求1所述的方法,进一步包括识别在所述多个存储机制的至少一个上的一备用容量;在被识别为具有一备用容量的所述多个存储机制的至少一个上实施所述相同大小的 段的至少一个的一工作备份;在所述多个存储机制的至少一个上存储所述相同大小的段的至少一个的所述工作备 份,其中所述多个存储机制的至少一个是可访问的;在所述多个存储机制的至少一个被启用并被一当前的相同大小的段更新时,丢弃所述 多个存储机制的至少一个上的所述相同大小的段的至少一个的所述工作备份。
4.如权利要求1所述的方法,其中将数据划分成多个相同大小的段包括 将每一卷分割成1MB的数据块。
5.如权利要求1所述的方法,其中将所述相同大小的段存储在多个存储机制中包括 在大规模非活动磁盘阵列上存储所述相同大小的段。
6.如权利要求1所述的方法,其中将所述相同大小的段存储在多个存储机制中包括 在廉价磁盘冗余阵列上存储所述相同大小的段。
7.如权利要求1所述的方法,其中监视对被存储在所述多个存储机制上的所述相同大 小的段的访问以确定一访问模式包括设置一访问协议用以访问所述多个存储机制的所述至少一个上的所述相同大小的段 以及根据所述访问协议确定用于所述相同大小的段的一访问拓扑。
8.如权利要求1所述的方法,其中监视所述多个存储机制的性能特性以确定所述多个 存储机制的一性能需求包括为所述多个存储机制设置一性能说明,和确定一性能拓扑以获取所述多个存储机制的 性能说明设置。
9.如权利要求1所述的方法,其中响应所述访问模式或所述性能需求中的至少一个将 所述多个相同大小的段的至少一个段从所述多个存储机制的一第一存储机制迁移包括迁移数据以将正被访问的数据置于符合冗余和性能需求的最少的存储机制中。
10.一种大容量存储系统,包括一处理器,所述处理器被配置用以执行指令;多个存储装置,所述多个存储装置连接到所述处理器并被配置用以跨越所述多个存储 装置连续地存储分块的一第一数据集以及在所述多个存储装置的至少一个内连续地存储一第二数据集;和一控制器,所述控制器可操作地连接到多个存储装置,所述控制器被配置用以控制所 述多个存储装置的操作;其中所述多个存储装置包括一具有始终在线特性的第一组存储机制和一具有被访问 以外其它时候不运转特性的第二组存储机制。
11.如权利要求10所述的大容量存储系统,进一步包括一数据存储布局,其被配置用以在所述多个存储装置的至少一个上的预留空间内存储 至少一个数据集的一工作备份并在对应于所述工作备份的所述至少一个数据集被更新处 丢弃所述工作备份。
12.如权利要求10所述的大容量存储系统,其中所述处理器预处理1MB块的数据单元。
13.如权利要求10所述的大容量存储系统,其中所述控制器监视对存储在所述多个存 储装置上的数据的访问模式。
14.如权利要求10所述的大容量存储系统,其中所述控制器监视所述多个存储装置的 性能特性。
15.如权利要求10所述的大容量存储系统,其中所述控制器响应于访问模式和性能需 求通过迁移来移动数据。
16.如权利要求10所述的大容量存储系统,其中所述多个存储装置的至少一个将在接 收到访问请求处被起旋。
17.一种存储数据的方法,包括将数据划分成多个相同大小的段;将所述相同大小的段存储在多个存储机制中;监视对被存储在所述多个存储机制上的相同大小的段的访问以确定一访问模式;监视多个磁盘之间的访问模式;监视所述多个存储机制的性能特性以确定所述多个存储机制的一性能需求;响应所述访问模式或所述性能需求中的至少一个,将所述多个相同大小的段的至少 一个段从所述多个存储机制的一第一存储机制迁移到所述多个存储机制的一第二存储机 制;识别在所述多个存储机制的至少一个中的一备用容量;在被识别为具有一备用容量的所述多个存储机制中的至少一个上实施所述相同大小 的段的至少一个的一工作备份;在所述多个存储机制的至少一个上存储所述相同大小的段的至少一个的所述工作备 份,其中所述多个存储机制的至少一个是可访问的;和在所述多个存储机制的至少一个被启用并被一当前的相同大小的段更新时,丢弃所述 多个存储机制的至少一个上的所述相同大小的段的至少一个的所述工作备份。
全文摘要
本发明是一种存储数据的方法。所述方法包括将数据划分成多个相同大小的段的步骤。所述方法进一步包括将所述相同大小的段存储在多个存储机制中。所述方法包括步骤监视对被存储在所述多个存储机制上的相同大小的段的访问以确定访问模式;监视多个磁盘之间的访问模式和监视所述多个存储机制的性能特性以确定多个存储机制的性能需求。最后,所述方法包括响应所述访问模式或所述性能需求中的至少一个,将所述多个相同大小的段的至少一个段从所述多个存储机制的第一存储机制迁移到所述多个存储机制的第二存储机制的步骤。
文档编号G06F17/30GK102150157SQ200880131133
公开日2011年8月10日 申请日期2008年11月20日 优先权日2008年10月16日
发明者布赖恩·麦肯, 罗斯·泽伟斯勒 申请人:Lsi公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1