管理层次存储系统中的数据的方法和系统的制作方法

文档序号:6554116阅读:112来源:国知局
专利名称:管理层次存储系统中的数据的方法和系统的制作方法
技术领域
本发明涉及在层次存储子系统中的存储等级之间高效的数据迁移。
背景技术
数据处理设施(facility)通常包括一个或多个主机设备,存储设备或直接地或通过网络附接在所述主机设备上。随着用户的业务增长,对增加的存储设备的需要也增长了。然而,安装附加的高速存储设备例如DASD(直接存取存储设备)可能是昂贵的。此外,并非用户的所有存储设备会都需要是昂贵、高速类型的。而是可将这样的存储设备分配给经常被访问的数据,而可将较不经常访问的数据存储在较慢和较低廉的存储设备例如磁带盒中。称具有多个等级的存储设备被配置为层次存储设备。
主机的操作系统可包括一层次存储管理器。在IBMS/390服务器上运行的OS/390或z/OS操作系统可包括一数据设施存储管理子系统(DFSMSTM),该子系统自动化了存储管理策略和过程以将数据在存储层次结构中上下移动。应理解其他厂商可提供也管理层次存储空间的其他产品。而且,尽管将在来自IBM的DFSMS的情境中描述本发明,本发明并不限于被并入该特定产品中。
DFSMS的一个组件是层次存储管理器(DFSMShsmTM,在这里也被称为“HSM”),该管理器监督备份、恢复、迁移和空间管理操作。由DFSMShsm的空间管理功能提供的一种功能是“间隔迁移”,该功能指导将数据集定期迁移到其存储较为低廉或其存储形式节省空间的位置。HSM间隔迁移基于用户指定的结构(construct)自动地管理DASD存储空间(也被称为等级0)中的卷。可将存储有具有共同的由用户定义的存储要求的数据集的各卷组合为“存储组”。用户可为一卷选择的参数之一是“高阈值”。以预定的间隔,HSM按字母顺序检查各DASD卷,并确定由存储到一卷中的数据集所使用的空间是否超过该高阈值。如果是这样,则该卷中的数据集就适合于从等级0迁移到等级1(例如DASD/磁带介质)。然后在所有这样的卷上执行迁移,这种迁移是从每个卷中最大的数据集开始,并以越来越小的数据集继续进行,直到达到另一个用户定义参数,即该卷的“低阈值”。
DFSMS的另一个功能是为新数据集分配空间。通常,用于新数据集的空间将被分配给具有最大自由空间量的卷。然而,经常地,空间被分配到的卷是数据集正在从其迁移的同一个卷。这种冲突造成对共同资源包括卷目录表(VTOC)、目录(catalog)条目等的争用,从而导致数据迁移和/或用户工作负荷的速度减慢。
因此,存在着减少数据迁移和空间分配之间的争用以及增加迁移速度的需要。

发明内容
本发明提供了用于管理层次存储子系统中的数据的方法和装置。该方法包括将多个卷指定为用于等级0存储设备的存储组,为该存储组建立高阈值,将用于一数据集的空间分配给该存储组的一卷,该将数据集存储在该卷中,比较该高阈值与由存储在该存储组中的各卷中的所有数据集所消耗的空间的总量,以及如果该高阈值小于或等于由存储在该存储组中的各卷的所有数据集所使用的空间的总量,则将数据集从该存储组迁移到等级1存储设备。
在一个实施例中,向每个存储组分配高阈值,并且当由一存储组使用的空间达到或超过该高阈值时,将开始从该存储组中的卷的数据迁移,并且是从具有最小自由空间的卷开始。这样,就减少了迁移和空间分配之间的争用。
在另一个实施例中,当选择一卷以进行迁移时,设置一标志,该标志防止该卷中的空间被分配给新的数据集。在完成了该迁移之后,清除该标志,从而允许分配。这样,就避免了迁移和空间分配之间的争用。


图1是其中可包含本发明的层次存储系统的框图;图2是本发明的方法的流程图;图3是本发明的一实施例的流程图;图4是本发明的另一实施例的流程图;以及图5是本发明的又一实施例的流程图。
具体实施例方式
图1是其中可包含本发明的层次存储系统100的框图。系统100包括主机设备110,多个等级的数据存储设备120和一管理接口130附接在该主机设备上。主机110包括处理器112、存储器114和操作系统116。操作系统116包括层次存储管理功能118。为了本说明的目的,该层次存储管理器118被示为操作地连接到存储设备120。然而,操作系统116和/或主机110中的其他过程也可访问存储设备120。因此,如这里所使用的术语“连接”可指两个组件、设备或子系统之间的间接关系,以及两者之间的直接电连接。
存储设备120包括高速(和昂贵)的等级0存储设备122、以及较慢(和较低廉)的等级1存储设备124。在图1中被表示为更慢(和更低廉)的等级2存储设备126的其他等级的存储设备也可连接到层次存储管理器118。如将在以下描述的,各卷132被组合为存储组130以便存储数据集134。
作为示例而非限制,所述主机110可以是IBM S/390,操作系统116可以是z/OS,并且层次存储管理功能可由DFSMShsm提供。等级0存储设备可以是DASD设备,例如IBM TotalStorageTMModel 2107。等级1存储设备可以是DASD/磁带介质,例如IBM TotalStorage Model 2105企业存储服务器或IBM TotalStorage 3592企业磁带系统。
图2是本发明的方法的流程图。通过使用DFSMShsm或其等价物,设施管理员将一个或多个卷指定为等级0存储组(步骤200);也可类似地指定其他的存储组。对于每个存储组,由设施管理员建立一高阈值,并将其存储在存储器114中(步骤202),该存储器可包括数据库、表或类似物。然后可将用于新数据集的空间分配给该存储组的卷(步骤204),并且将数据集存储在该卷中(步骤206)。在由管理员规定的时间,DFSMShsm比较任何存储组的空间与高阈值(步骤208)。如果已满足该阈值(步骤210),就是说,该高阈值小于或等于该存储组中的已使用空间量,则将数据集从该卷迁移到等级1存储设备(步骤212)。
参照图3的流程图,在一个实施例中,检查该存储组的各卷(步骤300),并且识别具有最小自由空间的卷(步骤302)。然后从存储在该识别出的卷中的数据集开始数据集从该存储组的迁移(步骤304)。
除了为每个存储组建立的高阈值外,可为每个存储组中的每个卷建立一低阈值(步骤306)。当建立了卷低阈值时,数据集从一卷的迁移将继续下去,直到达到该低阈值(步骤308)。
也可指导DFSMS将用于新数据集的空间分配给存储组的所有卷中具有最大自由空间的卷(步骤310)。相反地,具有最小自由空间的卷更可能是迁移的对象。因此,降低了空间将被分配到的卷是数据集正在从其被迁移的同一卷的风险。
在另一个实施例(图4)中,为每个存储组建立一低阈值(步骤400),以指示可允许的自由空间量(或最小的使用空间量)。当迁移开始时,识别存储组的所有卷中具有最小自由空间量的卷(步骤402),并且迁移从来自所识别的卷的数据集开始(步骤404)。接着以随后识别的具有下一个最小自由空间量的卷的数据集进行迁移(步骤406)。该过程继续进行,直到已满足所述低阈值(步骤408),或直到已在该存储组中的所有卷上执行了迁移(步骤410),以两者中先发生者为准。
在又一个实施例中(图5),当一卷的数据集的迁移开始时,设置一标志(步骤500),该标志防止用于新数据集的空间被分配给该卷(步骤502),这样就防止了迁移和分配功能之间的争用。当从该卷的迁移完成(步骤504)时,清除该标志(步骤506),从而允许分配(步骤508)。
重要的是注意到,尽管已在全功能的数据处理系统的情境中描述了本发明,本领域的技术人员将认识到本发明的过程能够以包含指令的计算机可读介质的形式和多种形式分发,并且不管实际用来进行该分发的信号承载介质的特定类型本发明都适用。计算机可读介质的示例包括可记录类型的介质例如软盘、硬盘驱动器、RAM、和CD-ROM,以及传输类型的介质例如数字和模拟通信链路。
对本发明的描述是为了说明和描述的目标呈现的,而非旨在是穷尽性的或限于本发明的所公开的形式。对于本领域的普通技术人员来说,很多修改和改变将是显然的。所选择和描述的实施例是为了最好地解释本发明的原理和实际应用,并使本领域的其他普通技术人员能够理解本发明,以实现具有适合于所考虑的特定应用的各种修改的实施例。此外,尽管以上针对方法和系统进行了描述,本领域中的上述需要也可以包含用于管理层次存储设备的指令的计算机程序产品来满足,或以这样一种用于部署计算基础设施的方法来满足,该方法包括将计算机可读代码集成到计算系统中以便管理层次存储设备。
权利要求
1.一种用于管理层次存储子系统中的数据的方法,包括将多个卷指定为用于等级0存储设备的存储组;为该存储组建立第一阈值;将用于一数据集的空间分配给该存储组的卷;将该数据集存储在该卷中;比较该第一阈值与由存储到该存储组中的各卷中的所有数据集所使用的空间的总量;以及如果已达到该第一阈值,则将数据集从该存储组迁移到等级1存储设备。
2.根据权利要求1的方法,还包括识别所述存储组中的所有卷中具有最小自由空间量的卷;以及从存储在该识别的卷中的数据集开始,将数据集从该存储组迁移。
3.根据权利要求2的方法,还包括为该存储组中的每个卷建立低阈值;以及将数据集从所述识别的卷迁移,直到由存储到该识别的卷中的所有数据集使用的空间的总量小于或等于用于该识别的卷的低阈值。
4.根据权利要求3的方法,还包括将用于新数据集的空间分配给所述存储组的所有卷中具有最大自由空间的卷,借此降低了所述分配将是分配到数据集当前正被从其迁移的卷的空间的风险。
5.根据权利要求1的方法,还包括为所述存储组建立低阈值;识别该存储组中的所有卷中具有最小自由空间量的卷;从存储到该识别的卷中的数据集开始,将数据集从该存储组迁移;以及重复所述识别和迁移步骤,直到由存储在该存储组中的各卷中的所有数据集使用的空间的总量小于或等于用于该存储组的所述低阈值,或直到数据集已从该存储组中的所有卷迁移,以两者中先发生者为准。
6.根据权利要求1的方法,还包括以来自所述存储组的第一卷的数据集开始所述迁移;当数据集从所述第一卷的迁移开始时设置标志;如果设置了标志,则防止用于新数据集的空间被分配给该第一卷;以及当数据集从该第一卷的迁移完成时,清除该标志,借此允许将用于新数据集的空间分配给该第一卷。
7.一种层次存储管理系统,包括主计算机,其附接有至少第一和第二等级的数据存储设备,该第一等级的数据存储设备被配置为至少第一存储组,该第一存储组具有被分配用于存储数据集的多个卷的空间;用于为该第一存储组建立高阈值的装置;用于将用于一数据集的空间分配给该第一存储组的卷的装置;用于将该数据集存储在该卷中的装置;用于比较该高阈值与由存储到该第一存储组中的各卷中的所有数据集消耗的空间的总量的装置;以及用于如果该高阈值小于或等于由存储到该第一存储组中的各卷中的所有数据集所使用的空间的总量,则将数据集从该第一存储组迁移到该第二等级存储设备的装置。
8.根据权利要求7的系统,还包括用于识别所述第一存储组中的所有卷中具有最小自由空间量的卷的装置;以及用于从存储在该识别的卷中的数据集开始将数据集从该第一存储组迁移的装置。
9.根据权利要求8的系统,还包括用于为所述第一存储组中的每个卷建立低阈值的装置;以及用于将数据集从所述识别的卷迁移,直到由存储在该识别的卷中的所有数据集使用的空间的总量小于或等于用于该识别的卷的所述低阈值。
10.根据权利要求9的系统,还包括用于将用于新数据集的空间分配给所述第一存储组的所有卷中具有最大自由空间的卷,借此降低了所述分配将是分配到数据集当前正被从其迁移的卷的空间的风险的装置。
11.根据权利要求7的系统,还包括用于为所述第一存储组建立低阈值的装置;用于识别该第一存储组中的所有卷中具有最小自由空间量的卷的装置;用于从存储到该识别的卷中的数据集开始,将数据集从该第一存储组迁移的装置;以及用于重复所述标识和迁移步骤,直到由存储到该第一存储组中的各卷中的所有数据集所使用的空间的总量小于或等于用于该第一存储组的所述低阈值,或直到数据集已被从该第一存储组中的所有卷迁移,以两者中先发生者为准的装置。
12.根据权利要求7的系统,还包括用于以来自所述第一存储组的第一卷的数据集开始所述迁移的装置;用于当数据集从该第一卷的迁移开始时设置标志的装置;用于如果设置了该标志则防止用于新数据集的空间被分配该第一卷的装置;以及用于当数据集从该第一卷的迁移完成时清除该标志,借此允许将用于新数据集的空间分配给该第一卷的装置。
13.根据权利要求7的系统,其中所述第一等级的存储设备包括DASD存储设备。
14.根据权利要求7的系统,其中所述第二等级的存储设备包括磁带存储设备。
15.一种可与可编程计算机一起使用的计算机可读介质的计算机程序产品,该计算机程序产品具有包含在其中的用于管理层次存储子系统中的数据的计算机可读代码,该计算机可读代码包含用于执行权利要求1到6中的任何一个的方法的指令。
16.一种用于部署计算基础设施的方法,包括将计算机可读代码集成到计算系统中,其中该代码与该计算系统结合能够执行权利要求1到6中的任何一个的方法。
全文摘要
提供了用于管理层次存储子系统中的数据的方法和装置。将多个卷指定为等级0的存储组;为该存储组建立高阈值;将用于一数据集的空间分配给该存储组的一卷,该将数据集存储在该卷中;比较该高阈值与该存储组各卷中的所有数据集消耗的空间总量;且如果该高阈值小于或等于该总量,则将数据集从该存储组迁移到等级1存储设备。可选地,向每个存储组分配高阈值,并且当在一存储组中使用的空间达到或超过该高阈值时,将从该存储组中具有最小自由空间的卷开始数据迁移。又可选地,当选择一卷以进行迁移时,设置标志以防止该卷中的空间被分配给新的数据集。在完成迁移时,清除标志以允许分配。这样,避免了迁移和空间分配之间的争用。
文档编号G06F3/06GK1804777SQ20061000058
公开日2006年7月19日 申请日期2006年1月11日 优先权日2005年1月13日
发明者M·D·史密斯 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1