存储系统以及存储系统的消耗电力降低方法

文档序号:6461379阅读:180来源:国知局
专利名称:存储系统以及存储系统的消耗电力降低方法
技术领域
本发明涉及一种存储系统以及存储系统的消耗电力降低方法,特别适合用 于使用》兹盘的存储系统以及存储系统的消耗电力降低方法。
背景技术
已经公开了一种技术,该技术是关于在业务数据等的备份、存档中,为了 抑制在磁盘阵列中存储的数据量的增大提高数据容量效率,不在磁盘中存储重 复的数据的重复数据消除的技术(以下将该技术称为重复数据消除)。重复数 据消除技术是在新写入磁盘中的数据,即所谓的写数据与已经存储在磁盘中的 数据为相同的内容时,最终不在磁盘中写入重复的数据的技术。在写数据和已 经存储在磁盘中的数据是否为相同内容的验证中, 一般采用使用了散列值
(hash)的高速检索(例如参照专利文献l)。
另一方面,磁盘阵列是具备多个磁盘的装置。当同时使磁盘阵列具备的多 个磁盘运转时,磁盘阵列的消耗电力变大。作为该问题的解决对策,公开了以 下技术在磁盘阵列中限制可以同时运转的磁盘的数量,由此来削减整个磁盘 阵列的消耗电力,提高省电效果(例如参照专利文献2)。专利文献1美国专利第6928526号公报专利文献2美国专利第5423046号公报

发明内容
目前,在使用磁盘的存储系统中,在进行磁盘中存储的重复数据的消除时, 没有考虑同时执行抑制消耗电力的控制。因此,在执行重复数据消除的磁盘阵 列中,同时通过限制可运转的磁盘的数量来削减消耗电力时,因为没有考虑到 由于重复数据消除而产生的向磁盘的访问,所以无法进行高效的磁盘运转控 制。结果,需要无效的磁盘的运转,产生无法发挥最佳的省电效果的问题。
本发明是考虑了以上的问题而发明的,提出了 一种存储系统以及存储系统 的消耗电力降低方法,该存储系统以及存储系统的消耗电力降低方法,在同时 执行重复数据消除和》兹盘运转控制时,可以最大限度地发挥基于重复数据消除 的容量高效化、以及基于磁盘运转控制的省电效果。
本发明是一种存储系统,该存储系统,包含计算机以及具有对从该计算机 接收到的数据进行存储的多个磁盘装置以及由该多个磁盘装置构成的多个逻
辑单元的存储装置,该存储系统具备组管理表,其存储组信息,该组信息至 少包含使用所述多个逻辑单元构成的组以及该组是否是启动中;电力控制部, 其接通/切断与所述组中包含的逻辑单元对应的磁盘装置的电源;数据管理表, 其存储管理信息,该管理信息包含与所述多个》兹盘装置中存储的数据的存储位 置对应的逻辑单元的逻辑单元号码、代表所述数据的位串的值以及与所述逻辑 单元对应的所述计算机指定的号码;计算部,其当从所述计算机接收到数据时, 计算代表该数据的位串的值;判断部,其判断与该计算部计算出的值相同的值 是否已存储在所述数据管理表中;第一存储部,其在该判断部判断为没有存储 相同的值时,将所述4妄收到的数据存储在所述数据管理表中,并且根据所述组
的磁盘装置中;以及第二存储部,其在所述判断部判断为存储了相同的值时, 根据所述组管理表管理的组信息以及所述凄t据管理表管理的管理信息,将所述 接收到的数据存储在所述磁盘装置中。
根据本发明,在同时进行重复数据消除以及通过抑制可以启动的省电组来 抑制消耗电力的情况下,可以最大限度地发挥基于重复数据消除的数据容量的 高效化、以及基于磁盘运转控制的省电效果。


图l表示本发明第一实施方式的存储系统的结构。 图2表示本实施方式的省电管理表。 图3表示本实施方式的重复数据管理表。 图4表示本实施方式的数据池管理表。
图5表示本实施方式的重复未比较数据(duplication un-compared data)管 理表。
图6是表示本实施方式的写处理的流程图。
图7是表示本实施方式的重复消除的判断处理的流扭图。
图8是表示本实施方式的重复消除的执行处理的流程图。
图9是表示本实施方式的数据最佳化处理的一例的流程图。
图IO表示本实施方式的存储系统的结构的变形例。
图11表示本发明第二实施方式的启动候补省电组管理表。
图12表示本发明第三实施方式的重复数据管理表。
图13表示本实施方式的重复未比较数据管理表。
图14是表示本实施方式的数据最佳化处理的一例的流程图。

1、 2存储系统;100主机;200磁盘阵列;300管理服务器;210 CPU; 220存储器;221省电组控制程序;222省电组管理表;223重复数据消除程序; 224、 228重复数据管理表;225、 229重复未比较数据管理表;226数据池管 理表;227启动候补省电组管理表;240磁盘阵列控制器;271 RAID组;281-283 逻辑单元;291~298磁盘;401电力控制服务器
具体实施例方式
以下,参照附图对本发明的实施方式进行说明。
(第一实施方式)
(1-1)结构的i兌明
图1表示存储系统1的结构的一例。在图1中,主机100以及对从主机 IOO发送的数据进行存储的磁盘阵列200,经由SAN (Storage Area Network) 进行了连接,主机100是运行业务用途等用途的应用程序的计算机。此外,在 图1中作为计算机仅记载了主机100,但实际上可以具有多台计算机。
磁盘阵列200,具有与SAN连接的光线通道接口 (以下记为FC/IF) 250 和管理用接口 (以下记为管理I/F) 260。此外,管理I/F260是用于与管理服务 器300等其他的装置收发数据的接口 。 FC/IF250是用于与主机100等交换从 f兹盘阵列200读出的数据或者在;兹盘阵列200中写入的数据的接口。
此外,磁盘阵列200具有控制磁盘阵列200的CPU210;存储各种管理 表、各种程序等的存储器220;以及存储用户数据的高速緩冲存储器230。而 且,磁盘阵列200还具有控制多个磁盘291 298的磁盘控制器240。
在磁盘控制器240上连接有上述的磁盘291~298。在这些磁盘组(磁盘
291 298)中设定了各自具有被称为RAID (Redundant Arrays of independent (inexpensive) Disc)的冗余结构的RAID组27卜272。此外,磁盘291~298 内的存储区域作为SCSI的逻辑单元(LU: 1ogicaUnit) 281 283,由主机100 进行访问。在图1中,LU281-283被表示为跨越上述磁盘组中的多个磁盘而 存在的存储区域,但还可以是由一个磁盘内的存储区域构成的LU。此外,还 可以跨越RAID组来设定LU。
在存储器220中存储有省电组控制程序221;省电组管理表222;重复 数据消除程序223;重复数据管理表224;重复未比较数据管理表225;数据 池管理表226;以及启动候补省电组管理表227。将在后面对它们进行详细地 说明。
(1-2)》兹盘阵列的消耗电力的抑制
在第一实施方式中,省电组控制程序221使用省电组管理表222,对磁盘 阵列220中包含的》兹盘291~298的启动以及停止进行控制,由此来实现消耗电 力的削减。
在省电组控制程序221中,根据,兹盘阵列200的规格,或者由网络管理者 等预先设定了以RAID组为单位、LU为单位,或者以磁盘为单位形成的省电 组。此外,还预先设定了作为可以同时运转的省电组的上限数的上限值。
图2中表示的省电组管理表222是用于管理省电组的表。省电组管理表 222具有省电识别号码栏2221、状态栏2222、 RAID组号码栏2223、 LU号 码栏2224以及巻利用率栏2225。
在省电识别号码栏2221中存储每个省电组的识别符。在状态栏2222中对 于每个省电识别号码存储省电组的运转状态。在RAID组号码栏2223中存储 包含在省电组中的RAID组号码。在LU号码栏2224中存储LU的识别符。在 巻利用率栏2225中存储每个省电组的巻的利用率。
例如图2所示,在省电管理表222中,与在省电识别号码栏2221中存储 的省电识别号码"P-01"相对应,在状态栏2222中作为状态存储"运转中", 在RAID组号码栏2223中作为RAID组号码存储"RG01",在LU号码栏2224 中作为LU号码存储"LUOl、 LU02",以及在巻利用率栏2225中作为巻利用 率存储"50%"。
省电组控制程序221 ,在省电组管理表222中,#4居在省电识别号码栏2221 中存储的省电识别号码以及在状态栏2222中存储的状态,掌握当前正在运转 的省电组的数量,进行控制始终使磁盘阵列200中包含的正在运转的省电组的 数量不超过所述上限值。
具体地说,在该第一实施方式中,省电组控制程序221的省电组以RAID 组为单位。在产生对于特定的LU的访问时,参照在省电组管理表222的RAID 组号码栏2223中存储的RAID组号码、在状态栏2222中存储的状态、以及在 RAID组中包含的LU号码栏2224中存储的LU号码。省电组控制程序221根 据包含该特定的LU的特定的RAID组的状态栏2222中存储的状态判断是否 需要启动。在需要启动时,省电组控制程序221进一步判断是否受到上限值的 限制。然后,在特定的RAID组没有受到使用限制时,省电组控制程序221允 许执行向该特定的LU的数据访问处理,实现启动包含该特定的LU的特定的 RAID组,可以对磁盘上的数据进行访问。另一方面,在特定的RAID组受到 使用限制时,省电组控制程序221使数据访问处理进行待机。以上是已公开的 技术,除了与本实施例有关的内容以外,省略详细的说明。
此外,在该第一实施方式中,作为一例以RAID组为单位说明了省电组。 但是,省电组还可以LU为单位,以磁盘为单位,以从同一电源供电的机壳或 框架为单位,或者以1台以上的磁盘阵列为单位。
当单位如此变化时,图2中所示的省电组中包含的要素增加或减少。作为 例子,图IO表示了在将省电组的单位设为磁盘阵列单位,跨越多个磁盘阵列 执行省电控制时的存储系统2的结构。磁盘阵列201-203与图1的磁盘阵列 200的结构相同。因此,省略有关磁盘阵列201-203的结构的说明。
在图IO的例子中,省电组控制程序221在电力控制服务器401上运行, 该电力控制服务器401是与作为省电控制对象的各个磁盘阵列200 203相连接 的计算机。此外,电力控制服务器401将省电组控制程序221使用的省电组管 理表222存储在存储器中。
此外,电力控制服务器401表示为独立的专用的服务器,但也可以内置于 存储器虚拟化装置或FC (Fiber Channel)开关等其他装置内。电力控制服务 器401上的省电组控制程序221收集各^f兹盘阵列201~203的运转/停止等的、
与状态栏2222中存储的"状态"有关的信息,然后根据该信息控制各磁盘阵 列201-203的运转/停止。即,省电组控制程序221监视主机100向各磁盘阵 列201~203的访问,在具有向停止中的/P兹盘的访问时,判定可以同时运转的磁 盘阵列的数量是否超过了预定的上限值,根据该结果控制磁盘阵列的运转/停 止。
此外,在进行该控制的同时,各个i兹盘阵列201 203本身可以单独地具有 省电组控制程序221,通过各磁盘阵列内部的机壳或框架的单位、RAID组单 位、LU单位或者磁盘单位等来设定省电组,控制该省电组的运转状态。当然, 也可以将这些控制集中到电力控制服务器401来进行控制。
此外,还可以与图10所示的存储系统2不同,不具备电力控制服务器401, 各个^f兹盘阵列201-203具有省电组控制程序221,其中一台/F兹盘阵列的省电组 控制程序221具有与电力控制服务器401相同的功能,执行剩余的磁盘阵列的 运转/停止的控制。此时,省电组控制程序221在正在运转的^兹盘阵列停止时, 使其他正在运转的磁盘阵列接管省电控制和表示运转状态的信息。
此外,通过各个磁盘阵列201 203始终与其他^t盘阵列保存的省电组的信 息取得同步,可以在各个磁盘阵列201~203中可以单独地执行省电控制。
此外,在第一实施方式中,省电控制的内容为以RAID组为单位的磁盘的 停止和启动,但是还可以为按照每个省电组单位以各自具有的省电状态向睡眠 模式的迁移,例如可以为以磁盘单位的向睡眠模式的迁移等。 (1-2)重复数据消除
在第一实施方式中,重复数据消除程序223通过使用重复数据管理表224, 在写入磁盘的数据中,限制数据内容相同的数据的写入,实现削减在磁盘 291~298中存储的数据容量的效果。
图3表示重复数据管理表224。重复数据管理表224是用于管理在磁盘 291 298中存储的重复数据的表。重复数据管理表224具有散列值栏2241、实 数据存储地址栏2242、以及主机侧指定地址栏2243。
在散列值栏2241中存储数据的散列值。在实数据存储地址栏2242中存储 LU号码LBA。在主机侧指定地址栏2243中存储LU号码LBA。
在重复数据管理表224中,例如图3所示,与散列值栏2241中存储的散
列值"a"对应,在实数据存储地址栏2242中存储"LU01: 100000",在主机 侧指定地址栏2243中存Y渚"001: 101000"。
然后,对使用重复数据管理表224的重复数据处理程序223的处理进行说 明。在磁盘阵列200接收到来自主机100的写数据和指定了该写数据的写入目 的地的逻辑地址(以下称为主机侧指定地址)时,重复数据处理程序223计算 写数据的散列值,该散列值是代表数据的数值,并且与重复数据管理表224 的散列值栏2241中存储的散列值进行比较,由此来判断已经写入磁盘291-298 的数据与写数据是否有可能为相同的内容。
当在重复数据管理表224中不存在与该写数据的散列值相同的数值时,重 复数据处理程序223将该写数据作为新的数据写入;兹盘中,并且在重复数据管 理表224中追加新的行,将该写数据的散列值和磁盘中写入目的地的逻辑地址 存储在散列值栏2241中以及实数据存储地址栏2242中,并且将主机侧指定地 址存储在主机侧指定地址栏2243中。
另一方面,在重复数据管理表224中存在与该写数据的散列值相同的值 时,重复数据处理程序223判断为有可能已经写入了相同的数据。此时,重复 数据处理程序223参照重复数据管理表224,读出在与该写数据的散列值为相 同散列值的实数据存储地址栏2242中存储的逻辑地址所表示的磁盘上的数 据,将数据内容与该写数据进行比较。
在比较结果为数据内容一致时,重复数据处理程序223不在磁盘中写入该 写数据,而是在重复数据管理表224的该写数据的散列值一行中的主机侧指定 地址栏2243中追加主才几侧指定地址。
另一方面,在比较结果为数据内容不一致时,产生了散列值相同、但本来 的数据不同的同义名(synonym)。此时,重复数据处理程序223在磁盘中写 入该写数据,在重复数据管理表224的与该写数据的散列值为相同散列值的一 行中的实数据存储地址栏2242中追加该写数据的写入目的地的逻辑地址,并 且在主机侧指定地址栏2243中追加主机侧指定地址。
即,产生同义名的散列值虽然为相同的散列值,但在磁盘上具有不同的数 据。即,重复数据管理表224对于一个散列值具有多个实数据存储地址和主机 侧指定地址的组合。
此外,在从主机100进行读取时,重复数据消除程序223参照重复数据管 理表224的主^/L侧指定地址栏2243,从对应的实数据存储地址栏2242中存储 的逻辑地址表示的磁盘中读出数据,然后将其发送给主机100。此外,以上为 已公开的技术,除了与本实施方式相关的内容之外,省略详细的说明。
磁盘阵列200具有使用数据池管理表226使主机IOO将"实巻(real volume) LU号码"表示的多个LU识别为"主机侧巻号码"表示的虚拟的一个以上的 LU的存储巻虚拟化机制。其为一般公开的存储器的虚拟化技术,在本实施方 式中虛拟化^L制本身并不是重点,所以省略说明。
此外,如图4所示,数据池管理表226具有主机栏2261、主机侧巻号码 栏2262以及实巻LU号码栏2263。在主机栏2261中存储表示主机的信息。在 主机侧巻号码栏2262中存储主机侧的巻号码。在实巻LU号码栏2263中存储 与主机侧的巻号码对应的实巻LU号码。在数据池管理表226中,与主机栏2261 中存储的主机"A"对应,在主机侧巻号码栏2262中作为主机侧巻号码存储 "001",在实巻LU号码栏2263中作为实巻LU号码存储"LUO 1 、 LU02、 LU03 、 LU04、 LU05、 LU06"。
在该第一实施方式中,将适用上述重复数据消除的范围设为在数据池管理 表226的实巻LU号码栏2263中表示的与主机识别的虚拟LU对应的多个LU 单位。当然,也可以不将适用重复数据消除的范围限定为进行了虚拟化的巻单 位。例如可以为对主机分配的一个以上的LU单位、由重复数据消除程序223 预先设定的与主机没有关联的一个以上的LU单位、RAID单位、或者磁盘阵 列单位等。
以上为存储系统1、 2的结构。但是,该第一实施方式的存储系统1、 2 的结构为应用本发明的存储系统的一个例子。即,在该第一实施方式中,与重 复数据消除有关的重复数据消除程序223.以及重复数据管理表224所具有的功 能,被存储在磁盘阵列200的存储器220中,但并不限于此。例如,实现重复 数据消除的这些功能可以位于磁盘阵列200外部,作为重复数据消除装置存在 于经由SAN对主机100和磁盘阵列200之间的数据进行中继的独立的计算机 中。此外,也可以将上述功能安装在不是重复数据消除装置而是其他的装置中, 例如安装在虚拟化装置等中。
在上述的情况下,^兹盘阵列200、存在于外部的重复数据消除程序223以 及重复数据管理表224,经由磁盘阵列200的管理I/F260或FCI/F250连接, 因此,可以交换和后面所述的考虑了重复数据消除的省电控制中所需要的上述 省电组管理表222、重复数据管理表224以及数据池管理表226、重复未比较 数据管理表225间的信息。
重复未比较数据管理表225为由于限制可同时启动的RAID组的数量的上 限值,无法从磁盘中读取具有相同散列值的数据,结果存储没有进行数据内容 的比较便写入i兹盘中的写数据(以下还称为未比较数据)的表。
如图5所示,重复未比较数据管理表225具有数据临时存储地址栏2251、 主机侧指定地址栏2252以及散列值栏2253。在^:据虛拟存储地址栏2251中 存储在重复数据消除处理中临时存储数据的地址。在主机侧指定地址栏2252 中存储主机侧指定地址。在散列值栏2253中存储在数据临时存储地址中存储 的数据的散列值。例如图5所示,在重复未比较数据管理表225中,与数据临 时存储地址栏2251中存储的数据"LU03: 100000"相对应,在主机侧指定地 址栏2252中作为主机侧指定地址存储"001: 109000",在散列值栏2253中存 储散列值"a"。
(1-3 )考虑了重复数据消除的省电控制
在重复数据消除中,在磁盘阵列200接收到来自主机100的写数据时,如 上所述,重复数据消除程序223为了判断该写入数据是否为已经在磁盘 291-298中写入的数据,执行利用散列值等的高速的检索。
但是,考虑出现同义名的情况在存在与写入数据相同的散列值时,在从主 机100接收到写数据的磁盘阵列200中,有可能访问全部的在数据池管理表 226所示的重复数据消除范围内的LU中,存储有具有相同散列值的数据的磁 盘。
另一方面,在磁盘阵列200中,如上所述省电组控制程序221使用省电组 管理表222,通过上限值来限制同时启动的RAID组的数量,抑制消耗电力。
因此,在重复数据消除中在产生相同的散列值时执行数据比较,因此在产 生向磁盘291-298的写入访问时,在包含写入对象逻辑地址的RAID组为停止 状态时,磁盘直到启动为止需要花费启动时间,因此产生性能降低。此外,在
釆用上限值的限制时,相应的RAID组无法启动,无法执行数据比较。
而且,在相同散列值的数据分散存储在不同的RAID组中时,在每次产生 相同的散列值时,需要启动包含相同散列值的多个RAID组,因此省电效果降 低。
因此,参照图6至图9的流程图对解决上述课题的本发明的处理进行说明。
首先,对于来自主机100的写处理进行说明。图6是表示该写处理的流程。 在磁盘阵列200从主机100接收到写数据和该写入目的地的主机侧指定地址 时,开始进行该处理。
首先,在步骤S1001中,重复数据消除程序223计算该写数据的散列值。 然后,在步骤S1002中,重复数据消除程序223判断在重复数据管理表224 的散列值栏2241中是否存在相同的散列值。
在不存在相同的散列值时(S1002: NO),可以判断为新数据内容的写入 数据,因此在步骤S1003中,重复数据消除程序223在重复数据管理表224 中新追加该写入数据,将该写入数据的散列值存储在散列值栏2241中,将写 入目的地的逻辑地址写入实数据存储地址栏2242中,将主机侧指定地址存储 在主机侧指定地址栏2243中。然后,在步骤S1004中,重复数据消除程序223 参照省电组管理表222,在已启动的RAID组的LU中写入该写数据。
另一方面,在重复数据管理表224中存在与该写数据的散列值相同的值时 (S1002: YES),判断为有可能已写入了相同的数据,因此在步骤S1005中, 重复数据消除程序223执行重复消除判断处理。
当步骤S1004的处理或步骤S1005的处理结束时,写入处理结束。
然后,对重复消除判断处理进行说明。图7是表示步骤S1005的重复消除 判断处理的流程图。
在步骤2001中,重复数据消除程序223比较在重复未比较数据管理表225 的散列值栏2253中存储的散列值是否与该写数据的散列值一致。
在上述步骤2001的结果为不一致时(S2001: NO),在步骤S2002中,重 复数据消除程序223进行重复消除的执行处理。将在后面使用图8对该重复消 除的"t丸行处理进行说明。
在上述步骤2001的结杲为一致时(S2001: YES ),已经在磁盘上存在具
有相同散列值的未比较数据。为了进行该写数据的数据内容的比较,需要从全
部的磁盘中读取在重复数据管理表224和重复未比较数据管理表225中登录的 相同散列值的数据。在本实施方式中,由于启动RAID组数量的限制,无法启 动全部的磁盘。因为无法读取全部的来自磁盘的具有相同散列值的数据,在步 骤S2003中,重复数据消除程序223参照省电组管理表222,在已启动的RAID 組的LU中写入没有执行数据内容比较的该写数据。
然后,在步骤S2004中,重复数据消除程序223在重复未比较数据管理表 225中作为未比较数据存储该写数据。即,在步骤S2003中,在数据临时存储 地址栏2251中存储写入了该写数据的磁盘的逻辑地址,在主机侧指定地址栏 2252中存储该写数据的主机侧指定地址,在散列值栏2253中存储该写数据的 散列值。
然后,对重复消除的执行处理进行说明。图8是表示该重复消除的执行处 理的流程图。
首先,重复数据消除程序223在步骤S3001中,将重复数据管理表224 中的与该写数据为相同散列值的实数据存储地址栏2242中存储的实数据存储 地址的LU号码与省电组管理表222的LU号码栏2224中存储的LU号码进行 比较,判断在包含该LU的RAID组的状态栏2222中存储的"状态"是否为 "已启动"。
在该RAID组的状态栏2222为"已停止"时(S3001: NO ),在步骤S3002 中,重复数据消除程序223判断是否可以启动包含该LU的RAID组。是否可 以启动的判断是由省电组控制程序221参照省电组管理表222,在上限值的限 制范围内进行判断。
在该步骤S3002的RAID组的启动判断的结果为无法启动该RAID组时 (S3002: NO),重复数据消除程序223无法从-磁盘中读取相同散列值的数据。 结果,重复数据消除程序223无法比较该写数据的数据内容。因此,重复数据 消除程序223在步骤S3003中,参照省电组管理表222,在与步骤S3001中确 认的RAID组不同的已启动的RAID组的LU中写入该写数据。
然后,在步骤S3004中,重复数据消除程序223在重复未比较数据管理表 225中作为未比较数据存储该写数据。在步骤S3003中,在数据临时存储地址
栏2251中存储写入了该写数据的磁盘的逻辑地址,在主机侧指定地址栏2251 中存储主机侧指定地址,以及在散列值栏2253中存储散列值。
在步骤S3001中状态栏2222为"已启动"(S3001: YES )或者在步骤S3002 中判断为RAID组可以启动时(S3002: YES),在步骤S3005中,重复数据消 除程序223使该RAID组为启动状态,从磁盘中读取重复数据管理表224中的 该写数据的散列值的实数据存储地址栏22242中存储的全部逻辑地址的数据, 与该写数据进行数据内容的比较。
在上述步骤S3005的结果为数据一致时(步骤S3005: YES ),因为在磁 盘291-298中已存在相同的数据,所以重复数据消除程序223不在磁盘 291~298中写入该写数据。此外,此时,重复数据消除程序223在步骤S3006 中,在重复数据管理表224中的、与存储了步骤S3005的比较结果为一致时的 数据的逻辑地址的实数据存储地址栏2242为同 一行的主机侧指定地址栏2243 中,存储该写数据的主机侧指定地址。
在上述步骤S3005的结果为数据不一致时(S3005: NO),在步骤S3007 中,重复数据消除程序223将该写数据作为新的数据,参照省电组管理表222, 将该写数据写入在步骤S3005中读取比较数据时已启动的RAID组的LU中。
然后,在步骤S3008中,重复数据消除程序223在重复数据管理表224 中的该写数据的散列值一行的实数据存储地址栏2242中追加写数据的写入目 的地的逻辑地址,在主机侧指定地址栏2243中追加由主机100指定的地址。
以上是来自主机100的写数据在磁盘阵列200中的处理顺序。在本处理中, 不存在具有相同散列值的数据的写数据作为新的数据被存储在磁盘291 ~298 中,将计算出的散列值新登录在散列值栏2241中,将^兹盘上的逻辑地址新登 录在实数据存储地址栏2242中,将主机侧指定地址新登录在主机側指定地址 栏2243 (重复数据管理表224)中。
此外,对于存在具有相同散列值的数据,但通过比较被确认为数据内容不 同的写数据,将数据自身存储在磁盘291-298上,并且在与已存在的相同散列 值同一行的实数据存储地址栏2242中追加登录在磁盘上的逻辑地址,在同一 行的主机侧指定地址栏2243 (重复数据管理表224 )中追加登录主机侧指定地 址。
此外,对于由于省电组的上限值》兹盘无法启动,因此无法与具有相同散列
值的数据进行数据内容比较的写数据,在数据临时存储地址栏2251中新登录 临时写入了写数据的磁盘上的逻辑地址,在散列值栏2253中新登录散列值, 在主机侧指定地址栏2252 (重复未比较数据管理表225 )中新登录主机侧指定 地址。
然后,对本发明中重复数据消除程序223执行的数据最佳化处理进行说 明。所谓数据最佳化处理是对重复未比较数据管理表225中登录的未比较数据 执行数据内容的比较,在数据的内容相同时,执行通常的重复数据消除。而且, 还为以下的处理关于具有相同散列值但被确认为数据内容不同的数据,移动 数据在磁盘291 298上的位置,使数据集中在存储了具有相同散列值的数据的 省电组中。
数据最佳化处理的结果为,在数据最佳化处理后,在接收到写数据,产生 了相同的散列值,因此与磁盘上的数据进行数据内容比较时,通过仅启动集中 了具有相同散列值的数据的省电组,可以从》兹盘读取具有相同散列值的数据。
然后,对本实施方式的数据最佳化处理进行说明。图9是表示该数据最佳 化处理的顺序的流程图。
首先,在步骤4001中,重复数据消除程序223将以下(1) ~ ( 6 )的情况 作为执行数据最佳化处理的契机来执行数据最佳化。具体地说,(l)为在通常 的处理中发生RAID组的启动/停止的情况;(2)为由于健康检查等停止中的 RAID组启动的情况;(3)为上述上限值具有余裕的情况;(4)为在省电组管 理表222的巻利用率栏2225中存储的作为省电组单位的RAID组的巻使用率 超过了用户所指定的阈值的情况;(5)为重复未比较数据管理表225中存储的 未比较数据的数量为预先设定的阚值以上的情况;(6)为由用户或主机100 的应用程序指定了执行的情况。在本实施方式中,将这(1)至(6)中的任何 一种情况作为执行数据最佳化处理的契机,但并不是将执行契机限定为这(1) 至(6)中的任何一种情况。
然后,在步骤S4002中,重复数据消除程序223参照重复未比较数据管理 表225,判断是否存在未比较数据。在不存在未比较数据时(S4002: NO), 重复数据消除程序223再次返回步骤S4001,等待数据最佳化处理开始的契机。
另一方面,在存在未比较数据时(S4002: YES),重复数据消除程序223 选择为了比较未比较数据的数据内容必须运转的RAID组的候补,并将结果存 储在启动候补省电组管理表227中。
作为一个具体例子,重复数据消除程序223,对于各个未比较数据,取出 与各自的散列值为相同值的、在重复未比较数据管理表225的数据临时存储地 址栏2251中存储的LU号码、以及在重复数据管理表224的实数据存储地址 栏中存储的LU号码。然后,重复数据消除程序223从省电组管理表222中选 择包含上述LU号码的RAID组。结果,对于全部未比较数据的散列值中的每 个散列值选定为了比较数据内容必须启动的RAID组的候补(以下还可以称为 启动候补RAID组)。然后,在步骤S4003中,重复数据消除程序223将该结 果存储在启动候补省电组管理表227中。
在此,对启动候补省电组管理表227进行说明。此外,图ll表示启动候 补省电组管理表227。启动候补省电组管理表227是对为了存储数据而启动的 RAID组的候补进行存储的表。启动候补省电组管理表227具有散列值栏2271 、 启动候补省电组栏2272以及相同散列值数据数量栏2273。在散列值栏2271 中存储散列值。在启动候补省电组栏2272中存储启动候补省电组。在相同散 列值数据数量栏2273中存储相同散列值数据的数量。例如图11所示,在启动 候补省电组管理表227中,对应散列值栏2271的散列值"a",在启动候补省 电组栏2272中作为启动候补省电组存储"RGOl、 RG02、 RG03"三个RAID 组,在相同散列值数据数量栏2273中,对应RAID组"RG01"存储相同散列 值数据数量"2",对应RAID组"RG02"存储相同散列值数据数量"1",对 应RAID组"RG03"存储相同散列值数据数量"1"。
此外,在本实施方式中,省电组是以RAID组为单位,所以对于对启动候 补省电组记载RAID组的识别符的情况进行了说明,在省电组的单位不同时, 可以使用省电识别号码。
然后,重复数据消除程序223,在步骤S4004中参照启动候补省电组管理 表227以及省电组管理表222,在省电组控制程序221保存的上限值的范围内, 对省电组控制程序221发出指示,使启动候补RAID组运转,对每个散列值比 较未比较数据的数据内容。
此外,在启动候补RAID组的总数超过了上限值时,重复数据消除程序 223在上限值的范围内按照顺序使启动候补RAID组启动来读取数据,在磁盘 阵列200的高速緩冲存储器230中存储读取的数据,与该数据进行比较。此外, 可以将已启动的磁盘的一部分作为临时区域,用来代替上述高速緩冲存储器 230。此外,还可以对用户发出警告来催促用户改变上限值。
对于步骤S4004的比较结果为数据内容一致的未比较数据(步骤S4004: YES),重复数据消除程序223判断为在^t盘中存在一个以上的重复的数据。 因此,在步骤S4005中,重复数据消除程序223保留一个该重复的数据,将其 他的该重复数据全部删除。重复数据删除的优先度为在重复的数据全部处于同 一RAID组时,从未比较数据开始进行删除。在重复数据处于不同的RAID组 时,在启动候补省电组管理表227中存储的同一散列值的启动候补省电组中, 从同 一散列值数据数量小的启动候补省电组中存储的数据开始进行删除。
然后,在步骤S4006中,重复数据消除程序223,与磁盘291 298上的数 据删除相配合来整理重复数据管理表224、重复未比较数据管理表225以及启 动候补省电组管理表227中的已删除数据的信息。
作为一个具体的例子,在步骤S4005中删除的数据为重复未比较数据管理 表225中存储的数据时,从重复未比较数据管理表225中删除该数据,并重新 存储在重复数据管理表224中。该存储内容是将未比较数据的"主机侧指定地 址,,的信息追加到与散列值、数据内容一致的数据相应的重复数据管理表224 的主机侧指定地址栏2243中。结果,在重复数据管理表224中存在以下的情 况对于一个散列值和实数据存储地址的组合,具有多个主机侧指定地址。
在步骤S4005中删除的数据是在重复数据管理表224中存储的数据时,在 步骤S4006中,重复数据消除程序223对如下所述的重复未比较数据管理表 225以及重复数据管理表224进行整理。
该整理是从重复未比较数据管理表225中删除表示已和删除的数据进行 了比较的未比较数据的存储信息,并将该存储信息重新存储到重复数据管理表 224中。具体地说,重复数据消除程序223将重复未比较数据管理表225中存 储的"数据临时存储地址"、"散列值"以及"主机侧指定地址"存储在重复数 据管理表224的实数据存储地址栏2242、散列值栏2241以及主机侧指定地址
栏2243中。而且,重复数据消除程序223,删除在重复数据管理表224中存 储的表示已删除的数据的信息,将该数据的主机侧指定地址的信息追加到与刚 才从重复未比较数据管理表225移动到重复数据管理表224的数据对应的主机 侧指定地址栏2243中。该整理的顺序可以改变,但最终的结果是,数据内容 一致的重复数据,在磁盘阵列200中的磁盘291~298中仅存在一个,并且针对 该数据内容的表示主机侧指定地址的信息会全部被继承。最后,重复数据消除 程序223对应已删除的数据的数量,使启动候补省电组管理表227的同 一散列 值数据数量栏2273中存储的同一散列值数据数量减少与已删除的数据的数量 相同的数量。
另一方面,在步骤4004的比较结果为数据内容不一致时,重复数据消除 程序223判断为在磁盘291-298上不存在该数据的重复数据。结果,虽然散列 值相同但数据内容不同,所以不成为删除对象。然后,在步骤S4007中,重复 数据消除程序223对如下所述的重复未比较数据管理表225以及重复数据管理 表224进行整理。
重复数据消除程序223删除重复未比较数据管理表225中的表示数据内容 不一致的数据的存储信息,将该存储信息重新存储到重复数据管理表224中。
具体地说,在步骤S4007中,重复数据消除程序223在重复未比较数据管 理表225的表示该数据的存储信息中,将"数据临时存储地址,,以及"主机侧 指定地址"移动到重复数据管理表224中的为同一散列值的一行的"实数据存 储地址"以及"主机侧指定地址"。结果,重复数据管理表224具有对于一个 散列值,具有多个实数据存储地址和主机侧指定地址的組合的情况。
反复执行上述步骤S4004至步骤S4007的重复数据的删除,直到重复未 比较数据管理表225中存储的信息消失为止。
最后,在步骤S4008中,重复数据消除程序223为了使散列值相同但数据 内容不同的数据集中到相同的省电组对数据进行移动,与此相伴对重复数据管 理表224以及启动候补省电组管理表进行整理。
作为一个具体地例子,重复数据消除程序223参照重复数据管理表224 的实数据存储地址栏2242以及省电组管理表222。然后,在不同的省电组中 存储有散列值相同的数据时,重复数据消除程序223移动该数据,使数据集中
到同 一省电组中。移动源和移动目的地的决定参照启动候补省电组管理表
227,根据相同散列值数据数量栏2273,使数据从"相同散列值数据数量,,少 的省电组移动到"相同散列值数据数量"多的省电组。伴随该数据的移动,在 重复数据管理表224的表示移动数据的存储信息中,将实数据存储地址栏2242 中存储的实数据存储地址变更为移动目的地的地址。而且,重复数据消除程序 223,对应不同数据向同一省电组的移动,对启动候补省电组管理表227的相 同散列值数据数量栏2273的"相同散列值数据数量"进行变更。
直到启动候补省电组管理表227的相同散列值数据数量栏2273中存储的 "相同散列值数据数量"全部集中到一个"启动候补省电组"为止,反复执行 上述步骤S4008。
当上述步骤S4008的处理结束时,返回步骤S4001的处理,当上述说明 的数据最佳化执行契机到来时,再次执行上述的处理。
根据该第一实施方式的存储系统1,在磁盘阵列200中同时执行重复数据 消除和;兹盘运转控制时,可以最大限度地发挥基于重复数据消除的数据容量的 高效化,以及基于》兹盘运转控制的省电效果。
此外,上述实施方式为一个例子,还可以按照与上述实施方式不同的顺序 执行处理。即,最终,都可以通过删除数据内容相同的重复数据,在磁盘上必 定存储一个数据,把在多个省电组中分散存储的散列值相同但数据内容不同的 数据集中存储在同一省电组中。例如,在数据最佳化处理时,为了减少省电组 的启动次数,同时执行S4002至S4008的步骤。 (第二实施方式) (2-1 )结构的说明
第二实施方式的结构与上述第一实施方式的存储系统1的结构相同,因此 省略说明。
(2-2 )磁盘阵列的消耗电力的抑制
因为与上述第一实施方式相同所以省略说明。但是,将省电组中的一个以 上的省电组定义为在^兹盘阵列200运转的过程中,始终启动因此可以访问的省 电组(以下称为始终运转组)。 (2-3)重复数据消除
因为与上述第一实施方式相同所以省略说明。
(2-4 )考虑了重复数据消除的省电控制
处理流程除了以下的不同点之外与上述第一实施方式相同,对于相同点省 略说明,以下对于不同点进^f亍说明。
与上述第一实施方式不同,在该第二实施方式中,将始终运转组用作未比 较数据的临时存储场所。此时,图7的步骤S2002中的未比较数据全部临时保 存在始终运转组中。此外,在数据最佳化处理时,步骤S4005的重复数据删除 处理以及步骤S4008的相同散列值的数据移动处理必定将始终运转组作为删 除源、以及移动源。
而且,始终运转组发挥始终可以访问的特性,在同一散列值的数据的数量 成为预定的阈值以上时,可以将相应散列值的数据全部移动到始终运转组中。
由此,在图8的步骤S3001的省电组是否已启动的判断中,因为始终运转 组始终为已启动,所以可以不必启动多余的省电组来执行重复数据消除。
此外,在该第二实施方式中,始终运转组作为包含一个以上的磁盘 291 298的省电组的一种控制形式。但是,与包含该^兹盘291 298的控制形式 不同,还可以是包含在磁盘阵列200运转时可以访问的易失性/非易失性存储 器等数据存储区域的控制形式。 (第三实施方式) (3-1)结构的说明
第三实施方式的结构与上述第一实施方式的存储系统1的结构相同,所以 省略说明。
(3-2)磁盘阵列的消耗电力的抑制 因为与上述第一实施方式相同所以省略说明。
(3-3)重复数据消除
因为与上述第一实施方式相同,所以省略详细的说明。但是,从主机IOO 向磁盘阵列200的写数据在由重复数据消除程序223分割为多个数据段之后, 计算散列值。此外,数据段的大小也可以根据重复数据消除的技术规格而不同。 (3-4)考虑了重复数据消除的省电控制
对于与上述第一实施方式的相同点省略说明,以下对于不同点进行说明。
在与上述第一实施方式不同的第三实施方式中,将写数据分割为多个数据 段。主机100将这些从一个写数据分割出的多个数据段识别为连续的数据。结
果,在主机IOO请求读取数据时,同时从^磁盘中读出的概率变高。在用于上述 第一实施方式时,还产生以下的情况属于具有连续性的数据段组的数据(以 下成为关联数据)的 一 部分被存储在不同的省电组(在为上述第 一 实施方式时 为RAID组)中。此时,在调用连续的数据段时,需要启动多个省电组。结果, 在省电组为停止状态等省电状态时,需要启动多个省电组,省电效果降低。因 此,在该第三实施方式中,保存这样一种信息,该信息表示具有连续性的数据 的关联性,在根据该信息进行数据最佳化处理时,对数据进行配置使其属于相 同的省电组。
具体地说,在图3所示的重复数据管理表224和图5所示的重复未比较数 据管理表225中追加存储关联地址的关联地址栏。图12表示追加了关联地址 栏的重复数据管理表228,图13表示追加了关联地址栏的重复未比较数据管 理表229。
如图12所示,重复数据管理表228除了散列值栏2281、实数据存储地址 栏2282以及主机侧指定地址栏2283之外,还设置有关联地址栏2284。此外, 如图13所示,重复未比较数据管理表229除了数据临时存储地址栏2291、主 机侧指定地址栏2292以及散列值栏2293之外,还设置有关联地址栏2294。
如图12以及图13所示,关联地址栏2284与实数据存储地址栏2282为一 对一的关系,关联地址栏2294与数据临时存储地址栏2291为一对一的关系。 此外,当具有在实数据存储地址栏2282或数据临时存储地址栏2291所示的磁 盘上的地址中存储的数据的关联数据时,存储多个该数据的磁盘上的地址。
当以上述第一实施方式为》出具体说明存储多个该地址的处理时,在第一 实施方式中的在;兹盘中写入写数据的时刻,即将实数据存储地址存储在重复数 据管理表228,或者将数据临时存储地址存储在重复未比较数据存储表229的 时刻,在关联地址栏2284或关联地址栏2294中,作为关联数据登录在磁盘 291~298中写入的逻辑地址。此外,在关联数据具有多个连续性时,在关联地 址栏2284、 2294中存储多个逻辑地址。
而且,在数据最佳化处理时,在执行了具有相同散列值的数据的移动以及
重复数据管理表228、重复未比较数据管理表229等管理表的整理之后,执行 使用了 "关联地址"的数据的再配置以及表的整理。此外,这些处理可以同时 执行。
然后,对第三实施方式的数据最佳化处理进行说明。图14表示该数据最 佳化处理的流程图。此外,图14中的步骤S4001至S4008与图9中说明的处 理相同,所以省略说明,对于新追加的步骤S4009进行详细地说明。
在步骤S4009中,重复数据消除程序223参照重复数据管理表228的实数 据存储地址栏2282和关联地址栏2284。然后,重复数据消除程序223在判断 出LU号码不同时,进一步参照省电组管理表222判断该LU号码是否属于不 同的RAID组。结果,重复数据消除程序223在判断出属于不同的RAID组时, 将数据移动到同一RAID组中,对应伴随数据移动而变更的地址,改写重复数 据管理表228的实数据存储地址栏2282以及关联地址栏2284。重复数据消除 程序223直到"实数据存储地址"和"关联地址"全部属于同一RAID组为止, 重复进行该处理。结果,"管理数据"被存储在同一RAID组(省电组)中。
但是,此时,关于针对重复数据管理表228的"散列值"存储了多个"实 数据存储地址"的数据,是为了集中相同散列值的数据而集中在同一省电组中 的数据,所以可以去除上述步骤S4009。
此外,可以由用户决定在同一省电组中,优先向同一省电组集中具有相同 散列值的不同数据,或者优先在同一省电组中集中关联数据,例如,还可以比 较具有相同散列值的数据的数量和关联数据的数量,由系统决定优先集中多的 一方等。
而且,在上述第三实施方式中,作为一个例子,在由重复数据消除程序 223分割了写数据的情况下进行了说明,但也可以使用主机IOO的应用程序等 中的表示数据连续性的信息,例如差分文件等的特性作为关联数据。
此外,在上述第一至第三实施方式中,为了方便说明,在将处理的主体设 为省电组管理程序221或重复数据消除程序223的情况下进行了说明,但实际 上是通过CPU210执行省电组管理程序221或重复数据消除程序223来实现该 处理。
而且,在上述第一至第三实施方式中,被处理的写数据的单位可以使用数
据块单位或文件单位中的任意一种单位。
而且,在上述各个实施方式中,在将本发明的存储系统应用于磁盘阵列
200的情况下进行了说明,但本发明并不限于此,可广泛地用于各种存储系统。 此外,在上述的实施方式中,对于将本发明用于存储系统1的情况进行了 说明,但本发明并不限于此,该存储系统1具有主机100;以及磁盘阵列200, 其具有存储从该主机100接收的数据的多个磁盘291~198以及由该多个磁盘 291~298构成的多个逻辑单元281-283,该磁盘阵列200具有存储组信息的 省电组管理表222,该组信息至少包含使用多个逻辑单元281 283构成的RAID 组271、 727以及该RAID组271、 727是否已启动;磁盘阵列控制器240,其 接通/切断与RAID组中包含的逻辑单元281~283对应的磁盘291-298的电源; 以及存储管理信息的重复数据管理表224,该管理信息包含与多个磁盘 291-298中存储的数据的存储位置对应的逻辑单元281-283的逻辑单元号码
(LU )、代表数据的位串的散列值以及与逻辑单元281 283对应的计算机100 指定的主机侧指定号码,并且,还具备当从计算机IOO接收到数据时,计算 代表该数据的位串的值的步骤(S1001);判断与该计算出的散列值相同的散列 值是否已存储在重复数据管理表224中的步骤(S1002);在该判断步骤中判断 为没有存储相同的散列值时,将接收到的数据存储在重复数据管理表224中, 并且根据省电组管理表222,将数据存储在与构成已启动的组的逻辑单元的逻 辑单元号码对应的磁盘291-298中的第一步骤(S1003, S1004);以及在判断 步骤中判断为存储了相同的散列值时,根据在省电组管理表222中管理的组信 息以及在重复数据管理表中管理的管理信息,将接收到的数据存储在磁盘 291~298中的第二步骤(S蘭)。
此外,还对以下的情况进行了说明磁盘阵列200具备存储未比较数据信 息的重复未比较数据管理表225,该未比较数据信息至少包含在磁盘291 298 中临时存储数据的逻辑单元号码以及代表数据的位串的散列值,第二步骤包 含未比较步骤(S2001 ),其判断在所述未比较数据管理表中是否存储有与代 表接收到的数据的位串的散列值相同的散列值;处理未比较数据的步骤
(S2003、 S2004),在该未比较步骤中判断出存储有相同的散列值时,根据省 电组管理表222在与构成已启动的组的逻辑单元的逻辑单元号码对应的磁盘
291-298中存储接收数据,并且在重复未比较数据管理表中存储与存储接收数 据的磁盘291~298对应的逻辑单元号码以及代表接收到的数据的位串的散列 值;以及消除步骤(S2002),其在未比较步骤中判断出没有存储相同的散列值 时,消除重复存储数据的情况,但本发明并非限于此。
而且,还对以下的情况进行了说明消除步骤包含判断状态的步骤 (S3001 ),其根据省电组管理表222判断存储了与代表接收到的数据的位串的 散列值相同的散列值的磁盘291-298是否已启动;数据判断步骤(S3005 ),在 该判断状态的步骤中判断为磁盘291~298已启动时,从磁盘291 298读出与散 列值对应的数据,判断该读出的数据与接收到的数据是否一致;第三步骤 (S3006),其在该数据判断步骤中判断出数据一致时,与重复数据管理表224 的所读出的数据的逻辑单元号码相对应,存储*接收到的数据的由主机100指定 的主机侧指定号码;以及第四步骤(S3007、 S3008),其在该数据判断步骤中 判断出数据不 一致时,将接收到的数据存储在与进行了读出的RAID组对应的 磁盘291-298中,并且将接收数据的管理信息存储在重复数据管理表224中, 但本发明并非限于此。
而且,还对以下的情况进行了说明消除步骤包含判断启动的步骤 (S3002),其在判断状态的步骤中判断出磁盘291 298没有启动时,判断是否 可以启动在省电组管理表222中管理的RAID组,在判断启动的步骤中判断出 可以启动RAID组时,磁盘阵列控制器240接通与RAID组对应的磁盘291~298 的电源,在接通了磁盘291 298的电源时,数据判断步骤进行数据是否一致的 判断,但本发明并非限于此。
而且,还对以下的情况进行了说明消除步骤包含第五步骤(S3003、 S3004),其在判断启动的步骤中判断出无法启动RAID组时,在与已启动的 RAID组对应的》兹盘291 298中存储接收到的数据,并且将接收数据的管理信 息存储在重复数据管理表中,但本发明并非限于此。
而且,还对以下的情况进行了说明磁盘阵列200具有存储启动候补信息 的启动候补省电组管理表227,并且具有进行最佳化处理的步骤(S4001至 S4008),其在重复未比较数据管理表225中存储有未比较数据信息的情况下, 再次进行配置使散列值相同的数据成为同一 RAID组,但本发明并非限于此。
本发明可以广泛地应用于存储系统以及存储系统的消耗电力降低方法。
权利要求
1. 一种存储系统,其包含计算机以及存储装置,该存储装置具有存储从该计算机接收到的数据的多个磁盘装置以及由该多个磁盘装置构成的多个逻辑单元,该存储系统的特征在于,具备:组管理表,其存储组信息,该组信息至少包含使用所述多个逻辑单元构成的组以及该组是否已启动;电力控制部,其接通/切断与所述组中包含的逻辑单元对应的磁盘装置的电源;数据管理表,其存储管理信息,该管理信息包含与所述多个磁盘装置中存储的数据的存储位置对应的逻辑单元的逻辑单元号码、代表所述数据的位串的值以及与所述逻辑单元对应的由所述计算机指定的号码;计算部,当从所述计算机接收到数据时,计算代表该数据的位串的值;判断部,其判断与该计算部计算出的值相同的值是否已存储在所述数据管理表中;第一存储部,其在该判断部判断为没有存储相同的值时,将所述接收到的数据存储在所述数据管理表中,并且根据所述组管理表,将所述数据存储在与构成已启动的组的逻辑单元的逻辑单元号码对应的磁盘装置中;以及第二存储部,其在所述判断部判断为存储了相同的值时,根据所述组管理表管理的组信息以及所述数据管理表管理的管理信息,将所述接收到的数据存储在所述磁盘装置中。
2. 根据权利要求1所述的存储系统,其特征在于, 具备未比较数据管理表,其存储未比较数据信息,该未比较数据信息至少包含在所述磁盘装置中临时存储数据的逻辑单元号码以及代表所述数据的位 串的值,所述第二存储部包含未比较判断部,其判断在所述未比较数据管理表中是否存储有与代表所述 接收到的数据的位串的值相同的值;未比较数据处理部,在该未比较判断部判断出存储有相同的值时,根据所中存储所述接收数据,并且在所述未比较数据管理表中存储与存储所述接收数 据的所述磁盘装置对应的逻辑单元号码以及代表所述接收到的数据的位串的值;以及重复消除处理部,其在所述未比较判断部判断出没有存储相同的值时,进 行消除重复存储所述数据的重复消除处理。
3. 根据权利要求2所述的存储系统,其特征在于, 所述重复消除处理部包含状态判断部,其根据所述组管理表判断存储了具有与代表所述接收到的数 据的位串的值相同值的数据的磁盘装置是否已启动;数据判断部,其在该状态判断部判断为所述^t盘装置是启动中时,从所述 磁盘装置读出与所述值对应的数据,判断该读出的数据与所述接收到的数据是 否一致;第三存储部,其在该数据判断部判断出数据一致时,与所述数据管理表的 所述读出的数据的逻辑单元号码对应起来,存储所述接收到的数据的由所述计 算机指定的号码;以及第四存储部,其在所述数据判断部判断出数据不一致时,将所述接收到的 数据存储在与所述进行了读出的组对应的磁盘装置中,并且将所述接收数据的 管理信息存储在所述数据管理表。
4. 根据权利要求3所述的存储系统,其特征在于,所述重复消除处理部具有启动判断部,其在所述状态判断部判断出所述^兹 盘装置不是启动中时,判断是否可以启动在所述组管理表中管理的组,在所述启动判断部判断出可以启动所述组时,所述电力控制部接通与所述 组对应的磁盘装置的电源,在接通了所述^f兹盘装置的电源时,所述数据判断部,进行所述数据是否一 致的判断。
5. 根据权利要求4所述的存储系统,其特征在于, 所述启动判断部比较预先设定的可以启动的组的数量以及目前已启动的组的数量,来判断是否可以启动所述其他的组。
6. 根据权利要求4所述的存储系统,其特征在于,所述重复消除处理部具有第五存储部,其在由所述启动判断部判断出无法 启动所述组时,将所述接收到的数据存储在与已启动的组对应的石兹盘装置中, 并且将所述接收数据的管理信息存储在所述数据管理表中。
7. 根据权利要求1所述的存储系统,其特征在于, 所述组为RAID组。
8. 根据权利要求2所述的存储系统,其特征在于, 具备启动候补表,其存储启动候补信息,该启动候补信息包含代表数据的位串 的值、启动候补的所述组以及所述值的计数值;进行最佳化处理的最佳化处理部,其在所述未比较数据管理表中存储有未 比较数据信息的情况下,将所述值相同的数据再配置到同 一所述组中。
9. 根据权利要求8所述的存储系统,其特征在于,所述最佳化处理部,以在通常的处理中发生了所述组的启动/停止时的情 况、停止中的所述组已启动的情况、所述未比较数据管理表中存储的未比较数 据的数量成为了预定设定的阔值以上的情况、以及由用户或者所述计算机所指 定的情况中的至少任何一种情况为契机来开始处理。
10. —种存储系统的消耗电力降低方法,该存储系统包含计算机以及存储 装置,该存储装置具有存储从该计算机接收到的数据的多个磁盘装置以及由该 多个磁盘装置构成的多个逻辑单元,该存储系统的消耗电力降低方法的特征在于,所述存储装置具有组管理表,其存储组信息,该组信息至少包含使用所述多个逻辑单元构成 的组以及该组是否是启动中;电力控制部,其接通/切断与所述组中包含的逻辑单元对应的磁盘装置的 电源;数据管理表,其存储管理信息,该管理信息包含与所述多个^兹盘装置中存 储的数据的存储位置对应的逻辑单元的逻辑单元号码、代表所述数据的位串的 值以及与所述逻辑单元对应的所述计算机指定的号码, 具有以下步骤当从所述计算机接收到数据时,计算代表该数据的位串的值的步骤; 判断与该计算出的值相同的值是否已存储在所述数据管理表中的步骤; 在该进行判断的步骤中判断为没有存储相同的值时,将所述接收到的数据存储在所述数据管理表中,并且根据所述组管理表,将所述数据存储在与构成已启动的组的逻辑单元的逻辑单元号码对应的磁盘装置中的第一步骤;以及 在所述进行判断的步骤中判断为存储了相同的值时,根据所述组管理表管理的组信息以及所述数据管理表管理的管理信息,将所述接收到的数据存储在所述磁盘装置中的第二步骤。
11. 根据权利要求IO所述的存储系统的消耗电力降低方法,其特征在于, 所述存储装置具备未比较数据管理表,其存储未比较数据信息,该未比较数据信息至少包含在所述磁盘装置中临时存储数据的逻辑单元号码以及代表 所述数据的位串的值,所述第二步骤包含以下步骤未比较步骤,其判断在所述未比较数据管理表中是否存储有与代表所述接 收到的数据的位串的值相同的值;处理未比较数据的步骤,其在该未比较步骤中判断出存储有相同的值时,盘装置中存储所述接收数据,并且在所述未比较数据管理表中存储与存储所述 接收数据的所述磁盘装置对应的逻辑单元号码以及代表所述接收到的数据的 位串的值;以及消除步骤,其在所述未比较步骤中判断出没有存储相同的值时,消除重复 存储所述数据的情况。
12. 根据权利要求11所述的存储系统的消耗电力降低方法,其特征在于, 所述消除步骤包含以下步骤判断状态的步骤,其根据所述组管理表判断存储了具有与代表所述接收到 的数据的位串的值相同的值的数据的磁盘装置是否已启动;数据判断步骤,其在该判断状态的步骤中判断为所述磁盘装置已启动时, 从所述磁盘装置读出与所述值对应的数据,判断该读出的数据与所述接收到的 数据是否一致;第三步骤,其在该数据判断步骤中判断出数据一致时,与所述数据管理表的所述读出的数据的逻辑单元号码对应起来,存储所述接收到的数据的由所述计算机指定的号码;以及第四步骤,其在所述数据判断步骤判断出数据不一致时,将所述接收到的数据存储在与所述进行了读出的组对应的磁盘装置中,并且将所述接收数据的 管理信息存储在所述数据管理表中。
13. 根据权利要求12所述的存储系统的消耗电力降低方法,其特征在于, 所述消除步骤具有判断启动的步骤,其在所述判断状态的步骤中判断出所述磁盘装置没有启动时,判断是否可以启动在所述组管理表中管理的组, 在所述判断启动的步骤中判断出可以启动所述组时,所述电力控制部接通与所述组对应的f兹盘装置的电源,在接通了所述磁盘装置的电源时,所述数据判断步骤进行所述数据是否一致的判断。
14. 根据权利要求13所述的存储系统的消耗电力降低方法,其特征在于, 所述判断启动的步骤比较预先设定的可以启动的组的数量以及目前已启动的组的数量,来判断是否可以启动所述其他的组。
15. 根据权利要求13所述的存储系统的消耗电力降低方法,其特征在于, 所述消除步骤具有第五步骤,其在所述判断启动的步骤中判断出无法启动所述組时,将所述接收到的数据存储在与已启动的组对应的磁盘装置中,并且 将所述接收数据的管理信息存储在所述数据管理表中。
16. 根据权利要求IO所述的存储系统的消耗电力降低方法,其特征在于, 所述组为RAID組。
17. 根据权利要求11所述的存储系统的消耗电力降低方法,其特征在于, 所述存储装置具备启动候补表,其存储启动候补信息,该启动候补信息包含代表数据的位串的值、启动候补的所述组以及所述值的计数值;具有进行最佳化处理的步骤,其在所述未比较数据管理表中存储有未比较 数据信息的情况下,将所述值相同的数据再配置到同一所述组中。
18. 根据权利要求17所述的存储系统的消耗电力降低方法,其特征在于, 所述进行最佳化的步骤,以在通常的处理中发生所述组的启动/停止的情 况、停止中的所述组已启动的情况、所述未比较数据管理表中存储的未比较数 据的数量成为预先设定的阈值以上的情况、以及由用户或者所述计算机所指定 的情况中的至少任何一种情况为契机来开始处理。
全文摘要
本发明提供一种存储系统以及存储系统的消耗电力降低方法。最大限度地发挥基于重复数据消除的数据容量的高效化,以及基于磁盘运转控制的省电效果。存储系统,当从计算机接收到数据时,计算代表该数据的位串的值,判断在数据管理表中是否存储有与该计算出的值相同的值。在判断为没有存储时,在数据管理表中存储接收到的数据,并且根据组管理表在与构成已启动的组的逻辑单元的逻辑单元号码对应的磁盘装置中存储数据。在判断为存储有同一值时,根据在组管理表中管理的组信息以及在数据管理表中管理的管理信息,在磁盘装置中存储接收到的数据。
文档编号G06F1/32GK101377710SQ20081008282
公开日2009年3月4日 申请日期2008年2月28日 优先权日2007年8月30日
发明者一 森 申请人:株式会社日立制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1