存储系统的制作方法

文档序号:6596186阅读:171来源:国知局
专利名称:存储系统的制作方法
技术领域
本发明涉及存储系统,并且具体地,涉及将数据分发并存储到多个存储设备中的存储系统。
背景技术
近年来,随着计算机的发展和流行,各种信息被置于数字数据中。存在诸如磁带和磁盘之类的存储设备,以作为用于存储诸如数字数据的设备。因为要存储的数据日益增加, 并且其数量已经变得很大,所以需要高容量的存储系统。另外,需要保持可靠性,同时降低存储设备的成本。此外,需要在随后可以容易地取回数据。因此,期望这样的存储系统,其能够自动地提高其存储容量和性能,消除存储的重复以降低存储成本,并且具有高冗余度。在这样的情况下,近年来,已经开发出了内容地址存储系统,如专利文献1中所示。该内容地址存储系统将数据分发并且存储到多个存储设备中,并且基于唯一的内容地址来指定数据存储的存储位置,该唯一的内容地址对应于数据的内容而被指定。具体地,内容地址存储系统将预定数据划分为多个分段,向其添加作为冗余数据的分段,并且将这些分段分别存储到多个存储设备中。此后,通过指明内容地址,可以取回数据,即存储在由该内容地址指定的存储位置中的分段,并且根据多个分段恢复划分之前的预定数据。此外,生成内容地址以便唯一对应于数据的内容。因此,在重复数据的情况下,可以参考相同存储位置中的数据而获得相同内容的数据。由此,不需要独立地存储重复的数据,并且可以消除重复的记录并且减少数据容量。[专利文献1]日本未审查专利申请公开号JP-A2005-235171然而,如上所述,内容地址存储系统将预定数据划分为多个分段,并且分别存储到多个存储设备中。因此,当取回预定数据时,需要通过指定由划分数据获得的相应分段的存储位置来进行访问。这产生了一个问题,即,要花费时间来执行指定要访问的存储位置的过程,并且取回效率降低。

发明内容
因此,本发明的一个目的在于提供一种高性能存储系统,其能够快速取回数据同时保持冗余度,即,上文所述的任务。为了实现这一目的,本发明的一个实施方式的存储系统配备有多个存储装置和数据处理装置,该数据处理装置配置用于将数据存储到多个存储装置中以及取回存储在存储装置中的数据。另外,该数据处理装置包括数据集生成装置,配置用于通过将存储目标数据划分为多个片段来生成划分数据,并且还生成用以恢复存储目标数据的冗余数据,从而生成包括多个分段数据的数据集,该分段数据是划分数据和冗余数据;以及分发存储控制装置,配置用于将分段数据分发并且存储到相应的存储装置中。
此外,分发存储控制装置配置用于将组成数据集的分段数据分别存储到在形成于相应存储装置中的存储区域内的相同位置中。另外,本发明的另一实施方式的计算机程序是包括指令的计算机程序,该指令使得配置有多个存储装置的信息处理设备实现数据处理装置,该数据处理装置配置用于将数据存储到多个存储装置中并且取回存储在存储装置中的数据。另外,该数据处理装置包括数据集生成装置,配置用于通过将存储目标数据划分为多个片段而生成划分数据,并且还生成用以恢复存储目标数据的冗余数据,从而生成包括多个分段数据的数据集,分段数据是划分数据和冗余数据;以及分发存储控制装置,配置用于将分段数据分发并且存储到相应的存储装置中。此外,分发存储控制装置配置用于将组成数据集的分段数据分别存储到形成于相应存储装置中的存储区域内的相同位置中。另外,在本发明的又一实施方式的数据处理方法中,配备有多个存储装置的信息处理设备将数据存储到多个存储装置中并且取回存储在存储装置中的数据。另外,在将数据存储到多个存储装置中时,信息处理设备通过将存储目标数据划分为多个片段来生成划分数据,并且还生成用以恢复存储目标数据的冗余数据,从而生成包括多个分段数据的数据集,分段数据是划分数据和冗余数据;将分段数据分发和存储到相应的存储装置中;以及另外,在将分段数据存储到相应的存储装置中时,信息处理设备将组成数据集的分段数据分别存储到形成于相应存储装置中的存储区域内的相同位置中。利用上述配置,本发明可以实现能够快速取回数据同时保持冗余度的高性能存储系统。


图1是示出包括根据本发明的第一示例性实施方式的存储系统的完整系统的配置的框图;图2是示意性地示出根据本发明的第一示例性实施方式的存储系统的配置的框图;图3是示出根据本发明的第一示例性实施方式的存储系统的配置的功能框图;图4是用于解释图3中公开的存储系统中的数据存储过程的方面的解释视图;图5是用于解释图3中公开的存储系统中的数据存储过程的方面的解释视图;图6是用于解释图3中公开的存储系统中的数据取回过程的方面的解释视图;图7是示出将数据存储到图4中公开的存储系统中的存储设备中的方面的示图;图8是示出将数据存储到图4中公开的存储系统中的存储设备中的方面的示图;图9是示出图3中公开的存储系统的操作的流程图;图10是示出本发明的第二示例性实施方式中的存储系统的配置的功能框图;图11是示出将数据存储到图10中公开的存储系统中的存储设备中的方面的示图;图12是示出将数据存储到图10中公开的存储系统中的存储设备中的方面的示图13是示出将数据存储到图10中公开的存储系统中的存储设备中的方面的示图;图14是示出将数据存储到图10中公开的存储系统中的存储设备中的方面的示图;图15是示出将数据存储到图10中公开的存储系统中的存储设备中的方面的示图;图16是示出将数据存储到图10中公开的存储系统中的存储设备中的方面的示图;图17是示出图10中公开的存储系统的操作的流程图;以及图18是示出本发明的第三示例性实施方式中的存储系统的配置的功能框图。
具体实施例方式<第一示例性实施方式>将参考图1到图9描述本发明的第一示例性实施方式。图1是示出了完整系统的配置的框图。图2是示意性地示出了存储系统的框图,而图3是示出了配置的功能框图。图 4到图6是用于解释存储系统的操作的解释视图。图7和图8是示出了存储系统中的数据存储状态的示图。图9是示出了存储系统的操作的流程图。此处的示例性实施方式示出了随后描述的第三示例性实施方式中公开的存储系统的特定示例。下面将描述通过连接多个服务器计算机来配置存储系统的情况。然而,本发明的存储系统不限于具有多个计算机的配置,而是可以由一个计算机来配置。[配置]如图1所示,本发明的存储系统10经由网络N连接至对备份过程进行控制的备份系统11。备份系统11获取经由网络N连接的备份目标设备12中存储的备份目标数据(存储目标数据),并且请求存储系统10进行存储。由此,存储系统10存储被请求作为备份而存储的备份目标数据。如图2所示,该示例性实施方式的存储系统10采用连接有多个服务器计算机的配置。具体地,存储系统10配备有加速器节点IOA和存储节点10B,加速器节点IOA充当控制存储系统10的存储/再现操作的服务器计算机,并且存储节点IOB充当配备有存储数据的存储设备的服务器计算机。加速器节点IOA的数目和存储节点IOB的数目不限于图2中所示,并且可以采用连接更多节点IOA和更多节点IOB的配置。另外,该示例性实施方式的存储系统10是内容地址存储系统,其划分数据并且使数据冗余,分发数据并且存储到多个存储设备中,以及通过根据数据的内容而指定的唯一内容地址来指定被存储的数据的存储位置。将详细描述具体配置。另外,假设存储系统10是一个系统,下文将描述存储系统10的配置和功能。换言之,下文描述的存储系统10的配置和功能可以包括在加速器节点IOA或者存储节点IOB 中。存储系统10不限于包括加速器节点IOA和存储节点IOB的配置。存储系统10可以具有任何配置。另外,存储系统10不限于内容地址存储系统。图3示出了存储系统10的配置。如该图所示,存储系统10配备有存储数据的数据存储设备30,以及控制将数据存储到数据存储设备30中和从数据存储设备30取回数据的操作的数据处理设备20。实际上,数据处理设备20由多个算术设备配置,算术设备诸如图2中所示的加速器节点IOA的CPU(中央处理单元)和存储节点IOB的CPU。另外,存储设备30由图2中所示的加速器节点IOA的硬盘和存储节点IOB的硬盘来配置。继而,如图3所示,数据处理设备20配备有块生成单元21、重复检查单元22、分段生成单元23、分发存储控制单元M和存储位置管理单元25,它们通过内建于程序中而被配置。另外,数据存储设备30配备有多个存储设备31,每一个存储备份目标数据;以及存储位置信息存储单元32,其存储所存储数据的位置。下面将详细描述相应的配置。同时,将参考图4到图8描述由相应的配置处理数据的方面。上述程序例如以存储在诸如CD-ROM的存储介质中的状态被提供至存储系统10。备选地,程序可以存储在网络上的另一服务器计算机的存储设备中,并且从其他服务器计算机经由网络提供至存储系统10。首先,在接受备份目标数据A的输入(如图5中的箭头Yl所示)之后,块生成单元21将备份目标数据A划分为预定容量(例如,64KB)的块数据D,如图4以及图5中的箭头Y2所示。继而,基于该块数据D的数据内容,块生成单元21计算表示该数据内容(箭头 Y3)的唯一哈希值H(内容标识信息)。例如,通过使用预先设置的哈希函数,基于块数据D 的数据内容来计算哈希值H。在加速器节点IOA中执行块生成单元21的过程。另外,重复检查单元22 (重复检查装置)通过使用备份目标数据A的块数据D的哈希值H来检查块数据D是否已被存储在存储设备31中。特别地,哈希值H和表示已存储块数据D的存储位置内容地址CA是相关的,并且被注册在MFI (主分段索引)文件中。因此,如果在存储之前计算的块数据D的哈希值H存在于MFI文件中,则重复检查单元22可以确定具有相同内容的块数据D已经被存储(图5中的箭头W)。在这种情况下,重复检查单元22从MFI文件获取与和存储之前的块数据D的哈希值H相一致的MFI中的哈希值 H相关的内容地址CA。继而,重复检查单元22返回该内容地址CA作为需要存储的块数据 D的内容地址CA。由此,通过使用该内容地址CA而参考的已存储数据被用作需要存储的块数据D,并且无需存储需要存储的块数据D。如果存在多个存储节点10B,则基于如上所述的根据块数据D而被计算的哈希值H 而确定一个称为写启动器(WI)的存储节点,其处理数据存储时的初始过程(压缩过程和分段过程,将在随后描述)。另外,分段生成单元23 (数据集生成装置)压缩如上所述由重复检查单元22确定为尚未被存储的块数据D,并且将数据划分为具有预定容量的多个分段数据,如图5中的箭头TO所示。例如,如图4中的附图标记Dl到D9所示,分段生成单元23将数据划分为9个分段数据(划分数据41)。此外,分段生成单元23生成冗余数据以使得即使在丢失了通过划分而获得的某些分段数据的情况下也可以恢复原始块数据,并且将冗余数据添加到通过划分而获得的分段数据41。例如,如图4中的附图标记DlO到D12所示,分段生成单元23 添加了 3个分段数据(冗余数据42)。由此,分段生成单元23生成包括12个分段数据的数据集40,这12个分段数据由9个划分数据41和3个冗余数据组成。分段生成单元23的过程由上述称为WI的一个存储节点执行。另外,分发存储控制单元24(分发存储控制装置)将由分段生成单元23生成的、 组成数据集的分段数据逐个分发并且存储到形成于存储设备31中的存储区域中。例如,如图4所示,在生成了 12个分段数据Dl到D12的情况下,分发存储控制单元M将分段数据Dl到D12之一存储到形成于12个存储设备31中的数据存储文件Fl到F12 (数据存储区域)之一中(参考图6中箭头Y6)。此时,分发存储控制单元M将组成一个数据集40的各分段数据Dl到D12存储到相应数据存储文件Fl到F12内的相同位置中。例如,如图7所示,分发存储控制单元M将所有的分段数据Dl到D12存储到相对于相应数据存储文件Fl到F12的开始位置而言相同的位置中。在图7的示例中,该图的上端是文件的开始。特别地,在先前没有设置在各数据存储文件Fl到F12中的存储位置的情况下,分发存储控制单元M将分段数据Dl到D12分别存储到与已经存储在各存储文件Fl到F12 中的数据相邻的空闲存储位置中。例如,在图8中,数据已经存储到各数据存储文件Fl到 F12中的网状部分之上,并且分发存储控制单元M将各分段数据Dl到D12存储到与其相邻的区域中,使得一个数据集40的存储位置相一致。另外,特别地,分发存储控制单元对将组成一个数据集40的各分段数据Dl到D12同时存储到相应的数据存储文件Fl到F12中。另外,分发存储控制单元M向组成数据集40的各分段数据Dl到D12提供相同的标识信息(写记录序列号),从而标识这些分段数据组成相同的数据集40,并且存储到数据存储文件Fl到F12中。继而,分发存储控制单元M在存储系统10的资源可用的任何时刻检查标识信息,从而能够检查组成相同数据集40的各分段数据是否被存储在相应数据存储文件Fl到F12内的相同存储位置中。由此,如果存储在相应数据存储文件Fl到F12内的相同存储位置中的各分段数据不是全部包括相同的标识信息(写记录序列号),则分发存储控制单元M纠正存储位置以使得各分段数据被存储在相同的存储位置中,并且重新存储该数据。在上文描述中,分发存储控制单元M将组成数据集40的各分段数据Dl到D12存储在类似于数据存储文件的相应逻辑存储区域内的相同位置中,但是,也可以将其存储在相应存储设备31内的物理上相同位置中。另外,存储位置管理单元25 (存储位置信息管理装置)生成并且管理内容地址Ck, 其表示如上所述存储在存储设备31中的分段数据Dl到D12的存储位置,即,将要通过分段数据Dl到D12恢复的块数据D的存储位置。特别地,存储位置管理单元25通过如下方式来生成内容地址CA 将基于所存储的块数据D的内容而计算的哈希值H的部分(短哈希) 与表示逻辑存储位置的信息进行组合。继而,存储位置管理单元25向存储系统10内的文件系统,也就是向加速器节点IOA返回该内容地址CA(图5中的箭头Y7)。加速器节点IOA 继而将标识信息(诸如备份目标数据的文件名)与内容地址CA相关,并且在文件系统中进行管理。另外,存储位置管理单元25将块数据D的内容地址CA与块数据D的哈希值H相关,并且相应的存储节点IOB在MFI文件中进行管理。由此,内容地址CA与指定文件的信息、哈希值H等相关,并且被存储到加速器节点IOA和存储节点IOB的存储设备30 (存储位置信息存储单元32)中。此外,存储位置管理单元25执行对取回如上所述而被存储的备份目标数据的控制。例如,当存储系统10接受指明特定文件的取回请求时(参考图6中的箭头Yll),基于文件系统,存储位置管理单元25首先指明内容地址CA,它包括作为与取回请求有关的文件所对应的哈希值的一部分的短哈希以及逻辑位置的信息(参考图6中的箭头YU)。继而,存储位置管理单元25检查内容地址CA是否在MFI文件中注册(参考图6中的箭头13)。 如果内容地址CA没有注册,则所请求的数据没有被存储,以使得存储位置管理单元25返回错误响应。另一方面,如果与取回请求相关的内容地址CA已被注册,则存储位置管理单元25 指定由内容地址CA所指明的存储位置,并且取回存储在所指定存储位置中的每个分段数据,作为请求要取回的数据(参考图6中的箭头Y14)。此时,如果已知存储各分段的数据存储文件Fl到F12以及分段数据之一在数据存储文件中的存储位置,则存储位置管理单元 25可以指定其他分段数据的存储位置,因为存储位置是相同的。继而,存储位置管理单元25根据响应于取回请求而取回的相应分段数据来恢复块数据D (参考图6中的箭头YM)。另外,存储位置管理单元25连接多个恢复的块数据D, 以恢复为类似于文件A的一组数据,并且将其返回给正在控制取回的加速器节点IOA(参考图6中的箭头Y16)。[操作]接下来,将参考图9的流程图来描述上述存储系统的操作。最初,将描述存储系统10经由备份系统11从预定备份目标设备12接受备份目标数据以及将备份目标数据存储到存储设备31中的操作(数据存储过程)。首先,存储系统10 ( S卩,加速器节点10A)将备份目标数据A划分为预定容量(例如,64KB)的块数据D(步骤Si)。基于该块数据D的数据内容,加速器节点IOA计算表示该数据内容的唯一哈希值H (内容标识信息)(步骤S2)。继而,检查该哈希值H是否在MFI文件中注册。此处,如果哈希值H被注册,则与MFI内的块数据D的哈希值H相关的内容地址CA 被返回给文件系统以作为该块数据D的存储位置。换言之,因为存储了与备份目标数据相同的数据,因此认为通过使用已被存储的相同数据而存储了备份目标数据。因此,在随后取回该备份目标数据时,文件系统取回由内容地址CA表示的存储位置的数据,并且从而可以取回相同的数据。另一方面,如果块数据D的哈希值未在MFI文件中被注册,即,如果与块数据D相同的数据未被存储在存储设备31中,则继而执行存储块数据D的过程。此时,首先,存储节点IOB基于如上所述计算的哈希值的部分来实际存储数据,并且存储节点IOB之一被确定为如下所述对块数据执行预先存储过程的写启动器(WI)。此后,如上所述被确定为WI的存储节点IOB压缩块数据D,并且随后将其划分为例如9个分段数据(步骤S; )。此外,被确定为WI的存储节点IOB向分段数据添加例如3个冗余数据,以使得即使在丢失某些划分数据的情况下也可以恢复块数据D。继而,被确定为 WI的存储节点IOB生成包括12个分段数据的数据集,该12个分段数据包括9个划分数据和3个冗余数据(步骤S4,数据集生成步骤)。随后,被确定为WI的存储节点IOB向各分段提供用以标识数据集的ID (步骤S5)。 换言之,被确定为WI的存储节点IOB向通过划分一个块数据D而生成并且组成数据集的所有分段数据提供相同的ID。继而,存储节点IOB检查要变成数据存储目的地的多个数据存储文件Fl到F12是否存在于存储节点IOB的存储设备31以及其他存储节点IOB的存储设备31内,并且将分段数据Dl到D12存储到相应的数据存储文件Fl到F12中(步骤S6,分发存储控制步骤)。此时,存储节点IOB将分段数据逐个存储到数据存储文件中。继而,在上述分发和存储时,存储节点IOB将组成一个数据集40的分段数据Dl到 D12存储到相应数据存储文件Fl到F12内的相同位置中。例如,如图7所示,存储节点IOB 将所有分段数据Dl到D12存储到相对于相应数据存储文件Fl到F12的开始而言相同的位置中。作为一个具体过程,存储节点IOB将组成一个数据集40的分段数据Dl到D12同时存储到相应数据存储文件Fl到F12中。此时,存储节点IOB将分段数据Dl到D12存储到与已经存储在相应数据存储文件Fl到F12中的数据相邻的空闲存储位置中,而没有在先设置相应数据存储文件Fl到F12中的存储位置(步骤S6)。例如,在图8中,数据已经存储在相应数据存储文件Fl到F12的网状部分中,并且存储节点IOB将各分段数据Dl到D12 存储在下一区域中以使得数据集40的位置相一致。继而,存储节点IOB将基于所存储的块数据D的内容而计算的哈希值H的部分(开始的8B)与表示逻辑存储位置的信息进行组合,从而生成表示存储设备31中所存储的分段数据Dl到D12的存储位置的内容地址CA。继而,加速器节点IOA将返回的内容地址CA与实际存储的备份目标数据的文件名等相关,并且在文件系统中进行管理。另外,存储节点IOB将所生成的块数据D的内容地址CA与块数据D的哈希值H相关,并且相应存储节点IOB在MFI文件中进行管理。如上所述,在新存储备份目标数据时, 管理哈希值H和内容地址CA的MFI文件被用于检查相同内容的数据是否已被存储。此处,在将各分段数据Dl到D12存储到相应数据存储文件Fl到F12中时,也即,在来自被确定为WI的存储节点IOB的分段数据向其他存储节点IOB的存储时,存储节点IOB 之间的通信可能减慢,或者说通信延迟可能增加。在这些情况下,存在这样的可能性,即组成一个数据集40的所有分段数据Dl到D12未被存储在相应数据存储文件Fl到F12内的相同位置中。假设这种情况,在任何时候,例如,当资源可用时,存储系统10参考已被存储的各分段数据Dl到D12中所包括的每个数据集的标识信息(写记录序列号)来执行重新存储过程,以使得组成一个数据集40的所有分段数据Dl到D12被存储在相应数据存储文件Fl到F12内的相同位置中。接下来,将描述存储系统10经由备份系统11接受取回数据的请求以及从存储设备31取回数据的操作(数据取回步骤)。当存储系统10接受取回请求时,加速器节点IOA首先指明内容地址CA,其由与取回请求有关的文件所对应的短哈希和逻辑位置信息。已经接受内容地址CA的存储节点IOB 继而检查内容地址CA是否在MFI文件中注册。如果内容地址CA未被注册,则所请求的数据未被存储,以使得存储节点IOB返回错误响应。另一方面,如果内容地址CA已被注册,则基于内容地址CA,存储节点IOB指定组成与取回请求相关的数据的各分段数据的存储位置。此时,如果已知存储各分段的数据存储文件Fl到F12以及分段数据之一在数据存储文件中的存储位置,则存储节点IOB可以指定其他分段数据的存储位置,因为存储位置是相同的。继而,存储节点IOB根据响应于取回请求而取回的各分段数据来恢复块数据D。此外,存储节点IOB连接多个恢复的块数据D以恢复为类似于文件A的一组数据,并且将其返回给控制取回的加速器节点10A。
即使存储节点IOB由于存储设备31的故障而无法取回组成一个数据集的12个分段数据的3个分段数据,如果已经添加了上述3个冗余数据,则存储节点IOB也可以恢复原始块数据。特别地,当12个分段数据存储在分离的存储设备31(盘)中时,可以最多同时处理3个存储设备31的故障。由此,在取回所存储的数据时,根据该示例性实施方式的存储系统10通过指定组成该数据的数据集的一个分段数据的存储位置,可以容易地指定其他分段数据的存储位置。因此,在取回数据时,无需指定组成数据集的所有分段的位置,并且可以快速取回数据。 因此,可以实现能够快速取回数据同时保持冗余度的高性能存储系统。<第二示例性实施方式>接下来,将参考图10到图17描述本发明的第二示例性实施方式。图10是示出存储系统的配置的功能框图。图11到图16是用于解释存储系统的操作的解释图。图17是示出存储系统的操作的流程图。[配置]如图10所示,该示例性实施方式的存储系统10采用与上述第一示例性实施方式几乎相同的配置。在该示例性实施方式中,存储系统10配备有流ID提供单元沈,其通过将程序安装到数据处理设备20中而被配置。据此,分发存储控制单元M等具有不同的配置。 下面,将主要描述与第一示例性实施方式不同的点。上述程序通过存储介质(诸如⑶-ROM) 提供给存储系统10,或者经由网络从另一服务器计算机提供给存储系统10。首先,在接受备份目标数据A的输入之后,流ID提供单元沈(标识信息提供装置) 提供流ID,流ID是区别备份目标数据(一组数据)的标识信息。例如,流ID提供单元沈向备份目标数据A提供流ID = ST1,并且向备份目标数据B (图中未示出)提供流ID = ST2。流ID可以是这样的信息,它不仅区别备份目标数据,而且还区别备份目标设备 12 (其是备份目标数据A的输出源)。换言之,流ID提供单元沈向通过预定规则收集的每个备份目标数据提供不同的流ID。另外,以与上述第一示例性实施方式类似的方式,块生成单元21将备份目标数据 A划分为预定容量(例如,64KB)的块数据D,并且基于该块数据D的数据内容计算哈希值 H。继而,在将备份目标数据A划分为块数据D时,块生成单元21同样将如上所述向备份目标数据A提供的流ID提供给各块数据D。如上所述,流ID提供单元沈不限于向备份目标数据A提供流ID。例如,当块生成单元21将备份目标数据A划分为块数据D时,流ID提供单元沈可以向每个块数据D提供区别备份目标数据A的相同流ID。由于重复检查单元22具有与上述第一示例性实施方式几乎相同的配置,所以省略其描述。此外,分段生成单元23生成包括12个分段数据片段的数据集40,该12个分段数据片段包括通过划分块数据D而获得的划分数据以及按照与上述相似的方式获得的冗余数据。分段生成单元23继而向生成的所有分段数据Dl到D12提供已经向块数据D提供的流ID (块数据D是原始分段数据),即,要根据分段数据Dl到D12而被恢复的块数据D。另外,如以上在示例性实施方式1中所描述的,基本上,分发存储控制单元M将组成一个数据集40的分段数据Dl到D12分别存储到形成于存储设备31中的数据存储文件 Fl到F12中的相同位置。
此处,如果在分段数据被如上所述地存储,则当同时进行针对备份目标数据的存储的多个请求时,存在这样的可能性,即,组成具有不同流ID(ST1、ST2和ST3)的各数据集的分段数据交替地存储在相应的数据存储文件Fl到F12中,如图11所示。在图11中,由相同的图案示出具有相同流ID的数据集。因此,在将各分段数据Dl到D12存储到相应的数据存储文件Fl到F12中之前,该示例性实施方式中的分发存储控制单元M —次将各分段数据Dl到D12存储到流ID不同的缓冲区存储器中。此后,分发存储控制单元对将缓冲区存储器内的分段数据Dl到D12 存储到相应的数据存储文件Fl到F12中。将参考图12到图16描述其具体示例。首先,分发存储控制单元M为数据存储文件Fl到F12中的每一个建立针对每个流ID的缓冲区存储器。例如,如果建立与3个流ID(ST1、ST2和ST3)相对应的缓冲区存储器BFl、BF2和BF3,则如图12所示,分发存储控制单元M为一个数据存储文件Fl建立3个缓冲区存储器BF1、BF2和BF3,并且建立12组缓冲区存储器。继而,分发存储控制单元M将分段数据Dl到D12分别存储到与分段数据Dl到D12 中所包含的流ID相对应的缓冲区存储器BF1、BF2或者BF3中。在图12所示的示例中,假设原始块数据D (备份目标数据A)的数据集40的流ID = STl。在这种情况下,分发存储控制单元M将组成数据集40的分段数据Dl到D12存储到与流ID = STl相对应的缓冲区存储器BFl中,该缓冲区存储器BFl是针对随后成为存储目的地的相应数据存储文件Fl到 F12而建立的。换言之,分发存储控制单元M将分段数据Dl存储到数据存储文件Fl的缓冲区存储器BFl中,将分段数据D2存储到数据存储文件F2的缓冲区存储器BFl中,以相似的方式,将分段数据存储到所有数据存储文件的缓冲区存储器中。此时,分发存储控制单元 24将各分段数据Dl到D12同时存储到相应缓冲区存储器BFl中的已存储数据的相邻空闲存储器区域中。因此,在相应的缓冲区存储器BFl到BF3内,具有对应流ID的分段数据被连续地定位和存储。此外,这时,组成相同数据集的各分段数据Dl到D12被存储在相应缓冲区存储器BF1、BF2或者BF3内的相同位置中。例如,如果分发存储控制单元M将数据集40的分段数据Dl和D2存储到相应的缓冲区存储器BFl中,如图12所示,则分段数据Dl和D2 被存储在最后的存储位置中,它们是缓冲区存储器BFl内的相同位置,如图13所示。通过这样利用流ID分发分段数据,并且将其存储到与流ID相对应的相应缓冲区存储器中,针对与所有数据存储文件Fl到F12相对应的特定流ID的所有缓冲区存储器容量在任何时候都变得相同。在图13的示例中,所有缓冲区存储器BFl的容量是相同的,并且针对每个相对应的流ID,所有缓冲区存储器BF2和BF3的容量也是相同的。继而,当缓冲区存储器BFl到BF3到达预定容量(例如,变得充满)时,分发存储控制单元M将缓冲区存储器BFl到BF3内的所有分段数据存储到数据存储文件Fl到F12 中。在图13的示例中,与流ID = STl相对应的所有缓冲区存储器BFl同时变满,因此,分发存储控制单元M将缓冲区存储器BFl内的分段数据同时存储到相应的数据存储文件Fl 到F12中。此时,分发存储控制单元M将分段数据Dl到D12分别存储到数据存储文件Fl 到F12中的已存储数据的相邻空闲存储位置。图14的示例示出了在相应数据存储文件Fl 到F12空闲的情况下,从相应数据存储文件Fl到F12的开始存储分段数据的方面。如图14所示,在相应数据存储文件Fl到F12中,组成相同数据集14的相应分段数据Dl到D12被存储,使得其存储位置相一致。此时,具有相同流ID的数据集被连续地存储。图15示出了与其他流ID(SD)相对应的缓冲区存储器BF2随后变满并且缓冲区存储器BF2内的分段数据被存储到数据存储文件Fl到F12中的方面。另外,该示例性实施方式中的分发存储控制单元M还具有对如上所述将要存储到数据存储文件中的分段数据以及已经存储的分段数据的存储位置执行事后改变的功能, 使得具有相同流ID的分段数据被连续定位。例如,当存储系统10的可用资源是预定值或更高时,分发存储控制单元M移动存储在相应数据存储文件Fl到F12中的分段数据的存储位置,使得具有相同流ID的分段数据被连续定位。特别地,分发存储控制单元M可以对由分段数据组成的整个数据集40执行如图11所示被存储在相应数据存储文件Fl到F12 中的相同存储位置(水平对准)中的所有分段数据的存储位置的改变。因此,分发存储控制单元M可以从具有不同流ID的数据集被交替地存储的状态(如图11所示)变为具有相同流ID(ST1、ST2、ST3)的数据集被连续存储的状态(如图16所示)。分发存储控制单元M的其他功能几乎与第一示例性实施方式中相同。在上文描述中,在划分块数据D以生成数据集40时,分段生成单元23向组成数据集40的各分段数据Dl到D12提供相同的流ID,但是并非必须向各分段数据Dl到D12提供。例如,通过将根据相应块数据D生成的、组成数据集40的分段数据Dl到D12存储到与提供给相应块数据D的流ID相对应的数据缓冲区BFl到BF3中,可以成功地通过流ID存储分段数据。由于组成相同数据集40的各分段数据Dl到D12被存储在缓冲区存储器BF1、 BF2.BF3和数据存储文件Fl到F12中的相同存储位置中,所以可以一起改变相同存储位置中的所有分段数据的存储位置,以改变数据集的存储位置。另外,如在上述第一示例性实施方式中,存储位置管理单元25通过内容地址CA管理数据的存储位置。将省略对其的描述。[操作]接下来,将参考图17的流程图描述上述存储系统的操作。此处,将描述存储系统10经由备份系统11从预定备份目标设备12接受备份目标数据以及将备份目标数据存储到存储设备31中的操作(数据存储过程)。将省略与上述示例性实施方式相似的操作的描述。首先,在接受备份目标数据A的输入之后,存储系统10(即加速器节点10A)提供流ID,流ID是将备份目标数据A区别为一组数据的标识信息(步骤S11,标识信息提供步
骤)ο继而,加速器节点IOA将备份目标数据A划分为预定容量(例如,64KB)的块数据 D (步骤SU)。基于该块数据D的数据内容,加速器节点IOA计算表示数据内容的唯一哈希值H(内容标识信息)。继而,检查该哈希值H是否在MFI文件中被注册。如果哈希值H已被注册,则将与MFI文件内的块数据D的哈希值H相关的内容地址CA返回至文件系统作为该块数据D的存储位置。另一方面,如果块数据D的哈希值未被注册在MFI文件中,则执行存储块数据D的过程。当如上所述将备份目标数据A划分为块数据D时,如上所述向备份目标数据A提供的流ID也被提供给相应的块数据D。随后,在压缩块数据D之后,存储节点IOB例如划分9个分段数据(步骤S14),并且例如向分段数据添加3个冗余数据。继而,存储节点IOB生成包括12个分段数据片段的数据集,该12个分段数据片段包括9个划分数据和3个冗余数据(步骤S15,数据集生成步骤)。随后,存储节点IOB向各分段提供用以标识数据集的ID(步骤S16)。继而,存储节点IOB为数据存储文件Fl到F12中的每一个建立针对每个流ID的缓冲区存储器。继而,存储节点IOB将各分段数据Dl到D12存储到与分段数据Dl到D12 中所包含的流ID相对应的缓冲区存储器BF1、BF2、BF3中(步骤S17)。此时,存储节点IOB 将各分段数据Dl到D12整体同时存储到相应缓冲区存储器BFl到BF3中的已存储数据的相邻空闲存储区域中。因此,在相应的缓冲区存储器BF1、BF2和BF3内,具有对应流ID的分段数据被连续地定位和存储。此外,这时,组成相同数据集的各分段数据Dl到D12被存储在缓冲区存储器BF1、BF2、BF3内的相同存储位置中。此后,在缓冲区存储器BF1、BF2、BF3到达预定容量例如变满时(步骤S18处为 “是”),存储节点IOB将缓冲区存储器BF1、BF2、BF3内的分段数据存储到数据存储文件Fl 到F12中(步骤S19,分发存储控制步骤)。此时,存储节点IOB将分段数据Dl到D12分别存储到相应数据存储文件Fl到F12中的已存储数据的相邻空闲存储位置中。将分段数据从缓冲区存储器存储到数据存储文件时并不一定限于上述时刻。例如,上述步骤可以在从特定参考时间经过设置时间段之后的时刻执行。由此,存储节点IOB可以将组成一个数据集40的所有分段数据Dl到D12存储在相应数据存储文件Fl到F12中的相同位置中。因此,具有相同流ID的数据被连续地存储在相应数据存储文件Fl到F12中。继而,存储节点IOB将基于所存储的块数据D的内容而计算的哈希值H的部分(开始8B)与表示逻辑存储位置的信息组合,从而生成内容地址CA,其表示存储在存储设备31 中的分段数据Dl到D12的存储位置。继而,存储节点IOB向加速器节点IOA返回该内容地址CA。继而,加速器节点IOA将返回的内容地址CA与实际存储的备份目标数据的文件名等进行相关,并且在文件系统中进行管理。另外,存储节点IOB将所生成的块数据D的内容地址CA与块数据D的哈希值H进行相关,并且在MFI文件中进行管理。如上所述,管理哈希值H和内容地址CA的MFI文件用于在新存储备份目标数据时,检查相同内容的数据是否已被存储。此后,在任何时候,例如当存储系统10的可用资源是预定的或者更多时(步骤S20 处为“是”),对已经存储的分段数据执行存储位置的事后改变的过程,使得具有相同流ID 的分段数据被连续地定位(步骤S21)。在该过程中,检查各存储文件Fl到F12的相同存储位置中存储的各分段数据内的流ID,并且改变分段数据的存储位置以使得具有相同流ID 的更多分段数据的存储位置(即,更多数据集的存储位置)变得连续。由此,根据该示例性实施方式的存储系统10,在取回所存储的数据时,通过指定组成该数据的数据集的一个分段数据的存储位置,就可以容易地指定其他分段数据的存储位置。此外,由于组成一组数据的多个存储目标数据被连续存储,所以相关内容的数据被一起存储。因此,当取回存储在存储系统中的数据时,可以一起取回相关数据。因此,可以增加数据取回的速度和效率,并且可以增加存储系统的性能。〈第三示例性实施方式〉
将参考图18描述本发明的第三示例性实施方式。图18是示出存储系统的配置的功能框图。在该示例性实施方式中,将示意性地描述存储系统。如图18所示,该示例性实施方式的存储系统1配备有多个存储装置5和数据处理装置2,该数据处理装置2配置用于将数据存储到多个存储装置5中以及取回存储在存储装置5中的数据。数据处理装置2还包括数据集生成装置3,配置用于通过将目标数据划分为多个片段来生成划分数据,并且还生成用以恢复存储目标数据的冗余数据,从而生成由多个分段数据组成的数据集,该多个分段数据是划分数据和冗余数据;以及分发存储控制装置4, 配置用于将分段数据分发并且存储到相应存储装置中。另外,分发存储控制装置4配置用于将组成数据集的分段数据分别存储到形成于相应存储装置中的存储区域内的相同位置中。另外,分发存储控制装置配置用于将组成数据集的分段数据分别存储到相对于相应存储装置中生成的文件的数据存储区域的开始而言相同的位置中。根据上文描述的发明,首先,存储系统响应于来自主机的数据存储请求而接受存储目标数据。继而,存储系统将存储目标数据划分为多个划分数据,并且还生成用以恢复该存储目标数据的冗余数据,以及生成包括多个分段数据的数据集,该分段数据是划分数据和冗余数据。随后,存储系统将组成一个数据集的分段数据分发和存储到相应的存储装置中。此时,存储系统将组成一个数据集的分段数据存储在形成于相应存储装置中的存储区域内的相同位置中,例如存储在从相应文件的数据存储区域的开始的相同位置中。由此,在取回所存储的数据时,存储系统指定组成数据的数据集的一个分段数据的存储位置,从而能够容易地指定其他分段数据的存储位置。因此,在取回数据时,不需要指定组成数据集的所有分段的位置,并且可以快速取回数据。因此,可以实现能够快速取回数据同时保持冗余度的高性能存储系统。另外,在存储系统中,分发存储控制装置配置用于将组成数据集的分段数据存储在相应存储装置中生成的文件中的已存储数据的相邻空闲存储位置中。另外,在存储系统中,分发存储控制装置配置用于将组成数据集的分段数据同时存储到相应存储装置中。如上所述,分发存储控制装置将分段数据存储到相应存储装置中,从而可能通过简单的过程将组成数据集的分段数据分别存储在相同位置中。因此,还可能提高数据存储过程的速度。另外,在存储系统中,分发存储控制装置配置用于向组成数据集的相应分段数据提供用以标识该数据集的相同标识信息,并且将组成该数据集的分段数据存储到相应存储装置中。另外,在存储系统中,分发存储控制单元配置用于基于向相应分段数据提供的标识信息来检查组成数据集的分段数据是否被分别存储在形成于相应存储装置中的存储区域内的相同位置中,并且在分段数据未被存储在相应存储区域内的相同位置中的情况下, 改变分段数据的存储位置以使得组成数据集的分段数据分别被存储在相应存储区域内的相同位置中。由此,组成数据集的各分段数据具有相同的标识信息,并且被存储在多个存储装置中。因此,通过检查向已经存储的分段数据提供的标识信息,可以确定组成一个数据集的各分段数据是否被存储在相应存储装置的相同位置中。继而,基于相应分段数据中所包含的标识信息,可以改变存储在相应存储装置中的分段数据的存储位置。因此,如上所述,可能将组成一个数据集的分段数据分别存储在形成于相应存储装置中的存储区域内的相同位置中,并且可以快速取回数据。另外,在存储系统中数据处理装置包括存储位置信息管理装置,配置用于生成并且管理存储位置信息,其表示由分发存储控制装置存储到相应存储装置中的存储目标数据的存储位置;以及存储位置信息管理装置,配置用于基于请求取回数据时指定的数据的存储位置信息,取回由存储位置信息指定的、相应存储装置内的存储位置中所存储的数据。另外,在存储系统中数据处理装置包括重复检查装置,配置用于生成对存储目标数据的内容而言唯一的内容标识信息,并且与对已经存储在相应存储装置中的存储目标数据的内容而言唯一的内容标识信息进行比较,从而检查具有相同内容的存储目标数据是否已被存储在相应存储装置中;并且该重复检查装置配置用于在具有与存储目标数据相同内容的数据已被存储在相应存储装置中的情况下,使用具有相同内容的数据的存储位置信息作为存储目标数据的存储位置信息,而不将存储目标数据存储到相应存储装置中。由此,可以将上述配置应用于内容地址存储系统,该内容地址存储系统基于存储目标数据的内容来指定表示数据存储位置的存储位置信息。因此,可以防止具有与已存储数据相同内容的存储目标数据的重复存储,可以减少数据存储的使用量,并且可以降低系统的成本。另外,在存储系统中,数据处理装置配备有标志信息提供装置,其配置用于向数据组提供区别请求要存储的数据组的标识信息。继而,分发存储控制装置还配置用于将组成与具有相同标识信息的数据组中所包括的多个存储目标数据相对应的多个数据集中每个数据集的分段数据存储到相应存储区域中,以使得相应存储区域内的存储位置变得连续。因此,由于组成数据组的多个存储目标数据被连续存储在存储装置中,所有具有相关内容的数据被一起存储。因此,当取回所存储的数据时,存储系统可以一起取回相关数据。所以,可以增加数据取回的速度和效率,并且可以提高存储系统的性能。另外,在存储系统中,分发存储控制装置配置用于在组成与具有相同标识信息的数据组中所包括的多个存储目标数据相对应的多个数据集中每个数据集的分段数据被存储到存储装置中之前对其进行存储,使得缓冲区存储器内的存储位置变得连续,并且将存储在缓冲区存储器中的分段数据存储到相应存储装置中。另外,在存储系统中,分发存储控制装置配置用于将组成与具有相同标识信息的数据组中所包括的多个存储目标数据相对应的多个数据集中每个数据集的分段数据存储到缓冲区存储器中,该缓冲区存储器的标识信息不同,并且将存储在针对每个标识信息建立的相应缓冲区存储器中的分段数据存储到相应存储装置中。另外,在存储系统中,分发存储控制装置配置用于在缓冲区存储器到达预定容量时,将存储在缓冲区存储器中的分段数据存储到相应存储装置中。由此,存储系统一次将一组数据存储到缓冲区存储器中以使其是连续的,并且之后存储到存储装置中。因此,将具有相关内容的数据一起存储的过程变得容易,并且可以提高存储系统的性能。另外,在存储系统中,分发存储控制装置配置用于将组成与具有相同标识信息的数据组中包括的多个存储目标数据相对应的多个数据集中的每个数据集的分段数据(该分段数据已经存储在相应存储装置中)重新存储到相应存储区域中,以使得相应存储区域内的存储位置变得连续。由此,存储系统还重新存储已经存储在存储装置中的数据,以使得组成数据组的存储目标数据变得连续。因此,可以提高此后数据取回的速度和效率。另外,在存储系统中,数据集生成装置配置用于将由标识信息提供装置提供给数据组的标识信息包括在组成与数据组中所包括的多个存储目标数据相对应的数据集中的每个数据集的相应分段数据中。由此,可以容易理解,存储在相应存储区域中的分段数据属于什么数据组。因此, 基于包括在相应分段数据中的标识信息,可以容易地执行连续地存储包括在数据组中的存储目标数据的过程。另外,可以通过将计算机程序植入到信息处理设备(系统)中来实现存储系统。特别地,本发明的另一实施方式的计算机程序是包括以下指令的计算机程序,该指令用于使得配备有多个存储装置的信息处理设备实现数据处理装置,该数据处理装置配置用于将数据存储到多个存储装置中并且取回存储在存储装置中的数据。继而,数据处理装置包括数据集生成装置,配置用于通过将存储目标数据划分为多个片段来生成划分数据,并且还生成用以恢复该存储目标数据的冗余数据,从而生成由多个分段数据组成的数据集,该分段数据是划分数据和冗余数据;以及分发存储控制装置, 配置用于将分段数据分发和存储到相应存储装置中。另外,分发存储控制装置配置用于将组成数据集的分段数据分别存储到形成于相应存储装置中的存储区域内的相同位置中。另外,在计算机程序中,分发存储控制装置配置用于将组成数据集的分段数据分别存储在与在相应存储装置中生成的文件的数据存储区域的开始相关的相同位置中。另外,在由存储系统的操作执行的本发明的另一示例性实施方式的数据处理方法中,配备有多个存储装置的信息处理设备将数据存储到多个存储装置中以及取回存储在存储装置中的数据。继而,在将数据存储到多个存储装置中时,信息处理设备通过将存储目标数据划分为多个片段来生成划分数据,并且还生成用以恢复存储目标数据的冗余数据,从而生成由多个分段数据组成的数据集,该分段数据是划分数据和冗余数据;以及将分段数据分发和存储到相应存储装置中。另外,在将分段数据存储到相应存储装置中时,信息处理设备将组成数据集的分段数据分别存储到形成于相应存储装置中的存储区域内的相同位置中。另外,数据处理方法包括在将分段数据存储到相应存储装置中时,将组成数据集的分段数据分别存储在与在相应存储装置中生成的文件的数据存储区域的开始相关的相同位置中。具有上述配置的计算机程序和数据处理方法的发明具有与上述存储系统相似的动作,因此可以实现上述发明的目的。
虽然參考上述相应示例性实施方式描述了本发明,但是本发明不限于上述示例性 实施方式。本领域技术人员可以理解,在本发明的范围内,可以按照各种方式替换本发明的 配置和细节。本发明基于并且要求于2009年1月27日提交的日本专利申请号2009-015261的 优先权的权益,在此通过引用将其公开内容整体并入。实用性本发明可以用于通过连接多个计算机而配置的存储系统,并且具有实用性。附图标记的描述1 存储系统2 数据处理装置3 标识信息提供装置4 数据集生成装置5 分发存储控制装置6 存储装置10存储系统IOA加速器节点IOB存储节点11备份系统12备份目标设备20数据处理设备21 块生成単元22重复检查单元23分段生成単元24分发存储控制单元25存储位置管理単元26流ID提供単元30数据存储设备31存储设备32存储位置存储单元40数据集41划分数据42冗余数据A备份目标数据BF1、BF2、BF3 缓冲区存储器CA内容地址D块数据Dl到D12分段数据Fl到F12数据存储文件H哈希值
权利要求
1.一种存储系统,包括多个存储装置和数据处理装置,所述数据处理装置配置用于将数据存储到所述多个存储装置中以及取回存储在所述存储装置中的数据,其中所述数据处理装置包括数据集生成装置,配置用于通过将存储目标数据划分为多个片段来生成划分数据,并且还生成用以恢复所述存储目标数据的冗余数据,从而生成由多个分段数据组成的数据集,所述多个分段数据是所述划分数据和所述冗余数据;以及分发存储控制装置,配置用于将所述分段数据分发和存储到相应存储装置中;以及所述分发存储控制装置配置用于将组成所述数据集的所述分段数据分别存储到形成于所述相应存储装置中的存储区域内的相同位置中。
2.根据权利要求1所述的存储系统,其中所述分发存储控制装置配置用于将组成所述数据集的所述分段数据分别存储在相对于所述相应存储装置中生成的文件的数据存储区域的开始而言相同的位置中。
3.根据权利要求1或者2所述的存储系统,其中所述分发存储控制装置配置用于将组成所述数据集的所述分段数据存储在所述相应存储装置中生成的文件中的已存储数据的相邻空闲存储位置中。
4.根据权利要求1到3任一项所述的存储系统,其中所述分发存储控制装置配置用于将组成所述数据集的所述分段数据同时存储到所述相应存储装置中。
5.根据权利要求1到4任一项所述的存储系统,其中所述分发存储控制装置配置用于向组成所述数据集的各分段数据提供用以标识所述数据集的相同标识信息,以及将组成所述数据集的所述分段数据存储到所述相应存储装置中。
6.根据权利要求5所述的存储系统,其中所述分发存储控制装置配置用于基于向所述各分段数据提供的所述标识信息来检查组成所述数据集的所述分段数据是否被分别存储在形成于所述相应存储装置中的存储区域内的相同位置中,并且在所述分段数据未被存储在所述相应存储区域内的相同位置中的情况下改变所述分段数据的存储位置,使得组成所述数据集的所述分段数据被分别存储在所述相应存储区域内的相同位置中。
7.根据权利要求1到6任一项所述的存储系统,其中所述数据处理装置包括存储位置信息管理装置,配置用于生成和管理存储位置信息, 所述存储位置信息表示由所述分发存储控制装置存储到所述相应存储装置中的所述存储目标数据的存储位置;以及所述存储位置信息管理装置配置用于基于请求取回数据时所指定的数据的存储位置信息,取回存储在由所述存储位置信息表示的、相应存储装置内的存储位置中的数据。
8.根据权利要求7所述的存储系统,其中所述数据处理装置包括重复检查装置,配置用于生成对所述存储目标数据的内容而言唯一的内容标识信息,以及与对所述相应存储装置中已存储的存储目标数据的内容而言唯一的内容标识信息进行比较,从而检查具有相同内容的目标存储数据是否已被存储在所述相应存储装置中;以及所述重复检查装置配置用于在具有与所述存储目标数据相同内容的数据已被存储在所述相应存储装置中的情况下,使用具有相同内容的所述数据的存储位置信息作为所述存储目标数据的存储位置信息,而不将所述存储目标数据存储到所述相应存储装置中。
9.一种包括指令的计算机程序,所述指令使得配备有多个存储装置的信息处理设备实现数据处理装置,所述数据处理装置配置用于将数据存储到所述多个存储装置中,以及取回存储在所述存储装置中的数据,其中所述数据处理装置包括数据集生成装置,配置用于通过将存储目标数据划分为多个片段来生成划分数据,并且还生成用以恢复所述存储目标数据的冗余数据,从而生成由多个分段数据组成的数据集,所述多个分段数据是所述划分数据和所述冗余数据;以及分发存储控制装置,配置用于将所述分段数据分发和存储到相应存储装置中;以及所述分发存储控制装置配置用于将组成所述数据集的所述分段数据分别存储到形成于所述相应存储装置中的存储区域内的相同位置中。
10.根据权利要求9所述的计算机程序,其中所述分发存储控制装置配置用于将组成所述数据集的所述分段数据分别存储在相对于所述相应存储装置中生成的文件的数据存储区域的开始而言相同的位置中。
11.一种数据处理方法,包括由配备有多个存储装置的信息处理设备执行将数据存储到所述多个存储装置中,以及取回存储在所述存储装置中的数据;以及在将数据存储到所述多个存储装置中时通过将存储目标数据划分为多个片段来生成划分数据,并且还生成用以恢复所述存储目标数据的冗余数据,从而生成由多个分段数据组成的数据集,所述多个分段数据是所述划分数据和所述冗余数据;以及将所述分段数据分发和存储到相应存储装置中;以及在将所述分段数据存储到所述相应存储装置中时,将组成所述数据集的所述分段数据分别存储到形成于所述相应存储装置中的存储区域内的相同位置中。
12.根据权利要求11所述的数据处理方法,包括在将所述分段数据存储到所述相应存储装置中时,将组成所述数据集的所述分段数据分别存储到相对于所述相应存储装置中生成的文件的数据存储区域的开始而言相同的位置中。
全文摘要
一种存储系统,具有多个存储装置和数据处理装置,该数据处理装置用于将数据存储到多个存储装置中,以及读取存储在存储装置中的数据。数据处理装置具有数据集生成装置,用于通过将要存储的数据划分为多个数据而生成划分数据,以及生成用于重构要存储的数据的冗余数据,并且生成由多个分段数据组成的数据集,分段数据是划分数据和冗余数据;以及分发存储控制装置,用于分发各分段数据并且将各分段数据存储到相应存储装置中。分发存储控制装置将组成数据集的各分段数据存储到形成于相应存储装置中的相应存储区域的相同位置中。
文档编号G06F3/06GK102282545SQ20098015499
公开日2011年12月14日 申请日期2009年8月20日 优先权日2009年1月27日
发明者田岛由理 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1