使用对象多个维度的信息存储对象的制作方法_4

文档序号:9422739阅读:来源:国知局
性(包括但不限于访问特性)的两个或更多个不同类型的存储设备。例如,一些存储设备可为具有相对快的访问时间(和可能相对高的功率要求)的相对昂贵的存储设备,如闪存技术或固态驱动器(SSD)技术设备,而其他存储设备可为具有相对慢的访问时间(和可能相对低的功率要求)的较便宜的设备,如商品硬盘驱动器(HDD)技术设备。
[0058]在至少一些实施方案中,服务提供者可因此在数据中心420内实现具有不同成本和特性的存储设备的两个或更多个层,并且存储服务可利用本文所述的存储管理方法(例如,实现为存储应用程序402内的存储管理模块406)来跨这些层分配客户的数据对象。例如,如图3中所示,存储服务可使用固态驱动器(SSD)技术设备作为顶层存储解决方案410,并使用商品硬盘驱动器(HDD)技术设备作为中间层存储解决方案412。应注意,其他技术设备可被用于实现数据中心420中的一个或多个另外中间层412。
[0059]服务提供者400还可实现可被用于存储系统中的底层或档案存储装置的一个或多个存储设施430。应注意,存储设施430可邻近或靠近420设施或甚至在数据中心420设施内,或可在地理上远离任何数据中心420。存储设施430可本质上为用于存储永久性但离线的存储介质如磁带或光盘的仓库,并且可因此具有低功率要求和低或极低量的气候控制。在至少一些实施方案中,一个或多个存储设施430可被视为用于存储至可移除、永久性存介储质如磁带或光盘的数据对象的冷档案存储装置。将数据对象移动至存储设施430和从其检索数据的成本可能因此而非常高,而将数据存储在存储设施430中的每单元成本可能非常低。
[0060]存储服务可利用本文所述的存储管理方法来检测可归档的数据对象并且引导将所检测的数据对象从数据中心420中的顶层和/或中间层移动至一个或多个存储设施430。例如,存储管理方法可被用于收集并分析关于存储在数据中心420中的顶层410和/或中间层412中的数据对象的信息,并且根据信息的一个或多个维度,如年限、访问频率、类型和对象间关系,确定可归档并且因此可移动至存储设施430中的档案存储装置的数据对象的一个或多个分组。随后可将数据对象的一个或多个分组从层中的存储设备移动或复制到可移动的、永久性存储介质如磁带或光盘,并且存储介质可随后被运送至一个或多个存储设施430并存储在其中。可替代地,数据对象的一个或多个分组可被电子传输至存储设施430 (例如,通过高速网络连接)并且写入存储设施430处的存储介质。
[0061]存储服务还可利用本文所述的存储管理方法检测有待从一个或多个存储设施430检索的数据对象,并且引导将所检测的数据对象从一个或多个存储设施430移动或复制到数据中心420中的顶层410或中间层412。例如,存储管理方法可被用于收集并分析关于存储在存储设施430中的数据对象的信息,并且根据信息的一个或多个维度,如对象间关系和用户访问模式,确定可从存储设施430中的档案存储装置检索并且移动或复制到数据中心420中的顶层410或中间层412以便更容易访问的数据对象的一个或多个分组。包括数据对象的一个或多个分组的存储介质随后可从存储设施430被检索,并且用于将数据对象的分组移动或复制到数据中心420中的一个或多个存储层。在一些实施方案中,可将数据对象的分组复制到存储介质,并包括副本的存储介质可被运送至数据中心420,在数据中心420中,存储介质可被用于在数据中心中的一个或多个存储层上创建数据对象的分组的副本。可替代地,数据对象的一个或多个分组可从存储设施430电子传输至数据中心420 (例如,通过高速网络连接)。
[0062]在一些实施方案中,替代将数据对象的分组从存储设施430中的存储介质移动至数据中心420中的存储层(例如,顶层410),并且然后在数据对象不再被访问时将数据对象移回至存储设施430,可创建数据对象的副本并且将其移动至数据中心420,而包括数据对象的原始存储介质可留在存储设施430中。当数据中心420中的数据对象的副本不再被访问时,可简单地将副本从数据中心420中的存储设备删除(或标记以用于进行垃圾收集)。
[0063]图3和图4示出数据存储系统,其中存储管理方法被用于引导跨根据访问特性和/或存储成本分层布置的两个或更多个存储层储存数据对象。然而,存储管理方法还可被应用在包括具有不同特性的多个不同存储解决方案的存储系统中,以根据对关于数据对象的多个维度的信息的分析、例如根据群集分析技术,引导将所确定的数据对象的分组存储至可能最适合所述分组的特定存储解决方案。参见图2B获得对多个维度进行群集分析以确定数据对象的群集或分组的实例。随后可检查分组的特性并将其与存储系统中的各个存储解决方案的特性进行比较,以将分组匹配至特定存储解决方案。随后可将数据对象的分组存储或移动至所确定的存储解决方案。
[0064]图5是根据至少一些实施方案的使用群集分析技术来将数据对象的分组匹配至存储解决方案的多维度存储管理方法的高级流程图。如500处所示,可确定数据存储系统中的多个存储解决方案的特性和容量。如502处所示,存储管理方法获取关于数据存储系统中的数据对象的信息。例如,存储管理方法可从存储在由存储应用软件维持的存储系统中的数据对象的元数据中收集信息。数据对象可为已经存储在存储系统中的数据对象或有待存储在存储系统中的新数据对象。如504处所示,群集分析技术应用于所获取的信息,以根据多个维度的信息确定数据对象的分组。如506处所示,所确定的分组可根据存储解决方案的特性和容量被匹配至特定存储解决方案。如在508处所示,存储管理方法可根据所确定的存储解决方案引导存储分组中的对象。一旦获取关于存储系统中的一个或多个数据对象的新信息,存储管理方法可根据包括新信息的分析引导将数据对象从一个存储解决方案移动到另一个存储解决方案。
[0065]图6是示出根据至少一些实施方案的示例性存储系统的逻辑视图的框图,在示例性存储系统中,存储管理方法的实施方案可被用于确定数据对象的群集并且在多个存储解决方案之中分配数据对象。存储系统可包括存储应用程序600,存储应用程序600可将存储管理方法的实施方案实现为存储管理模块602或实现在其中。存储应用程序600还可维持存储在存储系统中的数据对象的大量元数据。存储应用程序600可被实现在一个或多个计算设备上。图8中示出在其上可实现存储应用程序600的示例性计算设备。
[0066]存储系统可包括各自具有不同特性和容量的多个不同存储解决方案。这个实例示出七个不同存储解决方案610、612、614、620、622、624和630,并且不意在进行限制。存储解决方案610、612、614可为具有相对快速的访问时间的相对昂贵的存储解决方案,如闪存技术、固态驱动器(SSD)技术设备和高速磁盘技术设备。存储解决方案620、622、624可为具有较慢的访问时间的较便宜的存储解决方案,如商品硬盘驱动器(HDD)技术设备和光盘技术设备。存储解决方案630可为最便宜的存储解决方案,从其访问数据可能较为昂贵但其可提供最低的每存储单元成本。存储解决方案630可例如涉及将数据对象存储至磁带、光盘或其他可移动永久性存储介质,以及将介质运送至具有低功率要求和低或极低水平气候控制的设施并将介质存储在其中。
[0067]存储解决方案610、612、614、620、622和624中所使用的各个设备可在一个或多个特性和容量上不同,如成本(例如,每存储单元)、功耗、容量、吞吐量、访问速度和环境要求。设备的其他特性也可不同,如可靠性度量或统计量(例如,故障率或平均故障间隔时间(MTBF))ο
[0068]存储应用程序600可从一个或多个客户660接收有待存储在存储系统中的新数据对象。存储应用程序600还可从客户660接收访问所存储数据对象的请求。此外,存储应用程序600可在内部产生存储在存储系统中的客户数据的一些数据对象,例如备份、副本或冗余数据对象。
[0069]在一些实施方案中,客户660可针对正存储至存储系统的特定新数据对象或新数据对象的分组,或可替代地针对预先存至存储系统的数据对象,提供存储指令。存储指令可例如引导存储应用程序600将数据对象存储至特定存储解决方案或存储层。来自客户660的存储指令可因此覆盖来自存储管理模块602的决策,或可替代地,可被输入至存储管理模块602作为在为相应数据对象做出存储决策时可考虑的附加信息。
[0070]存储管理模块602可收集存储系统中的或正在进入存储系统的数据对象的信息,并且基于对从所收集到的信息所确定的多个维度(例如,对象年限、访问频率、对象类型、对象关系、对象元数据、用户访问模式等)的分析确定数据对象的分组。在至少一些实施方案中,可使用群集分析技术来确定数据对象的群集或分组,并且将所述群集匹配至特定存储解决方案。因此可检查数据对象的分组的特性或要求并且将其与各个存储解决方案的特性和容量进行比较,以将所述分组匹配至特定存储解决方案。这通过存储管理模块602产生存储决策,存储决策可引导存储应用程序600和/或存储解决方案中的一个或多个将一个或多个数据对象存储、移动或复制到已被确定用于所述数据对象所属的分组的存储解决方案。
[0071]在一些实施方案中,由客户660存储至存储系统的新数据对象可至少首先存储至默认存储解决方案,例如至存储解决方案610、612和614中的一个。可替代地,新对象可基于对关于对象的信息的分析而存储至存储解决方案中的任何一个。存储管理模块602可收集关于新数据对象的至少一些信息并且基于对信息的两个或更多个维度(应注意,对象年限、即可能被考虑的一个维度为“新”)的分析(例如,群集分析)为新数据对象确定存储解决方案。
[0072]在至少一些实施方案中,存储管理模块602可收集预先存储至各个存储解决方案中的一个或多个的数据对象的信息,并且基于对信息的两个或更多个维度的分析(例如,群集分析)决定是否将数据对象移动至另一个存储解决方案。存储管理模块602可产生存储决策,存储决策可引导存储应用程序600和/或存储解决方案中的一个或多个将一个或多个数据对象存储、移动或复制到已根据分析为数据对象所属的分组确定的存储解决方案。
[0073]在图6中,从存储应用程序600到数个存储解决方案的粗箭头表示在存储管理模块602的引导下将新数据对象存储至存储解决方案的实例。从数个存储解决方案到存储应用程序600的粗箭头表示从存储解决方案中检索数据对象以满足客户访问请求。应注意,在至少一些情况下,数据对象可从一个存储解决方案被提取并且在将数据对象提供给请求客户660之前放置于另一个存储解决方案上。例如,数据对
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1