使用对象多个维度的信息存储对象的制作方法_3

文档序号:9422739阅读:来源:国知局
例如,在一些实施方案中,存储管理模块302可检查客户360正在存储至存储系统的数据对象的类型,并且至少部分地基于对象类型决定应将数据对象存储至哪个存储层。例如,如果确定数据对象为来自客户360的备份数据,那么存储管理模块302可确定数据对象不太可能被访问并且因此将有待存储的数据对象引导至底层314或可替代地至中间层312,而不是至顶层310。作为另一个实例,如果确定数据对象为来自客户360的审计数据(例如,正在归档的电子邮件消息),那么存储管理模块302可确定数据对象不太可能被访问,并且因此将有待存储的数据对象引导至底层314或可替代地至中间层312,而不是至顶层310。在至少一些实施方案中,如果所收集的新数据对象的信息不足以做出存储决策(例如,如果对象类型未知),那么新数据对象可默认为初始地存储至顶层310。
[0042]在一些实施方案中,客户360可针对正存储至存储系统的特定新数据对象或新数据对象的分组,或可替代地针对预先存至存储系统的数据对象,提供存储指令。存储指令可例如引导存储应用程序300将数据对象存储至特定存储解决方案或存储层。来自客户360的存储指令可因此覆盖来自存储管理模块302的决策,或可替代地,可被输入至存储管理模块302作为在为相应数据对象做出存储决策时可考虑的附加信息。
[0043]在至少一些实施方案中,存储管理模块302可定期地或不定期地收集存储在一个或多个存储层中的数据对象350的信息,并且基于信息的一个或多个维度为数据对象350做出存储决策。存储管理模块302还可响应于从客户360接收的访问请求为特定数据对象350做出存储决策。下面给出可为存储在存储系统中的数据对象350做出的存储决策的几个实例。应注意,这些实例并非意在是排他性的或限制性的。
[0044]在至少一些实施方案中,存储管理模块302可收集顶层310中的数据对象350A的信息,并且基于多个维度的信息,例如数据对象350A的年限和访问频率,决定是否将数据对象350A移动至中间层312或至底层314。例如,在至少一些实施方案中,如果数据对象350A比年限阀值老并且从未被访问,那么存储管理模块302可决定将数据对象350A移动至底层314。如果数据对象比年限阀值新但从未被访问,那么存储管理模块302可决定将数据对象350A移动至第一中间层312。如果数据对象比年限阀值老但从已被访问,那么存储管理模块302可决定将数据对象350A移动至第二中间层312。仍然新并且已被访问的数据对象350A可留在顶层310上。
[0045]在至少一些实施方案中,在做这些决策时,存储管理模块302可考虑除了对象年限和访问频率外的信息的其他维度。例如,在一些实施方案中,可考虑一组数据对象350A之间的关系。作为实例,存储管理模块302可确定很少被访问的一组数据对象350A可能趋向于一起被访问,并且因此如果组中的数据对象350A中的一个或多个最近被访问,那么存储管理模块302可决定将组中的所有数据对象350A留在顶层310上。作为另一个实例,存储管理模块302在做出决策时可考虑对象类型。例如,在顶层310上发现的已知为不太可能被访问的某些类型(例如,备份或审计数据)的数据对象350A可不管年限和访问频率被下移至较低层,并且已知为更有可能被访问的其他类型(例如,数据库对象)的数据对象350A可不管年限或访问频率被留在顶层310上。
[0046]在至少一些实施方案中,存储管理模块302可获取或收集中间层312中的数据对象350B的信息,并且基于多个维度的信息,决定是否将数据对象350B移动至顶层310、至另一个中间层312或至底层314。在至少一些实施方案中,可考虑至少数据对象350B的年限和访问频率。例如,如果确定数据对象350B比年限阀值老(所述阀值可能但并非必须与用于顶层310的年限阀值不同)并且尚未被访问,那么存储管理模块302可决定将数据对象350B下移至较低的中间层312或至底层314。作为另一个实例,如果存储管理模块302确定数据对象350B最近被访问,那么存储管理模块302可决定将数据对象350B上移至更高的中间层312或至顶层310。应注意,接收对中间层312上的数据对象350B的访问请求可导致数据对象350B被移动至更高层(例如,至更高的中间层312或至顶层310)。
[0047]在至少一些实施方案中,存储管理模块302在为中间层上的数据对象350B做出这些决策时可考虑除对象年限和访问频率外的其他维度,例如对象类型和对象关系,例如如以上参考顶层310上的数据对象350A所描述的。作为实例,存储管理模块302可确定很少被访问的一组数据对象350B可能趋向于一起被访问,并且因此如果组中的数据对象350B中的一个或多个最近被访问,那么存储管理模块302可决定将组中的所有数据对象350B移动至顶层310。
[0048]在至少一些实施方案中,存储管理模块302可追踪和/或挖掘存储系统中的数据对象350的访问信息,并且基于一个或多个访问判据(访问数据/时间、用户标识等)分析访问信息,以基于各种访问模式或其组合确定数据对象的一个或多个分组。在至少一些实施方案中,可随时间追踪数据对象的访问信息,并且所追踪的访问信息可被用于提供存储决策可基于的一个或多个另外的维度。例如,可追踪并分析过去(例如,回到数据对象的创建日期/时间)数据对象的多个访问的日期/时间信息,以确定一个或多个维度,如大体访问模式、随时间的访问频率和/或在某些时间(例如,每周五,在特定日期或围绕特定日期一年一次,在每个月的月末等)的访问模式。
[0049]在至少一些实施方案中,可考虑的另一个维度是用户访问模式。例如,存储管理模块302可确定一组一个或多个数据对象350 (其可能是或可能不是相同类型)趋向于以某一时间间隔、例如一月一次、一季度一次或一年一次地被访问。存储管理模块302可根据时间间隔将这组数据对象350从较低层(例如,中间层312或底层314)上移至较高层(例如,至顶层310),并且一旦数据对象350不再被访问,将这组数据对象350下移至较低层(例如,至中间层312或底层314)。
[0050]在至少一些实施方案中,例如在与服务提供者的服务水平协议(SLA)中表达的客户指定的优先级可提供存储管理模块302在做出存储决策时可考虑的一个或多个维度。例如,服务提供者可向不同客户或向单个客户的不同组数据对象提供不同水平的SLA。客户的SLA中的信息可被用于为客户数据确定存储解决方案或层。
[0051]在至少一些实施方案中,底层314上的数据对象350C可趋向于留在底层314上,除非从客户360接收到对数据对象350C的访问请求。然而,底层上的数据对象350C的一个或多个维度可由存储管理模块302考虑并且导致产生将较低层314上的数据对象350C中的一个或多个上移或复制到较高层(例如,至中间层312或至顶层310)的决策。例如,如以上所提及,用户访问模式可使得一组数据对象350C被上移或复制到较高层。作为另一个实例,如果趋向于被一起访问的数据对象350C的时间相关组中的至少一个数据对象350C被访问,那么在所述组中的所有数据对象350C可从底层314被移动或复制到较高层。
[0052]如先前所指出,在一些实现方式中,存储系统的底层314可涉及将数据对象350C存储至磁带或其他可移动永久性介质。用作底层314存储装置的介质(例如,磁带介质)可被移动至可具有低功率要求和低或极低量的气候控制的单独设施并且仓储在其中。在至少一些实施方案中,底层314可被视为用于数据对象350的冷档案存储装置。将数据对象350移动至底层314和从底层314检索数据对象350的成本可能因此而非常高,而存储数据对象350的每单元成本可能非常低。
[0053]在一些实施方案中,替代在需要访问数据对象350时将数据对象350C从底层314移除并且将数据对象350C移动至较高层(例如,顶层310),并且然后在数据对象350不再被访问时将数据对象350移回至底层314,可创建数据对象350C的副本并且将副本移至较高层,而数据对象350C的原件可被留存在底层314中的介质上。当较高层上的数据对象350的副本不再被访问时,可简单地将数据对象350的副本从较高层删除(或标记以用于在较高层中进行垃圾收集)。在一些实现方式中,可使用类似方法来将数据对象350B从中间层312复制到较高层(例如,顶层312)。
[0054]图4示出其中可实现存储管理方法的实施方案的存储系统的示例性物理实现方式。例如,可根据图4中所示的实例实现图3中所示的示例性存储系统的逻辑视图。
[0055]图4还将存储系统示出为由服务提供者400实现的存储服务。存储服务可在提供者网络上实现,并且可通过中间网络如因特网向服务提供者400的多个客户460提供远程存储。在一些实现方式中,至少一些客户460可为服务提供者400中的进程,其可通过服务提供者400的网络基础设施访问存储服务。客户460可通过存储服务API 404访问存储服务,以将数据写入由存储服务提供的存储和从所述存储读取数据。在至少一些情况下,由客户460存储的数据可存储在多租户存储硬件上;也就是说,两个或更多个客户460的数据可存储到存储系统内的相同存储设备上,并且可跨存储系统内的两个或更多个存储设备传播任何一个客户460的数据。存储服务软件和/或硬件部件(示出为存储应用程序402)可管理将客户数据存至存储系统内的物理存储设备和从所述物理存储设备检索客户数据。存储服务通过API 404可将存储作为虚拟化存储装置呈现给每一个客户460 ;也就是说,每一个客户460都可查看它们自己的在存储系统中的数据,例如作为虚拟化硬盘或虚拟卷,并且可访问(从其读取或向其写入)它们自己的数据,而其他客户的数据是客户460不可查看或不可访问的。
[0056]服务提供者400可在一个或多个数据中心420内或跨一个或多个数据中心420实现服务提供者网络。每个数据中心420可包括成百或成千的网络化存储设备(例如,机架式存储设备)以及其他硬件如服务器、网络设备(路由器、开关、负载均衡器等)和布线(例如,数据缆线,如光纤电缆以及电力电缆),存储服务在网络化存储设备上实现并维持由所述服务提供的数据存储。除硬件成本外,数据中心420可通常为功率要求和成本高的物理设施,因为功率被提供给网络、服务器、存储装置和数据中心420内的其他硬件设备,并且设施通常是气候受控的,以保护硬件并补偿电力设备的热负载。
[0057]在至少一些实现方式中,数据中心中的存储服务所使用的物理数据存储设备可包括具有不同成本和特
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1