相对于数据实施数据集特定管理策略的方法

文档序号:6436149阅读:194来源:国知局
专利名称:相对于数据实施数据集特定管理策略的方法
技术领域
本发明一般性涉及数据存储。更具体的,公开了在可内容寻址的存储设备上实施应用程序特定管理策略。
背景技术
内容寻址存储(CAS)设备主要在存储服务器上存储可能来自多个源的固定的内容,该存储服务器通常通过网络访问。一个例子是,Centera CAS设备,由Hopkinton,MA 的EMC 公司制造和销售。通常,应用程序发送数据到CAS设备存储,该CAS设备通过至少部分基于要存储的内容计算“内容地址”(CA)来决定存储位置,之后,CAS设备在所选的位置上存储内容并且返回内容地址给发送数据的应用程序。内容地址被用作类似于权利检查 (claim check),使得存储应用程序(或者,理论上,被提供了 CA的另一个应用程序)可以取回(在某些情况下执行其他有限的操作,例如,删除)之前存储的内容。在典型CAS设备里,相同的管理策略,例如,数据保持策略,被实施到所有数据,而忽略数据源。典型的CAS设备没有本地文件系统或其他方式去识别特定数据对象来自特定数据源(例如,应用程序)。然而在许多情况下,不同的策略可以应用于不同的数据,例如,依赖于内容和/或应用程序或其他生成和/或存储数据的过程。在当前的CAS设备中,通常更多限制性的(例如,最长保持期)策略实施到所有数据上,导致一些数据被保持例如比需求长得多的时间,不必要的占用了本来可以存储其它数据的存储资源。因而,需要一种对 CAS设备中存储的数据实施应用程序(或其他的数据集)特定管理策略,例如数据保持策略, 的方式。

发明内容
为解决以上技术问题,本发明提供一种相对于在内容寻址存储设备上存储的数据实施一个或多个数据集特定管理策略的方法,包括
将存储在内容寻址存储设备上的每个数据对象与多个数据集之一相关联,包括基于从哪个应用程序接收数据对象将每个数据对象与应用程序相关联,其中从所述应用程序接收所述数据对象;
在所述内容寻址存储设备处将所述多个数据集的至少每个子集与相应的应用程序特定管理策略相关联,所述应用程序特定管理策略与应用程序相关联,其中所述应用程序与所述数据集相关联并且包括在所述数据集中的所有数据对象都被从所述应用程序接收;
对于已经与相应的应用程序特定管理策略相关联的每个数据集,将与该数据集相关联的应用程序特定管理策略应用到该数据集的数据对象,
其中所述内容寻址存储设备被配置为接收将被存储的数据对象,基于数据对象的内容数据计算存储该数据的地址,将所述数据对象存储在与所述地址相关联的存储位置。优选地,将存储在内容寻址存储设备上的每个数据对象与多个数据集之一相关联包括把每个数据对象与从其接收该数据对象的应用程序相关的应用程序标识符相关联。所述的方法还可以包括接收应用程序特定管理策略;将该接收的应用程序特定管理策略和相应的应用该接收的应用程序特定管理策略的数据集相关联。有利地,将接收的应用程序特定管理策略和相应的应用该接收的应用程序特定管理策略的数据集相关联包括在策略表中产生一个条目。可以将接收的应用程序特定管理策略和相应的应用该接收的应用程序特定管理策略的数据集相关联包括把接收的应用程序特定管理策略和从其接收该应用程序特定管理策略的发送应用程序相关联。管理策略可以包括数据保持策略。


本发明的各种实施例在以下详细的描述和附图中公开。图1是一个实施例中使用的在可内容寻址存储设备上实施应用程序特定管理策略的过程的流程图。图2是一个实施例中使用的在配置来实施应用程序特定管理策略的CAS设备上接收和处理数据的过程的流程图。图3是表示一个实施例中使用的用来实施应用程序特定管理策略的CAS设备的框图。图4是一个实施例中使用的对内容寻址的存储设备上存储的数据实施应用程序 (或其它数据集)特定管理策略的过程的流程图。图5是一个实施例中使用的对CAS设备上存储的数据集实施数据集(例如,应用程序)特定管理(例如,保持)规则和策略的过程的流程图。
具体实施例方式本发明可以用几种方式实施,包括实施为一个过程、仪器、系统、以上的组合、计算机可读介质,例如计算机可读存储介质或其中通过光学或电子通信链接发送程序指令的计算机网络。在本说明书中,这些实施方式,或任何其他本发明可以使用的形式,可以称为技术。一般来讲,公开的过程的步骤的顺序可以在本发明的范围内变化。以下结合示出了本发明原则的附图,提供了对本发明的一个或更多实施例的描述。联系这样的实施例来描述本发明,但是本发明不局限于任何实施例。本发明的范围仅由权利要求来限制,并且本发明包括各种替代、修改和等价物。在以下说明书中阐述了许多特定细节,以便提供对本发明的完全理解。提供这些细节是用于举例的目的,并且本发明可以依照权利要求包含或不包含这些特定细节来实现。为了清楚起见,对于与本发明相关的技术领域已知的技术内容没有详细加以描述,以便不会模糊本发明。公开了在可内容寻址的存储设备上实施应用程序特定管理策略。在一个实施例中,将存储在内容寻址存储设备上的每个数据对象与多个数据集之一相关联。将相应的数据集特定管理策略与所述多个数据集的至少每个子集相关联。将可应用的数据集特定管理策略实施到已经与相应的数据集特定管理策略相关联的每个数据集的数据对象。
图1是一个实施例中使用的在可内容寻址存储设备上实施应用程序特定管理策略的过程的流程图。接收可以由特定的应用程序(或其它源)对存储在CAS设备上的数据实施的保持(或其他数据管理)策略或规则(102)。这个规则(或策略)在CAS设备上与应用程序(或其它源)关联(104)。在一个实施例中,通过在维护用来跟踪这些规则和策略的表、数据库、或其它存储库中产生一个或多个条目,将保持(或其他管理)规则或策略与相应的应用程序(或其他数据源)关联。图2是一个实施例中使用的在配置来实施应用程序特定管理策略的CAS设备上接收和处理数据的过程的流程图。接收数据(202)。存储数据(204)。在一个实施例中,存储数据包括至少部分基于数据的内容计算内容地址和在与该内容地址相关联的存储位置存储数据。与在CAS设备上存储数据的存储位置相关联的内容地址,在CAS设备上与发送数据(206)的应用程序(或其它源)相关联。在一个实施例中,206包括在与CAS设备上的发送应用程序(或其它源)关联的一个表或其他数据存储库中生成一个条目,该条目将发送应用程序(或其它源)与内容地址相关联。在一个实施例中,还记录附加信息,诸如存储数据的日期/时间。在一个实施例中,CAS设备配置为为发送应用程序(或其它源)维护内容映射,该内容映射将被该应用程序存储在CAS设备上的每个数据对象的内容地址与相应的本地数据对象标识符(例如,文件名和/或路径)相关联,通过该标识符,数据对象在与发送应
用程序相关联的本地主机已知,更详细的描述在共同待决的US专利申请号_(代理人摘
要号LEGAP034)中,该申请在此引入作为参考。在一个这样的实施例中,在206生成在内容地址和发送应用程序之间的关联包括在该发送应用程序的内容映射中生成一个条目。操作的结果被返回到发送应用程序(或其他源)(208),在这之后过程结束。在一种实施例中,如果数据被成功的保存,则报告包括操作成功地完成的指示。图3是表示一个实施例中使用的用来实施应用程序特定管理策略的CAS设备的框图。具有与之关联的应用程序识别号“234”的一个应用程序A (302),和具有与之关联的应用程序识别号“456”的一个应用程序B (304),通过网络(例如,TCP/IP网络)(306)连接到CAS设备308。在一个实施例中,应用程序标识符(例如,“234”和“456”)由CAS设备 308产生,来唯一标识每个发送数据给CAS设备308存储的应用程序。在其它实施例中,发送应用程序本身或者第三方可以产生应用程序标识符。CAS设备308存储由应用程序,如302和304,发送给它保存的数据对象。CAS设备308被配置来跟踪哪些数据对象是被哪些发送程序或其他源发送的。在图3所示的例子中,数据对象包括在CAS设备308上存储的与应用程序A (302)相关联的第一组数据对象 312,和与应用程序B (304)相关联的第二组数据对象314。CAS设备308包括策略表316, 在其中,列出了与每个已经在CAS设备308上保存数据的应用程序相关联的保持(或其他管理)策略。在展示的例子中,策略表316指示出被应用程序A (302)保存的数据将被保持 12个月,而应用程序B (304)保存的数据将只被保持6周。CAS设备308被配置为通过监视存储在CAS设备308上的数据对象和当适用于该数据对象被关联的数据集(例如,发送应用程序)的保持期限过期时删除该数据对象,来实施列于策略表316中的保持(或其他管理) 策略。在保持策略的例子中,例如,在一个实施例中,CAS设备308被配置来周期性地扫描每个数据集的数据对象,并且删除那些存储在CAS设备308上已经超过与该数据集关联的保持期限的对象,下面会更详细的描述。
尽管在图3中的例子中,不同的管理(例如,保持)策略基于与每个数据对象关联的相应的发送程序被实施到不同的数据对象,在其它实施例中,不同的管理策略可以实施到由其它或附加的特性定义的不同数据集上,例如基于代码、标志或其他由发送源提供的指示与特定数据对象关联的数据集的指示符,以便在发送应用程序的身份之外的基础上实施一个或多个数据集特定的管理策略。在一个实施例中,CAS设备308具有通信接口,例如网络接口卡(NIC),来帮助实现通过网络306与应用程序302和304的通讯。CAS设备308还包括存储器,用来保存策略表 316和一个或多个内容映射,该内容映射跟踪哪个数据与哪个发送应用程序(或其他源)相关联;一个或多个存储节点,用来存储被应用程序,例如302和304应用程序发送到CAS设备308的数据(例如,数据集312和314);和一个或多个处理器,被配置来处理CAS设备308 的数据存储、恢复和管理功能以及此处描述的应用程序特定管理操作。所述一个或多个处理器中的一个或多个可以包括配置为通过软件来执行这样的功能和操作的通用处理器(例如CPU),和/或者专用集成电路、场可编程逻辑设备或其他如此配置的设备。图4是一个实施例中使用的对内容寻址的存储设备上存储的数据实施应用程序 (或其它数据集)特定管理策略的过程的流程图。这个过程开始于第一个数据集,例如包括由特定应用程序(402)存储在CAS设备上的数据对象的数据集。确定可应用到该数据集中的数据对象的保持(或其他管理)规则或策略是否已知(404)。如果该数据集特定规则或策略不是已知(例如,在策略表,例如图3的策略表316中没有这个数据集的条目),就实施缺省的规则(406)。检查该数据集中的每个数据对象,以确定它已经被保存的期限是否等于或大于例如缺省的保持期限。例如,如果该数据集特定的规则或策略是已知的(404),则将该数据集特定的规则或策略(例如,保持期限)实施到该数据集中的数据对象上(408)。一旦已经实施该可应用的数据集特定或缺省规则,确定刚刚处理的该数据集是否是图4的过程的当前迭代中需要处理的最后数据集(410)。在一个实施例中,图4的过程被周期性的执行,例如,每小时、每天、每周等,并且存储在CAS设备上的所有数据集通过规定的周期性基础循环。如果刚完成的数据集不是要被处理的最后的数据集,则图4的过程继续到要处理的下一个数据集(412),且为该数据集重复404-410。如果刚完成的数据集是最后一个要处理的数据集(410),则过程结束(414)。图5是一个实施例中使用的对CAS设备上存储的数据集实施数据集(例如,应用程序)特定管理(例如,保持)规则和策略的过程的流程图。在一个实施例中,图5的过程用来实现图4的406和408。过程开始于处理数据集中的第一个数据对象(502)。确定数据对象在CAS设备上已经存储的时间是否超过可应用的保持期限(504)。如果超过了期限,则删除该数据对象(506);不然保留该数据对象(508)。确定刚处理的数据对象是否是数据集中最后的数据对象(510)。如果不是,过程继续到该数据集中的下一个数据对象(512)并且对于该数据对象重复504-510。如果刚处理的数据对象是数据集中最后一个数据对象(510), 过程结束(514)。使用这里描述的方法,在CAS设备上存储数据的应用程序不需被配置来实施与这样的数据相关的保持和/或其他管理策略。相反,CAS设备自己能在发送应用程序(或其他数据集)特定的基础上实施这样的策略。虽然为了理解清晰详细描述了前述实施例,本发明不受限于所述的细节。还有许多实现本发明的替代方法存在。所公开的实施例是说明性的不是限制性的。
权利要求
1.一种相对于在内容寻址存储设备上存储的数据实施一个或多个数据集特定管理策略的方法,包括将存储在内容寻址存储设备上的每个数据对象与多个数据集之一相关联,包括基于从哪个应用程序接收数据对象将每个数据对象与应用程序相关联,其中从所述应用程序接收所述数据对象;在所述内容寻址存储设备处将所述多个数据集的至少每个子集与相应的应用程序特定管理策略相关联,所述应用程序特定管理策略与应用程序相关联,其中所述应用程序与所述数据集相关联并且包括在所述数据集中的所有数据对象都被从所述应用程序接收;对于已经与相应的应用程序特定管理策略相关联的每个数据集,将与该数据集相关联的应用程序特定管理策略应用到该数据集的数据对象,其中所述内容寻址存储设备被配置为接收将被存储的数据对象,基于数据对象的内容数据计算存储该数据的地址,将所述数据对象存储在与所述地址相关联的存储位置。
2.权利要求1中所述的方法,其中将存储在内容寻址存储设备上的每个数据对象与多个数据集之一相关联包括把每个数据对象与从其接收该数据对象的应用程序相关的应用程序标识符相关联。
3.权利要求1中所述的方法,还包括接收应用程序特定管理策略;将该接收的应用程序特定管理策略和相应的应用该接收的应用程序特定管理策略的数据集相关联。
4.权利要求3中所述的方法,其中,将接收的应用程序特定管理策略和相应的应用该接收的应用程序特定管理策略的数据集相关联包括在策略表中产生一个条目。
5.权利要求3中所述的方法,其中,将接收的应用程序特定管理策略和相应的应用该接收的应用程序特定管理策略的数据集相关联包括把接收的应用程序特定管理策略和从其接收该应用程序特定管理策略的发送应用程序相关联。
6.权利要求1中所述的方法,其中,管理策略包括数据保持策略。
全文摘要
本发明涉及一种相对于数据实施数据集特定管理策略的方法,包括将存储在内容寻址存储设备上的每个数据对象与多个数据集之一相关联;在所述内容寻址存储设备处将所述多个数据集的至少每个子集与相应的应用程序特定管理策略相关联,所述应用程序特定管理策略与应用程序相关联;对于已经与相应的应用程序特定管理策略相关联的每个数据集,将与该数据集相关联的应用程序特定管理策略应用到该数据集的数据对象,其中所述内容寻址存储设备被配置为接收将被存储的数据对象,基于数据对象的内容数据计算存储该数据的地址,将所述数据对象存储在与所述地址相关联的存储位置。
文档编号G06F17/30GK102360389SQ201110322410
公开日2012年2月22日 申请日期2005年11月7日 优先权日2004年11月8日
发明者乌尔姆斯顿 R., 麦康内尔 W. 申请人:Emc公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1