计算机系统、文件管理方法以及元数据服务器的制造方法

文档序号:6484619阅读:243来源:国知局
计算机系统、文件管理方法以及元数据服务器的制造方法
【专利摘要】实现一种计算机系统,其不制作多余的复制就能够从分析程序参照处于业务服务器管理下的文件、即包含过去存在但已经删除的文件在内的全部文件。其是具备文件服务器、元数据服务器、业务服务器的计算机系统,元数据服务器与提供用于存储从文件服务器删除的文件的保存区域的存储装置连接,元数据服务器保存管理文件的元数据和存储在保存区域中的文件的存储位置的元数据存储库,在检测出删除存储在文件服务器中的文件的情况下,将文件作为保存文件存储到保存区域中,将表示文件在文件服务器中的位置的信息和表示保存文件在保存区域中的存储位置的信息对应地存储在元数据存储库中。
【专利说明】计算机系统、文件管理方法以及元数据服务器
【技术领域】
[0001]本发明涉及一种计算机系统的文件管理方法,该计算机系统由存储装置、管理存储在存储装置中的文件的元数据的元数据服务器、执行规定的业务处理的业务服务器、执行对业务服务器所利用的数据的分析处理的分析服务器构成。
【背景技术】
[0002]在用网络将多个计算机、与存储装置对应的多个文件服务器连接起来所得的计算机系统中,使在计算机上运行的业务程序执行业务所需要的处理。业务程序例如有文书管理系统那样的自主动作的程序、用户所利用的文书作成程序那样的对话式程序。
[0003]通过将业务程序执行处理所需要的业务数据存储在文件服务器中,能够灵活地进行系统的结构变更、存储器的容量的管理。
[0004]另外,广泛地通过在与业务程序不同的计算机上运行的分析程序对存储在文件服务器中的业务数据执行统计处理等分析处理,来得到对企业经营有用的信息。
[0005]业务程序在处理的过程中,有时删除存储在文件服务器中的文件。另一方面,分析程序为了取得更有用的信息,理想的是追溯过去取得包含从文件服务器中删除的文件在内的计算机系统的全部文件来进行分析。
[0006]作为以后读出被删除的文件的方法,有使用备份系统的方法。备份系统周期地读出存储在文件服务器中的数据,复制到其他备份用存储装置。但是,在备份系统中,将同一数据保持在文件服务器和备份用存储装置中,因此存储区域的利用效率差。
[0007]另外,作为其他方法,有使用文件服务器所具备的快照功能的方法。通过使用快照功能,能够在抑制存储区域的消耗量的同时,保存过去某时刻的文件服务器的多个状态。但是,能够作成的快照的数量有限制,因此例如不适于用于取得追溯过去5年以上的时刻存在的文件。
[0008]另外,作为将文件移动到其他存储装置的方法,有存档系统。存档系统是将满足规定的条件的文件(例如一定期间没有更新的文件)移动到其他存储器的系统。但是,在存档系统中,只将存在于文件系统中的文件作为对象,因此例如无法将“删除的文件”指定为条件。
[0009]另外,在专利文献I中记载了以下的技术,即不实际删除通过用户的操作删除的文件而保存到其他存储区域中,能够以后恢复。
[0010]现有技术文献
[0011]专利文献
[0012]专利文献1:特开2008-17049号公报
【发明内容】

[0013]发明要解决的问题
[0014]但是,在专利文献I记载的技术中,如果一度恢复删除的文件,则该文件成为系统的管理对象以外。因此,无法达成追溯过去向分析程序提供包含删除的文件在内的计算系统的全部文件的目的。
[0015]本发明实现以下的计算机系统,其不制作多余的复制,就能够从分析程序参照处于业务程序管理下的文件、即包含过去存在但已删除的文件在内的全部文件。
[0016]如果表示在本申请中公开的发明的代表性的一个例子则如下所述。即,一种计算机系统,具备:文件服务器,其管理多个文件;元数据服务器,其管理上述文件的元数据;业务服务器,其使用上述文件,执行规定的业务处理,该计算机系统的特征为:上述文件服务器、上述元数据服务器、上述业务服务器经由网络相互连接,上述文件服务器具备第一处理器、与上述第一处理器连接的第一存储器、与上述第一处理器连接的第一网络接口、与上述第一处理器连接而存储上述文件的第一存储介质,上述元数据服务器具备第二处理器、与上述第二处理器连接的第二存储器、与上述第二处理器连接的第二网络接口、与上述第二处理器连接的第二存储介质,上述业务服务器具备第三处理器、与上述第三处理器连接的第三存储器、与上述第三处理器连接的第三网络接口,上述元数据服务器与存储装置连接,该存储装置具备控制器和多个存储介质,并且提供存储从上述文件服务器删除的上述文件的保存区域,在上述第二存储介质中存储了元数据存储库,该元数据存储库管理上述文件的元数据、存储在上述保存区域中的上述文件的存储位置,上述元数据服务器在检测出通过由上述业务服务器执行的业务处理而删除存储在上述文件服务器中的上述文件的情况下,将上述文件作为保存文件存储在上述保存区域,将表示上述文件在上述文件服务器中的存储位置的信息、表示上述保存文件在上述保存区域中的存储位置的信息对应地存储在上述元数据存储库中。
[0017]发明效果
[0018]根据本发明,元数据服务器不作成多余的复制就能够管理从文件服务器删除的文件。
【专利附图】

【附图说明】
[0019]图1是说明本发明的处理的概要的框图。
[0020]图2是说明本发明的第一实施方式的计算机系统的结构的框图。
[0021]图3是说明本发明的第一实施方式的元数据服务器的结构的框图。
[0022]图4是表示本发明的第一实施方式的存储管理表的结构的一个例子的说明图。
[0023]图5是表示本发明的第一实施方式的名字空间管理表的结构的一个例子的说明图。
[0024]图6是表示本发明的第一实施方式的元数据管理表的结构的一个例子的说明图。
[0025]图7是表示本发明的第一实施方式的文件保存管理表的结构的一个例子的图。
[0026]图8是说明本发明的第一实施方式的文件服务器的结构的框图。
[0027]图9是说明本发明的第一实施方式的元数据管理程序所执行的处理的流程图。
[0028]图10是说明本发明的第一实施方式的文件共享程序所执行的处理的流程图。
[0029]图1lA是说明本发明的第一实施方式的文件删除检测程序所执行的处理的流程图。
[0030]图1lB是说明本发明的第一实施方式的文件删除检测程序所执行的处理的流程图。
[0031]图1lC是说明本发明的第一实施方式的文件删除检测程序所执行的处理的流程图。
[0032]图12是表示在本发明的第一实施方式中文件移动后的元数据管理表的说明图。
[0033]图13是表示在本发明的第一实施方式中文件移动后的文件保存管理表的说明图。
[0034]图14是说明本发明的第一实施方式的查询处理程序所执行的处理的流程图。
[0035]图15A是表示本发明的第一实施方式的列表的结构的一个例子的说明图。
[0036]图15B是表不本发明的第一实施方式的列表的结构的一个例子的说明图。
[0037]图16是说明本发明的第一实施方式的分析程序所执行的文件分析处理的流程图。
[0038]图17是表示本发明的第二实施方式的隐藏文件管理表的结构的一个例子的说明图。
[0039]图18是说明本发明的第二实施方式的文件共享程序所执行的处理的流程图。
[0040]图19是表示本发明的第三实施方式的文件保存管理表的结构的一个例子的说明图。
[0041]图20是表示本发明的第三实施方式的隐藏文件管理表的结构的一个例子的说明图。
[0042]图21是说明本发明的第三实施方式的文件共享程序所执行的处理的流程图。
[0043]图22是说明本发明的第三实施方式的文件删除检测程序所执行的处理的流程图。
[0044]图23是表示本发明的第三实施方式的元数据管理表的一个例子的说明图。
[0045]图24是表示本发明的第三实施方式的元数据管理表的一个例子的说明图。
[0046]图25是表示本发明的第三实施方式的文件保存管理表的一个例子的说明图。
[0047]图26是说明本发明的第三实施方式的文件代理读出程序所执行的处理的流程图。
[0048]图27是说明本发明的第三实施方式的恢复处理的详细的流程图。
[0049]图28是表示本发明的第四实施方式的存储管理表的结构的一个例子的说明图。
[0050]图29是表示本发明的第四实施方式的名字空间管理表的结构的一个例子的说明图。
[0051]图30是表示本发明的第四实施方式的元数据管理表的结构的一个例子的说明图。
[0052]图31是说明本发明的第四实施方式的文件删除检测程序所执行的处理的流程图。
[0053]图32A是说明本发明的第五实施方式的元数据管理程序所执行的处理的流程图。
[0054]图32B是说明本发明的第五实施方式的元数据管理程序所执行的处理的流程图。
【具体实施方式】
[0055]首先,说明本发明的概要。[0056]图1是说明本发明的处理的概要的框图。
[0057]本发明的计算机系统500由元数据服务器1、保存用存储装置2、多个文件服务器
4、多个业务服务器5、多个分析服务器6构成。
[0058]业务服务器5是执行规定的业务的计算机,运行业务程序51。业务程序51使用存储在文件服务器4中的文件执行规定的业务。
[0059]在图1所示的例子中,业务程序51使用路径名是“/A/a.doc”的文件1000_1、以及路径名是“/A/c.doc”的文件1000-2执行规定的业务。以下,在不区别文件的情况下,记载为文件1000。
[0060]分析服务器6是分析文件1000的计算机,运行分析程序61。分析程序61读出业务程序51所使用的文件1000-1、1000-2,执行统计处理等分析处理。
[0061]元数据服务器I是管理存储在多个文件服务器4中的文件的元数据的计算机。本实施方式的元数据服务器I的特征点在于还管理与从文件服务器4中删除的文件有关的元数据。
[0062]在此,元数据表示对文件设定的属性值的集合。例如,元数据包含文件的拥有者、文件的拥有组、存取控制信息、文件的作成日、文件的更新日、文件的元数据更新日、文件的大小、以及其他用户定义的属性值。
[0063]元数据服务器I管理存储文件的元数据的元数据存储库。在元数据存储库中,包含确定存储在文件服务器4中的字段、确定存储在保存用存储装置2中的文件的字段、以及表示文件的状态的字段。
[0064]在确定存储在文件服务器4中的文件的字段中包含路径名和存储器名。作为确定存储在保存用存储装置2中的文件的字段,包含路径名和存储器名。另外,作为表示文件的状态的字段,存储表示文件是否存在于文件服务器4中的信息。
[0065]接着,说明业务程序51在删除文件1000-1的情况下执行的处理的概要。
[0066]业务程序51向识别名是“FS1”的文件服务器4发送文件1000-1的删除请求(步骤 S1001)。
[0067]文件服务器4如果检测出文件的删除请求,则保留文件1000-1的删除,向元数据服务器I通知接收到对文件1000-1的删除请求(步骤S1002)。
[0068]元数据服务器I如果接收到来自文件服务器4的通知(步骤S1003),则更新与存储在元数据存储库150中的文件1000-1对应的记录(步骤S1004)。具体地说,在表示文件的状态的字段中存储表示删除文件1000-1的“删除”。
[0069]接着,元数据服务器I将文件1000-1移动到保存用存储装置2中(步骤S1005)。具体地说,元数据服务器I从文件服务器4取得文件1000-1,作为文件1008存储在保存用存储装置2的文件系统22中。
[0070]在图1所示的例子中,将文件1008存储在路径名“r/FSl/A/a.doc”。此外,不重复地设定保存用存储装置2中的路径名。
[0071]接着,元数据服务器I向文件服务器4指示文件1000-1的删除(步骤S1006)。文件服务器4如果接收到该指示,则删除文件1000-1,向业务程序51应答文件1000-1的删除完成。
[0072]最后,元数据服务器I更新元数据存储库150的与文件1000-1的元数据对应的记录(步骤S1007)。具体地说,在确定存储在保存用存储装置2中的文件的字段中存储文件1008的路径名“r/FSl/A/a.doc”、存储文件1008的保存用存储装置2的识别名“SI”。
[0073]在图1中,表示文件1000-1的删除前和删除后的元数据存储库150的变化。
[0074]接着,说明分析程序61将现在和过去的文件作为分析对象的分析处理的概要。在此,说明由业务程序51从文件服务器4中删除文件1000-1,并将文件1000-1移动到保存用存储装置2中后的分析处理。
[0075]分析程序61向元数据服务器I查询包含现在存储的文件和过去存在的文件在内的全部文件(步骤S1011)。具体地说,分析程序61向元数据服务器I请求全部文件的列表。
[0076]元数据服务器I根据元数据存储库150生成列表,向分析程序61应答所生成的列表(步骤S1012)。
[0077]此外,列表由包含用于确定文件的信息的多个条目构成。该条目包含文件的路径名、存储目的地的存储装置的识别名、文件在文件服务器4中的元数据、表示文件的状态的字段。
[0078]在从文件服务器4删除的文件1000-1的条目中,还包含文件的保存目的地的路径名、保存用存储装置2的识别名。另外,在该条目的表示文件的状态的字段中,存储表示文件已删除的信息。
[0079]分析程序61根据从元数据服务器I取得的列表,确定文件的存储位置。
[0080]在图1所示的例子中,分析程序61知道路径名是“/A/a.d0c”、“/A/c.doc”的2个文件存在于文件服务器4中。进而,分析程序61知道上述文件中的路径名为“/A/a.doc”的文件被从文件服务器4中删除,而作为路径名为“r/FSl/A/a.doc”的文件1008存储在识别名是“SI”的保存用存储装置2中。
[0081]分析程序61参照列表,取得分析处理所需要的全部文件(步骤1013、步骤S1014)。即,分析程序61从文件服务器4取得存储在文件服务器4中的文件1000-2,从保存用存储装置2取得与从文件服务器4删除的文件1000-1对应的文件1008。
[0082]如以上说明的那样,元数据服务器I能够进行管理使得分析程序61能够对业务程序51执行业务时删除的文件进行分析。
[0083]这样,本发明在从文件服务器4中删除文件的情况下,在从文件服务器4中删除之前移动到保存用存储装置2,因此不作成不必要的文件的复制。
[0084]以后,如文件1000-1那样,将从文件服务器4删除而能够通过向元数据服务器I查询而取得内容的文件称为删除文件。此外,把存储在保存用存储装置中的删除文件的复制称为保存文件。另外,将删除对象的文件即在成为删除文件之前存储在文件服务器4中的文件称为原始文件。另外,将存储在文件服务器4中而没有删除的文件成为通常文件。
[0085][第一实施方式]
[0086]图2是说明本发明的第一实施方式的计算机系统500的结构的框图。
[0087]计算机系统500由元数据服务器1、保存用存储装置2、备份存储装置3、多个文件服务器4、多个业务服务器5、多个分析服务器6、网络7构成。
[0088]元数据服务器1、保存用存储装置2、备份存储装置3、文件服务器4、业务服务器5、分析服务器6能够经由网络7相互通信。此外,可以使用LAN (局域网)、WAN (广域网)、因特网等构成网络7。本发明并不限定网络7的连接方式。[0089]元数据服务器I是管理元数据的计算机。此外,元数据服务器I也可以是使用虚拟化技术生成的虚拟计算机。
[0090]元数据服务器I具备元数据服务器程序110和元数据存储库150。将在后面说明其他构成要素。
[0091]保存用存储装置2是存储各种文件的存储装置。
[0092]在此,存储装置表示具备控制器(省略图示)、网络接口(省略图示)、以及一个以上的存储介质(省略图示),能够向计算机提供该存储介质的存储区域的装置。存储装置能够使用多个存储介质构成RAID,进而能够通过物理存储区域生成多个逻辑存储区域。另外,能够对每个逻辑存储区域构筑不同的文件系统。
[0093]保存用存储装置2具备文件共享程序21和文件系统22。文件共享程序21依照经由网络7从元数据服务器I接收到的文件存取请求,将文件存储在文件系统22中,另外从文件系统22读出文件。将在后面说明其他构成要素。
[0094]备份存储装置3是存储各种文件的存储装置。其中,特别以文件的备份为目的利用备份存储装置3。备份存储装置3具备备份程序31和文件系统32。将在后面说明其他构成要素。
[0095]文件服务器4是存储各种文件而管理该文件的计算机。特别在文件服务器4中存储业务程序51执行业务处理所需要的文件。文件服务器4具备文件共享程序411和文件系统452。将在后面说明其他构成要素。
[0096]此外,在计算机上,还将文件服务器4识别为一种存储装置。
[0097]业务服务器5是执行实现业务处理所需要的程序的计算机。此外,业务服务器5也可以是使用虚拟化技术而生成的虚拟计算机。
[0098]业务服务器5具备业务程序51。业务程序51是进行规定的业务处理的程序,从文件服务器4取得业务处理所需要的数据而执行规定的业务处理。将在后面说明其他构成要素。
[0099]分析服务器6是执行实现分析处理所需要的程序的计算机。此外,分析服务器6也可以是使用虚拟化技术生成的虚拟计算机。
[0100]分析服务器6具备分析程序61。分析程序61读出在文件服务器4中存储的、业务程序51进行业务处理所利用的文件,使用读出的文件执行分析处理。
[0101]图3是说明本发明的第一实施方式的元数据服务器I的结构的框图。
[0102]元数据服务器I具备存储器11、处理器12、网络接口 13、以及本地存储器15,各构成要素经由内部总线16相互连接。
[0103]处理器12执行存储在存储器11中的程序。通过由处理器12执行程序,能够实现元数据服务器I所具备的功能。
[0104]存储器11存储元数据服务器程序110。元数据服务器程序110是用于实现元数据服务器I所具备的功能的程序,由多个子程序构成。
[0105]具体地说,元数据服务器程序110由查询处理程序111、元数据管理程序112、文件删除检测程序113、文件保存程序114、文件代理读出程序115构成。
[0106]查询处理程序111是执行针对来自文件服务器4和分析服务器6的查询的处理的程序。元数据管理程序112是管理元数据的程序。[0107]文件删除检测程序113是检测从文件服务器4删除文件的程序。文件保存程序114是将文件复制到保存用存储装置2的程序。文件代理读出程序115是从保存用存储装置2读出文件的程序。
[0108]上述的子程序可以分别作为独立的处理来执行,也可以作为构成元数据服务器程序110的库等部分程序来执行。此外,将在后面使用【专利附图】
附图
【附图说明】通过各子程序执行的处理的详细。
[0109]另外,在存储器11中还存储在接收到来自分析服务器6的查询时生成的列表116。列表116存储从文件服务器4或保存用存储装置2取得文件所需要的信息。
[0110]本地存储器15是元数据服务器I所具备的存储介质,可以考虑硬盘(HDD)、固态驱动器(SSD)、非易失性存储器(NVRAM)。
[0111]本地存储器15存储元数据存储库150。此外,元数据存储库150既可以存储在存储器11中,也可以存储在与元数据服务器I连接的存储装置中。
[0112]元数据存储库150包含存储管理表151、名字空间管理表152、元数据管理表153、文件保存管理表154。以下,说明各表的结构。
[0113]图4是表示本发明的第一实施方式的存储管理表151的结构的一个例子的说明图。
[0114]存储管理表151存储与元数据服务器I管理的存储装置有关的信息。具体地说,存储管理表151包含一个以上的记录,各记录由存储器ID1511、存储器名1512、类型1513、ID地址1514构成。
[0115]存储管理表151的各记录与元数据服务器I所管理的一个存储装置对应。
[0116]存储器ID1511存储用于由元数据服务器I唯一地识别存储装置的标识符。存储器名1512存储对计算机系统500中的存储装置设定的识别名。
[0117]类型1513存储存储装置的利用种类。例如,在存储装置是文件服务器4的情况下存储“文件服务器”,在是存储存档文件的存储装置的情况下存储“存档存储器”。
[0118]IP地址1514存储对存储装置分配的IP地址。
[0119]在图4所示的例子中,在第一记录中,存储存储器ID1511是“slOOO”、存储器名是“FS1”、类型1513是“文件服务器”、IP地址1514是“192.168.10.100”的文件服务器4的信息。
[0120]同样,在第二记录中存储文件服务器4的信息,在第三记录中存储保存用存储装置2的信息。
[0121]图5是表示本发明的第一实施方式的名字空间管理表152的结构的一个例子的说明图。
[0122]名字空间管理表152存储与元数据服务器I管理的存储装置的名字空间有关的信息。在此,名字空间是识别存储文件的存储区域的逻辑单位。可知在文件服务器4的情况下,共享名和公开名等的名称与名字空间对应。另外,在保存用存储装置2的情况下也可知同样的概念。
[0123]名字空间管理表152包含一个以上的记录,各记录由名字空间ID1521、名字空间名1522、存储器ID1523、容量1524、协议1525、使用量1526、用途1527构成。
[0124]名字空间管理表152的各记录与文件服务器4和保存用存储装置2的名字空间对应。
[0125]名字空间ID1521是用于由元数据服务器I唯一地识别名字空间的标识符。名字空间1522存储用于由存储装置唯一地识别名字空间的名称。
[0126]存储器ID1523存储提供与名字空间对应的逻辑存储区域的存储装置的标识符。此外,存储器ID1523与存储器ID1511相同。
[0127]容量1524存储与名字空间对应的逻辑存储区域的容量。协议1525存储在对与名字空间对应的逻辑存储区域进行存取时使用的协议。使用量1526存储与名字空间对应的逻辑存储区域的使用量。
[0128]用途1527存储与名字空间对应的逻辑存储区域的用途。例如,在由业务程序51使用的逻辑存储区域的情况下存储“主”。另外,在存储保存文件的逻辑存储区域的情况下存储“保存”。
[0129]在图5所示的例子中,第一记录和第二记录存储与存储器ID1523是“slOOO”的文件服务器4上的名字空间有关信息。
[0130]在第一记录的名字空间ID1521中存储“nlOOl”,在名字空间名1522中存储“sharel”,在存储器ID1523中存储“slOOO”,在容量1524中存储“20TB”,在协议1525中存储“nfs”,在使用量1526中存储“5TB”,在用途1527中存储“主”。
[0131]同样,在第二记录中,存储与名字空间名1522、即共享名是“share2”的名字空间有关的信息。另外,在第三记录中,存储与其他文件服务器4的名字空间名1522、即共享名是“share3”的名字空间有关的信息。另外,在第四记录中,存储与保存用存储装置2的名字空间名1522是“r”的名字空间有关的信息。
[0132]图6是表示本发明的第一实施方式的元数据管理表153的结构的一个例子的说明图。
[0133]元数据管理表153存储表示文件的存储位置的信息和元数据。具体地说,元数据管理表153包含一个以上的记录,各记录由元数据ID1531、路径1532、名字空间ID1533、原始元数据1534、文件状态1535构成。
[0134]元数据管理表153的各记录与存储在文件服务器4中的文件和删除文件对应。
[0135]元数据ID1531存储用于识别元数据的标识符。路径1532存储表示存储文件的存储位置的路径名。
[0136]名字空间ID1533存储用于识别存储文件的逻辑存储区域的名字空间的标识符。名字空间ID1533与名字空间ID1521相同。
[0137]原始元数据1534存储文件服务器4中的元数据(省略图示)。
[0138]文件状态1535存储表示文件是否存在于文件服务器4中的信息。具体地说,在文件存在于文件服务器4中的情况下存储“存在”,在文件不存在于文件服务器4中的情况下存储“删除”。
[0139]在文件状态1535中存储“存在”的记录表示与该记录对应的文件被存储在由路径1532和名字空间ID1533所示的存储位置。
[0140]另一方面,在文件状态1535中存储“删除”的记录表示现在没有存储在由路径1532和名字空间ID1533所示的存储位置中而现在是删除文件。
[0141]文件服务器4对每个文件管理文件的元数据,元数据服务器I能够通过对名字空间的每个种类提供的API (应用程序接口)从文件服务器4取得文件的元数据。
[0142]在图6所示的例子中,在元数据管理表153中存储3个记录。此处,记录的个数是一个例子,并不限定本发明。即,在元数据管理表153中,存储与元数据服务器I管理的全部文件的元数据所对应的记录。
[0143]第一记录表示与存储在文件服务器4的“sharel”这样的名字空间中的文件“/share 1/a.doc”对应的元数据,在元数据ID1531中存储“100”。
[0144]在第一记录的路径1532中存储对应的文件的路径名“/sharel/a.doc”,在名字空间ID1533中存储名字空间“sharel”的标识符即“nlOOl”。另外,在第一记录的原始元数据1534中,存储文件服务器4中的对应的文件的元数据,但在此没有图示。并且,在第一记录的文件状态1535中存储“存在”。
[0145]第二记录表示与存储在文件服务器4的“sharel”这样的名字空间中的文件“/share 1/b.doc”对应的元数据,在元数据ID1531中存储“110”。另外,在第二记录的文件状态1535中存储“删除”。因此,表示文件“/sharel/b.doc”现在没有存储在由路径1532和名字空间ID1533所示的存储位置而是删除文件。
[0146]第三记录表示与存储在文件服务器4的“sharel”这样的名字空间中的文件“/sharel/c.doc”对应的元数据,在元数据ID1531中存储“120”。
[0147]图7是表示本发明的第一实施方式的文件保存管理表154的结构的一个例子的图。
[0148]文件保存管理表154存储与保存文件的存储目的地(保存目的地)有关的信息。具体地说,文件保存管理表154包含一个以上的记录,各记录由元数据ID1541、保存目的地路径1542、保存目的地名字空间ID1543构成。
[0149]文件保存管理表154的各记录与存储在保存用存储装置2中的保存文件对应。
[0150]此外,元数据服务器I检测从文件服务器4中删除文件的情况,在将该文件移动到保存用存储装置2的情况下,更新文件保存管理表154。
[0151]元数据ID1541存储用于识别元数据的标识符。元数据ID1541与元数据ID1531相同。
[0152]保存目的地路径1542存储表示存储保存文件的存储位置的路径名。保存目的地名字空间ID1543存储用于识别存储保存文件的名字空间的标识符。
[0153]在图7所示的例子中,在第一记录中,存储与图6中的文件“/sharel/b.doc”对应的保存文件相关的信息。
[0154]在元数据ID1541中,存储与文件“/sharel/b.doc”对应的元数据的标识符“ 110”。另外,在保存目的地路径1542中,存储与文件“/sharel/b.doc”对应的保存文件的存储目的地的路径名“/r/FSl/sharel/b.doc”。进而,在保存目的地名字空间ID1543中,存储有存储保存文件“/r/FSl/sharel/b.doc”的名字空间的标识符“n3001”。
[0155]接着,说明文件服务器4的结构。
[0156]图8是说明本发明的第一实施方式的文件服务器4的结构的框图。
[0157]文件服务器4具备存储器41、处理器42、网络接口 43、存储器接口 44,另外与存储装置45连接。
[0158]处理器42执行存储在存储器41中的程序。通过由处理器42执行程序,能够实现文件服务器4所具备的功能。
[0159]存储器41存储文件共享程序411、文件系统程序412、存储器输入输出程序413。
[0160]文件共享程序411是提供用于由业务程序51、分析程序61、元数据服务器程序110经由网络7对存储在存储装置45中的文件进行存取的功能的程序。
[0161]文件系统程序412构成用于将文件存储在存储装置45中的文件系统,是管理文件的输入输出的程序。
[0162]存储器输入输出程序413是管理对存储装置45读出以及写入数据的处理的程序。
[0163]通过由处理器42执行上述的程序,文件服务器4经由网络7实现文件共享功能。
[0164]存储装置45在内部生成存储卷451。存储卷451由存储装置45所具备的硬盘驱动器、固态驱动器、非易失性存储器等存储介质的存储区域构成。
[0165]存储卷451包含2个名字空间452-1、452-2。作为识别名对名字空间452-1设定“sharel”,作为识别名对名字空间452-2设定“sharel”。
[0166]各名字空间452-1、452-2分别包含数据区域453_1、453_2、隐藏文件存储区域454-1、454-2。
[0167]数据区域453-1、453_2是存储能够由业务程序51参照的文件的区域。隐藏文件存储区域454-1、454-2是暂时存储通过业务程序51被删除的文件的区域。
[0168]在业务程序51中,将存储在隐藏文件存储区域454-1、454_2中的文件作为不存在的文件来处理。即,业务程序51无法识别存储在隐藏文件存储区域454-1、454-2中的文件。
[0169]数据区域453-1、453-2和隐藏文件存储区域454-1、454-2既可以包含在不同的存储卷451中,也可以分别是单一的文件系统树内的一个目录。另外,名字空间452-1、452-2既可以分别包含在不同的存储卷451中,也可以分别是单一的文件系统树内的一个目录。
[0170]在本实施方式中,在存储卷451中定义2个名字空间,但这并不限定本发明也可以定义2个以上的名字空间。
[0171]以后,在不区别数据区域453-1、453_2的情况下,记载为数据区域453。另外,在不区别隐藏文件存储区域454-1、454-2的情况下,记载为隐藏文件存储区域454。
[0172]图9是说明本发明的第一实施方式的元数据管理程序112所执行的处理的流程图。
[0173]元数据管理程序112为了更新元数据存储库150,周期地或依照用户的请求执行本处理。
[0174]元数据管理程序112如果开始处理(步骤S8000),则参照名字空间管理表152,选择成为处理对象的一个名字空间(步骤S8001)。
[0175]接着,元数据管理程序112从存储在选择出的名字空间中的文件中选择成为处理对象的一个文件(步骤S8002)。
[0176]此外,作为文件的选择方法,可以考虑从上位的目录开始顺序地遍历名字空间中的文件系统树的方法。
[0177]元数据管理程序112从文件服务器4取得处理对象的文件的元数据(步骤S8003 )。
[0178]元数据管理程序112根据所取得的元数据,更新元数据管理表153 (步骤S8004)。具体地说,执行以下这样的处理。
[0179]元数据管理程序112判定与选择出的文件对应的记录是否已经登录。具体地说,元数据管理程序112判定是否存在路径1532和名字空间ID1533与处理对象的名字空间的标识符和处理对象的文件的路径名一致的记录。
[0180]此外,也可以是判定所取得的元数据和原始元数据是否一致的方法。例如,可以使用文件服务器4中的文件的识别信息即i节点(inode)编号。
[0181]在判定为没有登录与选择出的文件对应的记录的情况下,元数据管理程序112将新的记录登录到元数据管理表153中。这时,元数据管理程序112生成用于唯一识别元数据的标识符,将生成的标识符存储在元数据ID1531。
[0182]进而,元数据管理程序112将选择出的名字空间中的处理对象文件的路径名存储在路径1532中,将选择出的名字空间的标识符存储在名字空间ID1533中。另外,元数据管理程序112将所取得的元数据存储在原始元数据1534中,向文件状态1535中存储“存在”。
[0183]另一方的面,在已经登录与选择出的文件对应的记录的情况下,元数据管理程序112将所取得的元数据存储在现存的记录的原始元数据1534中。
[0184]元数据管理程序112判定是否针对存储在处理对象的名字空间中的全部文件完成了处理(步骤S8005)。
[0185]在判定为没有对存储在处理对象的名字空间中的全部文件完成处理的情况下,元数据管理程序112返回到步骤S8002,执行同样的处理(步骤S8002?步骤S8005)。
[0186]在判定为对存储在处理对象的名字空间中的全部文件完成了处理的情况下,元数据管理程序112判定是否对作为管理对象的全部名字空间完成了处理(步骤S8006)。
[0187]在判定为没有对作为管理对象的全部名字空间完成处理的情况下,元数据管理程序112返回到步骤S8001,执行同样的处理(步骤S8001?步骤S8006)。
[0188]在判定为对作为管理对象的全部名字空间完成了处理的情况下,元数据管理程序112结束处理(步骤S8007)。
[0189]图10是说明本发明的第一实施方式的文件共享程序411所执行的处理的流程图。
[0190]文件服务器4在从业务程序51或其他程序接收到对文件的存取请求的情况下,执行以下说明的处理。
[0191]文件共享程序411如果开始处理(步骤S8100),则经由网络7从业务程序51或其他程序接收对规定的文件的存取请求(步骤S8101 )。
[0192]文件共享程序411判定接收到的存取请求是否是文件的删除请求(步骤S8102)。
[0193]在判定为接收到的存取请求不是文件的删除请求的情况下,文件共享程序411向文件系统程序412指示依照接收到的存取请求执行处理(步骤S8105)。然后,文件共享程序411发送对存取请求的发送源的程序的应答,结束处理(步骤S8106)。
[0194]在判定为接收到的存取请求是文件的删除请求的情况下,文件共享程序411向元数据服务器I的文件删除检测程序113通知接收到包含文件的删除请求的存取请求的信息(步骤 S8103)。
[0195]以后,将接收到请求删除文件的存取请求的信息的通知记载为删除通知。另外,将从业务程序51或其他程序请求了删除的文件称为删除对象文件。删除对象文件最终由元数据服务器I移动到保存用存储装置2。如果将删除对象文件移动到保存用存储装置2并在元数据管理表153的文件状态1535中存储了 “删除”,则该文件成为删除文件。
[0196]此外,在删除通知中,包含删除对象文件的路径名、存储删除对象文件的名字空间、文件服务器的识别名、删除对象文件的元数据等的信息。
[0197]文件共享程序411如果从文件删除检测程序113接收到对删除通知的应答,则依照该应答,执行对删除对象文件的处理(步骤S8104)。此外,在从文件删除检测程序113发送的应答中,包含来自文件保存程序114的指示。具体地说,执行以下那样的处理。
[0198]文件共享程序411在接收到的应答中包含删除对象文件的隐藏的指示的情况下,将删除对象文件移动到隐藏文件存储区域454中。由此,业务程序51无法对删除对象文件进行存取。即,从业务程序51识别为该文件已经删除。
[0199]另外,文件共享程序411在接收到的应答中包含删除对象文件的删除的指示的情况下,将删除对象文件删除。
[0200]此外,文件共享程序411向文件系统程序412输出指示,由此实现删除对象文件的移动处理和删除处理。
[0201]以后,将存储在隐藏文件存储区域454中的删除对象文件称为隐藏文件。
[0202]如果对删除对象文件的处理结束,则文件共享程序411结束处理(步骤8106)。
[0203]在本实施方式中,由文件共享程序411执行处理,但也可以由文件系统程序412等其他程序执行。
[0204]图11A、图1lB和图1lC是说明本发明的第一实施方式的文件删除检测程序113所执行的处理的流程图。
[0205]文件删除检测程序113如果开始处理(步骤S8200),则检测从文件服务器4删除文件的情况(步骤S8201)。文件删除检测程序113将该文件识别为删除对象文件。
[0206]在本实施方式中,文件删除检测程序113通过从文件共享程序411接收删除通知(参照步骤S8103),能够检测从文件服务器4删除文件的情况。此外,在该通知中包含删除对象文件的路径名、名字空间名、元数据等。
[0207]文件删除检测程序113对与元数据管理表153的删除对象文件对应的记录进行更新(步骤S8202)。
[0208]具体地说,文件删除检测程序113根据包含在接收到的删除通知中的信息参照元数据管理表153,确定与删除对象文件对应的记录,在该记录的文件状态1535中存储“删除”。
[0209]文件删除检测程序113对文件服务器4执行针对删除对象文件的文件隐藏处理(步骤S8203)。在文件隐藏处理中,执行以下的处理。
[0210]首先,文件删除检测程序113向发送了删除通知的文件服务器4指示对删除对象文件的隐藏处理的执行(步骤S8204)。
[0211]接收到隐藏处理的执行指示的文件服务器4的文件共享程序411将删除对象文件移动到隐藏文件存储区域454。由此,将删除文件作为隐藏文件来处理。此外,隐藏文件的路径名既可以由文件共享程序411或文件系统程序412自动地决定,也可以由文件删除检测程序113自动地决定。
[0212]接着,文件删除检测程序113更新文件保存管理表154 (步骤S8205)。具体地说,执行以下的处理。
[0213]文件删除检测程序113向文件保存管理表154追加新的记录,将与删除对象文件对应的记录的元数据ID1531存储在该记录的元数据ID1541中。文件删除检测程序113将隐藏文件的路径名存储在保存目的地路径1542中,将存储隐藏文件的名字空间的标识符存储在保存目的地名字空间ID1543中。
[0214]以上是对删除对象文件的隐藏处理的说明。
[0215]接着,文件删除检测程序113执行隐藏文件的保存处理(步骤S8206),结束处理(步骤S8210)。在对隐藏文件的保存处理中,执行以下的处理。
[0216]首先,文件删除检测程序113调用文件保存程序114,指示对隐藏文件的保存处理的执行。
[0217]接收到该保存处理的执行指示的文件保存程序114将隐藏文件复制到保存用存储装置2上的名字空间(步骤S8207)。所复制的文件成为隐藏文件。这时,假设保存文件的路径名被决定为在存储保存文件的名字空间内唯一的路径名。
[0218]文件保存程序114通知保存文件的信息、以及对隐藏文件的保存处理的完成。
[0219]接着,文件删除检测程序113根据在接收到的完成通知中包含的信息,更新文件保存管理表154 (步骤S8208)。具体地说,将保存文件的路径名存储在步骤S8205中追加的记录的保存目的地路径1542中,将存储保存文件的名字空间的标识符存储在保存目的地名字空间ID1543中。
[0220]接着,文件删除检测程序113向文件服务器4指示隐藏文件的删除(步骤S8209)。接收到该指示的文件服务器4从与隐藏文件存储区域454对应的名字空间中删除隐藏文件。
[0221]此外,文件服务器4也可以周期地向元数据服务器I查询是否存在应该删除的文件。在该情况下,文件删除检测程序113也可以不指示隐藏文件的删除。
[0222]图12是表示在本发明的第一实施方式中文件移动后的元数据管理表153的说明图。图13是表示在本发明的第一实施方式中文件移动后的文件保存管理表154的说明图。
[0223]在此,以存储在文件服务器4的名字空间“sharel”的文件“sharel/a.doc”移动到保存用存储装置2中的情况为例进行说明。
[0224]如果对图6和图12进行比较,则可知与文件“sharel/a.doc”对应的第一记录的文件状态1535从“存在”变化为“删除”。这表示文件“sharel/a.doc”成为删除文件。
[0225]另外,如果对图7和图13进行比较,则可知向文件保存管理表154追加了新的第二记录。第二记录在元数据ID1541中存储“100”。因此,可知第二记录是存储元数据的标识符是“ 100”的文件、即与文件“sharel/a.doc”对应的保存文件的信息的记录。
[0226]另外,如果参照保存目的地路径1542和保存目的地名字空间ID1543,则可知与文件“sharel/a.doc”对应的保存文件的路径名是“r/FSl/sharel/a.doc”,保存目的地名字空间ID1543是用“n3001”识别的名字空间、即保存用存储装置2的名字空间“r”。
[0227]图14是说明本发明的第一实施方式的查询处理程序111所执行的处理的流程图。
[0228]查询处理程序111在从分析程序61请求了元数据服务器I所管理的文件的一览的输出时执行处理。
[0229]查询处理程序111如果开始处理(步骤S8300),则从分析程序61接收文件的查询(步骤 S8301)。
[0230]在该查询中,可以包含所输出的文件的条件。作为条件,例如可以考虑在路径名中包含特定的字符串的文件、更新为特定的时间段的文件、特定的拥有者的文件、设定了特定的存取权的文件、要存储在特定的文件服务器或名字空间中的文件、或已存储在特定的文件服务器或名字空间中的文件等。另外,也可以指定是删除文件、不是删除文件、是删除文件和不是删除文件的双方等与删除文件有关的条件。进而,还可以指定满足上述条件的文件的集合的与、或。
[0231]查询处理程序111参照元数据存储库150,在存储器11上生成满足指定的条件的文件的列表116 (步骤S8302)。具体地说,查询处理程序111参照存储管理表151、名字空间管理表152、元数据管理表153,生成列表116。
[0232]图15A和图15B是表不本发明的第一实施方式的列表116的结构的一个例子的说明图。
[0233]列表116存储元数据服务器I所管理的各文件的信息。具体地说,列表116包含元数据ID1161、路径1162、原始元数据1163、存储器ID1164、IP地址1165、名字空间ID1166、文件状态1167、保存目的地信息1168。
[0234]元数据ID1161存储用于识别元数据的标识符。元数据ID1161与元数据ID1531相同。
[0235]路径1162存储表示存储文件的存储位置的路径。路径1162与路径1532相同。
[0236]原始元数据1163存储文件的元数据。原始元数据1163与元数据元数据1153相同。
[0237]存储器ID1164对存储文件的存储装置的标识符进行存储。存储器ID1164与存储器ID1511相同。
[0238]IP地址1165存储存储装置被分配的IP地址。IP地址1165与IP地址1514相同。
[0239]名字空间ID1166存储用于元数据服务器I唯一地识别名字空间的标识符。名字空间ID1166与名字空间ID1521相同。
[0240]文件状态1167存储表示文件是否存在于文件服务器4中的信息。文件状态1167与文件状态1535相同。
[0241]保存目的地信息1168存储与保存文件有关的信息。此外,在不是保存文件的情况下,不在保存目的地信息1168中存储信息。
[0242]保存目的地信息1168包含保存目的地路径11681、存储器IDl 1682、IP地址11683、保存目的地名字空间IDl 1684。
[0243]保存目的地路径11681存储表示存储保存文件的存储位置的路径。保存目的地路径11681与保存目的地路径1542相同。
[0244]存储器ID11682对存储保存文件的存储装置的标识符进行存储。存储器ID11682与存储器ID1511相同。
[0245]IP地址11683存储IP地址,该IP地址是存储保存文件的存储装置被分配的IP地址。IP地址11683与IP地址1514相同。
[0246]保存目的地名字空间ID11684存储用于识别存储保存文件的名字空间的标识符。保存目的地名字空间ID11684与保存目的地名字空间ID1543相同。
[0247]在步骤S8302中,向元数据ID1161、路径1162、原始元数据1163、存储器ID1164、IP地址1165、名字空间ID1166、文件状态1167存储信息。
[0248]以上,是列表116的说明。返回到图14的说明。[0249]查询处理程序111从生成的列表中选择一个与删除文件对应的条目(步骤S8303)。具体地说,查询处理程序111选择在文件状态1167中存储“删除”的条目。此外,在存在多个与删除文件对应的条目的情况下,可以考虑从条目的上位开始按顺序进行选择的方法。
[0250]查询处理程序111参照文件保存管理表154,取得与选择出的条目对应的删除文件的保存目的地的信息(步骤S8304)。
[0251]具体地说,查询处理程序111从文件保存管理表154中确定与选择出的条目的元数据IDl 161 —致的记录。
[0252]查询处理程序111从所确定的记录中取得保存目的地路径1542、保存目的地名字空间ID1543。进而,查询处理程序111使用保存目的地名字空间ID1543,从存储管理表151和名字空间管理表152,取得存储保存文件的保存用存储装置2的识别名、IP地址、名字空间的识别名。
[0253]接着,查询处理程序111根据在步骤S8304中取得的信息,更新列表116 (步骤S8305)。具体地说,把在步骤S8304中取得的信息存储在选择出的条目的保存目的地信息1169 中。
[0254]查询处理程序111针对与包含在列表116中的全部删除文件对应的条目判定处理是否完成(步骤S8306)。
[0255]在判定为针对与全部的删除文件对应的条目处理没有完成的情况下,查询处理程序111返回到步骤S8303,执行同样的处理(步骤S8303?步骤S8306)。
[0256]在判定为针对与全部的删除文件对应的条目处理完成的情况下,查询处理程序111向文件一览的输出请求的发送源即分析程序61发送所生成的列表116,结束处理(步骤S8307、步骤 S8308)。
[0257]图16是说明本发明的第一实施方式的分析程序61所执行的文件分析处理的流程图。
[0258]分析程序61周期地或依照用户的指示执行分析处理。
[0259]分析程序61如果开始分析处理(步骤S8400),则向元数据服务器I的查询处理程序111发送全部存储在文件服务器4中的文件的查询(步骤S8401)。在该输出请求中,也可以包含应该包含在列表116中的文件的条件。
[0260]分析程序61等待来自元数据服务器I的应答。即,到从元数据服务器I发送列表116为止等待处理。
[0261]分析程序61从接收到的列表116中选择一个成为处理对象的条目(步骤S8402)。例如可以考虑从列表116的上位的条目开始按顺序进行选择的方法。
[0262]分析程序61根据处理对象的条目,取得与该条目对应的文件的读出目标的信息(步骤S8403)。具体地说,执行以下的处理。
[0263]首先,分析程序61判定在选择出的条目的文件状态1167中是否存储有“删除”。在文件状态1167中存储有“删除”的情况下,可知选择出的条目是与删除文件有关的条目。
[0264]在文件状态1167中存储有“删除”的情况下,分析程序61取得存储在保存目的地信息1168中的信息。即,取得保存目的地路径11681、存储器ID11682、IP地址11683、保存目的地名字空间ID11684。[0265]在文件状态1167中存储有“删除”的情况下,分析程序61取得路径1162、存储器ID1164、IP 地址 1165、名字空间 ID1166。
[0266]以上是步骤S8403的处理。
[0267]接着,分析程序61根据在步骤S8403中取得的信息,从成为读出目标的存储装置中读出与选择出的条目对应的文件(步骤S8404)。
[0268]分析程序61根据读出的文件的内容、选择出的条目的原始元数据1163,执行规定的分析处理(步骤S8405)。
[0269]分析程序61判定针对取得的列表116的全部条目是否完成处理(步骤S8406)。
[0270]在判定为针对全部的条目没有完成处理的情况下,分析程序61返回到步骤S8402,执行同样的处理(步骤S8402?步骤S8406)。
[0271]在判定为针对全部的条目完成处理的情况下,分析程序61结束分析处理(步骤S8407)。
[0272]此外,在步骤S8404中,有时存储文件的存储装置是无法从分析程序61进行存取的存储装置。例如,相当于在分析程序61中不支持用于读出文件的文件共享协议的情况
坐寸ο
[0273]在该情况下,分析程序61向文件代理读出程序115发送希望的文件的读出请求。接收到该请求的文件代理读出程序115代替分析程序61从存储装置读出文件,向分析程序61应答所读出的文件。
[0274][第二实施方式]
[0275]接着,说明本发明的第二实施方式。
[0276]在第一实施方式中,文件服务器4在从业务程序51接收到文件的删除请求的情况下,在处理的过程中向元数据服务器I发送该文件的删除通知。然后,文件服务器4依照元数据服务器I的指示执行隐藏处理。
[0277]在第二实施方式中,不同点在于,文件服务器4在从业务程序51接收到一定数量的文件的删除请求的情况下,在发送删除通知后经过了一定时间的情况下,汇总多个文件的删除通知发送给元数据服务器I。另外,在第二实施方式中,文件服务器4为了汇总地发送多个文件的删除通知,在接收到文件的删除请求的情况下,不等待来自元数据服务器I的指示,自动地执行文件的隐藏处理。
[0278]以后,以与第一实施方式的差异为中心进行说明。
[0279]第二实施方式的计算机系统500的结构、元数据服务器I的结构、元数据服务器I所管理的表与第一实施方式相同,因此省略说明。第二实施方式的文件服务器4在存储器41中新具备隐藏文件管理表415 (省略图不)这一点与第一实施方式的文件服务器4不同。其他结构与第一实施方式相同,因此省略说明。
[0280]图17是表示本发明的第二实施方式的隐藏文件管理表415的结构的一个例子的说明图。
[0281]隐藏文件管理表415存储与隐藏文件有关的信息。具体地说,隐藏文件管理表415包含路径4151、名字空间ID4152、原始元数据4153、隐藏文件路径4154。
[0282]路径4151存储执行隐藏处理前的文件的路径名。名字空间ID4152存储在执行隐藏处理前存储了文件的名字空间的识别名。[0283]原始元数据4153存储执行隐藏处理前的文件的元数据。隐藏文件路径4154存储隐藏文件的路径名。
[0284]图18是说明本发明的第二实施方式的文件共享程序411所执行的处理的流程图。
[0285]文件共享程序411如果开始处理(步骤S8600),则经由网络7,从业务程序51或其他程序接收对规定的文件的存取请求(步骤S8601 )。
[0286]文件共享程序411判定接收到的存取请求是否是文件的删除请求(步骤S8602)。
[0287]在判定为接收到的存取请求不是对文件的删除请求的情况下,文件共享程序411向文件系统程序412指示执行与接收到的存取请求一致的处理(步骤S8607)。然后,文件共享程序411发送对存取请求的发送源的程序的应答,结束处理(步骤S8608)。
[0288]在判定为接收到的存取请求是文件的删除请求的情况下,文件共享程序411将删除对象文件移动到隐藏文件存储区域454 (步骤S8603)。由此,从业务程序51识别为删除对象文件被删除。
[0289]文件共享程序411更新隐藏文件管理表415(步骤S8604)。即,文件共享程序411将隐藏文件的信息存储到隐藏文件管理表415中。
[0290]具体地说,文件共享程序411生成新的记录,把删除对象文件移动到隐藏文件存储区域454之前存储的路径名、名字空间的识别名、元数据、以及隐藏文件的路径名存储到所生成的记录中。文件共享程序411决定隐藏文件的路径名,使其在隐藏文件管理表415
内不重复。
[0291]文件共享程序411判定是否需要向元数据服务器I发送文件的删除通知(步骤S8605)。例如,文件共享程序411在隐藏文件管理表415中登录了预先设定的一定数量以上的记录的情况或者从上次的删除通知经过了预先设定的时间的情况下,判定为需要发送文件的删除通知。
[0292]在判定为不需要向元数据服务器I发送文件的删除通知的情况下,文件共享程序411结束处理(步骤S8608)。
[0293]在判定为需要向元数据服务器I发送文件的删除通知的情况下,文件共享程序411向元数据服务器I发送文件的删除通知(步骤S8606)。在该通知中,包含存储在隐藏文件管理表415中的全部记录的信息、即与全部的隐藏文件有关的信息。然后,文件共享程序411结束处理(步骤S8608)。
[0294]此外,步骤S8605和步骤S8606的处理在对来自业务程序51的存取请求的处理的过程中执行,但该2个处理也可以作为与对存取请求的处理独立的处理而周期地执行。
[0295]文件删除检测程序113如果从文件共享程序411接收到删除通知,则执行图11所示的处理。其中,在接收到删除通知时,由文件服务器4对删除文件进行隐藏,因此不执行步骤S8203的处理。
[0296][第三实施方式]
[0297]接着,说明本发明的第三实施方式。
[0298]第三实施方式对第二实施方式进行扩展,其特征为进行管理,除了删除文件以外,分析程序61还针对由于对文件的覆盖写入和文件的大小的变更等从文件中部分消去的数据进行读出。
[0299]以后,将由于文件的删除、对文件的覆盖写入、或文件大小缩小而消去的数据称为消去数据。
[0300]另外,将通过上述的处理产生了消去数据,因此无法从文件服务器4读出,但能够通过查询元数据服务器I而取得的文件称为删除文件。特别将由于对文件的覆盖写入、文件大小缩小而消去了数据的一部分的文件称为部分消去数据。
[0301]另外,将存储了消去数据的文件服务器4上的文件称为原始文件。将用于保存消去数据的文件称为保存文件。在一个保存文件中,存储在一次存取处理中产生的消去数据。
[0302]以后,以与第一实施方式和第二实施方式的差异为中心进行说明。
[0303]第三实施方式的计算机系统500的结构、元数据服务器I的结构与第一实施方式相同,因此省略说明。另外,第三实施方式的文件服务器4的结构与第二实施方式相同,因此省略说明。
[0304]在第三实施方式中,元数据服务器I所具备的文件保存管理表154、文件服务器4所具备的隐藏文件管理表415不同。
[0305]图19是表示本发明的第三实施方式的文件保存管理表的结构的一个例子的说明图。
[0306]第三实施方式的文件保存管理表154存储在元数据服务器I的存储器11中。
[0307]文件保存管理表154存储对消去数据和保存文件的对应进行管理的信息。具体地说,文件保存管理表154包含一个以上的记录,各记录由元数据ID1541、保存目的地路径1542、保存目的地名字空间ID1543、地址范围1544构成。
[0308]文件保存管理表154的各记录与在一次的存取处理中产生的消去数据相关的信息对应。
[0309]与第一实施方式的文件保存管理表154相比,新追加了地址范围1544。地址范围1544对存储了消去数据的原始文件上的地址范围进行存储。
[0310]元数据服务器I如果检测出在文件服务器4中消去了数据,则将消去数据移动到保存文件,并且更新文件保存管理表154。
[0311]在图19所示的例子中,在第一记录中,存储与文件“/sharel/b.doc”的消去数据有关的信息。在元数据ID1541中存储与文件“/sharel/b.doc”对应的元数据的标识符“110”。另外,在保存目的地路径1542中存储保存文件的存储目的地的路径名“r/FSl/sharel/b.doc”。在保存目的地名字空间ID1543中,存储对保存文件“r/FSl/sharel/b.doc”进行存储的名字空间的标识符“n3001”。进而,在地址范围1544中,存储原始文件“/sharel/b.doc”的消去数据的地址范围[10,20)。
[0312]图20是表示本发明的第三实施方式的隐藏文件管理表415的结构的一个例子的说明图。
[0313]第三实施方式的隐藏文件管理表415存储在文件服务器4的存储器41中。
[0314]隐藏文件管理表415存储管理消去数据和隐藏文件的对应的信息。具体地说,隐藏文件管理表415包含一个以上的记录,各记录由路径4151、名字空间ID4152、原始元数据4153、隐藏文件路径4154、地址范围4155、消去种类4156构成。
[0315]隐藏文件管理表415的各记录对应于在一次存取处理中产生的消去数据相关的信息。
[0316]与第二实施方式相比,新追加了地址范围4155和消去种类4156。地址范围4155对存储了原始文件的消去数据的地址范围进行存储。消去种类4156存储产生消去数据的原因。
[0317]在由于删除文件而产生了消去数据的情况下,在消去数据种类4156中,存储表示删除了文件的信息即“删除”。在由于文件的一部分被覆盖写入或文件的大小的缩小而产生了消去数据的情况下,在消去种类4156中,存储表示消去了文件的一部分数据的信息即“一部分消去”。
[0318]文件服务器4在产生消去数据的情况、即请求了文件的删除、对文件的覆盖写入、或文件大小的缩小等处理的情况下,从原始文件中读出消去数据,将消去数据写入到隐藏文件,并且更新隐藏文件管理表415。
[0319]图21是说明本发明的第三实施方式的文件共享程序411所执行的处理的流程图。
[0320]在第三实施方式中,与第二实施方式的不同点在于,不只是请求了文件的删除的情况,在由于对文件的覆盖写入和文件大小的缩小而产生消去数据的情况下,也将该消去数据存储到隐藏文件存储区域454中。
[0321 ] 与第二实施方式相同,文件共享程序411如果开始处理(步骤S8700),则经由网络7,从业务程序51或其他程序接收对文件的存取请求(步骤S8701)。
[0322]文件共享程序411如果执行与接收到的存取请求对应的处理,则判定是否产生消去数据(步骤S8702)。即,判定接收到的存取请求是否请求从文件中进行数据的消去。例如,在是文件的删除、对文件的数据的覆盖写入、或文件大小的缩小等的请求的情况下,如果执行与接收到的存取请求对应的处理,则判定为产生消去数据。
[0323]在判定为不产生消去数据的情况下,文件共享程序411前进到步骤S8705。
[0324]在判定为产生消去数据的情况下,文件共享程序411将消去数据移动到隐藏文件存储区域454 (步骤S8703)。
[0325]具体地说,文件共享程序411确定消去数据的地址范围,生成用于将消去数据存储在隐藏文件存储区域454上的隐藏文件,将消去数据存储到所生成的隐藏文件中。
[0326]这时,决定隐藏文件的路径名,使其与存储在隐藏文件存储区域454中的其他隐藏文件不重复。
[0327]文件共享程序411根据所生成的隐藏文件的信息,更新隐藏文件管理表415 (步骤
58704)。
[0328]具体地说,文件共享程序411向隐藏文件管理表415追加新的记录。
[0329]文件共享程序411将原始文件的路径名存储到追加的记录的路径4151中,将存储原始文件的名字空间的标识符存储到名字空间ID4152中,将原始文件的元数据存储到原始元数据4153中。
[0330]另外,文件共享程序411将所生成的隐藏文件的路径名存储到隐藏文件路径4154中,将消去数据的地址范围存储到地址范围4155中。进而,文件共享程序411在删除文件的情况下在消去种类4156中存储“删除”,在不删除文件的情况下在消去种类4156中存储“一部分消去”。
[0331]接着,文件共享程序411对文件执行与接收到的存取请求对应的处理(步骤
58705)。
[0332]文件共享程序411判定是否需要发送删除通知(步骤S8706)。此外,假设在删除通知中,包含通知接收到产生消去数据的存取请求的信息。
[0333]例如,在隐藏文件管理表415中登录了预先设定的一定数量以上的记录的情况,或从上次的删除通知经过了预先设定的时间的情况下,判定为需要发送删除通知。
[0334]在判定为不需要向元数据服务器I发送删除通知、即表示产生了消去数据的通知的情况下,文件共享程序411结束处理(步骤S8708)。
[0335]在判定为需要向元数据服务器I通知删除通知、即产生了消去数据的情况下,文件共享程序411向元数据服务器I通知产生了消去数据(步骤S8707)。在该通知中,包含存储在隐藏文件管理表415中的全部记录的信息、即与全部隐藏文件有关的信息。然后,文件共享程序411结束处理(步骤S8708)。
[0336]此外,步骤S8706和步骤S8707的处理在对存取请求的处理的过程中执行,但也可以作为与针对存取请求的处理独立的处理而周期地执行。
[0337]图22是说明本发明的第三实施方式的文件删除检测程序113所执行的处理的流程图。
[0338]文件删除检测程序113如果开始处理(步骤S8800),则检测文件服务器4中的消去数据的产生(步骤S8801)。
[0339]具体地说,文件删除检测程序113通过从文件服务器4接收通知产生了消去数据的删除通知,能够检测在文件服务器4中产生了消去数据的情况。此外,在删除通知中,包含存储在隐藏文件管理表415中的信息。
[0340]在此,说明文件删除检测程序113对每个消去数据、即对隐藏文件管理表415的每个记录执行处理的情况。
[0341]文件删除检测程序113根据包含在接收到的删除通知中的隐藏文件管理表415,判定是否由于文件的删除而产生了处理对象的消去数据(步骤S8802)。即,判定包含处理对象的消去数据的文件是删除文件还是部分消去文件。
[0342]文件删除检测程序113在消去种类4156中存储“删除”的情况下,判定为是由于文件的删除而产生的消去数据。另一方面,文件删除检测程序113在消去种类4156中存储“一部分消去”的情况下,判定为是由于文件的覆盖写入或文件大小的缩小而产生的消去数据。
[0343]在判定为由于文件的删除而产生的消去数据的情况下,文件删除检测程序113确定元数据管理表153的与处理对象的文件对应的记录,在该记录的文件状态1535中存储“删除”(步骤S8803)。然后,文件删除检测程序113前进到步骤S8804。
[0344]在判定为不是由于文件的删除而产生的消去数据的情况下,文件删除检测程序113向元数据管理表153追加与处理对象的文件对应的记录(步骤S8808)。
[0345]具体地说,文件删除检测程序113在追加的记录的元数据ID1531中存储不与其他记录重复的标识符。文件删除检测程序113在追加的记录的路径1532和原始元数据1534中存储处理对象的文件的路径名和元数据。文件删除检测程序113在名字空间ID1533中存储用于存储处理对象的文件的名字空间的标识符。另外,文件删除检测程序113在文件状态1535中存储“一部分消去”。
[0346]此外,可以根据从文件服务器4接收到的删除通知中包含的信息,取得存储在追加的记录中的信息。[0347]文件删除检测程序113更新文件保存管理表154 (步骤S8804)。具体地说,文件删除检测程序113追加与存储处理对象的消去数据的隐藏文件对应的记录。
[0348]在追加的记录的元数据ID1541中,存储与在步骤S8804中确定的记录的元数据ID1531或者在步骤S8808中追加的记录的元数据ID1531相同的元数据ID。在保存目的地路径1542中存储隐藏文件的路径名,在保存目的地名字空间ID1543中存储用于存储隐藏文件的名字空间的标识符,在地址范围1544中存储在隐藏文件中存储的消去数据的地址范围。此外,可以根据从文件服务器4接收到的删除通知中包含的信息,取得在追加的记录中存储的信息。
[0349]文件删除检测程序113将隐藏文件移动到保存用存储装置2 (步骤S8805)。具体地说,文件删除检测程序113将隐藏文件复制到保存用存储装置2的名字空间上,将处理对象的消去数据移动到保存文件。这时,决定保存文件的路径名,使其与存储在保存用存储装置2中的其他保存文件不重复。
[0350]文件删除检测程序113更新文件保存管理表154 (步骤S8806)。具体地说,文件删除检测程序113将在步骤S8804中追加的记录的保存目的地路径1542变更为保存文件的路径名。
[0351]文件删除检测程序113向文件服务器4指示隐藏文件的删除(步骤S8807)。然后,文件删除检测程序113结束处理(步骤S8809)。
[0352]图23和图24是表示本发明的第三实施方式的元数据管理表153的一个例子的说明图。图25是表示本发明的第三实施方式的文件保存管理表154的一个例子的说明图。
[0353]在此,说明将数据覆盖写入到在文件服务器4的名字空间“sharel”中存储的文件“/sharel/a.doc”中时的元数据管理表153和文件保存管理表154。
[0354]图23表示将数据覆盖写入到文件“/sharel/a.doc”中之前的元数据管理表153。在元数据管理表153的第一记录中,记录文件“/sharel/a.doc”的信息。根据存储在该记录中的信息,可知文件“/sharel/a.doc”存储在文件服务器4中,更新时刻是“ 10:00”。
[0355]图24表示将数据覆盖写入到文件“/sharel/a.doc”中,元数据服务器I将消去数据移动到保存用存储装置2后的元数据管理表153。
[0356]与图23相比,追加了元数据ID1531是“101”的第二记录。该记录表示元数据服务器I将更新时刻是“10:00”的时刻的文件“/sharel/a.doc”作为部分消去文件来管理。因此,在该记录的文件状态1535中存储“一部分消去”。
[0357]另外,可知第一记录通过对文件“/sharel/a.doc”的数据的覆盖写入,更新时刻被变更为“12:00”。
[0358]图25表示将数据覆盖写入到文件“/sharel/a.doc”中,元数据服务器I将消去数据移动到保存用存储装置2后的文件保存管理表154。
[0359]在图25的文件保存管理表154的第一记录中,存储与图24的元数据管理表153的第二记录对应的部分消去文件的消去数据和与保存文件有关的信息。
[0360]在第二记录的元数据ID1541中存储“100”。因此,可知第二记录是与图24的元数据管理表153的第二记录对应的部分消去文件的消去数据相关联的记录。
[0361]根据保存目的地路径1542和保存目的地名字空间ID1543,可知消去数据作为路径名是“A/r/slOOO/share/a.doc_diff”的文件存储在保存用存储装置2的名字空间“r”中。
[0362]另外,根据地址范围1544,可知消去数据是存储在原始文件的从地址“O”到“29”的范围中的数据。
[0363]图26是说明本发明的第三实施方式的文件代理读出程序115所执行的处理的流程图。
[0364]本实施方式的文件代理读出程序115接受通常文件、删除文件、部分消去文件的读出请求,向请求源应答文件的内容。在所请求的文件是删除文件或部分消去文件的情况下,暂时恢复所请求的文件,应答恢复后的文件的内容。
[0365]文件代理读出程序115如果开始处理(步骤S8900),则从分析程序61等接收文件的读出请求(步骤S8901)。在接收到的文件读出请求中,包含用于由请求源的程序指定文件的信息。例如,包含文件的路径名、名字空间名、元数据、其他标识符(元数据ID、文件系统中的i节点编号)等信息。
[0366]文件代理读出程序115根据包含在接收到的文件读出请求中的信息,确定元数据管理表153的对应的记录(步骤S8902)。
[0367]文件代理读出程序115参照所确定的记录的文件状态1535,判定读出对象的文件是否是通常文件(步骤S8903)。
[0368]在文件状态1535是“删除”或“一部分消去”的情况下,判定为读出对象的文件是删除文件或部分消去文件。另一方面,在文件状态1535是“存在”的情况下,判定为是通常文件。
[0369]在判定为读出对象的文件不是通常文件、即是删除文件或部分消去文件中的任意一种的情况下,文件代理读出程序115执行用于恢复读出对象的文件的恢复处理(步骤S8904)。由此,将文件暂时恢复到保存用存储装置2中。此外,将在后面使用图27详细说明恢复处理。
[0370]然后,文件代理读出程序115向请求源发送恢复后的文件,结束处理(步骤S8905、步骤 S8907)。
[0371]在步骤S8903中判定为是通常文件的情况下,文件代理读出程序115确定读出对象的文件的存储目的地(步骤S8906)。具体地说,根据文件服务器4的标识符、名字空间的标识符、路径名等确定文件的存储目的地。
[0372]进而,文件代理读出程序115从所确定的存储目的地的文件服务器4读出读出对象的文件,向请求源发送读出的文件,结束处理(步骤S8905、步骤S8907)。
[0373]图27是说明本发明的第三实施方式的恢复处理的详细的流程图。
[0374]文件代理读出程序115如果开始处理(步骤S9000),则从元数据管理表153抽出与读出对象的文件相关联的记录(步骤S9001)。在此,抽出同一读出对象的文件、即时序比在步骤S8903中确定的记录新的记录。
[0375]具体地说,文件代理读出程序115抽出路径1532和名字空间ID1533与读出对象的文件一致,并且在原始元数据1534中包含的更新时刻比读出对象的文件的更新时刻晚,即更新时刻新的记录。
[0376]文件代理读出程序115判定读出对象的文件当前是否是删除文件(步骤S9002)。具体地说,文件代理读出程序115确定抽出的记录中的在原始元数据1534中存储的更新时刻最新的记录,判定该记录的文件状态1535是否是“删除”。
[0377]在判定为读出对象的文件当前是删除文件的情况下,文件代理读出程序115根据在步骤S9001中抽出的删除文件的记录,将删除文件作为暂时文件复制到工作区域中(步骤S9003)。在此,工作区域是保存用存储装置2的一存储区域。
[0378]另一方面,在判定为读出对象的文件当前不是删除文件、即是部分消去文件的情况下,文件代理读出程序115根据在步骤S9001中抽出的记录,读出当前存储在文件服务器4中的读出对象的文件,将读出的文件作为暂时文件复制到工作区域中(步骤S9007)。
[0379]文件代理读出程序115从抽出的记录中选择出在步骤S9003中确定的记录的下一个更新时间新的记录,来作为处理对象的记录(步骤S9004)。
[0380]文件代理读出程序115将存储在保存文件中的删除数据覆盖写入到暂时文件上(步骤S9005)。具体地说,执行以下的处理。
[0381]文件代理读出程序115根据在步骤S9004中选择出的记录的信息,从文件保存管理表154中确定对应的保存文件的记录。
[0382]文件代理读出程序115根据所确定的记录,从保存用存储装置2读出保存文件,由此取得删除数据。
[0383]文件代理读出程序115参照所确定的记录的地址范围1544,将读出的删除数据覆盖写入到暂时文件上的同一地址范围。另外,文件代理读出程序115将暂时文件的文件大小变更为在元数据管理表153的选择出的记录的原始元数据1534中存储的文件大小。
[0384]通过以上的处理,暂时文件成为与把步骤S9004中选择出的记录追加到元数据管理表153中的时刻的文件相同的内容。
[0385]文件代理读出程序115判定针对在步骤S9001中抽出的全部记录是否完成了处理(步骤 S9006)。
[0386]在判定为没有对在步骤S9001中抽出的全部记录完成处理的情况下,文件代理读出程序115返回到步骤S9004,执行同样的处理(步骤S9004?步骤S9006)。
[0387]在判定为没有对在步骤S9001中抽出的全部记录完成处理的情况下,文件代理读出程序115结束处理(步骤S9008)。
[0388]此外,在第三实施方式中,元数据服务器I读出文件,并将读出的文件发送到分析服务器6。但是,本发明并不限于此,也可以由分析服务器6取得文件。在该情况下,执行以下的处理。
[0389]在步骤S8905中,文件代理读出程序115生成列表116,将生成的列表116发送到分析服务器6。此外,列表116的生成方法使用与第一实施方式相同的方法。此外,在列表116的与暂时文件对应的记录的保存目的地路径11681中,存储工作区域中的暂时文件的存储位置的信息。
[0390]分析服务器6根据接收到的列表116,读出文件。该处理与第一实施方式相同,因此省略说明。
[0391]在本实施方式中,将各消去数据存储在一个保存文件或隐藏文件中,但本发明并不限于此。例如,也可以将消去数据汇总地存储在若干个文件中,还可以存储在数据库或块存储器中。
[0392][第四实施方式][0393]接着,说明本发明的第四实施方式。
[0394]第四实施方式对第一实施方式进行扩展,在将与删除文件相同的内容的文件存储到备份存储装置3中的情况下,不生成与删除文件对应的保存文件。由此,能够在计算机系统500内削减相同内容的复制文件。
[0395]以后,以与第一实施方式的差异为中心进行说明。
[0396]第四实施方式的计算机系统500的结构、元数据服务器I的结构、文件服务器4的结构与第一实施方式相同,因此省略说明。另外,元数据服务器I和文件服务器4所管理的各表的结构也与第一实施方式相同,因此省略说明。
[0397]图28是表示本发明的第四实施方式的存储管理表151的结构的一个例子的说明图。
[0398]存储器ID1511、存储器名1512、类型1513、ID地址1514与第一实施方式相同,因此省略说明。
[0399]在第四实施方式中,与第一实施方式的不同点在于,元数据服务器I除了将文件服务器4、保存用存储装置2作为管理对象以外,还将备份存储装置3作为管理对象。即,在图28所示的存储管理表151的第四记录中,存储备份存储装置3的信息。此外,在与备份存储装置3对应的记录的类型1513中存储“备份”。
[0400]图29是表示本发明的第四实施方式的名字空间管理表152的结构的一个例子的说明图。
[0401]名字空间ID1521、名字空间名1522、存储器ID1523、容量1524、协议1525、使用量1526、用途1527与第一实施方式相同,因此省略说明。
[0402]如图29所示,在名字空间管理表152的第五记录中,存储备份存储装置3的名字空间的信息。此外,在与备份存储装置3对应的记录的用途1527中存储“备份”。
[0403]图30是表示本发明的第四实施方式的元数据管理表153的结构的一个例子的说明图。
[0404]在第四实施方式中,元数据管理表153存储在元数据服务器I的存储器11中。
[0405]第四实施方式的元数据管理表153在追加了哈希值1536这一点上与第一实施方式不同。哈希值1536存储表示与条目对应的文件的内容的哈希值。在此,哈希值是通过对文件的内容应用预先定义的哈希函数而取得的值。例如,哈希函数可以使用已知的各种算法(例如SHA256)。
[0406]在本实施方式中,根据哈希值1536来判定文件的内容是否相同。
[0407]在图30所示的例子中,在元数据管理表153的第四记录中存储与备份存储装置3中存储的文件“/BU/x.doc”有关的信息。以后,将存储在备份存储装置3中的文件称为备份文件。
[0408]另外,在与备份文件对应的条目的文件状态1535中,存储表示与条目对应的文件是备份文件的“BU”。另外,可知在该记录的哈希值1536中,根据文件“/BU/x.doc”计算出的哈希值是“eOOl”。在此,哈希值为用16进制表示的值。
[0409]本实施方式的元数据管理程序112为了将备份文件的信息存储到元数据管理表153中,而向备份存储装置3的备份程序31进行查询,取得存储在备份存储装置3中的备份文件的元数据。另外,元数据管理程序112也可以读出保存由备份程序31管理的备份文件的列表的数据库等。
[0410]备份文件的哈希值既可以在由元数据管理程序112从备份存储装置3读出备份文件时计算,也可以由备份程序31计算并发送给元数据管理程序112。
[0411]图31是说明本发明的第四实施方式的文件删除检测程序113所执行的处理的流程图。
[0412]第四实施方式的文件删除检测程序113如果检测出删除对象文件,则判定是否存在内容与该文件相同的备份文件。在有相同内容的备份文件的情况下,文件删除检测程序113将备份文件作为与删除对象文件对应的保存文件追加到文件保存管理表154中。进而,文件删除检测程序113不在文件服务器4中生成隐藏文件,而将删除对象文件删除。
[0413]文件删除检测程序113如果开始处理(步骤S9100),则检测从文件服务器4删除文件的情况(步骤S9101)。
[0414]步骤S9101的处理是与步骤S8201相同的处理。在第四实施方式中,在从文件服务器4发送的删除通知中包含删除对象文件的哈希值。
[0415]此外,通过由文件删除检测程序113对从文件服务器4读出的删除对象文件应用哈希函数,能够计算出删除对象文件的哈希值。
[0416]文件删除检测程序113更新元数据管理表153的与删除对象文件对应的记录(步骤S9102)。步骤S9202的处理是与步骤S8202相同的处理。
[0417]文件删除检测程序113参照元数据管理表153,检索内容与删除对象文件相同的备份文件(步骤S9103)。具体地说,执行以下的处理。
[0418]文件删除检测程序113取得删除对象文件的哈希值1536。
[0419]接着,文件删除检测程序113抽出在文件状态1535中存储“BU”的条目,对抽出的条目的哈希值1536和删除对象文件的哈希值1536进行比较。与删除对象文件的哈希值1536 —致的条目是内容与删除对象文件相同的备份文件。
[0420]此外,文件的内容的判定方法并不限于上述的方法。例如,也可以使用比较文件的元数据的方法、比较文件大小的方法、以及组合它们所得的方法等。
[0421]文件删除检测程序113判定作为上述检索处理的结果,是否存在内容与删除对象文件相同的备份文件(步骤S9104)。
[0422]在判定为不存在内容与删除对象文件相同的备份文件的情况下,文件删除检测程序113针对文件服务器4执行对删除对象文件的文件隐藏处理(步骤S9106)。
[0423]进而,文件删除检测程序113向通知了文件的删除的文件服务器4指示执行删除对象文件的隐藏处理(步骤S9107),结束处理(步骤S9108)。
[0424]此外,步骤S9106和步骤S9107的处理是与步骤S8203和步骤S8204相同的处理,因此省略说明。
[0425]在步骤S9104中判定为存在内容与删除对象文件相同的备份文件的情况下,文件删除检测程序113更新文件保存管理表154,结束处理(步骤S9105、步骤S9108)。
[0426]具体地说,文件删除检测程序113将与备份文件相关的信息作为与删除对象文件对应的保存文件的信息追加到文件保存管理表154中。
[0427]S卩,在元数据ID1541中,存储与备份文件对应的记录的元数据ID1531的值,在保存目的地路径1542中,存储与备份文件对应的记录的路径1532的路径名。另外,在保存目的地名字空间ID1543中,存储与备份文件对应的记录的名字空间ID1533的标识符。
[0428]在上述处理中,从存储在备份存储装置3中的文件中检索内容与删除对象文件相同的文件,但也可以除此以外,还由元数据服务器I从成为管理对象的全部的存储装置中进行检索。
[0429][第五实施方式]
[0430]接着,说明本发明的第五实施方式。在第五实施方式中,文件服务器4在从业务程序51请求了文件的删除的情况下,不向元数据服务器I发送文件的删除通知。因此,元数据服务器I周期地判定是否从文件服务器4删除了文件。在该判定中,使用文件服务器4的快照功能。
[0431]以后,以与第一实施方式的差异为中心进行说明。
[0432]第五实施方式的计算机系统500的结构、元数据服务器I和文件服务器4的结构与第一实施方式相同,因此省略说明。此外,文件服务器4具有快照功能这一点不同。另外,元数据服务器I和文件服务器4所管理的各表的结构也与第一实施方式相同,因此省略说明。
[0433]图32A和图32B是说明本发明的第五实施方式的元数据管理程序112所执行的处理的流程图。
[0434]在本实施方式中,元数据管理程序112收集存储在文件服务器4中的文件的元数据,并且检测从文件服务器4删除的文件,移动到保存用存储装置2。
[0435]元数据管理程序112如果开始处理(步骤S9200 ),则向文件服务器4指示作成成为元数据的收集对象的名字空间的快照(步骤S9201)。接收到该指示的文件服务器4作成所指示的名字空间的快照。
[0436]元数据管理程序112从所作成的快照中包含的文件中选择一个成为处理对象的文件(步骤S9202)。步骤S9202的处理在选择包含在快照中的文件这一点上与步骤S8002的处理(参照图9)不同。
[0437]元数据管理程序112取得从文件服务器4选择出的文件的元数据(步骤S9203)。
[0438]元数据管理程序112根据所取得的元数据,更新元数据管理表153 (步骤S9204)。步骤S9204的处理是与步骤S8004的处理(参照图9)相同的处理。
[0439]元数据管理程序112判定是否对包含在快照中的全部文件完成处理(步骤S9205)。
[0440]在判定为没有对包含在快照中的全部文件完成处理的情况下,元数据管理程序112返回到步骤S9202,执行同样的处理(步骤S9202?步骤S9205)。
[0441]在判定为对包含在快照中的全部文件完成处理的情况下,元数据管理程序112抽出元数据管理表153的记录中的在从步骤S9201到步骤S9205的处理中没有更新的记录(步骤 S9206)。
[0442]元数据管理程序112从抽出的记录中选择一个处理对象的记录(步骤S9207)。
[0443]元数据管理程序112判定与处理对象的记录对应文件是否包含在快照中(步骤S9208)。
[0444]在判定为与处理对象的记录对应的文件包含在快照中的情况下,元数据管理程序112前进到步骤S9212。[0445]在判定为与处理对象的记录对应的文件不包含在快照中的情况下,元数据管理程序112更新处理对象的记录(步骤S9209)。具体地说,在处理对象记录的文件状态1535中存储“删除”。
[0446]这表示与处理对象的记录对应的文件是作成快照前删除的文件。因此,将该文件作为删除文件来管理。
[0447]元数据管理程序112从在步骤S9201中作成的快照的前一代的快照中,取得与处理对象的记录对应的文件(步骤S9210)。前一代的快照是在上次执行的本处理中作成的快照。此外,前一代的快照既可以由文件服务器4存储,也可以由保存用存储装置2存储。
[0448]元数据管理程序112将从前一代的快照中取得的文件作为与处理对象的记录对应的删除文件的保存文件而移动到保存用存储装置2 (步骤S9211)。
[0449]元数据管理程序112更新文件保存管理表154 (步骤S9212)。步骤S9212的处理是与步骤S8208的处理(参照图11C)相同的处理。
[0450]元数据管理程序112判定是否对在步骤S9206中抽出的全部记录完成处理(步骤S9213)。
[0451]在判定为没有对在步骤S9206中抽出的全部记录完成处理的情况下,元数据管理程序112返回到步骤S9207,执行同样的处理(步骤S9207?步骤S9213)。
[0452]在判定为对在步骤S9206中抽出的全部记录完成处理的情况下,元数据管理程序112向文件服务器4指示删除前一代的快照,结束处理(步骤S9214、步骤S9215)。接收到该指示的文件服务器4删除所指示的快照。
[0453]在本实施方式中,文件服务器4不需要通知文件的删除,因此即使是不具备通知文件删除的功能的文件服务器4,也能够将删除文件移动到保存用存储装置2。
[0454]在本发明的任意一个实施方式中,根据元数据服务器I的指示删除隐藏文件。这是因为在文件服务器4、元数据服务器1、或网络7中发生故障而正在执行的文件保存处理中断的情况下,直到元数据服务器I将文件移动到保存用存储装置2的动作完成为止,文件服务器4不删除隐藏文件。
[0455]另外,在元数据服务器I或网络7发生故障而文件服务器4无法向元数据服务器I通知文件的删除的情况下,文件服务器4使文件删除的通知延迟到检测出故障而能够与元数据服务器I通信为止。
[0456]在第一实施方式中,在检测出文件服务器4无法与元数据服务器I通信的情况下,也可以切换为第二实施方式的文件删除的通知方法,以便能够继续工作。
[0457]以上,参照附图详细说明了本发明,但本发明并不限于这样的具体结构,包含附加的权利范围的主要内容的各种变更和等同的结构。
【权利要求】
1.一种计算机系统,具备:文件服务器,其管理多个文件;元数据服务器,其管理上述文件的元数据;业务服务器,其使用上述文件,执行规定的业务处理,该计算机系统的特征在于, 上述文件服务器、上述元数据服务器、上述业务服务器经由网络相互连接, 上述文件服务器具备第一处理器、与上述第一处理器连接的第一存储器、与上述第一处理器连接的第一网络接口、与上述第一处理器连接而存储上述文件的第一存储介质,上述元数据服务器具备第二处理器、与上述第二处理器连接的第二存储器、与上述第二处理器连接的第二网络接口、与上述第二处理器连接的第二存储介质, 上述业务服务器具备第三处理器、与上述第三处理器连接的第三存储器、与上述第三处理器连接的第三网络接口, 上述元数据服务器与存储装置连接,该存储装置具备控制器和多个存储介质,并且提供存储从上述文件服务器删除的上述文件的保存区域, 在上述第二存储介质中存储了元数据存储库,该元数据存储库管理上述文件的元数据、存储在上述保存区域中的上述文件的存储位置, 上述元数据服务器在检测出通过由上述业务服务器执行的业务处理而删除存储在上述文件服务器中的上述文件的情况下,将上述文件作为保存文件存储在上述保存区域,将表示上述文件在上述文件服务器中的存储位置的信息、表示上述保存文件在上述保存区域中的存储位置的信息对应地存储在上述元数据存储库中。
2.根据权利要求1所述的计算机系统,其特征在于, 上述计算机系统还具备:分析服务器,其对上述文件执行规定的分析处理, 上述分析服务器具备第四处理器、与上述第四处理器连接的第四存储器、与上述第四处理器连接的第四网络接口, 上述元数据服务器在从上述分析服务器接收到上述文件的查询请求的情况下,根据上述文件的查询请求确定要读出的对象文件的存储位置,向上述分析服务器通知所确定的上述对象文件的存储位置, 上述分析服务器根据从上述元数据服务器接收到的通知,从上述文件服务器或上述保存区域取得上述对象文件,执行上述分析处理。
3.根据权利要求2所述的计算机系统,其特征在于, 上述文件服务器具备向上述文件服务器、上述元数据服务器、上述业务服务器、上述分析服务器分配的第一存储区域以及向上述文件服务器、上述元数据服务器、上述分析服务器分配的第二存储区域, 将删除前的上述文件存储在上述第一存储区域中, 上述文件服务器检测通过由上述业务服务器执行的业务处理而从上述文件服务器删除上述文件的情况,将上述文件从上述第一存储区域移动到上述第二存储区域, 上述元数据服务器 取得存储在上述第二存储区域中的上述文件,将所取得的上述文件作为上述保存文件存储在上述保存区域中, 将表示上述文件在上述第一存储区域中的存储位置的信息作为上述文件在上述文件服务器中的存储位置的信息存储在上述元数据存储库中,向上述文件服务器发送上述文件的删除指示, 上述文件服务器在接收到上述删除指示的情况下,从上述第二存储区域中删除上述文件。
4.根据权利要求3所述的计算机系统,其特征在于, 上述元数据服务器在接收到上述文件的查询请求的情况下,根据存储在上述元数据存储库中的信息,生成包含存储在上述文件服务器中的上述文件和存储在上述保存区域中的上述保存文件的存储位置的信息的列表信息, 向上述分析服务器发送所生成的上述列表信息。
5.根据权利要求3所述的计算机系统,其特征在于, 上述文件服务器在检测出通过由上述业务服务器执行的业务处理而从上述文件服务器删除上述文件的情况下,向上述元数据服务器发送表示删除上述文件的通知, 上述元数据服务器通过接收来自上述文件服务器的通知,来检测从上述文件服务器删除上述文件的情况。
6.根据权利要求5所述的计算机系统,其特征在于, 上述文件服务器在检测出从上述文件服务器删除规定数量的上述文件的情况、或从上次发送的表示删除上述文件的通知经过了规定时间的情况下,向上述元数据服务器发送表示删除了上述文件的通知。
7.根据权利要求3所述的计算机系统,其特征在于, 上述文件包含多个数据, 上述文件服务器判定是否通过由上述业务服务器执行的业务处理产生从上述文件中删除的数据即删除数据, 在判定为产生上述删除数据的情况下,将包含在上述文件中的上述删除数据移动到上述第二存储区域, 上述元数据服务器将存储在上述第二存储区域中的上述删除数据作为上述保存文件存储在上述保存区域中。
8.根据权利要求7所述的计算机系统,其特征在于, 在上述元数据服务器中, 在从上述分析服务器接收到上述文件的查询请求的情况下,参照上述元数据存储库,判定是否存在与上述对象文件对应的上述删除数据, 在判定为存在与上述对象文件对应的上述删除数据的情况下,读出存储在上述文件服务器中的上述对象文件, 取得存储在上述保存区域中的上述删除数据所对应的上述保存文件,将从上述保存文件取得的上述删除数据覆盖写入读出的上述对象文件中,由此恢复上述对象文件, 将恢复的上述对象文件发送到上述分析服务器。
9.根据权利要求3所述的计算机系统,其特征在于, 上述计算机系统还具备备份存储装置,该备份存储装置具备控制器、多个存储介质,并且对存储在上述文件服务器中的上述文件的备份文件进行存储, 上述元数据服务器 在检测出通过由上述业务服务器执行的业务处理而删除存储在上述文件服务器中的上述文件的情况下,判定在上述备份存储装置中是否存储有与删除的上述文件相同内容的备份文件, 在判定为在上述备份存储装置中存储有与删除的上述文件相同内容的备份文件的情况下,将该备份文件的存储位置作为上述保存文件的存储位置存储在上述元数据存储库中。
10.根据权利要求2所述的计算机系统,其特征在于, 上述文件服务器具有:快照生成功能,其生成记录了任意时刻的上述文件服务器的状态的快照, 上述元数据服务器 向上述文件服务器发送记录了当前的上述文件服务器的状态的第一快照的生成指示, 参照所生成的上述第一快照,更新存储在上述元数据存储库中的上述元数据, 抽出上述元数据中的没有更新的上述元数据,判定在上述第一快照中是否存在与所抽出的上述元数据对应的文件, 在判定为在上述第一快照中不存在与所抽出的上述元数据对应的文件的情况下,取得时序在上述第一快照之前的第二快照,从该第二快照取得与所抽出的上述元数据对应的文件, 将取得的上述文件作为上述保存文件存储在上述保存区域中。
11.一种文件管理方法,是计算机系统的文件管理方法,该计算机系统具备:文件服务器,其管理多个文件;元数据服务器,其管理上述文件的元数据;业务服务器,其使用上述文件,执行规定的业务处理;分析服`务器,其对上述文件执行规定的分析处理,该文件管理方法的特征在于, 上述文件服务器、上述元数据服务器、上述业务服务器以及上述分析服务器经由网络相互连接, 上述文件服务器具备第一处理器、与上述第一处理器连接的第一存储器、与上述第一处理器连接的第一网络接口、与上述第一处理器连接而存储上述文件的第一存储介质,上述元数据服务器具备第二处理器、与上述第二处理器连接的第二存储器、与上述第二处理器连接的第二网络接口、与上述第二处理器连接的第二存储介质, 上述业务服务器具备第三处理器、与上述第三处理器连接的第三存储器、与上述第三处理器连接的第三网络接口, 上述分析服务器具备第四处理器、与上述第四处理器连接的第四存储器、与上述第四处理器连接的第四网络接口, 在上述元数据服务器上连接存储装置,该存储装置具备控制器、多个存储介质,并且提供存储从上述文件服务器删除的上述文件的保存区域, 在上述第二存储介质中存储有元数据存储库,该元数据存储库管理上述文件的元数据、存储在上述保存区域中的上述文件的存储位置, 上述方法包括: 上述元数据服务器在检测出通过由上述业务服务器执行的业务处理而删除存储在上述文件服务器中的上述文件的情况下,将上述文件作为保存文件存储在上述保存区域的第一步骤;上述元数据服务器将表示上述文件在上述文件服务器中的存储位置的信息、表示上述保存文件在上述保存区域中的存储位置的信息对应地存储在上述元数据存储库中的第二步骤; 上述元数据服务器在从上述分析服务器接收到上述文件的查询请求的情况下,根据上述文件的查询请求确定要读出的对象文件的存储位置,向上述分析服务器通知所确定的上述对象文件的存储位置的第三步骤; 上述分析服务器根据从上述元数据服务器接收到的通知,从上述文件服务器或上述保存区域取得上述对象文件,执行上述分析处理的第四步骤。
12.根据权利要求11所述的文件管理方法,其特征在于, 上述文件服务器具备向上述文件服务器、上述元数据服务器、上述业务服务器、上述分析服务器分配的第一存储区域以及向上述文件服务器、上述元数据服务器、上述分析服务器分配的第二存储区域, 将删除前的上述文件存储在上述第一存储区域中, 上述第一步骤包括: 上述文件服务器检测通过由上述业务服务器执行的业务处理而从上述文件服务器删除上述文件的情况,将上述文件从上述第一存储区域移动到上述第二存储区域的步骤;上述元数据服务器取得存储在上述第二存储区域中的上述文件,将所取得的上述文件作为上述保存文件存储在上述保存区域中的步骤, 上述第二步骤包括: 上述元数据服务器将表示上述文件在上述第一存储区域中的存储位置的信息作为上述文件在上述文件服务器 中的存储位置的信息存储在上述元数据存储库中的步骤; 上述元数据服务器向上述文件服务器发送上述文件的删除指示的步骤; 上述文件服务器在接收到上述删除指示的情况下,从上述第二存储区域中删除上述文件的步骤。
13.根据权利要求12所述的文件管理方法,其特征在于, 上述第三步骤包括: 上述元数据服务器根据存储在上述元数据存储库中的信息,生成包含存储在上述文件服务器中的上述文件和存储在上述保存区域中的上述保存文件的存储位置的信息的列表信息的步骤; 上述元数据服务器向上述分析服务器发送所生成的上述列表信息的步骤。
14.根据权利要求12所述的文件管理方法,其特征在于, 在上述第一步骤中,通过接收从上述文件服务器发送的表示删除上述文件的通知,来检测从上述文件服务器删除上述文件的情况。
15.根据权利要求14所述的文件管理方法,其特征在于, 上述文件服务器在检测出从上述文件服务器删除规定数量的上述文件的情况、或从上次发送的表示删除上述文件的通知经过了规定时间的情况下,向上述元数据服务器发送表示删除了上述文件的通知。
16.根据权利要求12所述的文件管理方法,其特征在于, 上述文件包含多个数据,上述第一步骤包括: 上述文件服务器判定是否通过由上述业务服务器执行的业务处理产生从上述文件中删除的数据即删除数据的步骤; 上述文件服务器在判定为产生上述删除数据的情况下,将包含在上述文件中的上述删除数据移动到上述第二存储区域的步骤; 上述元数据服务器将存储在上述第二存储区域中的上述删除数据作为上述保存文件存储在上述保存区域中的步骤。
17.根据权利要求16所述的文件管理方法,其特征在于, 上述第三步骤包括: 上述元数据服务器参照上述元数据存储库,判定是否存在与上述对象文件对应的上述删除数据的步骤; 在判定为存在与上述对象文件对应的上述删除数据的情况下,读出存储在上述文件服务器中的上述对象文件的步骤; 取得存储在上述保存区域中的上述删除数据所对应的上述保存文件,将从上述保存文件取得的上述删除数据覆盖写入读出的上述对象文件中,由此恢复上述对象文件的步骤;将恢复的上述对象文件发送到上述分析服务器的步骤。
18.根据权利要求12所述的文件管理方法,其特征在于, 上述计算机系统还具备备份存储装置,该备份存储装置具备控制器、多个存储介质,并且对存储在上述文件服务器中的上述文件的备份文件进行存储, 上述第一步骤包括:上述元数据服务器在检测出通过由上述业务服务器执行的业务处理而删除存储在上述文件服务器中的上述文件的情况下,判定在上述备份存储装置中是否存储有与删除的上述文件相同内容的备份文件的步骤, 上述第二步骤包括:上述元数据服务器在判定为在上述备份存储装置中存储有与删除的上述文件相同内容的备份文件的情况下,将该备份文件的存储位置作为上述保存文件的存储位置而存储在上述元数据存储库中的步骤。
19.根据权利要求11所述的文件管理方法,其特征在于, 上述文件服务器具有:快照生成功能,其生成记录了任意时刻的上述文件服务器的状态的快照, 上述第一步骤包括: 上述元数据服务器向上述文件服务器发送记录了当前的上述文件服务器的状态的第一快照的生成指示的步骤; 上述元数据服务器参照所生成的上述第一快照,更新存储在上述元数据存储库中的上述元数据的步骤; 抽出上述元数据中的没有更新的上述元数据,判定在上述第一快照中是否存在与所抽出的上述元数据对应的文件的步骤, 上述第二步骤包括: 上述元数据服务器在判定为在上述第一快照中不存在与所抽出的上述元数据对应的文件的情况下,取得时序在上述第一快照之前的第二快照,从该第二快照取得与所抽出的上述元数据对应的文件的步骤;上述元数据服务器将取得的上述文件作为上述保存文件存储在上述保存区域中的步骤。
20.一种元数据服务器,具备处理器、与上述处理器连接的存储器、与上述处理器连接的网络接口、与上述处理器连接的本地存储器,对存储在经由网络连接的文件服务器中的多个文件的元数据进行管理, 上述元数据服务器与分析服务器和保存用存储装置连接,该分析服务器对上述文件执行规定的分析处理,该保存用存储装置存储从上述文件服务器删除的上述文件, 在上述存储器中存储:管理上述元数据的元数据管理程序、检测从上述文件服务器中删除上述文件的情况的文件删除检测程序、将从上述文件服务器删除的上述文件移动到上述保存用存储装置的文件保存程序、对来自上述分析服务器的上述文件的查询请求进行处理的查询处理程序, 在上述本地存储器中,存储元数据存储库,该元数据存储库包含管理上述文件的元数据的元数据管理表、管理存储在上述保存区域中的上述文件的文件保存管理表, 执行上述元数据管理程序的上述处理器取得存储在上述文件服务器中的上述文件的元数据,更新上述元数据管理表, 执行上述文件删除检测程序的上述处理器检测删除存储在文件服务器中的上述文件的情况, 执行上述文件保存程序的处理器将上述文件作为保存文件复制到上述保存用存储装置中, 执行上述文件保存程序的处理`器将表示上述保存文件在上述保存用存储装置中的存储位置的信息存储在上述文件保存管理表中, 执行上述查询处理程序的处理器在接收到上述文件的查询请求的情况下,根据上述文件的查询请求确定读出的对象文件的存储位置,生成包含确定的上述对象文件的存储位置的列表, 执行上述查询处理程序的处理器向上述分析服务器发送生成的上述列表。
【文档编号】G06F12/00GK103460197SQ201180069823
【公开日】2013年12月18日 申请日期:2011年9月21日 优先权日:2011年9月21日
【发明者】高冈伸光, 儿玉升司 申请人:株式会社日立制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1