一种电子文件归档方法和系统的制作方法

文档序号:6487851阅读:178来源:国知局
一种电子文件归档方法和系统的制作方法
【专利摘要】本发明提供了一种用于对文件服务器上所存储的电子文件进行归档的方法,所述方法包括:确定要进行文件归档的文件服务器集群;接收对文件归档的操作条件以及文件规则的配置;根据所述操作条件以及所述文件规则在所述集群中的每个文件服务器上匹配待归档的文件;以及对匹配的待归档文件执行满足所述操作条件的归档操作;其中所述操作条件至少包括归档权限条件、归档动作条件以及文件可操作条件,并且所述文件规则为文件服务器可识别的文件属性。本发明还提供了可执行上述方法的相应的系统。
【专利说明】一种电子文件归档方法和系统
【技术领域】
[0001]本发明涉及信息管理【技术领域】,并且更具体地涉及一种电子文件归档方法和系统。
【背景技术】
[0002]一般地,电子文件指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件,其信息以二进制数字代码记录和表示,因此也可称为“数字文件”。随着信息技术的迅猛发展,电子文件已经越来越广泛地取代了纸质文件的使用。电子化的文件管理流程解决了传统的纸质文件归档过程中所存在的档案建设费时、维护不便、浪费资源等众多问题。相应地,如何合理且高效地对电子文件进行归档和管理也成为大家关注的焦点。
[0003]目前,针对电子文件归档管理的系统通常包括用于存储电子文件的大规模文件服务器。与常规的服务器形似,文件服务器可以被实现为网络环境中的高性能计算机,它能够侦听网络上的其他计算机(即客户机)提交的服务请求,并且提供相应的服务。这样的文件服务器通常具有高速度的运算能力、长时间可靠运行的能力以及强大的外部数据吞吐能力。
[0004]现有文件服务器上的文件归档主要是针对于过期文件和垃圾文件进行操作,归档过程包括压缩和删除。例如可以使用相对分散的文件查找命令结合人工识别来拣选垃圾文件,然后对其进行手动压缩或者删除。自动化程度相对较高的方法是编辑简单的脚本对特定文件加以归档或者删除。这样的方法通常过程繁琐,效率低下,并且对操作人员的专业性有很高的要求。一旦发生误删错删,都极有可能带来非常严重的影响。同时,简单的脚本无法严谨地判断垃圾文件,对清理工作又会带来一定的隐患。而对于采用不止一个文件服务器的系统,虽然对各个单独的服务器有统一的管理接口,但文件归档的过程还是在各单机上依次进行的,同样存在效率低下的问题,并且工作强度也相当可观。
[0005]因此,对于灵活高效的电子文件归档方法和系统仍有很大需求。

【发明内容】

[0006]本发明的目的在于提供一种根据用户需求进行电子文件归档作业的灵活高效的方法和系统。
[0007]为了实现上述目标,本发明提供了 一种用于对文件服务器上所存储的电子文件进行归档的方法,所述方法包括:确定要进行文件归档的文件服务器集群;接收对文件归档的操作条件以及文件规则的配置;根据所述操作条件以及所述文件规则在所述集群中的每个文件服务器上匹配待归档的文件;以及对匹配的待归档文件执行满足所述操作条件的归档操作;其中所述操作条件至少包括归档权限条件、归档动作条件以及文件可操作条件,并且所述文件规则为文件服务器可识别的文件属性。
[0008]在本发明的一些实施例中,确定文件服务器集群包括通过根据所接收的条件查找要进行文件归档的文件服务器并且将所找到的文件服务器关联为可应用相同的文件归档操作条件和文件规则进行文件归档的文件服务器集群。
[0009]在本发明的一些实施例中,确定文件服务器集群包括根据所接收的条件删除或临时屏蔽所述文件服务器集群中的成员、向所述文件服务器集群添加新成员。
[0010]在本发明的一些实施例中,对归档权限条件的配置包括预先根据每个文件服务器的用户级别设定归档操作的发起者可以对该文件服务器上的哪些文件进行哪些归档动作,其中所述归档动作包括压缩、备份删除以及永久删除文件。
[0011]在本发明的一些实施例中,对归档动作条件的配置包括从压缩、备份删除以及永久删除操作中选择至少一项。
[0012]在本发明的一些实施例中,对文件可操作条件的配置包括根据至少一个文件服务器可识别的文件属性来划分不允许进行归档操作的文件以及允许进行归档操作的文件,其中所述文件属性包括文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间。
[0013]在本发明的一些实施例中,所述至少一个文件属性为文件名。
[0014]在本发明的一些实施例中,所述文件服务器可识别的文件属性包括文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间,并且对文件规则的配置包括从上述各项中选择至少一项。
[0015]在本发明的一些实施例中,所述方法还包括在归档操作完成之后生成归档日志,所述归档日志记录归文件归档过程以及经文件归档之后的文件服务器状态。
[0016]本发明还提供了一种用于对文件服务器上所存储的电子文件进行归档的系统,所述系统包括:服务器集群配置模块,其用于确定要进行文件归档的文件服务器集群;操作条件及规则配置模块,其用于接收对文件归档的操作条件以及文件规则的配置;文件匹配模块,其用于根据所述操作条件以及所述文件规则在所述集群中的每个文件服务器上匹配待归档的文件;以及归档执行模块,其用于对匹配的待归档文件执行满足所述操作条件的归档操作;其中所述操作条件至少包括归档权限条件、归档动作条件以及文件可操作条件,并且所述文件规则为文件服务器可识别的文件属性。
[0017]本方法所提出的电子文件归档方法和系统可以根据用户对服务器上不同文件的具体操作需求,同时结合文件的自身特性,自动、智能并且高效地完成电子文件归档,使得用户能够更方便和有效地管理文件服务器的磁盘空间和电子文件本身。
【专利附图】

【附图说明】
[0018]本发明的前述和其他目标、特征和优点根据下面对本发明的实施例的更具体的说明将是显而易见的,这些实施例在附图中被示意。
[0019]图1是根据本发明的一个优选实施例的服务器文件归档方法的示意图。
[0020]图2是在本发明的方法中所包括的服务器集群过程的示意图。
【具体实施方式】
[0021]以下结合附图和【具体实施方式】进一步详细说明本发明。需要说明的是,附图中的各结构只是示意性说明,用以使本领域普通技术人员最佳地理解本发明的原理,其不一定按比例绘制。
[0022]图1是根据本发明的一个优选实施例的服务器文件归档方法的示意图。如在【背景技术】中所提到的那样,文件服务器被用于对大规模的电子文件进行存储并且提供对这些文件的管理。进一步地,在诸如银行系统的大型业务系统中,很可能会使用不止一个文件服务器以应对海量的数据文件。在实践中,这些文件服务器通常经由网络相互连通。本发明所提供的方法很好地适用于这样的多服务器系统上的文件归档操作。
[0023]在要发起文件归档操作之前,首先在步骤SlOl中确定要进行文件归档的文件服务器集群,以进而对该集群内的所有文件服务器应用相同的文件归档操作条件以及文件规贝U,这将在下文中更详细地说明。由于这些文件服务器之间一般可以经由网络进行通信,因此有可能在一个文件服务器的控制台上对集群中的所有服务器执行相同的文件归档操作。或者,也可以通过所有文件服务器的中央控制系统来执行针对该集群的文件归档操作。不管以哪种方式实现,对服务器进行集中式管理可以省去用户在单个服务器上分别进行文件归档操作的麻烦,而这样的文件归档操作通常具有很大程度的相似性。
[0024]举例来说,可以通过根据所接收的条件查找要进行电子文件归档的文件服务器并且关联所找到的文件服务器来构建文件服务器集群。图2是这样的服务器集群过程的示意图。如图2所示,用于确定文件服务器集群的集群配置模块可以在用户定义的网段中搜索所有的文件服务器并且将这些服务器配置为一个集群。这可以被认为是主动发现服务器的过程,其通常可以借助SLP, SNMP, Active Directory等协议来实现。另一方面,集群配置模块还可以根据用户输入的服务器IP地址和用户名来定位特定的某个服务器并且将其添加为要构建的服务器集群中的成员,这可以被认为是主动添加的过程。进一步地,在添加完毕之后还可能需要通过连接测试来保证服务器的访问性。
[0025]另外,根据本发明的一些实施例还可以允许对所确定的文件服务器集群进行更改,例如根据所接收的条件删除或临时屏蔽已有文件服务器集群中的成员、向已有文件服务器集群添加新成员。
[0026]在实践中,用于确定要进行文件归档的文件服务器集群的集群配置模块可以被配置有输入接口,以从用户处接收查找或定位要添加、删除或者屏蔽的文件服务器的条件,例如服务器的IP地址等等。
[0027]在确定服务器集群之后,进而在步骤S103中,接收对文件归档的操作条件以及文件规则的配置。在本发明所提供的方法中,所述操作条件至少包括归档权限条件、归档动作条件以及文件可操作条件。
[0028]在本发明的一些实施例中,归档权限条件可以指归档操作的发起者可以对该文件服务器上的哪些文件进行哪些归档动作,归档动作例如可以包括压缩、备份删除以及永久删除文件。对归档权限条件的配置可以例如是根据每个文件服务器的用户级别预先设定的,即对不同级别的用户设计不同的文件处理权限,如管理员级别的用户可以对所有文件进行任何读写操作,而普通用户只能对特定范围内的文件进行一部分的操作,例如只能进行压缩或者备份删除操作,而无权进行永久删除。
[0029]在本发明的一些实施例中,文件可操作条件可以是按照特定的文件属性将服务器上的所有文件划分为不允许进行归档操作的文件以及允许进行归档操作的文件。通俗地,可以将这样的划分称为文件的黑白名单管理,即维护两份文件名单-黑名单(不允许归档操作)和白名单(允许归档操作)。可以作为划分黑白名单文件的依据的文件属性例如包括文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间。举例来说,可以根据文件名的正则表达式规则来划分允许操作和不允许操作的文件。
[0030]此外,操作条件及规则配置模块还可以被配置有用于从用户处接收对归档动作选择的输入接口,用户可以根据文件对象来选择对文件进行压缩、备份删除或者永久删除,由此配置归档动作条件。
[0031]通过确定上述操作条件来对文件的归档操作进行控制,可以使得文件归档操作的安全性得以提高,可以有效地避免用户对文件的误操作所带来的严重后果。
[0032]另外,在本发明所提供的方法中,文件规则是文件服务器可识别的文件属性,例如文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间。上述所列的文件属性仅是一些示例,这里可以采用文件服务器可识别的任何文件属性。在实践中,操作条件及规则配置模块可以被配置有输入接口以从用户,即归档操作的发起者处接收对如上所列的至少一个文件属性的选择。优选地,可以允许用户仅选择一个文件属性作为简单文件规则,也可以允许用户选择多个文件属性作为组合文件规则。组合文件规则可以例如为规定对在2011年I月I日之前创建的并且文件大小为IOMB的文件进行归档操作。
[0033]在本发明的一些实施例中,操作条件及规则配置模块中用于接收文件规则配置的部分可以使用例如商业对象模型(BOM: Business Object Model)的规则引擎技术来实现,而相应地,在规则解析和匹配任务又可以由规则的执行对象模型(XOM: Execution ObjectModel)来实现,这将在下文中进一步论述。优选地,定义好的文件规则,即包含所确定的一个或多个文件属性选择的各种文件规则可以根据名称和ID来进行管理。
[0034]在步骤S105中,根据所配置的操作条件和文件规则在集群中的每个文件服务器上匹配待归档的文件。具体而言,匹配待归档文件的过程可以首先包括根据上述预先确定的归档操作发起者的权限确定可进行归档操作的第一文件范围,根据文件可操作条件确定允许进行归档操作的第二文件范围,并且确定该第一文件范围与该第二文件范围的交集。进一步地,在该文件范围的交集中根据所配置的文件规则查找待归档的文件,例如在该范围中定位在2011年I月I日之前创建的并且文件大小为10MB的文件。由此,在集群中的每个服务器上找到需要并且允许被执行归档操作的文件。
[0035]在完成待归档文件的匹配,即在各个文件服务器上找到允许被归档并且符合归档规则的文件之后,就可以在步骤S107中对所匹配的待归档文件执行满足操作条件的归档操作。如上所述,满足操作条件大体上可以是指满足归档权限条件以及归档动作条件,也就是说对所匹配的待归档文件执行所配置的归档动作并且该归档动作必须是本次归档操作的发起者有权执行的归档动作,例如对文件进行压缩、备份删除或者永久删除操作。在实践中,还可以在文件归档结束之后向用户发送结果反馈,告知其文件系统中成功归档的文件数目以及成功归档后释放的磁盘空间。
[0036]在该优选实施例中,还可以在完成归档操作之后在步骤S109中生成归档日志。该归档日志可以记录整个归档过程以及经文件归档之后的文件服务器状态。举例来说,可以在该归档日志中详细描述文件归档操作的发起者、所采取的归档动作、归档执行时间、被归档的具体文件列表以及文件服务器上被释放的磁盘空间等等。
[0037]从图1所示的优选实施例中可以看到,本发明所提供的基于操作条件和文件规则的服务器集群文件归档方法使得用户能够灵活而便利地对多个服务器上的文件同时进行归档操作,避免了繁琐的手动文件查找、识别以及归档的过程,使得服务器集群磁盘空间的
清理任务变得简单。
[0038]应当说明的是,以上【具体实施方式】仅用以说明本发明的技术方案而非对其进行限制。尽管参照上述【具体实施方式】对本发明进行了详细的说明,本领域的普通技术人员应当理解,依然可以对本发明的【具体实施方式】进行修改或对部分技术特征进行等同替换而不脱离本发明的实质,其均涵盖在本发明请求保护的范围中。
【权利要求】
1.一种用于对文件服务器上所存储的电子文件进行归档的方法,其特征在于,所述方法包括: 确定要进行文件归档的文件服务器集群; 接收对文件归档的操作条件以及文件规则的配置; 根据所述操作条件以及所述文件规则在所述集群中的每个文件服务器上匹配待归档的文件;以及 对匹配的待归档文件执行满足所述操作条件的归档操作;其中所述操作条件至少包括归档权限条件、归档动作条件以及文件可操作条件,并且所述文件规则为文件服务器可识别的文件属性。
2.如权利要求1所述的方法,其特征在于,确定文件服务器集群包括通过根据所接收的条件查找要进行文件归档的文件服务器并且将所找到的文件服务器关联为可应用相同的文件归档操作条件和文件规则进行文件归档的文件服务器集群。
3.如权利要求1所述的方法,其特征在于,确定文件服务器集群包括根据所接收的条件删除或临时屏蔽所述文件服务器集群中的成员、向所述文件服务器集群添加新成员。
4.如权利要求1所述的方法,其特征在于,对归档权限条件的配置包括预先根据每个文件服务器的用户级别设定归档操作的发起者可以对该文件服务器上的哪些文件进行哪些归档动作,其中所述归档动作包括压缩、备份删除以及永久删除文件。
5.如权利要求4所述的方法,其特征在于,对归档动作条件的配置包括从压缩、备份删除以及永久删除操作中选择至少一项。
6.如权利要求1所述的方法,其特征在于,对文件可操作条件的配置包括根据至少一个文件服务器可识别的文件属性来划分`不允许进行归档操作的文件以及允许进行归档操作的文件,其中所述文件属性包括文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间。
7.如权利要求6所述的方法,其特征在于,所述至少一个文件属性为文件名。
8.如权利要求1所述的方法,其特征在于,所述文件服务器可识别的文件属性包括文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间,并且对文件规则的配置包括从上述各项中选择至少一项。
9.如权利要求1所述的方法,其特征在于,所述方法还包括在归档操作完成之后生成归档日志,所述归档日志记录归文件归档过程以及经文件归档之后的文件服务器状态。
10.一种用于对文件服务器上所存储的电子文件进行归档的系统,其特征在于,所述系统包括: 服务器集群配置模块,其用于确定要进行文件归档的文件服务器集群; 操作条件及规则配置模块,其用于接收对文件归档的操作条件以及文件规则的配置; 文件匹配模块,其用于根据所述操作条件以及所述文件规则在所述集群中的每个文件服务器上匹配待归档的文件;以及 归档执行模块,其用于对匹配的待归档文件执行满足所述操作条件的归档操作;其中所述操作条件至少包括归档权限条件、归档动作条件以及文件可操作条件,并且所述文件规则为文件服务器可识别的文件属性。
11.如权利要求10所述的系统,其特征在于,确定文件服务器集群包括通过根据所接收的条件查找要进行文件归档的文件服务器并且将所找到的文件服务器关联为可应用相同的文件归档操作条件和文件规则进行文件归档的文件服务器集群。
12.如权利要求10所述的系统,其特征在于,确定文件服务器集群包括根据所接收的条件删除或临时屏蔽所述文件服务器集群中的成员、向所述文件服务器集群添加新成员。
13.如权利要求10所述的系统,其特征在于,对归档权限条件的配置包括预先根据每个文件服务器的用户级别设定归档操作的发起者可以对该文件服务器上的哪些文件进行哪些归档动作,其中所述归档动作包括压缩、备份删除以及永久删除文件。
14.如权利要求13所述的系统,其特征在于,对归档动作条件的配置包括从压缩、备份删除以及永久删除操作中选择至少一项。
15.如权利要求10所述的系统,其特征在于,对文件可操作条件的配置包括根据至少一个文件服务器可识别的文件属性来划分不允许进行归档操作的文件以及允许进行归档操作的文件,其中所述文件属性包括文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间。
16.如权利要求15所述的系统,其特征在于,所述至少一个文件属性为文件名。
17.如权利要求10所述的系统,其特征在于,所述文件服务器可识别的文件属性包括文件大小、文件名称、文件读写属性、文件存储位置、文件创建时间、文件上次修改时间以及文件上次访问时间,并且对文件规则的配置包括从上述各项中选择至少一项。
18.如权利要求10所述的系统,其特征在于,所述系统还包括在日志管理模块,其用于在归档操作完成之后生成归档日志,所述归档日志记录归文件归档过程以及经文件归档之后的文件服务器状 。
【文档编号】G06F17/30GK103593351SQ201210289513
【公开日】2014年2月19日 申请日期:2012年8月15日 优先权日:2012年8月15日
【发明者】章春芳, 尹祥龙, 吕苏, 戴康, 黄文蓓 申请人:中国银联股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1