选取文件的方法和装置的制作方法

文档序号:6585053阅读:85来源:国知局
专利名称:选取文件的方法和装置的制作方法
技术领域
本发明涉及计算机领域,尤其涉及一种选取文件的方法和装置。
背景技术
在批量处理文件的过程中,首先要对文件进行批量选取。有一种情况是,在终端上 设置专门的文件接收目录,将待处理的文件存放到其中。现有技术中,每次选取文件接收目 录中的所有文件,处理完这些文件后清空文件接收目录,等所述目录中又有待处理的文件 时,再选取所有文件进行处理,如此循环操作。在实现本发明的过程中,发明人发现,现有技术中如果将所述文件接收目录设为 “只读”的属性,则不能对所述目录进行清空操作,每次都要重复选取前一次已经处理过的 文件;并且,即使可以清空目录,当本次存放的文件与上一次相同时,也会重复选取。以上两 种情况均会使操作繁琐、工作效率降低。

发明内容
本发明的实施例提供一种选取文件的方法和装置,能够在文件接收目录设为“只 读”属性的情况下,也能有效地减少重复选取文件的次数,提高工作效率。为达到上述目的,本发明的实施例采用如下技术方案一种选取文件的方法,包括获取待选取文件集合中文件的属性信息;将所述待选取文件集合中文件的属性信息与预先获取的已选取文件集合中文件 的属性信息进行比较,获取比较结果;根据所述比较结果选取所述待选取文件集合中不同于所述已选取文件集合中的 文件。一种选取文件的装置,包括获取单元,用于获取待选取文件集合中文件的属性信息;比较单元,用于将由所述获取单元获取的待选取文件集合中文件的属性信息与预 先获取的已选取文件集合中文件的属性信息进行比较,获取比较结果;选取单元,用于根据由所述比较单元获取的比较结果选取所述待选取文件集合中 不同于所述已选取文件集合中的文件。本发明实施例提供的选取文件的方法和装置,由于是将待选取文件集合中的文件 属性信息与已选取文件集合中的文件属性信息进行比较,通过所获得的比较结果来选取文 件,使得对于文件的选取具有选择性,解决了现有技术中由于需要频繁地重复选取已处理 过的文件,而造成的操作繁琐、工作效率降低的问题。本发明的实施例提供的技术方案,能 够在文件接收目录设为“只读”属性的情况下,也能有效地减少重复选取文件的次数,提高 工作效率。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 这些附图获得其他的附图。图1为本发明实施例提供的选取文件的方法流程图;图2为本发明另一个实施例提供的选取文件的方法流程图;图3为图2所述方法中获取到的已选取文件集合中文件属性信息的示意图;图4为图2所述方法中获取到的待选取文件集合中文件属性信息的示意图;图5为本发明实施例提供的选取文件的装置示意图一;图6为本发明实施例提供的选取文件的装置中比较单元的结构示意图;图7为本发明实施例提供的选取文件的装置示意图二。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。为了解决现有技术中由于需要频繁地重复选取已处理过的文件,而造成的操作繁 琐、工作效率降低的问题,本发明实施例提供一种选取文件的方法和装置。如图1所示,本发明实施例提供的选取文件的方法,包括步骤101,获取待选取文件集合中文件的属性信息;步骤102,将所述待选取文件集合中文件的属性信息与预先获取的已选取文件集 合中文件的属性信息进行比较,获取比较结果;步骤103,根据所述比较结果选取所述待选取文件集合中不同于所述已选取文件 集合中的文件。本发明实施例提供的选取文件的方法,由于是将待选取文件集合中的文件属性信 息与已选取文件集合中的文件属性信息进行比较,通过所获得的比较结果来选取文件,使 得对于文件的选取具有选择性,解决了现有技术中由于需要频繁地重复选取已处理过的文 件,而造成的操作繁琐、工作效率降低的问题。为了使本领域技术人员能够更清楚地理解本发明实施例提供的技术方案,下面通 过具体的实施例,对本发明实施例提供的选取文件的方法进行详细说明。如图2所示,本发明另一个实施例提供的选取文件的方法,包括步骤201,对预先设置的获取文件属性信息的时间间隔进行计时;在本实施例中,首先设置一个获取文件属性信息的时间间隔,即每隔一定的时间 扫描一次文件接收目录中的文件,以获取文件属性信息。可以根据实际工作的需要来设置 此时间间隔,例如,可以将计时器的计时时间设置成20分钟或者半个小时,当计时时间到, 扫描一次文件接收目录中的文件。之后,计时器循环计时。步骤202,当计时时间到,获取待选取文件集合中文件的属性信息;
本实施例中,所述待选取文件集合指的是文件接收目录,所述文件的属性信息包 括文件的目录结构和文件信息码。文件的目录结构即文件接收目录中所有文件的存放路径 列表,假设本实施例中的文件接收目录为C:\试验目录。本实施例中,文件信息码是该文 件的MD5信息码,当然,还可以采用其它的信息码,此处不一一列举。任何一个文件,包括可 执行程序文件,或者图像文件,或者其它类型的文件,不管其文件大小,都会有一个独一无 二的MD5信息码。并且,如果这个文件被修改,其MD5信息码也会相应地改变。因此,可以 用MD5信息码作为一个文件独一无二的标识,通过对比不同时间或者不同位置的同一文件 的MD5信息码,来验证这个文件是否变动过。本实施例中的一部分文件目录结构和文件的 MD5信息码如图3所示。步骤203,保存所述待选取文件集合中文件的属性信息;在本实施例中,当第一次扫描文件接收目录时,将获取到的文件目录结构和文 件信息码保存起来,用于创建初始比较文件;或者,当不是第一次扫描文件接收目录时, 将获取到的文件目录结构和文件信息码保存起来,用于与前一次获取的文件信息作比 较。优选地,保存成inf文件格式,但保存路径不限。例如,将获取到的文件信息命名为 Filelnfo-new. inf,文件的保存位置只要便于程序运行时能够快速找到即可。步骤204,将所述待选取文件集合中文件的属性信息与预先获取的已选取文件集 合中文件的属性信息进行比较,获取比较结果;在本实施例中,所述待选取文件集合中文件的属性信息即为本次获取到的文件 的属性信息,也即步骤203中命名的文件Filelnfo-new. inf ;所述预先获取的已选取文件 集合中文件的属性信息即为上一次获取到的文件的属性信息,将其命名为Filelnfo-old. inf,将所述两个文件进行比较,找出有差异部分的文件。所述差异部分包括新增的文件和 变动的文件,但不包括减少的文件。本实施例中,首先比较上述两个文件中的文件目录结 构,当文件目录结构相同时,比较文件的MD5信息码;或者,当文件目录结构不同时,直接根 据有差异的文件目录结构选取文件。参见图3和图4所示,例如,将图3中的文件1. txt中 的内容进行改动后,虽然前后两次的文件目录结构相同,但是图4中文件的MD5信息码发生 了改变,则可判断文件l.txt发生了变动;又例如,通过比较前后两次的文件目录结构,发 现图4中新增了文件7. log,并缺失了文件4. txt,但由于在实际工作中,缺失的文件一般是 人为删除的,所以并不对其进行处理,可以忽略。所以,在本实施例中,获取的比较结果为 后一次与前一次相比,变动了文件1. txt,并增加了文件7. log。需要说明的是,如果是第一次扫描文件接收目录,或者是意外地删除了前一次 的文件信息,此时只有文件Fi 1 elnfo-new. inf,没有前一次的文件信息Fi 1 elnfo-o 1 d. inf与之相比较,则将文件Filelnfo-new. inf中所有的文件,也即此时文件接收目录中 的所有文件作为有差异的文件,所以获取的比较结果为后一次与前一次相比,新增了 Filelnfo-new. inf中的所有文件。步骤205,用所述待选取文件集合中文件的属性信息替换所述已选取文件集合中 文件的属性信息;在本实施例中,用本次获取的文件信息Filelnfo-new. inf替换上一次获 取的文件信息Filelnfo-old. inf。具体的替换方法为首先删除上一次获取的文件 信息Filelnfo-old. inf,然后将本次获取的文件信息Filelnfo-new. inf重命名为Filelnfo-old. inf,再置于原Filelnfo-old. inf的保存路径下。这样,本次获取的文件信 息就作为了与下一次获取的文件信息相比较的临时文件信息,如此循环操作。步骤206,根据所述比较结果选取所述待选取文件集合中不同于所述已选取文件 集合中的文件。在本实施例中,根据步骤204中获取的比较结果,选取文件。如步骤204中所 述,比较的结果不考虑缺失的文件,所以本步骤中只选取新增的文件7. log和变动的文件 1. txt进行处理;或者,当第一次扫描文件接收目录,或者是意外地删除了前一次的文件信 息时,选取文件接收目录中的所有文件进行处理。由于意外地删除文件发生的概率不大,所 以重复选择并处理这些文件的概率也不大,仍然能够有效地提高工作效率。另外,当文件 Filelnfo-new. inf与文件Filelnfo-old. inf相比较没有差异时,不选择任何文件。选取前后有差异的文件后,就可以对这些文件进行处理了。所述处理文件包括,将 文件下载到处理终端,获取文件中的有用信息,或者将文件打包发送等。处理文件的动作被 记录,可以实时输出为日志。需要说明的是,本实施例对于文件的选取处理还可以弥补上一次对于文件处理失 败的问题。例如,在用ftp传输文件,或者在Unix系统下传输文件的过程中,经常会出现文 件没有传输完就被处理的情况。现有技术中,由于选取文件接收目录中的所有文件进行处 理,处理完后清空文件接收目录,所以未传输完的文件处理错误,即使以后再接收到另一半 文件,也不能得到完整的文件进行正确处理了。本发明由于不清空文件接收目录,当文件未 传输完而被选取进行处理时,也会处理错误,但是,当文件接收完以后再一次进行选取处理 时,会得到正确结果,对上一次的错误进行了补救。本发明实施例提供的选取文件的方法,由于是将待选取文件集合中的文件属性信 息与已选取文件集合中的文件属性信息进行比较,通过所获得的比较结果来选取文件,使 得对于文件的选取具有选择性,解决了现有技术中由于需要频繁地重复选取已处理过的文 件,而造成的操作繁琐、工作效率降低的问题。如图5所示,本发明实施例还提供一种选取文件的装置,包括获取单元301,用于获取待选取文件集合中文件的属性信息,其具体的获取方法可 以参见如图2所示的步骤202所述,此处不再赘述;比较单元302,用于将由所述获取单元301获取的待选取文件集合中文件的属性 信息与预先获取的已选取文件集合中文件的属性信息进行比较,获取比较结果,其具体的 比较方法可以参见如图2所示的步骤204所述,此处不再赘述;选取单元303,用于根据由所述比较单元获取的比较结果选取所述待选取文件集 合中不同于所述已选取文件集合中的文件,其具体的选取方法可以参见如图2所示的步骤 206所述,此处不再赘述。进一步地,如图6所示,所述比较单元302包括第一比较单元3021,用于将由所述获取单元301获取的待选取文件集合中文件的 目录结构与预先获取的已选取文件集合中文件的目录结构进行比较;和/或第二比较单元3022,用于将由所述获取单元301获取的待选取文件集合中文件信 息码与预先获取的已选取文件集合中文件信息码进行比较。进一步地,如图7所示,本发明实施例提供的选取文件的装置还包括
替换单元304,用于用由所述获取单元301获取的待选取文件集合中文件的属性 信息替换所述已选取文件集合中文件的属性信息,其具体的实现方法可以参见如图2所示 的步骤205所述,此处不再赘述。计时单元305,用于对预先设置的获取文件属性信息的时间间隔进行计时,其具体 的实现方法可以参见如图2所示的步骤201所述,此处不再赘述;本发明实施例提供的选取文件的装置,由于是将待选取文件集合中的文件属性信 息与已选取文件集合中的文件属性信息进行比较,通过所获得的比较结果来选取文件,使 得对于文件的选取具有选择性,解决了现有技术中由于需要频繁地重复选取已处理过的文 件,而造成的操作繁琐、工作效率降低的问题。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以 通过程序来指令相关的硬件完成,所述的程序可以存储于计算机可读存储介质中,如ROM/ RAM、磁碟或光盘等。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
1.一种选取文件的方法,其特征在于,包括获取待选取文件集合中文件的属性信息;将所述待选取文件集合中文件的属性信息与预先获取的已选取文件集合中文件的属 性信息进行比较,获取比较结果;根据所述比较结果选取所述待选取文件集合中不同于所述已选取文件集合中的文件。
2.根据权利要求1所述的选取文件的方法,其特征在于,所述文件的属性信息包括文 件的目录结构和/或文件信息码。
3.根据权利要求2所述的选取文件的方法,其特征在于,所述文件信息码为文件的MD5 信息码。
4.根据权利要求2所述的选取文件的方法,其特征在于,当所述文件的属性信息包括 文件的目录结构时,所述将所述待选取文件集合中文件的属性信息与预先获取的已选取文 件集合中文件的属性信息进行比较包括将所述待选取文件集合中文件的目录结构与预先获取的已选取文件集合中文件的目 录结构进行比较。
5.根据权利要求4所述的选取文件的方法,其特征在于,当所述待选取文件集合中文 件的目录结构与预先获取的已选取文件集合中文件的目录结构相同时,还包括将所述待选取文件集合中文件信息码与预先获取的已选取文件集合中文件信息码进 行比较。
6.根据权利要求1所述的选取文件的方法,其特征在于,所述将所述待选取文件集合 中文件的属性信息与预先获取的已选取文件集合中文件的属性信息进行比较,获取比较结 果之后,还包括用所述待选取文件集合中文件的属性信息替换所述已选取文件集合中文件的属性信息。
7.根据权利要求1所述的选取文件的方法,其特征在于,还包括对预先设置的获取文件属性信息的时间间隔进行计时。
8.一种选取文件的装置,其特征在于,包括获取单元,用于获取待选取文件集合中文件的属性信息;比较单元,用于将由所述获取单元获取的待选取文件集合中文件的属性信息与预先获 取的已选取文件集合中文件的属性信息进行比较,获取比较结果;选取单元,用于根据由所述比较单元获取的比较结果选取所述待选取文件集合中不同 于所述已选取文件集合中的文件。
9.根据权利要求8所述的选取文件的装置,其特征在于,所述比较单元包括第一比较单元,用于将由所述获取单元获取的待选取文件集合中文件的目录结构与预 先获取的已选取文件集合中文件的目录结构进行比较;和/或第二比较单元,用于将由所述获取单元获取的待选取文件集合中文件信息码与预先获 取的已选取文件集合中文件信息码进行比较。
10.根据权利要求8所述的选取文件的装置,其特征在于,还包括替换单元,用于用由所述获取单元获取的待选取文件集合中文件的属性信息替换所述 已选取文件集合中文件的属性信息。
11.根据权利要求8所述的选取文件的装置,其特征在于,还包括 计时单元,用于对预先设置的获取文件属性信息的时间间隔进行计时。
全文摘要
本发明实施例公开一种选取文件的方法和装置,涉及计算机领域,以解决现有技术中由于需要频繁地重复选取已处理过的文件,而造成的操作繁琐、工作效率降低的问题。本发明提供的技术方案包括获取待选取文件集合中文件的属性信息;将所述待选取文件集合中文件的属性信息与预先获取的已选取文件集合中文件的属性信息进行比较,获取比较结果;根据所述比较结果选取所述待选取文件集合中不同于所述已选取文件集合中的文件。本发明实施例提供的技术方案可以应用在如Windows和Unix等多种操作系统中。
文档编号G06F17/30GK102103601SQ20091024195
公开日2011年6月22日 申请日期2009年12月16日 优先权日2009年12月16日
发明者李守亮, 王晨, 郑洪涛 申请人:北京方正阿帕比技术有限公司, 北大方正集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1