一种文件处理方法和设备的制造方法

文档序号:10553018阅读:180来源:国知局
一种文件处理方法和设备的制造方法
【专利摘要】本发明公开了一种文件处理方法和设备,属于计算机领域,以提高存储空间利用率。所述方法包括:获取需要存储的多个文件,所述多个文件中的每个文件的大小小于指定大小;将所述多个文件以聚合方式存储到文件对象中,其中所述指定大小不大于所述文件对象的大小。本发明用于存储小文件。
【专利说明】
一种文件处理方法和设备
技术领域
[0001 ]本发明涉及计算机领域,特别涉及一种文件处理方法和设备。
【背景技术】
[0002] 在分布式文件系统中,文件系统的处理场景往往是针对大文件进行设计的,因此 在处理海量小文件时往往效率低下,无法满足实际应用需求。
[0003] 在分布式文件系统中,对于文件数据存储,会将一或多个磁盘整体管理出来作为 存储池使用,其中空间使用的粒度为固定大小的对象。因此,一个大文件往往会占用多个对 象,而一个小文件往往占用不满一个完整对象,造成存储空间浪费。

【发明内容】

[0004] 本发明实施例提供了一种文件处理方法和设备,以提高存储空间利用率。
[0005] 第一方面,提供一种文件处理方法,所述方法包括:获取需要存储的多个文件;确 定所述多个文件中的每个文件的大小小于指定字节,将所述多个文件以聚合方式存储到文 件对象中,其中所述指定字节不大于所述文件对象的大小。
[0006] 在本发明实施例中,所述多个文件为小文件,即文件大小小于指定字节的文件,其 中,指定字节可根据需要来设定,但需保证所述指定字节不大于文件对象的大小。一般而 言,小文件为那些单个文件无法占满一个完整对象,而需要多个(例如,两个或更多个)文件 才能占满或大部分占用一个完整对象的文件。聚合方式存储是指,多个小文件在存储时充 分利用对象内的空间,以一个小文件挨着另一个小文件的方式来进行存储。例如,一个小文 件可以存储在对象中分条的一个条带中。这样一来,对于小文件存储,相较于传统的一个小 文件单独占用一个完整对象,造成空间浪费,本发明实施例在进行小文件存储时是以条带 为单位进行存储,将多个小文件聚合存储到文件对象中,如此,对于小文件存储的粒度更 小,充分利用了对象空间,提高了存储空间的利用率。
[0007] 结合第一方面,在第一种可能的实现方式中,在进行文件存储之后,还可接收文件 删除命令,所述文件删除命令可指示删除的文件为所述文件对象中存储的文件;在本发明 实施例中在接收到文件删除命令之后,即可将所述文件删除命令以文件删除记录的形式进 行记录,并删除所述文件删除命令指示删除的文件的元数据。相比于传统的直接在接收到 文件删除命令时直接删除文件数据,本发明实施例中在接收到文件删除命令时只删除相应 的元数据,而不删除文件数据,同时针对文件删除命令保存文件删除记录,即以文件删除记 录的形式来代替真正的文件数据删除。如此,既可在用户侧实现对文件的删除(事实上,文 件并未真正删除),即用户已经看不到了要删除的文件,因为文件的元数据已被删除;同时, 又可以对文件删除命令进行归并,每当收到一条文件删除命令时并不真正删除对应的文件 数据,只是记录一条文件删除记录,操作简单,后续在满足一定条件时再一起执行真正的文 件删除操作,提高文件删除的效率。
[0008] 结合第一方面的第一种可能实现方式,可选地,在第二种可能的实现方式中,在删 除所述文件删除命令指示删除的文件的元数据之后,本发明实施例还可向用户提示所述文 件删除命令指示删除的文件已删除。即,向用户表明文件已删除,以便让用户及时得知文件 处理情况,方便用户进行后续的文件操作。
[0009] 结合第一方面的第一种可能实现方式或第二种可能实现方式,在第三种可能的实 现方式中,在删除所述文件删除命令指示删除的文件的元数据之后,本发明实施例提供的 文件处理方法还可包括:在满足预设条件时扫描存储的文件删除记录;确定所述文件删除 记录指示所述文件对象中一个完整分条中的所有条带上的文件均已被删除,删除所述完整 分条上的数据。在本发明实施例中,文件删除记录可存储在数据库中。所述预设条件可以为 预定时间间隔、文件删除记录的条数达到指定数目等。以预设条件为预定时间间隔为例,可 用定时器设定所述预定时间间隔,每当达到所述预定时间间隔,即可扫描存储的文件删除 记录。这样一来,通过设定扫描时间间隔来进行文件删除记录的扫描,可以保证扫描效率更 高。同时,根据扫描结果,在文件删除记录反映出一个完整分条上的文件均要被删除时,则 对这个完整分条上的数据执行删除操作,如此以分条为删除的最小单位,避免了每接收到 一次文件删除命令就执行一次文件删除操作,通过集中执行文件删除操作,降低了删除频 率,提高了删除效率。
[0010] 结合第一方面的第三种可能实现方式,在第四种可能的实现方式中,在删除所述 文件删除命令指示删除的文件的元数据以及在删除一个完整分条上的数据之后,本发明实 施例提供的文件处理方法可进一步包括:确定所述文件对象中所有分条均已被删除,删除 整个所述文件对象上的数据。在本发明实施例中,当文件对象中的一个分条被删除时,会进 一步确定该分条是否为文件对象中的最后一个分条,若该分条为文件对象中的最后一个分 条,则可确定文件对象的所有分条均被删除,则可删除整个文件对象上的数据以及相关的 文件对象属性。当然,若文件对象中存在没有被删除的分条,则会保留这些未被删除的分条 上的数据。此种实现方式是对第三种实现方式的进一步补充,如此能够保证文件删除操作 能够更彻底地进行,节约系统资源。
[0011]结合第一方面的上面任一种可能实现方式,在第五种可能的实现方式中,所述多 个文件为分布式文件系统中的文件。作为本发明的一种典型应用场景,本发明实施例提供 的文件处理方法可应用于分布式文件系统。当然,本发明实施例提供的文件处理方法并不 限于处理分布式文件系统中的文件,只要是针对细粒度进行操作,均可以通过本发明提供 的这种聚合方式来进行处理,提高处理性能。
[0012] 第二方面,提供一种文件处理设备,该文件处理设备具有实现上述第一方面中文 件处理设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实 现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
[0013] 在一个可能的设计中,文件处理设备的结构中包括处理器和存储器,所述存储器 用于存储支持文件处理设备执行上述方法的程序,所述处理器被配置为用于执行所述存储 器中存储的程序。所述文件处理设备还可以包括通信接口,用于文件处理的设备与其他设 备或通信网络通信。
[0014] 第三方面,本发明实施例提供了一种非临时性计算机存储介质,用于存储执行上 述方面为文件处理设备所设计的程序,所述程序包括上述文件处理设备所用的计算机软件 指令。
[0015] 本发明实施例提供的文件处理方法和文件处理设备,在对占用空间小于指定字节 的多个文件(即,小文件)进行存储时,以聚合方式将这多个文件存储到文件对象中,而不是 传统的一个文件占用一个对象,如此一来,能够在一个对象内存储多个文件,避免了存储空 间浪费,提高了存储空间利用率。
【附图说明】
[0016] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。
[0017] 图1是本发明实施例提供的文件处理方法的流程图;
[0018] 图2是本发明实施例提供的一种文件处理方法的示意图;
[0019] 图3是本发明实施例提供的另一种文件处理方法的示意图;
[0020] 图4是本发明实施例提供的文件处理设备的结构示意图;
[0021 ]图5是本发明实施例提供的文件处理设备的结构框图。
【具体实施方式】
[0022]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。
[0023] 本发明实施例提供了一种文件处理方法,该方法可以由终端设备来完成。其中,终 端设备也可称为用户设备(User Equipment,简称为"UE")、移动台(Mobile Station,简称 为"MS")、移动终端(Mobile Terminal)等,该终端设备可以经无线接入网(Radio Access Network,简称为"RAN")与一个或多个核心网进行通信,例如,终端设备可以是移动电话(或 称为"蜂窝"电话)、具有移动终端的计算机等,例如,终端设备还可以是便携式、袖珍式、手 持式、计算机内置的或者车载的移动设备,它们可以与无线接入网交换语言和/或数据。
[0024] 本发明实施例提供的终端设备典型的可以是例如便携式终端、移动电话、移动 pad、服务器、平板电脑、计算机或个人数字助理(PDA)等设备。
[0025] 当然,在本发明的范围内,本发明实施例提供的文件处理方法也可以由包括各种 终端设备的网络系统来执行。亦即,网络系统内可包括各种终端设备,每一终端设备完成一 项特定动作,它们相互配合一起来完成文件处理方法。其中,终端设备可包括至少一个处理 器、存储器、通信接口和总线。处理器、存储器和通信接口通过总线连接并完成相互间的通 信。终端设备和网络系统的具体结构将在下文中进一步描述。
[0026] 下面先对本发明实施例提供的文件处理方法中涉及的一些相关术语进行解释。
[0027] 对象(Object):对象存储的基本单元。每个对象是数据和数据属性集的综合体。数 据属性可以根据应用的需求进行设置,包括数据分布、服务质量等。对象维护自己的属性, 从而简化了存储系统的管理任务,增加了灵活性。对象的大小可以不同,可以包含整个数据 机构,如文件、数据库表项等。
[0028] 本发明实施例中的文件对象可以在一个存储设备(例如磁盘)上,也可以跨多个存 储设备,亦即,多个存储设备中都可以存储文件对象的数据。
[0029] 分条:分条可以设置在多个存储设备(例如磁盘)上。当分条跨多个存储设备时,这 多个存储设备中的每个存储设备可各选取一个条带组成一个分条。
[0030] 条带:单个存储设备上分配的存储空间单元。例如,可以在一个存储设备上设置多 个条带,每个条带可以分配例如1M的存储空间。
[0031] 图1是本发明实施例提供的一种文件处理方法的流程图。参照图1,本发明实施例 提供的文件处理方法可包括:
[0032] 11、获取需要存储的多个文件;
[0033] 12、确定所述多个文件中的每个文件的大小小于指定字节,将所述多个文件以聚 合方式存储到文件对象中,其中所述指定字节不大于所述文件对象的大小。
[0034]其中,所述需要存储的多个文件可以为分布式文件系统中的文件。
[0035] 步骤11中获取需要存储的多个文件可以包括各种不同方式。例如接收来自网络侧 的多个文件,具体可以为接收从网络上下载的多个文件,接收从网络侧的另一终端上传输 过来的多个文件等;接收来自外部存储设备的多个文件,例如,接收通过USB接口连接的硬 盘上传输过来的多个文件等。本发明实施例对具体获取需要存储的多个文件的方式不做具 体限定。
[0036] 步骤12中在获取到需要存储的多个文件之后,即可进一步判定所述多个文件中的 每一个文件的大小,将文件大小不大于指定字节的那些文件选取出来作为小文件,然后以 聚合的方式将这些选取出来的文件存储到文件对象中。这样一来,一个文件对象中往往可 以存储多个小文件,而不是传统的一个小文件占用一个对象,提高了存储空间利用率。
[0037] 本发明实施例提供的文件处理方法不仅涉及到了小文件的存储,而且还涉及到了 对小文件的操作,例如对小文件的删除操作。在删除小文件时通过以对象内的分条为删除 的基本单位,一次删除操作就删除整个分条内的数据,降低了删除操作的频率,提高了删除 效率。对文件操作的处理可参照图2。
[0038] 图2是本发明实施例提供的一种文件处理方法的示意图。参照图2,本发明实施例 提供的文件处理方法可由终端设备来完成,终端设备内可包括前台集群代理(Cluster Agent,CA)、数据库、后台CA以及元数据服务(Metadata Service,MDS)。所述文件处理方法 可包括如下步骤:
[0039] 21、接收文件删除命令,所述文件删除命令指示删除的文件为文件对象中存储的 文件。
[0040] 其中,本步骤可由前台CA来完成。文件删除命令可以为用户通过文件系统发出的, 并由前台CA来接收。所述指示删除的文件可以为分布式文件系统中的文件。
[0041] 22、将所述文件删除命令以文件删除记录的形式进行记录,并删除所述文件删除 命令指示删除的文件的元数据。
[0042] 前台CA在接收到文件删除命令之后,可对收到的文件删除命令进行解析,并根据 解析结果,执行相应的文件操作。具体地,在本发明实施例中,前台CA可将文件删除命令变 更为文件删除记录,并可将文件删除记录存储到数据库中,但前台CA并不会删除文件删除 命令所指示删除的文件数据,而只是删除指示删除的文件(即待删除文件)的元数据。待文 件的元数据删除后,用户将不会再看到需要删除的文件。
[0043] 在本发明实施例中,可针对一个文件删除命令,记录一条文件删除记录,还可对文 件删除记录的数目进行统计。
[0044]本发明实施例利用数据库存放删除文件记录,能够提高用户删除文件请求的响应 速度。其中,数据库中存放的文件删除记录可如下表所示:
[0047] 上表维护了收到三个文件删除命令后在数据库中形成的3个相应的文件删除记 录,后台会定期扫描这些文件删除记录进行相应数据的真正删除,如果扫描到对象中整分 条上小文件均有记录,那么则删除对象中的整分条,进而达到一次删除会删除多个小文件 的目的,具体可如下面进一步说明。
[0048] 23、向用户提示所述文件删除命令指示删除的文件已删除。
[0049] 步骤23可由前台CA来完成。
[0050] 向用户提示文件已删除时,用户已看不到指示删除的文件。步骤23为可选步骤,在 本发明的范围内,也可以不向用户提示指示删除的文件已删除。由于在删除指示删除的文 件的元数据后,用户已看不到需要删除的文件,因而,用户在看不到需要删除的文件时,BP 可获知指示删除的文件已被删除。
[0051] 24、在满足预设条件时,扫描存储的文件删除记录。
[0052] 步骤24可由后台CA来完成。步骤24是与步骤22相适应的,在步骤22中存储了文件 删除记录,在步骤24中在达到设定的条件时,即可扫描存储的文件删除记录。其中,所述预 设条件可以为预定时间间隔,例如1分钟,5分钟等。其中,预定时间间隔可以通过定时器来 设定。在本发明实施例中也可以设定其他预设条件,在达到预设条件时即触发开始扫描存 储的文件删除记录。所述预设条件例如还可以为文件删除记录的条数达到指定数目等,所 述指定数目例如为10条、15条等。
[0053] 25、确定所述文件删除记录指示所述文件对象中一个完整分条中的所有条带上的 文件均被删除,删除所述完整分条上的数据。
[0054]步骤25可由后台CA来完成。
[0055]具体地,根据步骤24中的文件删除记录的扫描结果,即可获知文件对象中是否存 在以下类型的一个或多个分条:这一个或多个分条中的每一个分条中的所有条带上的文件 均被文件删除记录指示删除。若存在这种类型的一个或多个分条,则表明这一个或多个分 条已被文件删除记录指示删除,因而可直接删除这一个或多个分条上的文件数据。
[0056]当然,若不存在这种类型的一个或多个分条,则表明分条上还存在没有被文件占 用的条带,此时,不删除这种类型的分条,待分条上的所有条带上的文件均已被文件删除记 录指示删除时,才会删除这种类型的分条上的文件数据。
[0057] 26、确定所述文件对象中所有分条均已被删除,删除整个所述文件对象上的数据。
[0058] 步骤26可由后台CA来完成,且步骤26为可选步骤。步骤26是在步骤25基础上的进 一步延伸。在本发明实施例中,当文件对象的最后一个分条被删除时,可确定文件对象的所 有分条均已被删除。若文件对象中的所有分条上的文件数据均已被删除,则需要删除整个 对象上的文件数据以及对象的一些其他相关联数据,例如对象的属性信息等。当然,若文件 对象中存在文件数据尚未被删除的分条,则会保留文件对象上的这种分条。
[0059] 需要说明的是,在执行上面的步骤22、24、25时,如图2所示,还可以反馈确认信息, 所述确认信息可以为确认文件删除记录添加成功、确认文件元数据删除成功、确认分条删 除成功、确认对象删除成功等。
[0060] 需要说明的是,本发明实施例中的前台CA、后台CA以及MDS可以以软件程序的形态 存储在存储器中。当CPU执行这些软件程序时,可执行上述本发明实施例提供的文件处理方 法。
[0061] 本发明实施例提供的文件处理方法,在海量小文件目录删除场景下,通过以文件 删除记录的形式聚合删除操作,提高了底层删除效率,同时通过针对对象分条释放空间,提 高了文件删除空间回收效率。
[0062] 图3是本发明实施例提供的另一种文件处理方法的示意图。参照图3,本发明实施 例提供的文件处理方法可由网络上的各种终端设备来完成。例如,一个用于接收用户的操 作指令的用户设备、一个发挥前台CA作用的前侧设备(例如,个人电脑a)、一个用于存储文 件(即,发挥图2中所示数据库的作用)的存储设备(例如,服务器a)、一个发挥后台CA的作用 (例如,个人电脑b)的后侧设备,以及一个发挥元数据服务作用的元数据服务器(例如,服务 器b) 〇
[0063] 需要说明的是,图3中的存储设备虽然在图中示出为一个,但实际上可以为分布于 网络上各处的多个存储设备。每个所述存储设备上可存放文件删除记录和文件数据。
[0064]需要指出的是,在本发明实施例中,用户设备、前侧设备、存储设备、后侧设备、元 数据服务器可以为相互独立的终端设备,当然用户设备、前侧设备、存储设备、后侧设备、元 数据服务器也可根据需要集成在一起,只需要完成相应的功能即可。例如,前侧设备和元数 据服务器可以为同一个终端设备(即服务器a和b可以为同一服务器),又例如,用户设备和 前侧设备可为同一个设备等。
[0065]在图3所示情形下的文件处理方法可与图2中所示文件处理方法相类似,只是执行 主体不同。在此,对于这种情形下的文件处理方法可参照上文描述,在此不做赘述。
[0066]本发明实施例提供的文件处理方法,通过将多个小文件数据聚合存储到同一个对 象中,能够提高系统存储利用率。同时,利用数据库记录删除文件记录,能够提高用户删除 文件请求的响应速度;在海量小文件目录删除场景下,通过以文件删除记录的形式聚合删 除操作,提高了底层删除效率,同时通过针对对象分条释放空间,提高了文件删除空间回收 效率。
[0067]图4是本发明实施例提供的一种文件处理设备的结构示意图。参照图4,本发明实 施例提供的数据处理的装置400包括:至少一个处理器401、存储器402、通信接口 403和总 线。处理器401、存储器402和通信接口 403通过总线连接并完成相互间的通信。所述总线可 以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互 连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称为EISA)总线等。所述总线可以分为地址总线、数 据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一 种类型的总线。其中:
[0068]存储器402用于存储可执行程序代码,该程序代码包括计算机操作指令。存储器 402可以为高速RAM存储器,也可能为非易失性存储器(non-volatile memory),例如至少一 个磁盘存储器。
[0069] 在一个实施例中,处理器401通过读取存储器402中存储的可执行程序代码来运行 与所述可执行程序代码对应的程序,以用于:获取需要存储的多个文件;确定所述多个文件 中的每个文件的大小小于指定字节,将所述多个文件以聚合方式存储到文件对象中,其中 所述指定字节不大于所述文件对象的大小。
[0070] 在一个实施例中,处理器401通过读取存储器402中存储的可执行程序代码来运行 与所述可执行程序代码对应的程序,以用于:接收文件删除命令,所述文件删除命令指示删 除的文件为所述文件对象中存储的文件;将所述文件删除命令以文件删除记录的形式进行 记录,并删除所述文件删除命令指示删除的文件的元数据。
[0071] 在一个实施例中,处理器401通过读取存储器402中存储的可执行程序代码来运行 与所述可执行程序代码对应的程序,以用于:在所述删除所述文件删除命令指示删除的文 件的元数据之后,向用户提示所述文件删除命令指示删除的文件已删除。
[0072] 在一个实施例中,处理器401通过读取存储器402中存储的可执行程序代码来运行 与所述可执行程序代码对应的程序,以用于:在所述删除所述文件删除命令指示删除的文 件的元数据之后,在满足预设条件时,扫描存储的文件删除记录;确定所述文件删除记录指 示所述文件对象中一个完整分条中的所有条带上的文件均被删除,删除所述完整分条上的 数据。
[0073] 在一个实施例中,处理器401通过读取存储器402中存储的可执行程序代码来运行 与所述可执行程序代码对应的程序,以用于:在所述删除所述文件删除命令指示删除的文 件的元数据之后,确定所述文件对象中所有分条均被删除,删除整个所述文件对象上的数 据。
[0074] 在本发明实施例中,所述多个文件可以为分布式文件系统中的文件。
[0075] 本发明实施例提供的文件处理设备,通过将多个小文件数据聚合存储到同一个对 象中,能够提高系统存储利用率。同时,利用数据库记录删除文件记录,能够提高用户删除 文件请求的响应速度;在海量小文件目录删除场景下,通过以文件删除记录的形式聚合删 除操作,提高了底层删除效率,同时通过针对对象分条释放空间,提高了文件删除空间回收 效率。
[0076] 图5是本发明实施例提供的文件处理设备的结构框图。参照图5,本发明实施例提 供的文件处理的设备500包括获取单元501、处理单元502和存储单元503。其中:
[0077]获取单元501,用于获取需要存储的多个文件;
[0078] 处理单元502,用于确定所述多个文件中的每个文件的大小小于指定字节,其中所 述指定字节不大于所述文件对象的大小;
[0079] 存储单元503,用于将所述多个文件以聚合方式存储到文件对象中。
[0080] 可选地,在一个实施例中,所述设备500还包括:
[0081] 接收单元504,用于接收文件删除命令,所述文件删除命令指示删除的文件为所述 文件对象中存储的文件;
[0082] 所述存储单元503具体用于:将所述文件删除命令以文件删除记录的形式进行存 储;
[0083]所述处理单元502具体用于:删除所述文件删除命令指示删除的文件的元数据。 [0084] 可选地,在另一个实施例中,所述设备500还包括:
[0085]提示单元505,用于在所述处理单元502删除所述文件删除命令指示删除的文件的 元数据之后,向用户提示所述文件删除命令指示删除的文件已删除。
[0086]可选地,所述处理单元502在删除所述文件删除命令指示删除的文件的元数据之 后,还可用于:
[0087]以预定时间间隔周期性扫描存储的文件删除记录;确定所述文件删除记录指示所 述文件对象中一个完整分条中的所有条带上的文件均已被删除,删除所述完整分条上的数 据。
[0088] 进一步地,所述处理单元502还可用于:
[0089]确定所述文件对象中所有分条均已被删除,删除整个所述文件对象上的数据。 [0090]其中,本发明实施例中的所述多个文件可以为分布式文件系统中的文件。
[0091]本发明实施例提供的文件处理设备,通过将多个小文件数据聚合存储到同一个对 象中,能够提高系统存储利用率。同时,利用数据库记录删除文件记录,能够提高用户删除 文件请求的响应速度;在海量小文件目录删除场景下,通过以文件删除记录的形式聚合删 除操作,提高了底层删除效率,同时通过针对对象分条释放空间,提高了文件删除空间回收 效率。
[0092]需要说明的是:上述实施例提供的文件处理的设备仅以上述各功能模块的划分进 行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设 备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实 施例提供的文件处理的设备与文件处理的方法实施例属于同一构思,其具体实现过程详见 方法实施例,这里不再赘述。
[0093]需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重 点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。 对于设备类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参 见方法实施例的部分说明即可。
[0094]本发明实施例还提供了一种计算机存储介质,用于储存实现上述图4所示的文件 处理设备的计算机软件指令,其包含用于执行上述方法实施例所设计的程序。通过执行存 储的程序,能够有效过滤无关的页面,增强和完善了 WEB页面的过滤,实现了更加有针对性 地进行文件处理。
[0095]需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列 的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为 依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知 悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明 所必须的。
[0096] 需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列 的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为 依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知 悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明 所必须的。
[0097] 尽管在此结合各实施例对本发明进行了描述,然而,在实施所要求保护的本发明 过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实 现所述公开实施例的其他变化。在权利要求中,"包括"(comprising)-词不排除其他组成 部分或步骤,"一"或"一个"不排除多个的情况。单个处理器或其他单元可以实现权利要求 中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措 施不能组合起来产生良好的效果。
[0098] 本领域技术人员应明白,本发明的实施例可提供为方法、设备(设备)、或计算机程 序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的 实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算 机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序 产品的形式。计算机程序存储/分布在合适的介质中,与其它硬件一起提供或作为硬件的一 部分,也可以采用其他分布形式,如通过Internet或其它有线或无线电信系统。
[0099] 本发明是参照本发明实施例的方法、设备(设备)和计算机程序产品的流程图和/ 或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/ 或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令 到通用计算机、专用计算机、嵌入式处理机或其他可编程文件处理设备的处理器以产生一 个机器,使得通过计算机或其他可编程文件处理设备的处理器执行的指令产生用于实现在 流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
[0100] 这些计算机程序指令也可存储在能引导计算机或其他可编程文件处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0101] 这些计算机程序指令也可装载到计算机或其他可编程文件处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一 个方框或多个方框中指定的功能的步骤。
[0102] 尽管结合具体特征及其实施例对本发明进行了描述,显而易见的,在不脱离本发 明的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所 附权利要求所界定的本发明的示例性说明,且视为已覆盖本发明范围内的任意和所有修 改、变化、组合或等同物。显然,本领域的技术人员可以对本发明进行各种改动和变型而不 脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其 等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1. 一种文件处理方法,其特征在于,所述方法包括: 获取需要存储的多个文件,所述多个文件中的每个文件的大小均小于指定大小; 则将所述多个文件以聚合方式存储到文件对象中,其中所述指定大小不大于所述文件 对象的大小。2. 根据权利要求1所述的方法,其特征在于,所述方法之后,还包括: 接收文件删除命令,所述文件删除命令指示待删除的文件为所述文件对象中存储的文 件; 将所述文件删除命令以文件删除记录的形式进行记录,并删除所述待删除的文件的元 数据。3. 根据权利要求2所述的方法,其特征在于,在所述删除所述待删除的文件的元数据之 后,所述方法还包括: 向用户提示所述待删除的文件已删除。4. 根据权利要求2或3所述的方法,其特征在于,在所述删除所述待删除的文件的元数 据之后,所述方法还包括: 在满足预设条件时,扫描所述文件删除记录; 如果所述文件删除记录指示所述文件对象中一个完整分条中的所有条带上的文件均 被删除,则删除所述完整分条上的数据。5. 根据权利要求4所述的方法,其特征在于,在所述删除所述待删除的文件的元数据之 后,所述方法还包括: 确定所述文件对象中所有分条均被删除,删除整个所述文件对象上的数据。6. 根据权利要求1_3、5中任一所述的方法,其特征在于,所述方法应用于分布式文件系 统。7. 根据权利要求1_3、5中任一所述的方法,其特征在于,所述将所述多个文件以聚合方 式存储到文件对象中包括: 所述多个文件中的每个文件占用所述文件对象中的一个条带。8. -种文件处理设备,其特征在于,所述设备包括: 获取单元,用于获取需要存储的多个文件; 处理单元,用于确定所述多个文件中的每个文件的大小小于指定大小,其中所述指定 大小不大于所述文件对象的大小; 存储单元,用于将所述多个文件以聚合方式存储到文件对象中。9. 根据权利要求8所述的设备,其特征在于,所述设备还包括: 接收单元,用于接收文件删除命令,所述文件删除命令指示待删除的文件为所述文件 对象中存储的文件; 所述存储单元具体用于:将所述文件删除命令以文件删除记录的形式进行记录; 所述处理单元具体用于:删除所述待删除的文件的元数据。10. 根据权利要求9所述的设备,其特征在于,所述设备还包括: 提示单元,用于在所述处理单元删除所述待删除的文件的元数据之后,向用户提示所 述待删除的文件已删除。11. 根据权利要求9或10所述的设备,其特征在于,所述处理单元在所述处理单元删除 所述待删除的文件的元数据之后,还用于: 在满足预设条件时,扫描所述文件删除记录;确定所述文件删除记录指示所述文件对 象中一个完整分条中的所有条带上的文件均被删除,删除所述完整分条上的数据。12. 根据权利要求11所述的设备,其特征在于,所述处理单元还用于: 确定所述文件对象中所有分条均被删除,删除整个所述文件对象上的数据。13. 根据权利要求8-10、12中任一所述的设备,其特征在于,所述多个文件为分布式文 件系统中的文件。14. 根据权利要求8-10、12中任一所述的方法,其特征在于,所述存储单元具体用于: 所述文件对象中的一个条带存储所述多个文件中的一个文件。
【文档编号】G06F17/30GK105912664SQ201610224098
【公开日】2016年8月31日
【申请日】2016年4月11日
【发明人】赵胜志
【申请人】华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1