office文档的处理方法和处理系统与流程

文档序号:18059283发布日期:2019-07-03 02:57阅读:563来源:国知局
office文档的处理方法和处理系统与流程

本发明涉及文档保护技术领域,具体涉及一种office文档的处理方法和处理系统。



背景技术:

目前防勒索安全产品,均使用officecom组件对office的内容进行读取备份,目前的安全检查产品都使用了备份机制,但是采用了全文备份,势必会造成对磁盘空间的大量占用。



技术实现要素:

本发明旨在至少解决上述技术问题之一。

为此,本发明的第一个目的在于提出一种office文档的处理方法,备份文件占用空间小。

为了实现上述目的,本发明的实施例公开了一种office文档的处理方法,包括以下步骤:将office文档转换为压缩格式文件;对所述压缩格式文件提取xml格式的theme文件和document文件;备份所述xml格式的theme文件和document文件,以便在所述office文档被病毒加密时,通过所述xml格式的theme文件和document文件进行文档恢复。

进一步地,还包括:检测所述office文档是否被改写;如果所述office文档被改写,则对所述office文档进行解压处理;如果无法对所述office进行所述解压处理,则认定所述office文档被病毒加密。

进一步地,还包括:当用户改写所述office文档时,将改动的内容进行差量备份。

进一步地,还包括:当所述office文档被改写时,读取最近一次备份的xml格式的document文件;比较当前的xml格式的document文件与所述最近一次备份的xml格式的document文件之间的差别是否大于预设差别阈值;如果是,则向所述用户进行提示。

进一步地,在向所述用户进行提示之后还包括:接收所述用户发出的恢复备份指令;根据所述恢复备份指令将当前的xml格式的document文件恢复为所述最近一次备份的xml格式的document文件。

根据本发明实施例的office文档的处理方法,利用office文档的公开结构,可以不依赖与任何office组件便对office文档直接进行解析;通过对改动之处进行差量备份,使用户可以主动选择任何时间的备份,同时占用了最低的系统资源;根据文档相邻两次改动的差异度判断,间接反映文档是否被病毒备份,检测准确度高、检测速度快。

为此,本发明的第二个目的在于提出一种office文档的处理系统,备份文件占用空间小。

为了实现上述目的,本发明的实施例公开了一种office文档的处理系统,包括:转换模块,用于将将office文档转换为压缩格式文件;提取模块,用于对所述压缩格式文件提取xml格式的theme文件和document文件;备份模块,用于备份所述xml格式的theme文件和document文件,以便在所述office文档被病毒加密时,通过所述xml格式的theme文件和document文件进行文档恢复。

进一步地,还包括:检测模块,用于检测所述office文档是否被改写;解压处理模块,用于在所述office文档被改写时,对所述office文档进行解压处理,以在无法对所述office进行所述解压处理时,认定所述office文档被病毒加密。

进一步地,所述备份模块用于当用户改写所述office文档时,将改动的内容进行差量备份。

进一步地,还包括:读取模块,用于当所述office文档被改写时,读取最近一次备份的xml格式的document文件;比较模块,用于比较当前的xml格式的document文件与所述最近一次备份的xml格式的document文件之间的差别是否大于预设差别阈值;提示模块,用于在所述当前的xml格式的document文件与所述最近一次备份的xml格式的document文件之间的差别大于所述预设差别阈值时,进行提示。

进一步地,还包括:指令接收模块,用于接收所述用户发出的恢复备份指令;恢复模块,用于根据所述恢复备份指令将当前的xml格式的document文件恢复为所述最近一次备份的xml格式的document文件。

根据本发明实施例的office文档的处理系统,利用office文档的公开结构,可以不依赖与任何office组件便对office文档直接进行解析;通过对改动之处进行差量备份,使用户可以主动选择任何时间的备份,同时占用了最低的系统资源;根据文档相邻两次改动的差异度判断,间接反映文档是否被病毒备份,检测准确度高、检测速度快。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1是本发明一个实施例的office文档的处理方法的流程图;

图2是本发明一个实施例的office文档的处理系统的结构框图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

以下结合附图描述本发明。

图1是本发明一个实施例的office文档的处理方法的流程图。如图1所示,本发明实施例的office文档的处理方法,包括以下步骤:

s1:将office文档转换为压缩格式文件。

示例性地,可以将office文档转换为rar格式、jar格式等压缩格式文件。在本文中,本领域人员可以理解,office文档包括word、excel等文档。

s2:对压缩格式文件提取xml格式的theme文件和document文件。

具体地,由于新版的office文档均采用数据流的方式进行存储,而这种数据流实际上是以压缩的形式进行存储的。而本系统正是利用上述的原因,直接将office文档当作压缩文件处理。从而将office文档直接提取。以word文档为例,可以将office提取成如下文件夹如_rels、customxml、docprops、word文件夹等等。而我们主要需要备份word\theme\theme1.xml和word\document.xml。其中document.xml是word文档中真正的内容。

s3:备份xml格式的theme文件和document文件,以便在office文档被病毒加密时,通过xml格式的theme文件和document文件进行文档恢复。

具体地,当office文档被病毒加密时,无法打开该office文档。此时通过备份的xml格式的theme文件和document文件进行文档恢复,以保证用户可以继续使用office文档。

在本发明的一个实施例中,office文档的处理方法还包括:检测office文档是否被改写;如果office文档被改写,则对office文档进行解压处理;如果无法对office进行解压处理,则认定office文档被病毒加密。

在本发明的一个实施例中,office文档的处理方法还包括:当用户改写office文档时,将改动的内容进行差量备份。在一般的情况下,office文档的内容只会修改少量,或增添新的内容,很少会有从头到尾的更改,因此这种相似度对比能从根本上解决直接对文档内容加密的勒索行为。同时仅备份每次更改的差量,占用了最低的系统资源。

进一步地,当office文档被改写时,读取最近一次备份的xml格式的document文件;比较当前的xml格式的document文件与最近一次备份的xml格式的document文件之间的差别是否大于预设差别阈值,其中,预设差别阈值用于提供一个依据,以便用户判断最近一个更改的内容是否为用户主动对office文档的少许修改,还是被病毒攻击导致的大量修改;如果是,则向用户进行提示。其中,即使差别大于预设差别阈值,也有可能是客户主动进行的大量修改,通过在差别大于预设差别阈值时向用户进行提示,由用户判断office文档是否被病毒加密。

进一步地,在向用户进行提示之后还包括:接收用户发出的恢复备份指令;根据恢复备份指令将当前的xml格式的document文件恢复为最近一次备份的xml格式的document文件。

根据本发明实施例的office文档的处理方法,利用office文档的公开结构,可以不依赖与任何office组件便对office文档直接进行解析;通过对改动之处进行差量备份,使用户可以主动选择任何时间的备份,同时占用了最低的系统资源;根据文档相邻两次改动的差异度判断,间接反映文档是否被病毒备份,检测准确度高、检测速度快。

图2是本发明一个实施例的office文档的处理系统的结构框图。如图2所示,本发明实施例的office文档的处理系统,包括转换模块210、提取模块220和备份模块230。

其中,转换模块210用于将将office文档转换为压缩格式文件。提取模块220用于对压缩格式文件提取xml格式的theme文件和document文件。备份模块230用于备份xml格式的theme文件和document文件,以便在office文档被病毒加密时,通过xml格式的theme文件和document文件进行文档恢复。

在本发明的一个实施例中,office文档的处理系统还包括检测模块和解压处理模块。其中,检测模块用于检测office文档是否被改写。解压处理模块用于在office文档被改写时,对office文档进行解压处理,以在无法对office进行解压处理时,认定office文档被病毒加密。

在本发明的一个实施例中,备份模块230用于当用户改写office文档时,将改动的内容进行差量备份。

在本发明的一个实施例中,office文档的处理系统还包括读取模块、比较模块和提示模块。其中,读取模块用于当office文档被改写时,读取最近一次备份的xml格式的document文件。比较模块用于比较当前的xml格式的document文件与最近一次备份的xml格式的document文件之间的差别是否大于预设差别阈值。提示模块用于在当前的xml格式的document文件与最近一次备份的xml格式的document文件之间的差别大于预设差别阈值时,进行提示。

在本发明的一个实施例中,office文档的处理系统还包括指令接收模块和恢复模块。其中,指令接收模块用于接收用户发出的恢复备份指令。恢复模块用于根据恢复备份指令将当前的xml格式的document文件恢复为最近一次备份的xml格式的document文件。

根据本发明实施例的office文档的处理系统,利用office文档的公开结构,可以不依赖与任何office组件便对office文档直接进行解析;通过对改动之处进行差量备份,使用户可以主动选择任何时间的备份,同时占用了最低的系统资源;根据文档相邻两次改动的差异度判断,间接反映文档是否被病毒备份,检测准确度高、检测速度快。

需要说明的是,本发明实施例的office文档的处理系统的具体实施方式与本发明实施例的office文档的处理方法的具体方式类似,具体参见处理方法部分的描述,为了减少冗余,不做赘述。

另外,本发明实施例的office文档的处理方法和处理系统的其它构成以及作用对于本领域的技术人员而言都是已知的,为了减少冗余,不做赘述。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1