本发明涉及文档领域,具体是一种开放文档格式的格式自动扫描系统。
背景技术:
1、在我们日常工作生活中,文档中的文字格式是文档的重要组成部分,而格式问题给我们的工作和交流带来了很多的工作量。例如,企业内部不同的文档规范,对文字格式是有明确要求的,之前这种格式规范全部需要靠人工对照规范进行校对和修正,工作量巨大。
2、文档是最为常用的工作和交流工具,不同的厂商推出的不同文档格式,导致不同的软件在处理文档时遇到了非常复杂的兼容性问题,于是业界推出了开放文档格式(opendocument format),用公开的、明文的方式来制定文档格式标准,使得不同厂商的文档处理软件能够识别不同厂商推出的文件格式,从而为我们解析文档原始内容提供了技术便利。
3、虽然在文档领域中,业界已经推出了开放文档格式(open document format),但是由于文档本身不是直接的明文文本,而是一个由多个根据开放文档格式的规范、对文档进行定义的一组文件打包而成的文件包,直接用普通的字符编辑器无法打开。所以对其原文内容和格式的分析和使用尚未深入,在办公协同领域,对文档格式规则的设置、检查、修正都还通过专业文档处理软件的图形界面进行手工处理,效率十分低下。
技术实现思路
1、本发明的目的在于提供一种开放文档格式的格式自动扫描系统,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:
3、一种开放文档格式的格式自动扫描系统,包括规则设置模块、规则存储模块、文档解析模块、内容及格式数据存储模块、格式判定模块、判定结果存储模块、格式问题展示模块;
4、所述规则设置模块的数据输出端分别与规则存储模块和格式判定模块连接;
5、所述规则存储模块的数据输出端分别与规则设置模块和格式问题展示模块连接;
6、所述文档解析模块的数据输出端分别与内容及格式数据存储模块和格式判定模块连接;
7、所述内容及格式数据存储模块的数据输出端分别与文档解析模块和格式判定模块连接;
8、所述格式判定模块的数据输出端分别与判定结果存储模块和格式问题展示模块连接;
9、所述判定结果存储模块的数据输出端与格式判定模块连接。
10、作为本发明进一步的方案:包括如下步骤:
11、步骤一、设置规则;
12、用户通过规则设置模块进行规则输入,设置文档格式规范;
13、步骤二、存取规则;
14、通过规则设置模块将设置好的文档格式规则数据存至规则存储模块中,并在后续流程中按需读取;
15、步骤三、文档读入;
16、通过文件解析模块读入用户文档;
17、步骤四、读入规范;
18、通过文件解析模块读入开放文档格式规范;
19、步骤五、解析;
20、根据开放文档格式规范,对用户文档进行解析,提取出用户文档内容及用户文档内容的格式数据,并传输至格式判定模块中;
21、步骤六、读取规则;
22、通过格式判定模块读取用户在步骤一中设置好的文档格式规则数据;
23、步骤七、判定;
24、比对步骤五中提取出的用户文档内容的格式数据,以及步骤六中读取的文档格式规则数据,判定用户文档内容的格式是否符合要求,并将判定结果传输至格式问题展示模块;
25、步骤八、设置规则读取;
26、通过格式问题展示模块读取用户在步骤一中设置好的文档格式规则数据,会同步骤七中产生的判定结果,展示给用户。
27、作为本发明进一步的方案:在步骤五中,将提取出的用户文档内容及用户文档内容的格式数据,存至内容及格式数据存储模块中,并在后续流程中按需读取。
28、作为本发明进一步的方案:在步骤七中,将产生的判定结果存至判定结果存储模块中,并在后续流程中按需读取。
29、与现有技术相比,本发明的有益效果是:
30、本发明提供了一种对开放文档格式的文档进行自动格式扫描的系统,提升对文档格式校对、规范、修改等方面的效率。本发明将现有在代码静态扫描领域,对代码编码规范进行设置、检查和修正的技术应用到文档扫描中,使文档格式规则的设置、检查、修正都实现了自动化,从而大幅度提升了工作效率。
31、本发明通过提供文档格式定义系统对文档格式进行预定义;并且基于开放文档格式对用户文档输入进行解归档,并解析原始文件格式定义文件,对文档格式解析和检查;同时对不符合文档格式预定义的用户文档格式进行对比和自动检查;从而能够让文档处理人员通过本系统,自动对文档的格式进行规范设置和自动检查,大大提高工作效率。
1.一种开放文档格式的格式自动扫描系统,其特征在于,包括规则设置模块、规则存储模块、文档解析模块、内容及格式数据存储模块、格式判定模块、判定结果存储模块、格式问题展示模块;
2.根据权利要求1所述的一种开放文档格式的格式自动扫描系统的扫描方法,其特征在于,包括如下步骤:
3.根据权利要求2所述的一种开放文档格式的格式自动扫描系统的扫描方法,其特征在于,在步骤五中,将提取出的用户文档内容及用户文档内容的格式数据,存至内容及格式数据存储模块中,并在后续流程中按需读取。
4.根据权利要求2所述的一种开放文档格式的格式自动扫描系统的扫描方法,其特征在于,在步骤七中,将产生的判定结果存至判定结果存储模块中,并在后续流程中按需读取。