复杂文档分离组织方法以及复杂文档自动生成方法_4

文档序号:8282454阅读:来源:国知局
述)节点类型,在样式组模板GroupStyle节点下找到Paragraph (段落样式)子节点。接着,根据数据模板SN索引序号“ I ”,在样式组模板Paragraph节点下找到No属性为“I”的SN子节点。最后,使用样式组模板SN节点的Value属性值“C0VER_LEFT”,构建文档段落样式引用的Office OpenXml描述(例如:〈W:pStylew:val = 〃C0VER_LEFT〃/>)。
[0074]10)遵循先数据组级别再大纲级别、依据数据先后位置顺序的组装规则,将第9步样式匹配好的文档数据依次进行组装。数据组装时,根据大纲模板需求(Layer的Sect1nID属性)或数据模板需求(各级样式的SN的Load属性)将分节、字体、段落等样式的具体Office OpenXml描述一并进行组装。
[0075]11)如果大纲模板中文档架构解析未完成,则继续进行第3?10步工作。如果大纲模板中文档架构解析已完成,则根据文档格式需求,将组装好的带样式的文档数据进行格式化输出,形成最终文档。
[0076]本发明对复杂文档的大纲、数据和样式进行分离组织和描述,构建了完整的复杂文档自动生成技术框架,实现了基于Xml描述和Xslt变换的,文档数据与样式模板融合并转换为Office OpenXml的文档生成技术(例如如图9所示)。
[0077]本发明相对于传统的文档自动生成技术,具有良好的灵活性、高效性和可扩展性。
[0078]本发明提供的复杂文档大纲、数据和样式的分离组织和描述方法,突破了文档内容信息描述所受到的文档格式、样式的约束和限制。对复杂文档的文档架构逐层细化,对文档数据与样式的分离解析,使复杂文档的组织变得更清晰灵活。基于Xml描述的文档大纲、数据和样式组织,可实现复杂文档内容的跨平台生成和复用,具有良好的可扩展性。
[0079]本发明提供的复杂文档自动生成技术框架,使文档自动生成流程更加灵活和高效。结合文档大纲、数据和样式的分离描述,该技术框架使得单个复杂文档的多个文档内容的并发生成成为可能,同时极大程度的方便了用户对文档内容的组织和定制。该技术框架,即为用户提供了更为灵活的文档架构与内容定制接口,又可整合相关性和相似度强的文档大纲、样式和内容,避免了重复的文字输入工作,较大程度的提高了工作效率。
[0080]此外,需要说明的是,除非特别指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。
[0081]可以理解的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
【主权项】
1.一种复杂文档分离组织方法,其特征在于包括:将复杂文档分解成文档大纲、文档数据和文档样式;其中将复杂文档的文档大纲定义为对文档结构的宏观描述,是按照文档内容对文档的层次化分解、定义和管理,是对文档数据和文档样式模板的统一组织;复杂文档的文档数据是对文档元数据的组织和描述;复杂文档的文档样式是对文档样式的组织和描述。
2.根据权利要求1所述的复杂文档分离组织方法,其中文档大纲包括文档架构描述、文档关联索引、文档数据模板定义、文档样式模板定义和文档属性定义;文档架构描述是按照内容对整个文档进行层次化分解和组织,为文档主体框架的静态展现;文档关联索引定义文档层次与元素间的引用和关联关系,将文档架构的各个组成部分进行有机融合;文档数据模板定义是文档数据模板的入口,描述了文档数据相关模板的获取方法;文档样式模板定义是文档样式模板的入口,描述了文档样式相关模板的获取方法;文档属性定义包含文档的全局的、通用的属性描述,可以在文档的相关数据和样式模板中进行引用。
3.根据权利要求1或2所述的复杂文档分离组织方法,其中文档数据包括文档具体内容、文档内容分组、文档内容与样式关联;文档具体内容是文档需要实际展现的数据,是对原始数据的处理和组织;文档内容分组是在文档大纲的宏观组织下,进一步细化对文档内容的组织,或者是粗粒度的文档内容;文档内容分组包括封面、目录页、正文、附录;文档内容与样式关联是确定文档具体内容最终输出的样式;文档内容与样式关联具有间接关系,文档内容所属的文档内容分组与一个文档内容样式索引进行关联,文档具体内容通过引用文档内容样式索引的序号间接地与文档具体内容样式进行关联。
4.根据权利要求1或2所述的复杂文档分离组织方法,其中文档样式包括文档整体样式、文档结构样式、文档内容样式和文档内容样式索引;文档整体样式针对于整个文档设置的样式,包括文字处理类文档中的页眉页脚、演示文稿类文档中的母版设置;文档结构样式针对于文档结构层次设置的样式,包括文字处理类文档中的分节;文档内容样式针对于上文提到的文档具体内容设置的样式,包括表格样式、段落样式、编号样式、字体样式;文档内容样式索弓I分组地对文档内容样式进行编排,文档内容通过引用内容样式序号间接地与内容样式进行关联。
5.一种基于权利要求1至4之一所述的复杂文档分离组织方法的复杂文档自动生成方法,其特征在于包括: 首先,执行第一步骤以获取文档大纲模板描述; 随后,执行第二步骤以便对文档大纲模板进行解析;其中在第二步骤中,根据文档数据和文档样式模板定义信息控制进行第三步骤、第四步骤和第五步骤以完成文档相关数据和样式模板的获取; 随后,根据文档架构描述和关联索引信息控制第六步骤、第七步骤和第八步骤以完成文档数据获取及其格式的转换; 接着,根据文档内容与样式关联信息执行第九步骤和第十步骤以完成文档数据与样式的匹配及组装,最后根据文档的完成情况进入第十一步骤以完成最终文档的输出; 其中,第三步骤用于获取文档数据组模板,数据组模板描述了文档内容的组合和获取方法以及文档内容分组的样式索引;第四步骤用于获取文档样式组模板,文档样式组模板定义了文档内容样式索引,并且对文档内容样式的具体标识进行了编排;第五步骤用于获取文档的属性模板。
6.根据权利要求5所述的复杂文档自动生成方法,其特征在于,第六步骤用于根据文档大纲模板中文档架构描述和关联索引信息涉及的宏观的文档内容分组信息,从第三步骤获取到的文档数据组模板中提取相应的文档内容分组描述并进行解析,获取文档内容数据的模板信息。
7.根据权利要求5或6所述的复杂文档自动生成方法,其特征在于,第七步骤用于根据第六步骤获取到的文档内容数据的模板信息,获取文档数据模板。
8.根据权利要求5或6所述的复杂文档自动生成方法,其特征在于,第八步骤用于根据第七步骤获取到的文档数据模板,获取原始数据,并将原始数据进行格式转换。
9.根据权利要求5或6所述的复杂文档自动生成方法,其特征在于,第九步骤用于将第八步骤格式转换后的文档数据与第四步骤获取到文档内容样式索引进行关联分析,根据文档内容分组关联的文档内容样式索引,以及文档具体内容关联的文档内容样式索引序号,将格式转换后的文档数据中的文档具体内容与具体的文档内容样式标识进行匹配。
10.根据权利要求5或6所述的复杂文档自动生成方法,其特征在于,第十步骤用于将第九步骤样式匹配后的文档数据与第五步获取到的各类文档样式进行组装,第十一步骤用于根据文档格式需求,将组装好的带样式的文档数据进行格式化输出,形成最终文档。
【专利摘要】本发明提供了复杂文档分离组织方法以及复杂文档自动生成方法。该复杂文档分离组织方法包括:将复杂文档分解成文档大纲、文档数据和文档样式;其中将复杂文档的文档大纲定义为对文档结构的宏观描述,是按照文档内容对文档的层次化分解、定义和管理,是对文档数据和文档样式模板的统一组织;复杂文档的文档数据是对文档元数据的组织和描述;复杂文档的文档样式是对文档样式的组织和描述。
【IPC分类】G06F17-30, G06F17-21
【公开号】CN104598636
【申请号】CN201510064618
【发明人】董国良, 吴利, 董超群, 黄东海
【申请人】无锡江南计算技术研究所
【公开日】2015年5月6日
【申请日】2015年2月6日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1