一种快速排版系统及方法

文档序号:6376876阅读:379来源:国知局
专利名称:一种快速排版系统及方法
技术领域
本发明涉及电子稿件规范化排版过程,尤其涉及一种快速排版系统及方法。
背景技术
方正书版是一种专业化的排版软件。最大特点是可以制作出长篇幅、符合专业出版要求的高质量印刷排版物。它功能强,覆盖面宽,广泛应用在出版社、印刷厂,用来制作图书期刊等正规出版物,并应用在政府机关、事业单位制作较高质量的正规公文、信函等。方正中排版是一件非常繁重、非常细致的工作。以期刊为例,每种刊的版式要求至少都在6页以上,从书眉、栏目、标题、作者、单位、摘要、关键词等内容,到正文中的多级标题、图、表、公式、参考文献,都有详细的要求。这些要求,体现在方正书版中,就是一个个方正命令。想要排好一本刊,排版人员首先要熟练掌握这些命令,而后细致的把这些命令应用在排版文件的合适位置。这样不光对排版人员的技术水平有很高的要求,同时排版质量取决于排版员的耐心和责任心,致使排版成本高,质量不可控。

发明内容
为解决上述中存在的问题与缺陷,本发明提供了一种提高排版效率、质量可控的快速排版系统及方法。所述技术方案如下一种快速排版系统,包括自动排版模块、检查模块及排版校错与管理模块,所述自动排版模块,对预处理完的文件标引,将标引文件通过基于知识的自动标引算法,得到标引结果,并对标引结果规律化内容处理;检查模块;用于对标引结果进行检查,并改正错误的标引项;排版校错与管理模块;根据所述标引结果进行排版,并对错误排版进行校正。一种快速排版方法,包括对预处理完的文件标引,将标引文件通过基于知识的自动标引算法,得到标引结果,并对标引结果规律化内容处理;对标引结果进行检查,并改正错误的标引项;根据所述标引结果进行排版,并对错误排版进行校正。本发明提供的技术方案的有益效果是排版速度高、质量好,标引正确率高,主要标引项正确率达到95%以上,次要标引项正确率超过90%,基于自动标引算法的自动排版系统整体降低排版成本的30%。


图I是快速排版系统结构图;图2是快速排版方法流程图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述参见图1,为快速排版系统结构,包括自动排版模块、检查模块及排版校错与管理模块,所述自动排版模块,对预处理完的文件标引,将标引文件通过基于知识的自动标引算法,得到标引结果,并对标引结果规律化内容处理;检查模块;用于对标引结果进行检查,并改正错误的标引项;排版校错与管理模块;根据所述标引结果进行排版,并对错误排版进行校正。上述自动排版模块包括自动标引单元、自动排版单元和智能监控单元;所述检查模块包括标引单元;所述排版校错与管理模块包括排版单元、校错单元及管理和监控单元。
参见图2,为快速排版方法流程,包括如下步骤对预处理完的文件标引,将标引文件通过基于知识的自动标引算法,得到标引结果,并对标引结果规律化内容处理;对标引结果进行检查,并改正错误的标引项;根据所述标引结果进行排版,并对错误排版进行校正。上述方法的具体过程包括文档预处理为了提高标引正确率,通过研究大量文档,总结出很多会对标引结果产生不好影响的情况,比如统一换行符和换段符,固定表格高宽等等,在此一一处理。而后扫描整个文档,获取正文字体字号等通用性信息,以备后用。基于知识的自动标弓丨过程在预处理完的文档中,以段落为单位,顺序分析各个段落属性。先根据段落位置,上下文,确定多个该段落可能的属性,再通过字体字号、书写格式、关键字等信息对多个属性打分,取分数最高者为该段落属性,最后再根据本段属性调整上下文段落的属性,并将标引属性显著标记在文档中。属性打分过程引入基于知识的项目校验新思想。利用作者库、机构库等知识积累库大大提高作者姓名和作者单位等项目标引正确率,依据上下文关系使标题摘要等项,标引正确率也大大提高。从而使得整体标引正确率大大提高。上述算法实现如下(I)首先根据段落位置,上下文,确定多个段落可能的属性,如IF (nCurPage = IMnCurLine = I) then ProArray. Add 标题IF (sPrePro =单位 &&nCurPage = IMnLineCount > 3) then ProArry. Add 摘要IF (nCurPage = l&&CurView =尾注)then ProArray. Add 作者简介...(2)而后对各个可能属性进行打分。设ProArray数据元素个数为mFORi = ITO mbegin IF Pro Array, i =作者 begin
IF Alignment =居中 then nScore +=10IF FontSize < FtxtFontSize then nScore +=10在此引入知识积累库IF Author in 作者库 then nScore += 50
ScoreArray. i = nScore end
End为提高效率,如果根据各种条件,已经可以确认该段属性,将不再继续循环排查剩余的可能属性。直接将确认属性设为本段属性。(3)如果本段有确认属性,则取确认属性为本段属性,否则取分值最高者,为本段
落属性。(4)根据本段落属性,调整上文属性。
标引结果检查提供界面对自动标弓I结果进行检查,纠正自动标弓I的错误结果。使用模板文件,为每个标引项定义合适快捷键,人工发现标引错误,即可快速纠正。如果需要,人工可以调整文档结构,重新进行自动标引,以达到最正确的标引结果。标引结果移入模板对于每种期刊,都有各自的排版规范,这些规范非常详尽,至少都在6页以上。首先为每种期刊制作一个模板文件,里面详细规定各个元数据项位置,字体字号等各种规范。
直接以方正命令的方式体现在模板文件之中。而后程序将标引结果,根据标引项,--移入
模板的指定位置。这个过程完成后,即产生一个基本可用的排版结果。传统排版模式中,需要大量手动实现的规范,已经自动处理完毕。移入模板的过程中,程序要保证移入信息的完整性,内容信息不能少,不能重复。否则将会增加后续人工排版过程工作量,甚至产生错误的排版文件。规范化内容自动排版为进一步减少人工工作量,在初步排好的文件中,程序将一些有规律的东西自动处理。比如参考文献的序号中加入CM命令,公式后的序号前加入JY命令,超宽图片在分栏文章中改为通栏图,等等。并将一些可以简单替换的内容(如句号需要替换成全角句号)总结到配置文件里,可以对每种刊做出不同的配置。这样处理之后,将再次减少人工工作。一些简单文章,甚至不需要人工再做处理。
排版在自动排版之后,再转入人工排版过程。正文制图,正文统排,一校,二校,核红,最终形成规范的出版物。管理与监控包括工资结算、任务统计分析、任务优先级调整、暂停加工、恢复加工等功能。实施效果基于知识的自动标引算法,标引正确率较传统算法提高,主要标引项正确率达到95 %以上,次要标弓I项正确率超过90 %。基于此自动标弓I算法的自动排版系统整体降低排版成本30%。 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种快速排版系统,其特征在于,所述系统包括自动排版模块、检查模块及排版校错与管理模块,所述 自动排版模块,对预处理完的文件标引,将标引文件通过基于知识的自动标引算法,得到标引结果,并对标引结果规律化内容处理; 检查模块;用于对标引结果进行检查,并改正错误的标引项; 排版校错与管理模块;根据所述标引结果进行排版,并对错误排版进行校正。
2.根据权利要求I所述的快速排版系统,其特征在于,所述自动排版模块包括自动标引单元、自动排版单元和智能监控单元;所述检查模块包括标引单元;所述排版校错与管理模块包括排版单元、校错单元及管理和监控单元。
3.根据权利要求I所述的快速排版系统,其特征在于,所述基于知识的自动标引算法包括根据段落位置、上下文、确定多个该段落可能的属性,并通过字体字号、书写格式、关键字信息对多个属性打分,取分数最高者为该段落属性,根据该段落属性调整上下文段落属性,并将标引属性标记在文档中。
4.根据权利要求I所述的快速排版系统,其特征在于,所述标引结果规律化内容处理是根据标弓I项将标弓I结果引入模板。
5.一种快速排版的方法,其特征在于,所述方法包括 对预处理完的文件标引,将标引文件通过基于知识的自动标引算法,得到标引结果,并对标引结果规律化内容处理; 对标引结果进行检查,并改正错误的标引项; 根据所述标弓I结果进行排版,并对错误排版进行校正。
6.根据权利要求5所述的快速排版的方法,其特征在于,所述基于知识的自动标引算法包括根据段落位置、上下文、确定多个该段落可能的属性,并通过字体字号、书写格式、关键字信息对多个属性打分,取分数最高者为该段落属性,根据该段落属性调整上下文段落属性,并将标引属性标记在文档中。
7.根据权利要求5所述的快速排版的方法,其特征在于,所述标引结果规律化内容处理是根据标弓I项将标弓I结果引入模板。
全文摘要
本发明公开了一种快速排版系统及方法,所述系统包括自动排版模块、检查模块及排版校错与管理模块,所述自动排版模块,对预处理完的文件标引,将标引文件通过基于知识的自动标引算法,得到标引结果,并对标引结果规律化内容处理;检查模块;用于对标引结果进行检查,并改正错误的标引项;排版校错与管理模块;根据所述标引结果进行排版,并对错误排版进行校正。本发明排版速度高、质量好,标引正确率高,主要标引项正确率达到95%以上,次要标引项正确率超过90%,基于自动标引算法的自动排版系统整体降低排版成本的30%。
文档编号G06F17/25GK102841888SQ20121033873
公开日2012年12月26日 申请日期2012年9月14日 优先权日2012年9月14日
发明者徐乾, 于大洲, 梁洵, 袁仁慧 申请人:《中国学术期刊(光盘版)》电子杂志社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1