一种基于模板的内容动态重组方法与流程

文档序号:19156086发布日期:2019-11-16 00:47阅读:418来源:国知局
一种基于模板的内容动态重组方法与流程

本发明涉及数字出版技术领域,尤其涉及一种基于模板的内容动态重组方法。



背景技术:

传统出版是通过传统印刷技术的纸质出版,其物质媒介是纸张。传统出版必须将内容物化在物质媒介上,其产品具有明确的物质形态以及实物可保存性。数字出版是利用信息技术将出版物以网络、光盘等形式投放市场的出版方式。

随着社会的进步,读者对知识获取的需求也在不断提高,尤其是在专业出版领域,读者的需求逐步在向个性化发展。新闻出版单位作为内容的提供者,也需要能够提供个性化产品。但是,由于传统出版的周期比较长,很难满足各类读者的需求。

内容动态重组基于碎片化加工的素材资源,根据各种媒体资源及内容单元之间关联性,以及不同专业领域的特点,快速完成个性化产品内容的生成,从而缩短出版周期,为读者提供个性化服务。

docbook提供了整个书写结构化文档的体系,它使用sgml/xml定义了一系列文档元素,并可以利用工具把原始的文档源文件转换成各种文档格式。简单说,docbook就是一组对于xml文档进行解析的规范。对于一个按照docbook格式写好的xml文件,使用docbook的一些相关工具,就可以按照用户的要求生成各种各样的输出。顾名思义,docbook是专门为写书籍或者类似书籍的文档所设计的。目前,国内出版社普遍采用基于docbook的标准对出版物资源进行碎片化加工。

面向出版领域的内容重组技术,国内外直接相关的技术标准还不存在,技术的发展还处于萌芽阶段。国际上由oasis(theorganizationfortheadvancementofstructuredinformationstandards)组织维护的开放性标准--dita(darwininformationtypingarchitecture),存在相关技术的理念。dita是一套基于xml的面向主题的数字内容结构化写作与发布方案。

国内外也存在个别对于碎片化加工的内容,按用户需要进行动态重组的业务模式,例如培生在其网站上允许用户选购碎片化的章节内容,自行按照需要打包付费购买。但是相关的技术和应用还存在许多问题,例如业务模式应用面窄,重组产品构建为用户手动操作,自动化水平低。



技术实现要素:

为解决上述技术问题,本发明的目的是提供一种基于模板的内容动态重组方法,该方法将经过碎片化加工处理后的素材进行重新组装,生成新的数字内容产品。

本发明的目的通过以下的技术方案来实现:

一种基于模板的内容动态重组方法,包括:

a根据出版物类型创建产品模板;

b在产品模板的章节中指定相应内容的描述;

c根据产品模板生成重组计划;

d基于全文检索执行重组计划,将检索的内容按照相关度自动填充到章节中;

e根据实际需要在推荐的素材列表中选择符合需求的素材,并可对素材内容进行编辑;

f按照产品模板的组织方式生成最终产品。

与现有技术相比,本发明的一个或多个实施例可以具有如下优点:

该内容动态重组方法增加了重组适用的范围,用户可以根据需要的出版物类别进行产品模板的创作,例如用户可以创建辞典模板,其内容由将有词条填充,用户还可以创建期刊文集,其内容将由符合要求的文章填充。

该内容动态重组方法实现了自动化的重组,基于产品模板确定的内容组织结构自动化地执行重组计划,其内容由全文检索方法从素材库中提取,按照相关度将最相关的内容填充到产品模板对应的章节(或者条目)中。

该内容动态重组方法引入了内容矫正的机制,自动化的重组结果难免有不符合用户要求的内容,用户可以用全文检索按照相关性排序推荐的其他素材替换自动执行填充的素材。

附图说明

图1是基于模板的内容动态重组方法流程图;

图2是产品模板的类型选择结构示意图;

图3是产品模板的内容描述结构示意图;

图4是生成的重组计划示例示意图;

图5是重组计划执行的效果示例示意图;

图6是输出产品的pdf示例示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明实施方式作进一步详细的描述。

如图1所示,为基于模板的内容动态重组方法流程,包括以下步骤:

步骤10根据出版物类型创建产品模板;

步骤20在产品模板的章节中指定相应内容的描述;

步骤30根据产品模板生成重组计划;

步骤40基于全文检索执行重组计划,将检索的内容按照相关度自动填充到章节中;

步骤50根据实际需要在推荐的素材列表中选择符合需求的素材,并可对素材内容进行编辑;

步骤60按照产品模板的组织方式生成最终产品。

上述步骤10对于出版物,产品模板可以认为是出版物的大纲,用以描述出版物的内容组织。不同出版物具有不同的内容组织方式,例如辞典,通常有词条素材构成,以字典序排序组织,而领域专著通常按照章节组织,对应于不同的领域主题,如图2所示为产品模板的类型选择。

上述步骤20在出版物模板中的章节(条目)中添加描述信息,该描述信息用以刻画用户期望的素材内容,作为启发信息指导后续步骤的内容提取。内容以自然语言描述即可,具体形式是以约定的分隔符分隔的关键词或者描述语句,如图3所示是产品模板的内容描述。

上述步骤30重组计划是用来描述如何自动化执行内容重组的数据结构,类似于数据库领域中的查询计划。重组计划一般以一种树形数据结构表示,对应于出版物的内容组织方式。重组计划中的节点对应于产品模板中的章节(条目),节点中标注的内容是检索条件,用以指导内容提取。生成重组计划典型地利用编译中的程序变换技术,如图4所示是生成的重组计划示例。

上述步骤40重组计划中的检索条件基于全文检索,通常全文检索的结果是按相关度排序的素材列表,执行重组计划时,将素材列表中相关度最高的素材填充在对应的章节(条目)中,再将其他素材作为推荐素材关联到相应章节(条目)。填充了内容的章节(条目)按产品模板的确定的结构进行组织。由于各个章节(条目)的相对独立性,可以利用并行计算的计算方法提升性能,例如map-reduce编程模型,如图5所示是重组计划执行的效果示例。

上述步骤50调整重组产品内容,基于产品模板和全文检索的自动化重组所得的结果很难做到完全符合用户的需求,因此引入调整重组产品内容的步骤。用户可以调整所用素材,即通过全文检索推荐的素材替换当前选取的素材,或者同时选用;用户还可以根据权限设定(通常受版权、政策等非技术因素影响),决定是否允许用户对内容进行编辑,例如删除部分文字。

上述步骤60基于上述步骤构建的重组产品还是一种中间产品的状态,通常的数字出版物的载体文件格式是pdf或者epub。基于上述数据,即可遍历各章节(条目),按照产品模板的组织方式生成最终产品,如图6所示,是输出产品的pdf示例图。

虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1