一种科技期刊论文word文档的结构化处理方法及装置与流程

文档序号:14685518发布日期:2018-06-13 00:09阅读:来源:国知局
技术总结
本申请文档处理技术领域,尤其涉及一种科技期刊论文word文档的结构化处理方法及装置,包括:根据待处理的科技期刊论文word文档的文档格式,提取word文档中文档元素;不同文档元素的元素属性不同;根据提取的文档元素的元素属性,将word文档划分为至少一个级别的数据块;其中,每一个级别对应至少一个数据块,且同一级别的数据块之间的元素属性不同;根据每一个数据块的内容信息以及预设的元素属性规则,将划分的至少一个级别的数据块转化为可扩展标记语言XML数据。本申请实现了word文档的结构化处理,减少了用户在使用过程中的工作量,提高了查找效率,便于读者基于结构化的数据与作者进行在线交互。

技术研发人员:王盛华;周祖胜;尹真
受保护的技术使用者:北京仁和汇智信息技术有限公司
技术研发日:2017.12.29
技术公布日:2018.06.12

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1