抽取电子表格文档中结构化信息的方法及装置与流程

文档序号:12063880阅读:来源:国知局
技术总结
本发明属于数据处理技术领域,具体涉及一种抽取电子表格文档中结构化信息的方法及装置。本发明提供的抽取电子表格文档中结构化信息的方法,包括:通过孤立表格识别算法获取电子表格文档中所有业务表格;对所述业务表格进行布局分析;根据布局分析结果从所述业务表格中抽取内容,并做对应的转换处理得到结构化信息。本发明提供的抽取电子表格文档中结构化信息的方法及装置,实现了自动批量获取电子表格文档中所有业务表格的功能,提高了大规模数据抽取的效率。

技术研发人员:张军;贾西贝
受保护的技术使用者:深圳市华傲数据技术有限公司
文档号码:201611245472
技术研发日:2016.12.29
技术公布日:2017.05.24

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1