一种PDF文档中文字的分段方法、装置及电子设备与流程

文档序号:20205401发布日期:2020-03-31 10:03阅读:来源:国知局
技术总结
本发明实施例提供了一种PDF文档中文字的分段方法、装置及电子设备,方案如下:可以将待分段PDF文档中待分段的连续的三行文字,确定该三行文字中每行文字的位置信息,作为行位置信息,基于三行文字的行位置信息,确定该三行文字中每相邻两行文字之间的位置间隔,作为行间距,当三行文字中每相邻两行文字之间的行间距相等时,将三行文字划分在同一个段落中。通过本发明实施例提供的方案,可以针对整个PDF文档,以该PDF文档每一行为单位,按照每相邻两行文字之间的行间距对PDF文档进行分段处理,得到分段后的段落,提高了PDF文档分段的准确性。

技术研发人员:邓斌
受保护的技术使用者:广州金山移动科技有限公司;珠海金山办公软件有限公司;北京金山办公软件股份有限公司
技术研发日:2018.09.21
技术公布日:2020.03.31

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1