文件识别方法、装置、服务器和计算机存储介质与流程

文档序号:12464633阅读:来源:国知局
技术总结
本发明公开了一种文件识别方法、装置、服务器和计算机存储介质。其中,方法包括:对文件进行初步识别,得到文件包含的文字和段落信息;针对每一个段落,对段落内文字进行解析,得到段落内文字的样式以及样式差异信息;根据段落内文字的样式差异信息,对段落内文字进行样式统一处理。利用本发明的方案,将段落内文字的样式统一处理成一种样式,解决了文件中文字样式繁多而造成的样式膨胀问题,而且还减少了样式信息的存储量,节省了存储空间,降低了资源占用率。

技术研发人员:胡元琪
受保护的技术使用者:掌阅科技股份有限公司
文档号码:201611113449
技术研发日:2016.12.06
技术公布日:2017.05.31

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1