本发明涉及表格识别,具体而言,涉及一种表格重构方法、装置、非易失性存储介质及电子设备。
背景技术:
1、表格数据在很多领域都提供了十分重要的信息,表格经常出现在文献或专利中,起到汇总分析的作用。为了获取表格内容相关技术中需要对表格进行解析,常常采用对表格线进行识别的方式,以边界线作为表格中每一个格子的分界,导致对于文献中常出现的半无线表格的识别能力不足。并且表格中还存在着合并格的情况,常常出现于表格的表头中,相关技术中对于一个格子跨行(跨列)的处理能力不足,容易导致重构出的表格错位,造成获取到的表格信息对应错误。
2、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本发明实施例提供了一种表格重构方法、装置、非易失性存储介质及电子设备,以至少解决相关技术中存在对表格识别率局限性高,导致重构表格的准确性不理想的技术问题。
2、根据本发明实施例的一个方面,提供了一种表格重构方法,包括:获取表格图像;对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。
3、根据本发明实施例的另一方面,提供了一种表格重构装置,包括:获取模块,用于获取表格图像;识别模块,用于对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;重构模块,用于基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。
4、根据本发明实施例的另一方面,提供了一种非易失性存储介质,所述非易失性存储介质存储有多条指令,所述指令适于由处理器加载并执行任意一项所述的表格重构方法。
5、根据本发明实施例的另一方面,提供了一种电子设备,包括:一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现任意一项所述的表格重构方法。
6、在本发明实施例中,通过获取表格图像;对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果;基于所述表格图像中的格对应的行范围识别结果、列范围识别结果,得到所述表格图像对应的重构表格。达到了提高对跨行跨列表格,以及无线表(或是半无线表)的识别能力和重构效果的目的,实现了提高表格重构准确性,减少表格识别局限性的技术效果,进而解决了相关技术中存在对表格识别率局限性高,导致重构表格的准确性不理想的技术问题。
1.一种表格重构方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述表格图像进行识别,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述表格图像进行识别,确定所述表格图像中的格识别结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述任意相邻两个表格内容之间的边距值,以及所述多个表格内容分别对应的字体信息,确定所述表格图像中的所述格识别结果,包括:
5.根据权利要求2所述的方法,其特征在于,所述根据所述格识别结果,得到所述表格图像中的格对应的行范围识别结果、列范围识别结果,包括:
6.根据权利要求5述的方法,其特征在于,所述根据所述格识别结果,确定所述表格图像中的格对应的起始行序号、终止行序号、起始列序号、终止列序号,包括:
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述获取表格图像,包括:
8.一种表格重构装置,其特征在于,包括:
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质存储有多条指令,所述指令适于由处理器加载并执行权利要求1至7中任意一项所述的表格重构方法。
10.一种电子设备,其特征在于,包括:一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的表格重构方法。