表格识别方法、装置、电子设备及存储介质与流程

文档序号:35194536发布日期:2023-08-21 13:03阅读:27来源:国知局
表格识别方法、装置、电子设备及存储介质与流程

本申请涉及图像处理领域,尤其涉及一种表格识别方法、装置、电子设备及存储介质。


背景技术:

1、在图像识别领域,可能会涉及到对图像中的文字、图形、表格等的识别。

2、相关技术中,在对表格进行识别时,通常会采用目标检测算法对图像中的表格进行定位,采用表格线识别算法,对定位得到的表格中的表格线进行识别,进一步根据识别得到的表格向对定位得到的表格进行结构分解,识别出表格中的单元格,并各单元格进行文字识别。

3、但采用该方式,所识别的各单元格的边缘线段可能会存在漏线、错线、重线等情况,导致最终对图像中的单元格识别不准确。


技术实现思路

1、本公开实施例提供了一种表格识别方法,以解决相关技术中,对图像中的单元格识别不准确的问题。

2、相应的,本公开实施例还提供了一种表格识别装置、一种电子设备以及一种存储介质,用以保证上述方法的实现及应用。

3、一方面,本公开实施例提供一种表格识别方法,该方法包括:

4、确定待处理图像中的原始单元格;

5、在待处理图像上,对原始单元格的边框线段进行延长操作,确定细分单元格;其中,细分单元格包括延长操作后的原始单元格在待处理图像上占据的单元格;

6、确定每个细分单元格与原始单元格的面积重叠参数;

7、根据面积重叠参数,对细分单元格进行合并操作,得到目标单元格;

8、对目标单元格进行文字识别操作。

9、另一方面,本公开实施例提供了一种表格识别装置,该装置包括:

10、原始单元格确定模块,用于确定待处理图像中的原始单元格;

11、延长操作处理模块,用于在待处理图像上,对原始单元格的边框线段进行延长操作,确定细分单元格;其中,细分单元格包括延长操作后的原始单元格在待处理图像上占据的单元格;

12、面积重叠参数确定模块,用于确定每个细分单元格与原始单元格的面积重叠参数;

13、单元格合并模块,用于根据所述面积重叠参数,对细分单元格进行合并操作,得到目标单元格;

14、文字识别模块,用于对目标单元格进行文字识别操作。

15、另一方面,本公开实施例提供了一种电子设备,包括处理器和存储器,该处理器和存储器相互连接;

16、上述存储器用于存储计算机程序;

17、上述处理器被配置用于在调用上述计算机程序时,执行本公开实施例提供的表格识别方法。

18、另一方面,本公开实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行以实现本公开实施例提供的表格识别方法。

19、在本公开实施例中,通过对原始单元格的边框线段进行延长操作,将延长操作后的原始单元格在待处理图像上占据的单元格确定为细分单元格,可以结合原始单元格中边框线段的多元性,对原始单元格进行更细粒度的划分,避免所识别的单元格存在漏线、错线、重线等情况;再确定并细分单元格和原始单元格的包含关系,对细分单元格进行合并,得到目标单元格,提高了对原始单元格的格式复原概率。并进一步将目标单元格进行文字识别操作,实现了对待处理图像中结构复杂的表格的识别准确性。



技术特征:

1.一种表格识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述面积重叠参数,对所述细分单元格进行合并操作,得到目标单元格,包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述原始单元格的边框线段进行延长操作,包括:

4.根据权利要求3所述的方法,其特征在于,所述采用单元格聚类算法,对所述原始单元格进行聚类,包括:

5.根据权利要求4所述的方法,其特征在于,所述确定任意两个所述原始单元格之间的间距,包括:

6.根据权利要求5所述的方法,其特征在于,所述确定所述原始单元格的边框线段在目标方向下的第一距离,包括:

7.根据权利要求5所述的方法,其特征在于,所述根据所述第一距离和所述第二距离,确定所述间距,包括:

8.一种表格识别装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括处理器和存储器,所述处理器和存储器相互连接;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。


技术总结
本公开实施例公开了一种表格识别方法、装置、电子设备及存储介质,涉及图像处理领域。该方法包括:确定待处理图像中的原始单元格;在待处理图像上,对原始单元格的边框线段进行延长操作,确定细分单元格;其中,细分单元格包括延长操作后的原始单元格在待处理图像上占据的单元格;确定每个细分单元格与原始单元格的面积重叠参数;根据面积重叠参数,对细分单元格进行合并操作,得到目标单元格;对目标单元格进行文字识别操作。采用本公开实施例,可以结合原始单元格中边框线段的多元性,对原始单元格进行更细粒度的划分,提高了对原始单元格的格式复原概率,实现了对待处理图像中结构复杂的表格的识别准确性。

技术研发人员:王怀照
受保护的技术使用者:亚信科技(南京)有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1