本公开涉及人工智能,具体为深度学习、图像处理、计算机视觉。具体涉及一种表格检测方法、装置、电子设备及存储介质。
背景技术:
1、随着人工智能(artificial intelligence,ai)的快速发展,人工智能已经广泛应用于计算机视觉技术、语音识别技术、自然语言处理技术、深度学习、大数据处理技术等领域。
2、基于人工智能的文字识别技术也已经广泛应用于不同场景。很多场景经常出现带有表格的文档,表格结构的数据组织方式具备较多丰富的结构化知识,准确提取和还原表格结构化信息,对业务应用能提供更为直接的决策信息。因此,如何提高表格检测性能十分重要。
技术实现思路
1、本公开提供了一种表格检测方法、装置、电子设备及存储介质。
2、根据本公开的一方面,提供了一种表格检测方法,包括:
3、对待检测的表格图像进行特征提取,得到表格特征信息;
4、根据所述表格特征信息分别对所述表格图像进行分割线预测和顶点预测,得到所述表格图像中的分割线和表格顶点;
5、根据所述表格图像中的分割线对表格图像中的表格顶点进行修正,得到修正后的表格顶点;
6、对修正后的表格顶点和所述分割线进行匹配,并根据匹配关系得到所述表格图像中的单元格信息。
7、根据本公开的又一方面,提供了一种表格检测装置,包括:
8、特征提取模块,用于对待检测的表格图像进行特征提取,得到表格特征信息;
9、表格预测模块,用于根据所述表格特征信息分别对所述表格图像进行分割线预测和顶点预测,得到所述表格图像中的分割线和表格顶点;
10、顶点修正模块,用于根据所述表格图像中的分割线对表格图像中的表格顶点进行修正,得到修正后的表格顶点;
11、顶点匹配模块,用于对修正后的表格顶点和所述分割线进行匹配,并根据匹配关系得到所述表格图像中的单元格信息。
12、根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
13、至少一个处理器;以及
14、与所述至少一个处理器通信连接的存储器;其中,
15、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任意实施例所提供的方法。
16、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任意实施例所提供的方法。
17、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种表格检测方法,包括:
2.根据权利要求1所述的方法,其中,所述根据所述表格图像中的分割线对表格图像中的表格顶点进行修正,得到修正后的表格顶点,包括:
3.根据权利要求2所述的方法,其中,所述根据所述分割线的特征信息对所述表格顶点的特征信息进行修正,得到修正后的表格顶点的特征信息,包括:
4.根据权利要求2所述的方法,所述得到修正后的表格顶点的特征信息之后,还包括:
5.根据权利要求1-4中任一项所述的方法,其中,所述对修正后的表格顶点和所述分割线进行匹配,并根据匹配关系得到所述表格图像中的单元格信息,包括:
6.根据权利要求5所述的方法,其中,所述根据修正后的表格顶点的特征信息和所述分割线的特征信息对修正后的表格顶点和分割线进行匹配,得到修正后的表格顶点的逻辑坐标,包括:
7.一种表格检测装置,包括:
8.根据权利要求7所述的装置,其中,所述顶点修正模块包括:
9.根据权利要求8所述的装置,其中,所述点特征修正单元包括:
10.根据权利要求8所述的装置,所述顶点修正模块还包括顶点过滤单元,所述顶点过滤单元包括:
11.根据权利要求7-10中任一项所述的装置,其中,所述顶点匹配模块包括:
12.根据权利要求11所述的装置,其中,所述表格匹配单元包括:
13.一种电子设备,包括:
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-6中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。