一种表格信息处理方法、装置、处理设备及可读存储介质与流程

文档序号:35800265发布日期:2023-10-22 00:26阅读:35来源:国知局
一种表格信息处理方法、装置、处理设备及可读存储介质与流程

本发明涉及人工智能,特别是指一种表格信息处理方法、装置、处理设备及可读存储介质。


背景技术:

1、表格是较为常见的数据展示形式,其结构清晰、时效性强,通常可作为搜索引擎和智能对话系统的重要答案来源。

2、在具体应用中,为了智能化理解表格信息,可以通过抽取表格要素信息,来提取表格的单元格表头和数据属性,以及判断表头之间的层级关系。

3、然而,现有的表格信息处理方法难以对表格中丰富的结构关系进行处理,导致抽取得到的表格要素信息的准确率较低。


技术实现思路

1、本发明的目的是提供一种表格信息处理方法、装置、处理设备及可读存储介质,解决了现有方法难以准确抽取表格要素信息的问题。

2、为达到上述目的,本发明的实施例提供一种表格信息处理方法,包括:

3、获取目标表格中至少一个单元格的起止行列信息,所述起止行列信息包括以下至少一项:起始行信息、终止行信息、起始列信息和终止列信息;

4、基于所述起止行列信息,对每一所述单元格进行特征提取,获得每一所述单元格对应的第一特征信息,所述第一特征信息用于对所述单元格进行分类。

5、为达到上述目的,本发明的实施例提供一种表格信息处理装置,包括:

6、第一获取模块,用于获取目标表格中至少一个单元格的起止行列信息,所述起止行列信息包括以下至少一项:起始行信息、终止行信息、起始列信息和终止列信息;

7、第一提取模块,用于基于所述起止行列信息,对每一所述单元格进行特征提取,获得每一所述单元格对应的第一特征信息,所述第一特征信息用于对所述单元格进行分类。

8、为达到上述目的,本发明的实施例提供一种处理设备,包括处理器和收发机,其中,所述处理器用于:

9、获取目标表格中至少一个单元格的起止行列信息,所述起止行列信息包括以下至少一项:起始行信息、终止行信息、起始列信息和终止列信息;

10、基于所述起止行列信息,对每一所述单元格进行特征提取,获得每一所述单元格对应的第一特征信息,所述第一特征信息用于对所述单元格进行分类。

11、为达到上述目的,本发明的实施例提供一种处理设备,包括收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行程序或指令时实现如上所述的表格信息处理方法。

12、为达到上述目的,本发明的实施例提供一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现如上所述的表格信息处理方法中的步骤。

13、本发明的上述技术方案的有益效果如下:

14、本发明实施例的方法,起止行列信息包括以下至少一项:起始行信息、终止行信息、起始列信息和终止列信息,通过获取目标表格中至少一个单元格的起止行列信息,可以明确表格中单元格之间丰富的结构关系,进一步的,可以基于起止行列信息,对每一单元格进行特征提取,从而获得每一单元格对应的第一特征信息,如此,能够有效地利用表格结构关系,从而更为准确地抽取表格要素信息。



技术特征:

1.一种表格信息处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述起止行列信息,对每一所述单元格进行特征提取,获得每一所述单元格对应的第一特征信息,包括:

3.根据权利要求1所述的方法,其特征在于,在所述获得每一所述单元格对应的第一特征信息之后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述总行数、所述总列数和所述起止行列信息,生成所述目标表格对应的文档结构信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述总行数、总列数和所述起止行列信息,确定第一单元格和第二单元格之间的d个位置相关维度信息,包括以下至少一项:

6.根据权利要求4所述的方法,其特征在于,所述根据所述文档结构信息,对所述第一特征信息进行特征增强处理,获得第二特征信息,包括:

7.一种表格信息处理装置,其特征在于,包括:

8.一种处理设备,其特征在于,包括:收发机和处理器;所述处理器用于:

9.一种处理设备,包括:收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;其特征在于,所述处理器执行所述程序或指令时实现如权利要求1-6任一项所述的表格信息处理方法。

10.一种可读存储介质,其上存储有程序或指令,其特征在于,所述程序或指令被处理器执行时实现如权利要求1-6任一项所述的表格信息处理方法中的步骤。


技术总结
本发明提供一种表格信息处理方法、装置、处理设备及可读存储介质,涉及人工智能技术领域。该方法包括:获取目标表格中至少一个单元格的起止行列信息,所述起止行列信息包括以下至少一项:起始行信息、终止行信息、起始列信息和终止列信息;基于所述起止行列信息,对每一所述单元格进行特征提取,获得每一所述单元格对应的第一特征信息,所述第一特征信息用于对所述单元格进行分类。本发明的方案,解决了现有方法难以准确抽取表格要素信息的问题。

技术研发人员:吴秦龙
受保护的技术使用者:中移(苏州)软件技术有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1