一种基于特定业务特征对表格图片结构化的方法和系统与流程

文档序号:34168117发布日期:2023-05-15 01:50阅读:来源:国知局

技术特征:

1.一种基于特定业务特征对表格图片结构化的方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述将待解析表格图片输入至预设的表格特征自学习方法中,得到所述待解析表格图片对应的表格特征,包括:

3.如权利要求2所述的方法,其特征在于,所述表格分类处理包括:

4.如权利要求1所述的方法,其特征在于,所述基于所述表格特征与所述待解析表格图片对应的表格交点值绘制表格线,得到新的横纵线,并基于所述横纵线,对所述待解析表格图片重新解析,得到结构化表格,包括:

5.如权利要求4所述的方法,其特征在于,所述根据所述待解析的表格图片中表格交点的位置顺序对所述列表中的表格交点值进行排序,得到排序后的交点矩阵,包括:

6.如权利要求5所述的方法,其特征在于,所述将遍历的表格交点值依次填入所述初始矩阵,得到排序后的交点矩阵,包括以下步骤:

7.如权利要求4所述的方法,其特征在于,所述根据所述交点矩阵中与所述表纵线数相等的一行表格交点值,确定横向交点,根据所述交点矩阵中的纵向交点数对所有列进行分组,确定列数最多组的列交点值和对应的纵向交点,包括:

8.如权利要求4所述的系统,其特征在于,所述基于所述新表格和新表格单元格的交点值,截取并识别所述待解析的表格图片中的表格内容,根据所述表格内容、表头行数和新表格,生成结构化表格,包括:

9.一种基于特定业务特征对表格图片结构化的系统,其特征在于,包括:

10.如权利要求9所述的系统,其特征在于,所述结构化模块,包括:


技术总结
本发明提供了一种基于特定业务特征对表格图片结构化的方法和系统,包括:将待解析表格图片输入至预设的表格特征自学习方法中,得到所述待解析表格图片对应的表格特征;基于所述表格特征与所述待解析表格图片对应的表格交点值绘制表格线,得到新的横纵线,并基于所述横纵线,对所述待解析表格图片重新解析,得到结构化表格。本发明通过业务特征自学习的方法与基于业务特征对表格图片横纵线重画的方式,提升表格图片解析结构化的效率和准确率。

技术研发人员:姬永杰,陈思瑾,胡杞燚
受保护的技术使用者:北京大数元科技发展有限公司
技术研发日:
技术公布日:2024/1/12
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1