基于文件表格的自动识别导入方法与流程

文档序号:37907594发布日期:2024-05-09 21:56阅读:来源:国知局

技术特征:

1.基于文件表格的自动识别导入方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于文件表格的自动识别导入方法,其特征在于,所述步骤s1中,确定最佳转换方式的子步骤包括:

3.根据权利要求2所述的基于文件表格的自动识别导入方法,其特征在于,所述步骤s14中,若不满足:(czk-zkmin)≥y1,则确定最小值以及次小值的对应下标k,锁定对应的两组相关格式a或b,并确定同时包含分别转换为a或b两组相关格式的文本内容,将此文本内容划分为两组待转内容,前一组待转内容向a格式进行转换,后一组待转内容向b格式进行转换,确定转换速率,锁定一组转换速率较大的转换过程,并确定对应格式并复原另一格式的转换过程,将其标定为待转格式,将本待识别文稿内部不属于本待转格式的内容均转换为待转格式的相关内容,得到格式统一的待识别文稿。

4.根据权利要求1所述的基于文件表格的自动识别导入方法,其特征在于,所述步骤s2中,确定初填补表格的子步骤包括:

5.根据权利要求4所述的基于文件表格的自动识别导入方法,其特征在于,所述步骤s23中,特征内容的确定方式为:

6.根据权利要求5所述的基于文件表格的自动识别导入方法,其特征在于,所述分隔符号包括:逗号、句号或其他相关断句符号。

7.根据权利要求1所述的基于文件表格的自动识别导入方法,其特征在于,所述步骤s3中,确定待填补项的特征序列包括:

8.根据权利要求1所述的基于文件表格的自动识别导入方法,其特征在于,所述步骤s4中,标定关联内容的子步骤包括:

9.根据权利要求8所述的基于文件表格的自动识别导入方法,其特征在于,所述步骤s42中,若对应特征序列内某特征值为0,则直接跳过对应特征值的筛选过程,直接执行后续的特征筛选。


技术总结
本发明公开了基于文件表格的自动识别导入方法,本发明涉及表格识别技术领域,解决了未识别对应账单内部的特征内容并录入至表格的问题,本发明通过优先对表格内相关的特征字符进行赋值,再分析文本内容,确定相关赋值,通过赋值匹配的方式,来确定相应的特征内容,并将所确定的特征内容进行提取,针对于未搜到赋值的情况,对待填补项的过往数据进行特征确认,锁定特征值,再进行文本搜索,确定相关特征值的相关内容,并进行提取,由操作人员进行选定,以此来完成对应文件表格的自动录入过程,降低操作人员的工作负担,锁定特征内容,进行自行填补。

技术研发人员:谷敏骏,吴庆东
受保护的技术使用者:南京安夏电子科技有限公司
技术研发日:
技术公布日:2024/5/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1