票据识别方法、系统、计算机设备与计算机可读存储介质与流程

文档序号:22934039发布日期:2020-11-13 18:16阅读:来源:国知局

技术特征:

1.一种票据识别方法,其特征在于,包括:

获取模板票据图片,所述模板票据图片包括框选的第一参考字段区域以及第二参考字段区域;

将所述模板票据图片输入至文字识别模型,以识别出所述第一参考字段区域中的文本,并通过检测模型输出所述第一参考字段区域的第一位置信息与所述第二参考字段区域的第二位置信息;

接收待处理票据图片,并将所述待处理票据图片输入至所述文字识别模型,识别出与所述文本匹配的目标文本,并通过所述检测模型框选标记所述目标文本的第一识别区域与第一目标位置信息;

根据所述第一位置信息与所述第一目标位置信息建立变换矩阵;

通过所述变换矩阵计算所述第二位置信息,得到所述待处理票据图片中第二识别区域的第二目标位置信息;

根据所述第一位置信息与所述第二位置信息的重叠度值,调整所述第二目标位置信息,得到待识别区域,并通过所述文字识别模型识别所述待识别区域中的文本,得到识别结果。

2.根据权利要求1所述的票据识别方法,其特征在于,所述获取模板票据图片,所述模板票据图片包括框选的第一参考字段区域以及第二参考字段区域包括:

选取标准图片格式的票据图片作为模板票据图片;

框选出文字条的字段内容作为第一参考字段区域以及所述文字条对应的数据内容作为第二参考字段区域。

3.根据权利要求1所述的票据识别方法,其特征在于,所述通过检测模型输出所述第一参考字段区域的第一位置信息与所述第二参考字段区域的第二位置信息包括:

通过所述检测模型对所述第一参考字段区域与所述第二参考字段区域进行边框识别,得到第一参考字段区域的第一边框顶点与所述第二参考字段区域对应的第二边框顶点;

将所述模板票据图片的任意顶点作为坐标原点建立坐标系,得到所述第一边框顶点的第一边框坐标与所述第二边框顶点的第二边框坐标,其中,所述第一位置信息包括多个第一边框坐标,所述第二位置信息包括多个第二边框坐标。

4.根据权利要求1所述的票据识别方法,其特征在于,所述通过所述检测模型框选标记所述目标文本的第一识别区域与第一目标位置信息包括:

通过所述检测模型对所述第一识别区域进行框选,得到多个第三边框顶点;

以所述待处理票据图片的任意顶点作为坐标原点建立坐标系,得到所述第三边框顶点的第三边框坐标,其中,所述第一目标位置信息包括多个第三边框坐标。

5.根据权利要求4所述的票据识别方法,其特征在于,所述根据所述第一位置信息与所述第一目标位置信息建立变换矩阵包括:

获取所述第一位置信息的第一边框坐标与所述第一目标位置信息的第三边框坐标;

将所述第一边框坐标进行变换得到所述第三边框坐标;

根据所述第一边框坐标与所述第三边框坐标之间的变换关系建立所述变换矩阵。

6.根据权利要求1所述的票据识别方法,其特征在于,所述根据所述第一位置信息与所述第二位置信息的重叠度值,调整所述第二目标位置信息,得到待识别区域包括:

获取所述第一位置信息与所述第二位置信息的重叠度值;

计算所述第一目标位置信息与所述第二目标位置信息的目标重叠度值;

调整所述第二目标位置信息,以使所述目标重叠度值等于所述重叠度值,得到待识别区域。

7.根据权利要求1所述的票据识别方法,其特征在于,所述方法还包括:

将所述识别结果上传至区块链进行存储。

8.一种票据识别系统,其特征在于,包括:

获取模块,用于获取模板票据图片,所述模板票据图片包括框选的第一参考字段区域以及第二参考字段区域;

识别模块,用于将所述模板票据图片输入至文字识别模型,以识别出所述第一参考字段区域中的文本,并通过检测模型输出所述第一参考字段区域的第一位置信息与所述第二参考字段区域的第二位置信息;

检测模块,用于接收待处理票据图片,并将所述待处理票据图片输入至所述文字识别模型,识别出与所述文本匹配的目标文本,并通过所述检测模型框选标记所述目标文本的第一识别区域与第一目标位置信息;

构建模块,用于根据所述第一位置信息与所述第一目标位置信息建立变换矩阵;

计算模块,用于通过所述变换矩阵计算所述第二位置信息,得到所述待处理票据图片中第二识别区域的第二目标位置信息;

调整识别模块,用于根据所述第一位置信息与所述第二位置信息的重叠度值,调整所述第二目标位置信息,得到待识别区域,并通过所述文字识别模型识别所述待识别区域中的文本,得到识别结果。

9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的票据识别方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1-7中任一项所述的票据识别方法的步骤。


技术总结
本发明实施例公开了一种票据识别方法、系统、计算机设备与计算机可读存储介质,方法包括:通过模板票据图片的第一参考字段区域中的文本对待处理票据图片中文本的进行匹配,得到目标文本,并通过识别模型将目标文本对应的第一目标位置区域进行框选,再建立第一参考字段区域对应的第一位置信息与目标文本的第一目标位置信息之间的变换矩阵,最后通过变换矩阵获取第二目标位置信息;且对待处理票据的第二目标位置信息通过第一位置信息与第二位置信息的重叠度值进行调整。本发明实施例还可以应用于数字医疗中的电子处方签中,其有益效果在于:提高了多行识别的精确度。

技术研发人员:王文浩;徐国强
受保护的技术使用者:深圳壹账通智能科技有限公司
技术研发日:2020.09.17
技术公布日:2020.11.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1