一种银行电子回单的识别方法和装置与流程

文档序号：33739134发布日期：2023-04-06 09:13阅读：93来源：国知局

本发明涉及数据处理的，尤其是涉及一种银行电子回单的识别方法和装置。

背景技术：

1、为了获取电子银行回单对应的结构化数据，一般采用ocr识别方式，对电子银行回单进行文字识别。目前市面上的ocr技术，一般是获取海量的电子银行回单文件，然后组成数据集，然后使用数据集使用人工智能算法训练出一个通用的电子银行回单识别模型出来，进行电子银行回单识别。

2、由于银行种类繁多，银行回单文件样式多变，增加了ocr识别率提升的难度，通用识别模型识别率的提升会因种类太多受到阻碍，而且新增一个银行，旧有的模型难以匹配，额外训练需要考虑新银行类型和旧有数据的兼容性。

3、针对上述问题，还未提出有效的解决方案。

技术实现思路

1、有鉴于此，本发明的目的在于提供一种银行电子回单的识别方法和装置，以缓解了现有的银行电子回单的识别方法的识别准确率较低的技术问题。

2、第一方面，本发明实施例提供了一种银行电子回单的识别方法，包括：获取样本电子回单，对所述样本电子回单进行预处理，得到目标样本电子回单；基于所述目标样本电子回单对应的银行，对所述样本电子回单进行分类，得到多个电子回单集；利用多个电子回单集对多个初始识别模型进行训练，得到多个目标识别模型，其中，一个初始识别模型对应一个电子回单集，所述初始识别模型用于识别电子回单中的文字；在获取到待识别电子回单之后，利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果，并将所述识别结果发送给用户。

3、进一步地，对所述样本电子回单进行预处理，得到目标样本电子回单，包括：确定出所述样本电子回单中的第一电子回单，其中，所述第一电子回单为格式不是图像格式的电子回单；将所述第一电子回单转换为图像格式，得到第二电子回单；将所述第二电子回单和所述样本电子回单中出所述第一电子回单以外的电子回单转化为尺寸统一的第三电子回单；对所述第三电子回单中文字所处区域和所述文字所处区域中的文字进行标注，得到所述目标电子回单。

4、进一步地，所述初始识别模型包括：基于yolo-v4算法构建的图像抓取模块和基于ocr文字识别算法构建的文字识别模块；

5、利用多个电子回单集对多个初始识别模型进行训练，得到多个目标识别模型，包括：利用所述多个电子回单集，对多个初始识别模型的图像抓取模块进行训练，得到多个目标识别模型的图像抓取模块；利用所述多个电子回单集，对多个初始识别模型的文字识别模块进行训练，得到多个目标识别模型的文字识别模块。

6、进一步地，利用所述多个电子回单集，对多个初始识别模型的图像抓取模块进行训练，得到多个目标识别模型的图像抓取模块，包括：

7、第一输入步骤，将电子回单集中的第一目标电子回单输入所述初始识别模型的图像抓取模块，得到所述第一目标回单中的文字区域的初始坐标信息，其中，所述第一目标电子回单为所述电子回单集中的任意一个电子回单；第一优化步骤，利用所述初始坐标信息和所述第一目标回单中的文字区域的标注，对所述初始识别模型的图像抓取模块进行优化，得到优化后的图像抓取模块；将第二目标电子回单确定为所述第一目标电子回单，将所述优化后的图像抓取模块确定为所述初始识别模型的图像抓取模块，重复执行所述第一输入步骤和所述第一优化步骤，直至所述初始坐标信息与所述第一目标回单中的文字区域的标注之间的误差小于第一预设阈值，并将误差小于第一预设阈值对应的优化后的图像抓取模块确定为目标识别模型的图像抓取模块。

8、进一步地，利用所述多个电子回单集，对多个初始识别模型的文字识别模块进行训练，得到多个目标识别模型的文字识别模块，包括：分割步骤，对电子回单集中的第三目标电子回单中文字所处区域进行分割，得到多个图像块，其中，一个图像块中包含一个文字；第二输入步骤，将所述多个图像块输入所述初始识别模型的文字识别模块，得到所述第三目标回单的文字识别结果，其中，所述第三目标电子回单为所述电子回单集中的任意一个电子回单；第二优化步骤，利用所述第三目标回单的文字识别结果和所述第三目标回单中的文字区域中文字的标注，对所述初始识别模型的文字识别模块进行优化，得到优化后的文字识别模块；将第四目标电子回单确定为所述第三目标电子回单，将所述优化后的文字识别模块确定为所述初始识别模型的文字识别模块，重复执行所述分割步骤、所述第二输入步骤和所述第二优化步骤，直至所述第三目标回单的文字识别结果与所述第三目标回单中的文字区域种文字的标注之间的错误率小于第二预设阈值，并将错误略小于第二预设阈值对应的优化后的文字模块确定为目标识别模型的文字识别模块。

9、第二方面，本发明实施例还提供了一种银行电子回单的识别装置，包括：获取单元，用于获取样本电子回单，对所述样本电子回单进行预处理，得到目标样本电子回单；分类单元，用于基于所述目标样本电子回单对应的银行，对所述样本电子回单进行分类，得到多个电子回单集；训练单元，用于利用多个电子回单集对多个初始识别模型进行训练，得到多个目标识别模型，其中，一个初始识别模型对应一个电子回单集，所述初始识别模型用于识别电子回单中的文字；识别单元，用于在获取到待识别电子回单之后，利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果，并将所述识别结果发送给用户。

10、进一步地，所述获取单元，用于：确定出所述样本电子回单中的第一电子回单，其中，所述第一电子回单为格式不是图像格式的电子回单；将所述第一电子回单转换为图像格式，得到第二电子回单；将所述第二电子回单和所述样本电子回单中出所述第一电子回单以外的电子回单转化为尺寸统一的第三电子回单；对所述第三电子回单中文字所处区域和所述文字所处区域中的文字进行标注，得到所述目标电子回单。

11、进一步地，所述初始识别模型包括：基于yolo-v4算法构建的图像抓取模块和基于ocr文字识别算法构建的文字识别模块，则所述训练单元，用于：利用所述多个电子回单集，对多个初始识别模型的图像抓取模块进行训练，得到多个目标识别模型的图像抓取模块；

12、利用所述多个电子回单集，对多个初始识别模型的文字识别模块进行训练，得到多个目标识别模型的文字识别模块。

13、第三方面，本发明实施例还提供了一种电子设备，包括存储器以及处理器，所述存储器用于存储支持处理器执行上述第一方面中所述方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。

14、第四方面，本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序。

15、在本发明实施例中，通过获取样本电子回单，对所述样本电子回单进行预处理，得到目标样本电子回单；基于所述目标样本电子回单对应的银行，对所述样本电子回单进行分类，得到多个电子回单集；利用多个电子回单集对多个初始识别模型进行训练，得到多个目标识别模型，其中，一个初始识别模型对应一个电子回单集，所述初始识别模型用于识别电子回单中的文字；在获取到待识别电子回单之后，利用所述待识别电子回单对应的目标识别模型识别出所述待识别电子回单的识别结果，并将所述识别结果发送给用户，达到了对不同类型的电子回单进行准确识别的目的，进而解决了现有的银行电子回单的识别方法的识别准确率较低的技术问题，从而实现了提高银行电子回单的识别准确率的技术效果。

16、本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

17、为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖建伟柴晓男
技术所有人：北京合思信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。