本技术涉及图像识别,尤其是涉及一种通用的卡证识别方法、装置、系统、电子设备及存储介质。
背景技术:
1、光学字符识别(optical character recognition,ocr)是一种可以将图像中的文本识别转换为计算机可编辑的文本的技术。这种技术主要应用于扫描和识别印刷或手写文档,从而将它们数字化。目前,ocr技术可以广泛应用于文档数字化、图像处理、自动化填写表格、光学字符防伪等多个领域。
2、在文档数字化领域中,ocr可识别的类型多达十几种,如身份证识别、发票识别、营业执照识别等,基本可以满足常用的业务中大部分需求,且在实际的应用场景中表现良好。但是,仅靠增加识别场景终究不能灵活适应所有的需求。在一些使用范围较小的卡证文档(例如,仅限在某个地区发放的证照)的识别场景下,ocr的适用性较差。
技术实现思路
1、本技术提供一种通用的卡证识别方法、装置、系统、电子设备及存储介质。提供给用户自行创建识别模板的功能,以便于适用特殊场景下的识别需求,提升ocr的适用性。
2、第一方面,本技术提供一种通用的卡证识别方法,包括:
3、检测到待识别卡证图像后,调用分类器,所述分类器中包含至少一个候选卡证识别模板;
4、将所述待识别卡证图像与所述分类器中的候选卡证识别模板进行对比,判断是否存在与所述待识别卡证图像匹配的模板;
5、若在所述候选卡证识别模板中没有与所述待识别卡证图像匹配的模板,则显示自定义模板编辑界面,提示用户创建所述待识别卡证图像匹配的自定义模板;
6、接收到用户上传的模板图片和基于所述模板图片选定的参照字段和识别区后,判断所述参照字段和所述识别区是否符合对应的框选要求;
7、若所述参照字段和所述识别区均符合对应的框选要求,则生成所述待识别卡证图像匹配的自定义模板;
8、响应于添加模板请求,将所述待识别卡证图像匹配的自定义模板添加到分类器中;
9、基于调整后的分类器对所述待识别卡证图像进行识别。
10、可选的,所述将所述待识别卡证图像与所述分类器中的候选卡证识别模板进行对比,判断是否存在与所述待识别卡证图像匹配的模板,包括:
11、针对每一个候选卡证识别模板,从所述候选卡证识别模板中提取参照字段信息;所述参照字段信息包括参照字段的字符信息和位置信息;
12、对所述待识别卡证图像进行初步识别,确定所述待识别卡证图像中的全部字段;
13、根据所述参照字段的字符信息,确定所述参照字段与所述待识别卡证图像中的全部字段的重复率;
14、若存在重叠率大于等于预设值的候选卡证识别模板,则确定存在与所述待识别卡证图像匹配的模板;
15、若不存在重叠率大于等于预设值的候选卡证识别模板,则确定不存在与所述待识别卡证图像匹配的模板。
16、可选的,所述方法还包括:
17、若存在重叠率大于等于预设值的候选卡证识别模板,则从中选取若干准匹配识别模板;
18、针对每一准匹配识别模板,保留所述准匹配识别模板中与所述待识别卡证图像相同的参照字段,删除其它字段;
19、根据所述参照字段的位置信息,从所述准匹配识别模板中提取相同的参照字段的列特征、行特征、同行特征;
20、针对所述待识别卡证图像,保留所述待识别卡证图像中与所述准匹配识别模板相同的参照字段,删除其它字段;
21、根据所述参照字段的位置信息,从所述待识别卡证图像中提取相同的参照字段的列特征、行特征、同行特征;
22、将所述待识别卡证图像中参照字段的列特征、行特征、同行特征,分别与每一所述准匹配识别模板中参照字段的列特征、行特征、同行特征进行对比,确定匹配识别模板;
23、基于所述匹配识别模板对所述待识别卡证图像进行识别。
24、可选的,所述基于所述匹配识别模板对所述待识别卡证图像进行识别,包括:
25、获取所述匹配识别模板的参照字段信息、识别区信息、透视变换信息;
26、根据所述参照字段信息,判断所述匹配识别模板与所述待识别卡证图像是否匹配;
27、若确定所述匹配识别模板与所述待识别卡证图像匹配,则根据所述匹配识别模板的透视变换信息,对所述待识别卡证图像进行透视变换;
28、根据变换后的待识别卡证图像与所述匹配识别模板的大小关系、所述识别区信息,确定变换后的待识别卡证图像的识别区的尺寸;
29、根据所述参照字段信息、识别区信息、变换后的待识别卡证图像的识别区的尺寸,确定变换后的待识别卡证图像的识别区的位置;
30、确定所述变换后的待识别卡证图像的识别区中的待识别文本框;
31、调用所述匹配识别模板对应的识别算法,对所述待识别文本框中的内容进行识别。
32、可选的,所述透视变换信息包括透视变换角点相对于参照字段的位置信息、透视变换角点计算公式;所述根据所述匹配识别模板的透视变换信息,对所述待识别卡证图像进行透视变换,包括:
33、根据所述匹配识别模板中透视变换角点相对于参照字段的位置信息,确定所述待识别卡证图像中变换前的透视变换角点位置信息;
34、根据所述待识别卡证图像变换前的透视变换角点位置信息和所述匹配识别模板的透视变换角点计算公式,确定所述待识别卡证图像变换后的透视变换角点位置信息;
35、基于所述待识别卡证图像变换前的透视变换角点位置信息和变换后的透视变换角点位置信息,对所述待识别卡证图像进行透视变换。
36、可选的,所述确定所述变换后的待识别卡证图像的识别区中的待识别文本框,包括:
37、根据所述识别区的位置信息、识别过程中生成的文本框的位置信息,将完全位于所述识别区内的文本框确定为待识别文本框;
38、检测所述识别区与文本框的交点;
39、针对每一个与所述识别区有交点的文本框,根据所述文本框的位置信息、所述识别区的位置信息,确定所述文本框在所述识别区内的面积相对于所述文本框的面积占比;将面积占比大于预设面积比的文本框确定为待识别文本框。
40、第二方面,本技术提供一种通用的卡证识别装置,包括:
41、分类器调用模块,用于检测到待识别卡证图像后,调用分类器,所述分类器中包含至少一个候选卡证识别模板;
42、对比模块,用于将所述待识别卡证图像与所述分类器中的候选卡证识别模板进行对比,判断是否存在与所述待识别卡证图像匹配的模板;
43、自定义模板模块,用于若在所述候选卡证识别模板中没有与所述待识别卡证图像匹配的模板,则显示自定义模板编辑界面,提示用户创建所述待识别卡证图像匹配的自定义模板;接收到用户上传的模板图片和基于所述模板图片选定的参照字段和识别区后,判断所述参照字段和所述识别区是否符合对应的框选要求;若所述参照字段和所述识别区均符合对应的框选要求,则生成所述待识别卡证图像匹配的自定义模板;
44、分类器管理模块,用于响应于添加模板请求,将所述待识别卡证图像匹配的自定义模板添加到分类器中;
45、识别模块,用于基于调整后的分类器对所述待识别卡证图像进行识别。
46、第三方面,本技术提供一种电子设备,包括:存储器和处理器;
47、所述存储器,用于存储程序指令;
48、所述处理器,用于调用并执行所述存储器中的程序指令,执行如第一方面任一项所述的通用的卡证识别方法。
49、第四方面,本技术提供一种计算机可读存储介质,存储有能够被处理器加载并执行第一方面的通用的卡证识别方法的计算机程序。
50、第五方面,本技术提供一种通用的卡证识别系统,包括:
51、自定义模板模块,用于显示自定义模板编辑界面,提示用户创建待识别卡证图像匹配的自定义模板;接收到用户上传的模板图片和基于所述模板图片选定的参照字段和识别区后,判断所述参照字段和所述识别区是否符合对应的框选要求;若所述参照字段和所述识别区均符合对应的框选要求,则生成自定义模板;
52、分类器管理模块,用于响应于添加模板请求,将自定义模板添加到分类器中;
53、图像识别模块,用于对待识别卡证图像进行识别。
54、本技术提供了一种通用的卡证识别方法、装置、系统、电子设备及存储介质。检测到待识别卡证图像后,调用分类器,所述分类器中包含至少一个候选卡证识别模板;将所述待识别卡证图像与所述分类器中的候选卡证识别模板进行对比,判断是否存在与所述待识别卡证图像匹配的模板;若在所述候选卡证识别模板中没有与所述待识别卡证图像匹配的模板,则显示自定义模板编辑界面,提示用户创建所述待识别卡证图像匹配的自定义模板;接收到用户上传的模板图片和基于所述模板图片选定的参照字段和识别区后,判断所述参照字段和所述识别区是否符合对应的框选要求;若所述参照字段和所述识别区均符合对应的框选要求,则生成所述待识别卡证图像匹配的自定义模板;响应于添加模板请求,将所述待识别卡证图像匹配的自定义模板添加到分类器中;基于调整后的分类器对所述待识别卡证图像进行识别。提供给用户自行创建识别模板的功能,以便于适用特殊场景下的识别需求,提升ocr的适用性。