银行票据识别方法、设备及介质与流程

文档序号:30311809发布日期:2022-06-05 14:10阅读:171来源:国知局
银行票据识别方法、设备及介质与流程

1.本发明实施例涉及图像处理技术领域,尤其涉及一种银行票据识别方法、设备及介质。


背景技术:

2.随着人工智能(英文简称:ai)技术的迅速发展,ai在人们的日常生活中也扮演着越来越重要的角色,许多简单而又重复的工作都可以由ai来帮助人们完成。在银行系统,每天都会产生大量的票据凭证,这些票据上的某些信息对于事后监督系统又是必不可少的。这其中最重要的两条信息是主键和流水号。
3.由于票据本身样式繁多,还有在票据产生过程中人为、机器等因素的影响以及各种非票据凭证的干扰等,大大增加了检测识别的难度。
4.现有技术中主要是基于模板匹配和特征提取来实现对银行票据的检测识别,但这种方法只适用于特定样式的银行票据的检测和识别,具有较大的局限性,不能够满足复杂多样的银行票据进行检测和识别的需求。


技术实现要素:

5.本发明实施例提供一种银行票据识别方法、设备及介质,该方法解决了现有技术中所采用的基于模板匹配和特征提取来实现对银行票据的检测识别的方法只适用于特定样式的银行票据的检测和识别,具有较大的局限性,不能够满足复杂多样的银行票据进行检测和识别的需求的技术问题。
6.第一方面,本发明实施例提供一种银行票据识别方法,包括:
7.获取待识别的目标银行票据图像;
8.采用训练至收敛的yolov3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测;
9.根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理;
10.采用训练至收敛的新的卷积循环神经网络newcrnn模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别。
11.可选地,如上所述的方法,所述采用训练至收敛的yolov3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测,包括:
12.将所述目标银行票据图像输入到训练至收敛的yolov3模型中,通过所述训练至收敛的yolov3模型对目标银行票据图像中的主键区域及流水号区域进行检测;
13.通过所述训练至收敛的yolov3模型输出主键区域信息及流水号区域信息。
14.可选地,如上所述的方法,所述根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理,包括:
15.根据主键区域及流水号区域的检测结果确定主键及流水号在所述目标银行票据图像中的布局信息;
16.根据所述布局信息确定目标银行票据图像的旋转角度;
17.根据所述旋转角度对所述目标银行票据图像进行校正处理,以使校正处理后的目标银行票据图像中主键区域及流水号区域中的文本按照水平且从左到右顺序排列。
18.可选地,如上所述的方法,所述采用训练至收敛的newcrnn模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别,包括:
19.将校正处理后的目标银行票据图像输入到训练至收敛的newcrnn模型的特征提取层,通过所述特征提取层对所述校正处理后的目标银行票据图像进行特征提取,以获得二维时间序列特征;
20.将所述二维时间序列特征输入到训练至收敛的newcrnn模型的解码层,在所述解码层中采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始文本识别结果。
21.可选地,如上所述的方法,所述在所述解码层中采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始文本识别结果,包括:
22.在所述解码层中采用贪心搜索算法确定每一时刻的主键或流水号的预测结果中最大概率的文本;
23.将所述最大概率的文本确定为该时刻主键或流水号的初始文本识别结果。
24.可选地,如上所述的方法,所述通过所述解码层采用贪心搜索算法确定所述二维时间序列特征中每一时刻的主键或流水号的初始字文本别结果之后,还包括:
25.根据预先构建的标准主键特征对主键的初始文本识别结果进行校正,并且根据预先构建的标准流水号特征对流水号的初始文本识别结果进行校正;
26.输出主键及流水号的最终识别结果。
27.可选地,如上所述的方法,所述采用训练至收敛的yolov3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测之前,还包括:
28.获取对初始yolov3模型进行训练的第一训练样本,所述第一训练样本为标注有主键区域及流水号区域的第一样本银行票据图像;
29.采用所述第一训练样本对所述初始yolov3模型进行训练;
30.若确定训练后的yolov3模型满足收敛条件,则将满足收敛条件的yolov3模型确定为训练至收敛的yolov3模型。
31.可选地,如上所述的方法,所述采用训练至收敛的newcrnn模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别之前,还包括:
32.获取对初始newcrnn模型进行训练的第二训练样本,所述第二训练样本为标注有主键及流水号语义信息的第二样本银行票据图像;
33.采用所述第二训练样本对所述初始newcrnn模型中的特征提取层及转录层进行训练;
34.若确定训练后的newcrnn模型满足收敛条件,则将满足收敛条件的newcrnn模型确定为训练至收敛的newcrnn模型。
35.第二方面,本发明实施例提供一种银行票据识别设备,包括:
36.存储器,处理器以及计算机程序;
37.其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实
现如第一方面中任一项所述的银行票据识别方法。
38.第三方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如第一方面中任一项所述的银行票据识别方法。
39.本发明实施例提供一种银行票据识别方法、设备及介质,通过获取待识别的目标银行票据图像;采用训练至收敛的yolov3模型,对所述目标银行票据图像中的主键区域及流水号区域进行检测;根据主键区域及流水号区域的检测结果对所述目标银行票据图像进行校正处理;采用训练至收敛的新的卷积循环神经网络newcrnn模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别。可利用基于深度学习的模型完成对票据的自动检测和识别,能够适用于复杂多样的银行票据,以满足银行票据识别的需求,提高了对银行票据检测和识别的通用性。
40.应当理解,上述发明内容部分中所描述的内容并非旨在限定本发明的实施例的关键或重要特征,亦非用于限制本发明的范围。本发明的其它特征将通过以下的描述变得容易理解。
附图说明
41.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
42.图1为本发明实施例一提供的银行票据识别方法的流程图;
43.图2a为本发明实施例一提供的一种银行票据布局样式图;
44.图2b为本发明实施例一提供的一种银行票据布局样式图;
45.图2c为本发明实施例一提供的一种银行票据布局样式图;
46.图2d为本发明实施例一提供的一种银行票据布局样式图;
47.图2e为本发明实施例一提供的一种银行票据布局样式图;
48.图2f为本发明实施例一提供的一种银行票据布局样式图;
49.图2g为本发明实施例一提供的一种银行票据布局样式图;
50.图2h为本发明实施例一提供的一种银行票据布局样式图;
51.图2i为本发明实施例一提供的一种银行票据布局样式图;
52.图3为本发明实施例二提供的银行票据识别方法的流程图;
53.图4为本发明实施例一提供的银行票据识别设备的结构示意图。
具体实施方式
54.下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。
55.本发明实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次
序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
56.为了清楚理解本技术的技术方案,首先对现有技术的方案进行详细介绍。
57.现有技术中,在对银行票据进行识别时,首先将票据模板进行存储,当自动化检测系统检测到待识别的目标票据,即将目标票据与所存储的模板进行比对,进而确定待识别票据的样式,然后根据确定的票据样式确定主键和流水号的位置信息,就可以在对应位置通过特征提取来识别得到主键和流水号的文本信息。
58.现有的方法只对特定样式的银行票据有较好的检测结果,但只适用于特定样式的银行票据的检测和识别,具有较大的局限性,不能够满足复杂多样的银行票据进行检测和识别的需求。
59.所以针对现有技术中复杂多样的银行票据,不能够满足复杂多样的银行票据进行检测识别的需求的技术问题,发明人在研究中发现,可以将基于深度学习的票据检测和识别方法应用到银行票据的检测和识别上。利用深度学习算法具有较强的学习能力的特性,完成对银行票据的检测和识别。具体地,利用基于深度学习的目标检测模型yolov3,检测主键和流水号的位置信息,并进行输出,对待检测票据进行旋转角度校正,再利用识别模型newcrnn进行文本识别,可对多种不同样式的票据都能进行较好的检测。能够适用于复杂多样的银行票据,以满足银行票据识别的需求,提高了对银行票据检测和识别的通用性。
60.以下参照附图来具体描述本发明的实施例
61.实施例一
62.图1为本发明实施例一提供的银行票据识别方法的流程图,如图1所示,本实施例的执行主体为银行票据识别设备。则本实施例提供的银行票据识别方法包括以下几个步骤。
63.步骤101,获取待识别的目标银行票据图像。
64.可选地,本实施例中,对待识别的目标银行票据进行图像采集得到票据图像,并对票据图像进行读取。或者预先对银行票据图像进行存储,从存储区域获取待检测和识别的目标银行票据图像。
65.其中,目标银行票据图像中可以包括主键及流水号信息。根据目标银行票据的类型不同,在目标银行票据中主键及流水号的布局样式也会不同。如图2a-图2i所示,为目标银行票据图像中主键及流水号信息九种布局样式。
66.可以理解的是,目标银行票据图像中主键及流水号信息的布局样式还可以其他样式,本实施例中对此不作限定。
67.步骤102,采用训练至收敛的yolov3模型,对目标银行票据图像中的主键区域及流水号区域进行检测。
68.具体地,本实施例中,将目标银行票据图像输入到训练至收敛的yolov3模型,目标检测模型yolov3对目标银行票据图像进行不同尺度的特征提取,以获得多个尺度的融合特征图,在多个尺度的融合特征图上分别独立做检测,并根据多种尺度的融合特征图对应的
检测结果确定最终的检测结果。对于小目标的检测效果提升明显。
69.可选地,本实施例中,在采用采用训练至收敛的yolov3模型,对目标银行票据图像中的主键区域及流水号区域进行检测之前,收集大量票据样本供yolov3模型进行训练,以得到训练至收敛的yolov3模型。
70.其中,训练至收敛的yolov3模型,具有训练好的模型权重值。预先训练好的模型权重可以为一系列模型训练参数值,本实施例对此不作限定。
71.可选地,本实施例中,在将目标银行票据图像输入到训练至收敛的yolov3模型之前,还可对目标银行票据图像进行预处理。具体可以为均值、方差及归一化处理,或者还可以为其他处理方式,本实施例对此不作限定。
72.步骤103,根据主键区域及流水号区域的检测结果对目标银行票据图像进行校正处理。
73.具体地,本实施例中,由于人为或者机器的原因,可能会导致目标银行票据发生一定角度的旋转,为了使目标银行票据图像符合正常阅读习惯,更加适用于新的卷积循环神经网络对主键及流水号的文本识别,就需要根据票据的几何特征及主键和流水号在整个票据中的布局信息确定出目标银行票据所发生的旋转角度,然后对其进行旋转角度校正,以得到校正后的目标银行票据图像。
74.其中,票据的几何特征可以为票据的长宽比,或者还可以为长宽之间的差值,本实施例中对此不作限定。主键和流水号在整个票据中的布局信息可以为:二者在票据页面的上半部分,下半部分,左半部分或者右半部分,本实施例中对此不作限定。
75.步骤104,采用训练至收敛的新的卷积循环神经网络newcrnn模型对校正处理后的目标银行票据图像中的主键及流水号进行文本识别。
76.其中,新的卷积循环神经网络newcrnn模型较crnn模型的区别在于:newcrnn模型去掉了循环层,且解码层采用贪心搜索算法(英文为:greedy search)替代束搜索算法(英文为:beam search)。
77.可选地,本实施例中,newcrnn模型由两部分组成:基于cnn(卷积神经网络)的特征提取层,基于时序连接的分类损失(英文为:ctc loss)的转录层和基于greedy search的解码层。
78.其中,ctc loss在训练过程中通过计算训练样本的输出标签和标注标签之间的损失,来指导模型进行学习、训练。greedy search在识别过程中,用来对cnn得到的特征向量进行解码,得到最终的识别结果,从而实现对目标区域中的文字进行识别。
79.可选地,本实施例中,通过cnn对目标银行票据图像进行特征提取,greedy search进行解码,从而得到解码结果,即文本识别结果。
80.可选地,本实施例中,在对目标银行票据图像进行识别之前,还包括将校正处理后的目标银行票据图像进行预处理。其中,预处理可以为均值、方差、归一化处理和指定高度的等比例缩放,或者其他处理方式,本实施例对此不作限定。
81.本实施例提供的银行票据识别方法,通过获取待识别的目标银行票据图像;采用训练至收敛的yolov3模型,对目标银行票据图像中的主键区域及流水号区域进行检测;根据主键区域及流水号区域的检测结果对目标银行票据图像进行校正处理;采用训练至收敛的新的卷积循环神经网络newcrnn模型对校正处理后的目标银行票据图像中的主键及流水
号进行文本识别。可利用yolov3模型的多尺度特征融合检测,加强对小目标检测的精确度;可在将newcrnn模型中的循环层去掉且解码层采用贪心搜索算法后,大大减小文本识别时间。因此,可利用基于深度学习的模型完成对票据的自动检测和识别,能够适用于复杂多样的银行票据,以满足银行票据识别的需求,提高了对银行票据检测和识别的通用性。
82.实施例二
83.图3为本发明实施例二提供的银行票据识别方法的流程图,如图3所示,本实施例提供的银行票据识别方法,是在本发明银行票据识别方法实施例一的基础上,对步骤101-步骤104的进一步细化,并且还包括了其他步骤,则本实施例提供的银行票据识别方法包括以下步骤。
84.步骤201,获取待识别的目标银行票据图像。
85.可选地,本实施例中,对待识别的目标银行票据进行图像采集得到票据图像,并对票据图像进行读取。
86.步骤202,获取对初始yolov3模型进行训练的第一训练样本,第一训练样本为标注有主键区域及流水号区域的第一样本银行票据图像。
87.可选地,本实施例中,对待训练的银行票据进行标注,标注出主键区域及流水号区域,就获取了标注有主键区域及流水号区域的第一训练样本。
88.其中,标注出主键区域及流水号区域可用主键区域及流水号区域对应的位置信息表示,位置信息是用目标框的左上角(l,t)和右下角(r,d)在图像中的相对位置进行表示的。
89.可选地,本实施例中,在获取了第一训练样本后,将第一样本像素值数据进行均值、方差及归一化等预处理。
90.可选地,本实施例中,还对第一训练样本进行重采样,并将其缩放到固定尺寸等预处理。
91.其中,固定尺寸可以为w*h,或者其他尺寸,本实施例中对此不作限定。
92.步骤203,采用第一训练样本对初始yolov3模型进行训练。
93.可选地,本实施例中,将预处理后得到的第一训练样本送给模型进行学习训练:对输入第一训练样本的图像数据进行卷积、池化及批归一化操作,得到3种不同尺度的特征图,在每一尺度特征图上,分别对应三种不同长宽的基础框;再在每个特征图所包含的基础框上进行预测,得到一系列的候选框;从这些候选框中找出与标注信息框最相近的候选框,并计算它们之间的损失值。根据损失值对模型进行参数调整,完成一次训练。
94.其中,基础框是预先用k-means聚类算法从训练数据上得到的,用来表示主键和流水号的标注区域可能存在的位置,3种尺度中每种尺度都对应3种不同的基础框。
95.步骤204,若确定训练后的yolov3模型满足收敛条件,则将满足收敛条件的yolov3模型确定为训练至收敛的yolov3模型。
96.可选地,本实施例中,经过多次迭代训练,直到损失值趋于稳定,即不再下降,就可以确定yolov3模型满足收敛条件,并将其确定为训练至收敛的yolov3模型。
97.可以理解的是,在每次实施本实施例时,需要先确定是否存在训练至收敛的yolov3模型,若存在,则不再需要执行步骤202-步骤204。
98.步骤205,将目标银行票据图像输入到训练至收敛的yolov3模型中,通过训练至收
敛的yolov3模型对目标银行票据图像中的主键区域及流水号区域进行检测。
99.可选地,本实施例中,将目标银行票据图像输入到训练至收敛的yolov3模型中后,再将其缩放到固定尺寸。yolov3模型对目标银行票据图像进行一系列的卷积、池化、批归一化等操作,得到3种不同尺度的特征图,在每一尺度特征图上,分别对应三种不同长宽的基础框;再在每个特征图所包含的基础框上进行预测,得到一系列的候选框;根据这些候选框确定主键区域和流水号区域。
100.步骤206,通过训练至收敛的yolov3模型输出主键区域信息及流水号区域信息。
101.可选地,本实施例中,在得到主键和流水号的区域后,根据主键区域和流水号区域,确定主键位置信息和流水号位置信息,再通过训练至收敛的yolov3模型将其进行输出。
102.步骤207,根据主键区域及流水号区域的检测结果对目标银行票据图像进行校正处理。
103.作为一种可选实施方式,本实施例中,步骤207包括以下步骤:
104.步骤2071,根据主键区域及流水号区域的检测结果确定主键及流水号在目标银行票据图像中的布局信息。
105.步骤2072,根据布局信息确定目标银行票据图像的旋转角度。
106.步骤2073,根据旋转角度对目标银行票据图像进行校正处理,以使校正处理后的目标银行票据图像中主键区域及流水号区域中的文本按照水平且从左到右顺序排列。
107.可选地,本实施例中,在得到检测结果后,获取主键及流水号在目标银行票据图像中的布局信息前,确定票据的几何特征,根据票据的几何特征可以确定票据是属于图2a-图2f类,还是属于图2g-图2i类。
108.其中,票据的几何特征可以为票据的长宽比,或者还可以为长宽之间的差值,本实施例中对此不作限定。
109.可选地,本实施例中,在获取票据的几何特征后,获取主键及流水号在目标银行票据图像中的布局信息,结合票据几何特征和布局信息就可以确定目标银行票据图像是否发生旋转以及旋转的角度,再根据确定的旋转角度对目标银行票据图像进行旋转角度校正,使校正处理后的目标银行票据图像中主键区域及流水号区域中的文本按照水平且从左到右顺序排列。
110.其中,主键和流水号在整个票据中的布局信息可以为:二者在票据页面的上半部分,下半部分,左半部分或者右半部分,本实施例中对此不作限定。
111.步骤208,获取对初始newcrnn模型进行训练的第二训练样本,第二训练样本为标注有主键及流水号语义信息的第二样本银行票据图像。
112.可选地,本实施例中,在得到旋转角度校正后的银行票据图像后,对主键及流水号语义信息进行标注,就获取了标注有主键及流水号语义信息的第二样本银行票据图像。
113.可选地,本实施例中,在对目标银行票据图像进行校正后,得到校正后的主键和流水号图像数据,然后对其进行均值、方差及归一化处理和指定高度的等比例缩放,得到预处理后的数据,即对初始newcrnn模型进行训练的第二训练样本。
114.步骤209,采用第二训练样本对初始newcrnn模型中的特征提取层及转录层进行训练。
115.可选地,本实施例中,对初始newcrnn模型中的特征提取层cnn及转录层进行训练
的过程为:根据第二训练样本中的标注信息建立字符集对应的字典;将每一个标注的语义信息的字符转换其对应在字典中的序号编码;从训练数据集中读取一个批次的图像数据及其对应的标注进行预处理;初始newcrnn模型中的特征提取层cnn对预处理结果进行特征提取后,得到一个二维的时间序列特征;ctc loss从该二维时间序列特征中计算出与对应标注之间的损失;根据损失值进行参数调整,完成一次训练。
116.其中,预处理过程为:对该批次的图像数据,进行均值、方差及归一化处理;采用等比例缩放对其进行第一次缩放操作;采用固定大小缩放进行第二次缩放操作;得到高度为h,宽度为wmax的预处理后图像数据。
117.其中,wmax表示进行第一次缩放操作后宽度最大的那个图像的宽度值。
118.步骤210,确定训练后的newcrnn模型满足收敛条件,则将满足收敛条件的newcrnn模型确定为训练至收敛的newcrnn模型。
119.可选地,本实施例中,经过多次迭代训练,直到损失的值趋于稳定,即不再下降,就可以确定newcrnn模型满足收敛条件,并将其确定为训练至收敛的newcrnn模型。
120.步骤211,将校正处理后的目标银行票据图像输入到训练至收敛的newcrnn模型的特征提取层,通过特征提取层对校正处理后的目标银行票据图像进行特征提取,以获得二维时间序列特征。
121.可选地,本实施例中,特征提取层cnn对目标银行票据图像进行特征提取,得到一个二维的时间序列特征(t=1/4*wmax,seq=num_classes+1)。
122.其中,t表示时间序列的长度,seq表示预测的总的类别数:其中num_classes表示有效的类别数,1表示增加的空白类。
123.其中,如表1所示,cnn由7个卷积层和1个全连接层组成,cnn对目标银行票据图像进行特征提取,得到一个二维的时间序列特征的具体过程如表1所示。
124.表1 newcrnn模型的cnn结构
125.[0126][0127]
步骤212,将二维时间序列特征输入到训练至收敛的newcrnn模型的解码层,在解码层中采用贪心搜索算法确定二维时间序列特征中每一时刻的主键或流水号的初始文本
识别结果。
[0128]
可选地,本实施例中,步骤212具体包括以下步骤:
[0129]
步骤2121,在解码层中采用贪心搜索算法确定每一时刻的主键或流水号的预测结果中最大概率的文本;
[0130]
步骤2122,将最大概率的文本确定为该时刻主键或流水号的初始文本识别结果。
[0131]
其中,greedy search对二维时间序列特征进行解码,以得到初始文本识别结果的解码过程如表2所示。将每一时刻预测的结果中最大概率的确定为该时刻的输出;将输出结果中相邻重复的文本和空白文本(英文为:blank)去掉,得到初始文本识别结果。
[0132]
其中,将输出结果中相邻重复的文本去掉,是因为:如果实际票据中存在相邻两个文本相同的情况,那么,解码结果应该是两个相同文本之间会存在一个空白文本。所以,如果输出结果存在相邻重复文本,就可以确定重复采集了文本信息,需要去掉其中一个。
[0133]
表2 newcrnn模型的解码过程
[0134][0135]
步骤213,根据预先构建的标准主键特征对主键的初始文本识别结果进行校正,并且根据预先构建的标准流水号特征对流水号的初始文本识别结果进行校正。
[0136]
可选地,本实施例中,对主键的初始文本识别结果进行校正:将识别结果与预先建立好的主键类型库中的标准主键特征进行比对,若是比对上,则说明检测结果可信,直接输出;若是没有比对上,则将该结果与类型库中所有类型的标准主键特征进行匹配,若是匹配成功,将概率最大的那个作为最终数据,若是没有匹配成功,则输出空字符串;对流水号的初始文本识别结果进行校正:具体地,将流水号的初始文本识别结果与预先构建的标准流水号特征进行对比。示例性的,若初始文本识别结果位数上满足流水号位数的要求且每一个预测的流水号字符都应该在流水号字符库中,才将识别结果输出,若其中一个条件不满足,则输出空字符串。
[0137]
步骤214,输出主键及流水号的最终识别结果。
[0138]
可选地,本实施例中,在对主键及流水号的初始识别结果进行校正后,输出主键及
流水号的最终识别结果。
[0139]
本实施例提供的银行票据识别方法,通过将校正处理后的目标银行票据图像输入到训练至收敛的newcrnn模型的特征提取层,通过特征提取层对校正处理后的目标银行票据图像进行特征提取,以获得二维时间序列特征;将二维时间序列特征输入到训练至收敛的newcrnn模型的解码层,在解码层中采用贪心搜索算法确定二维时间序列特征中每一时刻的主键或流水号的初始文本识别结果,由于贪心搜索算法确定二维时间序列特征中每一时刻的主键或流水号的初始文本识别结果,因此,贪心搜索算法能够大大减小文本识别时间。
[0140]
根据本发明的实施例,本发明还提供了一种银行票据识别设备和一种计算机可读存储介质。
[0141]
如图4所示,是根据本发明实施例提供的银行票据识别设备的结构示意图。银行票据识别设备旨在各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0142]
如图4所示,该电子设备包括:处理器301和存储器302。处理器301与存储器302通过电路互联。具体地,各个部件利用总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。
[0143]
存储器302即为本发明所提供的计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本发明所提供的列车制动方法。本发明的计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本发明所提供的银行票据识别方法。
[0144]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明实施例的其它实施方案。本发明旨在涵盖本发明实施例的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明实施例的一般性原理并包括本发明实施例未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明实施例的真正范围和精神由下面的权利要求书指出。
[0145]
应当理解的是,本发明实施例并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明实施例的范围仅由所附的权利要求书来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1