票据信息的获取方法、装置、设备及存储介质与流程

文档序号：24430969发布日期：2021-03-27 00:26阅读：255来源：国知局

1.本申请涉及计算机视觉和深度学习技术等人工智能领域，尤其涉及一种票据信息的获取方法、装置、设备及存储介质。

背景技术：

2.企业中经常涉及财务票据的报销，通过收集大量的票据图片，录入票据信息，完成报销流程。
3.目前财务票据报销的流程通常是采用人工录入的方式。在获取财务票据后，由人工逐一对票据进行拍摄，并辨认票面各字段的文字信息，手动输入各字段的内容，提交后完成财务报销流程。
4.上述方案需要投入大量的人力资源，严重影响票据信息采集的效率。

技术实现要素：

5.本申请提供了一种票据信息的获取方法、装置、设备及存储介质。
6.根据本申请的第一方面，提供了一种票据信息的获取方法，包括：
7.获取票据图像，并根据所述票据图像获取至少一个票据子图像和每个票据子图像的票据类型；
8.根据所述票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域的对应的信息类型；
9.根据每个信息提取区域以及对应的信息类型，获取每个票据子图像的票据信息。
10.根据本申请的第二方面，提供了一种票据信息的获取装置，包括：
11.获取模块，用于获取票据图像，并根据所述票据图像获取至少一个票据子图像和每个票据子图像的票据类型；
12.确定模块，用于根据所述票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域的对应的信息类型；
13.处理模块，用于根据每个信息提取区域以及对应的信息类型，获取每个票据子图像的票据信息。
14.根据本申请的第三方面，提供了一种电子设备，包括：
15.至少一个处理器；以及
16.与所述至少一个处理器通信连接的存储器；其中，
17.所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面中任一项所述的方法。
18.根据本申请的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行第一方面中任一项所述的方法。
19.根据本申请的第五方面，提供了一种计算机程序产品，所述程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可
读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
20.本申请实施例提供的票据信息的获取方法、装置、设备及存储介质，首先获取票据图像，并根据票据图像获取至少一个票据子图像和每个票据子图像的票据类型，从而将票据图像上的票据进行了分割和识别；然后，根据票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域对应的信息类型，并根据每个信息提取区域以及对应的信息类型，获取每个票据子图像的票据信息，完成票据图像上的票据的信息录入。本申请实施例的方案，无需人工操作，直接根据票据图像进行票据子图像和票据类型的识别，然后基于信息提取区域和信息类型完成票据信息的获取，无需耗费人力资源，且同时支持单贴和混贴的录入，录入效率较高，识别效果较好。
21.应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
22.附图用于更好地理解本方案，不构成对本申请的限定。其中：
23.图1为本申请实施例提供的一种应用场景示意图；
24.图2为本申请实施例提供的票据信息的获取方法的流程示意图；
25.图3为本申请实施例提供的获取票据子图像和票据类型的流程示意图；
26.图4为本申请实施例提供的一种票据识别样本的示意图；
27.图5为本申请实施例提供的信息提取区域和信息类型示意图；
28.图6为本申请实施例提供的方向矫正示意图；
29.图7为本申请实施例提供的获取票据信息的示意图；
30.图8为本申请实施例提供的上传票据图像的界面示意图；
31.图9为本申请实施例提供的票据信息获取的流程示意图；
32.图10为本申请实施例提供的票据信息的获取装置的结构示意图；
33.图11为本申请实施例提供的示例电子设备的示意性框图。
具体实施方式
34.以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
35.图1为本申请实施例提供的一种应用场景示意图，如图1所示，包括客户端11和服务器12，客户端11和服务器12之间通过有线或无线连接。
36.当需要进行票据信息的录入时，通过客户端对票据进行拍照，得到票据图像13。例如在图1中，票据图像13上包括票据1、票据2和票据3。
37.然后客户端11将票据图像13发送给服务器12，服务器12对票据图像13上的票据进行识别，得到对应的票据信息，并进行录入。
38.其中，客户端11和服务器12可以为独立的两个设备，也可以为设置于同一个设备
中的两个部件，本申请实施例对此不作特别限定。
39.目前对于票据信息的录入，主要是通过人工录入的方式。具体的，由人工逐一对票据进行拍摄，然后人工辨认票面各字段的文字信息，并手动输入各字段的内容，完成票据信息的录入。
40.上述方式存在一定的缺点，首先，人工拍摄票据并辨认文字信息，输入字段内容需要投入大量的人力资源，票据信息的采集的效率较低；其次，人眼辨认录入的票据信息可能导致录入信息错误，影响后续流程。
41.基于此，本申请实施例提供一种票据信息的获取方案，实现高效快速的票据信息的录入。
42.图2为本申请实施例提供的票据信息的获取方法的流程示意图，如图2所示，该方法可以包括：
43.s21，获取票据图像，并根据所述票据图像获取至少一个票据子图像和每个票据子图像的票据类型。
44.票据图像为粘贴了票据后进行拍摄得到的图像，票据图像上粘贴的票据可能为1个，也可能为多个。在粘贴了票据并进行拍摄得到票据图像后，可以上传该票据图像到服务器，服务器获取该票据图像。
45.服务器在获取了票据图像后，根据该票据图像获取至少一个票据子图像和每个票据子图像的票据类型。其中，每个票据子图像对应一个票据，可以对票据图像中的票据进行识别，将每个票据在票据图像中对应的图像区域进行截取，得到票据对应的票据子图像，以及票据子图像的票据类型。
46.票据子图像的票据类型例如可以为增值税发票、火车票、出租车票等不同的类型。
47.s22，根据所述票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域的对应的信息类型。
48.不同的票据类型上包括的票据信息的内容和在票据上的位置均不同。例如，在火车票上，其对应的信息可能包括乘车人姓名、身份证号、车次、票价等。出租车票上，可能只包括车次、价格等，不包括乘车人姓名、身份证号等不同的信息。因此，不同的票据类型需要提取的信息是不同的，信息的位置也是不同的。
49.在确定了每个票据子图像的票据类型后，根据该票据类型可以确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域对应的信息类型。
50.由于同一种票据类型的票据，其包括的信息的内容以及在票据上的位置基本是大同小异的，因此在确定了票据类型后，就可以进行信息的提取。例如针对火车票，火车票上的乘车人姓名、车次、身份证号等信息都在固定的区域。针对这些信息，可以确定对应的信息提取区域，信息提取区域对应于信息在票据子图像上的位置。同时，还要获取每个信息提取区域对应的信息类型，例如乘车人姓名、乘车人身份证号就是不同的信息类型。
51.s23，根据每个信息提取区域以及对应的信息类型，获取每个票据子图像的票据信息。
52.在获取了每个票据子图像的信息提取区域和对应的信息类型后，就可以根据每个信息提取区域提取对应的信息，结合对应的信息类型，得到每个票据子图像的票据信息，完成票据信息的录入。
53.本申请实施例提供的票据信息的获取方法，首先获取票据图像，并根据票据图像获取至少一个票据子图像和每个票据子图像的票据类型，从而将票据图像上的票据进行了分割和识别；然后，根据票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域对应的信息类型，并根据每个信息提取区域以及对应的信息类型，获取每个票据子图像的票据信息，完成票据图像上的票据的信息录入。本申请实施例的方案，无需人工操作，直接根据票据图像进行票据子图像和票据类型的识别，然后基于信息提取区域和信息类型完成票据信息的获取，无需耗费人力资源，且同时支持单贴和混贴的录入，录入效率较高，识别效果较好。
54.下面结合附图对本申请的方案进行详细介绍。
55.首先介绍根据票据图像获取票据子图像和票据类型的方案。
56.图3为本申请实施例提供的获取票据子图像和票据类型的流程示意图，如图3所示，包括：
57.s31，根据所述票据图像获取至少一个票据子图像的顶点坐标。
58.通常票据的形状是长方形的，因此本申请实施例中，是通过确定票据子图像的顶点坐标来确定票据子图像的。
59.具体的，可以通过票据识别模型对票据图像进行处理，得到票据子图像的顶点坐标。
60.在应用票据识别模型之前，首先需要进行票据识别模型的训练。首先，需要获取多组票据识别样本，其中，每组票据识别样本中包括一张样本票据图像和该样本票据图像上的每个样本票据子图像的顶点坐标。
61.图4为本申请实施例提供的一种票据识别样本的示意图，如图4所示，包括一张样本票据图像40。在进行票据识别模型的训练之前，需要对样本票据图像40上的样本票据子图像的顶点坐标进行标注。
62.样本票据图像40上，包括3个票据子图像，分别是票据子图像41、票据子图像42和票据子图像43。票据子图像41的4个顶点分别是点a1、点b1、点c1和点d1，票据子图像42的4个顶点分别是点a2、点b2、点c2和点d2，票据子图像4,3的4个顶点分别是点a3、点b3、点c3和点d3。
63.在进行票据识别模型训练时，样本票据图像上的样本票据子图像可能存在粘连的情况。以样本票据图像40为例，其中，票据子图像41和票据子图像42有部分粘连，票据子图像41的一个顶点c1位于票据子图像42的范围内，票据子图像42的一个顶点a2位于票据子图像41的范围内。票据子图像43不存在粘连的情况。
64.这样设置的原因是，实际在粘贴票据时，也可能存在票据有部分粘连的情况。通过设置这样的训练样本来训练票据识别模型，使得票据识别模型对存在粘连的票据子图像也具备识别能力。
65.在获取票据识别样本后，将其中的样本票据图像输入至票据识别模型，票据识别模型对样本票据图像处理，输出对应的4个坐标，然后根据这4个坐标和标注的样本票据图像上的每个样本票据子图像的顶点坐标之间的误差，调整票据识别模型的参数。针对每组票据识别样本，均进行上述处理，直至模型收敛后，票据识别模型训练完成。
66.训练完成后，票据识别模型就具备获取票据图像上的票据子图像的顶点坐标的功
能。然后，将票据图像输入至票据识别模型中，就可以得到票据图像上的每个票据子图像的顶点坐标。由于在进行票据识别模型的训练时，考虑了票据子图像存在粘连的情况，因此即使票据图像上存在票据子图像粘连的情况，该票据识别模型也能够进行准确的识别，从而后续可以根据票据子图像的顶点坐标，将票据子图像进行正确的分割。
67.可选的，在进行票据识别模型的训练时，标注的样本票据子图像的顶点坐标，可以具体标注出每个顶点坐标的类型，比如哪个是左上角顶点，哪个是左下角顶点，哪个是右上角顶点，哪个是右下角顶点。因此在模型训练完成后，不仅可以得到每个票据子图像的顶点坐标，还可以获知每个顶点坐标的类型。
68.s32，根据每个票据子图像的顶点坐标，获取对应的票据子图像。
69.在得到每个票据子图像的顶点坐标后，根据顶点坐标就可以获取对应的票据子图像。具体的，可以根据顶点坐标上的左上角顶点坐标、左下角顶点坐标、右下角顶点坐标和右上角顶点坐标依次连线，在票据图像上进行截取，就得到对应的票据子图像。
70.针对每个票据子图像，都可以采用上述方式，从票据图像上截取对应的票据子图像。
71.s33，确定每个票据子图像的票据类型。
72.当用户上传的票据图像上只包括一个票据子图像时，用户可能获知该票据子图像的票据类型，也可能不知道该票据子图像的票据类型。若用户获知该票据子图像的票据类型，就可以在对应的票据类型接口通过客户端上传该票据图像。根据票据类型接口，服务器能够获取票据类型信息，根据该票据类型信息确定该票据图像上对应的票据子图像的票据类型。
73.当用户不知道该票据子图像的票据类型，或者票据图像上包括的票据子图像为一个或多个时，需要根据票据子图像进行票据类型的识别。
74.具体的，可以根据票据分类模型对票据子图像进行处理，得到票据子图像的票据类型。
75.在采用票据分类模型对票据子图像进行处理之前，需要进行票据分类模型的训练。首先，获取多组票据分类样本，每组票据分类样本中包括一张样本票据子图像和样本票据子图像的票据类型，样本票据子图像的票据类型是对样本票据子图像进行类型标注的标注信息，票据类型例如包括增值税发票、火车票、出租车票、银行发票等类型中的一个。
76.在训练时，输入一张样本票据子图像，然后票据分类模型输出识别的票据类型，然后跟标注的票据类型进行比较，来调整票据分类模型的参数。重复上述操作，直至模型收敛后，得到训练完成的票据分类模型。
77.模型训练完成后，票据分类模型就具备根据票据子图像确定对应的票据类型的功能。此时将票据图像上的每个票据子图像输入至票据分类模型中，就可以得到每个票据子图像对应的票据类型。
78.本申请实施例中，票据类型的识别，只需要融合票据子图像的视觉特征，而无需结合票据子图像的文本特征，即无需对票据子图像的文本进行识别即可进行票据类型的确定，更加简便和高效。
79.在确定了票据图像上的票据子图像和每个票据子图像的票据类型后，就可以根据票据类型确定票据子图像的至少一个信息提取区域以及每个信息提取区域的对应的信息
类型。
80.信息提取区域为需要提取对应的票据信息的区域，不同的票据类型，其信息提取区域各不相同。例如，火车票需要提取的信息包括车次、乘车人姓名、乘车人身份证号、车票价格等等；出租车票需要提取的信息包括乘车编号、车票价格等。这些提取的信息不同，即使有相同的提取信息，例如车票价格，但是针对不同的票据类型，这些信息也可能位于票据上的不同位置。
81.下面将结合图5对信息提取区域以及对应的信息类型的获取进行介绍。
82.图5为本申请实施例提供的信息提取区域和信息类型示意图，如图5所示，是以火车票为例进行说明的，其他的票据类型与此类似。
83.在图5中，包括一张票据子图像50，其票据类型是已知的，就是火车票。在票据类型确定以后，就可以获取对应的语义结构模型，根据语义结构模型对票据子图像50进行处理，得到票据子图像50的至少一个信息提取区域以及每个信息提取区域对应的信息类型。
84.在图5中，示例了火车票上的4个信息提取区域的确定，分别是信息提取区域51、信息提取区域52、信息提取区域53和信息提取区域54。通过语义结构模型，可以输出信息提取区域51的4个顶点坐标以及信息提取区域51的信息类型，即车次；通过语义结构模型，可以输出信息提取区域52的4个顶点坐标以及信息提取区域52的信息类型，即车票价格；通过语义结构模型，可以输出信息提取区域53的4个顶点坐标以及信息提取区域53的信息类型，即乘车人姓名；通过语义结构模型，可以输出信息提取区域54的4个顶点坐标以及信息提取区域54的信息类型，即乘车人身份证号。
85.可选的，在一些情况下，票据子图像在票据图像上的方向可能存在不正的情况，在这种情况下，可能需要先进行方向矫正，再确定信息提取区域。
86.图6为本申请实施例提供的方向矫正示意图，如图6所示，票据子图像61是未经方向矫正的票据，是根据识别票据子图像61的4个顶点坐标从而在票据图像上截取得到的。
87.票据子图像61的方向是否正，可以根据票据子图像61的4个顶点坐标来确定。通常，方正的票据子图像61，左上角顶点和右上角顶点的纵坐标相同，左上角顶点和左下角顶点的横坐标相同。如果不同，则表示方向不正，需要进行方向校正。需要说明的是，票据子图像61的4个顶点坐标的获取可能存在些许的误差，因此只要左上角顶点和右上角顶点的纵坐标之间的差值小于一定值就认为相同，同样的，左上角顶点和左下角顶点的横坐标之间的差值小于一定值就认为相同。
88.若票据子图像61的方向不正，则需要进行方向矫正，根据票据子图像61的4个顶点坐标进行方向矫正，使得矫正后的票据子图像62满足左上角顶点和右上角顶点的纵坐标相同，左上角顶点和左下角顶点的横坐标相同即可，矫正后的效果可参加图6中的票据子图像62。
89.通过上述方式，可以确定票据子图像上每个信息提取区域以及对应的信息类型，然后，可以获取每个票据子图像的票据信息。
90.具体的，针对任意信息提取区域，可以根据该信息提取区域，在对应的票据子图像上提取区域图像。例如在图5中，根据信息提取区域51的4个顶点坐标，可以在票据子图像上截取对应的区域图像，同样的，根据信息提取区域52、信息提取区域53、信息提取区域54各自的4个顶点坐标，截取对应的区域图像。
91.在确定了区域图像后，对区域图像进行文字识别处理，就可以得到区域图像对应的文字信息，然后根据文字信息和对应的信息类型，获取信息提取区域对应的票据信息。
92.由于本申请实施例中，无需对票据子图像上的所有文字信息进行识别，而是通过确定对应的信息提取区域，只对信息提取区域中的文字信息进行识别，需要识别的文字信息较少，能够加快文字识别的速度，节省计算量。
93.图7为本申请实施例提供的获取票据信息的示意图，如图7所示，其中，从图5示例的4个信息提取区域分别截取得到了对应的4个区域图像，其中，信息提取区域51对应的区域图像为区域图像701，信息提取区域52对应的区域图像为区域图像702，信息提取区域53对应的区域图像为区域图像703，信息提取区域54对应的区域图像为区域图像704。
94.可选的，可以将上述区域图像进行灰度处理，得到对应的灰度区域图像，例如根据区域图像701得到灰度区域图像711，根据区域图像702得到灰度区域图像712，根据区域图像703得到灰度区域图像713，根据区域图像704得到灰度区域图像714。
95.进行灰度处理的目的是，灰度处理后的灰度区域图像的每个像素点的rgb三个像素通道的像素值相等，进行文字识别时能够减小计算量，提高文字识别的速度。同时，灰度处理后对于文字识别的准确率产生的影响较小，可以忽略。
96.在得到灰度区域图像后，就可以根据文字识别模型对灰度区域图像进行处理，得到灰度区域对于的文字信息。在根据文字识别模型进行文字识别之前，需要进行文字识别模型的训练。
97.首先，获取多组文字识别样本，每组文字识别样本中样本一张样本灰度区域图像和样本灰度区域图像中的样本文字信息。将样本灰度区域图像输入至文字识别模型，得到文字识别模型输出的识别文字，然后根据识别文字和样本文字信息对文字识别模型的参数进行调整。重复上述操作，直至文字识别模型收敛后，得到训练完成的文字识别模型，此时文字识别模型具备文字识别功能。
98.如图7所示，文字识别模型训练完成后，将灰度区域图像711、灰度区域图像712、灰度区域图像713、灰度区域图像714，分别输入至文字识别模型，可以得到对应的文字信息71，文字信息71中包括k123次、100.00元、李明、450211999****2413。
99.然后，结合每个信息提取区域的类型，得到票据信息72，其内容为：
100.车次：k123次；
101.票价：100.00元；
102.乘车人姓名：李明；
103.身份证号：450211999****2413。
104.下面结合图8和图9对本申请实施例的完整方案进行介绍。
105.图8为本申请实施例提供的上传票据图像的界面示意图，如图8所示，界面80上包括多个接口，例如包括混贴票据识别接口、银行回单识别接口、增值税发票识别接口等等。
106.当用户需要上传票据图像时，如果票据图像上只有一张票据子图像，且用户明确获知对应的票据类型，则可以根据上述接口进行选择。例如如果是火车票，则选择火车票识别接口上传票据图像。根据上传的接口，系统就能够获知票据类型。
107.如果票据图像上包括多张票据子图像，或者用户不知道票据类型，则可以选择最上方的混贴票据识别接口。然后系统会进行票据子图像的分割和识别，确定每个票据子图
像的类别。
108.例如在图8中，选择的是混贴票据识别接口上传票据图像，票据图像上包括4个票据，分别是票据1、票据2、票据3和票据4。上传后，就会分别对这4个票据进行分割和识别即可。
109.图9为本申请实施例提供的票据信息获取的流程示意图，如图9所示，包括：
110.s91，输入票据图像。
111.票据图像上包括一个或多个票据子图像，票据图像的上传可参见图8的描述，此处不再赘述。
112.s92，确定票据子图像。
113.每个票据子图像对应一张票据，确定票据子图像后就确定了对应的票据。
114.s93，判断票据类型是否已知，若是，则执行s95，若否，则执行s94。
115.s94，确定票据类型。
116.票据类型未知时需要进行票据类型的识别，才能够根据票据类型进行后续的票据信息的提取。
117.s95，确定信息提取区域和对应的信息类型。
118.票据类型确定后，就能够确定对应的信息提取区域和每个信息提取区域的信息类型。
119.s96，获取文字信息。
120.对信息提取区域中的文字进行文字识别即可得到对应的文字信息。
121.s97，得到票据信息。
122.根据文字信息和对应的信息类型，即可得到最终的票据信息。
123.本申请实施例提供的票据信息的获取方法，首先获取票据图像，并根据票据图像获取至少一个票据子图像和每个票据子图像的票据类型，从而将票据图像上的票据进行了分割和识别；然后，根据票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域对应的信息类型，并根据每个信息提取区域以及对应的信息类型，获取每个票据子图像的票据信息，完成票据图像上的票据的信息录入。本申请实施例的方案，无需人工操作，直接根据票据图像进行票据子图像和票据类型的识别，然后基于信息提取区域和信息类型完成票据信息的获取，无需耗费人力资源，且同时支持单贴和混贴的录入，录入效率较高，识别效果较好。
124.图10为本申请实施例提供的票据信息的获取装置的结构示意图，如图10所示，该装置100包括：
125.获取模块101，用于获取票据图像，并根据所述票据图像获取至少一个票据子图像和每个票据子图像的票据类型；
126.确定模块102，用于根据所述票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域的对应的信息类型；
127.处理模块103，用于根据每个信息提取区域以及对应的信息类型，获取每个票据子图像的票据信息。
128.在一种可能的实施方式中，所述获取模块101包括：
129.第一获取单元，用于根据所述票据图像获取至少一个票据子图像的顶点坐标；
130.第二获取单元，用于根据每个票据子图像的顶点坐标，获取对应的票据子图像；
131.确定单元，用于确定每个票据子图像的票据类型。
132.在一种可能的实施方式中，所述第一获取单元包括：
133.第一处理子单元，用于根据票据识别模型对所述票据图像进行处理，得到所述至少一个票据子图像的顶点坐标；
134.其中，所述票据识别模型是通过多组票据识别样本训练得到的，每组票据识别样本中包括一张样本票据图像和所述样本票据图像上的每个样本票据子图像的顶点坐标。
135.在一种可能的实施方式中，所述确定单元包括：
136.获取子单元，用于获取票据类型信息，根据所述票据类型信息确定对应的票据子图像的票据类型，其中，所述票据图像上包括的票据子图像为一个；或者，
137.第二处理子单元，用于根据票据分类模型对所述票据子图像进行处理，得到所述票据子图像的票据类型，其中，所述票据分类模型是通过多组票据分类样本训练得到的，每组票据分类样本中包括一张样本票据子图像和所述样本票据子图像的票据类型，所述票据图像上包括的票据子图像为一个或多个。
138.在一种可能的实施方式中，所述确定模块102包括：
139.确定单元，用于针对任意票据子图像，根据所述票据子图像的票据类型，确定对应的语义结构模型；
140.处理单元，用于根据所述语义结构模型对所述票据子图像进行处理，得到所述票据子图像的至少一个信息提取区域以及每个信息提取区域对应的信息类型；
141.其中，所述语义结构模型是通过多组语义结构样本训练得到的，每组语义结构样本中包括一张样本票据子图像，所述样本票据子图像上的信息提取区域的顶点坐标，以及每个信息提取区域对应的信息类型，其中，各语义结构样本中的样本票据子图像上的信息提取区域的数量相同，对应的信息提取区域的信息类型也相同。
142.在一种可能的实施方式中，所述处理模块103包括：
143.提取单元，用于针对任意信息提取区域，根据所述信息提取区域，在对应的票据子图像上提取区域图像；
144.识别单元，用于对所述区域图像进行文字识别处理，得到所述区域图像对应的文字信息；
145.第三获取单元，用于根据所述文字信息和对应的信息类型，获取所述信息提取区域对应的票据信息。
146.在一种可能的实施方式中，所述识别单元包括：
147.灰度处理子单元，用于对所述区域图像进行灰度处理，得到对应的灰度区域图像；
148.识别子单元，用于根据文字识别模型对所述灰度区域图像进行处理，得到所述灰度区域对应的文字信息；
149.其中，所述文字识别模型是通过多组文字识别样本训练得到的，每组文字识别样本中包括一张样本灰度区域图像和所述样本灰度区域图像中的样本文字信息。
150.在一种可能的实施方式中，在根据所述票据类型，确定对应的票据子图像的至少一个信息提取区域以及每个信息提取区域的对应的信息类型之前，所述获取模块101还包括：
151.矫正单元，用于根据每个票据子图像的顶点坐标，对所述票据子图像进行方向矫正处理。
152.本申请实施例提供的票据信息的获取装置，用于执行上述方法实施例，其实现原理和技术效果类似，本实施例此处不再赘述。
153.根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。
154.根据本申请的实施例，本申请还提供了一种计算机程序产品，程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
155.图11示出了可以用来实施本申请的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。
156.如图11所示，电子设备1100包括计算单元1101，其可以根据存储在只读存储器(rom)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(ram)1103中的计算机程序，来执行各种适当的动作和处理。在ram 1103中，还可存储设备1100操作所需的各种程序和数据。计算单元1101、rom 1102以及ram 1103通过总线1104彼此相连。输入/输出(i/o)接口1105也连接至总线1104。
157.设备1100中的多个部件连接至i/o接口1105，包括：输入单元1106，例如键盘、鼠标等；输出单元1107，例如各种类型的显示器、扬声器等；存储单元1108，例如磁盘、光盘等；以及通信单元1109，例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
158.计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理，例如票据信息的获取方法。例如，在一些实施例中，票据信息的获取方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1108。在一些实施例中，计算机程序的部分或者全部可以经由rom 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到ram 1103并由计算单元1101执行时，可以执行上文描述的票据信息的获取方法的一个或多个步骤。备选地，在其他实施例中，计算单元1101可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行票据信息的获取方法。
159.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器
可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
160.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
161.在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd
‑
rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
162.为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
163.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
164.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端
‑
服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与vps服务("virtual private server"，或简称"vps")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。
165.应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。
166.上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明
白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：常丽君;谢群义;李煜林;黄聚;岳海潇;刘珊珊;徐杨柳;钦夏孟;姚锟
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：一种砂轮磨槽装置的制作方法
上一篇：一种具有效率高的液相色谱仪的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。