银行对账单信息处理方法、计算机装置和存储介质与流程

文档序号:31539348发布日期:2022-09-16 23:26阅读:306来源:国知局
银行对账单信息处理方法、计算机装置和存储介质与流程

1.本发明涉及银行数字化技术领域,尤其是一种基于ocr和rpa的银行对账单信息处理方法、计算机装置及存储介质。


背景技术:

2.对账工作是银行与客户之间经常进行的工作。例如,在每月月末等特定时间点,银行向在其开户的企业发送当月银行存款对账单,企业的出纳人员将本企业的银行存款日记账与当月银行存款对账单进行逐笔核对,勾对已达账项,找出未达账项,并编制每月银行存款余额调节表。由此可见,对账工作是保障金融安全以及银行与其客户之间的合作畅通的重要手段。
3.传统上对账工作由人工进行,存在效率低、容易出错、容易作弊、对账抽查覆盖率不高等缺点。目前,一些对账技术主要是通过光学字符识别(optical character recognition,ocr)从对账单扫描件识别出字符形式的账单数据,再进行账单数据的对比,因此目前的对账技术的可靠性依赖于光学字符识别的可靠性。但是,收到算法效率和成本等因素的限制,光学字符识别的准确率是有限的,按照目前的水平来看,光学字符识别的准确率能够达到90%已经算是较高的水平,但是银行对账单的数据量巨大,不趋近100%的准确率会产生大量的错误识别结果。而且,光学字符识别识别出错一般会导致对账单中本身正确的金额被识别为不符,由于银行对账单的数据敏感,需要进行重新核对等流程,甚至需要重新核对之前已核对过的数据,造成整体工作效率受限。


技术实现要素:

4.针对目前的对账技术高度依赖人工判断的准确性,以及光学字符识别(ocr)的可靠性,从而有较大可能出错并导致工作效率受限等至少一个技术问题,本发明的目的在于提供一种基于ocr和rpa(robotic process automation,机器人流程自动化)的银行对账单信息处理方法、计算机装置及存储介质。
5.一方面,本发明实施例包括一种银行对账单信息处理方法,包括:
6.rpa机器人从服务端获取对账单扫描图像;
7.rpa机器人从客户端获取对账单记录信息;
8.rpa机器人根据所述账单记录信息对所述账单扫描图像进行核对,获得第一核对结果;
9.rpa机器人根据所述账单扫描图像对所述账单记录信息进行核对,获得第二核对结果。
10.进一步地,所述银行对账单信息处理方法还包括:
11.以所述第一核对结果作为初核结果,以所述第二核对结果作为复核结果;
12.或者
13.以所述第二核对结果作为初核结果,以所述第一核对结果作为复核结果。
14.进一步地,所述银行对账单信息处理方法还包括:
15.当出现异常情况,生成告警信息,包括但不限于邮件、短信等方式;所述异常情况包括所述第一核对结果表明所述账单记录信息与所述账单扫描图像不符、所述第二核对结果表明所述账单扫描图像与所述账单记录信息不符,和/或所述初核结果与所述复核结果不符;
16.向所述服务端和/或所述客户端发送所述告警信息。
17.进一步地,所述根据所述账单记录信息对所述账单扫描图像进行核对,包括:
18.rpa机器人对所述账单扫描图像进行ocr识别,获得字符识别信息;
19.rpa机器人对所述账单扫描图像进行切片,确定所述字符识别信息在所述账单扫描图像中的位置;
20.rpa机器人根据所述字符识别信息在所述账单扫描图像中的位置,确定所述字符识别信息对应的账单项目;
21.rpa机器人将所述字符识别信息与对应同一账单项目的所述账单记录信息进行对比,获得所述第一核对结果;所述第一核对结果具体为所述字符识别信息与所述账单记录信息相符,或者所述字符识别信息与所述账单记录信息不相符。
22.进一步地,所述根据所述账单扫描图像对所述账单记录信息进行核对,包括:
23.rpa机器人按照所述账单扫描图像的格式,对所述账单记录信息进行图像转换,获得转换图像信息;
24.rpa机器人将所述转换图像信息与所述账单扫描图像进行像素对比,获得所述第二核对结果;所述第二核对结果具体为所述转换图像信息与所述账单扫描图像相符,或者所述转换图像信息与所述账单扫描图像不相符。
25.进一步地,所述从服务端获取对账单扫描图像,包括:
26.rpa机器人指示所述服务端编辑生成具有预设格式的账单文档,根据所述账单文档生成所述账单扫描图像;
27.rpa机器人接收所述服务端发送的所述账单扫描图像。
28.进一步地,所述指示所述服务端编辑生成具有预设格式的账单文档,包括:
29.指rpa机器人示所述服务端编辑生成多个账单项目的内容;各所述账单项目组成所述账单文档,各账单项目的内容以预设的字体、颜色、位置排布和/或附加字符进行配置。
30.进一步地,所述指示所述服务端编辑生成具有预设格式的账单文档,还包括:
31.rpa机器人从所述账单文档所包括的多个账单项目中,识别至少一个重点账单项目;
32.rpa机器人将所述重点账单项目以各不相同的字体、颜色、位置排布和/或附加字符进行配置。
33.另一方面,本发明实施例还包括一种计算机装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行实施例中的银行对账单信息处理方法。
34.另一方面,本发明实施例还包括一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行实施例中的银行对账单信息处理方法。
35.本发明的有益效果是:实施例中的银行对账单信息处理方法,通过ocr和rpa结合,
分别以账单记录信息和账单扫描图像作为标准进行相互自动核对,从而获得第一核对结果和第二核对结果共两个核对结果,可以通过两个核对结果互相吻合或者互相矛盾来进行相互校验,相较于单纯以账单记录信息和账单扫描图像中的一者为标准,对另一者进行核对只能获得一个核对结果,实施例中的银行对账单信息处理方法可以提高核对结果的可靠性,同时解决人工对账存在的效率低、容易出错、覆盖面窄等问题。
附图说明
36.图1为实施例中银行对账单信息处理方法的流程图;
37.图2为实施例中的对账单扫描图像的示意图;
38.图3为实施例中的对账单记录信息的示意图;
39.图4为实施例中根据账单记录信息对账单扫描图像进行核对这一步骤的示意图;
40.图5为实施例中根据账单扫描图像对账单记录信息进行核对这一步骤的示意图;
41.图6为实施例中生成具有预设格式的账单文档这一步骤的示意图。
具体实施方式
42.本实施例中,参照图1,银行对账单信息处理方法包括以下步骤:
43.s1.rpa机器人从服务端获取对账单扫描图像;
44.s2.rpa机器人从客户端获取对账单记录信息;
45.s3.rpa机器人根据账单记录信息调用ocr接口对账单扫描图像进行核对,获得第一核对结果;
46.s4.rpa机器人根据调用ocr接口对账单扫描图像与对账单记录信息进行核对,获得第二核对结果。
47.本实施例中,可以由银行开发出服务端和客户端,其中服务端可以由银行的服务器运行,客户端可以安装在银行客户一侧的计算机装置中,或者服务端和客户端均可以由银行的服务器运行,银行客户可以通过手机、笔记本电脑或者平板电脑等终端访问。服务端和客户端也可以集成在同一个应用程序系统中,由银行的服务器运行,其中客户端为与银行客户对接,并供银行客户访问操作的部分,服务端为供银行内部访问操作的部分。
48.本实施例中,客户可以是个人、个体工商户、企事业单位等主体。
49.本实施例中,步骤s1-s4可以由服务端运行,也可以由客户端运行,或者由银行另外设置的服务器运行。
50.步骤s1中,可以由银行打印出纸质对账单,将纸质对账单寄送给客户后,由客户将纸质对账单扫描成对账单扫描图像,将对账单扫描图像上传到服务端;也可以由银行直接将纸质对账单扫描成对账单扫描图像后上传到服务端;也可以由银行直接将编辑好的文档转换成账单扫描图像后上传到服务端,而不经过纸质对账单的打印和扫描的流程。
51.步骤s2中,银行可以在客户端中集成一个银企对账系统,在银企对账系统中存储对账单记录信息。对账单记录信息中可以通过键值对以及文本字符等形式存储账单数据。
52.步骤s3中,以账单记录信息中记录的金额等信息为标准,核对账单扫描图像中的金额等信息是否与账单记录信息相符,即执行步骤s3获得的第一核对结果,其具体状态可以是:账单扫描图像与账单记录信息相符,或者账单扫描图像与账单记录信息不相符。
53.步骤s4中,以账单扫描图像中记录的金额等信息为标准,核对账单记录信息中的金额等信息是否与账单扫描图像相符,即执行步骤s4获得的第二核对结果,其具体状态可以是:账单记录信息与账单扫描图像相符,或者账单记录信息与账单扫描图像不相符。
54.本实施例中,通过执行步骤s3和s4,分别以账单记录信息和账单扫描图像作为标准进行相互核对,从而获得第一核对结果和第二核对结果共两个核对结果,可以通过两个核对结果互相吻合或者互相矛盾来进行相互校验,相较于单纯以账单记录信息和账单扫描图像中的一者为标准,对另一者进行核对只能获得一个核对结果,执行步骤s3和s4可以降低核对过程所使用算法的不可靠性造成的核对结果不可靠性。
55.本实施例中,在执行步骤s1-s4的基础上,还可以执行以下步骤:
56.s5.以第一核对结果作为初核结果,以第二核对结果作为复核结果;
57.或者
58.s6.以第二核对结果作为初核结果,以第一核对结果作为复核结果。
59.其中,可以只执行步骤s5和s6中的一个步骤。
60.步骤s5中,将第一核对结果视为对账单记录信息和账单扫描图像进行核对的初核结果,将第二核对结果视为对账单记录信息和账单扫描图像进行核对的复核结果;步骤s6中则相反,也就是将第二核对结果视为对账单记录信息和账单扫描图像进行核对的初核结果,将第一核对结果视为对账单记录信息和账单扫描图像进行核对的复核结果。
61.步骤s5和s6的原理在于:虽然步骤s3和s4的算法原理不同,但是执行步骤s3和执行步骤s4所能得到的状态,在人类理解的文义角度上是一样的,即如果执行步骤s3得到的第一核对结果为“账单扫描图像与账单记录信息相符”、执行步骤s4得到的第二核对结果为“账单记录信息与账单扫描图像相符”,那么第一核对结果和第二核对结果能够描述同样的事实。同理,如果执行步骤s3得到的第一核对结果为“账单扫描图像与账单记录信息不相符”、执行步骤s4得到的第二核对结果为“账单记录信息与账单扫描图像不相符”,那么第一核对结果和第二核对结果也能够描述同样的事实。因此,可以通过将第一核对结果和第二核对结果的其中一个作为初核结果,另一个作为复核结果,根据初核结果和复核结果所描述的事实是否一致,从而起到相互校验的效果。
62.本实施例中,执行步骤s1所获得的对账单扫描图像的一种形态如图2所示,执行步骤s2所获得的对账单记录信息的一种形态如图3所示。其中,对账单记录信息可以通过数据表等数据存储形式存储,图3是对账单记录信息被读取出来显示之后所展示出的形式。
63.本实施例中,在执行步骤s3,也就是根据账单记录信息对账单扫描图像进行核对这一步骤时,具体可以执行以下步骤:
64.s301.rpa机器人对账单扫描图像进行ocr识别,获得字符识别信息;
65.s302.rpa机器人对账单扫描图像进行切片,确定字符识别信息在账单扫描图像中的位置;
66.s303.rpa机器人根据字符识别信息在账单扫描图像中的位置,确定字符识别信息对应的账单项目;
67.s304.rpa机器人将字符识别信息与对应同一账单项目的账单记录信息进行对比,获得第一核对结果。
68.步骤s301-s304的原理如图4所示。
69.参照图4,步骤s301中,rpa机器人对账单扫描图像进行ocr识别,能够识别出字符识别信息,例如图4,账单扫描图像中“26020”这串数字所在的区域经过光学字符识别后,能够获得字符串“26020”。
70.步骤s302中,rpa机器人通过对账单扫描图像进行切片,确定字符串“26020”对应账单扫描图像中的位置,从而在步骤s303中,确定字符识别信息即字符串“26020”对应的账单项目,是账单记录信息中的e3栏。
71.步骤s304中,rpa机器人将字符识别信息即字符串“26020”与账单记录信息中的e3栏的值进行对比,从而获得第一核对结果,即字符识别信息与账单记录信息相符,或者字符识别信息与账单记录信息不相符。
72.本实施例中,在执行步骤s4,也就是根据账单扫描图像对账单记录信息进行核对这一步骤时,具体可以执行以下步骤:
73.s401.rpa机器人按照账单扫描图像的格式,对账单记录信息进行图像转换,获得转换图像信息;
74.s402.rpa机器人将转换图像信息与账单扫描图像进行像素对比,获得第二核对结果。
75.步骤s401-s402的原理如图5所示。
76.步骤s401中,参照图5,rpa机器人将数据表格式的账单记录信息按照账单扫描图像的格式进行图像转换,从而获得转换图像信息。当转换图像信息显示出来后,转换图像信息所显示的内容与账单扫描图像具有相同的格式,具体地,转换图像信息中所使用的字距、行距、表格尺寸、字体类型、字体大小等排版格式参数与账单扫描图像相同。
77.步骤s402中,参照图5,rpa机器人将转换图像信息与账单扫描图像进行像素级别的对比。具体地,以只有黑白两种颜色的转换图像信息与账单扫描图像为例,图像中有字迹处的像素为黑色,像素值为0或者接近0的数值,没有字迹处的像素为白色,像素值为255或者接近255的数值,因此通过将转换图像信息与账单扫描图像进行相同位置像素值的对比,可以确定转换图像信息与账单扫描图像相同位置处的像素颜色是否相同,如果转换图像信息与账单扫描图像的一个对应相同位置区域内,各个像素点的像素值处处对应相同,那么转换图像信息与账单扫描图像的这个区域内则记录了相同的符号。如果转换图像信息与账单扫描图像的一个对应相同位置区域内记录了不同的符号,例如转换图像信息的这个位置记录了数字“1”,账单扫描图像的这个位置记录了数字“2”,由于字体相同时数字“1”和数字“2”的笔迹重叠区域较小,那么转换图像信息与账单扫描图像的这个区域内,像素值对应相同的像素点的数量占总像素数的比例就较低,因此可以通过设置合适的比例阈值,来判断转换图像信息与账单扫描图像的对应相同位置区域内,是否记录了相同的内容。
78.步骤s402中,如果转换图像信息与账单扫描图像的任意对应相同位置区域内,像素值对应相同的像素点的数量占总像素数的比例达到了比例阈值,那么第二核对结果就是“转换图像信息与账单扫描图像相符”,反之,第二核对结果就是“转换图像信息与账单扫描图像不相符”。
79.本实施例中,在执行步骤s1,也就是从服务端获取对账单扫描图像这一步骤时,具体可以执行以下步骤:
80.s101.rpa机器人指示服务端编辑生成具有预设格式的账单文档,根据账单文档生
成账单扫描图像;
81.s102.rpa机器人接收服务端发送的账单扫描图像。
82.步骤s101中,rpa机器人可以指示服务端通过虚拟打印的方式,将图4所示的a1、a2、a3、a4、b1、b2
……
等多个账单项目的内容,打印成为账单文档,其中账单文档具有预设格式。然后通过虚拟扫描的方式,将账单文档扫描成为账单扫描图像。也可以指示服务端通过打印机实际打印的方式,将图4所示的多个账单项目的内容打印在纸上成为账单文档,然后通过扫描仪实际扫描的方式,将账单文档扫描成为账单扫描图像。
83.本实施例中,账单文档具有预设格式,即根据账单文档生成的账单扫描图像,通过打印或者显示器显示等方式展示时,其内容具有特定的排版格式,包括特定的字体、颜色、位置排布和/或附加字符等形式。
84.例如,参照图6,按照行业惯例等规则,从账单文档所包括的多个账单项目中,识别出“借方”、“贷方”和“余额”等重点账单项目,这些重点账单项目是需要重点核对的账单项目,而其他账单项目则是相对不重要的普通账单项目。在生成账单文档时,将“借方”、“贷方”和“余额”等重点账单项目的内容以各不相同的字体、颜色、位置排布和/或附加字符等参数进行配置。例如,对于“借方”这一重点账单项目,其中的“0”、“23000”、“10.8”等内容配置为楷体、无加黑、无附加字符;对于“贷方”这一重点账单项目,其中的“49000”、“0”、“0”等内容配置为宋体、加黑、无附加字符;对于“余额”这一重点账单项目,其中的“49020”、“26020”、“26009.20”等内容配置为宋体、无加黑、附加字符

。这样,根据账单文档能够生成图6所示的账单扫描图像,而由于在执行步骤s401时,按照账单扫描图像的格式对账单记录信息进行图像转换,获得转换图像信息,所得到的转换图像信息的显示效果如图6所示,其中的“借方”、“贷方”和“余额”等重点账单项目的内容也具有特定的字体、颜色、位置排布和/或附加字符。
85.通过执行步骤s101-s102,生成的账单扫描图像与转换图像信息中,至少重点账单项目的内容也具有特定的字体、颜色、位置排布和/或附加字符,在特定的字体、颜色、位置排布和/或附加字符的辅助下,能够产生更丰富的像素特征供像素点比对算法进行识别,从而在执行步骤s402,将转换图像信息与账单扫描图像进行像素对比,获得第二核对结果时,更容易获得准确的第二核对结果。
86.进一步地,当重点账单项目的内容具有特定的字体、颜色、位置排布和/或附加字符等预设格式,而且普通账单项目不具有这样的预设格式,由于重点账单项目的内容能够产生更丰富的像素特征供像素点比对算法进行识别,在同样的计算机环境和资源投入下,在执行步骤s402,将转换图像信息与账单扫描图像进行像素对比时,重点账单项目的内容能够相对获得像素点比对算法更多的注意,从而相对提高对转换图像信息与账单扫描图像中的重点账单项目的比对准确率。
87.本实施例中,通过执行步骤s301-s304以及s401-s402,采用了不同的算法执行步骤s3和s4,也就是采用了不同的算法,分别根据账单记录信息对账单扫描图像进行核对,获得第一核对结果,以及根据账单扫描图像对账单记录信息进行核对,获得第二核对结果,可以综合光学字符识别和像素对比两种算法的优点,相对于使用单一算法进行核对,具有更低的不确定性。
88.本实施例中,在执行步骤s1-s5或者s1-s6的基础上,还可以执行以下步骤:
89.s7.当出现异常情况,生成告警信息;
90.s8.向服务端和/或客户端发送告警信息。
91.步骤s7中,异常情况可以是指以下任一种情况:
92.(1)第一核对结果表明账单记录信息与账单扫描图像不符;
93.(2)第二核对结果表明账单扫描图像与账单记录信息不符;
94.(3)初核结果与复核结果不符。
95.其中,第(1)种情况表明通过光学字符识别算法发现了对账不符,第(2)种情况表明通过像素对比算法发现了对账不符,即第(1)种情况和第(2)种情况都属于对账不符的异常情况。第(3)种情况表明通过光学字符识别算法获得的对账结果与通过像素对比算法获得的对账结果发生冲突,例如通过光学字符识别算法发现了对账不符,但是通过像素对比算法没有发现对账不符,或者通过光学字符识别算法没有发现对账不符,但是通过像素对比算法发现了对账不符,这表明步骤s3和s4中的至少一个步骤存在问题,所获得的对账结果可信度低。对于以上几种异常情况,可以将告警信息发送至服务端和客户端中的至少一个终端,从而让银行和客户获知,进行进一步的复核工作。
96.可以通过编写执行本实施例中的银行对账单信息处理方法的rpa机器人程序,将该程序写入至计算机装置或者存储介质中,当程序被读取出来运行时,执行本实施例中的银行对账单信息处理方法,从而实现与实施例中的银行对账单信息处理方法相同的技术效果。
97.需要说明的是,如无特殊说明,当某一特征被称为“固定”、“连接”在另一个特征,它可以直接固定、连接在另一个特征上,也可以间接地固定、连接在另一个特征上。此外,本公开中所使用的上、下、左、右等描述仅仅是相对于附图中本公开各组成部分的相互位置关系来说的。在本公开中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。此外,除非另有定义,本实施例所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。本实施例说明书中所使用的术语只是为了描述具体的实施例,而不是为了限制本发明。本实施例所使用的术语“和/或”包括一个或多个相关的所列项目的任意的组合。
98.应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种元件,但这些元件不应限于这些术语。这些术语仅用来将同一类型的元件彼此区分开。例如,在不脱离本公开范围的情况下,第一元件也可以被称为第二元件,类似地,第二元件也可以被称为第一元件。本实施例所提供的任何以及所有实例或示例性语言(“例如”、“如”等)的使用仅意图更好地说明本发明的实施例,并且除非另外要求,否则不会对本发明的范围施加限制。
99.应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
100.此外,可按任何合适的顺序来执行本实施例描述的过程的操作,除非本实施例另
外指示或以其他方式明显地与上下文矛盾。本实施例描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
101.进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、ram、rom等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本实施例所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。
102.计算机程序能够应用于输入数据以执行本实施例所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
103.以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1