一种二次录入不一致的仲裁方法及装置制造方法

文档序号:6632197阅读:197来源:国知局
一种二次录入不一致的仲裁方法及装置制造方法
【专利摘要】本发明实施例公开了一种二次录入不一致的仲裁方法及装置,其中的方法可包括:检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据的两次输入,对应的原始影像为所述两次录入信息所依据的凭证的扫描影像;对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数;根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示。采用本发明可减少人工观测的内容,精准的展示了校验结果,提升了仲裁效率和仲裁结果的准确性,实现快速仲裁。
【专利说明】一种二次录入不一致的仲裁方法及装置

【技术领域】
[0001]本发明涉及图文识别【技术领域】。尤其涉及一种二次录入不一致的仲裁方法及装置。

【背景技术】
[0002]OCR (Optical Character Recognit1n,光学字符识别)是通过扫描等光学输入方式将各种票据、书籍等文本资料进行扫描,将文本信息转化为图像信息,然后通过字符识别技术对图像信息进行分析处理,最终转化为计算机文字录入到电脑中的技术过程。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。
[0003]在银行日常业务的票据资料处理中,存在大量的数字、文字录入工作,而在纸质资料电子化过程中,为保证票据录入结果的正确性,必须对录入的内容进行核对。现有的核对手段以二次录入校验为主,即同一段资料输入两次(由同一个人或者不同人),输入后由计算机逐笔核对,凡不一致的则拒绝接受,对于二次录入校验不一致的部分,仲裁过程主要是:计算机分别展示两次录入的完整内容;第三人观察两次录入不一致的部分,并根据录入内容所依据的纸质凭证的原始扫描影像中相对应的部分,仲裁选择其认为正确的录入结果。该方法是由计算机直接展示票据的完整影像供人工直接观测作为仲裁依据,但受限于现有技术,人工对两次录入的完整内容进行阅读,信息量多、观测时间长,增加了辨识难度和工作量。


【发明内容】

[0004]本发明实施例所要解决的技术问题在于,提供一种二次录入不一致的仲裁方法及装置,通过标识二次录入不一致的内容,提取对应原始影像中的内容并进行突出展示从而减少操作人员的二次录入仲裁的工作量,提高仲裁效率。
[0005]第一方面,本发明实施例提供了一种二次录入不一致的仲裁方法,包括:
[0006]检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据的两次输入,对应的原始影像为所述两次录入信息所依据的凭证的扫描影像;
[0007]对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数;
[0008]根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示。
[0009]第二方面,本发明实施例提供了一种二次录入不一致的仲裁装置,包括:
[0010]信息检测模块,用于检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据的两次输入,对应的原始影像为所述两次录入信息所依据的凭证的扫描影像;
[0011]信息校验模块,用于对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数;
[0012]标识展示模块,用于根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,并用于根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示。
[0013]实施本发明实施例,具有如下有益效果:
[0014]本发明实施例,通过在二次录入不一致的仲裁过程当中,将二次录入不一致的信息中的不一致部分进行鲜明标识和展示,并对二次录入不一致的信息所对应的原始影像资料进行影像定位、展示,减少人工观测的内容,精准的展示了校验结果,提升了仲裁效率和仲裁结果的准确性,实现快速仲裁。

【专利附图】

【附图说明】
[0015]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是本发明实施例中的一种二次录入不一致的仲裁方法的流程示意图;
[0017]图2是本发明实施例中的另一种二次录入不一致的仲裁方法的流程示意图;
[0018]图3是本发明实施例中的客户所填写的银行汇款票据示意图;
[0019]图4是本发明实施例中的客户所填写的银行汇款票据示意图对应的原始影像模板图;
[0020]图5是本发明实施例中的客户所填写的银行汇款票据的坐标示意图;
[0021]图6是本发明实施例中的一种二次录入不一致的仲裁装置的结构示意图;
[0022]图7是本发明实施例中的另一种二次录入不一致的仲裁装置的结构示意图;
[0023]图8是本发明实施例中的另一种二次录入不一致的仲裁装置的信息仲裁模块中坐标确定单元的结构示意图;
[0024]图9是本发明实施例中的另一种二次录入不一致的仲裁装置的信息仲裁模块中影像展示单元的结构示意图。

【具体实施方式】
[0025]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0026]需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或者所有可能组合。
[0027]本发明实施例的二次录入不一致的仲裁方案可以应用于银行票据、商场收据等任何机构所涉及到的纸质档案的校验仲裁过程。
[0028]下面将结合附图1-附图2,对本发明实施例中的二次录入不一致的仲裁方法进行详细介绍。图1是本发明实施例中的一种二次录入不一致的仲裁方法的流程示意图,如图所示本实施例中的二次录入不一致的仲裁方法可以包括以下步骤SlOl-步骤S103。
[0029]步骤SlOl:检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像。
[0030]具体地,当检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据在电脑等设备上的两次输入。输入时,可由同一操作人员在电脑等设备上输入两次,也可由不同的操作人员在电脑等设备上各输入一次,其中凭证可以是银行票据、商场的销售单据,也可以是任何机构的任何业务纸质档案。对应的原始影像为所述两次录入信息所依据的凭证的扫描影像,即通过扫描等光学输入方式对该凭证进行扫描,将纸质凭证材料转换为对应的完整的图像信息并输入到在电脑等设备中。需要说明的是,所述采集两次录入信息可以是两次录入不一致部分的信息也可以是两次录入的所有信息。
[0031]步骤S102:对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数。
[0032]具体地,将步骤SlOl中采集到的两次录入信息进行逐一比对,获取不一致信息部分的位置参数,其中位置参数表示该不一致信息在所述二次录入信息中的相对位置。
[0033]步骤S103:根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和关出展不。
[0034]具体地,根据步骤S102中获取的所述两次录入信息中不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,例如,一致信息部分使用正常的黑色,则不一致信息部分使用蓝色或红色进行标识;根据步骤S102中获取的所述两次录入信息中不一致部分的位置参数即根据不一致部分信息在二次录入信息中的相对位置将对应的原始影像中所述不一致部分进行定位和突出展示。
[0035]本发明实施例,通过在二次录入不一致的仲裁过程当中,将二次录入不一致的信息中的不一致部分进行鲜明标识和展示,并对二次录入不一致的信息所对应的原始影像资料进行影像定位、展示,减少人工观测的内容,精准的展示了校验结果,提升了仲裁效率和仲裁结果的准确性,实现快速仲裁。
[0036]图2是本发明实施例中的另一种二次录入不一致的仲裁方法的流程示意图,如图所示本实施例中的另一种二次录入不一致的仲裁方法可以包括以下步骤S201-步骤S219。
[0037]步骤S201:检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像。
[0038]具体地,当检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据在电脑等设备上的两次输入。输入时,可由同一操作人员在电脑等设备上输入两次,也可由不同的操作人员在电脑等设备上各输入一次,其中凭证可以是银行票据、商场的销售单据,也可以是任何机构的任何业务纸质档案。对应的原始影像为所述两次录入信息所依据的凭证的扫描影像,即通过扫描等光学输入方式对该凭证进行扫描,将纸质凭证材料转换为对应的完整的图像信息并输入到在电脑等设备中。所述采集两次录入信息可以是采集同一张凭证的两次录入的所有字符串也可以是采集同一张凭证的两次录入不一致的字符串,其中一张凭证上包含至少一段字符串,字符串中又包含至少一个字符,字符可以是阿拉伯数字,汉字,英文字母,或者其它各类符号等。需要说明的是所述两次录入信息包括至少一个字符串,其中字符串包括至少一个字符。
[0039]例如,图3为客户所填写的银行汇款票据示意图,在该应用实施例中,包含了 A、B、C、D、E、F、G、H、1、J的10段字符串,例如,汇款办理用户的申请用户姓名为A,年月日分别为B、C、D,汇款账号填写为E,汇入账号为F,大写金额为G,小写金额为H,汇入银行名称为I,收款人姓名为J。其中各段字符串中又包含了至少一个的字符,对该10段字符串分别进行两次录入,当整张票据上的填写信息两次录入完毕时,检测到有录入信息不一致时,例如是H段和I段不一致时,采集H段和I段的两次录入字符串或者采集该票据上所有的两次录入字符串,以备下一步使用。
[0040]步骤S202:将所述采集的两次录入信息以字符串为单位从首位字符开始逐位进行比对。
[0041]具体地,将步骤S201中采集到的两次录入信息以字符串为单位,从首位字符开始逐位进行比对。
[0042]例如,在图3的应用实施例中,当在步骤S201中采集的是两次录入不一致的字符串H和I的录入信息时,即对该两段字符串的两次录入进行分别比对,当在步骤S201中采集的是该票据的所有字符串的两次录入信息时,则对所有字符串的两次录入进行比对,即对A、B、C、D、E、F、G、H、1、J的两次录入进行比对,且是从各对应字符串的首位字符开始逐位进行比对。
[0043]步骤S203:根据所述比对结果生成所述两次录入信息中不一致字符串中不一致字符的位置参数n (k)。
[0044]具体地,根据步骤S202的比对结果,统计所述两次输入不一致字符串的详细参数,包括同一字符串的两次输入的最大字符数n,当比对结果为其中第k位字符录入不一致时则记为n (k),其中n、k为大于等于I的正整数且η大于等于k,需要说明的是,当两次输入的同一段字符串的长度不一致时,例如某一段字符串的第一次或第二次录入少输或者多输时,则记录其中字符总数较大的字符数n,按照同样的方法进行逐位对比,其中小于η位的字符串中不足的位数以空格计算。
[0045]例如,在图3的应用实施例中,假设根据步骤S202中的比对结果检测到第H段中一共有6个字符,假设从字符的首位开始第三位字符两次录入不一致则其不一致字符的位置参数n(k)可记为H6(3),第I段中有19个字符,假设从字符的首位开始第五位和第八位字符两次录入不一致,则其不一致的位置参数n (k)可记为119(5)和119(8)。
[0046]步骤S204:记录所述两次录入信息中字符串中不一致字符的位置参数n (k)。
[0047]具体地,将步骤S203中计算生成的两次录入信息中所有的两次输入不一致的字符串中不一致字符的位置参数n (k)分别记录下来并进行存储。
[0048]例如,在图3的应用实施例中,记录下不一致的字符串中不一致字符的位置参数H6(3)、119(5)和119 (8),并存储到相应数据库当中。
[0049]步骤S205:将所述两次录入信息中不一致部分相对应的字符串进行上下对齐展示,且字符串中的字符从首位到第η位逐位对齐。
[0050]具体地,根据步骤S202中的比对结果将同一张凭证上的两次录入信息中不一致部分相对应的不一致字符串进行对齐展示,例如一张凭证一共有八段字符串,经过信息校验得到两次录入有二段字符串的两次录入不一致,则将该二段字符串对应的两次输入字符串进行上下对齐且字符串中的字符从首位开始到第η位进行逐位对齐并展示。
[0051]例如,在图3的应用实施例中,将第H段的字符串的两次输入进行上下对齐,且两个字符串的字符从首位到第六位逐位对齐;将I段的字符串的两次输入进行上下对齐,且两个字符串的字符充首位到第十九位逐位对齐。需要说明的是当字符串的两次输入不一致的类型包含少输或者多输的情况,假设H段字符串第一次输入的是123456,第二次输入是12356时,此时仍然按照字符从首位到第六位逐位对齐的方式,第二次输入的五位不足六位时,第六位以空格代替,此时两次输入不一致字符的位置参数应为Η6 (4),Η6(5)和Η6(6),反过来第一次少输也是同样的处理和记录方式。
[0052]步骤S206:根据所述不一致字符的位置参数n (k),将所述对齐展示的字符串相对应的位置参数n(k)所对应的不一致字符以鲜明颜色进行标注并展示。
[0053]具体地,根据步骤S204中得到的不一致字符的位置参数n (k)将所述对齐展示的字符串相对应的位置参数n(k)所对应的不一致字符以鲜明颜色进行标注并展示。例如一致字符部分使用正常的黑色,则不一致字符部分使用蓝色或红色进行标识,假设其中一个字符串有2个字符不一致,则将该字符串的两次输入的其中不一致的2个字符分别进行标识,即一共标识4处。其中鲜明颜色表示与正确字符能够显著区分的颜色,可仅仅只对字符本身进行颜色标识,也可以对该字符所在的矩形区域进行标识。
[0054]例如,在图3的应用实施例中,根据步骤S204中所得到的不一致字符的位置参数H6 (3)、119 (5)、119 (8)将H段的两次输入字符串中的第三位(即两处)和I段的两次输入字符串中的第五位、第八位(即四处)进行鲜明颜色,例如用红色或蓝色等进行标注并展
/Jn ο
[0055]步骤S207:预先录入两次录入信息所对应的原始影像模板。
[0056]具体地,预先录入两次录入信息所对应的原始影像模板,其中原始影像模板为对应原始影像所依据的凭证未录入信息前的1:1大小的版面图,即为票据凭证的纸质材料在未填写信息之前录入的完整模板。例如,银行、商场或者其它机构的凭证通常都具有预定的模板,对于在业务中会使用到的各种不同的模板预先将其录入到模板库当中以备调用。
[0057]例如,在图3的应用实施例中,图4为图3汇款票据的预先录入的原始影像模板,将模板录入模板库,以备业务需要时调用。
[0058]步骤S208:预先测定并保存录入信息区域在所述原始影像模板上的区域坐标。
[0059]具体地,预先测定并保存步骤S207中所录入的各个模板上需录入信息区域在所述对应的原始影像模板上的区域坐标,包括凭证上各个字符串填写区域在在原始影像中的区域坐标。需要说明的是若模板中包含带有规则的方格、方框等模块化的区域,则测定各个方格、方框的具体的区域坐标并保存。
[0060]例如,在图3的应用实施例中,将图3中的票据对应的原始影像模板图4中需要填写的项目预先进行区域坐标的测定和录入,即测定A、B、C、D、E、F、G、H、1、J字符串所需填写位置的区域坐标,例如测定结果为 A(xal, jal, xa2, ya2), B(xbl, ybl, xb2, yb2), C(xcl, ycl, xc2,yc2),D(xdl,ydl j xd2,yj ? E (xel? yel,xe2,ye2),F(xfl,yfl,xf2,yf2),G(xgl,ygl,xg2,yg2),H(xhl,yhi?xh2?yh2),I (Xii,Υπ? χ?2? yi2),J(χ」ι,yn’ χj2^ y^),例如其中A字符串的区域坐标的含义代表由直线X = Xal,X = Xa2,y = ial,I = ya2的四条曲线围城的矩形区域,以此类推其他的字符串的区域坐标也是同样的定义方法。需要说明的是,由于H段字符串所填写的位置的区域含有规则的方格,即测定各个方格的具体的区域坐标并记录保存。
[0061]步骤S209:调用与所述两次录入信息相匹配的原始影像模板以获取录入信息区域在所述原始影像模板上的区域坐标。
[0062]具体地,调用步骤S208中所预先测定的录入信息区域在所述原始影像模板上的区域坐标。其中可以调用凭证的原始影像模板上所有录入字符串的区域坐标,也可以只调用含有不一致字符的字符串的录入区域坐标。
[0063]例如,在图3的应用实施例中,调用图4中所述两次录入信息相匹配的原始影像模板中的字符串录入的区域坐标,即可调用A、B、C、D、E、F、G、H、1、J的区域坐标也可以只调用H和I的区域坐标。
[0064]步骤S210:判断所述两次录入信息中不一致的字符串中的字符的区域坐标是否模块化。
[0065]具体地,根据步骤S209所调用得到的区域坐标,可以判断得到信息填写录入区域是否已经被模块化,所述模块化表示以固定大小格式填写所述两次录入信息中的字符。一般地,银行票据上的小写金额以阿拉伯数据为主,各位数字都有固定填写的空格,一个数字一个空格,其对应区域坐标已经被录入模板中。例如在图3中所示的H段字符串中所填入的小写金额区域即为模块化区域坐标,其余的A、B、C、D、E、F、G、1、J即为非模块化区域。
[0066]例如,在图3的应用实施例中,将调用获取的图4中的区域坐标!!“!^^!^^!^^!^)和I(Xil,yn,Xi2,yi2))进行判断,根据事先录入的区域坐标可以直接判断H段和I段录入区域坐标是否是模块化区域坐标。
[0067]步骤S211:如判断结果为模块化,则获取模板中对应的字符的模块化的区域坐标。
[0068]具体地,根据步骤S210中所判断的结果获取模板中对应的字符的模块化的区域坐标,例如在图5的票据中字符串H所填写区域坐标为H(xhl,yhl, xh2, yh2),但是因为该区域坐标为模块化区域坐标,用户根据该模块化区域坐标填写数据的时候必然是限定在方框内,所以获取该字符串区域坐标中的每一个字符的模块化区域坐标。
[0069]例如,在图3的应用实施例中,经过判断后的H段为模块化区域坐标,则直接获取H段字符串的每一个字符的模块化的区域坐标氏、H2、H3> H4, H5, H6, H7, H8, H9, Hltl,其中H1-Hw表示H段字符串中10个模块化的字符区域坐标。
[0070]步骤S212:根据所述字符串中不一致字符的位置参数n(k)并结合所述字符的模块化的区域坐标,确定不一致字符的区域坐标。
[0071]具体地,根据步骤S203中生成的所述字符串中不一致字符的位置参数n(k),并结合步骤S211中获取的字符的模块化的区域坐标,确定不一致字符的区域坐标。
[0072]例如,在图3的应用实施例中,由于H段字符串的两次录入的结果中检测到第三个字符不一致,即直接调用H3的坐标,从而确定不一致字符的区域坐标。需要说明的是,在一些特殊的情况中,例如小写金额不同于其它汉字的字符串,一般字符串是从左往右开始顶格写,但小写金额是从右往左开始顶格写,即将该小写金额的字符串区域坐标从左往右开始分割从而得到字符区域坐标。
[0073]步骤S213:若判断结果为非模块化,则获取模板中对应的非模块化的两次录入信息字符串的区域坐标M。
[0074]具体地,根据步骤S210的判断结果,即当结果为非模块化时,获取步骤S209中录入不一致信息区域在所述原始影像模板上的区域坐标。
[0075]例如,在图3的应用实施例中,获取如图5所示的客户所填写的银行汇款票据的坐标示意图中I段字符串的区域坐标I (xn,yn,xi2, yi2)。
[0076]步骤S214:根据区域坐标M并结合OCR识别技术进一步确认原始影像中录入信息区域中已填写的字符串的区域坐标M’。
[0077]具体地,根据步骤S213中确认的区域坐标M,并利用OCR技术对原始影像中录入信息的区域进行识别,进一步缩小并确认原始影像中已填写字符串的区域坐标M’。
[0078]例如,在图3的应用实施例中,根据步骤S213在图5中所确认的录入信息区域I (xn,yn,xi2? yi2)经过OCR识别技术检测到其中I’(xn’ , yn’ , xi2’ , yi2’)的区域填写有字符串,确认并记录I’。
[0079]步骤S215:根据字符串的总字符数n,从字符串中字符的排列方向将所述已填写的字符串的区域坐标M’平均分割为η块以确定字符串中字符的区域坐标。
[0080]具体地,根据字符串的总字符数η,从字符串中字符的排列方向将所述步骤S214中获取的已填写的字符串的区域坐标Μ’平均分割为η块以确定字符串中字符的区域坐标。由于同一个人笔迹特征是字符宽度大体一致,所以对于字符填写区域根据字数平均划分,得到每个字符的区域坐标具有较高的准确性。
[0081]例如,在图3的应用实施例中,根据录入结果得知I段字符串的字符总数为η,则其中第 k 位字符所在区域坐标为 I’ (xn,+(xi2,-Xn' )/n*k, yn’,xn’ +(xi2,_χη’ )/n*(k_l),yi2’),将k从I到n代入到区域坐标的表达式中即可得到I段字符串中所有字符的区域坐标。
[0082]步骤S216:根据所述字符串中不一致字符的位置参数n(k)并结合所述已确定的字符串中字符的区域坐标,得到所述不一致字符的区域坐标。
[0083]具体地,根据步骤S215中确定的字符串中各个字符的区域坐标,并结合步骤S203中确定的所述字符串中不一致字符的位置参数n(k),即可以确定字符串中不一致字符的区域坐标。
[0084]例如,在图3的应用实施例中,根据步骤S203中的n(k)和步骤S215中确定的字符串中各个字符的区域坐标,得到第五位不一致字符所在的区域坐标为:I’ (xn,+(xi2,-Xil' )/19*5,yn’ , xn,+(xi2,_xn’ )/19* (5-1), yi2’),第八位不一致字符所在的区域坐标为:1’ (xn,+(xi2,-xn’ )/19*8, yn’,xn’ +(xi2,_xn’ )/19* (8-1),yi2’)。
[0085]步骤S217:根据所述确定的不一致字符的区域坐标,提取所述原始影像中相对应的不一致字符的区域坐标所对应的突出影像。
[0086]具体地,根据步骤S216中确定的不一致字符的区域坐标,提取所述原始影像中相对应的不一致字符的区域坐标所对应的突出影像。
[0087]例如,在图3的应用实施例中,将I段字符串的第五位和第八位的字符所对应的原始影像中的相应区域进行突出展示。
[0088]步骤S218:将所述提取后的原始影像中相对应的不一致字符的区域坐标所对应的突出影像按比例进行多级范围扩大展示。
[0089]具体地,将步骤S217中提取的原始影像中相对应的不一致字符的区域坐标所对应的突出影像按比例进行多级范围扩大展示,所述多级范围包括所述不一致字符的区域坐标到不一致字符所在字符串的完整区域坐标。由于客户填写字体不可能严格均匀,极端情况下定位差错较大,用户可选择放大至包含完整信息的区域M进行展示,如果区域坐标M不准确,可再次放大至凭证全影像。但以上为极端情况,实际业务中由于银行票据的严肃性,以及需要二次录入的都是重要信息,填写规范性好,出现以上情况较少,对本发明方法的整体易用性影响较小。
[0090]例如,在图3的应用实施例中,可根据算法将突出影像从第三个字符扩展到第三、四、五个字符,也可根据需求,放大到整个I段字符串,甚至可以选择放大至整个票据。即在展示时可在算法中适度扩大区域以便对定位失误或人工书写超过模板区域进行容错。
[0091]步骤S219:将所述进行标识的两次录入信息中不一致部分和所述进行突出展示的两次录入信息中不一致部分所对应的原始影像进行同时展示并对比。
[0092]具体地,将步骤S206中生标识的两次录入信息中不一致字符串中的不一致字符和步骤S218中进行突出展示的两次录入信息中不一致部分所对应的原始影像进行同时展示和比对,便于工作人员进行判断和仲裁,减少工作量增加工作效率。
[0093]例如,在图3的应用实施例中,将H段和I段的字符串的两次输入不一致的标识部分和对应的原始影像中进行突出展示的部分,进行同时展示并对比,便于操作人员进行仲裁。
[0094]本发明实施例,通过在二次录入不一致的仲裁过程当中,将二次录入不一致的信息中的不一致部分进行鲜明标识和展示,并对二次录入不一致的信息所对应的原始影像资料进行影像定位、展示,减少人工观测的内容,精准的展示了校验结果,提升了仲裁效率和仲裁结果的准确性,实现快速仲裁。
[0095]图6是本发明实施例中的一种二次录入不一致的仲裁装置的结构示意图;用以执行上述图1所示实施例的一种二次录入不一致的仲裁方法的流程。
[0096]下面将结合附图6,对本发明实施例中的一种二次录入不一致的仲裁装置的结构进行详细介绍。该装置可包括:信息采集模块101、信息校验模块102和信息仲裁模块103。
[0097]信息采集模块101,用于检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像。
[0098]具体地,当检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据在电脑等设备上的两次输入。输入时,可由同一操作人员在电脑等设备上输入两次,也可由不同的操作人员在电脑等设备上各输入一次,其中凭证可以是银行票据、商场的销售单据,也可以是任何机构的任何业务纸质档案。对应的原始影像为所述两次录入信息所依据的凭证的扫描影像,即通过扫描等光学输入方式对该凭证进行扫描,将纸质凭证材料转换为对应的完整的图像信息并输入到在电脑等设备中。需要说明的是,所述采集两次录入信息可以是两次录入不一致部分的信息也可以是两次录入的所有信息。
[0099]信息校验模块102,用于对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数。
[0100]具体地,将信息采集模块101中采集到的两次录入信息进行逐一比对,获取不一致信息部分的位置参数,其中位置参数表示该不一致信息在所述二次录入信息中的相对位置。
[0101]信息仲裁模块103,用于根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示。
[0102]具体地,根据信息校验模块102中获取的所述两次录入信息中不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,例如,一致信息部分使用正常的黑色,则不一致信息部分使用蓝色或红色进行标识;根据信息校验模块102中获取的所述两次录入信息中不一致部分的位置参数即根据不一致部分信息在二次录入信息中的相对位置将对应的原始影像中所述不一致部分进行定位和突出展示。
[0103]本发明实施例,通过在二次录入不一致的仲裁过程当中,将二次录入不一致的信息中的不一致部分进行鲜明标识和展示,并对二次录入不一致的信息所对应的原始影像资料进行影像定位、展示,减少人工观测的内容,精准的展示了校验结果,提升了仲裁效率和仲裁结果的准确性,实现快速仲裁。
[0104]图7是本发明实施例中的另一种二次录入不一致的仲裁装置的结构示意图;用以执行上述图2所示实施例的另一种二次录入不一致的仲裁方法的流程。
[0105]下面将结合附图7-附图9,对本发明实施例提供的另一种二次录入不一致的仲裁装置的结构进行详细介绍。该装置可包括:信息采集模块101、信息校验模块102和信息仲裁模块103。其中信息校验模块102可包括:对比单元1021、参数生成单元1022和记录单元1023 ;所述信息仲裁模块103可包括:展示单元1031、标识展示单元1032、模板录入单元1033、模板测定单元1034、模板调用单元1035、坐标确定单元1036、影像展示单元1037和仲裁单元1038。所述坐标确定单元1036包括:判断子单元1361、第一坐标获取子单元1362、第一坐标确定子单元1363、第二坐标获取子单元1364、OCR识别子单元1365、字符分割子单元1366和第二坐标确定子单元1367 ;所述影像展示单元1037可包括:影像提取子单元1371和扩大展示子单元1372。
[0106]图7中信息采集模块101,用于检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像。
[0107]其中装置中的101信息采集模块可以执行并完成方法步骤S201中的所有方法和流程,在此不再赘述。
[0108]图7中信息校验模块102可包括:对比单元1021、参数生成单元1022和记录单元1023。
[0109]对比单元1021,用于将所述采集的两次录入信息以字符串为单位从首位字符开始逐位进行比对;
[0110]参数生成单元1022,用于根据所述比对结果生成所述两次录入信息中不一致字符串中不一致字符的位置参数n (k),其中η表示两次录入信息中两次录入的同一字符串的最大总字符数,k表示该字符串中的第k位字符,其中n、k为大于等于I的正整数且η大于等于k;
[0111]记录单元1023,用于记录所述两次录入信息中字符串中不一致字符的位置参数n (k) ο
[0112]其中装置中的102信息校验模块包含的1021到1023单元可以执行并完成方法步骤S202到S204中的所有方法和流程,在此不再赘述。
[0113]图7中信息仲裁模块103可包括:展示单元1031、标识展示单元1032、模板录入单元1033、模板测定单元1034、模板调用单元1035、坐标确定单元1036、影像展示单元1037和仲裁单元1038。
[0114]展示单元1031,用于将所述两次录入信息中不一致部分相对应的字符串进行上下对齐展示,且字符串中的字符从首位到第η位逐位对齐;
[0115]标识展示单元1032,用于根据所述不一致字符的位置参数n (k),将所述对齐展示的字符串相对应的位置参数n (k)所对应的不一致字符以鲜明颜色进行标注并展示;
[0116]模板录入单元1033,用于预先录入两次录入信息所对应的原始影像模板,所述原始影像模板为所述对应原始影像所依据的凭证未录入信息前的1:1大小的版面图;
[0117]模板测定单元1034,预先测定并保存录入信息区域在所述原始影像模板上的区域坐标;
[0118]模板调用单元1035,用于调用与所述两次录入信息相匹配的原始影像模板以获取录入信息区域在所述原始影像模板上的区域坐标;
[0119]坐标确定单元1036,用于根据所述两次录入信息中不一致的字符串的总字符数n,从字符串中字符的排列方向将所述原始影像模板上相应的区域坐标平均分割为η块,并结合所述字符串中不一致字符的位置参数n (k),确定不一致字符的区域坐标;
[0120]影像展示单元1037,用于根据所述确定的不一致字符的区域坐标,对所述对应的原始影像中相应区域坐标中的不一致字符进行突出展示;
[0121]仲裁单元1038,用于将所述进行标识的两次录入信息中不一致部分和所述进行突出展示的两次录入信息中不一致部分所对应的原始影像进行同时展示并对比。
[0122]图8是图7中信息仲裁模块103中坐标确定单元1036的结构示意图,该坐标确定单元1036可包括:判断子单元1361、第一坐标获取子单元1362、第一坐标确定子单元1363、第二坐标获取子单元1364、OCR识别子单元1365、字符分割子单元1366和第二坐标确定子单元1367。
[0123]判断子单元1361,用于判断所述两次录入信息中不一致的字符串中的字符的区域坐标是否模块化,所述模块化表示以固定大小格式填写所述两次录入信息中的字符;
[0124]第一坐标获取子单元1362,若模块化,获取模板中对应的字符的模块化的区域坐标;
[0125]第一坐标确定子单元1363,用于根据所述字符串中不一致字符的位置参数n(k)并结合所述字符的模块化的区域坐标,确定不一致字符的区域坐标;
[0126]第二坐标获取子单元1364,若非模块化,获取模板中对应的非模块化的两次录入信息中字符串的区域坐标M ;
[0127]OCR识别子单元1365,用于根据区域坐标M并结合OCR识别技术进一步确认原始影像中录入信息区域中已填写的字符串的区域坐标M’,其中M’于等于M ;
[0128]字符分割子单元1366,用于根据字符串的总字符数n,从字符串中字符的排列方向将所述已填写的字符串的区域坐标Μ’平均分割为η块以确定字符串中字符的区域坐标;
[0129]第二坐标确定子单元1367,用于根据所述字符串中不一致字符的位置参数n(k)并结合所述已确定的字符串中字符的区域坐标,得到所述不一致字符的区域坐标。
[0130]图9是图7中信息仲裁模块103中影像展示单元1037的结构示意图,该影像展示单元1037可包括:影像提取子单元1371和扩大展示子单元1372。
[0131]影像提取子单元1371,用于根据所述确定的不一致字符的区域坐标,提取所述原始影像中相对应的不一致字符的区域坐标所对应的突出影像;
[0132]扩大展示子单元1372,用于将所述提取后的原始影像中相对应的不一致字符的区域坐标所对应的突出影像按比例进行多级范围扩大展示,所述多级范围包括所述不一致字符的区域坐标到不一致字符所在字符串的完整区域坐标。
[0133]其中装置中的103信息仲裁模块包含的1031到1038单元以及其中包含的坐标确定单元1036中的1361到1367子单元和影像展示单元1037中的1371及1372子单元可以执行并完成方法步骤S205到S219中的所有方法和流程,在此不再赘述。
[0134]本发明实施例,通过在二次录入不一致的仲裁过程当中,将二次录入不一致的信息中的不一致部分进行鲜明标识和展示,并对二次录入不一致的信息所对应的原始影像资料进行影像定位、展示,减少人工观测的内容,精准的展示了校验结果,提升了仲裁效率和仲裁结果的准确性,实现快速仲裁。
[0135]本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random AccessMemory, RAM)等。
[0136]以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
【权利要求】
1.一种二次录入不一致的仲裁方法,其特征在于,包括: 检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据的两次输入,对应的原始影像为所述两次录入信息所依据的凭证的扫描影像; 对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数; 根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示。
2.如权利要求1所述的方法,其特征在于,所述采集两次录入信息,包括: 所述两次录入信息包括至少一个字符串,其中字符串包括至少一个字符; 采集同一张凭证的两次录入的所有字符串或者采集同一张凭证的两次录入不一致部分的字符串。
3.如权利要求2所述的方法,其特征在于,对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数,包括: 将所述采集的两次录入信息以字符串为单位从首位字符开始逐位进行比对; 根据所述比对结果生成所述两次录入信息中不一致字符串中不一致字符的位置参数n (k),其中η表示两次录入信息中两次录入的同一字符串的最大总字符数,k表示该字符串中的第k位字符,其中n、k为大于等于I的正整数且η大于等于k ; 记录所述两次录入信息中字符串中不一致字符的位置参数n (k)。
4.如权利要求3所述的方法,其特征在于,所述根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,包括: 将所述两次录入信息中不一致部分相对应的字符串进行上下对齐展示,且字符串中的字符从首位到第η位逐位对齐; 根据所述不一致字符的位置参数n(k),将所述对齐展示的字符串相对应的位置参数n(k)所对应的不一致字符以鲜明颜色进行标注并展示。
5.如权利要求4所述的方法,其特征在于,所述根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示,包括: 预先录入两次录入信息所对应的原始影像模板,所述原始影像模板为所述对应原始影像所依据的凭证未录入信息前的1:1大小的版面图; 预先测定并保存录入信息区域在所述原始影像模板上的区域坐标; 调用与所述两次录入信息相匹配的原始影像模板以获取录入信息区域在所述原始影像模板上的区域坐标; 根据所述两次录入信息中不一致的字符串的总字符数n,从字符串中字符的排列方向将所述原始影像模板上相应的区域坐标平均分割为η块,并结合所述字符串中不一致字符的位置参数n (k),确定不一致字符的区域坐标; 根据所述确定的不一致字符的区域坐标,对所述对应的原始影像中相应区域坐标中的不一致字符进行突出展示。
6.如权利要求5所述的方法,其特征在于,根据所述两次录入信息中不一致的字符串的总字符数n,从字符串中字符的排列方向将所述原始影像模板上相应的区域坐标平均分割为η块,并结合所述字符串中不一致字符的位置参数n (k),确定不一致字符的区域坐标,包括: 判断所述两次录入信息中不一致的字符串中的字符的区域坐标是否模块化,所述模块化表示以固定大小格式填写所述两次录入信息中的字符; 若模块化,获取模板中对应的字符的模块化的区域坐标; 根据所述字符串中不一致字符的位置参数n(k)并结合所述字符的模块化的区域坐标,确定不一致字符的区域坐标; 若非模块化,获取模板中对应的非模块化的两次录入信息中字符串的区域坐标M ; 根据区域坐标M并结合OCR识别技术进一步确认原始影像中录入信息区域中已填写的字符串的区域坐标M’,其中M’小于等于M ; 根据字符串的总字符数n,从字符串中字符的排列方向将所述已填写的字符串的区域坐标M’平均分割为η块以确定字符串中字符的区域坐标; 根据所述字符串中不一致字符的位置参数n(k)并结合所述已确定的字符串中字符的区域坐标,得到所述不一致字符的区域坐标。
7.如权利要求5和6所述的方法,其特征在于,所述根据所述确定的不一致字符的区域坐标,对所述对应的原始影像中相应区域坐标中的不一致字符进行突出展示,包括: 根据所述确定的不一致字符的区域坐标,提取所述原始影像中相对应的不一致字符的区域坐标所对应的突出影像; 将所述提取后的原始影像中相对应的不一致字符的区域坐标所对应的突出影像按比例进行多级范围扩大展示,所述多级范围包括所述不一致字符的区域坐标到不一致字符所在子符串的完整区域坐标。
8.如权利要求1-7所述的方法,其特征在于,所述根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示之后,还包括: 将所述进行标识的两次录入信息中不一致部分和所述进行突出展示的两次录入信息中不一致部分所对应的原始影像进行同时展示并对比。
9.一种二次录入不一致的仲裁装置,其特征在于,包括: 信息采集模块,用于检测到两次录入信息不一致时,采集两次录入信息及对应的原始影像,所述两次录入信息为同一张凭证上的数据的两次输入,对应的原始影像为所述两次录入信息所依据的凭证的扫描影像; 信息校验模块,用于对比所述两次录入信息,获取所述两次录入信息中不一致部分的位置参数; 信息仲裁模块,用于根据所述不一致部分的位置参数将所述两次录入信息中不一致部分进行标识,影像展示模块,并用于根据所述不一致部分的位置参数将对应的原始影像中所述不一致部分进行定位和突出展示。
10.如权利要求9所述的装置,其特征在于,所述采集两次录入信息,包括: 所述两次录入信息包括至少一个字符串,其中字符串包括至少一个字符; 采集同一张凭证的两次录入的所有字符串或者采集同一张凭证的两次录入不一致部分的字符串。
11.如权利要求10所述的装置,其特征在于,所述信息校验模块,包括: 对比单元,用于将所述采集的两次录入信息以字符串为单位从首位字符开始逐位进行比对; 参数生成单元,用于根据所述比对结果生成所述两次录入信息中不一致字符串中不一致字符的位置参数n (k),其中η表示两次录入信息中两次录入的同一字符串的最大总字符数,k表示该字符串中的第k位字符,其中n、k为大于等于I的正整数且η大于等于k ;记录单元,用于记录所述两次录入信息中字符串中不一致字符的位置参数n (k)。
12.如权利要求11所述的装置,其特征在于,所述信息仲裁模块,包括: 展示单元,用于将所述两次录入信息中不一致部分相对应的字符串进行上下对齐展示,且字符串中的字符从首位到第η位逐位对齐; 标识展示单元,用于根据所述不一致字符的位置参数n (k),将所述对齐展示的字符串相对应的位置参数n(k)所对应的不一致字符以鲜明颜色进行标注并展示。
13.如权利要求12所述的装置,其特征在于,所述信息仲裁模块,包括: 模板录入单元,用于预先录入两次录入信息所对应的原始影像模板,所述原始影像模板为所述对应原始影像所依据的凭证未录入信息前的1:1大小的版面图; 模板测定单元,预先测定并保存录入信息区域在所述原始影像模板上的区域坐标;模板调用单元,用于调用与所述两次录入信息相匹配的原始影像模板以获取录入信息区域在所述原始影像模板上的区域坐标; 坐标确定单元,用于根据所述两次录入信息中不一致的字符串的总字符数n,从字符串中字符的排列方向将所述原始影像模板上相应的区域坐标平均分割为η块,并结合所述字符串中不一致字符的位置参数n (k),确定不一致字符的区域坐标; 影像展示单元,用于根据所述确定的不一致字符的区域坐标,对所述对应的原始影像中相应区域坐标中的不一致字符进行突出展示。
14.如权利要求13所述的装置,其特征在于,所述坐标确定单元,包括: 判断子单元,用于判断所述两次录入信息中不一致的字符串中的字符的区域坐标是否模块化,所述模块化表示以固定大小格式填写所述两次录入信息中的字符; 第一坐标获取子单元,若模块化,获取模板中对应的字符的模块化的区域坐标; 第一坐标确定子单元,用于根据所述字符串中不一致字符的位置参数n(k)并结合所述字符的模块化的区域坐标,确定不一致字符的区域坐标; 第二坐标获取子单元,若非模块化,获取模板中对应的非模块化的两次录入信息中字符串的区域坐标M ; OCR识别子单元,用于根据区域坐标M并结合OCR识别技术进一步确认原始影像中录入信息区域中已填写的字符串的区域坐标M’,其中M’于等于M ; 字符分割子单元,用于根据字符串的总字符数n,从字符串中字符的排列方向将所述已填写的字符串的区域坐标M’平均分割为η块以确定字符串中字符的区域坐标; 第二坐标确定子单元,用于根据所述字符串中不一致字符的位置参数n(k)并结合所述已确定的字符串中字符的区域坐标,得到所述不一致字符的区域坐标。
15.如权利要求13和14所述的装置,其特征在于,所述影像展示单元,包括: 影像提取子单元,用于根据所述确定的不一致字符的区域坐标,提取所述原始影像中相对应的不一致字符的区域坐标所对应的突出影像; 扩大展示子单元,用于将所述提取后的原始影像中相对应的不一致字符的区域坐标所对应的突出影像按比例进行多级范围扩大展示,所述多级范围包括所述不一致字符的区域坐标到不一致字符所在字符串的完整区域坐标。
16.如权利要求9-15所述的装置,其特征在于,所述信息仲裁模块,还包括: 仲裁单元,用于将所述进行标识的两次录入信息中不一致部分和所述进行突出展示的两次录入信息中不一致部分所对应的原始影像进行同时展示并对比。
【文档编号】G06K9/68GK104408403SQ201410594087
【公开日】2015年3月11日 申请日期:2014年10月29日 优先权日:2014年10月29日
【发明者】郑邦东, 黄丹青, 吴渊, 胡晓斌 申请人:中国建设银行股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1