单据读出系统、单据读出方法及单据读出程序的制作方法

文档序号:6599994阅读:272来源:国知局
专利名称:单据读出系统、单据读出方法及单据读出程序的制作方法
技术领域
本发明涉及读出记载于单据上的金额及付款人名字等信息的单据处理系统。特别涉及作为单据处理系统中使用的单据的预备知识的单据定义的生成、管理和利用方法。
背景技术
将存入传票及税金缴纳书等单据的图像以光学扫描仪等读入,从该图像数据读出单据上记载的金额及付款人名字等信息的读出系统称为单据处理系统。
为了使上述单据处理系统正确处理单据,作为预备知识,在输入装置中,必需有记述读出单据的尺寸,读出行数、位置、字种、字符数等读出单据所必需的参数版面等单据特征以及在处理单据所必需的处理方法的信息。
在这些信息中,例如,可包括(1)单据种类信息、·单据种类ID、·单据发行者名字、·单据发行者帐户号(2)版面信息、·线格·框格位置·框格属性(金额记载框格、日期记载框格等)·框格记载文字种类(数字、汉字、片假名等)(3)应用信息·单据处理手续
·单据切纹位置·领收印章盖章位置等信息中的某一些,在本说明书中,将至少包含框格位置信息和框格属性信息的版面信息作为单据信息处理。
为了实现高精度的单据处理,单据定义的(a)的生成方法、(b)管理方法、(c)利用方法是重要的。
作为关于上述(a)单据定义生成方法的现有的方法,例如,在日本专利特开2000-172779号公报中公开了从单据定义生成对象的单据种类的输入图像,自动抽取框格,利用事先登录的框格的格式知识,确定有效的框格,生成版面信息的方法。
另外,在特开平11-184965号公报中公开了可以通过从图像内自动抽取满足字符模式等条件的构成要素,抽取用来区别单据种类的单据定义的方法。
关于上述(b)的单据定义管理方法,作为管理存储单据定义的单据定义DB(数据库)的方法,在特开平9-73502号公报中公开了通过网络将多台单据管理装置相连接,只使其中的一台单据处理装置保持单据定义DB,经网络向其他单据处理装置发送信息的方法。
另外,在特开2001-307008号公报中公开了根据需要向单据处理装置提供单据定义,减少构筑单据定义DB成本的方法。
关于上述(c)的单据定义利用方法,一般是按照在单据定义中记载的字段框格及记载字符种类等的版面信息执行字符串识别处理,将读出对象字段进行读出。

发明内容
然而,例如,在利用线格信息确定读出项目的位置时,有的场合由于各扫描仪的扫描特性之故线格的出现与定义时的图像不同,不能如定义中记载那样地抽取线格,会使确定该读出项目的位置失败。这样,就存在如下的课题,即在现有的方法中,由于是按照原样利用不考虑读入图像的亮度值及分辨率等使用的每个输入装置不同的特性值记载的单据定义的信息,在生成单据定义时使用的扫描仪和单据处理装置的扫描仪的特性不同的场合,难以高精度的读出单据。另外,作为单据处理系统的现实的构成,考虑(i)不是只使用1台而是使用多台多种类的扫描仪收集单据图像生成单据定义的场合、(ii)在由多台多种类单据处理装置使用1个单据定义DB的场合。在这种各种扫描仪并存的场合,以现有的单据定义的生成和利用方法进行处置事实上是不可能的。
这样,就存在在单据定义时和单据读出时扫描环境不同的场合,及利用多个扫描仪进行单据定义或单据读出的场合,以现有的方法不能实现高精度的单据读出的问题1。
此外,为了一直维持高精度的读出,必须把握单据处理系统内的扫描仪状态。一般,光学扫描仪随着使用时间而劣化。并且,有时由于传送系统不良等,会出现扫描图像伸缩等的异常的场合。画质恶化的扫描仪必须尽快更换。但是,却存在没有办法自动检测随时间劣化及故障等的问题2。
本发明正是鉴于上述问题而完成的发明,其目的在于提供一种即使是在单据定义时和单据读出时扫描环境不同的场合,及利用多个扫描仪进行单据定义或单据读出的场合,可以生成和使用单一单据定义DB的方法。
并且,对于上述问题2,提供一种自动检测随时间劣化及故障等的扫描仪状态的方法,这也是本发明的目的。
本发明,为了实现上述目的,通过在各单据定义内对生成该定义的输入装置的特性值或与其链接的信息进行记录,在单据读出时对定义生成和单据读出装置的特性进行比较,进行与该结果相应的字符串识别和比对等,使得在维持读出精度原样不变的情况下可以利用单一单据定义DB。
另外,通过对各扫描环境的特征测试图的观测,在特征测试图发生很大变化时,可以自动检测出判断该扫描仪发生随时间劣化和故障等扫描仪状态。


图1为示出本发明的当事人及其关系的示图。
图2为示出本发明的单据处理系统的构成例1的示图。
图3为示出本发明的单据处理系统的构成例2的示图。
图4为示出单据定义生成步骤和单据读出步骤的现有例的示图。
图5为示出本发明的单据定义生成步骤和单据读出步骤的示图。
图6为示出特征测试图生成样张的示例图。
图7为特征测试图示例图。
图8为扫描特性抽取的处理流程图。
图9为校正量计算装置的处理流程图。
图10为单据读出装置的处理流程图。
图11为扫描状态检测装置的处理流程图。
图12为灰度亮度值的图像校正的说明图。
图13为线格抽取结果校正的说明图。
图14为线格校正步骤的说明图。
图15为对线格间距离的说明图。
具体实施例方式
下面对本发明的当事人及系统构成、各功能等予以详细说明。
首先,对本发明的实施方式予以概略介绍(图1)。在本实施方式中出现的当事人有4个。
第1当事人为单据处理系统提供者101。
第2当事人为单据处理系统利用者102。
第3当事人为单据发行者103。
第4当事人为单据处理希望者104。
例如,以电费支付为例,单据处理系统提供者101为系统开发和服务公司,单据处理系统利用者102为金融机关,单据发行者103为电力公司,而单据处理希望者104为电力使用者。电力公司为了电费征收及支付发行单据,并将其送达各用电户。用电户拿着为交纳电费而送达的单据到金融机构利用单据处理系统办理交费手续。之后,金融机构将交纳的使用费汇入电力公司,而电力公司向金融机构支付单据处理费。整个流程结束。
在此场合,金融机构,从系统开发和服务公司购入或租赁单据处理系统,使用该单据处理系统,并支付其购入费或使用费。
下面对图1的单据处理系统提供者101提供的单据处理系统的构成予以说明。单据处理系统大致可分为(1)集中型(图2)和(2)分离型(图3)两种构成。
作为单据处理系统的第1种构成的集中型(图2)的构成为,由扫描仪211~213、单据图像服务器221、特征测试图服务器231、单据定义服务器241及单据读出服务器251经网络连接而构成。
网络201的实体是光缆、以太网及电话线等的有线网;IEEE802.11a/b/g及蓝牙(蓝牙SIG公司的注册商标)等的无线网;或其混合结构。服务区的构成,也可以是由1台硬件兼管各服务器之中的多个功能。
单据处理系统具有1台或多台扫描仪。作为扫描仪的构成例,可以是光学图像读入装置和可对其进行控制并将采取的图像经网络发送到单据图像服务器的计算机的组合以及FAX(传真机)装置等。另外,扫描仪的硬件构成也可以与某一个服务器融合。各扫描仪不一定必须是同一规格。如利用图1对扫描仪的设置场所进行说明,可以设置于单据处理系统提供者101、单据处理系统利用者102或单据处理希望者104。
经网络201,以各扫描仪扫描的单据图像,传送到单据图像服务器221。单据图像服务器,将传送的单据图像与采取所使用的扫描仪的信息一起,存储于单据图像DB 222中。所谓采取时所使用的单据图像输入装置的信息,是依赖于使用的扫描仪,或由于各输入装置的随时间变化而使得值可能变得不同的读出的图像数据上的特性值,例如,至少包含分辨率、浓淡信息、扫描最小线宽和线间隔中的某一个。此外,也可利用在单据定义中包含的此外的信息的某一个。以下,在本说明书中,将这些输入装置的信息称为特征测试图。此外,如预先对系统上的各扫描仪分配有固有的番号或字符串(以下,称其为扫描仪ID),也可以使用该扫描ID作为特征测试图。
各特征测试图,由特征测试图服务器231管理。特征测试图的示例示于图7。特征测试图服务器,将各个扫描仪的特征测试图与各个扫描仪相对应地存储于特征测试图DB232中进行管理。
单据定义服务器241,接收来自单据图像服务器的单据图像,生成单据定义,存储于单据定义DB242中。在各单据定义上,添加生成该各个定义的所使用的单据定义单据图像的采取扫描仪的特征测试图。
单据读出服务器251,从单据图像服务器或扫描仪接收单据图像,从特征测试图服务器231接收扫描仪特征测试图,从单据定义服务器接收单据定义,根据单据定义读出单据上的字符串和数字串等,并将该读出结果存储于单据读出结果DB中。关于单据读出处理将在后面详细说明。另外,如上所述,在以1个装置构成的场合,在单据读出服务器251内,存储单据图像DB222、特征测试图DB232和单据定义DB242,在从扫描仪接收图像数据的场合,也可以实现上述的处理。以上,是对从单据处理系统的第1构成的集中型的说明。
作为单据处理系统的第2种构成的分散型示于图3。与第1种构成集中型的差异在于,在是以1台单据读出服务器统一处理单据读出,还是在各单据读出装置内进行处理上不同。在分散型中,由进行单据定义的单据定义中心和实际上读出单据的1台或多台单据读出装置构成。在图3的场合,示出的是由2台单据读出装置A,B组成的场合。
单据定义中心300,除了不需要单据读出服务器和添加了DB配信服务器之外,与第1构成的集中型200相同。
DB配信服务器361,是将生成单据定义DB所使用的单据图像输入装置的特征测试图DB,利用网络302配信给各单据读出装置。单据定义的配信方法,可使用,例如,特开2001-307008号公报中记载的单据定义配信方法。
单据读出装置,具有1台或多台扫描仪和单据读出服务器、单据读出结果DB。各单据读出装置经网络302和配信服务器相连接。对于单据读出装置内的扫描仪的特征测试图,也可以存储于各单据读出装置内,或是由特征测试图服务器进行管理。
以上说明的是作为单据处理系统的第2构成的分散型。
另外,作为单据处理系统的也可以是集中型和分散型的混合型。就是说,在分散型中,在单据定义中心中具有单据读出服务器,也有将不具有单据读出服务器的单据读出装置连接到票据定义中心的场合。在此场合,各扫描仪的特征测试图通过在扫描仪373中设置存储装置进行保持,在将读出的图像发送到中心时,可以自动地添加。根据这种构成,例如,通过将单据信息集中地存储于单据中心等,可以有效率地进行单据的处理。
下面通过比较现有例(图4)和本发明(图5)对单据定义生成和单据读出步骤予以说明。
在单据定义生成步骤和单据读出步骤的现有例(图4)中,首先利用单据图像输入单元A412以电子方式将单据处理系统要处理的单据411读入,得到单据图像413。之后,由单据定义生成装置414定义版面信息等,生成单据定义415。到此为止是单据定义生成步骤410。
单据读出步骤420,首先利用单据图像输入单元B422以电子方式将要处理的单据421读入,得到单据图像423。于是,将单据图像423和在先前的单据定义生成步骤中生成的单据定义415作为输入,由单据读出单元424读入记载于单据纸面上的读出对象的字符串和数字串等,将该结果存储为单据读出结果425。
以上是单据定义生成步骤和单据读出步骤的现有例。
然而,在现有例的场合,因为未考虑单据图像输入单元A412和单据图像输入单元B422的输入图像中的特性差,会产生例如,在定义时的图像中存在的线格在读出时检测不到,或将未定义的线格读出等问题,结果降低单据读出精度的场合。
于是,本发明的方式是实现考虑到上述扫描特性的差异的单据读出。
在单据定义生成和单据读出本发明的步骤(图5)中,利用单据图像输入单元A512以电子方式将单据处理系统要处理的单据511读入,得到单据图像513。之后,由单据定义生成装置514定义版面信息等,生成单据定义515。此时将在单据定义515内在该定义生成中使用的单据图像和采取的特征测试图合并记录。另一方面,因为已知单据图像输入单元A 512的扫描特性,由单据图像输入单元A以电子方式将特征测试图生成样张516(参照图6,以下单称其为样张)读入,由扫描特性抽取单元517抽取扫描特性,输出特征测试图A518。到此为止是单据定义生成步骤510。特征测试图的生成不必每一次扫描单据时都实行,只要在最初使用该单据图像输入单元的场合,在定期进行维护的场合以及扫描的图像出现异常的场合等实行即可。也可能在扫描仪出厂前生成特征测试图并进行存储。关于特征测试图及扫描特性抽取单元在后面予以详细说明。
单据读出步骤520,首先利用单据图像输入单元B522以电子方式将要处理的单据521读入,得到单据图像523。一方面,与单据定义生成步骤510一样,因为已知单据图像输入单元B522的特征测试图,利用单据图像输入单元B522以电子方式将样张526读入,由扫描特性抽取单元527抽取特征测试图,输出特征测试图A528。在单据读出前或单据读出中,由校正量计算单元529抽取在2个特征测试图518和528之间,例如,亮度值及分辨率等的差异,确定读出时的校正量和校正方法。于是,将单据图像523和以先前的单据定义生成步骤生成的单据定义515、校正量计算单元529的结果作为输入,由单据读出单元524读入记载于单据纸面上的读出对象的字符串和数字串等,将其结果存储为单据读取结果525。
以上是单据定义生成和单据读出的本发明的步骤。
如上所述,通过考虑单据定义时和单据读出时的特征测试图的差异,即使是在单据图像输入单元不同的场合,也可以抑制单据读出精度的降低。
下面对特征测试图生成样张和特征测试图予以说明。
所谓的特征测试图生成样张,是用来由各单据图像输入单元将本样张进行扫描使图像电子化,对该图像执行扫描特性抽取装置而得到特征测试图的样张。图6为特征测试图生成样张的示例。
在此示例中,在区域610中印刷有各种字体、字形和字号的字符串和数字串。是用来在扫描样张后,扫描特性抽取装置,根据是否能够读出这些字符,抽取关于识别最小字符的字号等字符串识别的扫描特性。
图形621是用来了解可识别的线密度的图形。通过调查在扫描后可否识别两根横线之间存在的线段,可抽取识别最大线密度。在本例的场合,可以识别越是靠近中央的线段,就表示可识别的线密度越高。
图形622是用来调查灰度级的特性的图形。通过测定在扫描后本图形的亮度值,可抽取扫描仪的灰度色级特性。同样,图形623~625,是用来在彩色的场合,调查各个红、绿、青色级的特性的图形。
区域630、640的各图形,是用来调查线段的识别特性的区域。在本例的场合,在区域630内,画出线宽不同的线段。通过测定在扫描后该线段的实际线宽,可抽取线段的破坏和模糊状态。在区域640内,画出了浓度不同的线。通过调查在扫描后可否实际上识别该线段,可抽取此时的线宽等的特性。
关于特征测试图生成样张的何处、记载什么样的图形,以什么装置抽取什么样的特性,这样的特征测试图生成样张信息的保存方法有(1)作为预备知识保持于特性抽取装置内、(2)记录于特征测试图生成样张上的特定地点。在本例中是上述(2)的场合,这些信息编码为样张右上角处的二维条码601进行记录的示例。在此场合,在抽取扫描特性时,必需有二维编码的解码装置,但其优点是无需预备知识的管理,与各种特征测试图生成样张存在的场合也可以对应等等。
以上,由图6例示的特征测试图生成样张生成的特征测试图的例子示于图7。
首先,在字段701,记载示出的是何种扫描仪的特征测试图的扫描ID。在字段703中,记载有示出灰度色级的特性,例如,从图6的622得到的各灰度的亮度值(在本例的场合0~255的256色级)的亮度实测得到的实测值。同样,在字段704~706,记载有利用图6的623~625得到的红、绿、青色级的实测值。在字段707、708中示出关于线段的特性,在字段707和708中分别记载有可识别的最小线宽和可识别的最大线密度。在字段709、710中示出对于字符串及模式的特性,在字段709和710中分别记载有各线宽的实测值和可识别的最小字号。这些,可分别利用图6的610、630、640所示的模式求出。在其他示例中,字段702可记载分辨率的实测值。
在本项目上,例如,也可添加对于各字符可否识别等的字段。
下面参照图8对扫描特性抽取装置(图5517、527)的处理流程予以说明。首先,输入特征测试图生成样张图像(步骤801)。之后,从输入的图像中,检测出样张的四角,确定样张的图像中的位置(步骤802)。之后,抽取特征测试图生成样张信息(步骤803)。在本实施方式中,图6的二维条码601解码处理与此相当。以下,按照特征测试图生成样张信息,顺序抽取各扫描特性(步骤804)。在各扫描特性抽取中,首先确定该特性的实测区域(步骤805),测定实测值(步骤806)。从实测值计算扫描特性(步骤807),将该结果写入特征测试图(步骤808)。反复执行以上的步骤,如全部扫描特性都已抽取,则输出特征测试图而结束(步骤809)。以上的处理,例如,也可利用现在扫描仪出厂时用来确认各制品是否满足规格所使用的工具等实现。
以上是扫描特性抽取处理流程。
下面,图9示出校正量计算装置(图5529)的处理流程。首先,输入定义生成时的特征测试图(步骤901)。另外,还输入单据读出时的特征测试图(步骤902)。另外,步骤901和902的顺序也可以反过来。之后,计算2个特征测试图的差异(步骤903),由该差异确定输入的单据图像数据的校正量及单据定义规定的单据读出时的单据读出参数(步骤904)。最后,校正量及参数输出结束(步骤905)。关于本流程见后述。
下面对单据读出装置(图5524)的处理流程予以说明(图10)。
首先,在步骤1001~1003中,输入待读出的单据的图像,该图像的定义,校正量计算装置(529)计算的校正量。并且,不管各步骤的执行顺序。其后,按照校正量校正单据图像数据(步骤1004),检测出单据的四角,确定单据的图像中的位置(步骤1005)。之后,针对单据定义记载的各读出项目(步骤1006),确定该读出区域(步骤1007),从该区域中抽取字符模式(步骤1008),通过对各字符进行字符识别得到读出结果(步骤1009)。最后,在读出全部读出项目之后,将该结果输出(步骤1010)。
下面,对利用特征测试图的校正方法予以更详细的说明。校正方法大致可分为两种(1)图像校正对读出对象的读出图像直接校正、(2)识别校正对线格抽取结果、字符切出、字符识别的参数及词典等的变更。
在上述单据读出的处理流程中,上述(1)反映于步骤1004,上述(2)反映于步骤1007~1009中。
下面,作为上述(1)的图像校正的1例,对灰度亮度值的校正方法1予以说明(图12)。因为本校正,在单据定义时和单据读出时扫描仪不同的场合,改变灰度亮度值的特性,是一种用来使单据读出时的单据图像接近单据定义时的单据图像的方法。首先,从2个扫描仪的特征测试图,得出灰度的输入值亮度值和实测值的关系。在图12的场合,特征测试图A(单据定义时的扫描特性)是1201,特征测试图B(单据读出时的扫描特性)是1202。作为校正方法,例如,在单据读出时关心的像素的亮度值是g的场合,将该像素的亮度值变更为定义时的对应的实测值g′。另外,对彩色和色的浓度可进行同样的处理。这样,图像校正,就是为了将单据定义时使用的输入装置和输出读出对象的读出图像数据的装置的,例如,亮度值等特性引起的影响降低的处理。下面,对线格抽取结果的校正方法予以说明,作为上述(2)的识别校正的1例(图13)。在确定上述单据读出步骤的读出区域(步骤1007)中,为了确定更正确的区域,必须进行线格比对。但是,在单据定义时和单据读出时扫描仪不同的场合,在可识别线密度发生变化时,存在例如如图13所示,单据定义时的线格登录1301和线格抽取结果1306不同的场合。本校正的目的就是根据特征测试图的差异对抽取结果进行校正而对线格进行比对。
首先着眼于特征测试图A和B的识别最大线密度,将优势(大)的一方的线格信息与劣势一方的识别最大线密度相比较而对结果进行校正。在图13的场合,由于单据定义时的一方占优,针对劣势一方的识别最大线密度的线格信息进行参数变换(1304),得到线格校正结果1305。由于该校正结果和单据读出时的线格抽取结果进行线格比对(1307),所以,即使是上述两个扫描特性不同的场合,也可以得到高精度的线格比对。
图14示出线格校正的具体步骤的示例。首先,在步骤1401中输入校正的线格的集合L和识别最大线密度d。校正对象的线格集合L是线密度为高精度一方的线格信息,d是劣势一方的线密度。例如,在图13的场合,L是单据定义内的线格信息,d是特征测试图B的线密度,等于1.6。之后,对L内的各线格l1,l2,如步骤1404的各条件成立,使该两个线格统一成为1个线格(步骤1405)。在步骤1404的条件中的线格间的距离,如图15所示,是在两个线格l1,l2上的各个任意的点p,q中两点间距离最小时的距离。
此外,在扫描最小线宽及最小线间隔等存在差的场合同样,例如在输入单据图像数据的特征测试图一方为劣势的场合,将单据定义与最小线宽等进行比对读出。此外,为了读出单据,也可以变更字符的字符切出或模式统一用的参数。此外,研制了字符识别中模糊字符用的词典,可切换在字符识别1009时使用的词典。另外,在差异大的场合,也可以将该点或计算出的可信度附加在输出结果上,可以得到更高精度的读出结果。
最后,按照图11对扫描状态的检测装置的处理流程予以说明。
首先,将新生成的特征测试图输入到具有特征测试图服务器221或特征测试图DB的处理装置(步骤1101)。之后,将与该特征测试图相同的扫描仪的过去的特征测试图从特征测试图DB中检索出来(步骤1102),与新的特征测试图进行比较计算出差异(步骤1103)。在执行以上的步骤之后,执行扫描仪异常检测。首先,参照新特征测试图的各特性值,判断是否是满足单据处理系统的规格(步骤1104),假设是不满足的场合,就作为扫描仪异常,警告扫描仪的保有者或图1的系统提供者101(步骤1105)。此外,在计算特征测试图的差异的结果超过预定值的场合,也可发出警告。警告,例如,可以经过网络发送邮件,或邮寄,也可以是系统提供者直接访问兼维护。由于本警告,系统提供者101,对该扫描仪进行调查后或更换或修理。另外,在该扫描仪是系统利用者102及单据处理希望者104的装置的场合,由系统提供者发出内容为不能满足规格的警告和介绍满足规格的扫描仪等。另外,在新的特征测试图与过去的特征测试图的差异超过阈值的场合(步骤1107),也同样发出警告。
本装置在特征测试图更新时或生成新标准时执行。另外,制定新标准时不执行步骤1102,1103,1106,1107。作为实际的实施方式,也可由服务人员定期地进行维修服务,或由系统利用者请求定期地发送特征测试图生成样张和读出图像。根据本构成,在实施精度高的读出的同时,可以保证该精度。
如上所述,本申请公开了一种单据读出系统,其特征在于包括将单据定义和利用该定义的图像数据的第1输入装置的特征测试图相对应地存储的存储装置;经网络取得单据图像数据和输入该单据图像数据所使用的第2输入装置的特征测试图的装置;以及从上述存储装置读出该单据图像数据的单据定义和上述第1输入装置的特征测试图的装置;计算上述第1和第2输入装置的特征测试图的差异的装置;利用上述计算装置的结果校正上述单据图像数据或上述单据定义的装置;以及利用上述单据定义读出上述单据图像数据的装置。另外,还公开了以网络构成上述系统的形态。
根据本发明,即使是在单据定义时和单据读出时扫描环境不同的场合,或使用多个扫描仪进行单据定义或单据读出的场合,可以生成利用单一的单据定义DB,获得防止减少单据定义生成作业和降低单据读出精度的效果。
此外,由于可以自动检测随时间劣化及故障等的扫描仪的状态,可以获得减少系统维护作业的效果。
权利要求
1.一种单据读出系统,其特征在于包括将至少包含框格位置信息和框格属性的单据定义和该定义利用的图像数据的第1输入装置的特征测试图相对应地进行存储的存储装置;经网络取得单据图像数据和输入该单据图像数据所使用的第2输入装置的特征测试图的装置;从上述存储装置读出该单据图像数据的单据定义和上述第1输入装置的特征测试图的装置;计算上述第1和第2输入装置的特征测试图的差异的装置;利用上述计算装置的结果变更上述单据图像数据或上述单据定义,使上述两个特征测试图近似的装置;以及利用上述单据定义读出上述单据图像数据的装置。
2.如权利要求1的单据读出系统,其特征在于上述存储装置将上述第2输入装置的特征测试图,与该第2输入装置的ID代码相对应地进行存储;上述取得装置取得与向取得的上述单据图像数据赋予的ID代码相对应的、上述第2输入装置的特征测试图。
3.如权利要求1至2的单据读出系统,其特征在于包括输入上述单据图像数据的上述第2输入装置。
4.如权利要求1至3中任一项的单据读出系统,其特征在于包括利用经上述网络从上述第2输入装置取得的图像数据生成上述第2输入装置的特征测试图的装置。
5.如权利要求2或3的单据读出系统,其特征在于包括比较存储于上述存储装置中的第2输入装置的特征测试图和利用上述取得装置新得到的该第2输入装置的特征测试图的装置;以及将上述比较结果经上述网络输出的装置。
6.如权利要求1至5中任一项的单据读出系统,其特征在于上述第1和第2输入装置的特征测试图包含有关亮度值的信息;且上述变更装置,根据上述计算装置对亮度值计算的结果,变更上述单据图像数据或上述单据定义的亮度值。
7.如权利要求1至6中任一项的单据读出系统,其特征在于上述第1和第2输入装置的特征测试图包含线格的读出精度的信息;上述变更装置,根据上述计算装置的线格读出精度信息的计算结果,变更上述单据图像数据或上述单据定义的线格的读出精度。
8.如权利要求1至7中任一项的单据读出系统,其特征在于上述第1和第2输入装置的特征测试图包含字符的读出精度的信息;上述变更装置,根据上述计算装置的字符读出精度信息的计算结果,变更上述单据图像数据或上述单据定义在所包含的字符的切出精度的参数。
9.如权利要求1的单据读出系统,其特征在于上述读出装置存储多个字符识别用的词典,根据上述计算结果切换在包含于单据图像数据中的字符数据的字符识别中使用的词典。
10.一种单据读出方法,其特征在于包括经网络取得单据图像数据;取得依赖于该单据图像数据输入中使用的第2输入装置的该单据图像数据中的特性值;读出对于该单据图像数据的单据定义和对应该单据定义存储的对该定义使用的第1输入装置的上述特性值的第1信息;计算上述第1和第2信息的差异;利用上述计算装置的结果校正上述单据定义或上述单据图像数据;以及利用上述单据定义读出上述单据图像数据。
11.如权利要求10的单据读出方法,其特征在于在上述计算结果、上述第1和第2信息的差异在预定值以上的场合,经网络通知上述第2输入装置。
12.一种用来由接收机执行单据读出方法的程序,其特征在于包括取得存储于存储装置中的单据定义和生成该单据定义时使用的图像的输入装置的第1特征测试图的步骤;从连接的图像数据输入装置取得单据的图像数据的步骤;读出存储于存储装置中的上述图像数据的输入装置的第2特征测试图的步骤;计算上述2个特征测试图的差异的步骤;利用上述计算结果变更上述单据图像数据或上述单据定义,使上述2个特征测试图近似的步骤;利用上述单据定义从上述图像数据读出信息的步骤;以及将上述读出的信息存储于存储装置的步骤。
全文摘要
一种单据读出的系统、方法和程序,即使在单据定义时和单据读出时扫描环境不同,及利用多个扫描仪进行单据定义或单据读出,也可以生成和使用单一单据定义DB,并可以自动检测随时间劣化及故障等的扫描仪状态。该单据读出系统包括将单据定义和第1输入装置的特征测试图进行存储的存储装置;经网络取得单据图像数据和第2输入装置的特征测试图的装置;从上述存储装置读出该单据图像数据的单据定义和上述第1输入装置的特征测试图的装置;计算上述第1和第2输入装置的特征测试图的差异的装置;利用上述计算装置的结果使上述两个特征测试图近似的装置;以及利用上述单据定义读出上述单据图像数据的装置。
文档编号G06K9/36GK1452119SQ0215137
公开日2003年10月29日 申请日期2002年11月21日 优先权日2002年4月12日
发明者古川直広, 嶺竜治, 酒匂裕 申请人:株式会社日立制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1