表单处理系统、ocr装置、表单制作装置及其处理方法

文档序号:6424776阅读:150来源:国知局
专利名称:表单处理系统、ocr装置、表单制作装置及其处理方法
技术领域
本发明涉及一种对表单进行制作以及读取的表单处理系统、OCR装置、表单制作装置以及表单处理方法。
背景技术
近年来,在各领域中进行着无纸化,但是例如在组织的基础业务中,发票、考勤表、 调查表、试卷以及医院的诊断表等仍然使用印刷在纸张上的表单。用户为了有效地管理之后通过手写等填写在表单上的信息,利用扫描仪读取表单,利用OCR (Optical Character Reader 光符阅读机)装置实施OCR处理。但是,在表单的布局、格式不正确的情况下,有时无法正确地进行OCR处理。因此, 公开了一种技术,即根据由用户输入的OCR型号、行字段数、字符数自动生成表单格式(例如专利文献1)。另外,提出了一种信息处理装置,即将从表单读取到的图像数据与作为选择基准的多个选择基准图像数据进行比较,选择对应于从表单读取到的图像数据的选择基准图像数据,根据该选择基准图像数据来进行0 CR处理(例如专利文献2)。专利文献1 日本特开平8-30659号公报专利文献2 日本特开2000-132542号公报

发明内容
发明要解决的问题以往,利用OCR装置有时无法对扫描仪所读取到的表单的图像数据正确地进行 OCR处理。另外,有时以OCR处理的精度为优先而仅能将表单的布局固定地形成。因此,本发明是鉴于这种问题而完成的,目的在于提供一种能够提高表单的OCR 处理精度的表单处理系统、OCR装置、OCR处理程序、表单制作装置、表单制作程序以及表单处理方法。用于解决问题的方案为了解决上述问题,本发明的表单处理系统包括表单制作装置和OCR装置,表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其将所生成的布局信息发送给OCR装置,其中,OCR装置具有布局获取部,其获取从表单制作装置发送过来的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪所读出到的表单的图像数据进行OCR处理。OCR装置还可以具有辅助生成部,其生成用于辅助生成布局信息的辅助信息;以及辅助发送部,其将辅助信息发送给表单制作装置,其中,表单制作装置还具有辅助获取部,该辅助获取部获取发送过来的辅助信息,布局生成部根据所获取到的辅助信息来生成布局信息。在辅助信息中也可以包含与使用于OCR装置的OCR处理部的算法有关的算法信肩、ο
辅助生成部还可以根据OCR处理的结果来生成表示所获取到的辅助信息的改进点的改进信息,在辅助信息中包含改进信息。表单制作装置还可以具有基准生成部,该基准生成部根据所生成的布局信息来生成基准数据,该基准数据为与OCR处理的结果进行比较的基准,布局发送部将基准数据发送给OCR装置,OCR装置还具有基准获取部,该基准获取部获取发送过来的基准数据,辅助生成部根据获取到的基准数据和OCR处理的结果来生成改进信息。表单制作装置还可以具有数据输出部,该数据输出部将所生成的布局信息输出到打印机,在所生成的布局信息中包含用于定义可变表单的可变信息,该可变表单是表单中的输入区域可变的表单,当数据输出部将已确定可变信息中的输入区域的布局信息输出到打印机时,布局发送部将已确定可变信息中的输入区域的布局信息发送给OCR装置。还可以包括打印机和图像读取装置,表单制作装置还具有输出控制部,其在打印机印刷表单的情况下,控制打印机使其在预先确定的印刷条件下进行印刷;以及读取控制部,其在由图像读取装置读取表单的情况下,指定图像读取装置的动作方法。表单制作装置还具有不使用要素决定部,其决定布局信息中的不使用的图像要素;以及参考用图像生成部,其根据布局信息来生成排除了由不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据,布局发送部将布局信息或者参考用图像数据发送给OCR装置,OCR装置还具有图像校正部,该图像校正部在接收到参考用图像数据的情况下根据该参考用图像数据来校正扫描仪读取到的表单的图像数据。OCR装置还可以具有不使用要素决定部,其决定布局信息中的不使用的图像要素;参考用图像生成部,其根据布局信息来生成排除了由不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据;以及图像校正部,其根据参考用图像数据来校正扫描仪读取到的表单的图像数据。在由不使用要素决定部决定为不使用的图像要素中包含可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码的图案图像、包含灰色的彩色图像要素、 比预先确定的预定值细的线、比预先确定的预定值小的字符。参考用图像生成部也可以对从布局信息中排除由上述不使用要素决定部决定为不使用的图像要素而得到的图像要素进行栅格化处理。为了解决上述问题,本发明的OCR装置具有布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行OCR处理。为了解决上述问题,本发明的OCR处理程序使计算机作为以下部分而发挥功能 布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据获取到的布局信息对扫描仪读取到的表单的图像数据进行OCR处理。为了解决上述问题,本发明的表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其向OCR装置发送所生成的布局信息,该0 CR装置对在表单中填写的填写信息进行分析。为了解决上述问题,,本发明的表单制作程序使计算机作为以下部分而发挥功能 布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其向OCR装置发送所生成的布局信息,该0 CR装置对在表单中填写的填写信息进行分析。
为了解决上述问题,本发明的表单处理方法通过表单制作装置以及与表单制作装置通信连接的OCR装置来进行表单管理,表单制作装置生成表示表单布局的布局信息,并将所生成的布局信息发送给OCR装置,OCR装置获取从表单制作装置发送过来的布局信息, 并根据所获取到的布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。发明的效果如上所述,本发明能够提高表单的OCR处理精度。


图1是表示表单处理系统的概要连接关系的说明图。图2是表示表单制作装置的结构的功能框图。图3是表示表单布局的一例的说明图。图4是用于说明布局信息(特征信息以及数据属性信息)的说明图。图5是用于说明参考用图像数据的说明图。图6是表示OCR装置的结构的功能框图。图7是用于说明改进信息的说明图。图8是表示表单处理方法测试时的整体处理流程的序列图。图9是表示表单处理方法使用时的整体处理流程的序列图。附图标记说明100 表单处理系统;110 表单制作装置;120 0 CR装置;130 打印机;140 扫描仪;152 表单;160 布局生成部;162 不使用要素决定部;164 参考用图像生成部;166 辅助获取部;170 基准生成部;172 布局发送部;174 数据输出部;192 参考用图像数据; 220 布局获取部;224 图像校正部;2 :0CR处理部;2 辅助生成部;230 基准获取部; 232 辅助发送部。
具体实施例方式下面,参照附图详细说明本发明的优选实施方式。上述实施方式示出的尺寸、材料、其它具体的数值等仅是用于使发明的理解变得容易的例示,除了具有特别说明的情况以外,并不限定本发明。此外,在本说明书以及附图中,对实质上具有相同的功能、结构的要素附加相同的附图标记来省略重复说明,另外省略与本发明没有直接关系的要素的图示。(表单处理系统100)图1是表示表单处理系统100的概要连接关系的说明图。表单处理系统100构成为包括表单制作装置110、0CR装置120、打印机130、扫描仪140。表单制作装置110通过因特网、LAN(LocalArea Network 局域网)、专用线路等通信网150与OCR装置120相连接。 另外,表单制作装置110例如通过LAN与打印机130相连接,OCR装置120例如通过LAN与扫描仪140相连接。当接收到由用户输入的制作布局的输入时,表单制作装置110生成表示表单152 布局(与布局有关的信息)的布局信息。然后,打印机130印刷所生成的该布局信息的表单152。用户在印刷出的表单152上通过手写、盖印以及冲压等记载例如业务上的信息。当向表单152的记载完成时,扫描仪140读取记载有信息的表单152,OCR装置120对读取到的该图像数据进行OCR处理,获取填写在表单152上的填写信息。例如,提出了一种表单制作装置,即根据由用户手动输入的OCR型号、行字段数、 字符数来自动生成表单格式。但是,这种表单制作装置仅自动地调整要制作的表单的文本框、表单尺寸,存在要确定OCR型号等麻烦。并且,在反复读取同一布局的表单的情况下,为了提高OCR处理精度,用户必须对OCR装置指定成为读取对象的表单的读取位置等。另外,将由扫描仪140读取到的成为OCR处理对象的图像数据与成为OCR处理的参考的图像数据(以下称为参考用图像数据)进行比较来校正图像数据的位置偏移、倾斜, 由此能够提高OCR处理精度。作为生成这样的参考用图像数据的手段,例如可考虑以下手段利用扫描仪140 读取印刷出的表单152,由用户判断印刷的字符、格线等根据数据不同而可变的部分,在图像处理中将其删除而设为参考用图像数据;使用空数据作为与可变的部分有关的数据,印刷表单152,利用扫描仪140读取而设为参考用图像数据。例如在进行印刷、利用扫描仪140读取时,在存在由于颜色(包括黑色)变浅等浓度变化的影响而很有可能使OCR处理精度下降的部分的情况下,如果是前一方法,则用户要对这些部分分别进行逐一指示删除的操作,而判断哪一部分容易受到浓度变化的影响等是困难的,有可能产生作业错误而增加用户的作业负担。至于后一方法,存在无法避免浓度变化的影响而使OCR处理精度下降的情况。另外,用户需要特意准备空数据作为表单152输出而使作业负担增加。并且,无法删除自动地生成的表单152的输出日期和时间、页码、连号等字符、标记。另外,在所生成的参考用图像数据中残留按照每个表单152而可变的可变部分的情况下,使用哪一方法都会使OCR处理精度下降。另外,在读取印刷过一次的表单152时,表单152起皱或者在表单152上附着脏污都会导致无法得到正确的参考用图像数据而使OCR 处理精度下降。本实施方式所涉及的表单处理系统100在表单制作装置110生成布局信息时,还将该布局信息共用于OCR装置120的OCR处理。特别是,在使用参考用图像数据的情况下, 表单制作装置110生成不包含位置偏移、倾斜的校正所不需要的信息的参考用图像数据, 发送给OCR装置120。因而,根据该表单处理系统100,能够在减轻用户的作业负担的同时提高OCR处理精度。下面,按照表单制作装置110、OCR装置120的顺序详细说明表单制作装置110、OCR装置120的结构。(表单制作装置110)图2是表示表单制作装置110的结构的功能框图。表单制作装置110构成为包括显示部154、操作部156、中央控制部158。显示部巧4包括液晶显示器、有机EL (Electro Luminescence 电致发光)显示器等。操作部156包括设置于显示部154的显示面上的触摸面板、设置有多个操作键的键盘、 鼠标等指示装置、十字键以及操纵杆等。表单制作装置110在显示部154中显示布局制作画面,接受用户通过操作部156的操作输入而生成表单152的布局。图3是表示表单152的布局的一例的说明图。如图3所示,作为表单152的布局, 例如设定文本框182a、字符182b、基准标记182c、条形码182d等的配置。在此,在OCR装置120对扫描仪140所读取的图像数据实施0 CR处理时,基准标记182c成为表单152的方向以及布局位置的基准。另外,条形码182d是按照规定的规则对任意的信息进行编码而得到的,例如表示识别表单152的表单ID。表单制作装置110根据用户通过操作部156的操作输入来设定图3示出的布局。 此时,表单152包括作为汇总具有规则性的输入方式的区域的多个输入区域184。输入区域184例如被文本框18 包围。在输入区域184中能够按照每个输入区域184来设定假设为要填写的字符种类(英文、数字、日文、符号等)、属性(手写字符、铅字等)等。中央控制部158通过半导体集成电路来控制表单制作装置110整体,其中,该半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部158还作为布局生成部160、不使用要素决定部162、参考用图像生成部164、辅助获取部166、基准生成部168、布局发送部170、数据输出部172、输出控制部174以及读取控制部176而发挥功能。布局生成部160根据用户通过操作部156输入操作而设定的布局来生成表示表单 152布局的布局信息。在布局信息中包含特征信息、OCR属性信息。特征信息是注释(字典)等表示布局特征的信息,例如对格线、字符设定其位置、线类型等。OCR属性信息是表示成为OCR处理的对象的位置(以下称为OCR位置)、成为该OCR处理的对象的字符、标记等数据属性的信息。下面,根据图4说明特征信息以及0 CR属性信息。图4是用于说明布局信息(特征信息和数据属性信息)的说明图。特别是,图4 的(a)示出文本框18 的布局信息(特征信息),图4的(b)示出字符182b的布局信息 (特征信息),图4的(c)示出输入区域184的布局信息(OCR属性信息)。如图4的(a)所示,文本框18 的布局信息例如包括布局ID 190a、表单ID 190b、基准点坐标190c、行列 190d、尺寸190e、线宽190f、线类型190g、颜色190h等。布局ID 190a是识别该文本框18 的识别信息。表单ID 190b是识别成为表单 152的源的布局信息的识别信息。基准点坐标190c表示成为该文本框18 的基准的点、例如文本框18 左下角的点的坐标。在本实施方式中,坐标系例如以表单152左下角基准标记182c为原点,将横向方向设为χ轴而将纵向方向设为y轴。行列190d表示进一步分割被该文本框18 包围的区域的情况下的行和列的数量。另外,布局信息(特征信息)也可以是不以表为单位设定文本框18 而以进一步分割被该文本框18 包围的区域而得到的块为单位设定该文本框18 的信息。尺寸190e例如表示进一步分割被该文本框18 包围的表而得到的块的宽度和高度,在行、列不同而宽度、高度不同的情况下,按照每个行或者每个列进行设定。文本框18 的线宽190f、线类型190g、颜色190h也同样地,在由于行、列不同而不同的情况下也按照每个行或者每个列进行设定。此时,在相邻的行、列中文本框18 的线宽190f、线类型190g、 颜色190h不同的情况下,文本框18 夹持的部分例如以通过用户的操作输入而在后面进行的设定优先。另外,并不限于利用格线包围四周的文本框182a,还能够单独地设定格线。如图4的(b)所示,字符182b的布局信息例如包括布局ID190a、表单ID 190b、基准点坐标190c、大小190i以及内容190j等。大小190i表示字符182b的大小,内容190j 表示“采购发票” “年” “月” “日”等实际要印刷的字符182b本身。另外,在字符182b例如为连号的发票编号、根据用户不同而不同的用户编号而可变的情况下,也可以在布局信息中包含表示字符182b的变更规则的可变信息。如图4的(c)所示,输入区域184的布局信息例如包括布局ID190a、表单ID 190b、 基准点坐标190c、尺寸190e、字符种类190k、属性1901以及颜色190m等。如上所述,字符种类190k是假设为被填写的字符的种类,例如能够设定英文、数字、日文平假名、日文片假名、标记、日文等。关于属性1901,如果填写的方法为手写则能够设定手写字符、如果是印刷、数据符号等则能够设定铅字等。图4示出的布局信息(特征信息和数据属性信息)仅是一例,除了设定基准标记 182c、条形码182d以外还可设定能够记载于表单152的各种结构要素的信息。另外,特征信息例如也可以用PDLO^ge Description Language 页面描述语言)等各种数据形式来表不。另外,上述参考用图像数据是将通过用户的操作输入而设定的布局例如图像化 (栅格化)为使用了 RGB、CMYK等表色方法的位图形式等而得到的图像数据。但是,在仅使布局图像化时,例如由于上述的进行印刷、扫描仪140读取时产生浓度变化的部分、自动地生成的表单152的输出日期和时间、页码、连号等字符、标记这种按照每个表单152而可变的可变部分的影响,很有可能使OCR处理精度下降。因此,本实施方式的表单制作装置110 具备不使用要素决定部162。不使用要素决定部162决定布局信息中的不使用图像要素。参考用图像生成部 164根据布局信息并例如参照不使用要素决定部162对每个图像要素附加的表示是否可以图像化的图像化标志,生成排除了由不使用要素决定部162决定为不使用的(图像化标志为不可(false:假))的图像要素而得到的参考用图像数据。在本实施方式中,图像要素是与布局信息中的图3示出的文本框182a、字符182b、基准标记182c、条形码182d等各个项目对应的信息。图5是用于说明参考用图像数据的说明图。在表单制作装置110中,关于不使用要素决定部162,例如“付款通知单”“采购发票”等固定的文字(字符)、实线格线、文本框、 白色(在RGB中表示为(255、255、255))、黑色(在RGB中表示为(0、0、0))的图像要素不会使OCR处理精度下降,因此不使用要素决定部162将这些图像要素的图像化标志设为可 (true 真)ο另外,由不使用要素决定部162决定为不使用的图像要素包含可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码等的图案图像、包含灰色的彩色图像要素、比预先确定的预定值细的线、比预先确定的预定值小的字符。关于这些图像要素, 由于打印机130、扫描仪140的性能差、处理方式不同等原因,在所生成的参考用图像数据中有时线的粗细、分辨率、颜色、半色调点的结构产生差或者产生干涉条纹。不使用要素决定部162将这些图像要素的图像化标志设为false (不可)。根据上述结构,能够从参考用图像数据更可靠地排除导致OCR处理精度下降的图像要素。如图5所示,表单制作装置110的参考用图像生成部164生成排除了由不使用要素决定部162决定为不使用的图像要素的参考用图像数据192,将该参考用图像数据192发送到OCR装置120,在此不使用的图像要素为虚线、可变的字符串、条形码的图像要素。后述的OCR装置120的图像校正部对参考用图像数据192以及由扫描仪140读取到的表单152 的图像数据进行位置偏移、倾斜的校正。
通过OCR装置120根据排除了不使用的图像要素而得到的参考用图像数据进行 OCR处理的结构,避免由于用户的判断错误等而在参考用图像数据中残留按照每个表单 152变化的可变部分的情况,与用户的技能无关,能够提高OCR处理精度。另外,不需要对不使用的图像要素逐一进行指示删除的操作或者准备空数据,从而能够大幅减轻用户的作业负担。并且,与读取印刷过一次的数据152来生成参考用图像数据的情况相比,本实施方式的表单制作装置110不受表单152的褶皱、附着于表单152的脏污的影响,由此OCR处
理精度较高。另外,参考用图像生成部164仅使从布局信息排除了由不使用要素决定部162决定为不使用的图像要素而得到的图像要素栅格化。因此,与使所有图像要素栅格化之后从参考用图像数据删除不使用的图像要素部分的情况相比,能够使参考用图像生成部164的处理负载减少,减少量为使不使用的图像要素栅格化的处理量。辅助获取部166获取从后述的OCR装置120发送过来的辅助信息。在辅助获取部 166获取到辅助信息的情况下,布局生成部160能够根据该辅助信息生成布局信息。在辅助信息中包含与使用于OCR装置120的OCR处理部中的算法有关的算法信息,例如为OCR装置120的型号名称或者在OCR装置120的OCR处理部中使用的OCR处理软件的名称或者版本。布局生成部160与辅助获取部166所获取的算法信息相应地对布局信息施加限制。例如在根据用户的操作输入配置文本框18 的情况下,布局生成部160对该文本框 18 的线宽190f设置下限值。例如在算法信息为OCR处理软件的名称和版本的情况下,根据以该OCR处理软件和版本确定的算法的性能来设定该下限值。同样地,布局生成部160根据算法信息对基准标记182c的大小190i和配置(基准点坐标190c)、条形码182d的大小190i、扫描仪140无法读取的滤色、字符种类190k、属性1901等设定项目施加限制。另外,在用户指示了文本框18 等结构要素的配置的情况下,布局生成部160也可以根据算法信息来决定该结构要素的布局信息所含的上述设定项目的初始值。根据使用算法信息的结构,能够减少用于确认表单152的OCR处理精度的测试以及观察该测试的OCR处理结果来修正布局信息这种作业的反复次数,能够大幅减轻用户的作业负担。基准生成部168根据布局生成部160所生成的布局信息来生成成为与OCR装置 120中的OCR处理的结果进行比较的基准的基准数据。后面详细说明基准数据。布局发送部170将布局信息、基准数据发送给OCR装置120。另外,布局发送部170 将排除了由不使用要素决定部162决定为不使用的图像要素而得到的参考用图像数据发送给OCR装置120。数据输出部172将布局信息变换为与印刷对应的形式之后输出到打印机 130。输出控制部174在印刷表单152的情况下控制打印机130使其在预定的印刷条件下进行印刷。并不限于输出控制部174直接控制打印机130的情况,也可以是以下情况输出控制部174将禁止变更的印刷条件等控制信息输出到打印机130,打印机130根据该控制信息来设定印刷条件。
在随意地在打印机130中变更印刷条件而例如进行缩小印刷时,印刷出的表单 152的字符大小变小或者线的粗细变细,从而有可能使OCR处理精度下降。输出控制部174 控制打印机130使其在预定的印刷条件下进行印刷,从而能够避免以上的情况。读取控制部176将指定扫描仪140读取表单152并转换为图像数据时的分辨率、 读取后执行的应用程序、命令的指定信息通过通信网150输出到扫描仪140。并不限于通过上述通信网150输出,读取控制部176也可以将指定信息例如作为条形码182d嵌入于表单 152,扫描仪140从该条形码182d获取指定信息。根据具备上述读取控制部176的结构,能够以适合于OCR处理的分辨率生成图像数据或者利用扫描仪140的应用程序、命令来校正生成后的图像数据,从而能够进一步提高OCR处理精度。(OCR 装置 120)图6是表示OCR装置120的结构的功能框图。OCR装置120构成为包括显示部 200、操作部202、存储装置204、中央控制部206。显示部200包括液晶显示器、有机EL显示器等。操作部202包括设置于显示部200 的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键、操纵杆等。存储装置204包括HDD (Hard Disk Drive 硬盘驱动器)、快闪存储器、非易失性 RAM (Random Access Memory 随机存取存储器)等,存储布局信息等。在本实施方式中, 存储装置204与OCR装置120 —体地形成,但是并不限于上述情况,也可以是独立的例如 NAS (Network Attached Storage 网络附加存储)、外置 HDD、USB (Universal Serial Bus 通用串行总线)存储器等。中央控制部206通过半导体集成电路来控制OCR装置120整体,其中,该半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部206还作为布局获取部220、图像获取部222、图像校正部224、0CR处理部226、辅助生成部228、基准获取部230以及辅助发送部232而发挥功能。布局获取部220获取从表单制作装置110发送过来的布局信息或者参考用图像数据,存储到存储装置204。图像获取部222从扫描仪140获取读取表单152而生成的图像数据。在布局获取部220预先接收到参考用图像数据的情况下,图像校正部2M根据存储在存储装置204中的参考用图像数据对由扫描仪140读取到的表单152的图像数据进行位置偏移、倾斜的校正。存储在存储装置204中的参考用图像数据例如与表单152的表单 ID相对应,图像校正部224能够参照与所生成的表单152的图像数据对应的参考用图像数据。另外,在本实施方式中设为以下结构表单制作装置110具备不使用要素决定部 162和参考用图像生成部164,由OCR装置120接收在表单制作装置110中生成的参考用图像数据,但是也可以是以下结构即OCR装置120具备不使用要素决定部162和参考用图像生成部164。OCR处理部2 例如以图像获取部222获取到的图像数据的图像中的基准标记 182c为基准,读取以条形码182d等形式记载的表单152的表单ID。另外,OCR处理部226 从存储装置204读出包含该表单ID的布局信息,根据读出的布局信息对扫描仪140所读取的表单152的图像数据进行OCR处理(从图像数据中抽取该图像数据所示的字符、数字等内容的处理)。本实施方式的0 CR装置120根据从表单制作装置110获取到的布局信息进行 OCR处理,因此例如文本框18 的位置、读取写入信息的位置可知,从而能够提高OCR处理精度。并且,与例如由扫描仪140读取印刷出的表单152而生成图像数据并根据该图像数据进行位置偏移、倾斜的校正的情况相比,根据布局信息、参考用图像数据进行OCR处理的 OCR装置120不受附着于表单152的脏污、表单152的褶皱的影响,从而能够提高OCR处理精度。另外,在0 CR装置120中共用由表单制作装置110生成的布局信息,因此用户不需要分别在表单制作装置110和0 CR装置120中进行相同的设定,从而能够减轻用户的作业负担。并且,在根据条件变更、根据OCR处理的结果需要提高0 CR处理精度而对制作过一次的表单152进行布局信息的修正的情况下,也同样地在表单制作装置110和OCR装置120 中共用在表单制作装置110中修正过的布局信息,从而能够减轻用户的作业负担。另外,在布局信息中包含对可变表单进行定义的可变信息,该可变表单是表单152 中的输入区域184的例如形状、大小190i、配置、分割数等可变的表单。如果在处理这种可变表单的情况下不采用任何方法,则OCR处理部2 不得不仅根据图像数据估计该输入区域184,有时无法得到适当的OCR结果。因此,在本实施方式中, 表单制作装置110根据用户的输入操作来确定布局信息中的作为可变信息的输入区域184 的形状、大小190i、配置、分割数等,当数据输出部172将包含确定了可变信息中的输入区域184的可变信息的布局信息输出到打印机130时,以该数据输出部172的输出为契机,布局发送部170将确定了该输入区域184的布局信息发送给OCR装置120。另外,在要在打印机130中确定输入区域184的形状、大小190i、配置、分割数等的情况下,布局发送部170 也可以以来自打印机130的表单152的实际印刷为契机,将确定了该输入区域184的布局信息发送给OCR装置120。根据上述结构,在OCR装置120中布局信息的输入区域184已确定,因此能够根据正确的输入区域184的信息来提高OCR处理精度,并且由于成为OCR处理的对象的区域缩小,因此能够降低处理负载。另外,这种情况下的布局信息也可以是上述的与用户的操作输入相应的表单152 的布局的参考用图像数据。例如,OCR装置120将扫描仪140所读取的表单152的图像数据例如格线的位置等以与作为布局信息的参考用图像数据一致地方式进行校正之后,进行 OCR处理。即使根据上述结构也能够提高OCR处理精度。辅助生成部2 生成辅助信息,该辅助信息辅助布局信息的生成。并且,在辅助信息中还包含表示布局信息的改进点的改进信息。以上说明了辅助信息中的算法信息,因此在此详细说明改进信息。图7是用于说明改进信息的说明图。特别是,图7的(a)表示布局信息的一例,图 7的(b)表示改进信息的一例,图7的(c)表示基准数据的一例。辅助生成部2 参照由布局获取部220获取到的例如图7的(a)示出的与输入区域184有关的布局信息。前面使用图4的(c)说明了上述布局信息,因此省略说明。另外,辅助生成部2 确认由OCR处理部2 进行OCR处理的结果,即确认对以所参照的布局信息表示的、应该读取写入信息的分割得到的输入区域184是否读取出写入信息(读取成功与否)。例如在读取手写字符的情况下,OCR处理部2 对于与登记于OCR处理软件的基准字符进行对照的结果是判断为最接近的字符,将表示与基准字符匹配的程度的指标值与规定阈值进行比较来判断读取成功与否。能够根据用户的操作输入来变更该阈值。辅助生成部2 根据OCR处理结果生成图7的(b)示出的使布局信息中的表示分割得到的该输入区域184的布局ID 190a与读取成功与否(读取成功与否250)相关联的
改进信息。这样,改进信息例如表示OCR处理的结果、准确地说是在应该读取写入信息的分割得到的输入区域184中读取失败的情况。在布局生成部160中根据该改进信息例如以红色填充读取失败的分割得到的输入区域184或者染红包围分割得到的该输入区域184的文本框18 来促使用户改进。并且,根据用户的操作输入,例如进行增大输入区域184、文本框18 的大小190i等布局信息的修正来实现提高0 CR处理精度。根据使用上述改进信息的结构,即使不按照每个输入区域184确认写入信息的读取成功与否也自动地进行提示,因此能够减轻用户的作业负担,并且能够避免看漏要改进的点这种情况。另外,使用上述表单制作装置110的基准生成部168所生成的基准数据,能够使改进信息作为更有益的信息而有效地实现改进。基准生成部168所生成的基准数据是不包含于布局信息的使用于确认OCR处理精度的测试中的数据。基准数据例如包含图7的(c)示出的表示分割得到的输入区域184的布局ID 190a、用户用于进行测试而写入到分割得到的该输入区域184的字符的大小^Oa以及内容^0b。在这种情况下,用户预先对在表单152中分割得到的输入区域184写入被确定为基准数据的例如大小260a、内容^Ob的字符。另外,并不限于手写字符,也可以利用打印机 130印刷被确定为基准数据的字符。在这种情况下,不受用户手写字符的好坏限制,能够可靠地检测由扫描仪140的图像失真等引起的读取失败而改进OCR处理精度。之后,OCR装置120的图像获取部222通过扫描仪140获取该表单152的图像数据。基准获取部230获取布局发送部170所发送的基准数据。辅助生成部2 根据基准获取部230所获取到的基准数据以及0 CR处理的结果来生成改进信息。辅助生成部2 例如将表示确定了大小沈彻、内容^Ob的字符等的基准数据与实际被写入了字符等的表单152的图像数据的OCR处理结果进行比较,生成改进信息,后述的辅助发送部232将该改进信息发送给表单制作装置110。表单制作装置110根据该改进信息来修正布局信息。根据使用上述基准数据的结构,能够进行是否存在字符错误识别等详细的比较,从而能够提高布局信息的改进精度。如上所述,通过使用算法信息、改进信息这种辅助信息,表单制作装置110能够共享可在0 CR装置120侧掌握的信息,表单制作装置110的布局生成部160能够生成容易进行OCR处理的布局信息。辅助发送部232将由辅助生成部228生成的辅助信息发送给表单制作装置110。以上,通过所说明的表单制作装置110和OCR装置120,能够在大幅减轻用户的作业负担的同时提高OCR处理精度。另外,还提供使计算机作为表单制作装置110而发挥功能的表单制作程序以及作为OCR装置120而发挥功能的OCR处理程序、存储有该表单制作程序和OCR处理程序的计算机可读取的软盘、光磁盘、R0M、EPR0M、EEPR0M、CD(Compact Disc 致密光盘)、DVD (Digital Versatile Disc 数字多功能光盘)、BD (Blu-ray Disc 蓝光光盘)等存储介质。在此,程序是指通过任意的语言、描述方法描述的数据处理方法。另外,该表单制作程序和OCR处理程序也可以被存储在通过通信网150与表单制作装置110或者OCR装置120相连接的任意的应用程序服务器,根据需要还能够下载其全部或者一部分。(表单处理方法)接着,说明进行上述表单处理程序的使用的表单处理方法。图8是表示表单处理方法测试时的整体处理流程的序列图,图9是表示表单处理方法使用时的整体处理流程的序列图。如图8所示,当OCR装置120将包含算法信息的辅助信息发送给表单制作装置110 时(S 300),在表单制作装置110中,布局生成部160根据用户的操作输入来生成表示表单 152的布局的布局信息(S 302)。然后,按照印刷表单152的操作输入,数据输出部172将确定了输入区域184的布局信息变换为与印刷对应的形式之后输出到打印机130(S304)。 打印机130印刷表单152(S306)。不使用要素决定部162决定布局信息中的不使用的图像要素(S308)。参考用图像生成部164根据布局信息生成排除了由不使用要素决定部162决定为不使用的图像要素而得到的参考用图像数据(S 310)。然后,基准生成部168根据确定了输入区域184的布局信息来生成基准数据(S 310)。布局发送部170将布局信息、参考用图像数据、基准数据发送给OCR装置120 (S 314)。用户在印刷出的表单152中例如记载显示在显示部154中的基准数据所示的确定了大小260a、内容^Ob的字符等。在印刷出的表单152中记载了信息之后,扫描仪140读取记载了该信息的表单 152 (S 316),将图像数据发送给OCR装置120 (S318)。OCR装置120的图像校正部2M根据参考用图像数据对由扫描仪140读取并生成的表单152的图像数据进行位置偏移、倾斜的校正(S320)。OCR处理部2 根据布局信息对图像数据进行OCR处理(S32》。然后,辅助生成部2 根据OCR处理的结果和基准数据来生成改进信息(S324)。辅助发送部232将改进信息发送给表单制作装置110(S326)。表单制作装置110的布局生成部160根据改进信息来促使用户改进,修正布局信息(S328)。如图9所示,在使用时,按照印刷表单152的操作输入,表单制作装置110的数据输出部172将确定了输入区域184的布局信息变换为与印刷对应的形式之后输出到打印机 130 (S 340)。表单制作装置110的不使用要素决定部162决定布局信息中的不使用的图像要素(S 342)。参考用图像生成部164根据布局信息生成排除了由不使用要素决定部162 决定为不使用的图像要素而得到的参考用图像数据(S344)。布局发送部170将布局信息、 参考用图像数据发送给OCR装置120 (S 346)。打印机130印刷表单152 (S 348)。将此时的表单152的布局信息设为已经通过图8示出的表单处理方法根据改进信息修正的信息。然后,用户通过手写等方式将业务上的信息记载于表单152上之后,扫描仪140读取所记载的表单152(S 350),当读取到的图像数据发送给OCR装置120时(S 352),0CR装置120的图像校正部2M根据参考用图像数据对扫描仪140读取并生成的表单152的图像数据进行位置偏移、倾斜的校正(S 354)。然后,OCR处理部2 对校正后的图像数据进行 OCR处理来获取写入信息(S 356)。上述图像数据的布局信息已经在图8中进行了修正,因此OCR处理精度也变高。根据这种表单处理方法,在图8示出的测试时以及图9示出的使用时都能够减轻用户的作业负担,并且通过使用根据改进信息修正过的布局信息能够提高OCR处理精度。以上,参照

了本发明的优选实施方式,但是当然本发明并不限于上述实施方式。本领域技术人员在记载于权利要求的范围内的范畴中能够想得到各种变更例或者修正例是显而易见的,这些也当然理解为属于本发明的技术范围。此外,本说明书的表单处理方法中的各工序不一定按照记载为序列图的顺序以时间序列进行处理,还可以包含并列或者子程序的处理。产业上的可利用件能够将本发明利用于进行表单的制作以及读取的表单处理系统、OCR装置、OCR处理程序、表单制作装置、表单制作程序以及表单处理方法。
权利要求
1.一种表单处理系统,包括表单制作装置和OCR装置, 上述表单制作装置具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其将所生成的上述布局信息发送给上述OCR装置, 其中,上述OCR装置具有布局获取部,其获取从上述表单制作装置发送过来的布局信息;以及 OCR处理部,其根据获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行 OCR处理。
2.根据权利要求1所述的表单处理系统,其特征在于, 上述OCR装置还具有辅助生成部,其生成用于辅助生成上述布局信息的辅助信息;以及辅助发送部,其将上述辅助信息发送给上述表单制作装置,其中,上述表单制作装置还具有辅助获取部,该辅助获取部获取发送过来的上述辅助 fn息,上述布局生成部根据所获取到的上述辅助信息来生成上述布局信息。
3.根据权利要求2所述的表单处理系统,其特征在于,在上述辅助信息中包含与使用于上述OCR装置的OCR处理部的算法有关的算法信息。
4.根据权利要求2或者3所述的表单处理系统,其特征在于,上述辅助生成部根据上述OCR处理的结果来生成表示所获取到的上述布局信息的改进点的改进信息,在上述辅助信息中包含上述改进信息。
5.根据权利要求4所述的表单处理系统,其特征在于,上述表单制作装置还具有基准生成部,该基准生成部根据所生成的上述布局信息来生成基准数据,该基准数据为与上述OCR处理的结果进行比较的基准, 上述布局发送部将上述基准数据发送给上述OCR装置, 上述OCR装置还具有基准获取部,该基准获取部获取发送过来的上述基准数据, 上述辅助生成部根据所获取到的上述基准数据和上述OCR处理的结果来生成上述改进fe息。
6.根据权利要求1至5中的任一项所述的表单处理系统,其特征在于,上述表单制作装置还具有数据输出部,该数据输出部将所生成的上述布局信息输出到打印机,在所生成的上述布局信息中包含用于定义可变表单的可变信息,该可变表单是表单中的输入区域可变的表单,当上述数据输出部将已确定上述可变信息中的输入区域的布局信息输出到上述打印机时,上述布局发送部将已确定上述输入区域的布局信息发送给上述OCR装置。
7.根据权利要求1所述的表单处理系统,其特征在于, 还包括打印机和图像读取装置,上述表单制作装置还具有输出控制部,其在上述打印机印刷表单的情况下,控制打印机以使其在预先确定的印刷条件下进行印刷;以及读取控制部,其在由上述图像读取装置读取表单的情况下,指定图像读取装置的动作方法。
8.根据权利要求1至7中的任一项所述的表单处理系统,其特征在于, 上述表单制作装置还具有不使用要素决定部,其决定上述布局信息中的不使用的图像要素;以及参考用图像生成部,其根据上述布局信息来生成已排除由上述不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据,其中,上述布局发送部将上述布局信息或者上述参考用图像数据发送给上述OCR装置,上述OCR装置还具有图像校正部,该图像校正部在接收到上述参考用图像数据的情况下根据该参考用图像数据来校正上述扫描仪所读取出的表单的图像数据。
9.根据权利要求1至7中的任一项所述的表单处理系统,其特征在于, 上述OCR装置还具有不使用要素决定部,其决定上述布局信息中的不使用的图像要素; 参考用图像生成部,其根据上述布局信息来生成已排除由上述不使用要素决定部决定为不使用的图像要素而得到的参考用图像数据;以及图像校正部,其根据上述参考用图像数据来校正上述扫描仪所读取出的表单的图像数据。
10.根据权利要求8或者9所述的表单处理系统,其特征在于,在由上述不使用要素决定部决定为不使用的图像要素中包含可变的字符串或者数字串、点线、虚线、包含灰色的彩色填充、阴影、条形码的图案图像、包含灰色的彩色图像要素、 比预先确定的预定值细的线、或者比预先确定的预定值小的字符。
11.根据权利要求8至10中的任一项所述的表单处理系统,其特征在于,上述参考用图像生成部对从上述布局信息中排除由上述不使用要素决定部决定为不使用的图像要素而得到的图像要素进行栅格化处理。
12.—种OCR装置,具有布局获取部,其获取从制作表单的表单制作装置发送过来的表示表单布局的布局信息;以及OCR处理部,其根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。
13.一种表单制作装置,具有布局生成部,其生成表示表单的布局的布局信息;以及布局发送部,其向OCR装置发送所生成的上述布局信息,该OCR装置对在上述表单中填写的填写信息进行分析。
14.一种表单处理方法,通过表单制作装置以及与上述表单制作装置通信连接的OCR 装置来进行表单管理,上述表单制作装置生成表示表单布局的布局信息,并将所生成的上述布局信息发送给上述OCR装置,上述OCR装置获取从上述表单制作装置发送过来的布局信息,并根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。
全文摘要
提供一种表单处理系统、OCR装置、表单制作装置及其处理方法,提高表单的OCR处理精度。本发明的表单处理系统(100)包括表单制作装置(110)和OCR装置(120),表单制作装置具有布局生成部(160)和布局发送部(170),该布局生成部(160)生成表示表单(152)布局的布局信息,该布局发送部(170)将所生成的布局信息发送给OCR装置,OCR装置具有布局获取部(220)和OCR处理部(226),该布局获取部(220)获取从表单制作装置发送过来的布局信息,该OCR处理部(226)根据获取到的布局信息对扫描仪(140)读取到的表单的图像数据进行OCR处理。
文档编号G06K9/20GK102331914SQ201110136450
公开日2012年1月25日 申请日期2011年5月24日 优先权日2010年5月24日
发明者杉田敏彦, 桑村良则, 萩泽章一, 道场乡 申请人:株式会社Pfu
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1