表单处理系统、表单制作装置以及表单处理方法

文档序号:6424761阅读:172来源:国知局
专利名称:表单处理系统、表单制作装置以及表单处理方法
技术领域
本发明涉及一种对表单进行制作以及读取的表单处理系统、表单制作装置以及表单处理方法。
背景技术
近年来,在各领域中进行着无纸化,但是例如在组织的基础业务中,发票、考勤表、 调查表、试卷以及医院的诊断表等仍然使用印刷在纸张上的表单。用户为了有效地管理之后通过手写等填写在表单上的信息,利用扫描仪读取表单,利用OCR (Optical Character Reader 光符阅读机)装置实施OCR处理。但是,在表单的布局、格式不正确的情况下,有时无法正确地进行OCR处理。因此, 公开了一种技术,即根据由用户输入的OCR型号、行字段数、字符数自动生成表单格式(例如专利文献1)。另外,提出了一种信息处理装置,即将从表单读取到的图像数据与作为选择基准的多个选择基准图像数据进行比较,选择对应于从表单读取到的图像数据的选择基准图像数据,根据该选择基准图像数据来进行OCR处理(例如专利文献2)。专利文献1 日本特开平8-30659号公报专利文献2 日本特开2000-132542号公报

发明内容
发明要解决的问题以往,无法利用OCR装置对扫描仪所读取到的表单的图像数据正确地进行OCR处理。另外,也存在以OCR处理的精度为优先而仅能使表单的布局固定地形成的情况。因此,本发明是鉴于这种问题而完成的,目的在于提供一种能够提高表单的OCR 处理精度的表单处理系统、OCR装置、OCR处理程序、表单制作装置、表单制作程序以及表单处理方法。用于解决问题的方案为了解决上述问题,本发明的表单处理系统包括表单制作装置和打印机,表单制作装置具有布局生成部,其生成表示表单布局的布局信息;绘制指示部,其根据布局信息,使打印机的绘制执行部生成与该布局信息的至少一部分对应的参考用图像数据;以及图像发送部,其将所生成的参考用图像数据发送给OCR装置,打印机具有绘制执行部,该绘制执行部根据绘制指示部的指示生成参考用图像数据。绘制指示部还可以投入印刷作业来调用绘制执行部,使绘制执行部根据印刷作业生成参考用图像数据,当获取完所生成的参考用图像数据时,取消印刷作业。在存在多个绘制执行部的情况下,绘制指示部还可以执行以下操作中的某一个操作使所有绘制执行部生成参考用图像数据;仅使预先确定的一个绘制执行部生成参考用图像数据;使所有的绘制执行部生成参考用图像数据并合成;仅使用户所选择的绘制执行部生成参考用图像数据。
为了解决上述问题,本发明的表单处理系统包括打印机和表单制作装置,打印机具有功能发送部,该功能发送部将表示印刷功能的印刷功能信息发送给表单制作装置,表单制作装置具有布局生成部,其生成表示表单布局的布局信息;绘制执行部,其根据印刷功能信息和布局信息,生成与布局信息的至少一部分对应的参考用图像数据;以及图像发送部,其将所生成的参考用图像数据发送给OCR装置。表单制作装置还可以具有布局生成部,其生成表示表单布局的布局信息;以及布局发送部,其将所生成的布局信息发送给OCR装置,OCR装置具有布局获取部,其获取从表单制作装置发送过来的布局信息;以及OCR处理部,其根据获取到的布局信息对由扫描仪读取到的表单的图像数据进行OCR处理。OCR装置还可以具有辅助生成部,其生成辅助生成布局信息的辅助信息;以及辅助发送部,其将辅助信息发送给表单制作装置,表单制作装置还具有辅助获取部,该辅助获取部获取发送过来的辅助信息,布局生成部根据获取到的辅助信息来生成布局信息。在辅助信息中还可以包含与使用于OCR装置的OCR处理部的算法有关的算法信肩、ο辅助生成部还可以根据OCR处理的结果来生成表示获取到的布局信息的改进点的改进信息,在辅助信息中包含改进信息。表单制作装置还可以具有基准生成部,该基准生成部根据所生成的布局信息来生成基准数据,该基准数据为与OCR处理的结果进行比较的基准,布局发送部将基准数据发送给OCR装置,OCR装置还具有基准获取部,该基准获取部获取发送过来的基准数据,辅助生成部根据获取到的基准数据和OCR处理的结果来生成改进信息。表单制作装置还可以具有数据输出部,该数据输出部将所生成的布局信息输出到打印机,在所生成的布局信息中包含对可变表单进行定义的可变信息,该可变表单是表单中的输入区域可变的表单,当数据输出部将确定了可变信息中的输入区域的布局信息输出到打印机时,布局发送部将确定了可变信息中的输入区域的布局信息发送给OCR装置。表单处理系统还可以包括图像读取装置,表单制作装置还具有输出控制部,其在打印机印刷表单的情况下,控制打印机使其在预先确定的印刷条件下进行印刷;以及读取控制部,其在由图像读取装置读取表单的情况下,指定该图像读取装置的动作方法。为了解决上述问题,本发明的表单制作装置具有布局生成部,其生成表示表单布局的布局信息;绘制指示部,其根据布局信息,使打印机的绘制程序生成与布局信息的至少一部分对应的参考用图像数据;以及图像发送部,其将所生成的参考用图像数据发送给 OCR装置。为了解决上述问题,本发明的表单制作程序使计算机作为以下部分而发挥功能 布局生成部,其生成表示表单布局的布局信息;绘制指示部,其根据布局信息,使打印机的绘制程序生成与布局信息的至少一部分对应的参考用图像数据;以及图像发送部,其将所生成的参考用图像数据发送给OCR装置。为了解决上述问题,本发明的表单处理方法通过表单制作装置以及与表单制作装置通信连接的OCR装置来进行表单管理,表单制作装置生成表示表单布局的布局信息,根据布局信息,使打印机的绘制程序生成与布局信息的至少一部分对应的参考用图像数据; 以及将所生成的参考用图像数据发送给OCR装置。
发明的效果如上所述,本发明能够提高表单的OCR处理精度。


图1是表示表单处理系统的概要连接关系的说明图。图2是表示表单制作装置的结构的功能框图。图3是表示表单布局的一例的说明图。图4是用于说明布局信息(特征信息以及数据属性信息)的说明图。图5是表示打印机的结构的功能框图。图6是表示其它打印机的结构的功能框图。图7是表示其它表单制作装置的结构的功能框图。图8是表示OCR装置的结构的功能框图。图9是用于说明改进信息的说明图。图10是表示表单处理方法测试时的整体处理流程的序列图。图11是表示表单处理方法使用时的整体处理流程的序列图。图12是表示其它表单处理方法测试时的整体处理流程的序列图。图13是表示其它表单处理方法使用时的整体处理流程的序列图。附图标记说明100 表单处理系统;110,350 表单制作装置;120 :0CR装置;130,300 打印机; 140 扫描仪;152 表单;160 布局生成部;162 绘制指示部;164 图像发送部;166 辅助获取部;168 基准生成部;170 布局发送部;172 数据输出部;220、372 绘制执行部;320 功能发送部;420 布局获取部;似4 图像校正部;似6 :0CR处理部;4 辅助生成部;430 基准获取部;432 辅助发送部。
具体实施例方式下面,参照附图详细说明本发明的优选实施方式。上述实施方式示出的尺寸、材料、其它具体的数值等仅是用于使发明的理解变得容易的例示,除了具有特别说明的情况以外,并不限定本发明。此外,在本说明书以及附图中,对实质上具有相同的功能、结构的要素附加相同的附图标记来省略重复说明,另外省略与本发明没有直接关系的要素的图示。(表单处理系统100)图1是表示表单处理系统100的概要连接关系的说明图。表单处理系统100构成为包括表单制作装置110、0CR装置120、打印机130、扫描仪140。表单制作装置110通过因特网、LAN (Local Area Network :局域网)、专用线路等通信网150与OCR装置120相连接。 另外,表单制作装置110例如通过LAN与打印机130相连接,OCR装置120例如通过LAN与扫描仪140相连接。当接收到由用户输入的制作布局的输入时,表单制作装置110生成表示表单152 布局(与布局有关的信息)的布局信息。然后,打印机130印刷所生成的该布局信息的表单152。用户在印刷出的表单152上通过手写、盖印以及冲压等例如记载业务上的信息。当向表单152的记载完成时,扫描仪140读取记载有信息的表单152,OCR装置120对读取到的该图像数据进行OCR处理,获取填写在表单152上的填写信息。例如,提出了一种表单制作装置,即根据由用户手动输入的OCR型号、行字段数、 字符数来自动生成表单格式。但是,这种表单制作装置仅自动地调整要制作的表单的文本框、表单尺寸,存在要确定OCR型号等麻烦。并且,在反复读取同一布局的表单的情况下,为了提高OCR处理精度,用户必须对OCR装置指定成为读取对象的表单的读取位置等。另外,将由扫描仪140读取到的成为OCR处理对象的图像数据与成为OCR处理的参考的图像数据(以下称为参考用图像数据)进行比较来校正图像数据的位置偏移、倾斜, 由此能够提高OCR处理精度。该参考用图像数据通过表单制作装置所具备的绘制功能来生成,但是表单制作装置110的绘制功能使用与打印机130不同的独立的图像生成引擎,因此有时细微部分与实际上由打印机130印刷出的表单不同。例如每个打印机130不同而可印刷区域、原点位置、 字体种类、尺寸、分辨率变换时的像素的插值方法等不同,由于该原因有可能引起位置偏移、倾斜的校正失败而使OCR处理精度下降。本实施方式所涉及的表单处理系统100在表单制作装置110生成布局信息时,还将该布局信息共用于OCR装置120的OCR处理。特别是,在使用参考用图像数据的情况下, 表单制作装置110生成更接近于实际上由打印机130印刷出的表单的参考用图像数据,发送给OCR装置120。因而,根据该表单处理系统100,能够在减轻用户的作业负担的同时提高OCR处理精度。下面,按照表单制作装置110、OCR装置120的顺序详细说明表单制作装置110、OCR装置120的结构。(表单制作装置110)图2是表示表单制作装置110的结构的功能框图。表单制作装置110构成为包括显示部154、操作部156、中央控制部158。显示部巧4包括液晶显示器、有机EL (Electro Luminescence 电致发光)显示器等。操作部156包括设置于显示部154的显示面上的触摸面板、设置有多个操作键的键盘、 鼠标等指示装置、十字键以及操纵杆等。表单制作装置110在显示部154中显示布局制作画面,接受用户通过操作部156输入的操作而生成表单152的布局。图3是表示表单152的布局的一例的说明图。如图3所示,作为表单152的布局, 例如设定文本框182a、字符18 、基准标记182c、条形码182d等的配置。在此,在OCR装置 120对扫描仪140所读取的图像数据实施OCR处理时,基准标记182c成为表单152的方向以及布局位置的基准。另外,条形码182d是按照规定的规则对任意的信息进行编码而得到的,例如表示用于识别表单152的表单ID。表单制作装置110根据用户通过操作部156输入的操作来设定图3示出的布局。 此时,表单152包括作为汇总具有规则性的输入方式的区域的多个输入区域184。输入区域184例如被文本框18 包围。在输入区域184中能够按照每个输入区域184而设定假设为要填写的字符种类(英文、数字、日文、符号等)、属性(手写字符、铅字等)等。中央控制部158通过半导体集成电路来控制表单制作装置110整体,其中,该半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部158还作为布局生成部160、绘制指示部162、图像发送部164、辅助获取部166、基准生成部168、布局发送部170、数据输出部172、输出控制部174以及读取控制部176而发挥功能。布局生成部160根据用户通过操作部156输入操作而设定的布局来生成表示表单 152布局的布局信息。在布局信息中包含特征信息、OCR属性信息。特征信息是注释(字典)等表示布局特征的信息,例如对格线、字符设定其位置、线类型等。OCR属性信息是表示成为OCR处理的对象的位置(以下称为OCR位置)、成为该OCR处理的对象的字符、标记等数据属性的信息。下面,根据图4说明特征信息以及OCR属性信息。图4是用于说明布局信息(特征信息和数据属性信息)的说明图。特别是,图4 的(a)示出文本框18 的布局信息(特征信息),图4的(b)示出字符182b的布局信息 (特征信息),图4的(c)示出输入区域184的布局信息(OCR属性信息)。如图4的(a)所示,文本框18 的布局信息例如包括布局ID 190a、表单ID 190b、基准点坐标190c、行列 190d、尺寸190e、线宽190f、线类型190g、颜色190h等。布局ID 190a是识别该文本框18 的识别信息。表单ID 190b是识别成为表单 152的源的布局信息的识别信息。基准点坐标190c表示成为该文本框18 的基准的点、例如文本框18 左下角的点的坐标。在本实施方式中,坐标系例如以表单152左下角基准标记182c为原点,将横向方向设为χ轴而将纵向方向设为y轴。行列190d表示进一步分割被该文本框18 包围的区域的情况下的行和列的数量。另外,布局信息也可以是不以表为单位设定文本框18 而以进一步分割被该文本框18 包围的区域而得到的块为单位设定该文本框18 的信息。尺寸190e例如表示进一步分割被文本框18 包围的表而得到的块的宽度和高度,在行、列不同而宽度、高度不同的情况下,按照每个行或者每个列进行设定。文本框18 的线宽190f、线类型190g、颜色190h也同样地,在由于行、列不同而不同的情况下,按照每个行或者每个列进行设定。此时,在相邻的行、列中文本框18 的线宽190f、线类型190g、 颜色190h不同的情况下,文本框18 夹持的部分例如以通过用户的操作输入而在后面进行的设定为优先。另外,并不限于利用格线包围四周的文本框182a,还能够单独地设定格线。如图4的(b)所示,字符182b的布局信息例如包括布局ID190a、表单ID 190b、基准点坐标190c、大小190i以及内容190j等。大小190i表示字符182b的大小,内容190j 表示“采购发票” “年” “月” “日”等要实际印刷的字符182b本身。另外,在字符182b例如为连号的发票编号、用户不同而不同的用户编号而可变的情况下,也可以在布局信息中包含表示字符182b的变更规则的可变信息。如图4的(c)所示,输入区域184的布局信息例如包括布局ID190a、表单ID 190b、 基准点坐标190c、尺寸190e、字符种类190k、属性1901以及颜色190m等。如上所述,字符种类190k是假设为要被填写的字符的种类,例如能够设定英文、数字、日文平假名、日文片假名、标记、日文等。关于属性1901,如果填写的方法为手写则能够设定手写字符,如果为印刷、数据符号等则能够设定铅字等。图4示出的布局信息(基准特征信息和数据属性信息)仅是一例,除了设定基准标记182c、条形码182d以外还可设定能够记载于表单152的各种结构要素的信息。另外, 基准特征信息例如也可以用PDLO3age Description Language 页面描述语言)等各种数据形式来表示。另外,上述参考用图像数据是将通过用户的操作输入而设定的布局例如图像化 (栅格化)为使用了 RGB、CMYK等表色方法的位图形式等而得到的图像数据。但是,如上所述,表单制作装置110的绘制功能使用与打印机130不同的独立的图像生成引擎,因此在细微部分有时与实际上由打印机130印刷出的表单不同。因此,有可能使OCR处理精度下降。 因此,本实施方式的表单制作装置110具备绘制指示部162。绘制指示部162根据布局信息使后述的打印机130的绘制执行部生成与布局信息的至少一部分对应的参考用图像数据。这样,本实施方式的绘制指示部162使承担打印机130的绘制功能的绘制执行部生成参考用图像数据。根据上述结构,能够生成与打印机130的各印刷功能例如可印刷区域、原点位置、字体种类、尺寸、分辨率变换时的像素的插值方法等特征匹配的参考用图像数据,能够更可靠地执行位置偏移、倾斜的校正,从而能够提高OCR处理精度。另外,绘制指示部162还可以投入印刷作业来调用绘制执行部,使绘制执行部根据印刷作业生成参考用图像数据,当获取所生成的参考用图像数据完成时,取消印刷作业。根据上述结构,打印机130不追加新功能,而能够使用印刷作业的投入和取消功能来生成参考用图像数据,从而能够以更低成本实现表单处理系统。在存在多个绘制执行部的情况下,绘制指示部162还可以执行以下操作中的某一种操作使所有绘制执行部生成参考用图像数据;仅使预先确定的一个绘制执行部生成参考用图像数据;使所有的绘制执行部生成参考用图像数据并合成;仅使用户所选择的绘制执行部生成参考用图像数据。在此,参考用图像数据的合成例如为针对单色位图形式的图像数据将每个点的值相加(求和)的处理。根据上述结构,能够按照用户的使用目的生成参考用图像数据。图像发送部164将由绘制指示部162指示而生成的参考用图像数据发送给OCR装置 120。辅助获取部166获取从后述的OCR装置120发送过来的辅助信息。在辅助获取部 166获取到辅助信息的情况下,布局生成部160能够根据该辅助信息生成布局信息。在辅助信息中包含与使用于OCR装置120的OCR处理部中的算法有关的算法信息,例如为OCR 装置120的型号名称或者使用于OCR装置120的OCR处理部的OCR处理软件的名称或者版本。布局生成部160与辅助获取部166所获取的算法信息相应地对布局信息施加限制。例如在根据用户的操作输入配置文本框18 的情况下,布局生成部160对该文本框 18 的线宽190f设置下限值。例如在算法信息为OCR处理软件的名称和版本的情况下,根据以该OCR处理软件和版本所确定的算法的性能来设定该下限值。同样地,布局生成部160根据算法信息对基准标记182c的大小190i和配置(基准点坐标190c)、条形码182d的大小190i、扫描仪140无法读取的脱落颜色、字符种类190k、 属性1901等的设定项目施加限制。另外,在用户指示了文本框18 等结构要素的配置的情况下,布局生成部160也可以根据算法信息来决定该结构要素的布局信息所含的上述设定项目的初始值。根据使用算法信息的结构,能够减少用于确认表单152的OCR处理精度的测试以及观察该测试的OCR处理结果来修正布局信息这种作业的反复次数,从而能够大幅减轻用户的作业负担。基准生成部168根据布局生成部160所生成的布局信息来生成基准数据,该基准数据为与OCR装置120中的OCR处理的结果进行比较的基准。后面详细说明基准数据。布局发送部170将布局信息、基准数据发送给OCR装置120。数据输出部172将布局信息变换为与印刷对应的形式之后输出到打印机130。输出控制部174在印刷表单152的情况下控制打印机130以使其在预定的印刷条件下进行印刷。输出控制部174并不限于直接控制打印机130的情况,也可以是以下情况 输出控制部174将禁止变更的印刷条件等控制信息输出到打印机130,打印机130根据该控制信息来设定印刷条件。在随意地在打印机130中变更印刷条件而例如导致进行缩小印刷时,印刷出的表单152的字符大小变小或者线的粗细变细,从而有可能使OCR处理精度下降。输出控制部 174控制打印机130以使其在预定的印刷条件下进行印刷,由此能够避免以上的情况。读取控制部176将指定扫描仪140读取表单152并转换为图像数据时的分辨率、 读取后执行的应用程序、命令的指定信息通过通信网150输出到扫描仪140。并不限于通过上述通信网150输出,也可以是读取控制部176将指定信息例如作为条形码182d嵌入于表单152,扫描仪140从该条形码182d获取指定信息。根据具备上述读取控制部176的结构,能够以适合于OCR处理的分辨率生成图像数据或者利用扫描仪140的应用程序、命令来校正生成后的图像数据,从而能够进一步提高OCR处理精度。(打印机130)图5是表示打印机130的结构的功能框图。打印机130构成为包括显示部200、操作部202、印刷部204、中央控制部206。显示部200包括液晶显示器、有机EL显示器等。操作部202包括设置于显示部200 的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键、操纵杆等。印刷部204印刷基于图像数据的图像,该图像数据是后述的绘制执行部220使接收到的图像数据栅格化而得到的。中央控制部206通过半导体集成电路来控制打印机130整体,其中,该半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部206还作为绘制执行部220而发挥功能。绘制执行部220将从表单制作装置110发送过来的印刷作业(图像数据)例如图像化(栅格化)为使用了 CMYK等表色方法的位图形式等。在本实施方式中,绘制执行部 220根据表单制作装置110的绘制指示部162的指示来生成上述参考用图像数据,根据绘制指示部162的印刷作业取消指示,将参考用图像数据发送给绘制指示部162来代替发送给印刷部204。在上述例子中,设为使用打印机130所具备的绘制执行部220的结构,但是也可以使安装于表单制作装置110、其它计算机的打印机130的打印驱动程序作为绘制执行部220 而发挥功能。并且,也可以设为表单制作装置具备绘制执行部的结构。下面,根据图6、图7来说明表单制作装置具备绘制执行部的结构。(打印机300以及表单制作装置350)图6是表示其它打印机300的结构的功能框图。图7是表示其它表单制作装置 350的结构的功能框图。打印机300构成为包括显示部200、操作部202、印刷部204、中央控制部306。表单制作装置350构成为包括显示部154、操作部156、中央控制部364。打印机300的显示部200、操作部202、印刷部204以及表单制作装置350的显示部154、操作部156、中央控制部364的布局生成部160、图像发送部164、辅助获取部166、基准生成部168、布局发送部170、数据输出部172、输出控制部174、读取控制部176作为打印机130和表单制作装置110的结构要素,功能与上述结构要素的功能实质上相同,因此省略重复说明。打印机300的中央控制部306通过半导体集成电路来控制打印机300整体,其中, 该半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部306还作为功能发送部320而发挥功能。功能发送部320将表示印刷功能的印刷功能信息发送给表单制作装置350。印刷功能信息具体地说例如为表示打印机300的分辨率、印刷范围、抖动(dithering)等所支持的印刷功能的信息。表单制作装置350的中央控制部364通过半导体集成电路来控制表单制作装置 350整体,其中,该半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部364还作为布局生成部160、绘制执行部372、图像发送部 164、辅助获取部166、基准生成部168、布局发送部170、数据输出部172、输出控制部174以及读取控制部176而发挥功能。绘制执行部372根据印刷功能信息和布局信息来生成与布局信息的至少一部分对应的参考用图像数据。使用上述打印机300和表单制作装置350也能够抑制每个打印机的功能差的影响而更可靠地执行位置偏移、倾斜的校正,从而能够提高OCR处理精度。并且,由表单制作装置350生成参考用图像数据,因此还能够根据需要对栅格化处理进行微调整。(OCR 装置 120)图8是表示OCR装置120的结构的功能框图。OCR装置120构成为包括显示部 400、操作部402、存储装置404、中央控制部406。显示部400包括液晶显示器、有机EL显示器等。操作部402包括设置于显示部400 的显示面上的触摸面板、设置有多个操作键的键盘、鼠标等指示装置、十字键、操纵杆等。存储装置404包括HDD (Hard Disk Drive 硬盘驱动器)、快闪存储器、非易失性 RAM (Random Access Memory 随机存取存储器)等,存储布局信息等。在本实施方式中, 存储装置404与OCR装置120 —体地形成,但是并不限于上述情况,也可以是独立的例如 NAS (Network Attached Storage 网络附加存储)、外置 HDD、USB (Universal Serial Bus 通用串行总线)存储器等。中央控制部406通过半导体集成电路来控制OCR装置120整体,其中,该半导体集成电路包括中央处理装置(CPU)、保存有程序等的ROM、作为工作区的RAM等。另外,中央控制部406还作为布局获取部420、图像获取部422、图像校正部424、0CR处理部426、辅助生成部428、基准获取部430以及辅助发送部432而发挥功能。布局获取部420获取从表单制作装置110发送过来的布局信息或者参考用图像数据,存储到存储装置404。图像获取部422从扫描仪140获取读取表单152而生成的图像数据。在布局获取部420预先接收到参考用图像数据的情况下,图像校正部4M根据存储在存储装置404中的参考用图像数据对由扫描仪140读取到的表单152的图像数据进行位置偏移、倾斜的校正。存储在存储装置404中的参考用图像数据例如与表单152的表单 ID相对应,图像校正部似4能够参照与所生成的表单152的图像数据对应的参考用图像数据。OCR处理部似6例如以图像获取部422获取到的图像数据的图像中的基准标记 182c的位置为基准,读取以条形码182d等形式记载的表单152的表单ID。另外,OCR处理部4 从存储装置404读出包含该表单ID的布局信息,根据读出的布局信息对扫描仪140 所读取的表单152的图像数据进行OCR处理(从图像数据中抽取该图像数据所示出的字符、数字等内容的处理)。本实施方式的OCR装置120根据从表单制作装置110获取到的布局信息进行OCR 处理,因此例如可知文本框18 的位置、读取写入信息的位置,从而能够提高OCR处理精度。并且,与例如由扫描仪140读取印刷出的表单152而生成图像数据并根据该图像数据进行位置偏移、倾斜的校正的情况相比,根据布局信息、参考用图像数据进行OCR处理的OCR 装置120不受附着于表单152的脏污、表单152的褶皱的影响,从而能够提高OCR处理精度。另外,在OCR装置120中共用由表单制作装置110生成的布局信息,因此用户不需要在表单制作装置110和OCR装置120各自中进行相同的设定,从而能够减轻用户的作业负担。 并且,在根据条件变更、根据OCR处理的结果需要提高OCR处理精度而对制作过一次的表单 152进行布局信息的修正的情况下,也同样地在表单制作装置110和OCR装置120中共用在表单制作装置110中修正的布局信息,从而能够减轻用户的作业负担。另外,在布局信息中包含对可变表单进行定义的可变信息,该可变表单是表单152 中的输入区域184的例如形状、大小190i、配置、分割数等可变的表单。如果在处理这种可变表单的情况下不采用任何方法,则OCR处理部似6不得不仅根据图像数据估计该输入区域184,有时无法得到适当的OCR结果。因此,在本实施方式中, 表单制作装置110根据用户的输入操作来确定布局信息中的作为可变信息的输入区域184 的形状、大小190i、配置、分割数等,当数据输出部172将包含确定了可变信息中的输入区域184的可变信息的布局信息输出到打印机130时,以该数据输出部172的输出为契机,布局发送部170将确定了该输入区域184的布局信息发送给OCR装置120。另外,在要在打印机130中确定输入区域184的形状、大小190i、配置、分割数等的情况下,布局发送部170 也可以以来自打印机130的表单152的实际印刷为契机,将确定了该输入区域184的布局信息发送给OCR装置120。根据上述结构,在OCR装置120中布局信息的输入区域184已确定,因此能够根据正确的输入区域184的信息提高OCR处理精度,并且由于成为OCR处理的对象的区域缩小, 因此能够降低处理负载。另外,这种情况下的布局信息也可以是与用户的操作输入相应的上述表单152的布局的参考用图像数据。例如,OCR装置120将扫描仪140所读取的表单152的图像数据例如格线的位置等以使其与作为布局信息的参考用图像数据一致地方式进行校正之后,进行OCR处理。根据上述结构也能够提高OCR处理精度。辅助生成部4 生成辅助信息,该辅助信息辅助生成布局信息。并且,在布局信息中还包含表示布局信息的改进点的改进信息。前面说明了辅助信息中的算法信息,因此在此详细说明改进信息。图9是用于说明改进信息的说明图。特别是,图9的(a)表示布局信息的一例,图 9的(b)表示改进信息的一例,图9的(c)表示基准数据的一例。辅助生成部4 参照由布局获取部420获取到的、例如图9的(a)示出的与输入区域184有关的布局信息。在前面使用图4的(c)说明了上述布局信息,因此省略说明。另外,辅助生成部4 确认由OCR处理部似6进行OCR处理的结果、即对于以所参照的布局信息表示的、应该读取写入信息的分割得到的输入区域184是否读取出写入信息 (读取成功与否)。例如在读取手写字符的情况下,OCR处理部似6对于与登记于OCR处理软件的基准字符进行对照的结果是判断为最接近的字符,将表示与基准字符匹配的程度的指标值与规定阈值进行比较来判断读取成功与否。能够根据用户的操作输入来变更该阈值。辅助生成部4 根据OCR处理结果生成图9的(b)示出的、将布局信息中的表示分割得到的该输入区域184的布局ID 190a与读取成功与否(读取成功与否450)相关联的改进信息。这样,改进信息例如表示OCR处理的结果、准确地说是在应该读取写入信息的分割得到的输入区域184中读取失败的情况。在布局生成部160中根据该改进信息例如以红色填充读取失败的分割得到的输入区域184或者染红包围分割得到的该输入区域184的文本框18 来促使用户改进。并且,根据用户的操作输入,进行例如增大输入区域184、文本框18 的大小190i等布局信息的修正来实现提高OCR处理精度。根据使用上述改进信息的结构,即使不按照每个输入区域184确认写入信息的读取成功与否也自动地进行提示,因此能够减轻用户的作业负担,并且能够避免看漏要改进的点这种情况。另外,使用上述表单制作装置110的基准生成部168所生成的基准数据,能够使改进信息成为更有益的信息而有效地实现改进。基准生成部168所生成的基准数据是不包含于布局信息的、使用于确认OCR处理精度的测试中的数据。基准数据例如包含图9的(c) 示出的、表示分割得到的输入区域184的布局ID190a、用户用于进行测试而写入到分割得到的该输入区域184的写入字符的大小460a以及内容460b。在这种情况下,用户预先对在表单152中进行分割而得到的输入区域184写入被确定为基准数据的例如大小460a、内容460b的字符。另外,并不限于手写字符,也可以利用打印机130印刷被确定为基准数据的字符。在这种情况下,不受用户手写字符的好坏限制, 能够可靠地检测由扫描仪140的图像失真等引起的读取失败而改进OCR处理精度。之后, OCR装置120的图像获取部422通过扫描仪140获取该表单152的图像数据。基准获取部430获取布局发送部170所发送的基准数据。辅助生成部4 根据基准获取部430所获取到的基准数据以及OCR处理的结果来生成改进信息。
辅助生成部4 例如将表示确定了大小460a、内容460b的字符等的基准数据与实际被写入了字符等的表单152的图像数据的OCR处理结果进行比较,生成改进信息,后述的辅助发送部432将该改进信息发送给表单制作装置110。表单制作装置110根据该改进信息来修正布局信息。根据使用上述基准数据的结构,能够进行是否存在字符错误识别等详细的比较,从而能够提高布局信息的改进精度。如上所述,通过使用算法信息、改进信息这种辅助信息,表单制作装置110能够共享可在OCR装置120侧掌握的信息,表单制作装置110的布局生成部160能够生成容易进行OCR处理的布局信息。辅助发送部432将由辅助生成部428生成的辅助信息发送给表单制作装置110。以上,通过所说明的表单制作装置110和OCR装置120,能够在大幅减轻用户的作业负担的同时提高OCR处理精度。另外,还提供使计算机作为表单制作装置110而发挥功能的表单制作程序以及作为OCR装置120而发挥功能的OCR处理程序、存储有该表单制作程序和OCR处理程序的计算机可读取的软盘、光磁盘、R0M、EPR0M、EEPR0M、CD(Compact Disc 致密光盘)、DVD (Digital Versatile Disc 数字多功能光盘)、BD (Blu-ray Disc 蓝光光盘)等存储介质。在此,程序是指通过任意的语言、描述方法描述的数据处理方法。另外,该表单制作程序和OCR处理程序也可以被存储在通过通信网150与表单制作装置110或者OCR装置120相连接的任意的应用程序服务器,还能够根据需要下载其全部或者一部分。(表单处理方法)接着,说明进行包括表单制作装置110和打印机130的表单处理系统的运用的表单处理方法。图10是表示表单处理方法测试时的整体处理流程的序列图,图11是表示表单处理方法使用时的整体处理流程的序列图。如图10所示,当OCR装置120将包含算法信息的辅助信息发送给表单制作装置 110时(S500),在表单制作装置110中,布局生成部160根据用户的操作输入来生成表示表单152布局的布局信息650 。绘制指示部162将生成参考用图像数据的指示发送给打印机130(S504),打印机130的绘制执行部220生成参考用图像数据(S506),将所生成的参考用图像数据发送给表单制作装置110(S508)。然后,按照印刷表单152的操作输入,数据输出部172将确定了输入区域184的布局信息变换为与印刷对应的形式之后输出到打印机 130(S510)。打印机130印刷表单152(S512)。然后,基准生成部168根据确定了输入区域 184的布局信息来生成基准数据(S514)。布局发送部170将布局信息、基准数据发送给OCR 装置120,图像发送部164将参考用图像数据发送给OCR装置120 (S516)。用户在印刷出的表单152中例如记载显示在显示部巧4中的基准数据所示的确定了大小460a、内容460b的字符等。在印刷出的表单152中记载了信息之后,扫描仪140读取记载了该信息的表单 152 (S518),将图像数据发送给OCR装置120(S520)。OCR装置120的图像校正部4 根据参考用图像数据对由扫描仪140读取并生成的表单152的图像数据进行位置偏移、倾斜的校正(S52》。OCR处理部似6根据布局信息对图像数据进行OCR处理(S524)。然后,辅助生成部4 根据OCR处理的结果和基准数据来生成改进信息(S526)。辅助发送部432将改进信息发送给表单制作装置110(S528)。表单制作装置110的布局生成部160根据改进信息来促使用户改进,修正布局信息(S530)。如图11所示,在使用时,按照印刷表单152的操作输入,表单制作装置110的数据输出部172将确定了输入区域184的布局信息变换为与印刷对应的形式之后输出到打印机 130(S550)。绘制指示部162将生成参考用图像数据的指示发送给打印机130(S552),打印机130的绘制执行部220生成参考用图像数据(S5M),将所生成的参考用图像数据发送给表单制作装置110(S556)。表单制作装置110的布局发送部170将布局信息发送给OCR装置120,图像发送部164将参考用图像数据发送给OCR装置120(S558)。打印机130印刷表单152(S560)。将此时的表单152的布局信息设为已经通过图10示出的表单处理方法根据改进信息修正的信息。然后,用户在表单152上通过手写等方式将业务上的信息记载于表单152上之后,扫描仪140读取记载过的表单152(S562),当读取到的图像数据发送给OCR装置120时 (S564),OCR装置120的图像校正部似4根据参考用图像数据对扫描仪140读取并生成的表单152的图像数据进行位置偏移、倾斜的校正(S566)。OCR处理部似6对校正后的图像数据进行OCR处理而获取写入信息(S568)。上述图像数据的布局在图10中已经进行了修正,因此OCR处理精度也变高。接着,说明进行包括表单制作装置350和打印机300的表单处理系统的运用的表单处理方法。图12是表示其它表单处理方法测试时的整体处理流程的序列图,图13是表示使用其它表单处理方法时的整体处理流程的序列图。如图12所示,当OCR装置120将包含算法信息的辅助信息发送给表单制作装置 350时(S500),在表单制作装置350中,布局生成部160根据用户的操作输入来生成表示表单152布局的布局信息(S502)。打印机300的功能发送部320例如根据表单制作装置350的指示将表示印刷功能的印刷功能信息发送给表单制作装置350 (S604)。绘制执行部372根据印刷功能信息和布局信息来生成参考用图像数据(S606)。下面,关于布局信息发送步骤S510至布局信息修正步骤S530,功能与在图10的说明中说明的上述部分的功能实质上相同,因此附加相同的附图标记而省略重复说明。如图13所示,在使用时,按照印刷表单152的操作输入,表单制作装置350的数据输出部172将确定了输入区域184的布局信息变换为与印刷对应的形式之后输出到打印机 300(S550)。打印机300的功能发送部320例如根据表单制作装置350的指示将表示印刷功能的印刷功能信息发送给表单制作装置350 (S654)。绘制执行部372根据印刷功能信息和布局信息生成参考用图像数据(S656)。下面,关于布局信息发送步骤S558至OCR处理步骤S568,功能与在图11的说明中说明的上述部分的功能实质上相同,因此附加相同的附图标记而省略重复说明。根据这种表单处理方法,在图10、12示出的测试时以及图11、13示出的使用时都能够减轻用户的作业负担,并且能够通过使用根据改进信息而修正的布局信息来提高OCR 处理精度。以上,参照

了本发明的优选实施方式,但是当然本发明并不限于上述实施方式。本领域技术人员在记载于权利要求的范围的范畴中能够想得到各种变更例或者修正例是显而易见的,这些也当然理解为属于本发明的技术范围。
此外,本说明书的表单处理方法中的各工序不一定按照记载为序列图的顺序以时间序列进行处理,还可以包含并列或者子程序的处理。产业上的可利用件能够将本发明利用于进行表单的制作以及读取的表单处理系统、OCR装置、OCR处理程序、表单制作装置、表单制作程序以及表单处理方法。
权利要求
1.一种表单处理系统,包括表单制作装置和打印机, 上述表单制作装置具有布局生成部,其生成表示表单布局的布局信息;绘制指示部,其根据上述布局信息,使上述打印机的绘制执行部生成与该布局信息的至少一部分对应的参考用图像数据;以及图像发送部,其将所生成的上述参考用图像数据发送给OCR装置, 其中,上述打印机具有上述绘制执行部,该绘制执行部根据上述绘制指示部的指示生成上述参考用图像数据。
2.根据权利要求1所述的表单处理系统,其特征在于,上述绘制指示部投入印刷作业来调用上述绘制执行部,使该绘制执行部根据该印刷作业生成上述参考用图像数据,当获取完成所生成的参考用图像数据时,取消该印刷作业。
3.根据权利要求1或者2所述的表单处理系统,其特征在于,在存在多个上述绘制执行部的情况下,上述绘制指示部执行以下操作中的某一个操作使所有该绘制执行部生成上述参考用图像数据;仅使预先确定的一个该绘制执行部生成上述参考用图像数据;使所有的该绘制执行部生成上述参考用图像数据并进行合成;仅使用户所选择的该绘制执行部生成上述参考用图像数据。
4.一种表单处理系统,包括打印机和表单制作装置,上述打印机具有功能发送部,该功能发送部将表示印刷功能的印刷功能信息发送给上述表单制作装置,上述表单制作装置具有布局生成部,其生成表示表单布局的布局信息;绘制执行部,其根据上述印刷功能信息和上述布局信息,生成与该布局信息的至少一部分对应的参考用图像数据;以及图像发送部,其将所生成的上述参考用图像数据发送给OCR装置。
5.根据权利要求1至4中的任一项所述的表单处理系统,其特征在于,上述表单制作装置还具有布局发送部,该布局发送部将所生成的上述布局信息发送给 OCR装置,上述表单处理系统还包括上述OCR装置,该OCR装置具有 布局获取部,其获取从上述表单制作装置发送过来的布局信息;以及 OCR处理部,其根据所获取到的上述布局信息对扫描仪所读取出的表单的图像数据进行OCR处理。
6.根据权利要求1至5中的任一项所述的表单处理系统,其特征在于, 上述OCR装置还具有辅助生成部,其生成用于辅助生成上述布局信息的辅助信息;以及辅助发送部,其将上述辅助信息发送给上述表单制作装置,其中,上述表单制作装置还具有辅助获取部,该辅助获取部获取发送过来的上述辅助 fn息,上述布局生成部根据所获取到的上述辅助信息来生成上述布局信息。
7.根据权利要求6所述的表单处理系统,其特征在于,在上述辅助信息中包含与使用于上述OCR装置的OCR处理部的算法有关的算法信息。
8.根据权利要求6或者7所述的表单处理系统,其特征在于,上述辅助生成部根据上述OCR处理的结果来生成表示所获取到的上述布局信息的改进点的改进信息,在上述辅助信息中包含上述改进信息。
9.根据权利要求8所述的表单处理系统,其特征在于,上述表单制作装置还具有基准生成部,该基准生成部根据所生成的上述布局信息来生成基准数据,该基准数据为与上述OCR处理的结果进行比较的基准, 上述布局发送部将上述基准数据发送给上述OCR装置, 上述OCR装置还具有基准获取部,该基准获取部获取发送过来的上述基准数据, 上述辅助生成部根据所获取到的上述基准数据和上述OCR处理的结果来生成上述改进fe息。
10.根据权利要求1至9中的任一项所述的表单处理系统,其特征在于,上述表单制作装置还具有数据输出部,该数据输出部将所生成的上述布局信息输出到打印机,在所生成的上述布局信息中包含用于定义可变表单的可变信息,该可变表单是表单中的输入区域可变的表单,当上述数据输出部将已确定上述可变信息中的输入区域的布局信息输出到上述打印机时,上述布局发送部将已确定上述输入区域的布局信息发送给上述OCR装置。
11.根据权利要求1至10中的任一项所述的表单处理系统,其特征在于, 还包括图像读取装置,上述表单制作装置还具有输出控制部,其在上述打印机印刷表单的情况下,控制该打印机以使其在预先确定的印刷条件下进行印刷;以及读取控制部,其在由上述图像读取装置读取表单的情况下,指定该图像读取装置的动作方法。
12.—种表单制作装置,具有布局生成部,其生成表示表单布局的布局信息;绘制指示部,其根据上述布局信息,使打印机的绘制执行部生成与该布局信息的至少一部分对应的参考用图像数据;以及图像发送部,其将所生成的上述参考用图像数据发送给OCR装置, 其中,上述绘制执行部根据上述绘制指示部的指示生成上述参考用图像数据。
13.一种表单处理方法,通过表单制作装置以及与上述表单制作装置通信连接的OCR 装置来进行表单管理,上述表单制作装置生成表示表单布局的布局信息,根据上述布局信息,使打印机的绘制执行部生成与该布局信息的至少一部分对应的参考用图像数据;以及将所生成的上述参考用图像数据发送给上述OCR装置, 其中,上述绘制执行部根据指示生成上述参考用图像数据。
全文摘要
提供一种表单处理系统、表单制作装置以及表单处理方法,提高表单的OCR处理精度。本发明的表单处理系统(100)包括表单制作装置(110)和OCR装置(120),表单制作装置具有布局生成部(160)和布局发送部(170),该布局生成部(160)生成表示表单(152)布局的布局信息,该布局发送部(170)将所生成的布局信息发送给OCR装置,OCR装置具有布局获取部(420)和OCR处理部(426),该布局获取部(420)获取从表单制作装置发送过来的布局信息,该OCR处理部(426)根据获取到的布局信息对由扫描仪(140)读取到的表单的图像数据进行OCR处理。
文档编号G06K9/20GK102331913SQ20111013619
公开日2012年1月25日 申请日期2011年5月24日 优先权日2010年5月24日
发明者杉田敏彦, 桑村良则, 萩泽章一, 道场乡 申请人:株式会社Pfu
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1