数据处理装置和方法、以及图像处理装置和方法

文档序号:6554218阅读:118来源:国知局
专利名称:数据处理装置和方法、以及图像处理装置和方法
技术领域
本发明涉及一种用于将使用扫描装置扫描纸质票单而产生的图像和/或由传真机(以下简称为“传真机”)接收到的文档转换为电子票单的数据处理装置、图像处理装置、数据处理方法和图像处理方法。
背景技术
传统上,在将纸质票单转换为电子票单的最常见的方法中,扫描装置扫描纸质票单从而得到其图像数据,将所得到的图像数据发送到计算机,在该计算机中将图像数据处理成电子票单。
传统上,已知用于识别从票单获得的图像数据的票单类型的方法,其中该票单类型是通过使用图像的模式匹配等方法与事先注册的票单类型进行比较而被识别的,或者是通过识别事先嵌入在票单的一部分中、以便能从票单的图像数据中识别出来的条形码而被识别的。由于在识别票单类型之后进行的业务处理随票单类型的不同而不同,因此根据票单类型对图像数据进行正确分类是非常重要的。
关于票单识别,传统上已提出了一种从票单的图像数据中提取特征量并计算该票单与已注册的票单的相似度的方法(参见例如日本特开2000-285187和2000-293596号公报)。
然而,传统的票单类型识别方法存在的问题是识别准确度不高,因此根据通过扫描获得的图像数据的质量,票单类型可能被错误地识别为类似但不同的票单类型,或者有时可能被识别为不明(unclear)票单。
在传统的票单类型识别方法中,使用条形码的方法是以使用条形码为前提的,由于向票单新提供嵌入式条形码需要时间和精力,因此存在不一定能满足用户对电子化现有纸质票单的需求的问题。
另外,根据传统的票单类型识别方法,由于计算机从扫描仪接收通过扫描票单而获得的图像数据,然后对票单类型进行识别处理,因此存在计算机的处理负担大的问题。

发明内容
本发明的一个目的在于提供一种数据处理装置、图像处理装置、数据处理方法以及图像处理方法,其能够减少由数据处理装置执行的票单类型识别处理的负担,使图像数据能够根据票单类型被正确地分类,从而能提高识别票单类型的准确度。
为了实现上述目的,在本发明的第一方面,提供一种数据处理装置,包括图像输入单元,用于输入票单的图像信息,该图像信息附加有票单类型信息;字符识别单元,用于基于该所附加的票单类型信息来对由所述图像输入单元输入的该图像信息执行字符识别处理;以及存储单元,用于存储该图像信息和通过所述字符识别单元在该字符识别处理中获得的结果。
根据本发明,可以使票单类型识别处理对图像数据被发送到的数据处理装置来说是不必要的,从而减少数据处理装置的负担。
优选地,该数据处理装置还包括票单识别单元,用于对由所述图像输入单元输入的该图像信息执行票单识别处理以获得票单类型;以及票单类型判断单元,用于判断通过所述票单识别单元执行的该票单识别处理而获得的票单类型与由所述图像输入单元输入的该票单类型信息所表示的票单类型是否匹配,当所述票单类型判断单元已判断出由所述票单识别单元获得的票单类型与由该票单类型信息所表示的票单类型相匹配时,所述字符识别单元执行该字符识别处理。
更优选地,该数据处理装置还包括票单类型输入单元,该票单类型输入单元用于当所述票单类型判断单元已判断出由所述票单识别单元获得的票单类型与由该票单类型信息所表示的票单类型不匹配并且已选择了所述两个票单类型中的一个时,输入该所选择的票单类型。
更优选地,该数据处理装置还包括检查单元,该检查单元用于检查是否执行由所述票单类型判断单元进行的判断,其中,当判断为要执行由所述票单类型判断单元进行的判断时,所述票单识别单元执行该票单识别处理,并且所述票单类型判断单元执行该判断。
为了实现上述目的,在本发明的第二方面,提供一种图像处理装置,用于连接数据处理装置,该图像处理装置包括显示单元,用于显示用于设置票单的票单类型信息的设置屏幕;读取单元,用于读取该票单的图像以获取该票单的图像信息;以及发送单元,用于将通过所述显示单元所显示的该设置屏幕而设置的该票单类型信息附加到由所述读取单元获得的该图像信息上,并将附加有该票单类型信息的该图像信息发送到该数据处理装置。
优选地,该图像处理装置还包括获取单元,该获取单元获取该设置屏幕的配置信息,该配置信息包括所述读取单元的读取设置信息,所述读取设置信息对应于由该票单类型信息所表示的票单类型。
为了实现上述目的,在本发明的第三方面中,提供一种数据处理方法,包括图像输入步骤,用于输入票单的图像信息,该图像信息附加有票单类型信息;字符识别步骤,用于基于该所附加的票单类型信息来对在所述图像输入步骤中输入的该图像信息执行字符识别处理;以及存储步骤,用于存储该图像信息和在所述字符识别步骤中的该字符识别处理中获得的结果。
优选地,该数据处理方法还包括票单识别步骤,用于对在所述图像输入步骤中输入的该图像信息执行票单识别处理以获得票单类型;以及票单类型判断步骤,用于判断在所述票单识别步骤执行的该票单识别处理中获得的票单类型与在所述图像输入步骤中输入的该票单类型信息所表示的票单类型是否匹配,其中,当在该票单类型判断步骤中已判断出在所述票单识别步骤中获得的票单类型与由该票单类型信息所表示的票单类型相匹配时,在该字符识别步骤中执行该字符识别处理。
更优选地,该数据处理方法还包括票单类型输入步骤,该票单类型输入步骤用于当在所述票单类型判断步骤中已判断出在所述票单识别步骤中获得的票单类型与由该票单类型信息所表示的票单类型不匹配并且已选择了所述两个票单类型中的一个时,输入所选择的票单类型。
更优选地,该数据处理方法还包括检查步骤,该检查步骤用于检查是否执行所述票单类型判断步骤中的判断,其中,当判断为要执行所述票单类型判断步骤中的判断时,在所述票单识别步骤中执行该票单识别处理,并且在所述票单类型判断步骤中执行该判断。
为了实现上述目的,在本发明的第四方面中,提供一种图像处理方法,包括显示步骤,用于显示用于设置票单的票单类型信息的设置屏幕;读取步骤,用于读取该票单的图像以获取该票单的图像信息;以及发送步骤,用于将通过在所述显示步骤中显示的该设置屏幕而设置的该票单类型信息附加到在所述读取步骤中获得的该图像信息上,并将附加有该票单类型信息的该图像信息发送到数据处理装置。
优选地,该图像处理方法还包括获取步骤,该获取步骤获取该设置屏幕的配置信息,该配置信息包括在所述读取步骤中使用的读取设置信息,所述读取设置信息对应于由该票单类型信息所表示的票单类型。
通过下面结合附图的详细说明,本发明的上述和其它目的、特征和优点将变得显而易见。


图1是示意性示出根据本发明实施例的包括图像处理装置的网络系统的示例结构的图;图2是示出图1中的MFP的外观的图;图3是示出图2所示的MFP的信息处理功能的逻辑结构的框图;图4是示出图1中的服务器计算机和客户机PC中的每个的信息处理功能的逻辑结构的框图;图5是示出图2所示的MFP中能执行可定制的应用程序的软件的结构的框图;图6是示出图2所示的MFP的应用程序UI的一个例子的图;图7是示出与图6的应用程序UI有关的应用程序的UI结构模板的一个例子的图;图8是示出当应用程序的UI结构被更新时,在图1中的MFP和服务器计算机之间执行的通信处理的图;图9是示出一个例子的图,在该例子中,在图8所示的通信处理中被下载到MFP的部分UI配置文件是以XML写的;图10是示出存储在由图1中的服务器计算机使用的存储装置中的数据的示例内容,其中该数据内容是以表的格式来表示的;图11是示出使用图1中的客户机PC来编辑UI结构的屏幕的图;
图12是示出使用图1中的客户机PC来编辑UI结构的屏幕的图;图13是示出使用图1中的客户机PC来编辑UI结构的屏幕的图;图14是示出以表的格式来表示的、存储在由图1中的服务器计算机所使用的存储装置中的数据的内容的例子的图;图15是示出一个例子的图,在该例子中,在图8所示的通信处理期间被上载到服务器计算机的部分附加信息文件是以XML写的;图16是示出当上载文件时,在图1的网络系统中的MFP和服务器计算机之间执行的通信处理的图;图17是示出一个例子的图,在该例子中,存储在由图1中的服务器计算机所使用的存储装置中的数据的内容是以表的格式来表示的;图18是示出运行在图1中的服务器计算机上的程序处理从MFP接收到的图像文件和附加信息文件的过程的流程图;图19是图18中的流程图的继续部分;以及图20是示出一个例子的图,在该例子中,在图16所示的通信处理中上载到服务器计算机的附加信息文件是以XML写的。
具体实施例方式
现在参考示出优选实施例的附图来详细说明本发明。
图1是示意性示出根据本发明实施例的包括图像处理装置的网络系统的示例结构的图。
在图1中,网络系统由作为图像处理装置的多功能外设(下面简称为“MFP”)100、逻辑网络101、服务器计算机102、存储装置103、客户个人计算机(下面简称为“客户机PC”)104、电话/传真线路105、以及网关装置106组成。逻辑网络101能够经由网关装置106连接到内部网或因特网。注意,尽管图1中示出设置单个MFP的情况,但可以设置多个MFP。
MFP 100是具有多种功能例如图像读取功能、成像功能、以及通信功能的多功能装置。服务器计算机102是运行用于控制服务器计算机和MFP 100之间的通信的程序和用于处理业务票单的程序的计算机。存储装置103被构建为由服务器计算机102所使用的数据库系统和文件存储系统。客户机PC 104是连接到服务器计算机102以使用户通过该客户机PC 104来执行处理的计算机。
图2是示出图1中的MFP 100的外观的图。
在图2中,MFP 100由MFP主体200、原稿扫描部分201、自动原稿进给部分(下面简称为“进稿器”)202、输出自动整理部分(下面简称为“自动整理装置”)203、输出托盘部分204、以及显示器/触摸板部分205组成。
MFP主体200由存储薄片的供纸盒、输送薄片的输送部分、在薄片上形成图像的打印机部分等组成。原稿扫描部分201扫描进给到读取位置的原稿以读取原稿的图像。进稿器202将原稿进给到读取位置。自动整理装置203对从MFP主体200排出的、已完成成像的薄片执行预先设置的后处理。输出托盘部分204包括多个托盘,用于对已由自动整理装置203进行过后处理的薄片进行分页和堆叠。显示器/触摸板部分205包括显示各种屏幕的显示器和用于进行各种设置的触摸板。
图3是示出MFP 100的信息处理功能的逻辑结构的框图。
如图3所示,MFP 100由显示器/触摸板部分205、网络接口部分301、CPU 302、ROM 303、RAM 304、硬盘驱动程序(下面称为“HDD”)305、以及输入/输出接口306组成。
这些部分经由输入/输出接口306相互连接。显示器/触摸板部分205为用户提供用户接口。网络接口部分301经由网络101执行与外部装置的通信。CPU 302控制MFP 100的各部分,并且根据存储在ROM 303中的控制程序执行在图8所示的MFP侧的处理。ROM 303存储控制程序和数据。RAM 304用作临时存储区和工作区。HDD 305具有大容量存储区,存储各种类型的数据。
图4是示出用作数据处理装置的服务器计算机102和客户机PC 104中的每个的信息处理功能的逻辑结构的框图。
如图4所示,每个计算机包括输入控制部分400、显示部分401、网络接口部分402、CPU 403、ROM 404、RAM 405、HDD406和输入/输出接口407。
这些部分经由输入/输出接口407连接。输入控制部分400控制用于接收来自用户的输入的键盘/鼠标。显示部分401向用户提供输出屏幕。网络接口部分402经由网络101执行与外部装置的通信。CPU 403负责控制计算机的各部分,当该计算机是服务器计算机102时,CPU 403根据存储在ROM 404中的控制程序执行图8所示的服务器计算机侧的处理。ROM 404存储控制程序和数据。RAM405被用作临时存储区和工作区。HDD 406具有大容量存储区,存储各种类型的数据。
图5是示出MFP 100中能执行可定制的应用程序(以下简称为“应用程序”)的软件的结构的框图。
在图5中,附图标记501表示控制MFP 100的执行环境的一个例子。通常,执行环境501包括能实时控制MFP 100的各功能的实时OS的模块,或者一组能通过指示MFP 100的CPU 302来精确控制MFP 100的各功能,包括可选装置和扩展卡的功能的库。执行环境(实时OS)501是通过向运行在更高层的应用程序提供接口命令的一组模块来实现的。
附图标记502表示在执行环境501上运行的控制器(控制部分),其由用于控制MFP 100的原稿扫描部分201、打印机部分、调制解调器通信部分、PDL(页面描述语言)扩展部分等的模块组成。附图标记503表示应用程序编程接口(下面称为“API”),其包括响应于从应用程序输入的指令来通过API 503访问控制器502的功能,以及控制网络接口部分301的功能。
附图标记504表示用于执行特定应用程序的最佳执行环境。最佳执行环境是例如通过JAVA(注册商标)虚拟机来实现的,其能够在不依赖于OS、装置环境等的情况下执行特定的应用程序。附图标记505表示资源管理部分,其管理由执行环境504使用的资源,并在实时OS 501上运行。当实现执行环境504、API 503或实时OS 501上的每个应用程序的虚拟机使用例如存储器的资源时,资源管理部分505限制该使用,以便只能使用事先决定的资源。附图标记506、507和508表示在MFP 100上运行的应用程序的例子。
图6是示出应用程序UI(用户接口)600的一个例子的图。
在图6中,UI 600是可定制的,并且显示在MFP 100的显示器/触摸板部分205上。UI 600是为运行在执行环境504上的一个或多个应用程序例如图5中的应用程序506单独或共同准备的。当执行环境504是JAVA(注册商标)虚拟机时,该一个或多个应用程序每个是由JAVA程序提供的。
有关的应用程序能够访问从MFP 100的显示器/触摸板部分205到HDD 305的各种资源,并且经由API 503将控制指令发送到控制器502,从而控制MFP 100的原稿扫描部分201、打印机部分、调制解调器通信部分、PDL展开部分等。该应用程序还可以经由网络接口部分301与服务器计算机102通信。
图6中的UI 600示出一个例子,在该例子中,应用程序已根据称为“XYZ Finance”的金融公司的业务内容而被定制。附图标记601表示应用程序的名称/图标显示标签,602表示用户企业的标识图像,603表示操作屏幕的标题(例如,“业务菜单”),604表示显示给用户的消息(例如,“选择适合于要处理的业务票单的类型的业务菜单项”),605表示能够选择对应于用户所期望的业务处理(例如,“信用”、“个人贷款”、“储蓄”或“报表”)的业务菜单项的业务处理选择按钮(按钮控件)。
图7是示出与图6的UI 600有关的应用程序的UI结构模板700的一个例子的图。
在图7中,附图标记701表示应用程序名称/图标显示区,702表示用户定义的标识图像区,703表示标题区,704表示消息显示区,705表示菜单项选择区。根据对应于用户执行的业务票单处理的业务内容,安装在MFP 100中的应用程序可以从服务器计算机102下载适当的UI组件(UI配置文件和UI内容),并根据UI结构模板700中的设置来布置该组件,从而改变UI结构。
图8是示出当应用程序的UI结构被更新时,在MFP 100和服务器计算机102之间执行的通信处理的图。
在图8中,仅在将与UI 600有关的应用程序安装在MFP 100中之后初次执行操作时,服务器计算机102自动检测网络上的MFP100,或者通过操作者手动操作服务器计算机102来进行检测。服务器计算机102的CPU 403将服务器计算机102的主机地址注册在安装在MFP 100中的应用程序中(步骤S801)。注意,该操作可以通过客户机PC 104的显示部分401或MFP 100的显示器/触摸板部分205来执行。
安装在MFP 100中的应用程序指定所注册的主机地址,将对有关UI配置文件的下载请求发送到服务器计算机102(步骤S802)。响应于该下载请求,服务器计算机102的CPU 403将配置文件发送到MFP 100(步骤S803)。
图9是示出以XML(可扩充标记语言)写的UI配置文件的一部分的例子的图。
在图9中部分示出的配置文件900包括区域信息(位置/尺寸),其是安装在MFP 100中的相应应用程序的UI结构模板700的结构信息;区域属性信息(要显示在图7中的各区域701~705中的字符串、图像和控件的类型);关于字符串、图像和控件的信息(按钮控件的排列和菜单层级的表示);要由应用程序处理的票单类型信息的列表(票单类型ID、票单名称、各票单的页数);以及根据票单类型的扫描设置信息(单面或双面扫描、分辨率、彩色/单色、薄片大小等的指定)。
在图9所示的例子中,在元素(element)“MenuItem”中,菜单项名称“personalloan”(个人贷款)存储在元素“Name”中,要显示的消息“Please indicate…”存储在元素“Message”中,票单类型ID“loan_xxx_yyy_001”存储在元素“FormID”中。在从服务器计算机102下载到MFP 100之后,该信息由MFP 100的应用程序分析,并且被用于构建作为图6所示的UI结构的一部分的菜单项“个人贷款”。
返回到图8,关于例如未存储在UI配置文件900中的图像文件的UI内容,MFP 100的应用程序能够将对与事先写在配置文件中的内容ID信息相对应的UI内容的下载请求发送到服务器计算机102(步骤S804),以单独将UI内容从服务器计算机102下载到MFP 100(步骤S805)。MFP 100的应用程序完成从服务器计算机102下载UI配置文件和UI内容,并且在已确认应用程序处于待机(空闲)状态之后,更新UI(步骤S806)。
这里,上述配置文件和内容是根据基于Web服务的通信方法从服务器计算机102下载到MFP 100的。尽管本实施例是以配置文件是XML格式为前提进行说明的,但是配置文件可以以任何格式例如文本文件、二进制文件或数据流来实现。
接下来说明当在任意时间改变MFP 100的应用程序的UI结构时所执行的处理。
在图8中,在服务器计算机102上,用户执行MFP例如MFP100的应用程序的UI结构的改变操作,将UI配置文件的更新通知从服务器计算机102发送到该MFP(步骤S807)。然后,MFP的应用程序以与上述步骤S802~S805相同的方式从服务器计算机102下载UI配置文件和UI内容。
这里,改变UI结构的时间指定写在上述配置文件中。MFP的应用程序缓存新结构信息,并且当根据定时器监视等判断出到达所指定的时间时,在首先确认应用程序处于待机(空闲)状态之后更新UI(步骤S809)。改变UI结构的时间指定可以基于来自服务器计算机102的指令来设置以立即更新UI。因此,UI结构可以通过MFP在随意选择的时间发生改变。
接下来将说明票单扫描处理,该票单扫描处理用于扫描纸质业务票单,以将其转换成之后还要进一步处理的电子票单。
在图8所示的步骤S810中,用户在MFP 100的进稿器202上放置原稿业务票单,通过显示器/触摸板部分205来操作安装在MFP100中的应用程序中的所期望的一个或对其通用的UI,以在业务处理选择按钮605中选择例如菜单项“个人贷款”,并且操作UI上的按钮控件或MFP 100上的硬件按钮以开始原稿票单的扫描(还参见图2和图6)。原稿票单由MFP 100的原稿扫描部分201读取,并作为图像文件存储在HDD 305中。MFP 100的应用程序将附加信息文件(由图15中的附图标记1500示意性示出)附加到图像文件上,并且将附加有附加信息文件的图像文件上载到服务器计算机102(步骤S811)。
这里,已附加有附加信息文件的图像文件根据基于Web服务的通信方法从MFP 100发送到服务器计算机102。由于客户机信息根据业务处理的内容可能包括在业务票单图像中,因此从安全性的角度,在本实施例中可以执行以SSL(加密套接字协议层)为代表的加密通信。
图15示出一个例子,在该例子中,所上载的附加信息文件1500是以XML写的。
在图15中,执行扫描操作的用户的用户名被存储在元素“UserName”中,扫描日期和时间被存储在元素“ScannedDateTime”中,作为扫描结果而生成的图像文件的数量被存储在元素“NumberOfFiles”中,所选择的菜单项名称即票单名称被存储在元素“FormName”中,所选择的票单类型ID被存储在元素“FormID”中。执行扫描时所使用的设置被存储在元素“ScanSettings”中的各元素中。上述处理可以通过安装在MFP100中的扫描仪驱动程序或图像处理程序来执行。
在本实施例中,当MFP 100扫描一个或更多纸质业务票单时,准备附加信息文件1500。需要指出的是,刚才提到的用于准备附加信息文件1500的参数中的大部分是在扫描时由MFP 100自动生成的,其余的一个或更多参数在需要时例如可以通过操作者手动操作MFP 100的显示器/触摸板部分205来输入。
用户在图6所示的UI上选择的菜单项“个人贷款”和图9所示的、与上述例如菜单项“个人贷款”有关的票单类型ID“loan_xxx_yyy_001”是通过使用图15所示的附加信息文件来存储的。另外,在附加信息文件中,可以容易地扩展MFP 100和服务器计算机102的应用程序所需的数据字段,以便还可以上载任何随意选择的扩展数据。尽管本实施例是以附加信息文件是XML格式为前提进行说明的,但是附加信息文件可以以任何格式例如文本文件、二进制文件或数据流来实现。
图18和19是流程图,示出运行在服务器计算机102上的程序处理从MFP 100接收到的图像文件和附加信息文件的过程。
参考图18和19来说明如下情况运行在服务器计算机102上的程序接收由MFP 100扫描的票单的图像文件的上载,分析附加到图像文件的附加信息文件以判断票单类型ID,并且预先将图像文件分类到各票单类型从而为图像文件选择适当的进一步处理。
根据运行在服务器计算机102上的程序,服务器计算机102的CPU 403监视在文件系统上的图像文件的生成(步骤S1801)。该程序包括图像数据的票单识别处理功能和附加信息文件的信息分析功能。如在后面详细说明的,当检测到已生成了图像文件时,CPU 403确认在文件系统的文件夹中是否存在与检测到的图像文件相对应的附加信息文件(步骤S1802)。当不存在附加信息文件时,在本实施例中,CPU 403仅获取检测到的图像文件并进入步骤S1808的票单识别处理,以根据图像文件的数据来检测票单类型。需要指出的是,当没有附加信息文件被附加到图像文件时,可以进行错误处理而不执行票单识别处理。在错误处理中,例如,可以显示尚未附加附加信息文件的指示。
当存在相应的附加信息文件时,CPU 403识别附加信息文件的文件格式(步骤S1803)。当附加信息文件具有图15所示的文件格式(这里称为“文件格式A”)时,CPU 403从附加信息文件读取票单类型ID(步骤S1804)。
CPU 403判断对票单类型是否执行基于在步骤S1804中所提取的票单类型和通过服务器计算机102的票单识别处理所检测的票单类型的双重检查(步骤S1807)。当票单类型要进行双重检查时,CPU 403通过使票单识别应用程序执行预定票单识别逻辑来由票单识别处理检测票单类型(步骤S1808)。例如,步骤S1808中的票单识别处理能以传统的方式进行。接下来,CPU 403判断在步骤S1804中检测到的票单类型与在上述步骤S1808中的票单识别处理检测到的票单类型即双重检查的结果是否匹配(步骤S1809)。当两个票单类型不匹配时,CPU 403通过显示部分401通知用户或操作者检测结果不匹配。响应于此,操作者选择票单类型(步骤S1810)。在步骤S1808中检测到与未附加有附加信息文件的图像文件有关的票单类型的情况下,尽管在图18中图示被省略,但是CPU 403将检测到的票单类型通知给操作者。
需要指出的是,优选不进行双重检查以减小服务器计算机102的负担。然而,在本实施例中选择性地进行双重检查以提高票单类型检测的准确度。
由于上述处理已决定了接收到的图像文件的票单类型,因此CPU 403根据该票单类型将图像文件指定给处理(图19中的步骤S1901)。尽管在业务票单或其图像数据等中的字符识别区域的设置根据票单类型而不同,但是CPU 403可以根据所决定的票单类型来正确执行字符识别处理(步骤S1902),从而可以正确识别在图像文件的字符识别区域中说明的字符,以便将其转换成电子字符信息。当字符识别处理完成时,CPU 403将由上述处理处理或生成的数据,例如与在步骤S1801中检测到的原始图像文件相对应的原始图像数据、附加信息、票单类型ID、以及图像数据的字符识别结果存储在存储装置103中,以便这些数据与其票单类型相对应(步骤S1903)。通过重复执行图18和19所示的处理,根据票单类型对与各图像文件有关的数据进行分类并将其存储在存储装置103中。
在存储了数据之后,CPU 403判断是否可以删除在上述步骤S1801中检测到的原始图像文件(步骤S1904),并且当要删除原始文件时,从文件系统中删除原始文件和有关目录(步骤S1905)。之后,通过上述处理而得到的数据根据业务票单处理的业务内容进行后续处理。
图10是示出存储在由服务器计算机102使用的存储装置103(数据库系统或文件存储系统)中的数据的示例内容,其中该数据内容是以表的格式来表示的。
如图10所示,对于票单管理,服务器计算机102将票单类型ID1001、票单类型名称1002和票单文件1003之间的对应关系存储在存储装置103内的存储表1000中。通过使用存储表1000,可以搜索由票单类型ID表示的票单的名称,以及该票单的原始图像文件。
当从MFP 100上载具有字符识别区已知的票单类型ID中的任一个的图像文件时,执行票单类型识别或选择以及字符识别处理,如图18和19所示,从而服务器计算机102可以适当地开始后续业务处理例如票单处理,从而符合所识别或所选择的票单类型。这里,词语“业务处理”指的是例如开始工作流(在管理业务流的计算机上执行业务处理或业务支持的方案)、发送附加有票单的电子邮件、以及将票单数据发送到核心业务系统的处理,并且可以由用户根据业务内容适当定义。
接下来说明通过操作客户机PC 104在服务器计算机102上编辑上述UI结构的方法。
图11~13是示出用于编辑UI结构的屏幕的图。
在图11中,附图标记1100表示显示在客户机PC 104的显示部分401上的UI结构编辑屏幕的一个例子。当用户希望在UI结构编辑屏幕1100中新生成UI结构时,该UI结构能以配置别名1101来命名。UI结构编辑屏幕1100示出按钮名称1102表示“个人贷款”并且票单类型1103表示“个人贷款申请票单”的例子。图11中的附图标记1105表示“存储”按钮,1106表示“取消”按钮。
通过参考服务器计算机102的存储装置103的存储表1000,为票单类型1103指定的、与票单类型名称“个人贷款申请票单”匹配的指示“个人贷款申请票单”被关联到票单类型ID“loan_xxx_yyy_001”。因此,数据值“个人贷款申请票单”被设置在元素“FormName”中,数据值“loan_xxx_yyy_001”被设置在元素“FormId”中,这些元素位于图9所示的XML数据中的元素“ScanForm”中。在UI结构编辑屏幕1100中的消息区1104上已被编辑的消息以相同的方式设置在XML数据中的元素“Message”中。
同样地,在图12中的UI结构编辑屏幕1200和图13中的UI结构编辑屏幕1300中,可以根据票单类型来指定扫描设置信息和图像文件等。之后,将UI配置文件和UI内容从客户机PC 104发送到服务器计算机102,并将其存储在服务器计算机102中。
如上所述,当存在来自MFP 100的下载请求时,如图8中的步骤S802~S805以及步骤S807~S808所示,将存储在服务器计算机102中的配置文件和内容从服务器计算机102发送到MFP 100。
在图12所示的UI结构编辑屏幕1200中,可以指定用于打印的票单文件。在图12中,附图标记1201表示配置别名,1202表示票单类型,1203表示扫描设置(指定单面或双面扫描、分辨率和彩色/单色),1204表示页数,1205表示与用于打印的票单文件有关的信息,1206表示“存储”按钮,1207表示“取消”按钮。
屏幕1200是使用MFP 100的特征以通过定制UI立即打印出根据所选择的业务内容随意选择的票单的示例结构。例如,当已选择了名称为“个人贷款”的业务处理的用户希望打印出用作个人贷款申请票单的空白票单,或者希望打印出显示如何填写个人贷款申请票单的指南时,使用UI可以立即打印出该文档。
在图13所示的UI结构编辑屏幕1300中,可以指定与要在UI的用户定义标识图像区702中显示的标识图像602相对应的标识图像文件、以及与在UI的图标显示区例如名称/图标显示标签601中显示的图标图像相对应的图标图像文件。在图13中,附图标记1301表示配置别名,1302表示关于标识图像文件的信息,1303表示关于图标图像文件的信息,1304表示“存储”按钮,1305表示“取消”按钮。
接下来,说明在多个MFP连接在图1所示的网络系统上的情况下,对不同MFP的UI使用不同UI结构的方法。
图14是示出以表的格式来表示的、存储在服务器计算机102的存储装置103中的数据的内容的一个例子的图。
如图14所示,对于MFP管理,服务器计算机102将唯一地分配给各MFP的机器ID 1401、MFP机器别名1402和配置别名ID1403之间的对应关系存储在存储装置103内的存储表1400中。在服务器计算机102管理存储表1400的情况下,在图8中的步骤S802和S808中将机器ID从MFP发送到服务器计算机102。服务器计算机102搜索存储表1400,将与适当配置别名相对应的配置文件和内容单独发送到各MFP。
通过该操作,通过使多个MFP分别使用不同的配置别名或相同的配置别名,可以使各MFP构建不同的UI。
如上所述,根据本实施例,通过根据由用户执行的票单处理的业务内容来从服务器计算机102下载UI组件,可以随意改变MFP 100的UI结构。另外,当用户使用MFP扫描票单时,可以通过MFP的UI来选择票单类型,并将包括有票单类型ID的附加信息文件与票单的图像文件一起从MFP上载到服务器计算机102。通过该操作,对于接收票单的图像文件的上载的服务器计算机102,不再需要执行票单类型的识别处理,因此可以减小处理负担。另外,当多个MFP连接到网络时,可以在各MFP上构造不同的UI。
当将附加信息文件附加到从MFP 100接收到的图像文件时,服务器计算机102根据附加信息文件的格式来读取相应的票单类型ID,并判断是否要对票单类型进行双重检查。当票单类型要进行双重检查时,由票单识别处理来检测票单类型,判断检测出的票单类型与对应于附加信息文件的票单类型是否匹配,并根据识别出的票单类型将图像文件分配给处理。通过该方式,通过对票单类型进行双重检查,可以提高识别票单类型的准确度。另外,可以根据附加信息文件事先将图像数据正确分类到票单类型,因此可以快速开始后续业务处理。
尽管在上述实施例中已经说明了网络系统被构造成图1所示的示例情况,但是本发明不局限于此,任意数量的装置(MFP、客户机PC)可以连接到网络。另外,可以使用将MFP之外的其它扫描仪、打印机等连接到网络的结构。网络可以由任意类型的网络(LAN、WAN或因特网等)构建。
另外,尽管在上述实施例中已经说明了根据金融企业的业务内容定制MFP 100的UI的例子,但是本发明并不局限于此,可以应用于金融业之外的各种行业。
尽管在上述实施例中已经说明了MFP 100的UI是可定制的并且所扫描的票单被处理为电子票单的例子,但是本发明并不局限于此,可以应用于由MFP 100通过传真从外部装置接收到的文档(下面称为“传真文档”)被处理为电子票单的情况。
现在说明由MFP 100从外部装置接收到的传真文档被处理为电子票单的例子,作为本发明的变形实施例。
在上述图1中,当MFP 100从外部装置接收常规传真文档时,通过电话/传真线105接收传真文档。另外,当MFP 100通过因特网从外部装置接收传真文档(因特网传真文档)时,通过网关装置106和网络101接收传真文档。
图16是示出当上载文件时在MFP 100和服务器计算机102之间执行的通信处理的图。
在图16中,当通过网络接口部分301接收传真文档时(步骤S1601),MFP 100的CPU 302将接收到的传真文档转换为图像文件,将例如接收方传真号码和传真接收时间的信息作为附加信息文件附加到图像文件上,并将图像文件上载到服务器计算机102(步骤S1602)。
图20是示出附加信息文件2000是以XML写的例子的图。
在图20中,发送方传真号码被存储在元素“From”中,接收方传真号码被存储在元素“To”中,接收到传真文档的日期和时间被存储在元素“ReceivedDateTime”中,所生成的图像文件的数量被存储在元素“NumberOfFiles”。
在图18和19中,服务器计算机102的CPU 403根据运行在服务器计算机102上的程序来进行与上述步骤S1801~S1803相同的处理,当附加信息文件是传真文档的附加信息文件(这里称为“文件格式B”)时,CPU 403从附加信息文件中读取接收方传真号码(步骤S1805)。
在传真文档的情况下,事先为票单分配不同的申请传真号码,例如对“信用卡申请”分配“03_5555_xxxx”、对“贷款申请”分配“03_5555_yyyy”,并且如图17所示,提供传真文档的票单类型ID与传真文档要到达的各接收方传真号码的对应表1700。通过搜索对应表1700,CPU 403可以检测接收到的图像文件的票单类型(步骤S1806)。在以下步骤S1807~S1810和步骤S1901~S1905中,以与前述相同的方式进行处理。
以上对传真文档的接收处理的例子说明了变形实施例。通过进一步扩展附加信息文件的格式,可以从各种类型的装置获取票单类型识别信息。
在实施例及其变形例中,存储在作为数据处理装置的一个例子的服务器装置内的程序的票单识别功能使CPU执行预定的票单识别逻辑,从而执行票单识别处理,以识别通过读取原稿票单而生成的图像数据的票单类型。这时,由程序的票单识别功能执行的票单识别处理使用附加信息文件来控制,该附加信息文件是由该程序得到的控制信息的一个例子。
另外,可以定义附加信息文件,以与成像装置例如带有票单识别功能的多功能装置或从纸质票单读取图像数据的传真机的功能相对应。
另外,附加信息文件可以是能指定在程序获取图像数据之前该图像数据是否已进行过预定票单识别处理的信息。
当附加信息文件表示在接收图像数据之前该图像数据已由多功能装置等进行过预定票单识别处理时,可以执行控制以跳过票单识别功能的处理,从而省略对图像数据的票单识别处理。
可选地,即使附加信息文件表示已事先对图像数据执行过预定票单识别处理,也可以开始票单识别逻辑,以便通过服务器装置的显示部分401显示输入屏幕,以询问用户是否希望使票单识别逻辑重复识别处理。通过操作鼠标等,看到该输入屏幕的用户可以对输入控制部分400进行输入,当该输入使重复识别处理的功能有效时,可以对之前已进行过票单识别处理的数据再次执行票单识别处理。
当用于附加信息文件的通信的标识符是例如传真号码或电话号码时,程序可以省略使用票单识别逻辑的票单识别。与图像数据相对应的票单可以被识别为与该传真号码或电话号码相对应的票单,并且可以自动分配后续处理。
这完成了对服务器装置侧的特征的说明。
通过读取原稿票单来生成图像数据的图像处理程序、传输所生成的图像数据的网络接口部分、以及存储用于控制在图像数据的接收方执行的票单识别处理的附加信息文件的多功能装置100已作为数据发送方说明如上。
当用户使用图像处理装置的读取装置读取票单时,用户能通过图像处理装置的用户接口来选择票单类型,并将票单类型信息附加到之后从图像处理装置发送到作为数据处理装置的服务器计算机的票单的图像文件上。通过该操作,用于接收票单的图像文件的传输的数据处理装置不需要执行票单类型的识别处理,因此可以减小数据处理装置的处理负担。另外,当多个图像处理装置连接到网络时,可以为各图像处理装置构造不同的用户接口。
根据上述实施例,当执行比较处理以对基于附加到图像文件上的附加信息而得到的票单类型和通过票单识别处理而发现的票单类型进行比较时,判断票单类型是否匹配,并且基于所识别的票单类型来分配处理。通过该方式,通过对票单类型进行双重检查,可以提高识别票单类型的准确度。另外,通过事先将图像数据正确分类到基于附加信息的票单类型,可以快速开始后续业务处理。
应当理解,本发明的目的还可以通过向系统或装置提供存储有用于实现上述实施例及其变形例中的任一个的功能的软件的程序代码的存储介质(或者记录介质),并且使该系统或装置的计算机(或CPU或MPU)读出并执行存储在该存储介质中的程序代码来实现。
在这种情况下,从存储介质中读出的程序代码本身实现上述实施例及其变形例中的任一个的功能,因此程序代码和存储程序代码的存储介质构成本发明。
用于提供程序代码的存储介质的例子包括软(floppy,注册商标)盘,硬盘,磁光盘,光盘例如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW,磁带,非易失性存储卡,以及ROM。可选地,程序代码可以从未示出的连接到因特网、商用网络、局域网等的另一计算机、数据库等下载。
此外,应当理解,上述实施例及其变形例中的任一个的功能不仅可以通过执行由计算机读出的程序代码来实现,还可以通过使运行在计算机上的OS(操作系统)等根据程序代码的指令执行部分或全部实际操作来实现。
此外,应当理解,上述实施例及其变形例中的任一个的功能可以通过将从存储介质读出的程序代码写入设置在插入计算机的扩展板或连接到计算机的扩展单元上的存储器、然后使设置在该扩展板或扩展单元中的CPU根据程序代码的指令执行部分或全部实际操作来实现。
此外,程序的形式可以是目标代码、由编译程序执行的程序代码、或者提供给OS的脚本数据。
权利要求
1.一种数据处理装置,包括图像输入单元,用于输入票单的图像信息,该图像信息附加有票单类型信息;字符识别单元,用于基于该所附加的票单类型信息来对由所述图像输入单元输入的该图像信息执行字符识别处理;以及存储单元,用于存储该图像信息和通过所述字符识别单元在该字符识别处理中获得的结果。
2.根据权利要求1所述的数据处理装置,其特征在于,还包括票单识别单元,用于对由所述图像输入单元输入的该图像信息执行票单识别处理以获得票单类型;以及票单类型判断单元,用于判断通过所述票单识别单元执行的该票单识别处理而获得的票单类型与由所述图像输入单元输入的该票单类型信息所表示的票单类型是否匹配,其中,当所述票单类型判断单元已判断出由所述票单识别单元获得的票单类型与由该票单类型信息所表示的票单类型相匹配时,所述字符识别单元执行该字符识别处理。
3.根据权利要求2所述的数据处理装置,其特征在于,还包括票单类型输入单元,该票单类型输入单元用于当所述票单类型判断单元已判断出由所述票单识别单元获得的票单类型与由该票单类型信息所表示的票单类型不匹配并且已选择了所述两个票单类型中的一个时,输入该所选择的票单类型。
4.根据权利要求2所述的数据处理装置,其特征在于,还包括检查单元,该检查单元用于检查是否执行由所述票单类型判断单元进行的判断,其中,当判断为要执行由所述票单类型判断单元进行的判断时,所述票单识别单元执行该票单识别处理,并且所述票单类型判断单元执行该判断。
5.一种图像处理装置,用于连接数据处理装置,该图像处理装置包括显示单元,用于显示用于设置票单的票单类型信息的设置屏幕;读取单元,用于读取该票单的图像以获取该票单的图像信息;以及发送单元,用于将通过所述显示单元所显示的该设置屏幕而设置的该票单类型信息附加到由所述读取单元获得的该图像信息上,并将附加有该票单类型信息的该图像信息发送到该数据处理装置。
6.根据权利要求5所述的图像处理装置,其特征在于,还包括获取单元,该获取单元获取该设置屏幕的配置信息,该配置信息包括所述读取单元的读取设置信息,所述读取设置信息对应于由该票单类型信息所表示的票单类型。
7.一种数据处理方法,包括图像输入步骤,用于输入票单的图像信息,该图像信息附加有票单类型信息;字符识别步骤,用于基于该所附加的票单类型信息来对在所述图像输入步骤中输入的该图像信息执行字符识别处理;以及存储步骤,用于存储该图像信息和在所述字符识别步骤中的该字符识别处理中获得的结果。
8.根据权利要求7所述的数据处理方法,其特征在于,还包括票单识别步骤,用于对在所述图像输入步骤中输入的该图像信息执行票单识别处理以获得票单类型;以及票单类型判断步骤,用于判断在所述票单识别步骤执行的该票单识别处理中获得的票单类型与在所述图像输入步骤中输入的该票单类型信息所表示的票单类型是否匹配,其中,当在该票单类型判断步骤中已判断出在所述票单识别步骤中获得的票单类型与由该票单类型信息所表示的票单类型相匹配时,在该字符识别步骤中执行该字符识别处理。
9.根据权利要求8所述的数据处理方法,其特征在于,还包括票单类型输入步骤,该票单类型输入步骤用于当在所述票单类型判断步骤中已判断出在所述票单识别步骤中获得的票单类型与由该票单类型信息所表示的票单类型不匹配并且已选择了所述两个票单类型中的一个时,输入所选择的票单类型。
10.根据权利要求8所述的数据处理方法,其特征在于,还包括检查步骤,该检查步骤用于检查是否执行所述票单类型判断步骤中的判断,其中,当判断为要执行所述票单类型判断步骤中的判断时,在所述票单识别步骤中执行该票单识别处理,并且在所述票单类型判断步骤中执行该判断。
11.一种图像处理方法,包括显示步骤,用于显示用于设置票单的票单类型信息的设置屏幕;读取步骤,用于读取该票单的图像以获取该票单的图像信息;以及发送步骤,用于将通过在所述显示步骤中显示的该设置屏幕而设置的该票单类型信息附加到在所述读取步骤中获得的该图像信息上,并将附加有该票单类型信息的该图像信息发送到数据处理装置。
12.根据权利要求11所述的图像处理方法,其特征在于,还包括获取步骤,该获取步骤获取该设置屏幕的配置信息,该配置信息包括在所述读取步骤中使用的读取设置信息,所述读取设置信息对应于由该票单类型信息所表示的票单类型。
全文摘要
本发明提供一种数据处理装置和方法、以及图像处理装置和方法。该数据处理装置能提高识别票单类型的准确度。输入票单的图像文件以及包括有该票单的票单类型ID的附加文件。根据票单类型ID对图像文件执行字符识别处理。图像文件和在字符识别处理中获得的结果存储在存储装置(103)中。
文档编号G06F19/00GK1815490SQ20061000281
公开日2006年8月9日 申请日期2006年2月5日 优先权日2005年2月1日
发明者松田浩太郎 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1