图像处理设备和图像处理方法与流程

文档序号：11155168阅读：477来源：国知局

本发明涉及图像处理设备和图像处理方法。

背景技术：

日本未经审查的专利申请公开No.9-138837公开了以下的技术：提取二值图像的水平和垂直边界，检测图的拐角，检测充当边界交叉处的点，连接这些点，检测具有矩形形状的最靠外外部框架的轮廓，提取框架结构的特征，通过参考列出预先登记的框架结构的特征的框架结构参考表来识别输入报告形式，并且检测字符读取区域。

日本未经审查的专利申请公开No.6-119491公开了以下的技术：准备将识别目标报告形式的各项之间的物理布局关系与条目类型(诸如，用户的地址和名称)关联的报告形式定义表，从输入报告形式的图像数据中提取限定连续排列的白色像素的边界的矩形，将大小等于或大于阈值的矩形确定为写框架，用报告形式定义表的定义信息来检查得自所确定的写框架的各项的物理布局关系，确定写入项的类型，并且使用各写入项的类型特有的信息对写入项执行字符识别操作。

可通过识别在原始文档(诸如，报告形式)中绘出的字符和边界将原始文档分类。例如，字符或边界的识别可根据原始文档的类型而表现得好或不好。

技术实现要素：

本发明的目的是相比于使用不顾及原始文档类型而确定的识别处理的系统，在分类原始文档时大幅提高了分类准确性。

根据本发明的第一方面，提供了一种图像处理设备。所述图像处理设备包括：获取单元，其获取原始文档上形成的图像的图像信息；以及分类单元，其使用所述获取单元获取的图像信息，响应于作为第一识别操作和第二识别操作中的一个的操作结果，按照所述第一识别操作和所述第二识别操作中的所述一个或两个将所述图像分类。所述第一识别操作被配置为根据所述图像的特征量将图像分类，所述第二识别操作被配置为根据图像的字符信息将所述图像分类。

根据本发明的第二方面，依据图像处理设备的第一方面，如果预定关联关系指明作为所述第一识别操作和所述第二识别操作中的另一个的另一个识别操作的执行与所述一个识别操作的操作结果关联，则所述分类单元在所述一个识别操作之后，执行所述另一个识别操作。

根据本发明的第三方面，依据图像处理设备的第一方面，分别针对所述第一识别操作和所述第二识别操作预定多个项并且所述分类单元在所述第一识别操作和所述第二识别操作中的每个中识别所述图像属于哪一个项。如果在所述一个识别操作之后执行所述另一个识别操作，则所述分类单元减少预定项，以响应于所述一个识别操作的操作结果来选择更少量的项，并且在所述另一个识别操作中识别所述图像属于所选择的项中的哪一个。

根据本发明的第四方面，依据图像处理设备的第三方面，预先按照每一项将针对各识别操作预定的项与图像的分类目的地关联。所述分类单元将所述图像分类为与在所述另一个识别操作中所述图像被识别所属的项关联的分类目的地。

根据本发明的第五方面，依据图像处理设备的第一方面，如果如果作为所述一个识别操作的结果输出了多个候选，则所述分类单元按照预定次序来选择所述候选，直到确定了所述图像的分类目的地，并且使用所选择的候选，按照所述第一识别操作和所述第二识别操作中的一个或两个将所述图像分类。

根据本发明的第六方面，依据图像处理设备的第一方面，所述分类单元根据用户指定的条件，确定首先要执行所述第一识别操作和所述第二识别操作中的哪一个。

根据本发明的第七方面，依据图像处理设备的第一方面，所述图像的特征量包括所述图像中包含的边界。

根据本发明的第八方面，提供了一种图像处理设备。所述图像处理设备包括：获取单元，其获取原始文档上形成的图像的图像信息；以及分类单元，其使用所述获取单元获取的图像信息，响应于第一识别操作和与所述第一识别操作不同的第二识别操作中的一个的操作结果，按照所述第一识别操作和所述第二识别操作中的所述一个或两个将所述图像分类。

根据本发明的第九方面，提供了一种图像处理方法。所述图像处理方法包括：获取原始文档上形成的图像的图像信息；以及使用获取的所述图像信息，响应于第一识别操作和第二识别操作中的一个的操作结果，按照所述第一识别操作和所述第二识别操作中的所述一个或两个将所述图像分类，所述第一识别操作被配置为根据所述图像的特征量将图像分类，所述第二识别操作被配置为根据图像的字符信息将所述图像分类。

根据本发明的第一方面和第九方面，相比于使用不顾及原始文档类型而确定的识别处理的系统，所述图像处理设备在分类原始文档时大幅提高了分类准确性。

根据本发明的第二方面，相比于使用不顾及原始文档类型而确定的识别处理的系统，所述图像处理设备大幅提高了分类准确性。

根据本发明的第三方面，相比于确定图像是否属于所有预定项中的每个的系统，所述图像处理设备大幅增加了处理速度。

根据本发明的第四方面，相比于使用不顾及原始文档类型而确定的识别处理的系统，所述图像处理设备大幅提高了分类准确性。

根据本发明的第五方面，即使所述一个识别操作不能够唯一地识别图像，所述图像处理设备也确定原始文档的分类目的地。

根据本发明的第六方面，所述图像处理设备首先根据用户指定的条件来确定首先要执行第一识别操作和第二识别操作中的哪一个。

根据本发明的第七方面，根据图像中包含的边界将原始文档分类。

根据本发明的第八方面，相比于使用不顾及原始文档类型而确定的识别处理的系统，所述图像处理设备在分类原始文档时大幅提高了分类准确性。

附图说明

将基于下面的附图详细地描述本发明的示例性实施方式，其中：

图1总体上示出示例性实施方式的图像处理系统；

图2示出示例性实施方式的图像读取设备的硬件构造；

图3示出示例性实施方式的终端设备的硬件构造；

图4是示例性实施方式的终端设备的功能构造的框图；

图5示出光学字符识别(OCR)操作和边界识别操作的示例；

图6是示出图像处理系统的处理的例程的流程图；

图7示出可靠性表的示例；以及

图8是示出在为OCR识别操作赋予较高优先级的情况下执行的处理的例程的流程图。

具体实施方式

以下，参照附图描述本发明的示例性实施方式。

首先，描述示例性实施方式的图像处理系统1的整体构造。图1总体上示出示例性实施方式的图像处理系统1。示例性实施方式的图像处理系统1将诸如报告的原始文档分类。更具体地，示例性实施方式的图像处理系统1将诸如报告的原始文档分类。更具体地，在图像处理系统1上设置包括“交付声明”和“账单”的各种类型的原始文档并且图像处理系统1根据原始文档的内容将原始文档分类。通过将原始文档分类，用户验证处于被分类状态的原始文档上写上的各项，并且按照各分类类别预定的处理流程来处理原始文档。

如图1中所示，图像处理系统1包括图像读取设备10和终端设备20。图像读取设备10通过读取原始文档上形成的图像，生成图像数据(图像信息)。终端设备20借助网络30从图像读取设备10接收图像信息并且将接收到的图像信息分类。

具有扫描功能的图像读取设备10读取诸如报告的原始文档(纸张)上形成的图像，并且生成指示被读取图像的图像信息(下文中被称为“原始文档图像信息”)。图像读取设备10可以例如是扫描仪装置，并且是基于电荷耦合器件(CCD)系统或接触式图像传感器(CIS)系统。在CCD系统中，用光束照射文档，然后借助透镜收集被文档反射的光束。在CIS系统中，用来自发光二极管(LED)的光束照射文档，并且由CIS传感器接收被文档反射的光束。除了扫描功能之外，图像读取设备10还可具有印刷功能、复印功能或传真功能。

终端设备20借助网络30接收由图像读取设备10生成的原始文档图像信息，并且使用接收到的原始文档图像信息将原始文档分类(即，将原始文档上形成的图像分类)。个人计算机(PC)可用于终端设备20。按照示例性实施方式，终端设备20具有用作图像处理设备的功能。

如以下更详细描述的，终端设备20通过执行通过光学字符识别(OCR)识别原始文档(原始文档图像信息)中包含的字符(包括数字、符号和标记)的操作和识别原始文档中包含的边界的操作将原始文档分类。OCR是分析图像数据中的字符并且将字符转换成计算机将要操纵的字符数据的技术。边界代表垂直地或水平地绘制以勾画或包围各项的线，并且被视为代表图像的特征量的信息示例。

通过OCR识别原始文档中包含的字符信息并且将所识别的字符信息分类的操作还可被称为OCR识别操作。识别原始文档中包含的边界并且将其分类的操作还可被称为边界识别操作。按照示例性实施方式，使用边界识别操作作为第一识别操作的示例。使用OCR识别操作作为第二识别操作的示例。

网络30是用于图像读取设备10和终端设备20之间的信息通信的通信网络。例如，网络30是局域网(LAN)。

以下，描述图像读取设备10的硬件构造。图2示出示例性实施方式的图像读取设备10的硬件构造。如图2中所示，图像读取设备10包括中央处理单元(CPU)101、随机存取存储器(RAM)102、只读存储器(ROM)103、硬盘驱动(HDD)104、显示面板105、图像形成单元106、图像读取单元107和通信接口(下文中被称为通信I/F)108。这些元件借助总线109彼此相互连接，并且借助总线109交换数据。

CPU 101执行各种程序，包括操作系统(OS)和应用。RAM 102用作CPU 101的作业存储器。ROM 103存储CPU 101将要执行的各种程序。CPU 101将来自ROM 103等的各种程序加载到RAM 102，以执行这些程序。CPU 101因此执行图像读取设备10的功能中的每个。HDD 104存储输入到各种软件程序或者从各种软件程序输出的数据。

显示面板105从用户接收各种信息或操作输入的显示。

图像形成单元106响应于输入图像数据，在记录介质上形成图像。图像形成单元106是通过将光导鼓上的色调剂转移到记录介质或喷墨系统来形成图像的电子摄影系统，喷墨系统通过将墨水喷射到记录介质上来形成图像。

图像读取单元107读取记录介质上形成的图像，并且生成代表读取图像的原始文档图像信息。

通信I/F 108借助网络30从诸如终端设备20的外部设备接收各种数据或者将数据发送到外部设备。

以下，描述终端设备20的硬件构造。图3示出示例性实施方式的终端设备20的硬件构造。如图3中所示，终端设备20包括CPU 201、存储器202和磁盘装置(HDD)203。

CPU 201执行包括OS和应用的各种程序，从而实现终端设备20的功能。存储器202存储执行程序时使用的各种程序和数据。磁盘装置203存储输入程序的数据或者从程序输出的数据。终端设备20还包括被配置为与外部通信的通信I/F 204、包括视频存储器、显示器等的显示机构205、和诸如键盘和鼠标的输入装置206。

以下，描述终端设备20的功能和构造。图4是示例性实施方式的终端设备20的功能构造的框图。

终端设备20包括图像信息接收器21、操作输入接收器22、OCR识别单元23和边界识别单元24。图像信息接收器21借助网络30从图像读取设备10接收原始文档图像信息。操作输入接收器22从该用户接收操作输入。OCR识别单元23识别原始文档图像信息。边界识别单元24通过边界识别操作来识别原始文档图像信息。

终端设备20还包括分类处理器25和可靠性表存储器26。分类处理器25基于OCR识别操作的操作结果和边界识别操作的操作结果来确定分类目的地。可靠性表存储器26预先存储系统管理员制作的可靠性表。

图像信息接收器21借助网络30从图像读取设备10接收图像读取单元107已经通过读取原始文档上形成的图像而生成的原始文档图像信息。

操作输入接收器22从用户接收操作输入。例如，操作输入接收器22接收指定当要将原始文档分类时的分类模式的操作输入。分类模式指示各原始文档所属的分类类别。用户通过考虑各设置文档的内容来指定分类模式。以下，详细地描述分类模式。

OCR识别单元23通过OCR识别操作来识别原始文档图像信息。更具体地，OCR识别单元23通过OCR识别操作来识别图像信息接收器21接收的原始文档图像信息中包含的字符。基于所识别的字符(字符串)的信息，OCR识别单元23将原始文档分类为针对OCR识别操作预定的多个分类项中的一个。

边界识别单元24通过边界识别操作来识别原始文档图像信息。更具体地，边界识别单元24水平地和垂直地扫描图像信息接收器21接收的原始文档图像信息，并且识别具有预定长度或更长的连续黑点的线作为边界。基于所识别的边界的信息，边界识别单元24将原始文档分类，使其成为针对边界识别操作确定的多个分类项中的一个。

参照图5描述OCR识别操作和边界识别操作。图5示出OCR识别操作和边界识别操作的示例。图5的原始文档301包括由边界形成的图302和图303。图302包括字符串“AAA”并且图303包括字符串“BBB”。

在OCR识别操作中，OCR识别单元23执行字符识别，从而得知在原始文档301中绘制字符串“AAA”和字符串“BBB”。如果在原始文档301中绘制字符串“AAA”和字符串“BBB”的情况下针对OCR识别操作预定分类项，则OCR识别单元23将原始文档分类为预定分类项。当在OCR识别操作中执行分类时，可使用与字符相关的任何信息(诸如，字符的大小和位置(坐标信息))。

在边界识别操作中，边界识别单元24识别在原始文档301中绘制边界(诸如，图302和图303)。如果在原始文档301中绘制图302和图303的情况下针对边界识别操作预定分类项，则边界识别单元24将原始文档分类为预定分类项。当在边界识别操作中执行分类时，可使用与边界相关的任何信息(诸如，边界的类型、大小和位置(坐标信息))。

因此，执行OCR识别操作和边界识别操作。

分类处理器25确定是将要使用OCR识别操作和边界识别操作中的一个还是两个。分类处理器25通过执行OCR识别操作和边界识别操作中的一个或两个，确定原始文档的最终分类目的地。分类处理器25在本文中确定原始文档的类型是原始文档的最终分类目的地。

对分类时用户指定的各分类模式，确定具有优先级的识别操作(即，OCR识别操作或边界识别操作)。另外，根据原始文档，可通过识别字符而非边界，更容易地将一些文档分类，并且可通过识别边界而非字符，更容易地将其他文档分类。预先地，系统管理员可基于各分类模式来确定哪一个识别操作优先于其他。按照用户指定的分类模式，分类处理器25将OCR识别操作和边界识别操作之间的一个识别操作优先于其他识别操作。在示例性实施方式中，用户将要指定的条件的示例是分类模式。

分类处理器25为OCR识别操作和边界识别操作中的一个赋予优先级，然后基于执行的具有优先级的一个识别操作的操作结果，确定是否要执行另一个识别操作。存储在可靠性表存储器26中的可靠性表将OCR识别操作的操作结果与是否要在OCR识别操作之后执行边界识别操作关联。另外，存储在可靠性表存储器26中的可靠性表将边界识别操作的操作结果与是否要在边界识别操作之后执行OCR识别操作关联。为此原因，在执行一个识别操作之后，分类处理器25参考可靠性表来确定是否要执行另一个识别操作。

基于在OCR识别操作和边界识别操作之中的在另一个识别操作之前执行一个识别操作的操作结果，分类处理器25使用识别操作中的一个或两个的操作结果，确定原始文档的分类目的地。

可靠性表存储器26存储预先制作的可靠性表。可靠性表列出用于确定是否要执行OCR识别操作和边界识别操作的信息。可靠性表还列出用于按照OCR识别操作的操作结果和边界识别操作的操作结果来确定原始文档的分类目的地的信息。以下，详细描述可靠性表。在示例性实施方式中，使用可靠性表作为预定关联关系的示例。

显示器27向用户显示分类处理器25提供的分类结果。

当软件资源与硬件资源协作时，实现终端设备20中的这些功能中的每个。更具体地，CPU 201将来自磁盘装置203的被配置为实现终端设备20的功能的程序读取到存储器202上，并且执行程序。CPU 201因此实现功能。例如，可用磁盘装置203实现可靠性表存储器26。例如，可用显示机构205实现显示器27。

在示例性实施方式中，图像信息接收器21用于充当获取单元的示例。OCR识别单元23、边界识别单元24和分类处理器25用于充当分类单元的示例。

以下，描述图像处理系统1的处理的例程。图6是示出图像处理系统1的处理的例程的流程图。在初始状态下，用户将原始文档设置为图像读取设备10上的分类目标。

用户响应于设置的原始文档来指定分类模式。操作输入接收器22接收指定分类模式的操作(步骤S101)。分类模式指示原始文档所属的类别。更具体地，以各作业为基础，以各情况为基础，或者以消费者为基础，确定订购作业、交付作业等分类模式。在示例性实施方式中，用户仅仅指定预先准备的多个分类模式之中的响应于设置的原始文档的分类模式。

用户操作图像读取设备10以读取设置的原始文档。因此生成的原始文档图像信息被发送到终端设备20。

分类处理器25按照指定的分类模式，确定是否要使OCR识别操作优先于边界识别操作(步骤S102)。如果步骤S102中的确定结果是“是”，则通过OCR识别操作来识别原始文档图像信息(步骤S103)。

在步骤S103中，OCR识别单元23通过OCR识别操作来识别原始文档图像信息。分类处理器25参考可靠性表，以响应于OCR识别操作的操作结果，确定是否要执行边界识别操作。换句话讲，如果可靠性表将OCR识别操作的操作结果与边界识别操作的执行关联，则分类处理器25确定要执行边界识别操作。如果确定要执行边界识别操作，则边界识别单元24通过边界识别操作来识别原始文档图像信息。

如果步骤S102中的确定结果是“否”，则通过具有优先级的边界识别操作来识别原始文档图像信息(步骤S104)。在步骤S104中，边界识别单元24通过边界识别操作来识别原始文档图像信息。通过参考可靠性表，分类处理器25参考响应于边界识别操作的操作结果，确定是否要执行OCR识别操作。换句话讲，如果可靠性表将边界识别操作的操作结果与OCR识别操作的执行关联，则确定要执行OCR识别操作。如果确定要执行OCR识别操作，则OCR识别单元22识别原始文档图像信息。

在步骤S103或步骤S104之后，分类处理器25响应于OCR识别操作的操作结果和边界识别操作的操作结果，确定原始文档的分类目的地(步骤S105)。响应于步骤S103和步骤S104中执行的识别操作的操作结果，确定原始文档的分类目的地。更具体地，使用OCR识别操作和边界识别操作的操作结果中的一个或两个，确定原始文档的分类目的地。确定被构造用于用户指定的分类模式的各种类型的原始文档之中的一种类型的原始文档是原始文档的分类目的地。因此完成处理的例程。

以下，描述可靠性表。图7示出可靠性表的示例。可靠性表是已经得知用作分类目标的各种不同原始文档的格式的系统管理员制作的。更具体地，系统管理员已经得知关于用作分类目标的各原始文档上绘制的字符和边界的信息，然后制作可靠性表。

“分类模式标识”代表分类模式。如图7中所示，分类模式标识列出“分类模式1”和“分类模式2”。更具体地，“分类模式1”指示“交付”的作业，“分类模式2”指示“完成合约”的作业。

“分类名称”代表原始文档的类型。如图7中所示，列出“文档1”和“文档2”。更具体地，列出“交付声明”、“账单”等。此外，“文档1”、“文档2”和“文档3”这三种文档类型被包括在“分类模式1”的类别中。换句话讲，如果“分类模式”指示“交付操作”，则使用“文档1”、“文档2”和“文档3”这三种文档类型。在示例性实施方式中，分类处理器25确定列在“分类名称”下方的文档类型是原始文档的分类目的地。

“OCR分类”代表OCR识别操作的分类项，根据其将原始文档进行分类。如图7中所示，OCR识别操作将“文档1”的原始文档分类为“A1”至“A7”分类项中的一个。预先将分类项“A1”至“A7”与用作原始文档的分类目的地的“文档1”关联。

如果“文档1”代表“交付声明”，则通常从不同来源发出交付声明。一些交付声明可被印刷为“发票”。其他交付声明可被印刷为“交付证书”。文档的类型一般被作为交付声明来操纵，但对于不同文档，OCR将要识别的字符串可以是不同的。即使文档具有相同的“分类名称”，也将它们分类为分类项“A1”至“A7”。例如，“A1”指示上面印刷有“交付声明”的原始文档，“A2”指示上面印刷有“发票”的原始文档。

如果在OCR分类中将原始文档分类为“不可应用”类别，则这意味着，没有将原始文档分类为分类项“A1”至“A7”中的任一个。在交付声明的“文档1”中，可按给定格式印刷交付声明的仅仅单个词语“交付”来替代全部词语“交付声明”。在这种情况下，通过OCR识别操作，可不能将文档分类为交付声明。依据这种情况，“不可应用”类别被包括在OCR分类中。

“边界分类”代表边界识别操作的分类项，根据其将原始文档进行分类。如图7中所示，边界识别操作将“文档1”的原始文档分类为“B1”至“B4”分类项中的一个。预先将分类项“B1”至“B4”与用作原始文档的分类目的地的“文档1”关联。

如果“文档1”代表“交付声明”，则通常从不同来源发出交付声明。根据边界的边界结构，可将文档分类为四个分类项“B1”至“B4”。例如，将具有“OCR分类”下方的“A2”的所有原始文档分类为“边界分类”下方的“B1”。另一方面，将具有“OCR分类”下方的“A3”的原始文档中的一些分类为“边界分类”下方的“B1”，而将具有“OCR分类”下方的“A3”的其他原始文档分类为“边界分类”下方的“B2”。

在边界分类下方的“不可应用”类别中，没有将原始文档分类为分类项“B1”至“B4”中的任一个。在“文档1”的情况下，一些交付声明可没有按其格式绘制的边界，并且可不根据边界进行分类。依据这种情况下，通过边界识别操作，不可将原始文档分类为交付声明。因此，包括边界分类类别“不可应用”。

“OCR确定”基于边界识别操作的操作结果并且指示是否要执行OCR识别操作。这里，“是”指示将要执行OCR识别操作而“否”指示将不执行OCR识别操作。

“边界确定”基于OCR识别操作的操作结果并且指示是否要执行边界识别操作。这里，“是”指示将要执行边界识别操作而“否”指示将不执行边界识别操作。

按照OCR识别操作的操作结果或边界识别操作的操作结果的可靠性，确定OCR识别操作或边界识别操作的“是”或“否”。

例如，即使通过OCR识别操作将原始文档分类为“A4”，可靠性也不会高得足以确定“分类名称”是“文档1”。另一方面，如果通过边界识别操作将原始文档分类为“B2”，可靠性可高得足以确定原始文档是“文档1”，而不需要执行OCR识别操作。在这种情况下，确定“OCR确定”是“否”而确定“边界确定”是“是”。

如果“OCR分类”是不可应用的，则通过OCR识别操作不能分类原始文档，并且“OCR确定”因此是“否”。类似地，如果“边界分类”是不可应用的，则通过边界识别操作不能分类原始文档，并且“边界确定”因此是“否”。

参照图7的可靠性表，描述基于可靠性表进行的处理的例程的特定示例。本文中的处理对应于图6的步骤S103至S105中的操作。用户可即刻指定“分类模式1”。

以下，描述第一特定示例。在这个示例中，在OCR识别操作具有优先级的情况下，OCR识别操作可已经将原始文档分类为分类项“A2”。

分类处理器25参考可靠性表，并且响应于“OCR分类”下方的“A2”来检查“边界确定”。如图7中列出的，响应于“A2”的“边界确定”是“是”。为此原因，执行边界识别操作。

可靠性表指示响应于“A2”的“边界分类”是“B1”。如果边界识别单元24提供的操作结果是“B1”，则操作结果匹配可靠性表中的信息。确定响应于原始文档图像信息的原始文档的类型是“文档1”，“文档1”是响应于“A2”和“B1”的“分类名称”。更具体地，分类处理器25确定原始文档的类型是作为原始文档的分类目的地的“文档1”。另一方面，如果边界识别单元24提供的操作结果不是“B1”，则操作结果无法匹配可靠性表中的信息。在这个时间点，没有确定原始文档的类型。

边界识别单元24提供的操作结果可仅仅确定是否能将原始文档分类为“B1”，而不一定必须确定是否能将原始文档分类为“B2”或“B3”而非“B1”。换句话讲，边界识别单元24比照被分类为“B1”的边界来检查原始文档图像信息中绘制的边界，以确定边界是否能被分类为“B1”。

在示例性实施方式中，首先对原始文档执行OCR识别操作减少了预定多个分类项，以在边界识别操作中选择更少量的分类项，并且执行将原始文档归类为所选择分类项中的一个的操作。在这个示例中，在预定分类项“B1”至“B4”收窄至“B1” 的情况下，执行边界识别操作。

以下，描述第二特定示例。在这个示例中，在边界识别操作具有优先级的情况下，边界识别操作可已经将原始文档归类为分类项“B3”。

分类处理器25参考可靠性表，并且响应于“边界分类”下方的“B3”来检查“OCR确定”。如图7中列出的，响应于“B3”的“OCR确定”是“是”。为此原因，执行OCR识别操作。

可靠性表指示响应于“B3”的“OCR分类”是“A6”或“A7”。如果OCR识别单元23提供的操作结果是“A6”或“A7”，则操作结果匹配可靠性表中的信息。确定响应于原始文档图像信息的原始文档的类型是“文档1”，“文档1”是响应于“B3”的“分类名称”。更具体地，分类处理器25确定原始文档的类型是作为原始文档的分类目的地的“文档1”。另一方面，如果OCR识别单元23提供的操作结果既不是“A6”又不是“A7”，则操作结果无法匹配可靠性表中的信息。在这个时间点，没有确定原始文档的类型。

OCR识别单元23提供的操作结果可仅仅确定是否能将原始文档分类为“A6”或“A7”，而不一定必须确定是否能将原始文档分类为“A1”或“A2”而非“A6”或“A7”。换句话讲，OCR识别单元23比照被分类为“A6”的字符串或被分类为“A7”的字符串来检查原始文档上印刷的字符串，以确定字符串是否能被分类为“A6”或“A7”。

在示例性实施方式中，首先对原始文档执行边界识别操作减少了预定多个分类项，以在OCR识别操作中选择更少量的分类项，并且执行将原始文档归类为所选择分类项中的一个的操作。在这个示例中，在预定分类项“A1”至“A7”收窄至“A6”和“A7”的情况下，执行OCR识别操作。

以下，描述第三特定示例。在这个示例中，在边界识别操作具有优先级的情况下，边界识别操作可已经将原始文档分类为分类项“B4”。

分类处理器25参考可靠性表，并且响应于“边界分类”下方的“B4”来检查“OCR确定”。如图7中列出的，响应于“B4”的“边界确定”列出“是”和“否”。在这种情况下，执行OCR识别操作，并且只使用边界识别操作的操作结果来确定原始文档的分类目的地。更具体地，确定原始文档的分类目的地是响应于“B4”的“文档1”。

如果“OCR确定”是“否”，则OCR识别操作的操作结果的可靠性低，并且将通过边界识别操作将原始文档分类。如果“OCR确定”列出“是”和“否”，则只使用边界识别操作的操作结果来确定原始文档的分类目的地，而不顾及OCR识别操作的操作结果。

如果“边界确定”列出“是”和“否”，则执行与上述操作类似的操作。更具体地，只使用OCR识别操作的操作结果来确定原始文档的分类目的地，而不顾及边界识别操作的操作结果。

以下，描述第四特定示例。在这个示例中，已经在OCR识别操作具有优先级的情况下执行OCR识别操作，但是通过OCR识别操作没有将原始文档分类为属于“分类模式1”的“OCR分类”的任何分类项。

如果通过OCR识别操作没有将原始文档分类为分类项中的任一个，则随后执行边界识别操作。只使用边界识别操作的操作结果来确定原始文档的分类目的地。

如果通过OCR识别操作没有将原始文档分类为作为指定“分类模式1”的分类项的“A1”至“A7”和“071”至“073”和“074”中的任一个，则执行边界识别操作。如果边界识别操作的操作结果是例如“B1”，则确定响应于原始文档图像信息的原始文档的类型是作为响应于“B1”的“分类名称”的“文档1”。更具体地，分类处理器25确定原始文档的类型是作为原始文档的分类目的地的“文档1”。例如，如果边界识别操作的操作结果是“173”，则分类处理器25确定原始文档的分类目的地是作为响应于“173”的“分类名称”的“文档3”。

在第四特定示例中，OCR识别操作具有优先级。如果通过边界识别操作没有将原始文档分类为分类项中的任一个，执行与上述操作类似的操作。更具体地，边界识别操作之后继续进行OCR识别操作，并且通过只使用OCR识别操作的操作结果来确定原始文档的分类目的地。

在示例性实施方式的可靠性表中，用于OCR识别操作的分类项的数量不必等于单个“分类名称”(即，原始文档类型)下的边界识别操作的分类项的数量。换句话讲，OCR识别操作的分类项不必逐一对应于边界识别操作的分类项。例如，如果“分类名称”是图7的可靠性表中的“文档1”，则OCR识别操作的分类项的数量是7个，即，“A1”至“A7”，并且边界识别操作的分类项的数量是4个，即，“B1”至“B4”。此外，“OCR分类”下的“A3”类别对应于“边界分类”下方的“B1”和“B2”这两个类别。

如以上在示例性实施方式的可靠性表中描述的，将OCR识别操作的分类项和边界识别操作的分类项与用作分类目标的原始文档的类型关联。即使OCR识别操作的分类项没有逐一对应于边界识别操作的分类项，也唯一地确定原始文档类型。

详细描述具有优先级的OCR识别操作的处理的例程。图8是示出在OCR识别操作具有优先级的情况下执行的处理的例程的流程图。图8的处理对应于图6的步骤S103和S105中的操作。

如果OCR识别操作具有优先级，则OCR识别单元23通过OCR识别操作来识别原始文档(步骤S201)。分类处理器25确定原始文档已经通过OCR识别操作被分类到的分类项(在图7的可靠性表中的“OCR分类”下方列出的分类项)(步骤S202)。如果分类处理器25确定没有将原始文档图像信息确定为分类项中的任一个(步骤S202中的“否”分支)，则边界识别单元24通过边界识别操作来识别原始文档图像信息(步骤S203)。分类处理器25参考可靠性表并且识别与通过边界识别操作分类的分类项(在图7的可靠性表中的“边界分类”下方列出的分类项)对应的原始文档的类型。更具体地，分类处理器25只使用边界识别操作的操作结果来确定原始文档的类型(分类目的地)(步骤S204)。处理的例程因此结束。

如果在步骤S202中将原始文档分类为分类项中的一个(步骤S202中的“是”分支)，则存在将原始文档分类为多个分类项的可能性。更具体地，OCR识别操作的操作结果没有唯一地确定图7的可靠性表中的“OCR分类”下方的分类项，而是提供多个候选。如果存在多个候选，则可在确定原始文档的类型之前，按照任何类型的次序(诸如，可针对分类项确定的次序)来依次选择候选。

分类处理器25这里按照任何类型的次序在OCR识别操作中选择分类项候选中的一个(步骤S205)。分类处理器25参考可靠性表，以按照所选择的分类项来确定是否执行边界识别操作(步骤S206)。在确定将不执行边界识别操作时(步骤S06中的“否”分支)，分类处理器25参考可靠性表来识别响应于所选择的分类项的原始文档的类型。更具体地，分类处理器25响应于OCR识别操作的操作结果来确定原始文档的类型(步骤S207)。处理的例程因此结束。

如果分类处理器25在步骤S206中确定将执行边界识别操作(步骤S206中的“是”分支)，则边界识别单元24通过边界识别操作来识别原始文档图像信息(步骤S208)。分类处理器25参考可靠性表，然后响应于OCR识别操作的操作结果和边界识别操作的操作结果，确定是否确定了原始文档的类型(步骤S209)。

参照图7的可靠性表来描述步骤S209中的操作。分类处理器25参考可靠性表并且响应于步骤S205中选择的“OCR分类”的分类项来识别“边界分类”的分类项。如果本文中识别的“边界分类”的分类项匹配步骤S208中的边界识别操作的操作结果，则确定原始文档的类型。另一方面，如果本文中识别的“边界分类”的分类项无法匹配步骤S208中的边界识别操作的操作结果，则在这个时间点还没有确定原始文档的类型。

如果步骤S209中的确定结果是“是”，则响应于OCR识别操作的操作结果和边界识别操作的操作结果来确定原始文档的类型(步骤S210)。处理的例程因此结束。

另一方面，如果步骤S209中的确定结果是“否”，则分类处理器25确定步骤S201中的OCR识别操作中分类的分类项之中是否有任何分类项未选择(步骤S211)。如果有分类项未选择(步骤S211中的“是”分支)，则处理返回步骤S205。如果选择了所有分类项(步骤S211中的“否”分支)，则处理前进至步骤S204。如果处理前进至步骤S204，则响应于步骤S208中的边界识别操作的操作结果来确定原始文档的类型。

已经参照图8描述了具有优先级的OCR识别操作的情况。当边界识别操作具有优先级时，执行类似处理。更具体地，如果边界识别操作具有优先级，则边界识别操作识别原始文档图像信息。然后，响应于边界识别操作的操作结果来执行OCR识别操作，并且确定响应于原始文档图像信息的原始文档的类型。

如上所述，示例性实施方式的终端设备20使用OCR识别操作和边界识别操作将原始文档分类。在这种情况下，响应于OCR识别操作和边界识别操作中的一个的操作结果，终端设备20通过OCR识别操作和边界识别操作中的另一个来确定是否要分类原始文档。然后，终端设备20基于OCR识别操作和边界识别操作的操作结果中的一个或两个，确定原始文档的分类目的地。

按照示例性实施方式，即使没有响应于OCR识别操作和边界识别操作中的一个的操作结果确定原始文档的类型，也执行另一个识别操作。基于这两个识别操作的操作结果来识别原始文档的类型。

按照示例性实施方式，以各分类图案为基础确定OCR识别操作和边界识别操作中的哪一个具有优先级。本发明不限于这种方法。例如，用户可直接指定OCR识别操作和边界识别操作中的哪一个具有优先级。在这种情况下，操作输入接收器22接收指定OCR识别操作和边界识别操作中的哪一个具有优先级的操作输入。

按照示例性实施方式，终端设备20使用两个识别操作(即，OCR识别操作和边界识别操作)将原始文档分类。可另外使用另一种识别操作(诸如，使用QR码(注册商标)进行的识别操作)。在这种情况下，如果原始文档包含QR码，则终端设备20使用QR码将原始文档分类。如果原始文档不含QR码，则终端设备20使用多个识别操作之中的OCR识别操作和边界识别操作将原始文档分类。

在示例性实施方式中，图像读取设备10可实现终端设备20的功能。在这种情况下，图像读取设备10读取原始文档上形成的图像，并且通过参考可靠性表来确定响应于读取的原始文档图像信息的原始文档的类型。在这种情况下，图像读取设备10可以是图像处理设备的示例。

可使用通信系统来供应用于实现本发明的示例性实施方式的计算机程序。还可使用记录介质(诸如，压缩盘只读存储器(CD-ROM))的记录介质来供应计算机程序。

已经出于例证和描述的目的提供了以上对本发明的示例性实施方式的描述。它不旨在是排他性的或者将本发明限于所公开的精确形式。显而易见，对于本领域的从业技术人员而言，许多修改形式和变形形式将是清楚的。选择描述实施方式是为了最佳地说明本发明的原理及其实际应用，从而使本领域的其他技术人员能够理解适于特定用户的预料的各种实施方式和各种修改形式。本发明的范围旨在由下面的权利要求书及其等同物来限定。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：小柳胜也;冈田茂;安达真太郎;岸本纮幸;小林邦彦;吉崎茜
技术所有人：富士施乐株式会社
我是此专利的发明人

上一篇：一种人机对话平台的制造方法与工艺
上一篇：基于用电信息采集系统跨平台数据库数据迁移的方法与制造工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。