信息处理设备、信息处理系统以及信息处理方法与流程

文档序号:19074772发布日期:2019-11-08 21:18阅读:158来源:国知局
信息处理设备、信息处理系统以及信息处理方法与流程

本发明涉及信息处理设备、系统以及图像处理方法。



背景技术:

日本专利No.3469345描述了一种用于配准通过将标准图像的边缘和输入图像的边缘进行比较而计算的相似度当中的具有高的相似度的特定输入图像的技术。此外,日本专利No.3851742描述了一种用于使用诸如颜色、刻划线(ruled line)、字符等这样的特征来识别文件形式的技术。



技术实现要素:

如上所述,存在用于识别文件形式或文件的类型的多种方法。本发明的目的在于:即使当识别目标是多种类型的文件的集合时,也可通过将适用于相应文件的文件识别方法应用于所述多种类型的文件来识别该识别目标。

根据本发明的第一方面,提供了一种包括识别单元的信息处理设备。所述识别单元具有多种类型的图像识别方法,所述识别单元在由读取文件并且生成该文件的图像数据的生成单元生成第一文件的图像数据和第二文件的图像数据的情况下,从所述第一文件的所述图像数据识别所述第一文件的类型,并且使用所述多种类型的所述图像识别方法当中的与所述第一文件的所述类型对应的图像识别方法来从所述第二文件的所述图像数据识别所述第二文件的类型,所述第一文件和所述第二文件包括在多个文件中。

根据本发明的第二方面,提供了根据第一方面的信息处理设备,将所述多个文件作为文件类型的组合被预定的文件组来提交。所述信息处理设备还包括:输出单元,所述输出单元根据由所述识别单元执行的识别结果来输出指示已经提交的所述多个文件的完整度的信息。

根据本发明的第三方面,提供了根据第一方面或第二方面的信息处理设备,并且在识别所述第一文件的所述类型的情况下,所述识别单元尝试通过将所述图像识别方法改变为另一种图像识别方法来识别所述第一文件的所述类型,直到成功地识别所述第一文件的所述类型。

根据本发明的第四方面,提供了根据第三方面的信息处理设备。所述生成单元按照特定顺序一个接一个地读取多个文件的片材,并且在将由所述生成单元最先读取的文件的图像数据看作所述第一文件的所述图像数据以及从所述第一文件的所述图像数据不能识别所述第一文件的所述类型的情况下,所述识别单元尝试通过将由所述生成单元最后读取的文件的图像数据看作所述第一文件的所述图像数据来识别所述第一文件的所述类型。

根据本发明的第五方面,提供了根据第一方面至第四方面中的任一方面的信息处理设备。所述多个文件包括未指定页面数目的第一类型的文件、以及第二类型的文件,并且在顺序被指定为使得识别所述第一类型的所述文件并且然后识别所述第二类型的所述文件的情况下,所述识别单元使用与所述第一类型对应的第一图像识别方法以及与所述第二类型对应的第二图像识别方法来识别特定文件的类型,在使用所述第一图像识别方法已经成功地识别所述特定文件的所述类型的情况下,使用所述第一图像识别方法和所述第二图像识别方法来识别后续文件的类型,并且在使用所述第二图像识别方法已经成功地识别所述特定文件的所述类型的情况下,使用所述第二图像识别方法来识别所述后续文件的所述类型。

根据本发明的第六方面,提供了根据第一方面至第五方面中的任一方面的信息处理设备。所述第二文件是多种类型的第二文件中的一个,并且未指定由所述生成单元读取所述多种类型的顺序,并且所述识别单元重复地尝试使用与所述第二文件的相应的类型对应的多种图像识别方法来识别所述第二文件当中的第二文件的类型,并且在利用到目前为止已经成功地识别所使用的方法识别失败的情况下,所述识别单元尝试使用除了该方法以外的图像识别方法来识别所述第二文件当中的第二文件的类型。

根据本发明的第七方面,提供了一种包括生成单元和识别单元的系统。所述生成单元读取文件,并且生成所述文件的图像数据。所述识别单元具有多种类型的图像识别方法,所述识别单元在由所述生成单元生成第一文件的图像数据和第二文件的图像数据的情况下,从所述第一文件的所述图像数据识别所述第一文件的类型,并且使用所述多种类型的所述图像识别方法当中的与所述第一文件的所述类型对应的图像识别方法来从所述第二文件的所述图像数据识别所述第二文件的类型,所述第一文件和所述第二文件包括在多个文件中。

根据本发明的第八方面,提供了一种信息处理方法,所述信息处理方法包括以下步骤:在生成第一文件的图像数据和第二文件的图像数据的情况下,从所述第一文件的所述图像数据识别所述第一文件的类型,并且使用多种类型的图像识别方法当中的与所述第一文件的所述类型对应的图像识别方法来从所述第二文件的所述图像数据识别所述第二文件的类型,所述第一文件和所述第二文件包括在多个文件中。

根据本发明的第一方面、第七方面和第八方面,即使当识别目标是多种类型的文件的集合时,也可以通过将适用于相应文件的文件识别方法应用于所述多种类型的文件来识别该识别目标。

根据本发明的第二方面,可以向已提交文件的人通知该文件是否完整。

根据本发明的第三方面,即使当不知道适用于第一文件的类型的文件识别方法时,也可以识别该第一文件的类型。

根据本发明的第四方面,即使在最后识别最早读取的文件的类型的情况下,也可以识别第一文件的类型。

根据本发明的第五方面,即使在文件包括未指定的页面的数目的情况下,也可以针对该文件的页面的数目来识别该文件的类型。此外,还可以识别其后续文件的类型。

根据本发明的第六方面,即使在未指定读取多种类型的第二文件的顺序的情况下,也可以识别所述第二文件的类型。

附图说明

将基于下面的图详细地描述本发明的示例性实施方式,其中:

图1是例示了信息处理设备的硬件配置的图;

图2是例示了用于实现信息处理设备的功能配置的图;

图3是例示了要遭受QR代码识别的文件的图像的示例的图;

图4是例示了要遭受限制区域(limited area)OCR的文件的图像的示例的图;

图5A和图5B是例示了对于申请所需的文件组的示例的图;

图6是例示了读取多个文件的顺序的示例的图;

图7是例示了定义表的示例的图;

图8是例示了由结果数据指示的识别结果的示例的图;

图9A和图9B是例示了指示申请文件的完整度的信息的示例的图;

图10是例示了在识别处理中的操作的过程的示例的图;

图11是例示了在第二文件识别处理中的操作的过程的示例的图;

图12是例示了用于指定申请类型的图像的示例的图;

图13是例示了变型中的定义表的示例的图;

图14是例示了变型中的定义表的另一示例的图;

图15是例示了变型中的第二文件识别处理中的操作的过程的示例的图;

图16是例示了变型中的第二文件识别处理中的操作的过程的示例的图;

图17是例示了变型中的识别处理中的操作的过程的示例的图;

图18A和图18B是例示了在变型中实现的功能配置的示例的图;

图19是例示了在变型中使用的定义表的示例的图;

图20A和图20B是例示了对文件的图像执行识别的方式的示例的图;

图21是例示了多个文件的图像的示例的图;以及

图22是例示了变型中的识别处理中的操作的过程的示例的图。

具体实施方式

[1]示例性实施方式

例如,在政府办公室、公司等中执行的申请接收操作中,除非针对申请所需的文件组完整,否则该申请不被接受。因此,已经接收提交的文件的当值人员针对所提交的文件来确认针对申请所需的文件组是否完整。在本示例性实施方式中,将描述支持用于确认作为针对特定申请所需的预定文件组的所提交的多个文件的操作的信息处理设备。

图1例示了信息处理设备10的硬件配置。信息处理设备10是包括控制器11、存储器12、显示器13、操作单元14和图像读取单元15的计算机。控制器11包括中央处理单元(CPU)、随机存取存储器(RAM)和只读存储器(ROM)。控制器11通过使用CPU执行ROM或存储器12中存储的程序来控制各种单元的操作。

存储器12是非易失性存储器,并且存储各种程序和数据。显示器13包括显示各种消息和图像的显示装置。操作单元14包括用于操作信息处理设备10的操作器等。图像读取单元15是例如扫描器,并且光学地读取片材(诸如纸张)并将表示所读取的片材的图像数据提供到控制器11。图像读取单元15包括这样的单元:该单元将设置在托盘中的多张片材连续地发送到执行图像读取的位置,并且通过该单元一个接一个连续地读取所发送的片材。在本示例性实施方式中,图像读取单元15在托盘处于片材的底部的情况下从顶部片材连续地发送多张片材(从与托盘最远的片材起)。

信息处理设备10通过使用控制器11执行存储器12中存储的程序来实现图2中例示的功能。

图2例示了由信息处理设备10实现的功能配置。信息处理设备10包括生成单元101、识别单元102和输出单元103。生成单元101是读取文件并生成表示该文件的图像数据的单元。在一个接一个连续地读取多个文件的片材时,生成单元101将生成的表示所述多个文件的图像数据提供到识别单元102。这些数据可以是表示相应文件的多块图像数据,或者也可以是表示所述多个文件的图像的一块图像数据。

在由生成单元101生成图像数据的情况下,识别单元102是识别由图像数据表示的图像所指示的文件的类型的单元。识别单元102利用下面描述的多种方法中的任一种或者所述多种方法中的一些或全部的组合来识别文件的类型。具体地,使用以下五种图像识别方法:快速反应(QR)识别、受限制区域光学字符识别(OCR)、刻划线识别、关键字提取以及背景颜色消除。

QR代码识别是这样一种方法:该方法用于在QR代码被例示在文件的图像中的情况下,根据在该QR代码中编码的信息(以下被称作“代码信息”)来识别文件的类型。无论QR代码被例示在图像中的什么位置,QR代码都是可识别的,因此在例示有QR代码的情况下,不管文件的类型如何,任何类型的文件的图像都要遭受QR代码识别。

图3例示了要遭受QR代码识别的文件的图像的示例。在图3中,例示了其类型为“申请表A”的文件的图像S1。QR代码Q1形成在图像S1的右上方。该“申请表A”与例如代码信息“0001”关联。识别单元102读取QR代码Q1的代码信息。在读取的代码信息为“0001”的情况下,与该代码信息对应的类型“申请表A”被识别为由图像S1指示的文件的类型。

受限制区域QCR是这样一种方法:该方法用于根据通过以受限制的方式对文件的图像的指定区域执行所谓的OCR处理而获得的结果来识别文件的类型。在所谓的OCR处理中,识别图像内的字符的形状,并且获得对应字符串的代码。当整个文件遭受OCR处理时,除非消除除字符以外的刻划线等的图像,否则降低字符识别率。然而,对于文件的图像而言,与对整个文件执行OCR处理的情况相比,在预定表示字符串的区域并且知道该区域的位置和大小的情况下,可以通过使用受限制区域OCR来提高字符识别率。因此,在这种情况下,文件的图像要遭受受限制区域OCR。

图4例示了要遭受受限制区域OCR的文件的图像的示例。在图4中,例示了其类型为“居住证”的文件的图像S2。在图像S2的区域R1中,例示了简单地表示文件的类型的字符串T1“居住证”。毋庸置疑,字符串T1与文件“居住证”的类型关联。使用以文件的图像的左上角作为原点的xy坐标系统的坐标,通过使用位于坐标(100,2)处的点P1以及位于坐标(200,18)处的点P2来限定区域R1。区域R1的x坐标从100至200(包括200),并且区域R1的y坐标从2至18(包括18)。识别单元102根据这些坐标仅对区域R1来执行OCR处理,并且获得字符串T1的代码。识别单元102将与由该代码表示的字符串T1关联的类型“居住证”识别为由图像S2指示的图像的类型。

刻划线识别是这样一种方法:该方法用于从文件中例示的表的形状来识别文件的类型。识别单元102保留在文件中使用的表的图像,并且通过执行图案匹配处理来确定该表的图像是否包括在读取的文件的图像中。当包括表的图像时,识别单元102将读取的文件识别为与表的图像对应的文件的类型。刻划线识别被用于作为不能被嵌入QR代码的现成文件的图像的目标、以及表征文件的字符串在大小上小的文件的图像。

关键字提取是这样一种方法:该方法用于通过读取表征文件的字符串来识别文件的类型。字符串的示例是“订单”、“账单”、“评估书”等。由于这种字符串在文件的图像中的位置根据已经制作文件的制作者(公司、部门、负责人等)而改变,因此这些字符串不适合于受限制区域OCR。这些字符串比其它字符相对大。在水平书写的文档的情况下,这种字符串通常具有这样的特征:所述特征使得字符串被例示在文件的在横向方向(具有流字符的方向)上的中心以及在上下方向上的上侧。在识别这种字符串的情况下,当读取的文件的大小和布置与由字符串指示的文件类型匹配时,识别单元102将该文件识别为具有这些特征的文件的类型。使用例如在日本未审查专利申请公布No.2012-190313中公开的技术来实现关键字提取。

背景颜色消除是这样一种方法:该方法用于消除作为文件的背景而例示的诸如图案这样的图像。在例示了背景的情况下,该背景干扰字符和刻划线。因此,与背景是素色(plain)的情况相比,降低了OCR处理和刻划线识别的识别率。通过执行背景颜色消除,可以提高这些识别率。

当提交多个文件作为针对申请所需的文件组时,识别单元102执行图像识别。

图5A和图5B例示了针对申请所需的文件组的示例。图5A例示了针对申请A所需的包括“申请表A”、“居住证”和“用于开户的申请表”的文件组A。图5B例示了针对申请B所需的包括“申请表B”、“驾驶执照”、“预扣所得税证明”和“账单”的文件组B。对于文件组B中包括的文件,可以使用“护照”或“健康保险卡”来代替“驾驶执照”,并且可以使用“收入证明”来代替“预扣所得税证明”。此外,可以使用“合同”或“订单”来代替“账单”。

每个文件组包括代表该文件组的文件(以下被称作“代表文件”)。代表文件是这样的文件:该文件总是包括在特定文件组中,而不包括在其它文件组中的文件。例如,“申请表A”是文件组A的代表文件D1,而“申请表B”是文件组B的代表文件D2。例如,当已经提交的多个文件包括代表文件D1时,清楚的是,所述多个文件作为文件组A被提交。

注意到,存在使用一页文件来单独地作为多个申请的代表文件的情况。例如,可以针对用于新注册的申请以及用于更新注册的申请二者使用一页文件。在这种情况下,例如,存在指示将使用这种一页文件的申请的类型的描述。所述描述的示例是“新”和“更新”的复选框,在所述“新”和“更新”的复选框中的任一个设置有复选标记(checkmark)。因此,虽然文件的印刷形式对于多个申请是共同的,但是已经由申请人填写的文件可以是不包括在其它文件组中的文件(即,代表文件)。

在本示例性实施方式中,假定申请人提交了以指定顺序层叠的多个文件。例如,在图5A中例示的文件组A的情况下,指定顺序如下:No.1,申请表A,其作为代表文件D1;No.2,居住证;以及No.3,用于开户的申请表。在文件组B的情况下,指定顺序如下:No.1,申请表B,其作为代表文件D2;No.2,驾驶执照;No.3,预扣所得税证明;以及No.4,账单(第二文件至第四文件还可以是替代文件)。在代表文件中或在填写代表文件的地方所贴的片材上描述该顺序。申请人通过参照这样的描述以指定顺序层叠多个文件。

已经接收这些文件的当值人员将作为以该指定顺序层叠的多个文件的这些文件设置在图像读取单元15的托盘中,使得首先读取其代表文件(在从最高的片材起执行片材馈送的情况下,放置多个文件,使得第一号文件出现在其顶部)。将参照图6来描述通过以这种方式设置多个文件来读取所述多个文件的顺序。

图6例示了读取多个文件的顺序的示例。在图6中,提交了三个文件,并且例示了由图像读取单元15连续地读取第一号文件以及第二号文件和第三号文件的方式。第一号文件是代表文件D1,并且第二号文件和第三号文件是其它文件。

当开始读取如上所述设置的多个文件时,生成单元101生成表示已经设置的所述多个文件(即,作为针对申请所需的文件组提交的所述多个文件中的每一个)的图像数据。以这种方式提交的作为针对申请所需的文件组的多个文件包括第一文件和第二文件。在由生成单元101生成表示第一文件的图像数据以及表示第二文件的图像数据的情况下,首先,识别单元102从第一文件的图像识别第一文件的类型,然后从第二文件的图像识别第二文件的类型。

在本示例性实施方式中,识别单元102将由生成单元101首先读取的文件(页面1)看作第一文件,并且将已经读取的页面2至结尾的不同于第一文件的文件看作第二文件。识别单元102具有包括上述QR代码识别的多种类型的图像识别方法,并且使用所述多种图像识别方法来识别这些文件的类型。识别单元102使用定义表,在定义表中,每种文件类型与应当被用于该文件类型的图像识别方法关联。

图7例示了定义表的示例。在该定义表中,对于每个文件组(A、B、C、D、…),定义了与文件组中包括的文件的类型对应的图像识别方法。对于文件类型中的每一种,指定诸如“1”、“2”、…这样的顺序。例如,在文件组A的情况下,指定文件类型的顺序如下:No.1,作为“1”,“申请表A”;No.2,作为“2”,“居住证”;No.3,作为“3”,“用于开户的申请表”。

第一号文件类型“申请表A”与称作“QR代码识别”的图像识别方法以及用作识别用信息(recognition-use information)的“代码信息:0001”关联。识别用信息是用于识别文件的类型的信息。使用该代码信息,使得在由QR代码表示的代码信息为“0001”的情况下,具有该QR代码的文件的类型被识别为“申请表A”。作为由识别单元102使用该图像识别方法而执行的文件类型识别的结果,在识别与该图像识别方法对应的文件类型的情况下(在这种情况下,该文件类型是“申请表A”),确定使用该图像识别方法的识别已经成功。相反,在未识别与该图像识别方法对应的文件类型的情况下,确定使用该图像识别方法的识别失败。

第二号文件类型“居住证”与称作“受限制区域OCR”的图像识别方法以及用作识别用信息的“坐标:(100,2),(200,18)”和“字符串:居住证”关联。使用该识别用信息,使得在通过使用OCR处理从由特定文件的图像中的坐标限定的区域而读取的字符串为“居住证”的情况下,该文件的类型被识别为“居住证”。对于文件组A,对第一号文件类型至作为“用于开户的申请表”的第三号文件类型进行了定义。对于文件组B,对第一号文件类型至第四号文件类型进行了定义。此外,每个文件组中的第一号文件类型是代表文件。

识别单元102尝试是否能通过使用多种图像识别方法以特定顺序来从第一文件的图像识别第一文件的类型。识别单元102使用与定义表中的上述文件组的第一号文件类型关联的多种图像识别方法作为所述多种图像识别方法。也就是说,由识别单元102使用的所述多种图像识别方法中的每一种是与第一号文件类型中的一个对应的方法。在图7的示例中,识别单元102尝试使用与这些文件类型关联的图像识别方法来按照“申请表A”、“申请表B”、“申请表C”和“申请表D”的顺序识别第一文件的类型。

在本示例性实施方式中,通过使用图7中例示的定义表,在使用其它图像识别方法之前,使用与“申请表A”和“申请表B”关联的QR代码识别。以这种方式,在使用其它识别方法之前,识别单元102尝试通过使用用于识别通过将信息转换成诸如QR代码这样的代码而获得的图像(以下被称作“代码图像”)的方法来识别第一文件的类型。

当识别单元102尝试使用这些图像识别方法来识别第一文件的类型时,一些情况的识别可能成功,而一些情况的识别可能不成功。例如,在使用QR代码识别而读取的代码信息是“0002”的情况下,“申请表A”失败;然而,下一“申请表B”的识别成功。此外,在“申请表A”的识别和“申请表B”的识别二者已经在QR代码识别中失败的情况下,识别单元102尝试使用与“申请表C”对应的受限制区域OCR来执行识别。在文件类型的识别仍然失败的情况下,识别单元102尝试使用与“申请表D”对应的背景颜色消除和受限制区域OCR来执行识别。以这种方式,当识别单元102尝试识别第一文件当中的第一文件的类型时,识别单元102将一种图像识别方法改变为另一种图像识别方法并且尝试识别,直到成功地识别第一文件的类型为止。

识别单元102将与已经从第一文件的图像成功地识别第一文件的类型所使用的方法对应的类型识别为第一文件的类型,该方法包括在上述多种图像识别方法中。例如,在已经利用与“申请表B”对应的图像识别方法(使用代码信息“0002”的QR代码识别)成功地识别第一文件的类型的情况下,识别单元102将与该图像识别方法对应的“申请表B”识别为第一文件的类型。

当识别单元102识别第一文件的类型时,识别单元102使用如用于包括所识别的第一文件的类型的文件组的图像识别方法限定的图像识别方法来识别后续文件的类型。也就是说,识别单元102使用多种类型的图像识别方法当中的与所识别的第一文件的类型对应的图像识别方法来从第二文件的图像识别第二文件的类型。例如,在“申请表B”被识别为第一文件的类型的情况下,识别单元102使用与文件组B关联的限定来识别后续文件的类型。具体地,识别单元102尝试使用与第二号文件类型“驾驶执照”对应的图像识别方法来识别第二文件的类型。然后,识别单元102可以尝试使用与第三号文件类型“X县居住证”对应的图像识别方法来识别第二文件的类型。

当使用与“驾驶执照”对应的图像识别方法识别第二文件的类型失败时,识别单元102尝试使用与另一第二号文件类型“健康保险卡”对应的图像识别方法来识别。在这种识别也失败的情况下,识别单元102尝试使用与第三号文件类型“X县居住证”对应的图像识别方法来识别。由于存在与“X县居住证”对应的两种图像识别方法,因此首先识别单元102尝试使用例如第一种方法“受限制区域OCR”来识别。在该识别失败的情况下,识别单元102尝试使用第二种方法“刻划线识别/关键字提取”来识别。在这种情况下,当使用这两种方法中的任一种成功地识别文件的类型时,“X县居住证”被识别为该文件的类型。

当提交的文件不完整时,例如,“驾驶执照”和“健康保险卡”都不能被识别为第二号文件的类型。即使当第二文件的类型的识别像这种情况一样失败时,识别单元102也继续尝试识别另一第二文件。这是因为识别失败是重要的信息,并且其它第二文件的识别是否成功也是重要的信息。在以这种方式尝试识别最后一个第二文件的类型之后,识别单元102将指示这些识别结果的结果数据提供到输出单元103

图8例示了由结果数据指示的识别结果的示例。对于文件组B中包括的文件的类型中的每一种而言,结果数据指示识别是已经“成功”、已经“失败”还是“尚未执行”。在该示例中,由于“驾驶执照”已经被成功地识别为第二号文件的类型,因此不执行“健康保险卡”的识别,也就是说,针对“健康保险卡”,例示为“尚未执行”。

输出单元103是这样的单元:该单元根据由识别单元102获得的识别结果来输出指示申请文件(针对申请提交的多个文件)的完整度的信息。当从识别单元102提供结果数据时,输出单元103根据结果数据来输出指示申请文件的完整度的信息。

图9A和图9B例示了指示申请文件的完整度的信息的示例。在图9A中,指示字符串“图像识别完成”的信息、指示申请的类型是“申请B”的信息、以及指示没有缺少文件的信息作为指示申请文件的完整度的信息显示在显示器13上。对于由结果数据指示并且与针对组中的文件的顺序的排名(rank)关联的文件的类型(图8的示例中的第一号至第四号文件类型)而言,当针对排名中的每一个已经成功地识别至少一个或更多个文件类型时,输出单元103输出指示不存在缺少的文件的类型的信息。

图9B与图9A的示例不同。在图9B中,指示存在缺少的文件的类型的信息作为指示申请文件的完整度的信息显示在显示器13上。在图9B中,例示了文件类型“驾驶执照或健康保险卡”作为缺少的文件的类型。对于由结果数据指示并且与针对组中的文件的顺序的排名关联的文件而言,当在根本没有成功地识别文件的一个或多个类型的顺序方面存在排名时,输出单元103输出指示与该顺序中的排名对应的文件的一个或多个类型的信息。在图9B的示例中,由于针对第二号文件类型“驾驶执照”和“健康保险卡”二者的文件类型的识别已经失败,因此显示这两种文件类型。

信息处理设备10使用上述配置来执行用于从文件的图像识别该文件的类型的识别处理。将参照图10和图11来描述在识别处理中由信息处理设备10执行的操作的过程。

图10例示了识别处理中的操作的过程的示例。当值人员执行用于使信息处理设备10读取由申请人提交的多个文件的操作,触发开始识别处理。首先,当读取多个图像时,信息处理设备10生成表示这些多个图像的图像数据(步骤S11)。

接下来,信息处理设备10使用与特定代表文件对应的方法来尝试从多个文件中包括的第一文件的图像识别该第一文件的类型(步骤S12)。信息处理设备10确定第一文件的类型的该识别是否已经成功(步骤S13)。在确定第一文件的类型的识别已经成功的情况下(步骤S13中的是),执行第二文件识别处理(步骤S20)。第二文件识别处理是用于尝试从第二文件的图像来识别第二文件的类型的处理。接下来,信息处理设备10确定是否存在尚未执行步骤S20的识别处理的第二文件的图像(步骤S15)。在确定存在这种图像的情况下(步骤S15中的是),再次执行步骤S20的操作。

在步骤S13中确定第一文件的类型的识别失败的情况下(步骤S13中的否),信息处理设备10确定在步骤12中执行的识别中是否存在在多个文件当中的尚未使用其图像识别方法的文件组,这些图像识别方法与该组中的文件关联(步骤S14)。在步骤S14确定存在这样的文件组的情况下(步骤S14中的是),信息处理设备10使用与该组中的文件关联的图像识别方法来执行步骤S12的操作。在步骤S15中确定不存在这样的图像的情况下(步骤S15中的否),信息处理设备10输出指示申请文件的完整度的信息(步骤S16),并完成识别处理。

另外,在步骤S14中确定不存在这样的文件组的情况下(步骤S14中的否),信息处理设备10执行步骤S16的操作并且完成识别处理。在这种情况下指示申请文件的完整度的信息是例如指示申请文件(即,针对申请所提交的多个文件)不包括任何代表文件的信息。由生成单元101执行步骤S11的操作,并且由输出单元103执行步骤16的操作。由识别单元102执行其它操作中的任何操作。

图11例示了第二文件识别处理中的操作的过程的示例。首先,信息处理设备10尝试使用与已经在步骤S12中成功地识别其类型的第一文件对应的方法来识别第二文件的类型(步骤S21)。接下来,信息处理设备10确定是否已经在步骤S21中成功地识别第二文件的类型(步骤S22)。在确定已经成功地识别第二文件的类型的情况下(步骤S22中的是),信息处理设备10完成第二文件识别处理。在步骤S22中确定第二文件类型的识别失败的情况下(步骤S22中的否),信息处理设备10确定尚未在步骤S21中执行的识别中使用其图像识别方法的文件的类型是否包括在其它文件的类型中(步骤S23),所述其它文件包括在文件组中,该文件组包括其类型已经被成功地识别的第一文件。在步骤S23中确定包括尚未在步骤S21中执行的识别中使用其图像识别方法的文件的这种类型的情况下(步骤S23中的是),信息处理设备10使用与该文件的类型对应的图像识别方法来执行步骤S21的操作。在步骤S23中确定不包括尚未在步骤S21中执行的识别中使用其图像识别方法的文件的这种类型的情况下(步骤S23中的否),信息处理设备10完成第二文件识别处理。

由于针对申请所需的文件组中包括的文件的格式改变并且所写入的内容改变,因此难以使用例如仅一种图像识别方法来识别文件的所有类型。期望地,对于文件的类型,使用与文件的相应类型对应的图像识别方法。在本示例性实施方式中,从针对申请所提交的第一文件和第二文件的图像来识别第一文件的类型,并且使用与识别的第一文件的类型对应的图像识别方法来识别第二文件中的至少一个的类型。例如,将包括在特定文件组中但不包括在其它文件组中的文件(诸如上述代表文件)看作第一文件。因此,当识别第一文件的类型时,确定针对申请所需的其它文件(即,第二文件)的类型,并且还确定针对第二文件的图像有效的图像识别方法。由于根据第一文件的类型来使用这些方法,因此即使当识别目标是多种类型的文件的集合时,也能通过应用适用于该文件的文件识别方法来对每个文件执行识别。结果,与使用指定图像识别方法的情况相比,可以提高从表示已经针对申请提交的多个文件的图像识别多个文件的类型的精度。

此外,在本示例性实施方式中,将与通过使用多种图像识别方法当中的、已经成功地识别第一文件的类型的方法对应的类型识别为第一文件的类型。结果,即使当适用于第一文件的类型的文件识别方法未知时,也能识别第一文件的类型。例如,已经在特定申请接收操作中知道将要提交的申请的哪些类型。将与针对所有类型的申请的代表文件对应的图像识别方法准备为多种图像识别方法。结果,即使当申请的类型未知时,也能识别其第一文件的类型。此外,在本示例性实施方式中,由于输出了指示申请文件的完整度的信息(即,针对申请提交的多个文件的完整度),因此可以向已经提交这些文件的申请人通知申请文件是否完整。

[2]变型

上述示例性实施方式是本发明的仅示例性的实施方式,并且可以被如下地修改。此外,可以根据需要将上述示例性实施方式中的一些或全部与在下面描述的各种变型进行组合并执行。

[2-1]代表文件的指定

在示例性实施方式中,通过使用图像识别来识别第一文件的类型,然而,识别方法不限于图像识别。例如,还可以通过执行指定的人来识别第一文件的类型,这种人的示例是接收申请文件的当值人员。在这种情况下,例如,识别单元102将用于指定申请类型的图像显示在显示器13上。

图12例示了用于指定申请类型的图像的示例。在图12中,“请指定申请类型”的字符串、显示正被指定的申请类型的显示字段G1以及在用户指定并输入特定类型时由用户操作的操作器G2显示在显示器13上。如在图12中,当在显示字段G1中显示“申请A”时,通过操作操作器G2来将“申请A”指定为申请类型。在这种情况下,识别单元102将与申请A的代表文件对应的“申请A”识别为第一文件的类型。

例如,根据刻划线和字符串的状态,可能通过使用诸如刻划线识别和关键字提取这样的图像识别方法不能正确地识别文件的类型。因此,即使当“申请表D”包括在作为图7中例示的例如文件组D而提交的多个文件中时,在以移位的方式打印“申请表D”的字符串的情况下,通过使用受限制区域OCR也不能正确地读取信息。因此,文件组D的第一文件的类型未被识别。根据本变型,即使在那种情况下,也可以由指定第一文件的类型的当值人员来识别第一文件的类型,并且输出指示第二文件的类型的识别以及申请文件的完整度的信息。

[2-2]具有多页的文件的类型的识别

在示例性实施方式中,将每种类型的文件作为一页文件提交;然而,存在提交具有多页的文件的情况。这种情况的示例是附加到申请表的证书是三页长的情况。在指定了页面数目的情况下,图像识别方法仅必须与定义表中的各个页关联。

图13例示了本变型中的定义表的示例。通过将“页”的列添加到图7中例示的定义表中来得到该定义表。在本示例中,对于作为文件组E的第二号文件类型的“证书”而言,三种图像识别方法与相应的页“1”至“3”关联。既然这样,在已经成功地识别所有的三页的情况下,识别单元102将“证书”识别为第二文件的类型。

此外,多个文件可以包括没有指定页面数目的文件的类型。例如,在将合同的副本附加到申请表的情况下,副本的页面数目根据附加的合同的内容而改变。此外,根据制作上述证书的制作者,上述证书的页面数目可以改变。在这种情况下,识别单元102如下地执行识别。假定多个文件包括第一类型的文件和第二类型的文件,并且指定识别的顺序,其中,识别第一类型的文件,然后识别第二类型的文件。

在那种情况下,识别单元102使用与第一类型对应的第一图像识别方法以及与第二类型对应的第二图像识别方法来识别文件的类型。然后,当使用第一图像识别方法成功地识别文件的类型时,识别单元102使用第一图像识别方法和第二图像识别方法来识别后续文件的类型。当使用第二图像识别方法成功地识别文件类型时,识别单元102再次使用第二图像识别方法来识别后续文件的类型。即使在未指定第一类型的文件的页面数目的情况下,也可通过以这种方式执行识别针对页面数目来识别第一类型的文件。在图14中例示了在执行这种识别的情况下使用的定义表的示例。

图14是本变型中的定义表的另一示例。在该定义表中,例示了文件组E中包括的文件类型“申请表E”、“证书”、“合同”和“预扣所得税证明”以及与这些类型对应的图像识别方法“α”、“β”、“γ”和“Δ”。指定按照“申请表E”、“证书”、“合同”以及然后“预扣所得税证明”顺序来识别文件。假定未指定这些类型当中的针对“证书”的页面数目以及针对“合同”的页面数目。首先,识别单元102通过使用方法α来对与代表文件对应的“申请表E”执行识别。此后将参照图15来描述操作的过程。

图15例示了在本变型的识别处理中由信息处理设备执行的操作的过程的示例。首先,信息处理设备10尝试使用β和γ这两种方法来识别文件的类型(步骤S31)。接下来,信息处理设备10确定是否已经使用方法γ识别文件的类型(步骤S32)。在确定使用方法γ没有识别文件类型的情况下(步骤S32中的否),处理返回到步骤S31,并且信息处理设备10尝试使用β和γ这两种方法来识别后续文件的类型。在这种情况下,使用方法β来作为第一图像识别方法,并且使用方法γ来作为第二图像识别方法。在步骤S32中确定已经使用方法γ成功地识别文件的类型的情况下(步骤S32中的是),然后,信息处理设备10尝试使用γ和Δ这两种方法来识别后续文件的类型(步骤S33)。

随后,信息处理设备10确定是否已经使用方法Δ识别后续文件的类型(步骤S34)。在确定使用方法Δ没有识别后续文件的类型的情况下(步骤S34中的否),处理返回到步骤S33,并且信息处理设备10尝试使用γ和Δ这两种方法还对进一步后续的文件来识别文件的类型。在这种情况下,使用方法γ作为第一图像识别方法,并且使用方法Δ作为第二图像识别方法。在步骤S34中确定已经使用方法Δ成功地识别后续文件的类型的情况下(步骤S34中的是),由于使用方法Δ识别的预扣所得税证明是一页文件,因此信息处理设备10完成识别处理。由识别单元102执行步骤S31至S34中的操作。

如上所述,识别了文件的类型。因此,即使在多个文件中包括未指定页面数目的类型的文件的情况下,也能针对这种类型的文件的页面数目来识别该文件的类型。此外,识别了后续文件的类型。注意到,以上描述的第一类型和第二类型的文件都是第二文件,即,通过读取除第一文件以外的第二页至最后一页获得的文件。然而,在未指定第一文件(即,代表文件)的页面数目的情况下,代表文件可以是第一类型的文件,并且接着被识别的文件可以是第二类型的文件。

[2-3]未确定的读取顺序

在示例性实施方式中指定了生成单元101执行读取的文件类型的顺序;然而,读取顺序不限于此。例如,将描述下面的情况:指定首先读取图14中例示的第一文件的类型“申请表E”,但是针对第二文件的类型的“证书”、“合同”和“预扣所得税证明”,未指定读取顺序。

图16例示了本变型中的第二文件识别处理中的操作的过程的示例。首先,信息处理设备10尝试使用三种方法β、γ和Δ来识别第二文件的类型(步骤S41)。在这种情况下,无论以什么顺序布置第二文件类型,使用这些方法中的任一种都能成功地识别。接下来,信息处理设备10确定是否已经改变已成功地识别第二文件的类型所使用的图像识别方法(步骤S42)。在确定没有改变已成功地识别第二文件的类型所使用的图像识别方法的情况下(步骤S42中的否),处理返回到步骤S41,并且执行操作。结果,即使针对未指定页面数目的第二文件的特定类型(诸如证书和合同),也重复地执行步骤S41中的操作,直到第二文件的类型不能被识别为止。

在步骤S42中确定已经改变已成功地识别第二文件的类型所使用的图像识别方法的情况下(步骤S42中的是),信息处理设备10尝试使用除已成功地识别以前的第二文件的类型所使用的方法以外的两种方法来识别后续第二文件的类型(步骤S43)。例如,当首先使用方法γ成功地识别文件类型时,使用方法β和Δ。接下来,信息处理设备10确定是否已经改变已成功地识别文件类型所使用的图像识别方法(步骤S44)。在确定没有改变已成功地识别文件类型所使用的图像识别方法的情况下(步骤S44中的否),处理返回到步骤S43,并且执行操作。在步骤S44中确定已经改变已成功地识别文件类型所使用的图像识别方法的情况下(步骤S44中的是),信息处理设备10尝试使用除已成功地识别以前的第二文件的类型所使用的方法以外的一种方法来识别进一步后续的第二文件的类型(步骤S45)。然后,信息处理设备10确定是否存在其类型尚未被识别的第二文件的图像(步骤S46)。在确定存在这种图像的情况下(步骤S46中的是),执行步骤S45中的操作。在确定不存在这种图像的情况下(步骤S46中的否),信息处理设备10完成第二文件识别处理。

在本变型中,识别单元102重复地尝试使用与相应的多个第二文件对应的多种图像识别方法来识别这些第二文件的类型。当利用到目前为止已经成功地识别文件类型所使用的方法识别失败时,识别单元102尝试使用除该方法以外的图像识别方法来识别第二文件的类型。结果,即使在未指定读取多种类型的第二文件的顺序的情况下,第二文件的类型也被识别。

[2-4]两个阶段图像识别

识别单元102可以在两个阶段中执行图像识别。识别单元102将用于确认例如图像识别方法是否适用的图像识别作为第一阶段类来执行。结果,在确认图像识别方法适用的情况下,识别单元102将已经确认为适用并且识别文件的类型的图像识别作为第二阶段来执行。作为第一阶段的图像识别,使用具有比第二阶段的图像识别小的处理负载的图像识别。作为具体示例,例如,在QR代码识别的情况下,将用于确认在文件的图像上是否存在QR代码的图像识别作为第一阶段来执行。当确认存在QR代码时,确定可适用的图像识别方法。然后,作为第二阶段,读取由QR代码表示的代码信息,并且执行用于识别文件的类型的图像识别。

此外,在受限制区域OCR的情况下,将用于确认受限制区域是否为空白的图像识别作为第一阶段来执行。当确认受限制区域不是空白时,确定可适用的图像识别方法。然后,在该受限制区域上执行作为第二阶段的OCR处理。识别单元102执行图16中例示的步骤S41和S43中的第一阶段图像识别,并且尝试使用通过执行第一阶段图像识别而确定为可适用的方法来识别第二文件的类型。结果,与总是尝试第二文件的类型的识别的情况相比,识别单元102的处理负载减小。

[2-5]顶部和底部颠倒的读取

在示例性实施方式中,图像读取单元15从托盘中设置的多个文件的顶部片材连续地发送多个文件的片材;然而,也可以从托盘中设置的多个文件的底部片材连续地发送片材。在那种情况下,当申请人如在示例性实施方式中那样将代表文件层叠在文件的顶部上时,代表文件被最后读取。此外,还可以存在这样的情况:申请人将代表文件层叠在错误位置处,并且代表文件被最后读取。识别单元102还可以执行针对这种情况的识别。

具体地,在将表示由生成单元101最先读取的文件的图像看作第一文件的图像的情况下,当从第一文件的图像不能识别第一文件的类型时,识别单元102尝试通过将由生成单元101最后读取的文件的图像看作第一文件的图像来识别第一文件的类型。结果,即使当如上所述地最后读取代表文件时,识别单元102也能从最后读取的文件的图像识别第一文件的类型,并且此后例如如在本示例性实施方式中那样识别第二文件的类型。根据本变型,即使在多个文件以错误的顺序层叠或者以错误的方式设置在托盘中并且最后读取代表文件的情况下,即,即使在最后识别最先读取的文件类型的情况下,也能识别第一文件的类型。

[2-6]代表文件的位置

代表文件的位置在本示例性实施方式中位于多个文件的顶部,并且在上述变型中位于多个文件的顶部或底部。然而,代表文件的位置还可以是其它位置,即,可以处在夹于其它文件之间的位置处。即使在那种情况下,例如,作为代表文件的位置的指定的结果,识别单元102使用以与指定的位置对应的顺序读取的文件的图像作为第一文件的图像来执行识别。此外,识别单元102还可以以特定顺序对相应文件的图像来执行用于识别第一文件的图像的类型的图像识别方法,并且可以将已经成功地识别的文件识别为第一文件。在那种情况下,识别单元102对包括识别失败的文件的文件来执行第二文件识别处理。

[2-7]多个文件组的读取

在示例性实施方式中,识别了针对一个申请的多个文件的类型;然而,也可以连续地识别针对两个或更多个申请的多个文件的类型。

图17例示了本变型中的识别处理中的操作的过程的示例。在下面,将使用生成作为图7中例示的文件组A和B提交的多个文件的图像的情况作为示例来进行描述。首先,信息处理设备10执行与在图10中例示的示例中相同的操作,直到步骤S20(第二文件识别处理)。结果,使用与文件组A的“申请表A”和“居住证”对应的图像识别方法来执行文件类型的识别。

接下来,信息处理设备10确定是否存在尚未被用于识别第二文件的类型的图像识别方法(步骤S51)。在本示例中,由于第一文件的类型被识别为“申请表A”,因此以该顺序使用与“居住证”和“用于开户的申请表”对应的图像识别方法。在已经在步骤S20中使用与“居住证”对应的图像识别方法来执行文件类型的识别之后,由于还没有使用与“用于开户的申请表”对应的图像识别方法,因此信息处理设备10尝试通过使用这种方法执行步骤S20中的操作来识别第二文件的类型。

结果,不存在尚未使用的图像识别方法。接下来,信息处理设备10确定是否剩下表示多个文件的图像(步骤S52)。在本示例中,已经识别了作为文件组A提交的多个文件;然而,尚未识别作为文件组B提交的多个文件。也就是说,由于剩下表示多个文件的图像,因此信息处理设备10确定剩下表示多个文件的图像剩余(步骤S52中的是)。处理返回到步骤S12(第一文件的类型的识别),并且执行该操作。此后,当完成作为文件组B提交的多个文件的识别时,信息处理设备10在步骤S52中确定没有剩下表示多个文件的图像(步骤S52中的否),执行步骤S16中的操作(输出指示申请文件的完整度的信息),并且完成识别处理。根据本变型,即使当提交了针对两个或更多个申请的文件时,也能通过以集体的方式读取这些文件来识别每个文件的类型。

[2-8]图像识别方法

图像识别方法不限于以上描述的图像识别方法。例如,还可以使用条形码或其它二维代码图像来代替QR代码。此外,可以针对一种类型的文件来使用QR代码识别和受限制区域OCR二者,或者也可以针对一种类型的文件来使用三种或更多种图像识别方法的组合。此外,还可以使用在OCR处理中使用的字典的字体的类型作为识别用信息。在根据文件类型来预定字体类型的情况下,与没有使用字体类型的情况相比,通过使用字体类型提高了识别率。

[2-9]用于实现单元的设备

可以通过与在示例性实施方式中描述的设备不同的设备来实现图2中例示的单元。

图18A和图18B例示了在本变型中实现的功能配置的示例。图18A例示了包括读取设备20和信息处理设备10a的信息处理系统1。读取设备20包括图2中例示的生成单元101。信息处理设备10a包括识别单元102和输出单元103。在本示例中,甚至可使用不包括图1中例示的图像读取单元15的设备作为信息处理设备。

图18B例示了包括读取设备20、信息处理设备10b和图像输出设备30的信息处理系统1a。信息处理设备10b包括识别单元102,并且图像输出设备30包括输出单元103。这些设备通过通信线(未例示)连接。在这种情况下,例如,使用在与提交文件的地方不同的地方(例如,数据中心)处安装的服务器设备作为信息处理设备10b。在本示例中,由在用于文件提交的窗口处安装的读取设备20读取多个文件,信息处理设备10b从表示读取的文件的图像识别这些文件的类型,并且将指示结果的结果数据发送到图像输出设备30。

图像输出设备30也安装在窗口处,并且根据结果数据来输出指示申请文件的完整度的信息。如上所述,还可以通过各种设备来实现通过在示例性实施方式中描述的信息处理设备10实现的单元。在任何情况下,与使用指定图像识别方法的情况相比,可以通过使用包括识别单元102的信息处理设备来提高从表示已经针对申请提交的多个文件的图像识别所述多个文件的类型的精度。

[2-10]多个文件

多个文件不限于作为对于特定申请所需的预定的文件组而提交的文件。例如,这样的多个文件还可以是针对除申请接收操作以外的操作而生成的多个文件。如果存在用于记录通过读取这些文件生成的图像数据的操作,则通过执行上述识别处理来向用户通知这些文件的完整度,由此帮助操作。简单地说,当将多个文件作为文件类型的组合被预定的文件组来提交时,可以使用任意多个文件。在任何情况下,识别单元102识别提交的多个文件中的每一个的类型,并且输出单元103根据由识别单元102执行的识别的结果来输出指示提交的多个文件的完整度的信息。结果,已经提交这些文件的人被通知文件是否完整。

[2-11]第一文件

在示例性实施方式中,第一文件是一页文件;然而,第一文件可以是具有两页或更多页的文件。在那种情况下,同样对于用作第一文件的代表文件,使用其中代表文件的页与相应的图像识别方法关联的定义表。

图19例示了本变型中使用的定义表的示例。在该定义表中,例示了与文件组F的代表文件对应的“申请表F”以及与代表文件的相应页对应的图像识别方法“ε”、“ζ”和“η”。此外,还例示了作为第二号文件类型的“驾驶执照”以及与“驾驶执照”对应的图像识别方法“κ”。

在识别单元102使用与代表文件关联的图像识别方法来识别第一文件的类型的情况下,对于“申请表F”,识别单元102尝试使用与第一文件的第一号文件关联的“ε”来识别第一号文件的类型。当文件的类型的该识别成功时,识别单元102随后尝试使用与第二号文件关联的“ζ”来识别第一文件的第二号文件的图像的类型。当图像的类型的该识别也成功时,识别单元102尝试使用与第三号文件关联的“η”来识别第一文件的第三号文件的图像的类型。当这些识别处理成功时,识别单元102将第一文件的类型识别为“申请表F”,并且尝试使用与剩余的第二文件关联的图像识别方法“κ”来识别剩余的第二文件的图像的类型。以这种方式,即使当代表文件是具有两页或更多页的文件时,也能执行将具有两页或更多页的文件看作第一文件的识别。

[2-2]图像识别方向

当识别单元102执行图像识别时,识别单元102将一图像划分成多个部分,连续地读取该图像的、例如从该图像的一侧朝向相反侧的部分,并且对读取的部分执行图像识别处理。

图20A和图20B例示了对文件的图像执行图像识别的方式的示例。图20A例示了从顶边缘H31侧朝向底边缘H32侧读取文件的图像S3的部分并且执行图像识别处理的方式。图20B例示了从底边缘H32侧朝向顶边缘H31侧读取文件的图像S3的部分并且执行图像识别处理的方式。

例如,在执行受限制区域OCR的情况下,当受限制区域位于顶边缘H31侧时,从顶边缘H31侧读取图像S3的部分。在读取与受限制区域对应的图像的部分之后,可以停止读取。相反,当从底边缘H32侧读取部分时,在读取与受限制区域对应的图像的部分之前,读取了该图像的几乎所有部分。因此,与识别单元102从相反侧执行图像识别处理的情况相比,当识别单元102从存在受限制区域的一侧执行图像识别处理时,减小了图像识别处理的负载。这对于其它图像识别处理也是真实的。因此,在将要执行图像识别处理的区域布置在特定侧的情况下,与识别单元102从相反侧执行图像识别处理的情况相比,通过识别单元102从该区域被执行的一侧起执行图像识别处理,减小了图像识别处理的负载。

此外,识别单元102可以对多个文件的图像如下地执行图像识别。

图21例示了多个文件的图像的示例。图21例示了六个图像S3-1至S3-6。对于这些图像中的任一个,在其文件的顶侧限定受限制区域R3。在图21中,使受限制区域R3对角线阴影,并且例示受限制区域R3。在申请人将文件层叠以与文件的方向匹配的情况下,假定这些受限制区域R3布置在同一侧。然而,在本示例中,文件被层叠使得图像S3-1至S3-3的顶部-底部方向与图像S3-4至S3-6的顶部-底部方向相反。因此,受限制区域R3布置在图像S3-1至S3-3的顶边缘H31侧;然而,受限制区域R3布置在图像S3-4至S3-6的底边缘H32侧。

识别单元102从文件的图像的一侧(例如,顶边缘H31侧)朝向相反侧(例如,底边缘H32侧)来执行图像识别处理,在完成针对目标区域的处理之后停止图像识别处理,并且对后续文件的图像来执行图像识别处理。在这种情况下,识别单元102针对每个文件的图像测量图像识别的处理量。在测量的处理量大于或等于阈值的情况下,从针对后续文件的图像的相反侧(在本示例中为顶边缘H32侧)开始图像识别处理。在该阈值处,例如,设置在对文件的图像的区域的一半或三分之一执行图像识别处理时获得的处理量。结果,与固定执行图像识别处理的方向的情况相比,由识别单元102执行的图像识别的处理量减小。

[2-13]除文件类型以外的信息的识别

识别单元102在示例性实施方式中识别了文件的类型;然而,识别单元102还可以识别除文件的类型以外的信息。例如,识别单元102识别在文件的指定区域中是否存在描述,或者识别描述的字符串。例如,当在定义表中限定应该在特定区域中描述的字符串时,识别单元102使用识别的字符串和定义表来识别是否在指定区域中描述应该被描述的字符串。在这些情况下,输出单元103输出指示在特定区域中存在还是不存在描述的信息,作为指示申请文件的完整度的信息。结果,即使针对申请所需的文件类型完整,在因为文件包括不适当的描述而不能接受申请的情况下,申请人被通知申请的拒收。

[2-14]识别失败时执行的处理

在示例性实施方式中,即使第二文件的类型的识别失败,识别单元102也随后尝试识别另一第二文件的类型。然而,在这种情况下执行的处理不限于此。在第二文件的类型的识别失败时,也可以终止第二文件识别。注意到,如在图7中例示的文件组B的第二号文件(“驾驶执照”或“健康保险卡”)的情况那样,对于仅需要提交多种类型的文件中的任一个的情况(存在替代文件的情况),当与这些多个相应的文件类型对应的所有图像识别方法失败时,终止第二文件识别。

图22例示了本变型的识别处理中的操作的过程的示例。在本示例中,首先,执行图10中例示的步骤S11(生成图像数据)至步骤S13(确定识别是否成功)。在信息处理设备10确定第一文件的类型的识别已经成功的情况下,然后,信息处理设备10按照文件的顺序对每个文件执行第二文件的识别处理,作为第二文件识别处理(步骤S60)。例如,在信息处理设备10尝试使用与图7中例示的“申请表B”对应的方法来识别第二文件的类型的情况下,信息处理设备10执行针对与第二号文件对应的“驾驶执照”的识别。当针对“驾驶执照”的识别失败时,信息处理设备10也执行针对“健康保险卡”的识别。也就是说,在存在针对处于文件的顺序中的特定排名的文件的替代文件的情况下,信息处理设备10尝试识别包括替代文件的所有文件的类型,直到处于特定排名的文件的类型的识别变得成功为止。

接下来,信息处理设备10确定第二文件识别处理是否失败(步骤S61)。在确定第二文件识别处理失败的情况下(步骤S61中的是),处理进入步骤S16。然后,信息处理设备10输出指示申请文件不完整的信息(另选地,指示缺少驾驶执照或健康保险卡的信息)。此外,在确定第二文件识别处理已经成功的情况下(步骤S61中的否),信息处理设备10执行步骤S15(确定是否存在尚未执行第二识别处理的第二文件的图像)。例如,即使当第二号文件的识别成功时,在第三号文件和后续文件不遭受第二文件识别处理的情况下,剩下第三号文件和后续文件。因此,处理返回到步骤S60,并且对第三号文件执行第二文件识别处理。以这种方式,在本变型中,按照文件的顺序对每个文件执行对第二号文件和后续文件的第二文件识别处理。

[2-15]本发明的示例性实施方式的类别

除了上述信息处理设备以外,本发明的示例性实施方式可以被认为是实现由这种信息处理设备或者包括这些设备的系统实现的功能的多个设备。此外,本发明的示例性实施方式还可以被认为是用于实现由所述信息处理设备执行的处理的信息处理方法或者用于使作为例如信息处理设备的计算机用作上述单元的程序。可以以诸如存储程序的光盘这样的记录介质的形式或者以经由诸如因特网这样的网络将程序下载到或安装在计算机中并且使程序变得可用的形式来提供该程序。

提供对本发明的示例性实施方式的前述描述是出于例示和描述的目的。这些描述不旨在对所公开的明确形式进行穷尽或限制。显然,对于本领域技术人员而言,许多修改和变化将是显而易见的。选择并描述实施方式,以便最好地说明本发明的原理及其实际应用,从而使得本领域的其它普通技术人员能够对于各种实施方式理解本发明以及适合于预期的特定应用的各种修改。本发明的范围旨在由所附的权利要求及其等同物来限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1