信息处理装置、记录媒体及信息处理方法与流程

文档序号:21697660发布日期:2020-07-31 22:47阅读:164来源:国知局
信息处理装置、记录媒体及信息处理方法与流程

本发明涉及一种信息处理装置、记录媒体及信息处理方法。



背景技术:

有一种数据输入系统,其将被手写记入或打印在纸质表单上的字符串进行数字数据化。数据输入系统采用人读取表单中的内容进行键输入的方式、由使用了光学字符识别(ocr)技术的字符识别器对表单中的图像进行字符识别处理的方式或它们的组合,将表单中的字符串进行数字化。

在专利文献1中公开的信息处理装置的分类单元将字符识别对象分类为3个种类中的任一种,在由所述分类单元分类为第1种类的情况下,提取单元提取所述字符识别对象的字符识别结果,在由所述分类单元分类为第2种类的情况下,第1控制单元以提取所述字符识别对象的字符识别结果并手动输入该字符识别对象的方式进行控制,在由所述分类单元分类为第3种类的情况下,第2控制单元以复数人手动输入所述字符识别对象的方式进行控制。并且,在专利文献1中记载有:字符识别模块输出字符识别结果的准确度(即,确信该字符识别结果正确的程度),根据该准确度的值将字符识别对象分类为第1种类~第3种类,进而,在该准确度属于最高范围的情况下,将基于字符识别模块的字符识别结果作为最终结果来提取。

并且,在对如邮政编码栏那样所记入的字符种类被限定的记入栏的字符识别中,使用将所记入的字符作为属于该字符种类的字符而进行字符识别的字符识别器。

例如在专利文献2中公开了如下方式:由用户接收字符种类的指定,限定于被指定的字符种类而将被输入的手写字符的轨迹与预先登录的复数个登录字符进行核对,将与上述手写字符的轨迹的相似度高的登录字符作为识别候选而进行提取。

并且,在判断为基于字符识别器的字符识别结果正确的情况下,舍弃该字符识别结果。

例如在专利文献3中记载有:在字符识别器的字符识别的可靠性(相当于准确度)低的情况下、或者在字符的图像中包括删除线等的情况下,舍弃字符识别器的字符识别结果。

并且,在专利文献4中公开有:按每种劣化种类来计算字符图像的劣化程度,并根据所计算出的劣化程度来判定是否舍弃关于该字符图像的字符识别结果。

通过舍弃字符识别结果而能够实施提高精度的措施,例如促使人进行确认或者促使重新进行扫描或字符识别等。

并且,在专利文献5中公开了如下方法:通过综合评价识别方式不同的复数个字符识别部的字符识别结果而确定最终的字符识别结果。

专利文献1:日本特开2016-212812号公报

专利文献2:日本特开2013-214188号公报

专利文献3:日本特开2012-185713号公报

专利文献4:日本特开2013-073439号公报

专利文献5:日本特开2000-082110号公报

专利文献6:日本特开平11-296619号公报

有时在应记入特定的字符种类(例如数字)的记入栏中,因记入人员的失误而记入另一种字符种类(例如字母)的字符。而且,在这种被错误记入的字符的形状与本来应该记入的特定的字符种类的特定的字符形状相似等情况下,可能会发生字符识别单元将该已记入的字符识别为该特定的字符。虽然该识别结果本质上是错误的,但是字符识别单元多以高准确度输出该识别结果。

在字符识别结果是错误的概率高的情况下舍弃该字符识别结果的方式中,有时无法正确地舍弃这种类型的错误的字符识别结果。例如在字符识别结果的准确度低的情况下舍弃该字符识别结果的方式中,不会舍弃这种类型的错误的字符识别结果。



技术实现要素:

本发明的目的在于,与在字符识别结果是错误的概率高的情况下舍弃该字符识别结果的方式相比,能够更适当地舍弃将本来不应该记入的字符种类的字符识别为应该记入的字符种类的相似字符的类型的错误的字符识别结果。

方案1所涉及的发明为信息处理装置,其包括:第1字符识别单元,针对输入图像,将所述输入图像中的字符作为属于第1字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第1字符识别结果;第2字符识别单元,针对所述输入图像,将所述输入图像中的字符作为属于第2字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第2字符识别结果,所述第2字符种类是对属于所述第1字符种类的字符的集合至少追加了1个以上不属于所述第1字符种类的字符的集合;及对照单元,进行所述第1字符识别结果与所述第2字符识别结果的对照,在通过该对照而获知所述第1字符识别结果与所述第2字符识别结果不匹配的情况下,舍弃所述第1字符识别结果。

方案2所涉及的发明为方案1所述的信息处理装置,其中,所述第2字符识别单元关于1个所述输入图像输出不同的复数个所述第2字符识别结果,所述对照单元将这些不同的复数个所述第2字符识别结果的每一个与所述第1字符识别结果进行对照,在通过该对照而获知这些不同的复数个所述第2字符识别结果全部与所述第1字符识别结果不匹配的情况下,舍弃所述第1字符识别结果。

方案3所涉及的发明为方案1所述的信息处理装置,其还包括第3字符识别单元,针对所述输入图像,将所述输入图像中的字符作为属于第3字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第3字符识别结果,所述第3字符种类是对属于所述第1字符种类的字符的集合追加了至少1个以上不属于所述第1字符种类和所述第2字符种类的字符的集合,所述对照单元进行所述第1字符识别结果与所述第2字符识别结果的对照、以及所述第1字符识别结果与所述第3字符识别结果的对照,通过这些对照,在获知所述第1字符识别结果与所述第2字符识别结果及所述第3字符识别结果中的任一个均不匹配的情况下,舍弃所述第1字符识别结果。

方案4所涉及的发明为信息处理装置,其包括;第1字符识别单元,针对输入图像,将所述输入图像中的字符作为属于第1字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第1字符识别结果,并且输出所述第1字符识别结果的准确度;第2字符识别单元,针对所述输入图像,将所述输入图像中的字符作为属于第2字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第2字符识别结果,所述第2字符种类是对属于所述第1字符种类的字符的集合追加了至少1个以上不属于所述第1字符种类的字符的集合;接收单元,接收对所述输入图像的基于人的字符识别结果的输入;第1对照单元,进行所述第1字符识别结果与所述第2字符识别结果的对照;通过所述第1对照单元的对照,在获知所述第1字符识别结果与所述第2字符识别结果匹配、且所述准确度为阈值以上的情况下,将所述第1字符识别结果作为对所述输入图像的最终的字符识别结果而输出的单元;及第2对照单元,通过所述第1对照单元的对照,在获知所述第1字符识别结果与所述第2字符识别结果不匹配的情况下、或者在所述准确度小于阈值的情况下,进行所述第1字符识别结果与由所述接收单元接收到的基于所述人的字符识别结果的对照,并根据该对照结果而求出并输出最终的字符识别结果。

方案5所涉及的发明为发明为记录媒体,其记录有用于使计算机作为如下单元而发挥功能的程序:第1字符识别单元,针对输入图像,将所述输入图像中的字符作为属于第1字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第1字符识别结果;第2字符识别单元,针对所述输入图像,将所述输入图像中的字符作为属于第2字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第2字符识别结果,所述第2字符种类是对属于所述第1字符种类的字符的集合至少追加了1个以上不属于所述第1字符种类的字符的集合;及对照单元,进行所述第1字符识别结果与所述第2字符识别结果的对照,在通过该对照而获知所述第1字符识别结果与所述第2字符识别结果不匹配的情况下,舍弃所述第1字符识别结果。

方案6所涉及的发明为记录媒体,其记录有用于使计算机作为如下单元而发挥功能的程序:第1字符识别单元,针对输入图像,将所述输入图像中的字符作为属于第1字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第1字符识别结果,并且输出所述第1字符识别结果的准确度;第2字符识别单元,针对所述输入图像,将所述输入图像中的字符作为属于第2字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第2字符识别结果,所述第2字符种类是对属于所述第1字符种类的字符的集合追加了至少1个以上不属于所述第1字符种类的字符的集合;接收单元,接收对所述输入图像的基于人的字符识别结果的输入;第1对照单元,进行所述第1字符识别结果与所述第2字符识别结果的对照;通过所述第1对照单元的对照,在获知所述第1字符识别结果与所述第2字符识别结果匹配、且所述准确度为阈值以上的情况下,将所述第1字符识别结果作为对所述输入图像的最终的字符识别结果而输出的单元;及第2对照单元,通过所述第1对照单元的对照,在获知所述第1字符识别结果与所述第2字符识别结果不匹配的情况下、或者在所述准确度小于阈值的情况下,进行所述第1字符识别结果与由所述接收单元接收到的基于所述人的字符识别结果的对照,并根据该对照结果而求出并输出最终的字符识别结果。

方案7所涉及的发明为信息处理方法,其包括如下步骤:第1字符识别步骤,针对输入图像,将所述输入图像中的字符作为属于第1字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第1字符识别结果;第2字符识别步骤,针对所述输入图像,将所述输入图像中的字符作为属于第2字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第2字符识别结果,所述第2字符种类是对属于所述第1字符种类的字符的集合至少追加了1个以上不属于所述第1字符种类的字符的集合;及对照步骤,进行所述第1字符识别结果与所述第2字符识别结果的对照,在通过该对照而获知所述第1字符识别结果与所述第2字符识别结果不匹配的情况下,舍弃所述第1字符识别结果。

方案8所涉及的发明为信息处理方法,其包括如下步骤:第1字符识别步骤,针对输入图像,将所述输入图像中的字符作为属于第1字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第1字符识别结果,并且输出所述第1字符识别结果的准确度;第2字符识别步骤,针对所述输入图像,将所述输入图像中的字符作为属于第2字符种类的字符而进行字符识别,并输出作为该字符识别的结果的第2字符识别结果,所述第2字符种类是对属于所述第1字符种类的字符的集合追加了至少1个以上不属于所述第1字符种类的字符的集合;接收步骤,接收对所述输入图像的基于人的字符识别结果的输入;第1对照步骤,进行所述第1字符识别结果与所述第2字符识别结果的对照;通过所述第1对照步骤的对照,在获知所述第1字符识别结果与所述第2字符识别结果匹配、且所述准确度为阈值以上的情况下,将所述第1字符识别结果作为对所述输入图像的最终的字符识别结果而输出的步骤;及第2对照步骤,通过所述第1对照步骤的对照,在获知所述第1字符识别结果与所述第2字符识别结果不匹配的情况下、或者在所述准确度小于阈值的情况下,进行所述第1字符识别结果与在所述接收步骤中接收到的基于所述人的字符识别结果的对照,并根据该对照结果而求出并输出最终的字符识别结果。

发明效果

根据本发明的方案1、5或7,与在字符识别结果是错误的概率高的情况下舍弃该字符识别结果的方式相比,能够更适当地舍弃将本来不应该记入的字符种类的字符识别为应该记入的字符种类的相似字符的类型的错误的字符识别结果。

根据本发明的方案2,与第2字符识别单元仅输出单个第2字符识别结果的情况相比,能够降低错误舍弃在第1字符识别单元正确地识别出属于第1字符种类的字符的情况下的第1字符识别结果的概率。

根据本发明的方案3,与使用单个字符识别单元的情况相比,能够提高对照单元中的舍弃的精度,所述单个字符识别单元对包含属于第2字符种类的字符和属于第3字符种类的字符这两者的字符的集合进行识别。

根据本发明的方案4、6或8,能够防止将错误的字符识别结果直接作为装置的最终的字符识别结果而输出,所述错误的字符识别结果的类型为将本来不应该记入的字符种类的字符识别为应该记入的字符种类的相似字符的类型。并且,与在对照单元的对照结果不匹配的情况下只是丢弃该字符识别结果的方式相比,在尽管该字符识别结果正确,但是因第2字符识别单元的错误识别而成为不匹配的情况下,能够利用该字符识别结果,以更少的成本来求出最终的字符识别结果。

附图说明

根据以下附图,对本发明的实施方式进行详细叙述。

图1是例示出实施方式的装置结构的主要部分的图;

图2是例示出第1变形例的主要部分的图;

图3是例示出第2变形例的主要部分的图;

图4是例示出第3变形例的主要部分的图;

图5是例示出用于在第3变形例中第2对照部的对照结果不匹配的情况下的处理的结构的图;

图6是例示出用于在第3变形例中例示出第2对照部的对照结果不匹配的情况下的处理的另一结构的图;

图7是例示出对应于第3变形例的另一装置结构的主要部分的图。

符号说明

13、18-分配处理部,14、22、26、28-键输入部,16-第2对照部,24-第3对照部,102-字符种类限定识别器,104、104a-字符种类非限定识别器,106、106a-对照部,108-识别控制部,110-准确度调整部。

具体实施方式

图1表示本发明所涉及的信息处理装置的一实施方式的结构例。

在该信息处理装置中被输入包含字符串图像的输入图像。输入图像例如是通过扫描器扫描表单等纸面而得到的图像。或者从通过扫描纸面而得到的图像中切出包含识别对象的字符串的区域(例如特定的记入栏)的图像,并作为输入图像而输入到信息处理装置。输入图像中所包含的字符串可以是由手写字符构成的字符串,也可以是活字的字符串,也可以是手写字符与活字混合的字符串。字符串是由1个以上的字符构成的列。并且,在成为识别对象的字符中,可以包含各种字母或平假名、片假名等表音字符、汉字等表意字符、商标标志等各种标志等。

本实施方式中的成为识别对象的输入图像是被确定为仅记入属于预先指定的字符种类(以下,称作指定字符种类)的字符的记入栏的图像。例如从扫描表单而得到的图像中切出邮政编码记入栏而得到的图像是输入图像的例子。

在此,在该说明书及权利要求书中,字符种类是由复数个字符构成的字符的集合。字符种类的术语通常多指阿拉伯数字、拉丁字母、西里尔字母、平假名、片假名、日本汉字、简体汉字、繁体汉字等之类的字符的种类,但是这些字符的种类也包含在本说明书中的字符种类的概念中。例如“阿拉伯数字”(以下,简称为数字)的字符种类是由0、1、2、3、4、5、6、7、8、9这10个字符构成的集合,“拉丁字母”(以下,简称为字母)的字符种类是由a、b、c、……、z、a、b、c、……、z之类的52个字符构成的集合。并且,如alpha数字(即,由数字、字母、数学符号构成的集合),由复数个字符种类构成的集合也可以定义为1个字符种类。并且,在10个数字中,如由1、2、3、4、5这5个构成的集合,有时某一字符种类的部分集合也被定义为新的字符种类。并且,有时对10个数字追加了与数字4字形相似的字母a、与数字8字形相似的字母b的12个字符的集合也被定义为新的字符种类。如此,由任意的字符构成的集合能够被定义为字符种类。

字符种类限定识别器102及字符种类非限定识别器104均为使用ocr(光学字符识别)技术来进行对输入图像的字符识别的模块。

其中,字符种类限定识别器102将包含于输入图像中的字符作为属于指定字符种类的字符而进行字符识别。即,字符种类限定识别器102执行限定于指定字符种类的字符识别,换言之,执行将指定字符种类作为识别对象的字符识别。字符种类限定识别器102是该信息处理装置中的主要字符识别器,是“第1字符识别单元”的一例。并且,指定字符种类是作为“第1字符识别单元”的识别对象的“第1字符种类”的一例。并且,字符种类限定识别器102的识别结果r是“第1字符识别结果”的一例。

例如字符种类限定识别器102是通过学习属于该指定字符种类的各字符的各种字形的样品(例如基于复数人的手写样品)而以高精度识别属于指定字符种类的字符的方式学习的字符识别器。并且,作为另一例,字符种类限定识别器102可以使用关于属于指定字符种类的各字符分别登录了代表性字形的识别词库来进行字符识别。该例子中,关于包含在输入图像中的识别对象的字符,从包含在识别词库中的字符中,对该识别对象的字符搜索字形的相似度高的字符,若发现这种字符,则将所发现的字符作为识别对象的字符的识别结果而采用。如邮政编码用字符识别器那样,以往已开发并正在利用各种字符种类限定的字符识别器。作为字符种类限定识别器102,可以使用对应于指定字符种类的这种现有的字符识别器。

字符种类非限定识别器104是用于对作为主要字符识别器的字符种类限定识别器102的错误识别进行判别的辅助的字符识别器,是“第2字符识别单元”的一例。字符种类非限定识别器104是将包含在输入图像中的字符作为属于比包含指定字符种类的指定字符种类大的字符集合的字符而进行字符识别的字符识别器。即,字符种类限定识别器102的识别对象是属于指定字符种类的字符的集合,相对于此,字符种类非限定识别器104的识别对象是由属于指定字符种类的字符组和不属于指定字符种类的规定的(即,预先确定的)1个以上的字符构成的字符的集合。关于字符种类非限定识别器104,以下进行更详细的说明。在此,所谓的“由属于指定字符种类的字符组和不属于指定字符种类的规定的1个以上的字符构成的字符的集合”是作为“第2字符识别单元”的识别对象的“第2字符种类”的一例。并且,字符种类非限定识别器104的识别结果r是“第2字符识别结果”的一例。

字符种类非限定识别器104以与字符种类限定识别器102相同的方法(例如学习或识别词库的利用)构成即可,以便能够识别属于作为识别对象的字符的集合的字符。

字符种类限定识别器102及字符种类非限定识别器104可以以1个字符单位进行字符识别,也可以以包含在输入图像中的字符串整体作为单位进行字符识别,也可以从输入图像切出的1个以上的各个字符串作为单位进行字符识别。字符种类限定识别器102及字符种类非限定识别器104将输入图像中的相同的字符或相同的字符串作为对象而进行字符识别,其结果,将所得到的字符识别结果输出到对照部106。关于相同的对象的字符种类限定识别器102及字符种类非限定识别器104的字符识别结果分别标记为识别结果r及识别结果r。

对照部106是“对照单元”及“第1对照单元”的一例,进行对相同的对象的字符种类限定识别器102的识别结果r与字符种类非限定识别器104的识别结果r的对照(对照)。在该对照处理中,判定识别结果r与r是否匹配(即一致)。将识别结果r与r不匹配的情况称作不匹配(即不一致)。基于对照部106的对照处理可以以1个字符单位来进行,也可以以字符串单位(例如以识别结果r及r的字符串整体作为单位等)来进行。

而且,在识别结果r与r匹配的情况下,对照部106采用作为主要字符识别器的字符种类限定识别器102的识别结果r,在识别结果r与r不匹配的情况下,舍弃该识别结果r。在此,“采用识别结果r”是指输出该识别结果r作为在字符种类限定识别器102和字符种类非限定识别器104中经约定的字符识别结果。该情况下的输出目的地可以是成为字符识别结果的输出目的地的文件,也可以是后期的另一处理。另一方面,“舍弃识别结果r”是指不输出该识别结果r作为在字符种类限定识别器102和字符种类非限定识别器104中经约定的字符识别结果。在“舍弃识别结果r”的概念中,不仅包括不输出识别结果r而丢弃的情况,而且还包括与表示非约定(即识别结果r与r不匹配)的内容的信息对应关联地输出识别结果r的情况。

如以上已进行的说明,字符种类非限定识别器104将包含指定字符种类的比指定字符种类大的字符的集合作为对象进行字符识别。并且,字符种类限定识别器102和字符种类非限定识别器104均可以假设为关于分别属于作为自身的识别对象的字符的集合的字符,能够以足够高的识别率进行识别。从而,若识别对象的字符是属于指定字符种类的字符,则字符种类限定识别器102和字符种类非限定识别器104均以高概率来正确地识别该字符,因此字符种类限定识别器102的识别结果r与字符种类非限定识别器104的识别结果r匹配的概率高。认为识别结果r与识别结果r成为不匹配的理由在于,多数情况下,字符种类限定识别器102将除字符种类非限定识别器104能够正确地识别的指定字符种类以外的字符错误识别为指定字符种类内的字符。

由此,在本实施方式中,经对照部106中的对照结果,在识别结果r与识别结果r匹配的情况下采用识别结果r,在不匹配的情况下舍弃识别结果r。

接着,关于上述字符种类非限定识别器104,对更详细的例子进行说明。

作为一个例子,字符种类非限定识别器104不限定字符种类而进行字符识别。所谓不限定字符种类,换言之,是指将假设的所有字符作为识别对象。即,该情况下的字符种类非限定识别器104将由本实施方式的信息处理装置作为识别对象而假设的所有字符构成的集合作为字符识别处理的识别对象。例如在将数字、字母、数学符号、平假名及片假名假作为字符识别的对象的信息处理装置的情况下,字符种类限定识别器102将其中一部分字符的集合(例如仅数字)作为识别对象,相对于此,字符种类非限定识别器104将属于数字、字母、数学符号、平假名及片假名的所有的字符作为识别对象。

在另一个例子中,在字符种类非限定识别器104作为识别对象的字符的集合中,包含字符种类限定识别器102容易错误识别为指定字符种类中的任一个字符的字符。在该例(以下,称作第2例)中,例如在指定字符种类为数字的情况下,将除数字以外的字符中的字符种类限定识别器102容易错误识别为数字的一些字符追加到该指定字符种类的字符成为字符种类非限定识别器104的识别对象。举出具体例,字母a是一定程度上与数字4字形相似且在假设对象为数字的情况下进行识别的字符种类限定识别器102容易将其错误识别为数字4的字符。同样地,字母t、q在将识别对象限定为数字的字符种类限定识别器102中容易分别错误识别为数字7、9。由此,可以将由通过对10个数字追加字母a、t、q而得到的13个字符构成的集合作为字符种类非限定识别器104的识别对象。若为识别对象被限定为数字的字符种类限定识别器102,则字母a、t、q被分别识别为数字4、7、9的概率高,但是若为由以除数字以外还对字母a、t、q进行字符识别的方式构成的字符种类非限定识别器104,则正确地识别为字母a、t、q的概率高。由此,在本实施方式中,例如在字符种类限定识别器102将某一字符识别为数字4、且字符种类非限定识别器104将某一字符识别为字母a的情况下,由于两者不匹配,因此对照部106舍弃作为字符种类限定识别器102的识别结果的数字4。

在除指定字符种类以外的字符中,字符种类限定识别器102容易错误识别为属于指定字符种类的字符的字符通常从过去的经验中得知,因此在字符种类非限定识别器104的识别对象的字符的集合中包含这些字符即可。

另外,在上述第2例中,作为字符种类非限定识别器104的识别对象而追加的字符并不仅限于作为字符种类限定识别器102容易错误识别为指定字符种类中的任一种类的字符而已知的字符,还可以包含其他字符。例如在相对于数字限定的字符种类限定识别器102的字符种类非限定识别器104的识别对象中,除数字以外,还可以包含包括容易错误识别为数字的字母a、t、q在内的所有52个字母。

在此,在第2例中,除作为字符种类非限定识别器104的识别对象而追加到指定字符种类的指定字符种类以外的字符,可以限定于与该字符字形相似的指定字符种类内的字符容易区分识别的字符。例如字母o及o与数字0的字形非常相似,不仅是仅将数字作为识别对象的字符识别器,而且将数字和字母两者作为识别对象的字符识别器也容易错误识别为数字0。从而,相对于将识别对象限定于数字的字符种类限定识别器102,即使字符种类非限定识别器104构成为包含数字和字母两者,字符种类非限定识别器104将字母o或o错误识别为数字0的情况也不少。尤其,在手写字符的情况下,难以进行这种区分。如此,不管限定与否识别对象的字符种类都很难区分识别的字符,即使追加到字符种类非限定识别器104的识别对象中,也不会有助于字符种类限定识别器102的错误识别的检测。由此,在字符种类非限定识别器104的识别对象中不包含这种字符是有效的。

相对于此,以上例示出的字母a、t或q分别与数字4、7或9在一定程度上字形相似,但是若为能够识别字母的字符识别器,则错误识别为数字4、7或9的概率低。从而,若在字符种类非限定识别器104的识别对象中包含字母a、t或q,则在字符种类限定识别器102将字母a、t或q错误识别为数字4、7或9的情况下,有助于该错误识别的检测。

接着,参考图2对上述实施方式的第1变形例进行说明。在图2中,对与图1所示的装置要件具有同一功能的要件标注同一符号,对具有相似功能的要件标注同一符号上添加下标“a”的符号。

字符种类非限定识别器104a识别与图1的实施方式的字符种类非限定识别器104相同的识别对象的字符,但是与字符种类非限定识别器104不同,其输出复数个识别结果r1、r2、r3、……rn(n为2以上的整数)。

通常,字符识别器将复数个候选字符中与识别对象的字符或字符串的相似度最高的(换言之,准确度最高的)候选字符或候选字符串作为识别结果而输出。并且,在字符识别器中也有将相对于识别对象的字符或字符串的相似度(或准确度)为第2位或第3位的候选字符或候选字符串作为第2候选、第3位候选等进行提示的字符识别器。在此,准确度是表示字符识别器对输入图像进行字符识别而得到的识别结果正确地表示包含在该输入图像中的字符串的正确度的程度。准确度越高,识别结果的文字代码正确的概率也高。

字符种类非限定识别器104a不仅输出相似度(或准确度)最高的候选字符或候选字符串,而且也一并输出第2位、第3位、……第n位的候选字符串作为输入图像的字符识别结果。例如识别结果rk(k为1以上且n以下的整数)是相似度(或准确度)为第k位的候选字符或候选字符串。

对照部106a将字符种类限定识别器102的识别结果r分别与字符种类非限定识别器104a的识别结果r1、r2、r3、……rn进行对照。而且,若在识别结果r1、r2、r3、……rn中存在与识别结果r匹配的识别结果,则对照部106a将对照结果设为“匹配”,并采用字符种类限定识别器102的识别结果r。另一方面,若在识别结果r1、r2、r3、……rn中不存在与识别结果r匹配的识别结果的情况下,则对照部106a将对照结果设为“非匹配”,并舍弃字符种类限定识别器102的识别结果r。

图1例的字符种类非限定识别器104在识别对象的字符的集合中包含指定字符种类,但是在识别出属于指定字符种类的字符时,该字符并不限定于成为相似度或准确度最高的字符识别结果。相反地,有时不属于指定字符种类的与该字符相似的字符也会成为最高的字符识别结果。例如若在限定数字的字符种类限定识别器102中识别数字1,则识别结果r成为数字1,但是在除数字以外还将字母包含于识别对象中的字符种类非限定识别器104中识别出数字1的情况下,有时相似度或准确度中字母l(即l的小写字符)超越数字1,字母l也作为识别结果r而输出。该情况下,字符种类非限定识别器104虽然在内部将数字1考虑为识别结果的候选,但是不会将该情况转达给对照部106。其结果,对照部106将作为识别结果r的数字1和作为识别结果r的字母l进行对照,其结果,舍弃作为识别结果r的数字1。如此,如图1例所示,在字符种类非限定识别器104仅输出单个识别结果r的情况下,尽管字符种类限定识别器102的识别结果r正确地识别出属于指定字符种类的字符,有时也会发生舍弃该识别结果r的识别遗漏的情况。

相对于此,在图2所示的变形例中,不仅将最高的识别结果r1,而且将直至第n位为止的复数个识别结果rk与字符种类限定识别器102的识别结果r进行对照,因此与图1例相比,不易发生所述识别遗漏的情况。

另外,字符种类非限定识别器104a可以未必一定输出预先确定的数量的识别结果rn。相反地,可以仅输出相似度或准确度为阈值以上的1以上识别结果rk。阈值则可以预先确定。

接着,参考图3对上述实施方式的第2变形例进行说明。在图2中,对与图1或图3所示的装置要件具有同一功能的要件标注同一符号。

图1装置具有单个字符种类非限定识别器104,相对于此,图3的装置具有从第1至第n(n为2以上的整数)的n个第k非限定识别器104-k(k为1至n的整数)。各个第k非限定识别器104-k分别与字符种类非限定识别器104同样地执行将包含指定字符种类和除此以外的一个以上字符的字符的集合作为识别对象的字符识别处理。然而,包含于作为识别对象的字符的集合中的除指定字符种类以外的字符的部分集合在每个第k非限定识别器104-k中不同。例如在字符种类限定识别器102执行限定于数字的字符识别处理的情况下,第1非限定识别器104-1除数字以外还将字母作为识别对象,第2非限定识别器104-2除数字以外还将字母及片假名作为识别对象,第3非限定识别器104-3除数字以外还将数学符号作为识别对象等。在识别对象中除指定字符种类的字符的集合在k不同的第k非限定识别器104-k彼此之间可以包含或不包含共同的字符。

第k非限定识别器104-k中的1个是“第2字符识别单元”的一例,其他1个以上是“第3字符识别单元”的一例。

各第k非限定识别器104-k的识别结果r1、r2、r3、……rn被输入于对照部106a中。对照部106a将字符种类限定识别器102的识别结果r分别与这些第k非限定识别器104-k的识别结果r1、r2、r3……rn进行对照。而且,若在识别结果r1、r2、r3、……rn中存在与识别结果r匹配的识别结果,则对照部106a将对照结果设为“匹配”,并采用字符种类限定识别器102的识别结果r。另一方面,若在识别结果r1、r2、r3、……rn中不存在与识别结果r匹配的识别结果的情况下,则对照部106a将对照结果设为“非匹配”,并舍弃字符种类限定识别器102的识别结果r。

假设将n个第k非限定识别器104-k的识别对象的所有的字符作为识别对象的单个字符种类非限定识别器。该单个字符种类非限定识别器能够识别n个第k非限定识别器104-k的所有的识别对象,但是若识别对象的字符数量多,则识别精度会比各第k非限定识别器104-k差。因此若为第k非限定识别器104-k,则在即使除指定字符种类以外本身能够正确地识别作为识别对象的字符的情况下,该单个字符种类非限定识别器也无法正确地识别该字符,例如有可能错误识别为与该字符相似的指定字符种类内的字符。从而,与使用这种单个字符种类非限定识别器的情况相比,如该变形例在使用了n个第k非限定识别器104-k的情况下,可期待检测字符种类限定识别器102的错误识别(即,将除指定字符种类以外的字符识别为指定字符种类的字符的错误识别)的能力得以提高。

接着,参考图4对第3变形例进行说明。在该第3变形例中,对图1实施方式的装置追加了用于对照部106的后期处理的结构。另外,由以下说明可知,第3变形例的结构也能够应用到图2及图3中示出的第1及第2变形例中。

第3变形例的信息处理装置除图1所示的要件组以外,还具有识别控制部108、键输入部14及第2对照部16。

在第3变形例中,字符种类限定识别器102除对输入图像的识别结果r以外,还将该识别结果r的准确度p输出到对照部106。准确度p是表示字符种类限定识别器102求出的识别结果r正确地表示包含在该输入图像中的字符串的正确度的程度。准确度p越高,识别结果r的文字代码正确的(即,正确地表示输入图像中的字符串)概率越高。

字符种类非限定识别器104与图1例同样地将对输入图像的识别结果r输出到对照部106。

对照部106进行识别结果r与识别结果r的对照,将该对照结果,即表示这些两者是匹配还是不匹配的信息输出到识别控制部108。并且,对照部106将从字符种类限定识别器102接收到的识别结果r和准确度p输出到识别控制部108。

识别控制部108根据从对照部106输入的对照结果和识别结果r及准确度p,进行用于求出关于输入图像的最终的字符识别结果的控制。以下,对由识别控制部108执行的控制进行说明。

以往,存在一种信息处理装置,其在字符识别器对输入图像的识别结果r的准确度p高于某一阈值t1的情况下,将该识别结果r作为该信息处理装置的最终的字符识别结果而输出。这种信息处理装置在准确度p为阈值t1以下的情况下,接收人对相同的输入图像的字符识别结果的输入,并将所接收到的输入与该识别结果r进行对照。在该对照中,在判定为这两者匹配(即一致)的情况下,该识别结果r作为信息处理装置的最终的字符识别结果而输出。另一方面,在该对照中判定为这两者不匹配的情况下,该现有的信息处理装置从其他人接收该输入图像的字符识别结果的输入,并考虑到该输入而求出最终的字符识别结果。作为一例,将第一个人的字符识别结果和此次重新输入的其他人的字符识别结果进行对照,若这两者一致,则将该字符识别结果设为最终的字符识别结果。

相对于此,字符种类限定识别器102对输入图像的识别结果r的准确度p高于该阈值t1,本实施方式的识别控制部108也不会就此将该识别结果r设为信息处理装置的最终的字符识别结果。取而代之,识别控制部108还参考对照结果,在准确度p比该阈值t1高且对照结果显示匹配的情况下,将该识别结果r作为信息处理装置的最终的字符识别结果而输出。

另一方面,在对照结果不匹配的情况下,即使准确度p比阈值t1高,识别控制部108也不会将该识别结果r作为最终的字符识别结果而采用。其理由在于,在不匹配的情况下,字符种类限定识别器102的识别结果r将除指定字符种类以外的字符错误识别为指定字符种类内的字符的概率高。该情况下,识别控制部108将识别结果r输入到第2对照部16。第2对照部16将所输入的识别结果r与输入到键输入部14的基于人(图示例中名字为“a”的人)的关于该输入图像的字符识别结果进行对照。第2对照部16是“第2对照单元”的一例。另外,键输入部14是接收来自用户(人)的键输入的软件模块,是“接收单元”的一例。a的终端例如经由互联网而与图1所示的信息处理装置连接即可。该情况下,显示输入图像或接收该输入图像的识别结果的输入的结构,例如以网络服务的形式从键输入部14提供于该终端。a对显示于终端的输入图像进行识别,并从终端的键盘输入该输入图像表示的字符串。键输入部14从该终端接收a输入的字符串数据,并传递给第2对照部16。

并且,在准确度p为阈值t1以下的情况下,与上述现有方式同样,识别控制部108将识别结果r在第2对照部16中与基于人的字符识别结果进行对照。

如此,在本实施方式中,除准确度p为阈值t1以下的情况以外,还在对照部106的对照结果不匹配的情况下,进行字符种类限定识别器102的识别结果r与人的字符识别结果的对照。在对照部106的对照结果不匹配的情况下,可以说字符种类限定识别器102的识别结果r是错误识别的概率高,但是不能说一定是错误识别。也可能有如下情况:虽然字符种类限定识别器102的识别结果r是正确的,但是由字符种类非限定识别器104引起错误识别的结果,对照部106的对照结果错误成为不匹配。在该变形例中,考虑到这种情况,通过第2对照部16而与人的输入进行对照。在人的情况下,将除指定字符种类以外的字符误认为指定字符种类的字符的概率低,因此尽管字符种类限定识别器102的识别结果r是正确的,但是在对照部106的对照结果错误不匹配的情况下,通过与人的识别结果进行对照而获知字符种类限定识别器102的识别结果r正确。

即,在字符种类限定识别器102的识别结果r与输入到键输入部14的人的字符识别结果匹配的情况下,第2对照部16将该识别结果r作为信息处理装置的最终的字符识别结果而输出。另一方面,在基于第2对照部16的对照结果不匹配的情况下,从除a以外的其他人接收该输入图像的字符识别结果的输入,并利用所接收到的输入来求出信息处理装置的最终的字符识别结果。关于针对对照结果不匹配的情况的处理,以下,参考图5及图6对具体的例子进行说明。

在对照部106的对照结果不匹配的情况下,字符种类限定识别器102的识别结果r是错误识别的概率高,因此也可以考虑不输出到后续阶段而舍弃的方式。然而,在该方式中,在对照结果不匹配的情况下只能取决于基于人的字符识别结果。该情况下,可以考虑采用来自键输入部14的a的输入来直接作为信息处理装置的最终的字符识别结果。然而,人们往往有失误,因此多数情况下判断若仅凭一个人的识别结果,则可靠性不充分。由此,为了提高可靠性,还可以考虑将两人以上的人的字符识别结果进行对照,并根据该对照结果求出最终的字符识别结果。然而,使两人以上的人工作成本就会提高。

相对于此,在本实施方式中,在对照部106的对照结果不匹配的情况下,字符种类限定识别器102的识别结果r通过第2对照部16而与作为人的a的字符识别结果进行对照,在两者匹配的情况下,识别结果r作为最终的识别结果而被采用。关于该情况下的最终的识别结果,由于2个独立的识别结果匹配,因此比a单独的字符识别结果可靠性更高。并且,在第2对照部16的对照结果、字符种类限定识别器102的识别结果r与a的字符识别结果匹配的情况下,不需要第2个人的输入,因此与在对照部106的对照结果不匹配的情况下必须进行2人以上的输入的对照的方式相比,所需成本降低。

接着,参考图5对用于第2对照部16中的对照结果不匹配的情况下的处理的结构的一例进行说明。在图5中,对图4所示的要件相同的要件标注相同的符号,并省略重复说明。

图5所示的信息处理装置具有图4所示的信息处理装置的要件组,而且还具有键输入部22、第3对照部24及键输入部26。

键输入部22从不同于a的人即b接收输入图像的字符识别结果的输入。第3对照部24将从第2对照部16输入的a的输入和从键输入部22输入的b的输入进行对照。键输入部26将不同于a和b的c接收输入图像的字符识别结果的输入。

在图5的例子中,在字符种类限定识别器102的识别结果r与a的字符识别结果的对照结果不匹配的情况下,第2对照部16将a的字符识别结果输入到第3对照部24。并且,该情况下,键输入部22将输入图像提供于b的终端,与其相应地将b所输入的字符识别结果输入到第3对照部24。第3对照部24进行a的字符识别结果与b的字符识别结果的对照,在这两者匹配的情况下,将该匹配的字符识别结果作为信息处理装置的最终的字符识别结果而输出。并且,在对照结果不匹配的情况下,第3对照部24启动键输入部26。键输入部26将输入图像提供于c的终端,并接收与其对应的来自c的字符识别结果的输入,采用该字符识别结果作为最终的字符识别结果。作为c,例如采用过去输入的字符识别结果的准确率高于a或b的人,由此在一定程度上确保最终的字符识别结果的精确度。

接着,参考图6对用于第2对照部16中的对照结果不匹配的情况下的处理的结构的另一例进行说明。在图6中示出在信息处理装置的结构中承担基于第2对照部16的对照处理以后的处理的部分。

在图6的例子中,在第2对照部16的对照结果不匹配的情况下,第2对照部16将此次的识别对象的输入图像、对该输入图像的a的输入数据及准确度p传递给分配处理部18,并请求分配处理。

在准确度p大于预先设定的阈值t2(其中,t2<t1)的情况下,分配处理部18将该输入图像传递给键输入部28。键输入部28将该输入图像提供于预先登录的d的终端,相对于此,接收d输入的字符识别结果,并将该字符识别结果作为对该输入图像的最终的识别结果而输出。在此,d是不同于a的人即可。

并且,在准确度p为阈值t2以下的情况下,分配处理部18将输入图像传递给键输入部22,并且将a的输入数据传递给第3对照部24。键输入部22将该输入图像提供于预先登录的b的终端,相对于此,接收b输入的字符识别结果,并将该字符识别结果传递给第3对照部24。第3对照部24将a的字符识别结果与b的字符识别结果进行对照,若该两个结果匹配,则将该匹配的字符识别结果作为对该输入图像的最终的字符识别结果而输出。另一方面,在第3对照部24的对照中两者不匹配的情况下,键输入部26将该输入图像提供于不同于a及b这两者的c的终端,相对于此,接收c输入的字符识别结果,并将该字符识别结果作为最终的识别结果而输出。

接着,参考图7对第4变形例进行说明。在图7中,对与图4的结构中的要件相同的要件标注同一符号,并省略重复说明。

图7的结构是将图4的结构中的识别控制部108替换为准确度调整部110和分配处理部13。

准确度调整部110从对照部106接收对照结果和识别结果r及准确度p。在对照结果不匹配的情况下,准确度调整部110在将准确度p调整为小于阈值t1值之后输出到分配处理部13。另一方面,在从输入图像中未检测到删除线的情况下,准确度调整部110将接收到的准确度p不进行变更而直接输出到分配处理部13。将准确度调整部110输出的准确度的值表示为准确度p′。

分配处理部13根据从准确度调整部110输入的准确度p′而控制以下处理路径。更详细而言,在准确度p′大于阈值t1的情况下,分配处理部13将字符种类限定识别器102的识别结果r作为信息处理装置的最终的字符识别结果而输出。另一方面,在准确度p′为阈值t1以下的情况下,将识别结果r和准确度p′输入到第2对照部16。第2对照部16进行的处理与图4的例子的情况相同。并且,在第2对照部16的对照结果不匹配的情况下,作为处理结构,可以采用图5或图6中例示的结构。

以上例示出的实施方式的信息处理装置作为一例而能够构成为硬件的逻辑电路。并且,作为另一例,实施方式的信息处理装置可以通过使内置的计算机执行表示这些系统或装置内的各功能模块的功能的程序来实现。在此,计算机例如具有作为硬件的cpu等处理器、随机存取存储器(ram)及随机访问存储器(rom)等存储器(一次存储)、控制hdd(硬盘驱动器)的hdd控制器、各种i/o(输入输出)接口、控制用于与局域网等网络连接的网络接口等例如经由总线而连接的电路结构。并且,对于该总线,例如经由i/o接口而可以连接用于对cd、dvd等便携式磁盘记录媒体的读取及/或写入的磁盘驱动器、用于对闪存等各种标准的便携式非易失性记录媒体的读取及/或写入的存储器读写器等。记载有以上所例示出的各功能模块的处理内容的程序经由cd、dvd等记录媒体、或者经由网络等通信单元而保存于硬盘驱动器等固定存储装置并安装于计算机。存储于固定存储装置的程序读出到ram,并通过cpu等处理器而被执行,由此实现以上例示出的功能模块组。并且,实施方式的信息处理装置可由以软件与硬件的组合构成。

上述本发明的实施方式是以例示及说明为目的而提供的。另外,本发明的实施方式并不全面详尽地包括本发明,并且并不将本发明限定于所公开的方式。很显然,对本发明所属的领域中的技术人员而言,各种变形及变更是自知之明的。本实施方式是为了最容易理解地说明本发明的原理及其应用而选择并说明的。由此,本技术领域中的其他技术人员能够通过对假定为各种实施方式的特定使用最优化的各种变形例来理解本发明。本发明的范围由以上的权利要求书及其等同物来定义。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1