字符识别装置和字符识别方法

文档序号:6505505阅读:125来源:国知局
字符识别装置和字符识别方法
【专利摘要】本发明提供了一种字符识别装置和字符识别方法。字符识别装置包括:提取单元,其提取数值读取区域,在该数值读取区域中从作为字符识别对象的图像读取作为数字的字符串的数值;字符识别单元,其对于所提取的数值读取区域执行字符识别并且针对各数值获得多个识别候选;以及选择单元,其基于为各数值读取区域设置的数值范围从多个识别候选中选择可能的候选。
【专利说明】字符识别装置和字符识别方法
【技术领域】
[0001]本发明涉及一种字符识别装置和字符识别方法。
【背景技术】
[0002]JP-A-2002-92546 (专利文献I)公开了一种字符识别方法,其中,从具有其中写有数值的多个数值栏和其中写有在各数值栏中写入的数值的总值的总值栏的商业表读取手写字符以执行字符识别,手写字符被写入在多个数值栏和总值栏中;并且字符识别结果和作为字符识别结果的基础的图像数据被输出并且显示以允许字符识别结果的校正。这里,如果在针对多个数值栏的各字符识别结果的总值和针对总值栏的字符识别结果之间存在差异,则输出差值和指示存在差异的消息以进行显示。
[0003]JP-A-7-114616 (专利文献2)公开了一种传票文本信息系统,其对于医疗账单至少执行图像输入、累积、搜索和内容检查,并且包括用于识别账单的样式类型的装置;用于根据样式类型提取读取区域的装置;用于设置读取区域以执行字符识别的装置;以及用于基于作为识别结果的数据检查写入内容的有效性的装置。
[0004]JP-A-7-39816 (专利文献2)公开了 一种接收方名称读取装置,其包括:读取装置,用于读取写在邮件上的接收方名称;字符识别装置,用于根据由读取装置读取的内容识别字符;城市名称识别装置,用于从由字符识别装置识别出的字符识别城市名称;数字识别装置,用于从由字符识别装置识别的字符识别数字;创建装置,用于从由数字识别装置识别出的数字和由城市名称识别装置识别出的城市名称创建接收方名称;存储装置,用于为每个接收方名称预先存储写在邮件上的接收方名称中的数字部分的可能的减少值;计算装置,用于计算由数字识别装置识别出的数字的可能性作为评估值;比较装置,用于比较由计算装置计算的评估值与对应于由创建装置创建的接收方名称的存储装置中存储的减少值;以及确定装置,用于根据比较装置的结果确定是否采用由创建装置创建的接收方名称。

【发明内容】

[0005]本发明的目的在于提供一种字符识别装置和字符识别方法,与没有提供本发明的构造的情况相比,本发明的字符识别装置和字符识别方法具有较高的数值的识别率。
[0006]根据本发明的第一方面,提供了一种字符识别装置,其包括:提取单元,其提取数值读取区域,在该数值读取区域中从作为字符识别对象的图像读取作为数字的字符串的数值;字符识别单元,其对于所提取的数值读取区域执行字符识别并且针对各数值获得多个识别候选;以及选择单元,其基于为各数值读取区域设置的数值范围从多个识别候选中选择可能的候选。
[0007]根据本发明的第二方面,在根据第一方面的字符识别装置中,选择单元可以从所设置的数值范围中存在的识别候选中选择可能的候选。
[0008]根据本发明的第三方面,在根据第一方面的字符识别装置中,选择单元可以使用字符识别和数值识别来选择可能的候选。[0009]根据本发明的第四方面,在根据第二方面的字符识别装置中,选择单元可以使用字符识别和数值识别来选择可能的候选。
[0010]根据本发明的第五方面,在根据第一方面的字符识别装置中,可以利用数值的上限值和下限值来设置数值范围。
[0011]根据本发明的第六方面,在根据第二方面的字符识别装置中,可以利用数值的上限值和下限值来设置数值范围。
[0012]根据本发明的第七方面,在根据第三方面的字符识别装置中,可以利用数值的上限值和下限值来设置数值范围。
[0013]根据本发明的第八方面,在根据第一方面的字符识别装置中,可以利用数值的位数来设置数值范围。
[0014]根据本发明的第九方面,在根据第二方面的字符识别装置中,可以利用数值的位数来设置数值范围。
[0015]根据本发明的第十方面,在根据第三方面的字符识别装置中,可以利用数值的位数来设置数值范围。
[0016]根据本发明的第十一方面,在根据第一方面的字符识别装置中,可以利用有效位数来设置数值范围。
[0017]根据本发明的第十二方面,在根据第二方面的字符识别装置中,可以利用有效位数来设置数值范围。
[0018]根据本发明的第十三方面,在根据第三方面的字符识别装置中,可以利用有效位数来设置数值范围。
[0019]根据本发明的第十四方面,提供了一种字符识别方法,其包括:提取数值读取区域,在该数值读取区域中从作为字符识别对象的图像读取作为数字的字符串的数值;对于数值读取区域执行字符识别并且针对各数值获得多个识别候选;以及基于为各数值读取区域设置的数值范围从多个识别候选中选择可能的候选。
[0020]根据本发明的第一至第十四方面,与没有提供本发明的构造的情况相比,增强了数值的识别率。
[0021]根据本发明的第二方面,多个识别候选被缩减到数值范围。
[0022]根据本发明的第三和第四方面,与没有提供该方面的构造的情况相比,数值的识别率得到进一步增强。
[0023]根据本发明的第五至第十三方面,甚至对于包括表示位数、或正负的符号的数值也能够增强识别率。
【专利附图】

【附图说明】
[0024]将基于附图详细描述本发明的示例性实施方式,其中:
[0025]图1是示意性地示出包括根据本发明的示例性实施方式的字符识别装置的手写输入系统的不例的图;
[0026]图2是示出根据本发明的示例性实施方式的字符识别装置的控制系统的构造的示例的框图;
[0027]图3是示出字符识别处理的处理例程的示例的流程图;[0028]图4是示出数值识别处理的处理例程的示例的流程图;
[0029]图5A是示意性地示出显示的字符图像的示例的图,并且图5B是示意性地示出数值范围的设置方法的示例的图;
[0030]图6A至图6C是示意性地示出表示数值的字符串的字符识别过程的图,并且是示意性地示出形成编码图像的模式图的示例的图;以及
[0031]图7A是示出数值识别处理之前的识别候选的顺序的图,并且图7B是示出数值识别处理之后的识别候选的顺序的图。
【具体实施方式】
[0032]下面,将参考附图详细描述本发明的示例性实施方式。
[0033]<手写输入系统>
[0034]首先,将描述包括根据本发明的示例性实施方式的字符识别装置的系统的示例。
[0035]图1是示意性地示出包括根据本发明的示例性实施方式的字符识别装置的手写输入系统的示例的图。如图1中所示,手写输入系统10包括字符识别装置12和电子笔14。电子笔14通过有线或无线通信线路(未示出)执行与字符识别装置12的通信。字符识别装置12对应于用户所使用的诸如计算机和周边装置的信息处理装置。电子笔14用作用户使用墨水在记录介质16上执行书写所通过的书写材料。另外,电子笔14用作笔型图像读取装置,其捕获正在书写的笔尖周围的记录介质16的图像并且从所捕获的图像获得手写信息。
[0036]在手写输入系统10中,用户利用电子笔14在记录介质16上执行书写。电子笔14捕获正在书写的笔尖周围的记录介质16上的图像,并且从所捕获的图像获得指示笔尖的移动轨迹的手写信息。所获得的手写信息被发送给字符识别装置12。字符识别装置12基于接收到的手写信息生成手写图像,并且对手写图像执行字符识别处理以获得文本信息。即,关于手写图像的图像信息被转换为文本信息(文本数据)。
[0037]在很多情况下,数值(数字的字符串)包括诸如逗号或小数点的表示位数的符号和诸如加号或减号的表示正或负的符号,并且因此,识别率较低。特别地,如图6A中所示,难以第一眼读取手写的输入数值,并且因此,手写的输入数值的识别率被进一步降低。在本实施方式中,对于数值读取区域设置数值范围以执行再次执行字符识别的“数值识别处理”,从而改进了字符识别处理中的数值的识别率。
[0038]图1中所示的手写输入系统10是其中字符识别装置12获得关于手写图像的图像信息的构造的示例。在本实施方式中,优选的是,字符识别装置12获得关于包括数值的文本图像的图像信息。关于文本图像的图像信息既不限于从电子笔获得的图像信息也不限于关于手写信息的图像信息。字符识别装置12可以从除了电子笔之外的外部装置获得关于文本图像的图像信息。这里,作为外部装置,可以使用诸如扫描仪的图像读取装置、不同的信息处理装置等等。
[0039]<字符识别装置>
[0040](字符识别装置的构造)
[0041]接下来,将描述字符识别装置12的构造。
[0042]图2是示出根据本发明的示例性实施方式的字符识别装置的控制系统的构造的示例的框图。如图2中所示,字符识别装置12包括控制单元20、信息获得单元22、信息输出单元24、通信单元26和存储单元28。字符识别装置12的构造是示例,并且可以移除不必要的功能单元,可以添加新的功能单元或者可以修改各单元的构造和布置。
[0043]控制单元20被构造为执行整个装置的控制和各种计算的计算机。即,控制单元20包括CPU20A、存储各种程序的R0M20B、在执行程序时用作工作区域的RAM20C、存储各种信息的非易失性存储器20D和I/020E。CPU20A、R0M20B、RAM20C、非易失性存储器20D和I/020E通过总线20F彼此连接。
[0044]信息获得单元22、信息输出单元24、通信单元26和存储单元28的各单元连接到控制单元20的I/020E。控制单元20执行信息获得单元22、信息输出单元24、通信单元26和存储单元28中的各单元之间的信息接收和发送,以控制各单元。
[0045]信息获得单元22获得根据用户的操作的信息。信息输出单元24输出根据用户的操作的信息。所获得的信息和输出信息包括诸如电子信息、文本信息、图像信息和声音图像的各种信息。
[0046]作为信息获得单元22,可以使用鼠标、键盘、扫描仪、微型电话、摄像头、各种装置等等。作为信息输出单元24,可以使用诸如显示器的图像显示单元、诸如打印机的图像输出单兀和诸如扬声器的声音输出单兀。在本实施方式中,将描述其中提供诸如鼠标或键盘的操作单元作为信息获得单元22并且提供诸如显示器的图像显示单元作为信息输出单元24的示例。
[0047]通信单元26是通过有线或无线通信线路与外部装置执行通信的接口。存储单元28是诸如硬盘的存储单元。各种程序或各种数据被存储在存储单元28中。在本实施方式中,存储执行下面描述的“字符识别处理”的字符识别程序30、用于字符识别处理的字符字典32、数字字典33等等。
[0048]在本实施方式中,描述将诸如字符识别程序30的控制程序预先存储在存储单元28中的情况,但是控制程序可以存储在不同的存储单元(例如,R0M20B、非易失性存储器20D等等)中。此外,控制程序可以通过信息获得单元22或通信单元26从外部获得。例如,可以通过形成信息获得单元22的各种驱动器从诸如CD-ROM的信息记录介质获得控制程序。
[0049]此外,在本实施方式中,与作为字符识别对象的文本图像相关的图像信息也可以预先获得以存储在存储单元中,或者可以通过信息获得单元22或通信单元26从外部获得。例如,在图1中所示的系统中,基于通过通信单元26从电子笔获得的手写信息来生成手写图像,其中,手写图像是字符识别对象。
[0050](字符识别处理)
[0051]接下来,将描述由字符识别装置12执行的“字符识别处理”。
[0052]图3是示出“字符识别处理”的处理例程的示例的流程图。“字符识别处理”由控制单元20的CPU20A执行。如果用户通过形成信息获得单元22的操作单元指定了作为字符识别对象的文本图像并且指示了字符识别处理的执行,则开始“字符识别处理”。
[0053]首先,在步骤100,获得与作为字符识别对象的文本图像相关的图像信息。然后,在步骤S102,从作为字符识别对象的文本图像提取文本区域并且设置读取区域。接下来,在步骤104,对于所设置的读取区域,使用字符字典和数字字典执行字符识别处理。然后,在步骤106,对于数值读取区域设置数值范围以执行其中再次执行字符识别的“数值识别处理”。将在下面详细描述数值识别处理。最终,在步骤108,存储其中反映数值识别处理的结果的字符识别的最终结果,并且该例程终止。
[0054](数值识别处理)
[0055]这里,将描述“数值识别处理”。
[0056]图4是示出数值识别处理的处理例程的示例的流程图。图5A是示意性地示出所显示的文本图像的示例的图,并且图5B是示意性地示出数值范围的设置方法的示例的图。图6A至图6C是示意性地示出表示数值的字符串的字符识别过程的图。图7A是示出数值识别处理之前的识别候选的顺序的图,并且图7B是示出数值识别处理之后的识别候选的顺序的图。
[0057]如图4中所示,首先,在步骤200,提取其中从作为字符识别对象的文本图像读取数值的数值读取区域。然后,在步骤202,在图像显示单元上显示数值读取区域。接下来,在步骤204,显示用于设置针对每个数值读取区域的数值范围的设置画面以便于用户进行设置。
[0058]例如,如图5A中所示,在图像显示单元上显示文本图像18。文本图像18包括由实线表示的文本区域40和由阴影表示的图形区域。文本区域40由字符串(其可以包括数字和符号)构成。图形区域42由除了字符串之外的对象(例如图形或照片)构成。
[0059]文本区域40包括多个数值读取区域50。在图5A中所示的示例中,留个数值读取区域501至506被示出为矩形区域。在不需要区分各区域的情况下,这些区域被统称为数值读取区域50。当用户操作操作单元时,指定数值读取区域50。在图5A中所示的示例中,利用诸如光标的指定单元60指定数值读取区域SO1,并且将其显示为不同于其它数值读取区域50的颜色的颜色。
[0060]如果指定了数值读取区域50 (例如,如图5B中所示),则显示用于设置针对该指定的区域的数值范围的设置画面70。在图5B中所示的示例中,设置画面70包括用于设置数值范围的下限值的框72和用于设置数值范围的上限值的框74。例如,通过将数值范围的下限值设置为“ 1.00”,并且通过将上限值设置为“5.00”,数值范围被设置为1.00至5.00的范围。
[0061]返回图4,在步骤206,确定是否对于整个数值读取区域50完成了数值范围的设置。在完成了数值范围的设置的情况下,过程前进至步骤208。重复步骤206中的确定,直到完成了数值范围的设置。
[0062]接下来,在步骤208,选择一个数值读取区域50。然后,在步骤210,对于与所选择的数值读取区域50的数值相关的每个字符执行字符识别。在步骤212,对于作为数字的字符串的数值获得多个识别候选。然后,在步骤214,从多个识别候选中排除不属于所设置的数值范围的识别候选,从而缩减识别候选。然后,在步骤216,从缩减后的识别候选中选择识别可能性最大的候选。
[0063]例如,如图6A中所示,数值读取区域50包括数值52的图像。在图6A中所示的示例中,数值52为“4.67”,其是包括四个字符“4”、“.”、“6”和“7”的字符串。在字符识别中,数值读取区域50被划分为对应于一个字符的字符区域,并且然后,对于每个字符执行字符识别。
[0064]如图6C中所示,在其中对于对应于小数点的字符区域执行缩减以增强准确性的字符识别中,数值读取区域50被划分为对应于数字的字符区域51至543以及对应于小数点的字符区域544。在字符区域51中识别出字符52ι (数字“4”),在字符区域542中识别出字符522 (数字“6”),并且在字符区域543中识别出字符523 (数字“7”)。此外,在字符区域544中识别出字符524 (小数点”)。作为这些识别结果的组合,识别出数值“4.67”。
[0065]然而,在数值包括诸如小数点的符号的情况下,有时难以将数值读取区域50划分为对应于一个字符的字符区域。此外,在通过手写输入的数值中,难以执行习惯手写等等的识别。设置在图6A中所示的示例中,由于小数点较小而难以识别,并且难以区分“6”和“8”。例如,如图6B中所示,如果数值读取区域50被划分为对应于数字的字符区域54至543,则可能识别出“467”。因此,根据字符识别,获得除了 “4.67”之外的多个识别候选。
[0066]如图7A中所示,在执行数值识别处理之前的字符识别处理中,作为数值52的识别候选,获得了 “467”、“4.67,,、“487,,、“4.87,,、“46.7”等等。这些数值被确定为按照所记载的顺序具有高可能性。即,在执行数值识别处理之前的字符处理的结果中,数值52被识别为“467”。可以通过例如作为使用特征值的图像的相似度的计算来执行字符识别中的“可能性”的确定。当相似度较高时,可能性增大。
[0067]如图5B中所示,在本实施方式中,数值52的数值范围被设置为1.00至5.00的范围。因此,如图7B中所示,在执行数值识别处理之后的字符识别处理中,从识别候选中排除T “467”、“487”和“46.7”,识别候选被缩减到“4.67”和“4.87”。这些数值被确定为按照所记载的顺序具有高可能性。即,在执行数值识别处理之后的字符识别的结果中,数值52被识别为“4.67”。如上所述,在本实施方式中,通过字符识别和数值识别来选择识别候选。
[0068]返回图4,在步骤218,确定是否对于整个数值读取区域50完成了数值识别处理。在对于整个数值读取区域50完成了数值识别处理的情况下。过程返回步骤220。在存在没有完成数值识别处理的数值读取区域50的情况下,过程返回到步骤208,并且然后,重复步骤208至218的过程。
[0069]接下来,在步骤220,获得反映执行了数值识别处理之后的字符识别结果的字符识别的最终结果,并且然后终止该例程。在本实施方式中,通过执行数值识别处理,多个识别候选被缩减到数值范围,并且因此,提高了数值识别率。
[0070]在上述处理中,描述了从包括数值的字符图像中提取数值读取区域并且为每个提取的区域设置数值范围的示例,但是,例如,可以对于写入数值之前的数值读取区域(如商业表的数值栏中)设置数值范围。在该情况下,包括数值区域的文本区域被显示在图像显示单元中作为表。在写入数值之前,对于每个数值读取区域设置数值范围。
[0071]此外,获得写入数值之后的文本图像。例如,其上打印有具有数值栏的文本图像的表格被分发给用户,并且用户将数值写入在数值栏中。光学地读取其上写入有数值的表格,并且获得包括数值的文本图像。对于具有数值的文本图像,以与图4中的步骤208至220相同的方式执行“数值识别处理”。
[0072]在各实施方式中描述的字符识别装置和程序的构造是示例,并且可以在不偏离本发明的精神的范围内进行修改。
[0073]例如,在上述实施方式中,描述了利用下限值和上限值设置数值范围的示例,但是数值范围的设置方法不限于此。可以利用诸如四位或五位的数值的位数来设置数值范围。例如,在四位的情况下,将1000至9999设置给数值范围。此外,数值范围可以设置为使用小数点后四位或五位的有效位的有效数字。例如,在有效数字是小数点后四位的情况下,对于包括表示位数或正和负的符号的数值(例如,0.1320X 106),也增强了识别率。
[0074]已经为了示出和描述的目的而提供了本发明的示例性实施方式的上述描述。该描述不意在是详尽的或者将本发明限制到所公开的精确形式。显而易见地,对于本领域技术人员来说,很多修改和变化将是明显的。对实施方式进行选择和描述以最好地解释本发明的原理及其实际应用,从而使得本领域技术人员能够理解本发明的各种实施方式及其适合于预期的特定使用的各种修改。想要的是,本发明的范围由所附权利要求及其等价物限定。
【权利要求】
1.一种字符识别装置,所述字符识别装置包括: 提取单元,所述提取单元提取数值读取区域,在所述数值读取区域中,从作为字符识别对象的图像读取作为数字的字符串的数值; 字符识别单元,所述字符识别单元对于所提取的数值读取区域执行字符识别,针对各数值获得多个识别候选;以及 选择单元,所述选择单元基于为各数值读取区域设置的数值范围从所述多个识别候选中选择可能的候选。
2.根据权利要求1所述的字符识别装置, 其中,所述选择单元从所设置的数值范围中存在的识别候选中选择可能的候选。
3.根据权利要求1所述的字符识别装置, 其中,所述选择单元使用字符识别和数值识别来选择可能的候选。
4.根据权利要求2所述的字符识别装置, 其中,所述选择单元使用字符识别和数值识别来选择可能的候选。
5.根据权利要求1所述的字符识别装置, 其中,利用数值的上限值和下限值来设置所述数值范围。
6.根据权利要求2所述的字符识别装置, 其中,利用数值的上限值和下限值来设置所述数值范围。
7.根据权利要求3所述的字符识别装置, 其中,利用数值的上限值和下限值来设置所述数值范围。
8.根据权利要求1所述的字符识别装置, 其中,利用数值的位数来设置所述数值范围。
9.根据权利要求2所述的字符识别装置, 其中,利用数值的位数来设置所述数值范围。
10.根据权利要求3所述的字符识别装置, 其中,利用数值的位数来设置所述数值范围。
11.根据权利要求1所述的字符识别装置, 其中,利用有效位数来设置所述数值范围。
12.根据权利要求2所述的字符识别装置, 其中,利用有效位数来设置所述数值范围。
13.根据权利要求3所述的字符识别装置, 其中,利用有效位数来设置所述数值范围。
14.一种字符识别方法,所述字符识别方法包括: 提取数值读取区域,在所述数值读取区域中,从作为字符识别对象的图像读取作为数字的字符串的数值; 对于所述数值读取区域执行字符识别,针对各数值获得多个识别候选;以及 基于为各数值读取区域设置的数值范围从所述多个识别候选中选择可能的候选。
【文档编号】G06K9/20GK103729634SQ201310283873
【公开日】2014年4月16日 申请日期:2013年7月8日 优先权日:2012年10月11日
【发明者】中曾优 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1