字符识别方法、使用该方法的字符识别装置及程序的制作方法

文档序号：6498128阅读：105来源：国知局

字符识别方法、使用该方法的字符识别装置及程序的制作方法
【专利摘要】一种有关字符识别方法及装置的发明，在从字符串的浓淡图像中切取各个字符图像后，依次关注各字符图像，并进行基于各种字符的模型图像的核对处理，由此识别与各字符图像对应的字符。在识别处理之前，将由沿着宽度方向排列的一对字符要素构成的复合字符的模型图像，按照被赋予了规定的识别信息的状态进行登记。在识别处理中，执行将包括关注中的字符图像及其相邻的未处理的字符图像的范围中的图像、与附带识别信息的模型图像进行核对的复合核对，在通过该核对得到了超过预先设定的基准值的一致度时，将包含在该复合核对的对象范围中的两个字符图像的组合，识别为与被核对的附带识别信息的模型图像对应的字符。
【专利说明】字符识别方法、使用该方法的字符识别装置及程序

【技术领域】
[0001] 本发明涉及基于图像处理的字符识别处理，尤其涉及用于识别由沿宽度方向排列的一对字符要素构成的复合字符的技术。

【背景技术】
[0002] 在字符识别处理中，通常从拍摄字符串而生成的浓淡图像中切取各个字符，对切取出的每个字符实施使用了各种字符模型的匹配处理（模型匹配），从而识别字符串的内容。在字符的切取处理中，将处理对象的图像的2值化数据或者浓淡数据向X轴方向、y轴方向分别进行投影，从在各轴生成的投影图案中提取对应字符的部位，由此确定对应各个字符的区域（以下称为"字符区域"）。
[0003] 为了确保匹配处理的精度，需要对识别对象的每个字符确定字符区域，但是在各个独立的字符要素沿着与字符串对应的宽度方向排列而构成的复合字符中，各字符要素被独立地切取，有时进行错误的匹配处理。
[0004] 关于上述问题，在专利文献1中记载了这样的内容，在提取了针对预先学习过的汉字的偏旁的部分的可靠度较大的候选字符的情况下，判定为进行了错误的切取，将适合于偏旁的候选字符及其下一个候选字符一起作为一个字符重新切取（参照第0033段等）。
[0005] 另外，在专利文献2中记载了这样的内容，在切取字符后进行暂时匹配处理并计算匹配可靠度，根据满足匹配可靠度为规定的基准值以上等条件的候选字符决定全角字符的标准字符长度，然后根据识别出的标准字符长度切取识别对象的所有字符，并进行正式匹配处理（参照权利要求1等）。另外，当假设在匹配处理中提取了能够将两个字符部分结合的字符（例如，将汉字的"日"和"月"组合得到的"明"）的情况下，不将该字符用于标准字符长度的决定处理中（参照第0015?0022段、第0061?0068段、第0089段等）。
[0006] 现有技术文献
[0007] 专利文献
[0008] 专利文献1 :日本公开专利公报1997 - 282417号公报
[0009] 专利文献2 :日本公开专利公报2010 - 44485号公报

【发明内容】

[0010] 发明要解决的问题
[0011] 在专利文献2中披露了不清楚一对字符要素（汉字的"日"和"月"等）的组合表示一个字符、还是表示两个字符的情况。在将这种能够独立地识别为字符的字符要素组合而得到的复合字符中，各字符要素被独立地识别时的一致度提高，因而识别的错误被漏看的可能性比较大。
[0012] 另外，在专利文献1中仅是公开了这样的思想，根据一方的字符要素的特征识别出对字符的切取有错误，而重新进行切取处理。
[0013] 根据专利文献2记载的发明，如果两个字符要素的组合的宽度接近标准字符宽度，则该组合作为一个字符被切取，然而如果对如基于西语字符的字符串那样字符尺寸的偏差较大的字符串采用这种识别方法，将有可能产生错误识别。并且，在复合字符独立成为识别对象的情况下，不能采用专利文献2记载的识别方法。
[0014] 本发明正是着眼于上述问题而提出的，其课题是高精度地识别复合字符，而且不受在独立核对各个字符要素时得到的一致度和各个字符要素的尺寸的变动的影响。
[0015] 用于解决问题的手段
[0016] 本发明的字符识别方法从拍摄字符串而生成的浓淡图像中切取字符串内的各个字符，依次关注所切取的字符图像，通过与多种字符的模型图像进行核对，求出关注中的字符图像与各模型图像的一致度，根据这些一致度识别对应字符图像的字符。
[0017] 为了解决上述问题，在本发明中，将由沿着宽度方向排列的一对字符要素构成的复合字符的模型图像，按照被赋予了规定的识别信息的状态进行登记。
[0018] 并且，在使用了附带识别信息的模型图像的核对处理中，执行将包括关注中的字符图像及其相邻的未处理的字符图像的范围中的图像、与该模型图像进行核对的复合核对。并且，在通过复合核对而得到的一致度超过预先设定的基准值时，将包含在该复合核对的对象范围中的两个字符图像的组合，识别为与被核对的附带识别信息的模型图像对应的字符。
[0019] 例如，在横写的字符串成为识别对象的情况下，对于一对字符要素左右排列而构成的字符，登记复合字符的模型图像。并且，在识别处理中，在切取字符后，沿着字符串依次关注所切取的字符，并实施与各种字符的模型图像的核对处理。在这种情况下的复合核对中，包括关注中的字符图像及其相邻的未处理的字符图像的范围中的图像被设定为核对对象。
[0020] 如果复合核对的对象范围内的字符图像的组合不属于复合字符，则一致度应该降低，但是在两个字符图像的组合相当于复合字符的情况下，可以理解为得到较高的一致度。
[0021] 因此，即使是复合字符的各字符要素被彼此独立地被核对，并且相对于与其形状相似的字符的模型图像得到了较高的一致度时，也能够使复合核对的结果优先，因而能够防止对复合字符的错误识别。
[0022] 在上述方法的一个实施方式中，在与附带识别信息的模型图像的核对处理中，执行仅将关注中的字符图像与该模型图像进行核对的单独核对，并且至少在通过单独核对得到的一致度低于基准值时执行复合处理。并且，在通过单独核对而得到的一致度超过基准值时，识别为只有关注中的字符图像是附带识别信息的模型图像所表示的字符，在通过复合核对而得到的一致度超过基准值时，识别为包含在该复合核对的对象范围中的两个字符图像的组合是附带识别信息的模型图像所表示的字符。
[0023] 根据上述的实施方式，在复合字符的各字符要素作为一个字符图像被切取的情况下，基于单独核对的一致度提高，其识别结果被采用，因而能够准确识别复合字符。并且，在复合字符的各字符要素分别作为独立的字符图像被切取的情况下，基于复合核对的识别结果被采用，因而能够防止各字符要素分别被识别为独立的字符。
[0024] 本发明的字符识别装置具备：图像输入单元，其输入通过拍摄字符串而生成的浓淡图像作为识别对象；模型存储单元，其登记了多种字符的模型图像；字符切取单元，其从由图像输入单元输入的浓淡图像中切取字符串内的各个字符；识别单元，其依次关注所切取的字符图像，并通过与登记在登记单元中的多个模型图像进行核对，求出关注中的字符图像与各模型图像的一致度，根据这些一致度识别对应字符图像的字符；以及输出单元，其将识别单元对所切取的各字符图像识别出的字符连接而成的字符串，作为识别结果进行输出。
[0025] 另外，为了实施上述的识别方法，该字符识别装置还具有登记处理单元，该登记处理单元将由沿着宽度方向排列的一对字符要素构成的复合字符的模型图像，按照被赋予了规定的识别信息的状态登记在模型存储单元中。另外，识别单元具备这样的功能：在与附带识别信息的模型图像的核对处理中，执行将包括关注中的字符图像及其相邻的未处理的字符图像的范围中的图像、与附带识别信息的模型图像进行核对的复合处理，并且在通过复合处理而得到的一致度超过预先设定的基准值时，将包含在该复合核对的对象范围中的两个字符图像的组合，识别为与被核对的带识别信息的模型图像对应的字符。
[0026] 在上述的字符识别装置的一个实施方式中，登记处理单元受理这样的操作：显示要对模型存储单元登记的登记候选的字符图像或者已登记的模型图像，选择作为复合字符的模型图像而登记的对象的图像。并且，将所选择的图像的显示切换为基于规定的识别标记的识别显示，同时对该图像赋予识别信息而登记在模型存储单元中。
[0027] 根据该实施方式，用户自身能够指定识别所需要的复合字符，并登记为复合字符的模型图像。
[0028] 另外，本发明提供用于使计算机作为上述的字符识别装置而工作的程序。
[0029] 发明效果
[0030] 根据本发明，能够高精度地识别由沿着宽度方向排列的一对字符要素构成的复合字符，而且不受在各字符要素分别独立地与模型图像核对时的一致度的高低和字符要素的尺寸的影响。

【专利附图】

【附图说明】
[0031] 图1是示出字符识别装置的结构例的框图。
[0032] 图2是将在字符识别处理中显示的画面的示例和与处理对应的显示的变化一起示出的图。
[0033] 图3是示出字符识别处理的步骤的流程图。
[0034] 图4是示出为了向沿着字符串的方向的投影处理而设定的线段的概念的图。
[0035] 图5是示出相对于投影图案的基准直线的设定方法的图。
[0036] 图6是示出向沿着字符串的方向的投影处理（图3的步骤S5)的具体步骤的流程图。
[0037] 图7是示出复合字符被错误识别的示例的图。
[0038] 图8是示出用于登记复合字符模型的画面的示例的图。
[0039] 图9是示出匹配处理的步骤的流程图。
[0040] 图10是示出承接图9的步骤的流程图。

【具体实施方式】
[0041] 图1示出应用本发明的字符识别处理装置的结构例。
[0042] 该字符识别处理装置是以字符串为对象进行拍摄，读取所生成的图像中的字符而输出其读取结果的装置，由包括控制部10的主体部1、摄影用的摄像机2、显示部3、操作部 4等构成。显示部3例如由液晶监视器构成，操作部4包括鼠标和键盘。
[0043] 主体部1是通用的计算机装置（个人电脑），除包括CPU的控制部10外，还具有主存储部11、图像存储器12、摄像接口 13、显示用接口 14、输入用接口 15、外部接口 16、外部盘用读取部17等。
[0044] 主存储部11例如是硬盘，图像存储器12例如是RAM板。在主存储部11中登记了由外部盘用读取部17从外部硬盘18读取的专用的程序、在字符识别处理中使用的字体数据等。从摄像机2输出的图像被取入到摄像接口 13中进行数字变换，然后，变换后的图像数据被存储在图像存储器12中。
[0045] 对控制部10设定了以下功能：按照存储在主存储部11中的程序，从存储在图像存储器12中的图像中逐字符地切取出字符的功能；和识别切取出的字符的内容的功能。另夕卜，也对控制部10设定了作为在这些处理中提示给用户的图形用户界面的功能。根据该功能，控制部10通过显示用接口 14在显示部3显示包括处理对象的图像的画面，通过输入用接口 15受理操作部4的操作。
[0046] 在该实施例的字符识别处理装置中，在显示处理对象的图像的画面中，在受理了指示字符的读取的操作后，通过后述的图3的处理来识别图像中的字符，将识别结果显示在画面中。并且，也能够通过外部接口 16将识别结果输出给外部的设备。
[0047] 图2示出在显示部3显示的用于字符识别处理的画面的示例。
[0048] 在该示例的画面30中包含识别对象的字符串的图像的显示栏31、分析结果的显示栏32、读取按钮33、模型登记按钮34等。另外，在该示例中，假设在图像的右端部产生了阴影，并用斜线表示阴影。
[0049] 图2(1)是读取处理开始前的画面，在图像显示栏31内的图像中显示有示出由用户设定的处理对象区域的矩形框35。用户通过操作鼠标等设定矩形框35的位置和尺寸，由此设定处理对象区域，然后操作读取按钮33。根据该操作，控制部10将与矩形框35对应的区域识别为处理对象区域，并对该区域内的图像实施字符识别处理（包括字符的切取和匹配处理），使画面按照图2(2)所示变化。
[0050] 在识别处理后的画面30的图像显示栏31中，各字符分别被表示通过切取处理而确定的字符区域的框36包围。并且，在各框36的左上位置显示有从该框36内的图像中读取的字符。另外，在图像显示栏31的右侧的余白中显示有从每个字符区域的识别结果中导出的字符串，作为读取结果。并且，在字符串的下方显示有最适合于该字符串的字体的名称 (F1)。
[0051] 在处于空白状态的分析结果的显示栏32中，通过字符切取用的投影处理而生成的投影图案P、与作为切取的基准而设定的直线M(以下称为"基准直线M"）一起显示出来。
[0052] 下面，以将字符比背景暗的横排的字符串作为识别对象为前提，详细说明在该示例中实施的识别处理。
[0053] 图3示出由控制部10实施的用于字符识别的处理的概略步骤。
[0054] 该处理通过在图2示出的画面中设定处理对象区域，进而操作读取按钮33而开始。首先，控制部10根据矩形框35的位置信息取得处理对象区域内的图像（步骤S1)。
[0055] 在图2的示例中，假设指定了包括一列量的字符串的范围来进行说明，但实际上也存在指定包括多列字符串的范围的情况。考虑到这一点，在步骤S2,首先进行向y轴的投影处理，按照所生成的投影图案逐列地切分字符串（步骤S2)。
[0056] 然后，将被切分后的字符串依次设定为处理对象，执行从步骤S4开始的处理。
[0057] 在步骤S4,根据先前的字符串的切分处理的结果，设定y轴中的处理范围的上限值yl和下限值y2 (将被判别为与字符串对应的范围的稍微外侧的y坐标设为yl、y2。）。在步骤S5,以从这些yl到y2的范围内的图像为对象，执行向X轴的投影处理。
[0058] 在通过上述的处理生成沿着X轴方向的投影图案时，在步骤S6从投影图案中提取极大值和极小值，然后在步骤S7,导出与极大值的分布近似的直线和与极小值的分布近似的直线。另外，在步骤S8,根据这两条近似直线设定用于确定切取对象范围的基准直线M。
[0059] 在步骤S9,将投影图案内的各值与上述的基准直线Μ核对，并确定切取对象范围。并且，对于每个切取对象范围，根据表示该范围的左右端缘的X坐标和y坐标的处理对象范围的坐标yl、y2,提取字符区域（步骤S10)，并执行使用了各种字体数据中所包含的字符模型（字符图像的模型）的匹配处理（步骤S11)。
[0060] 然后，返回步骤S3,在具有未处理的字符串的情况下（步骤S3 :否），对未处理的一个字符串执行步骤S4?S11。在针对所有字符串的处理结束时（步骤S3 :是），进入步骤S12,输出识别结果。根据该输出，针对用户的指示的处理结束。
[0061] 在上述的处理中，在向y轴的投影处理（步骤S2)中，对于处理对象区域内的沿着 X轴的每条线段，对该线段内的最小浓度进行投影。通过这样处理，从即使是1像素也包含字符的图像的线段投影字符的图像的浓度，只从完全不包含字符的图像的线段投影背景部分的浓度，因而在y轴方向中能够高精度地提取包含字符串整体的范围。
[0062] 在向沿着字符串的X轴的投影处理（步骤S5)中，对于每个投影对象位置设定斜率不同的多条线段，提取各条线段的最小浓度，采用所提取的最小浓度中的最大值作为投影值。这种线段的设定方法如图4所示。图中的xi表示投影对象位置的X坐标，yl、y2表示y轴中的处理范围的上限值和下限值（在步骤S4求出的上限值和下限值）。
[0063] 参照图4说明对坐标xi设定的投影用的线段的概念，在使通过坐标xi且与y轴平行的线段L0在以点（xi、yl)和点（xi、y2)的中点为轴左右旋转规定角度α的范围内产生的各线段，分别成为针对坐标xi的投影用的线段。在控制部10执行的算法中，使用距y 轴方向的处理对象范围yl、y2的位置处的坐标xi的距离d，变更线段的斜率，因而设定距离d的最大值D α替代角度α。
[0064] 如通常的投影处理那样，在仅将沿着y轴的线段L0作为投影的方向的情况下，如图4的示例那样，字符之间的间隙狭窄，相邻的字符的一部分在该狭窄的间隙中凸出，有时形成该凸出部分落在线段L0上的状态。因此，根据与向y轴的投影处理相同的方法，将沿着y轴的线段L0内的最小浓度投影于xi，导致字符的浓度被投影于图4的示例的xi。
[0065] 鉴于这种情况，在该实施例中，设定各种斜率的线段，对于每条线段提取该线段的最小浓度，并采用所提取的浓度中的最大值作为向坐标xi的投影值。在背景部分比字符明亮的图像中，如图4中的线段L2那样，在仅通过间隙部分的线段中提取的最小浓度达到最大，因而该最大的浓度被投影于坐标xi。因此，字符之间的间隙部分的浓度被体现出来，生成与字符对应的部位成为谷底、与间隙部分对应的部位成为山脊的投影图案。
[0066] 图5将通过上述的投影处理而生成的投影图案P的示例（以x坐标为横轴，以浓度为纵轴的投影图案）、与设定基准直线Μ的方法一起示出。
[0067] 图中的Μ1、Μ2是在图3的步骤S7求出的近似直线。如前面说明的那样，在该步骤 S7,求出与投影图案中的极大值的变化近似的直线Ml和与极小值的变化近似的直线M2。在后面的步骤S8,例如使X坐标逐个移动，将各直线Ml、M2的与关注中的X坐标对应的各个点进行组合，求出这些点的中点（基于各点的浓度的平均值），设定与各中点的分布近似的直线，将该第3近似直线设为基准直线M。
[0068] 基准直线Μ的设定方法不限于上述的方法。例如，也可以采用如下的简易方法设定基准直线Μ :仅将处理对象区域的两端点的坐标xl、χ2作为对象，求出直线Ml上的对应点与直线M2上的对应点的中点并连接各中点。或者，也可以不设定直线Ml、M2,而根据极大值和极小值的分布的图案，决定直线Μ的高度和斜率。
[0069] 图5的投影图案与图2(2)的栏32内所示的投影图案相同，因而再次参照图2(2)。在该实施例中，在作为识别对象的图像中，在右侧端缘部产生了阴影，因而投影图案Ρ内的山脊也随着从左向右而变低，表示字符的谷底部分与山脊部分之差也缩小。但是，与该浓度的变化对应地，基准曲线Μ也从左上部朝向右下部倾斜，在阴影的产生部位中，基准直线Μ 位于能够切分体现间隙部分的山脊和体现字符的谷底的位置。因此，能够根据基准直线Μ 切取与各个字符对应的范围，而且不受阴影的浓度变化的影响。
[0070] 图6示出向X轴的投影处理（相当于图3的步骤S5)的具体步骤。下面，除该图 6夕卜，也一并参照前面的图4、图5来说明投影处理的步骤。
[0071] 在图6中，对应图4的示例，将X轴上的投影对象位置的坐标设为xi。对该xi设定处理对象区域的左端缘的X坐标xl作为初始值（步骤S101)。然后，使xi逐次移动1 像素并执行以下的处理，直到xi成为处理对象区域的右端缘的X坐标的x2(步骤ST110、 111)。
[0072] 首先，在步骤S102,对最小浓度的最大值MAX设定初始值0,并且对偏移量d设定-Da作为初始值。在假设Da是正的值时，d的初始值成为负的值。
[0073] 在步骤S103,设定连接坐标（xi+d、yl)和坐标（xi-d、y2)的线段。根据在步骤 S101、S102中设定的xi、d的初始值，第一次设定的线段成为图4的线段L1。另一方面，在 d = Da时，设定图4的线段L2。
[0074] 因此，将d逐次加1直到偏移量d成为D a (步骤S107、108)，对于每次的d执行步骤S103,由此在从线段L1到L2的范围内每次设定不同斜率的线段。并且，在步骤S104,提取所设定的线段内的最小浓度Imin。另外，在Imin超过最大值MAX的情况下，MAX被改写为Imin (步骤S105、106)。在Imin为MAX以下的情况下（ST105 :否），MAX维持当前值。
[0075] 这样，对于投影对象的一点xi设定斜率不同的多条线段，对每条线段求出最小浓度，并且提取其中的最大值MAX。在对所有线段的处理结束时（S108:是），该时刻的最大值 MAX被设定为坐标xi的投影值P (xi) (S109)。
[0076] 对每个时刻的坐标xi执行上述的处理，在xi被设定为终点即x2,上述的投影值的设定结束时，步骤S111成为"是"，结束投影处理。
[0077] 另外，与上述的示例相反，在将字符比背景明亮的图像设为处理对象的情况下，在各线段中分别提取该线段中的最大浓度，并选择所提取的浓度中的最小值作为投影值。由此，生成与字符对应的部位成为山脊、与间隙部分对应的部位成为谷底的投影图案。按照与图5所示的方法相同的方法，对该投影图案设定两条近似直线M1、M2,在这些直线M1、M2的中间位置设定基准直线M，但切取的对象范围成为投影图案中浓度高于基准直线Μ的范围。
[0078] 在图1的主存储部11中登记的识别处理用的程序被设定成对字符比背景暗的图像执行处理，但也可以装入用于对字符比背景明亮的图像执行处理的程序，根据用户的选择决定执行基于哪个程序的识别处理。
[0079] 另外，在上述的示例中，在极大值的分布范围与极小值的分布范围的大致正中央设定基准曲线Μ，但也可以根据预先设定的偏置值调整基准直线Μ的高度。
[0080] 另外，在该实施例中，在图2所示的画面中，用户通过拖拽栏32内的基准直线的操作，能够变更基准直线Μ的高度和斜率。因此，在对字符的自动切取处理失败的情况下，用户根据栏32内的投影图案的山脊和谷底的关系变更基准直线Μ，然后再次操作读取按钮 33,由此能够得到正确的识别结果。
[0081] 如以上叙述的那样，在该实施例中，在字符之间即使存在微小间隙，也能够高精度地切分该间隙和字符。但是，在识别由隔开间隙而左右排列的两个字符要素构成的复合字符的情况下，将导致各字符要素分别被独立切取，并对每个字符要素进行匹配处理。而且，如图7所示，在采取左右的字符要素都能够独立地识别为字符的方式的情况下，在匹配处理中即使具有较高的一致度也被错误识别，因而难以漏看错误识别。
[0082] 因此，在该实施例中，对由隔开间隙而左右排列的字符要素构成的复合字符的字符模型设定识别用的标志，在匹配处理中，利用该标志区分复合字符用的字符模型和一般的字符模型，根据模型的类型执行不同内容的处理。
[0083] 图8示出用于设定复合字符用的模型（以下称为"复合字符模型"）的画面的示例。在该实施例中，利用在主存储部11中登记了基于各种字体数据的字符模型的情况，控制部10生成被登记为特殊字符的字符模型的列表，并在显示部3显示如图示例那样的设定画面40。在设定画面40的中央部配置有显示特殊字符的列表的窗口 41，在空白部分设有登记按钮42等。
[0084] 用户在列表内的规定的字符上进行点击操作时，在该字符的横宽方向的中央部显示有基于亮度从高到低的色彩的坚条VP。该坚条VP是表示被选择为复合字符模型的候选的标记，但在该阶段中没有设定复合字符标志。用户再次进行点击操作时，坚条VP消失。
[0085] 采用这种结构，用户从显示在窗口 41内的字符中选择需要登记为复合字符模型的字符模型，根据坚条VP的显示而确认选择状况，并操作登记按钮42。对应该操作，对被选择的字符模型设定表示是复合字符的标志（以下称为"复合字符标志"）。并且，在画面的下部显示有表示登记完成的消息43。
[0086] 另外，坚条VP仅是单纯的标记，被设定在所选择的字符模型的横宽的中央位置。因此，不限于坚条VP，也可以显示基于其它方式的标记。
[0087] 另外，作为复合字符模型而登记的图像不限于基于字体数据的图像，例如也可以根据用户的操作而切取包含在识别对象的印刷物的图像中的复合字符并登记。但是，在这种情况下，需要根据登记地点的字体数据的尺寸调整复合字符模型的倍率。
[0088] 设定复合字符标志的处理不限于根据用户的操作来进行的方式。例如，也可以是，控制部10分析字体数据，提取采取左右分离的方式的字符模型，对所提取的字符模型设定复合字符标志。或者，也可以在主存储部11中适当安装由开发者生成的复合字符模型的词典数据。
[0089] 图9和图10示出使用了包括复合字符模型的字符模型组的匹配处理（对应于图 3的步骤S11)的具体步骤。
[0090] 在该处理中，沿着字符串逐个关注通过直到图3的步骤S10为止的处理而提取的字符区域。首先，对表示被关注的字符区域的计数器k设定初始值1 (步骤S201)，取得第k 个字符区域的图像Gk(步骤S202)。以下，将该图像Gk称为字符图像Gk。
[0091] 然后，对用于确定核对对象的模型的计数器j设定初始值1 (步骤S203)，读出第j 个字符模型Μ」（步骤S204)。然后，将该字符模型Μ」与字符图像Gk核对，计算两者的一致度（步骤S205)。将计算出的一致度与规定的基准值R进行比较（步骤S206)。另外，在该步骤S205,将字符模型Μ」的倍率变更为多种倍率，对每种倍率实施核对处理，采用其中最高的一致度。
[0092] 如果一致度为R以上（步骤S206 :是），保存表示上述的核对内容的核对结果信息 (包括在核对中使用的字符模型％的识别码、一致度、得到该一致度时的模型％的倍率等） (步骤S207)。在一致度小于R的情况下（步骤S206 :否），不保存核对结果信息，进入步骤 S208。
[0093] 在此，控制部10确认是否对字符模型％设定了复合字符标志。在设定了标志的情况下，步骤S208为"是"，进入步骤S209,提取包括字符图像G k及第k+Ι个字符区域的图像Gk+1(与字符图像Gk相邻的未被实施字符识别的字符图像）的范围的图像。并且，将提取出的图像与字符模型％核对，计算两者的一致度（步骤S210)，将该一致度与基准值R进行比较（步骤S211)。在步骤S210,与步骤S205相同地，将字符模型％的倍率变更为多种倍率，对每种倍率实施核对处理，采用其中最高的一致度。
[0094] 如果上述的一致度为基准值R以上（步骤S211 :是），保存核对结果信息（步骤 S212)。在这种情况时的核对结果信息中，除字符模型％的识别码、一致度、倍率外，还写入表示进行了以截止到相邻的字符图像G k+1的范围为核对对象的复合核对的信息。
[0095] 以后，通过更新计数器j来变更核对对象的字符模型％ (步骤S213、214)，对每次的字符模型％执行相同的处理，直到与被设定为核对对象的所有字符模型的核对结束。根据在此期间保存的核对结果信息，生成对关注中的字符区域得到了基准值R以上的一致度的字符模型的列表。
[0096] 自此以后参照图10。
[0097] 在基于最后的字符模型的处理结束时，控制部10确认在所保存的核对结果信息中是否存在表示通过与复合字符模型的核对而得到了比基准值R高的R0以上的一致度的信息（步骤S215)。在找到对应的信息的情况下（步骤S215 :是），分析其核对结果信息，并确认该信息是否是表示字符图像Gk被单独核对的信息（步骤S216、217)。在不是通过单独的核对，而是通过将包括相邻的字符图像G i+1的范围与复合字符模型进行核对，得到了 R0以上的一致度的情况下（步骤S217 :否），使该复合字符模型所表示的字符对应于Gk和 Gk+1的组合（步骤S218)，将计数器k加2 (步骤S219)。
[0098] 在分析出的核对结果信息表示字符图像Gk被单独与复合字符模型核对并得到了 R0以上的一致度的情况下（步骤S217 :是），使该复合字符模型所表示的字符仅对应于字符图像Gk(步骤S220)，将计数器k加1 (步骤S221)。
[0099] 在未确认到一致度为R0以上的复合字符模型的情况下（步骤S215 :否），确定得到了最高的一致度的字符模型（步骤S222)。
[0100] 如果所确定的字符模型是复合字符模型（步骤S223 :是），在步骤S217?S221执行与先前叙述的步骤相同的步骤。由此，在包括字符图像Gk及其相邻的字符图像Gk+1的范围与复合字符模型核对时的一致度最高的情况下，复合字符模型所表示的字符对应于字符图像Gk和Gk+1的组合（步骤S218)，在字符图像G k单独与复合字符模型核对时的一致度最高的情况下，复合字符模型所表示的字符对应于字符图像Gk(步骤S220)。
[0101] 在与一般的字符模型的一致度最高的情况下（步骤S223 :否），执行步骤S220和 S221。由此，一致度最高的一般字符模型所表示的字符对应于字符图像Gk。
[0102] 如上所述，当存在通过与复合字符模型的核对能够得到R0以上的一致度的核对处理的情况下、与复合字符模型的一致度比与一般的字符模型的一致度高的情况下，优先采用基于复合字符模型的核对结果。并且，在该采用的核对结果表示进行了以包括处理对象的字符图像G k及其相邻的未处理的字符图像Gk+1的范围为对象的核对的情况下，在使复合字符模型所表示的字符对应于字符图像G k和Gk+1的组合后，在步骤S219将计数器k加2。通过该步骤S219的计数处理，字符图像G k+1也与字符图像Gk-起被识别。
[0103] 根据上述的处理，在切取字符时，即使是复合字符被左右分开切取的情况下，也能够通过精度较高的匹配处理防止产生错误识别。尤其能够大幅提高如图7所示的、用于识别与一般的字符的组合（DZ)部分一致的形式的复合字符时的识别精度。
[0104] 另外，在上述的实施例中，在基于复合字符的模型图像的核对处理中，执行了仅以关注中的字符图像Gk为对象的单独核对、和以包括字符图像G k及其相邻的未处理的字符图像Gk+J^范围为对象的复合核对这两种处理，但不限于此，也可以仅在基于单独核对的一致度比基准值R0低的情况下执行复合核对。
[0105] 此外，在上述的实施例中，利用对投影对象线段内的最小浓度进行投影的方法进行了字符的切取，然而在进行基于一般的投影处理的字符的切取的情况下，也能够应用同样的匹配处理。
[0106] 标号说明
[0107] 1主体部；2摄像机；3显示部；4操作部；10控制部；11主存储部；40画面。
【权利要求】
1. 一种字符识别方法，从拍摄字符串而生成的浓淡图像中切取所述字符串内的各个字符，依次关注所切取的字符图像，通过与多种字符的模型图像进行核对，求出关注中的字符图像与各模型图像的一致度，根据这些一致度识别与所述字符图像对应的字符，其特征在于，对于由沿着宽度方向排列的一对字符要素构成的复合字符的模型图像，按照被赋予了规定的识别信息的状态进行登记，在与附带所述识别信息的模型图像的核对处理中，执行将包含关注中的字符图像及其相邻的未处理的字符图像的范围中的图像、与该模型图像进行核对的复合核对，在通过复合核对得到的一致度超过预先设定的基准值时，将包含在该复合核对的对象范围中的两个字符图像的组合，识别为与被核对的附带识别信息的模型图像对应的字符。
2. 根据权利要求1所述的字符识别方法，其特征在于，在与附带所述识别信息的模型图像的核对处理中，执行仅将关注中的字符图像与该模型图像进行核对的单独核对，并且至少在通过单独核对而得到的一致度低于所述基准值时执行所述复合核对，在通过所述单独核对而得到的一致度超过所述基准值时，识别为只有关注中的字符图像是附带识别信息的模型图像所表示的字符，在通过复合核对而得到的一致度超过所述基准值时，识别为包含在该复合核对的对象范围中的两个字符图像的组合是附带识别信息的模型图像所表示的字符。
3. -种字符识别装置，该字符识别装置具备：图像输入单元，其输入通过拍摄字符串而生成的浓淡图像作为识别对象；模型存储单元，其登记了多种字符的模型图像；字符切取单元，其从由所述图像输入单元输入的浓淡图像中切取所述字符串内的各个字符；识别单元，其依次关注所切取的字符图像，并通过与登记在所述登记单元中的多个模型图像进行核对，求出关注中的字符图像与各模型图像的一致度，根据这些一致度识别与所述字符图像对应的字符；以及输出单元，其将所述识别单元对所切取的各字符图像识别出的字符连接而成的字符串，作为识别结果进行输出，其特征在于，所述字符识别装置还具有登记处理单元，该登记处理单元将由沿着宽度方向排列的一对字符要素构成的复合字符的模型图像，按照被赋予了规定的识别信息的状态登记在所述模型存储单元中，所述识别单元具备这样的功能：在与附带所述识别信息的模型图像的核对处理中，执行将包括关注中的字符图像及其相邻的未处理的字符图像的范围中的图像、与附带所述识别信息的模型图像进行核对的复合核对，并且在通过复合核对而得到的一致度超过预先设定的基准值时，将包含在该复合核对的对象范围中的两个字符图像的组合，识别为与被核对的附带识别信息的模型图像对应的字符。
4. 根据权利要求3所述的字符识别装置，其特征在于，所述登记处理单元受理这样的操作：显示要对所述模型存储单元登记的登记候选的字符图像或者已登记的模型图像，并选择作为复合字符的模型图像而登记的对象的图像，将所选择的图像的显示切换为基于规定的识别标记的识别显示，同时对选择的图像赋予所述识别信息而登记在模型存储单元中。
5. -种字符识别处理用的程序，该程序使计算机作为字符识别装置而工作，该字符识别装置具备：字符切取单元，其从通过拍摄字符串而生成的浓淡图像中切取该图像中的字符串内的各个字符；识别单元，其依次关注所切取的字符图像，并通过与预先登记的多种模型图像进行核对，求出关注中的字符图像与各模型图像的一致度，根据这些一致度识别与所述字符图像对应的字符；以及输出单元，其将所述识别单元对所切取的各字符图像识别出的字符连接而成的字符串，作为识别结果进行输出，其特征在于，所述程序包含用于在所述字符识别装置中设置登记处理单元的程序，该登记处理单元将由沿着宽度方向排列的一对字符要素构成的复合字符的模型图像，按照被赋予了规定的识别信息的状态登记在所述模型存储单元中，所述识别单元具备这样的功能：在与附带所述识别信息的模型图像的核对处理中，执行将包括关注中的字符图像及其相邻的未处理的字符图像的范围中的图像、与附带所述识别信息的模型图像进行核对的复合核对，并且在通过复合核对而得到的一致度超过预先设定的基准值时，将包含在该复合核对的对象范围中的两个字符图像的组合，识别为与被核对的附带识别信息的模型图像对应的字符。
【文档编号】G06K9/20GK104094288SQ201280069116
【公开日】2014年10月8日申请日期:2012年11月28日优先权日:2012年2月17日
【发明者】藤枝紫朗申请人:欧姆龙株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：藤枝紫朗
技术所有人：欧姆龙株式会社
我是此专利的发明人

上一篇：信息处理装置、信息处理方法和程序的制作方法
上一篇：控制电子包裹存放柜的系统和方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。