字符识别装置、字符识别程序以及字符识别方法

文档序号:6579257阅读:169来源:国知局
专利名称:字符识别装置、字符识别程序以及字符识别方法
技术领域
本发明涉及例如识别字符的字符识别装置、字符识别程序以及字符识别方法。
背景技术
一直以来利用以下的字符识别技术通过数字照相机等摄像单元或数字扫描仪等来取得字符图像数据,并识别该字符图像数据内的字符。
在该字符识别技术中,从字符串中截取字符并将截取的字符与词典数据进行匹配,由此来识别字符。
在这样的字符识别中,针对例如字符与字符相接触的情况以及下述状况的字符等,产生很难截取正确字符的情况,该状况的字符是指由在字符串方向上分离的多个字符要素组成的分离字符(例如,横写字符串中的「州」和「川」,竖写文书中的「二」和「三」等)、或由原本单独的字符要素组成的字符,因模糊而分离成多个字符要素。
已提出一些从这种包含接触字符或分离字符的字符串中也能进行正确字符截取的方法,这些方法是在推定了字符宽度后进行字符截取的(参照专利文献1 5)。
但是,在这些专利文献所述的技术中仍存在问题点。
详细地说,专利文献1所述的字符识别装置是在字符宽度固定的前提下进行字符截取的。因此,该字符识别装置无法良好地应对全角字符和半角字符混合的字符串。
专利文献2所述的字符识别装置预先针对全角字符和半角字符分别准备预定的字符宽度并进行字符截取。因此,可以应对全角字符和半角字符混合的字符串。但是,无法应对如中国所采用的纵横比例变形的字符。即,例如在中国的指示牌、广告牌及餐饮店的菜单等中,使用如图IO(A)所示由变形成竖长的竖长字符构成的字符串、或如图IO(B)所示由 变形成横宽的横宽字符构成的字符串等各种横竖比例变形的字符。并且, 专利文献2所述的字符识别装置是以预定的字符宽度为前提,所以存在 无法良好地应对这种横竖比例变形字符的问题。
另外,专利文献3所述的字符识别装置以预定的字符宽度为前提, 考虑所提取的字符是一个字符的情况和是两个字符的情况二者。但是, 专利文献3与上述专利文献2的情况相同,由于以预定的字符宽度为前 提,因此无法良好地应对由竖长字符构成的字符串或由横宽字符构成的 字符串等基于横竖比例变形字符的字符串。
另外,上述专利文献4所述的字符识别装置假定全角字符的横竖比 例大致接近1:1。因此,与上述专利文献2、 3同样,无法良好地应对由 竖长字符构成的字符串或由横宽字符构成的字符串等基于横竖比例变形 字符的字符串。
另外,上述专利文献5所述的字符识别装置根据使黑像素(相当于字 符的像素)投影到与字符串垂直的方向上而得的数据,来制作投影字符宽 度的直方图,将其峰值作为字符宽度。因此,可能可以应对由竖长字符 构成的字符串或由横宽字符构成的字符串等基于横竖比例变形字符的字 符串。但是,例如在如图IO(C)所示存在接触字符的情况下,由于接触字 符的影响导致峰值成为W2,将实际字符宽度Wl的倍数的尺寸W2推定 为字符宽度。
专利文献1日本特开平5-128308号公报
专利文献2日本特开平5-128307号公报
专利文献3日本特开平3-53393号公报
专利文献4日本特开平7-271911号公报
专利文献5日本特开平1-78395号公报

发明内容
本发明是着眼于上述的现有问题而完成的,其目的是提供即使是接 触字符和基于横竖比例变形字符的字符串也能够正确地进行字符识别的字符识别装置、字符识别程序以及字符识别方法。
本发明提供一种字符识别装置,其特征是具有字符串图像取得单 元,其取得字符串图像;测定字符长度取得单元,其从由上述字符串图
像取得单元取得的字符串图像中,针对多个字符取得对字符串方向的字
符长度进行测定而得的测定字符长度;字符临时识别单元,其通过临时 匹配处理对取得的测定字符长度内的字符进行临时识别;标准字符长度 确定单元,其根据能够临时识别的字符的上述测定字符长度来确定标准 字符长度;字符截取单元,其根据所确定的标准字符长度,从上述字符 串图像中截取作为识别对象的全部字符;以及字符识别单元,其通过正 式匹配处理对截取出的字符进行正式识别。
上述字符串图像取得单元例如是CCD照相机或CMOS照相机等摄 像单元、或者从这样的摄像单元接收该摄像单元拍摄的字符串图像数据 的接口等,可以由能够取得图像的适当单元来构成。
关于上述字符串方向,如果字符纵向排列则为纵向,如果字符横向 排列则为横向等,可以设为排列字符的适当方向。
上述字符长度是指字符串方向上1个字符的长度,例如可以设为1 字符在字符串方向上的像素数量。
上述字符临时识别单元例如可以是从字符图像中提取特征数据、将 该特征数据与词典数据的特征数据进行匹配并识别是哪个字符的单元。 此外,所谓能够临时识别可以是以被认为能够识别正确字符的程度得到 匹配置信度的情况。
关于上述标准字符长度确定单元,由将多个测定字符长度的平均值 作为标准字符长度的平均字符长度运算单元构成,或者由提取多个测定 字符长度最集中的值的集中值提取单元构成等,可由确定标准字符长度 的适当单元来构成。
上述字符识别单元例如可以是从字符图像中提取特征数据、将该特 征数据与词典数据的特征数据进行匹配并识别是哪个字符的单元。
上述字符识别装置由半导体芯片等装置构成,或者由具有摄像单元、 控制单元和存储单元的携带电话或PDA等信息处理终端来构成等,可以由适当的装置构成,上述半导体芯片具有执行信息处理的CPU等信息 处理部、进行信息存储的存储器等信息存储部以及与外部装置连接的连 接端子等接口部。
根据本发明,即使是接触字符和基于横竖比例变形字符的字符串, 也能够正确地进行字符识别。
作为本发明的方式,可以构成为当通过上述临时匹配处理临时识 别的字符是上述字符串图像的字符串方向上配置的2个部首字符结合而 成的1个结合字符时,上述标准字符长度确定单元从用于确定上述标准 字符长度的测定字符长度中除去该结合字符的测定字符长度。
上述结合字符可以是字符串方向为左右方向时由左偏旁和右偏旁组 成的字符,或者是字符串方向为上下方向时由字盖和字底组成的字符。
上述部首字符可以是相当于字符串方向为左右方向时上述结合字符 的左偏旁或右偏旁的字符,或者是字符串方向为上下方向时由上述结合 字符的字盖或字底构成的字符。
由此,可以防止将2个字符的字符长度用作1个字符的字符长度。 具体而言例如考虑下述情况针对字符"日"和字符"月"按顺序排列两个的 字符串,错误地临时识别成"日"和"月"结合而成的1个字符"明"。在这样 的情况下,由于临时识别出的"明"是结合字符,因此可以除去"明"的测定 字符长度。因此,能够防止将"日"和"月"这2个字符的字符长度误用为 "明"这1个字符的测定字符长度。
此外作为本发明的方式,可以构成为当通过上述临时匹配处理临
时识别的字符是字符串方向前后的任意一个字符与该字符结合时能够形 成1个结合字符的部首字符时,上述标准字符长度确定单元从用于确定 上述标准字符长度的测定字符长度中除去该部首字符的测定字符长度。
由此,能够防止将结合字符的部首字符的测定字符长度误用为1个 字符的测定字符长度。具体而言考虑下述情况在临时识别"明"这1个 字符时,错误地临时识别为"日"和"月"这2个字符。在这样的情况下,能 够除去可成为部首字符的"日"和"月"的测定字符长度。因此,能够防止将 部首字符的测定字符长度误用为1字符的测定字符长度。
8可构成为所述字符截取单元制作将上述字符串图像投影到与字符 串方向垂直的方向上而成的投影数据,并执行第1截取处理,该第1截 取处理是截取从该投影数据的分开处或谷底到下一个分开处或谷底的临 时字符长度相对于上述标准字符长度处于预定误差内的字符,上述字符 识别单元对截取出的字符进行与全角字符匹配的全角字符正式匹配处 理,作为上述正式匹配处理,当该全角字符正式匹配处理的匹配可靠度 低于预定阈值时,上述字符截取单元执行第2截取处理,该第2截取处 理是截取位于縮小字符长度内的字符,该縮小字符长度是在上述标准字 符长度中从字符串前方切去了预定范围并从字符串后方切去了上述预定 误差,上述字符识别单元对截取出的字符进行与半角字符匹配的半角字 符正式匹配处理,作为上述正式匹配处理。
由此,能够正确地识别全角字符和半角字符。
此外作为本发明的方式,可以将上述预定误差设为上述标准字符长 度的4分之1。
由此,能够适当地应对全角字符彼此间字符宽度的偏差。即,例如 在字符""和字符"f中,字符宽度仅浊音部分稍微不同,能够适当地应 对这样的字符宽度偏差。
此外作为本发明的方式,可以将上述规定范围设为上述标准字符长
度的16分之1。
由此,即使针对'T,或T,等字符宽度较小的字符也能够适当应对。 另外本发明可以提供使计算机执行以下步骤的字符识别程序,字符 串取得步骤,通过字符串图像取得单元来取得字符串图像;测定字符长 度取得步骤,从上述字符串图像中针对多个字符取得对字符串方向的字 符长度进行测定而得的测定字符长度;字符临时识别步骤,通过临时匹 配处理对取得的测定字符长度内的字符进行临时识别;标准字符长度确 定步骤,根据能够临时识别的字符的上述测定字符长度来确定标准字符 长度;字符截取步骤,根据所确定的标准字符长度从上述字符串图像中 截取作为识别对象的全部字符;以及字符识别步骤,通过正式匹配处理 对截取出的字符进行正式识别。
9上述字符识别程序可以存储在CD(紧凑光盘,Compact Disc)、 DVD(数字通用光盘,Digital Versatile Disk)、软盘、存储器、芯片或硬盘 等适当的存储介质中。另外,上述字符识别程序可预先存储在与因特网 等电气通信线路连接的服务器的存储单元中,并可以通过电气通信线路 进行下载、或者可通过电气通信线路作为ASP(应用服务提供商, Application Service Provider)的服务来进行利用。
根据本发明,即使是接触字符和基于横竖比例变形字符的字符串, 也能够利用适当的硬件来执行正确的字符识别。
另外,本发明可提供字符识别方法,该字符识别方法执行以下的步 骤字符串取得步骤,通过字符串图像取得单元来取得字符串图像;测 定字符长度取得步骤,从上述字符串图像中针对多个字符取得对字符串 方向的字符长度进行测定而得的测定字符长度;字符临时识别步骤,通 过临时匹配处理对取得的测定字符长度内的字符进行临时识别;标准字 符长度确定步骤,根据能够临时识别的字符的上述测定字符长度来确定 标准字符长度;字符截取步骤,根据所确定的标准字符长度从上述字符 串图像中截取作为识别对象的全部字符;以及字符识别步骤,通过正式 匹配处理对截取出的字符进行正式识别。
本发明可提供即使是接触字符和基于横竖比例变形字符的字符串也 能够正确地进行字符识别的字符识别装置、字符识别程序以及字符识别 方法。


图l是便携终端的立体图。
图2是便携终端的结构框图。
图3是字符匹配中使用的词典数据的结构图。
图4是显示在画面显示部上的识别画面的画面结构图。
图5是提取测定字符长度的方法的说明图。
图6是关于字符识别功能的流程图。
图7是关于字符识别功能的流程图。
10图8是确定标准字符长度的过程的说明图。
图9是从截取开始位置截取预定截取范围的图像的全角字符截取处理。
图IO是在中国的餐饮店菜单等中使用的变形字符的说明图。
标号说明
1、便携终端;11、 CPU;15、芯片;23、字符识别程序;32、 字符长度候选提取处理部;33、标准字符长度计算部;34、字符截取处
理部;35、字符识别处理部;52、投影数据;El、截取范围;E2、截 取范围;L、测定字符长度;La、标准字符长度;P、字符串图像;a、 字符终端允许误差;P、字符开始端剪切范围
具体实施例方式
参照以下附图来说明本发明的一个实施方式。 图l示出便携终端l的立体图,图2示出便携终端1的结构框图。 如图1所示,便携终端1设置有图像输入部3、操作部5以及画面 显示部7。图像输入部3是拍摄图像的数字照相机,操作部5是可进行按 下操作的按钮,画面显示部7是显示图像的液晶显示器或有机电致发光
r口不益。
如图2所示,便携终端1被设置成图像输入部3、操作部5和画面 显示部7连同CPU11、 ROM12和RAM13与总线16连接。
图像输入部3是CCD照相机或CMOS照相机等数字照相机,其与 总线16连接。图像输入部3所拍摄得到的摄像图像作为数字图像数据被 发送到CPU 11 。该数字图像数据也可以最终存储在其他的存储装置(非易 失性存储器等)中。另外,图像输入部3从CPU ll接收拍摄信号而开始 拍摄。
操作部5与总线16连接。该操作部5经由总线16将使用者进行了 按下操作的按下信号发送至CPU 11 。
画面显示部7具有作为显示操作画面的操作画面显示部7a的功能和 作为显示字符识别的识别结果的识别结果显示部7b的功能。该操作画面显示部7与总线16连接。当从CPU ll发送来图像数据时,该图像数据 的图像显示在操作画面显示部7a或识别结果显示部7b中。
CPU 11是根据存储在ROM 12中的程序将RAM 13用作临时存储区 域来进行各种动作的处理器,该CPU 11具有控制各部的控制功能21和 字符识别功能22。
该字符识别功能22具有投影数据取得部31、字符长度候选提取 处理部32、标准字符长度计算部33、字符截取处理部34以及字符识别 处理部35。
投影数据取得部31取得投影数据,该投影数据是对字符串图像进行 二值化后将与字符串方向垂直的方向上的黑像素数(构成字符的像素数) 排列在字符串方向上的直方图。
字符长度候选提取处理部32从投影数据中将没有黑像素的部分或 黑像素较少的部分推测为字符分开处来提取作为标准字符长度的候选的 测定字符长度。
标准字符长度计算部33根据测定字符长度来计算标准字符长度。 字符截取处理部34按照上述标准字符长度来截取字符串,分离成1 个字符单位。
字符识别处理部35从截取出的字符中取得该字符的特征数据,匹配 该特征数据是否与存储在ROM 12的词典数据25中的各个字符的特征数 据一致或近似。
ROM 12存储有字符识别程序23、设定数据24以及词典数据25。 设定数据24例如存储有标准字符长度计算条件等,该标准字符长度计算 条件规定了判断已进行临时匹配处理的字符是否是求取标准字符长度时 可使用的字符的条件。
RAM 13临时存储CPU 11在各种控制和运算中使用的数据,并且在 图像存储器14中存储有字符串图像等图像。
另外,在便携终端1中还设置有进行无线通信的通信天线、进行声 音输出的扬声器以及进行声音采集的麦克风等。由此,构成为可作为移 动电话而利用。另外,如图中假想线所示,CPU 11和ROM 12可构成为搭载在1个 芯片15上的电子部件。在此情况下,只要在便携终端1中具有芯片15, 就可简单地追加字符识别功能。
图3示出在字符匹配中使用的词典数据25的结构图。
词典数据25由字符代码、匹配信息、全角/半角区别、结合字符区 别以及左部首字符区别等各个项目构成。
字符代码针对各个字符存储SHIFT-JIS或UTF-8等适当的字符代码。
匹配信息针对各个字符存储特征量数据。
全角/半角区别以'TV"0"的方式来存储全角字符或半角字符的区别。
结合字符区别以"rv"o"的方式来存储是否是结合字符的区别。
左部首字符区别以'TV"O"的方式来存储是否是左侧部首字符的区别。
图4示出在画面显示部7中显示的识别画面40的画面结构图。 识别画面40将由图像输入部3取得的图像较大地显示在画面中,对
其中希望识别的字符串图像P以利用识别对象确定框41包围的方式进行
显示。另外,在图示的例中字符是横向排列的,因此字符长度成为通常
所说的字符宽度。
在画面下方设置有返回按钮42、识别按钮43以及子菜单按钮44。
返回按钮42是当其被按下时返回前一画面的按钮。
识别按钮43是当其被按下时开始字符识别的按钮。
子菜单按钮44是当其被按下时显示具有各种功能的子菜单的按钮。
另外,在该子菜单中,还显示可通过使用者的操作来任意变更识别对象
确定框41的位置和范围的识别对象指定功能。
图5是说明从字符串图像中取得投影数据来提取测定字符长度的方
法的说明图。
将图5(A)所示的字符串图像51以字符部分变黑的方式进行2值化, 将与字符串方向垂直的方向(在图示例中为上下方向)上的黑像素数量以
比特为单位排列在字符串方向上时,如图5(B)所示,获得使黑像素投影 后的投影数据52。
13该投影数据52是将纵轴作为黑像素数量、横轴作为字符串方向位置 的直方图。
该投影数据52如图所示,字符串方向上的字符与字符之间位置的值 成为0或极小值,该0或极小值部分可能是字符与字符的分界。
如图5(C)所示,根据这样的字符与字符的分界可得到各种测定字符 长度的候选。在图5(C)中显示在最上段的测定字符长度L,是如果黑像 素数量小于等于预定数(阈值Bl)则推定为字符分开处的情况下的候选。 对于显示在最下段的测定字符长度L,是仅将黑像素数量为O(阈值B6) 的情形推定为字符分开处的情况下的候选。这两者之间的测定字符长度L 是使推定为字符分开处的黑像素数量的值(阈值B2 B5)不同的例子。
这样,通过使作为字符分开处的黑像素数量的阈值B变化,来得到 某种程度精度的测定字符长度L。不过如图所示,所得到的测定字符长度 L并非完全正确。这样得到了具有某种程度可靠性的测定字符长度L,以 下说明用于进一步进行准确性较高的字符识别的处理。
图6 图7示出关于CPU 11根据存储在ROM 12中的字符识别程序 23所执行的字符识别功能22的流程图。
CPU 11从图像输入部3取得字符图像(步骤Sl)。该字符图像的取得 可以通过以下方式来取得从操作部5接受使用者的摄像操作,根据该 摄像操作来执行图像输入部3的摄像,将图像输入部3取得的摄像图像 作为字符图像来进行数据接收。
CPU 11在画面显示部7中显示识别画面40,使用者利用操作部5 对识别对象确定框41进行移动操作来接受识别对象范围的指定(步骤 S2)。如图8(A)所示,上述步骤以后的说明是将"六月的宴会料理..."的字 符图像指定为识别对象范围的情况作为例子来进行说明的。
CPU 11发挥作为投影数据取得部31的功能,针对指定的识别对象 范围的字符串取得投影数据52(步骤S3)。
CPU 11发挥作为字符长度候选提取处理部32的功能,从投影数据
52提取测定字符长度(步骤S4)。此时如图8 (B)所示,区分成 "六""月 "白''"勺',"宴''"会''"米''"斗 "理''...的字符候选单位,提取出测定字符长度。另外,对于区分后的字符候选和测定字符长度,如果字符串 横向排列则可以从左向右依次标注编号,如果字符串纵向排列则可以从 上到下依次标注编号。
CPU 11将变量"i"设为"O"进行初始化(步骤S5),针对存在于第i个 测定字符长度内的字符候选进行临时匹配处理,计算匹配可靠度(步骤 S6)。该匹配可靠度是通过以下方式来计算的根据字符候选来计算特征 量,并将该特征量与词典数据25的各字符的匹配信息进行比较。此时, 仅与全角字符的匹配信息进行比较,而不使用半角字符。由此,可以将 最终计算出的标准字符长度作为全角字符的字符长度,能够提高精度。 另外,此时可通过临时匹配处理来临时识别字符,优选暂时存储该临时 识别出的字符。
CPU 11判定计算出的匹配可靠度是否满足预定的标准字符长度计 算条件(步骤S7)。该标准字符长度计算条件是指完全满足以下所示的条 件1 条件3的条件。
"标准字符长度计算条件"
条件l:匹配可靠度是预定的基准值以上
条件2:通过匹配识别出的字符不对应于部首字符 条件3:通过匹配识别出的字符不对应于结合字符
条件1中的预定基准值可适当设定为认为能够识别正确字符的基准值。
条件2的部首字符例如可设为成为字符串方向前方(左偏旁或字盖)
的前方部首字符,可设为成为字符串方向后方(右偏旁或字底)的后方部首 字符,或者可设为上述二者。
另外,将前方部首字符作为排除对象时,优选的是,仅将字符的临 时识别结果中、该前方部首字符与后方部首字符组合起来构成一个结合 字符的情况作为排除对象。这样能够提高效率和精度。
此外,将后方部首字符作为排除对象时,优选的是,仅将字符的临 时识别结果中、该后方部首字符与排列在其前方的字符识别结果结合而 构成一个结合字符的情况作为排除对象。由此,能够提高效率和精度。
15对于条件3的结合字符,如果字符串方向为横方向则是由"左偏旁" 和"右偏旁"组成的字符,如果字符串方向为纵方向则是由"字盖"和"字底" 组成的字符。
在图8(C)所示的例子中,可以作为满足标准字符长度计算条件而采 用的字符是"六""宴""会"。另外的"月""白""勺""米""斗""理"作为与部首 字符或结合字符相应的字符而不满足条件。
在满足标准字符长度计算条件时(步骤S7的"是"),CPU U将该测 定字符长度设为标准计算用字符长度,将初始值为"O"的变量"字符数"递 增1 (步骤S8)。
在不满足标准字符长度计算条件时(步骤S7的"否"),CPU 11直接将 处理进入步骤S9。
CPU 11判定是否收集了必要数量(例如4个字符)的标准计算用字符 长度,即判定变量"字符数"是否到达了预定数量(例如4个)(步骤S9)。
当收集了必要数量的标准计算用字符长度时(步骤S9的"是"),CPU 11根据取得的预定数量(例如4个字符)的标准计算用字符长度来计算标 准字符长度(步骤SIO),处理进入步骤S15。该标准字符长度优选为预定 数量的标准计算用字符长度的平均值。另外,计算出的标准字符长度为 全角字符的标准字符长度。
在未收集到必要数量的标准计算用字符长度时(步骤S9的"否"), CPU 11将变量"i"递增l(步骤Sll),返回步骤S6反复进行处理,直到该 变量"i"(即,变量"字符数")到达标准计算用字符长度的数量为止(步骤 S12的"是")。
在变量"i"到达标准计算用字符长度的数量时(步骤S12的"否"),可 识别为未收集到必要数量的标准计算用字符长度。因此,CPU11判定标 准计算用字符长度是否收集了一个以上(步骤S13)。
在标准计算用字符长度收集了一个以上时(步骤S13的"是"),CPU 11将处理进行步骤SIO,计算所收集到的标准计算用字符长度的平均值, 并将其确定为标准字符长度(步骤SIO)。
当一个标准计算用字符长度也未收集到时(步骤S13的"否"),CPU 11根据默认设定来计算标准字符长度(步骤S14)。
对于基于该默认设定的标准字符长度,假定读取对象字符的纵横比 是h 1,将与字符串方向垂直的方向上的字符长度(在此实施例中是字符 高度)设为标准字符长度。这样将纵横比设为h 1是因为通常纵横比为1 比1的字符多于除此以外的纵横比的字符。
执行到此为止的从步骤S6至S14的CPU 11作为标准字符长度计算 部33发挥功能。
CPU 11根据所确定的标准字符长度,设定针对字符串图像的第一字 符的截取开始位置(步骤S15)。
然后,CPU 11作为字符截取处理部34发挥功能,如图9(A)所示执
行从截取开始位置截取预定截取范围的图像的全角字符截取处理(步骤 S16)。这里的预定截取范围是标准字符长度Laicu即,全角字符截取处 理将从截取开始位置离开标准字符长度La的位置作为中心的-cc +a作为 搜索范围,将位于该搜索范围内的投影数据52的分开处或谷底确定为字 符终端侧剪切位置。然后,在从截取开始位置到字符终端侧剪切位置的 截取范围中截取图像。其中,(X是字符终端允许误差,优选为标准字符 长度La的1/4。
然后,CPU 11作为字符识别处理部35发挥功能,针对通过全角字 符截取处理所截取的图像内的字符来执行全角字符识别处理(步骤S17)。 该全角字符识别处理仅使用词典数据25中存储的匹配信息中的全角/半 角区别为全角的匹配信息。另外,全角字符识别处理是根据所截取的字 符图像来计算特征量、并从词典数据25检索与该特征量一致或最近似的 匹配信息的处理。
CPU 11判定在全角字符识别处理中得到的匹配可靠度是否高于基 准值(步骤S18)。该基准值设定成所识别的字符是正确字符的可能性高 的值。并且,如果匹配可靠度比上述基准值高(步骤S18的"是"),则CPU U采用该字符(步骤S19)。
如果匹配可靠度低于一定值(步骤S18的"否"),则CPU 11作为字符 截取处理部34发挥功能,执行半角字符截取处理(步骤S20)。如图9(B)所示,该半角字符截取处理以「p〈截取范围〈标准字符长度La-a」的方式 来截取图像。g卩,从全角字符的截取开始位置起切去字符开始端剪切范 围(3,并且在比标准字符长度La短字符终端允许误差a的部分处进行剪 切,由此能够高精度地截取半角字符。
这里,字符开始端剪切范围P的图像剪切可以始终在从全角字符的 截取开始位置离开字符开始端剪切范围(3的位置处进行剪切,或者也可 以在从全角字符的截取开始位置到字符开始端剪切范围p之间的投影数 据52的分开处或者谷底进行剪切。另外,优选将字符开始端剪切范围卩 设为标准字符长度的1/16。
此外,作为字符终端侧剪切位置的"标准字符长度La-a"处的图像剪 切,可以从全角字符的截取开始位置离开"标准字符长度La-a"的位置处 进行剪切,或者也可以将从全角字符的截取开始位置离开"标准字符长度 La-a"的位置、到离开标准字符长度La的位置的范围作为搜索范围,在 位于该搜索范围的投影数据52的分开处或谷底进行剪切。
这样进行了半角字符截取处理后,CPU 11作为字符识别处理部35 发挥功能,执行半角字符识别处理(步骤S21)。该半角字符识别处理仅使 用词典数据25中存储的匹配信息中的全角/半角区别为半角的匹配信息。 另外,半角字符识别处理是根据所截取的字符图像来计算特征量、并从 词典数据25中检索与该特征量一致或者最近似的匹配信息的处理。
如果匹配处理的可靠度高,则CPU11采用匹配后的字符,将该字符 设定为识别成功(步骤S22)。
CPU 11判定是否是字符串图像最末尾的字符(步骤S23),如果不是 最末尾的字符(步骤S23的"否"),则设定下一字符的截取开始位置(步骤 S24),并返回步骤S20反复进行处理。下一字符的截取开始位置例如设 为由步骤S16的全角字符截取处理或者步骤S20的半角字符截取处理所 确定的字符终端侧剪切位置即可。
当在上述步骤S23中是最末尾字符时(步骤S23的"是"),CPU 11认 为作为读取对象的全部字符的字符识别已结束而结束处理。这里,字符 识别出的字符可以显示在作为识别结果显示部7b的画面显示部7上,或者发送到翻译应用程序等其他程序,通过适当的输出单元进行输出。
通过以上的结构以及动作,即使是接触字符和基于纵横比变形字符 的字符串,也能进行正确的字符识别。
在确定标准字符长度La时要满足匹配可靠度高于某阈^i的条件,因 此可以从标准字符长度La的计算中排除不能进行正确字符识别的字符, 即接触字符、字符在中途分开或者反映了字符以外的噪声的图像。
此外,不仅匹配可靠度较高,而且是排除了可能是部首字符的字符 以及可能是结合字符的字符而进行标准字符长度La的计算,因此能够防 止弄错字符长度而进行识别的情况。即,例如,对于"日"和"月"等成为其 他字符("明"等)要素的概率较大的字符,当其实际上成为另外字符的 要素时,即使从"明"中仅截取"日"或"月"的部分作为字符长度的候选的情 况下,也能够将其排除而推定标准字符长度La。
此外,由于采用多个字符长度的平均值,因此能够提高字符长度的 推定精度。
此外,从投影数据52进行的字符截取处理中,在成为投影数据52 的分开处或谷底的位置截取字符并作为坐标的候选,由此即使是字符接 触频发的字符串,也能够正确地截取1个字符来高精度地进行字符识别。
此外,使用字符终端允许误差a和字符开始端剪切范围卩,在通过 全角字符识别处理无法正确识别的情况下执行半角字符识别处理,由此 能够任意读取全角字符和半角字符。
此外,由于利用相对于标准字符长度La的比率来确定字符终端允许 误差a和字符开始端剪切范围|3的值,因此与读取对象字符串是竖长(参 照图8(D))还是横宽(参照图8(E))等的大小(纵横比)区别无关,都能够适当 地识别字符。
此外,通过将字符开始端剪切范围P设为标准字符长度的1/16,由 此即使针对'T,或T等字符宽度较小的字符也能适当地应对。
另外,在取得了预定数量(例如4个)的可用测定字符长度的时刻,确 定标准字符长度La而不进行此后的临时识别,之后使用标准字符长度 La来进行正式的识别,由此能够实现字符识别所需时间的縮短以及字符
19识别精度的提高。
在本发明的结构与上述实施方式的对应中,本发明的字符识别装置
对应于实施方式的便携终端1或芯片15,以下同样,字符串图像取得单 元对应于执行步骤S1的CPU 11,测定字符长度取得单元对应于字符长 度候选提取处理部32,字符临时识别单元对应于执行步骤S6的标准字符 长度计算部33,标准字符长度确定单元对应于标准字符长度计算部33, 字符截取单元对应于字符截取处理部34,字符识别单元对应于字符识别 处理部35,临时字符长度对应于截取范围E1,縮小字符长度对应于截取 范围E2,预定误差对应于字符终端允许误差a,预定范围对应于字符开 始端剪切范围P,预定阈值对应于基准值,字符串取得步骤对应于步骤 Sl,测定字符长度取得步骤对应于步骤S4,临时匹配处理、临时识别和 字符临时识别步骤对应于步骤S6,标准字符长度确定步骤对应于步骤 S6 S14,第1截取处理对应于步骤S16,全角字符正式匹配处理对应于 步骤S17,字符截取步骤对应于步骤S16、 S20,字符识别步骤及正式匹 配处理对应于步骤S17、 S21,第2截取处理对应于步骤S20,半角字符 正式匹配处理对应于步骤S21,但本发明不仅限于上述实施方式的结构, 可以获得多个实施方式。
20
权利要求
1.一种字符识别装置,该字符识别装置具有字符串图像取得单元,其取得字符串图像;测定字符长度取得单元,其从由上述字符串图像取得单元取得的字符串图像中,针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别单元,其通过临时匹配处理对取得的测定字符长度内的字符进行临时识别;标准字符长度确定单元,其根据能够临时识别的字符的上述测定字符长度来确定标准字符长度;字符截取单元,其根据所确定的标准字符长度,从上述字符串图像中截取作为识别对象的全部字符;以及字符识别单元,其通过正式匹配处理对截取出的字符进行正式识别。
2. 根据权利要求l所述的字符识别装置,其中, 该字符识别装置构成为当通过上述临时匹配处理临时识别的字符是上述字符串图像的字符串方向上配置的2个部首字符结合而成的1个 结合字符时,上述标准字符长度确定单元从用于确定上述标准字符长度 的测定字符长度中除去该结合字符的测定字符长度。
3. 根据权利要求1或2所述的字符识别装置,其中, 该字符识别装置构成为当通过上述临时匹配处理临时识别的字符是字符串方向前后的任意一个字符与该字符结合时能够形成1个结合字 符的部首字符时,上述标准字符长度确定单元从用于确定上述标准字符 长度的测定字符长度中除去该部首字符的测定字符长度。
4. 根据权利要求1至3中任一项所述的字符识别装置,其中,该字符识别装置构成为所述字符截取单元制作将上述字符串图像投影到与字符串方向垂直 的方向上而成的投影数据,并执行第1截取处理,该第1截取处理是截 取从该投影数据的分开处或谷底到下一个分开处或谷底的临时字符长度相对于上述标准字符长度处于预定误差内的字符,上述字符识别单元对截取出的字符进行与全角字符匹配的全角字符 正式匹配处理,作为上述正式匹配处理,当该全角字符正式匹配处理的匹配可靠度低于预定阈值时,上述字符截取单元执行第2截取处理,该第2截取处理是截取位于 縮小字符长度内的字符,该縮小字符长度是在上述标准字符长度中从字 符串前方切去了预定范围并从字符串后方切去了上述预定误差,上述字符识别单元对截取出的字符进行与半角字符匹配的半角字符 正式匹配处理,作为上述正式匹配处理。
5. 根据权利要求4所述的字符识别装置,其中, 上述预定误差为上述标准字符长度的4分之1 。
6. 根据权利要求4或5所述的字符识别装置,其中, 上述预定范围为上述标准字符长度的16分之1。
7. —种字符识别程序,该字符识别程序使计算机执行以下步骤 字符串取得步骤,通过字符串图像取得单元来取得字符串图像;测定字符长度取得步骤,从上述字符串图像中针对多个字符取得对 字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别步骤,通过临时匹配处理对取得的测定字符长度内的 字符进行临时识别;标准字符长度确定步骤,根据能够临时识别的字符的上述测定字符 长度来确定标准字符长度;字符截取步骤,根据所确定的标准字符长度从上述字符串图像中截 取作为识别对象的全部字符;以及字符识别步骤,通过正式匹配处理对截取出的字符进行正式识别。
8. —种字符识别方法,该字符识别方法执行以下的步骤 字符串取得步骤,通过字符串图像取得单元来取得字符串图像; 测定字符长度取得步骤,从上述字符串图像中针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别步骤,通过临时匹配处理对取得的测定字符长度内的字符进行临时识别;标准字符长度确定步骤,根据能够临时识别的字符的上述测定字符 长度来确定标准字符长度;字符截取步骤,根据所确定的标准字符长度从上述字符串图像中截 取作为识别对象的全部字符;以及字符识别步骤,通过正式匹配处理对截取出的字符进行正式识别。
全文摘要
本发明提供字符识别装置、字符识别程序以及字符识别方法,即使是接触字符和基于纵横比变形字符的字符串也能正确进行字符识别。该字符识别装置具有字符串图像取得单元,其取得字符串图像;测定字符长度取得单元,其从字符串图像取得单元所取得的字符串图像中,针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;字符临时识别单元,其通过临时匹配处理对测定字符长度内的字符进行临时识别;标准字符长度确定单元,其根据能够临时识别的字符的测定字符长度来确定标准字符长度;字符截取单元,其根据标准字符长度,从字符串图像中截取作为识别对象的全部字符;以及字符识别单元,其通过正式匹配处理对截取出的字符进行正式识别。
文档编号G06K9/00GK101650779SQ200910159089
公开日2010年2月17日 申请日期2009年8月6日 优先权日2008年8月11日
发明者相泽知祯 申请人:欧姆龙株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1