光学字符识别方法及装置制造方法

文档序号:6551203阅读:148来源:国知局
光学字符识别方法及装置制造方法
【专利摘要】本公开提供了一种光学字符识别方法及装置。其中,光学字符识别方法包括:从原始图像中提取字符块;基于笔画宽度变换,确定所述字符块中断裂的笔画;对所述断裂的笔画补齐得到准识别图像;对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。本公开能够利用笔画宽度变换对字符中笔画出现的断裂进行补齐,提高了光学字符识别的识别准确率。
【专利说明】光学字符识别方法及装置

【技术领域】
[0001] 本公开涉及图像处理领域,具体而言,涉及光学字符识别方法及装置。

【背景技术】
[0002] OCR (Optical Character Recognition,光学字符识别)技术在图像处理领域占有 重要地位,在信息自动化和办公自动化中具有广泛的应用。OCR是指对文本资料、卡片等的 图像文件进行分析识别处理,获取文字及版面信息的过程。
[0003] 提高识别准确率是OCR技术中很重要的课题。在实际应用中,需要进行光学字符 识别的原始图像中经常会存在字符中笔画出现断裂的情况,例如,在充值卡中,用户在挂掉 涂层的时候,经常会有残留,导致充值卡的密码被遮挡,从而导致比划断裂。相关技术的OCR 容易将断裂的笔画识别为两个笔画,导致识别准确率降低。


【发明内容】

[0004] 本公开的目的在于提供光学字符识别方法及装置,以解决上述的问题。
[0005] 根据本公开实施例的第一方面,本公开提供了一种光学字符识别方法,包括:
[0006] 从原始图像中提取字符块;
[0007] 基于笔画宽度变换,确定所述字符块中断裂的笔画;
[0008] 对所述断裂的笔画补齐得到准识别图像;
[0009] 对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。
[0010] 本公开的实施例提供的技术方案,能够利用笔画宽度变换对字符中笔画出现的断 裂进行补齐,提高了光学字符识别的识别准确率。
[0011] 上述光学字符识别方法还可以包括如下特点,所述基于笔画宽度变换,确定所述 字符块中断裂的笔画包括:
[0012] 设置断裂长度阈值;
[0013] 确定所述字符块的笔画区域像素点所在笔画的方向;
[0014] 判断在所述笔画区域像素点所在笔画的方向上,所述笔画区域像素点与其下一个 笔画区域像素点之间是否存在笔画宽度突变区域,且所述笔画宽度突变区域的长度小于所 述断裂长度阈值,所述笔画宽度突变区域为空白区域、笔画宽度增大值大于设定第一宽度 变化阈值或笔画宽度减小值大于设定第二宽度变化阈值的区域;
[0015] 当存在所述笔画宽度突变区域时,确定所述笔画区域像素点所在笔画为断裂的笔 画,确定所述笔画宽度突变区域为所述断裂的笔画中的断裂区域。
[0016] 本公开的实施例提供的技术方案,利用笔画宽度变换确定断裂的笔画,可以准确 地找到断裂区域,为补齐断裂的笔画提供基础,有助于提高字符识别的识别准确率。
[0017] 上述光学字符识别方法还可以包括如下特点,所述对所述断裂的笔画补齐包括:
[0018] 设所述断裂的笔画中的断裂区域沿其所在笔画的方向与其所在笔画的交界像素 点分别为第一交界点和第二交界点,将所述第一交界点和所述第二交界点之间沿所述第一 交界点的笔画方向、宽度等于所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度 值的平均值的区域设置为准笔画区域,其中,所述第一交界点的笔画宽度值和所述第二交 界点的笔画宽度值通过笔画宽度变换算法获得;
[0019] 将所述准笔画区域的灰度值设置为与所述字符块中笔画区域的灰度值一致的值。
[0020] 本公开的实施例提供的技术方案,通过将准笔画区域的灰度值设置为与字符块中 笔画区域的灰度值一致的值这种方式对断裂的笔画进行补齐,能够有效消除断裂笔画,有 助于提高字符识别的识别准确率。
[0021] 上述光学字符识别方法还可以包括如下特点,所述对所述断裂的笔画补齐还包 括:
[0022] 当所述断裂区域为所述断裂的笔画中的笔画宽度显著增大区域时,将所述断裂区 域中处于所述准笔画区域之外的笔画区域的灰度值设置为与所述字符块中背景区域的灰 度值一致的值。
[0023] 本公开的实施例提供的技术方案,在进行笔画补齐的同时还可以进一步去除噪 声,有助于提高字符识别的识别准确率。
[0024] 上述光学字符识别方法还可以包括如下特点,在所述对所述准识别图像进行字符 识别之前,还包括:
[0025] 基于笔画宽度变换,检测所述字符块中的噪声;
[0026] 消除所述噪声。
[0027] 本公开的实施例提供的技术方案,不仅能够对字符中笔画出现的断裂进行补齐, 还能够利用笔画宽度变换进一步去除噪声,进一步提高了字符识别的识别准确率。
[0028] 上述光学字符识别方法还可以包括如下特点,所述基于笔画宽度变换,检测所述 字符块中的噪声包括:
[0029] 确定所述字符块的笔画宽度W,字符块i的笔画宽度等于第一宽度平均值与第二 宽度平均值之和的二分之一,所述第一宽度平均值为字符块i的平均笔画宽度值,字符块i 的平均笔画宽度值等于字符块i中所有笔画区域像素点的笔画宽度值的平均值,所述第二 宽度平均值为从所述原始图像中提取出的所有字符块的平均笔画宽度值的平均值,i为自 然数,笔画区域像素点的笔画宽度值通过笔画宽度变换算法获得;
[0030] 设置字符笔画宽度误差d ;
[0031] 判断所述字符块中笔画宽度处于区间[W_d,W+d]之外的笔画区域是否满足如下 成噪条件之一:所述笔画区域的设定范围内没有与所述笔画方向相符合的笔画、沿所述笔 画区域的笔画宽度变化波动值大于设定波动阈值或者所述笔画区域的笔画长度小于设定 长度阈值;
[0032] 当所述字符块中笔画宽度处于区间[W_d,W+d]之外的笔画区域满足所述成噪条 件之一时,判定所述字符块中笔画宽度处于区间[w-d,w+d]之外的笔画区域为噪声。
[0033] 本公开的实施例提供的技术方案,利用笔画宽度变换检测出字符块中的噪声,为 消除噪声提供基础,有助于提高字符识别的识别准确率。
[0034] 上述光学字符识别方法还可以包括如下特点,所述消除所述噪声包括:
[0035] 将所述噪声的灰度值设置为与所述字符块中背景区域的灰度值一致的值。
[0036] 本公开的实施例提供的技术方案,能够有效地消除字符块中的噪声,有助于提高 字符识别的识别准确率。
[0037] 上述光学字符识别方法还可以包括如下特点,所述笔画宽度变换算法包括:
[0038] 对所述字符块进行边缘检测,找到边缘像素点,所述边缘像素点具有一个方向梯 度值;
[0039] 按照任一边缘像素点p的梯度方向dp沿路线r查找与边缘像素点p相匹配的边 缘像素点q,边缘像素点q的梯度方向d q与边缘像素点p的梯度方向dp相反,其中,r = p+n*dp, η大于或等于0 ;
[0040] 当查找到所述边缘像素点q时,指定所述边缘像素点ρ与所述边缘像素点q的连 线上每个像素点的笔画宽度值为所述边缘像素点P与所述边缘像素点q之间的欧式距离。
[0041] 本公开的实施例提供的技术方案,能够有效确定笔画宽度值,为补齐断裂的笔画 提供基础。
[0042] 根据本公开实施例的第二方面,本公开提供了一种光学字符识别装置,包括:
[0043] 提取模块,用于从原始图像中提取字符块;
[0044] 确定模块,用于基于笔画宽度变换,确定所述字符块中断裂的笔画;
[0045] 补齐模块,用于对所述断裂的笔画补齐得到准识别图像;
[0046] 识别模块,用于对所述准识别图像进行字符识别,得到所述准识别图像中的文本 信息。
[0047] 本公开的实施例提供的技术方案,能够利用笔画宽度变换对字符中笔画出现的断 裂进行补齐,提高了光学字符识别的识别准确率。
[0048] 上述光学字符识别装置还可以包括如下特点,所述确定模块包括:
[0049] 阈值设置单元,用于设置断裂长度阈值;
[0050] 笔画方向确定单元,用于确定所述字符块的笔画区域像素点所在笔画的方向;
[0051] 突变判断单元,用于判断在所述笔画区域像素点所在笔画的方向上,所述笔画区 域像素点与其下一个笔画区域像素点之间是否存在笔画宽度突变区域,且所述笔画宽度突 变区域的长度小于所述断裂长度阈值,所述笔画宽度突变区域为空白区域、笔画宽度增大 值大于设定第一宽度变化阈值或笔画宽度减小值大于设定第二宽度变化阈值的区域;
[0052] 断裂笔画确定单元,用于当存在所述笔画宽度突变区域时,确定所述笔画区域像 素点所在笔画为断裂的笔画,确定所述笔画宽度突变区域为所述断裂的笔画中的断裂区 域。
[0053] 本公开的实施例提供的技术方案,利用笔画宽度变换确定断裂的笔画,可以准确 地找到断裂区域,为补齐断裂的笔画提供基础,有助于提高字符识别的识别准确率。
[0054] 上述光学字符识别装置还可以包括如下特点,所述补齐模块包括:
[0055] 准笔画区域设置单元,设所述断裂的笔画中的断裂区域沿其所在笔画的方向与其 所在笔画的交界像素点分别为第一交界点和第二交界点,所述准笔画区域设置单元用于将 所述第一交界点和所述第二交界点之间沿所述第一交界点的笔画方向、宽度等于所述第一 交界点的笔画宽度值和所述第二交界点的笔画宽度值的平均值的区域设置为准笔画区域, 其中,所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度值通过笔画宽度变换单 元获得;
[0056] 第一灰度调整单元,用于将所述准笔画区域的灰度值设置为与所述字符块中笔画 区域的灰度值一致的值。
[0057] 本公开的实施例提供的技术方案,通过将准笔画区域的灰度值设置为与字符块中 笔画区域的灰度值一致的值这种方式对断裂的笔画进行补齐,能够有效消除断裂笔画,有 助于提高字符识别的识别准确率。
[0058] 上述光学字符识别装置还可以包括如下特点,所述补齐模块还包括:
[0059] 第二灰度调整单元,用于当所述断裂区域为所述断裂的笔画中的笔画宽度显著增 大区域时,将所述断裂区域中处于所述准笔画区域之外的笔画区域的灰度值设置为与所述 字符块中背景区域的灰度值一致的值。
[0060] 本公开的实施例提供的技术方案,在进行笔画补齐的同时还可以进一步去除噪 声,有助于提高字符识别的识别准确率。
[0061] 上述光学字符识别装置还可以包括如下特点,在所述识别模块之前,还包括:
[0062] 噪声检测模块,用于基于笔画宽度变换,检测所述字符块中的噪声;
[0063] 消除模块,用于消除所述噪声检测模块检测出的噪声。
[0064] 本公开的实施例提供的技术方案,不仅能够对字符中笔画出现的断裂进行补齐, 还能够利用笔画宽度变换进一步去除噪声,进一步提高了字符识别的识别准确率。
[0065] 上述光学字符识别装置还可以包括如下特点,所述噪声检测模块包括:
[0066] 笔画宽度确定单元,用于确定所述字符块的笔画宽度W,字符块i的笔画宽度等于 第一宽度平均值与第二宽度平均值之和的二分之一,所述第一宽度平均值为字符块i的平 均笔画宽度值,字符块i的平均笔画宽度值等于字符块i中所有笔画区域像素点的笔画宽 度值的平均值,所述第二宽度平均值为从所述原始图像中提取出的所有字符块的平均笔画 宽度值的平均值,i为自然数,笔画区域像素点的笔画宽度值通过笔画宽度变换单元获得; [0067] 误差设置单元,用于设置字符笔画宽度误差d ;
[0068] 成噪判断单元,用于判断所述字符块中笔画宽度处于区间[W_d,W+d]之外的笔画 区域是否满足如下成噪条件之一:所述笔画区域的设定范围内没有与所述笔画方向相符合 的笔画、沿所述笔画区域的笔画宽度变化波动值大于设定波动阈值或者所述笔画区域的笔 画长度小于设定长度阈值;
[0069] 判定单元,用于当所述字符块中笔画宽度处于区间[W_d,W+d]之外的笔画区域满 足所述成噪条件之一时,判定所述字符块中笔画宽度处于区间[w-d,w+d]之外的笔画区域 为噪声。
[0070] 本公开的实施例提供的技术方案,利用笔画宽度变换检测出字符块中的噪声,为 消除噪声提供基础,有助于提高字符识别的识别准确率。
[0071] 上述光学字符识别装置还可以包括如下特点,所述消除模块包括:
[0072] 灰度除噪单元,用于将所述噪声的灰度值设置为与所述字符块中背景区域的灰度 值一致的值。
[0073] 本公开的实施例提供的技术方案,能够有效地消除字符块中的噪声,有助于提高 字符识别的识别准确率。
[0074] 上述光学字符识别装置还可以包括如下特点,所述笔画宽度变换单元包括:
[0075] 边缘检测子单元,用于对所述字符块进行边缘检测,找到边缘像素点,所述边缘像 素点具有一个方向梯度值;
[0076] 匹配子单元,用于按照任一边缘像素点p的梯度方向dp沿路线r查找与边缘像素 点P相匹配的边缘像素点q,边缘像素点q的梯度方向d q与边缘像素点p的梯度方向dp相 反,其中,r = p+n*dp, η大于或等于0 ;
[0077] 指定子单元,用于当查找到所述边缘像素点q时,指定所述边缘像素点ρ与所述边 缘像素点q的连线上每个像素点的笔画宽度值为所述边缘像素点P与所述边缘像素点q之 间的欧式距离。
[0078] 本公开的实施例提供的技术方案,能够有效确定笔画宽度值,为补齐断裂的笔画 提供基础。
[0079] 根据本公开实施例的第三方面,提供一种光学字符识别装置,包括:
[0080] 处理器;
[0081] 用于存储处理器可执行指令的存储器;
[0082] 其中,所述处理器被配置为执行如下指令:
[0083] 从原始图像中提取字符块;
[0084] 基于笔画宽度变换,确定所述字符块中断裂的笔画;
[0085] 对所述断裂的笔画补齐得到准识别图像;
[0086] 对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。
[0087] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本 公开。

【专利附图】

【附图说明】
[0088] 图1是根据一示例性实施例示出的一种光学字符识别方法的流程图之一;
[0089] 图2是根据一示例性实施例示出的一种光学字符识别方法的流程图之二;
[0090] 图3是根据一示例性实施例示出的一种光学字符识别装置的结构框图之一; [0091] 图4是根据一示例性实施例示出的一种光学字符识别装置中确定模块20的一种 结构框图;
[0092] 图5是根据一示例性实施例示出的一种光学字符识别装置中补齐模块30的结构 框图之一;
[0093] 图6是根据一示例性实施例示出的一种光学字符识别装置中补齐模块30的结构 框图之二;
[0094] 图7是根据一示例性实施例示出的一种光学字符识别装置中提取模块10的结构 框图;
[0095] 图8是根据一示例性实施例示出的一种光学字符识别装置的结构框图之二; [0096] 图9是根据一示例性实施例示出的一种光学字符识别装置中噪声检测模块50的 结构框图;
[0097] 图10是根据一示例性实施例示出的一种光学字符识别装置中消除模块60的结构 框图;
[0098] 图11是根据一示例性实施例示出的一种光学字符识别装置中笔画宽度变换单元 70的结构框图;
[0099] 图12是根据一示例性实施例示出的一种装置的框图。
[0100] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。

【具体实施方式】
[0101] 下面通过具体的实施例子并结合附图对本公开做进一步的详细描述。
[0102] 图1是根据一示例性实施例示出的一种光学字符识别方法的流程图之一。如图1 所示,本实施例中,光学字符识别方法的流程可以包括如下步骤:
[0103] 在步骤S101中,从原始图像中提取字符块;
[0104] 提取出的字符块包括笔画区域和背景区域。本公开中,可以将笔画区域的像素点 的灰度值设为〇,将背景区域的灰度值设为255,也可以将笔画区域的像素点的灰度值设为 255,将背景区域的灰度值设为0。
[0105] 其中,步骤S101可以采用如下的子步骤(步骤all至步骤dll)来实现:
[0106] all,对原始图像进行灰度化处理后滤波,获得原始图像的第一预处理结果图;
[0107] bll,对第一预处理结果图进行二值化处理后滤波,获得原始图像的第二预处理结 果图;
[0108] cll,定位和提取第二预处理结果图中的文本信息;
[0109] dll,对第二预处理结果图中的文本信息按行进行字符分割,得到字符块,该字符 块即为从原始图像中提取出的字符块。
[0110] 步骤all至步骤dll在进行字符块提取的过程中同时去除噪声,有助于提高字符 识别的识别准确率。
[0111] 在步骤S102中,基于笔画宽度变换,确定该字符块中断裂的笔画;
[0112] 其中,步骤S102可以采用如下的子步骤(步骤al2至步骤dl2)来实现:
[0113] 在步骤al2中,设置断裂长度阈值;
[0114] 在步骤bl2中,确定字符块的笔画区域像素点所在笔画的方向;
[0115] 在步骤cl2中,判断在笔画区域像素点所在笔画的方向上,笔画区域像素点与其 下一个笔画区域像素点之间是否存在笔画宽度突变区域,且该笔画宽度突变区域的长度小 于断裂长度阈值,其中,笔画宽度突变区域可以为空白区域、笔画宽度显著增大区域或笔画 宽度显著减小区域;其中,笔画宽度显著增大区域是指笔画宽度增大值大于设定第一宽度 变化阈值的区域,笔画宽度显著减小区域是指笔画宽度减小值大于设定第二宽度变化阈值 的区域。
[0116] 在步骤dl2中,当存在笔画宽度突变区域时,确定笔画区域像素点所在笔画为断 裂的笔画,确定笔画宽度突变区域为断裂的笔画中的断裂区域。
[0117] 利用笔画宽度变换确定断裂的笔画,可以准确地找到断裂区域,为补齐断裂的笔 画提供基础,有助于提商字符识别的识别准确率。
[0118] 在步骤S103中,对断裂的笔画补齐得到准识别图像;
[0119] 其中,步骤S103可以采用如下的子步骤(步骤al3至步骤bl3)来实现:
[0120] 在步骤al3中,设断裂的笔画中的断裂区域沿其所在笔画的方向与其所在笔画的 交界像素点分别为第一交界点和第二交界点,将第一交界点和第二交界点之间沿第一交界 点的笔画方向、宽度等于第一交界点的笔画宽度值和第二交界点的笔画宽度值的平均值的 区域设置为准笔画区域,其中,第一交界点的笔画宽度值和第二交界点的笔画宽度值通过 笔画宽度变换算法获得;
[0121] 在步骤bl3中,将准笔画区域的灰度值设置为与字符块中笔画区域的灰度值一致 的值。
[0122] 步骤al3至步骤bl3通过将准笔画区域的灰度值设置为与字符块中笔画区域的灰 度值一致的值这种方式对断裂的笔画进行补齐,能够有效消除断裂笔画,有助于提高字符 识别的识别准确率。
[0123] 在本公开实施例中,步骤S103还可以包括子步骤cl3 :
[0124] 在步骤cl3中,当断裂区域为断裂的笔画中的笔画宽度显著增大区域时,将断裂 区域中处于准笔画区域之外的笔画区域的灰度值设置为与字符块中背景区域的灰度值一 致的值。这样,在进行笔画补齐的同时还可以进一步去除噪声,有助于提高字符识别的识别 准确率。
[0125] 在步骤S104中,对准识别图像进行字符识别,得到该准识别图像中的文本信息。
[0126] 这里,说明一下笔画宽度变换算法。笔画宽度变换算法可以包括如下步骤(步骤 a00至步骤c00):
[0127] 在步骤a00中,对字符块进行边缘检测,找到边缘像素点,边缘像素点具有一个方 向梯度值;
[0128] 在步骤b00中,按照任一边缘像素点p的梯度方向dp沿路线r查找与边缘像素点 P相匹配的边缘像素点q,边缘像素点q的梯度方向dq与边缘像素点p的梯度方向dp相反, 其中,r = p+n*dp, η大于或等于0 ;
[0129] 在步骤c00中,当查找到边缘像素点q时,指定边缘像素点ρ与边缘像素点q的连 线上每个像素点的笔画宽度值为边缘像素点p与边缘像素点q之间的欧式距离。边缘像素 点P与边缘像素点q之间的欧式距离表示为I |p_q| I。
[0130] 该笔画宽度变换算法能够有效确定笔画宽度值,为补齐断裂的笔画提供基础。
[0131] 本实施例示出的光学字符识别方法,能够利用笔画宽度变换对字符中笔画出现的 断裂进行补齐,提高了光学字符识别的识别准确率。
[0132] 图2是根据一示例性实施例示出的一种光学字符识别方法的流程图之二。如图2 所示,本实施例中,光学字符识别方法的流程可以包括如下步骤:
[0133] 在步骤S201中,从原始图像中提取字符块;
[0134] 在步骤S202中,基于笔画宽度变换,确定字符块中断裂的笔画;
[0135] 在步骤S203中,基于笔画宽度变换,检测字符块中的噪声;
[0136] 其中,步骤S203可以采用如下的子步骤(步骤a23至步骤d23)来实现:
[0137] 在步骤a23中,确定字符块的笔画宽度W,字符块i的笔画宽度等于第一宽度平均 值与第二宽度平均值之和的二分之一,其中,第一宽度平均值为字符块i的平均笔画宽度 值,字符块i的平均笔画宽度值等于字符块i中所有笔画区域像素点的笔画宽度值的平均 值,第二宽度平均值为从原始图像中提取出的所有字符块的平均笔画宽度值的平均值,i为 自然数,笔画区域像素点的笔画宽度值通过笔画宽度变换算法获得;
[0138] 设字符块i的笔画宽度为I,第一宽度平均值为Wn,第二宽度平均值为Wa,那么, Wa的表达式如公式(1)所示:

【权利要求】
1. 一种光学字符识别方法,其特征在于,包括: 从原始图像中提取字符块; 基于笔画宽度变换,确定所述字符块中断裂的笔画; 对所述断裂的笔画补齐得到准识别图像; 对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。
2. 根据权利要求1所述的光学字符识别方法,其特征在于,所述基于笔画宽度变换,确 定所述字符块中断裂的笔画包括: 设置断裂长度阈值; 确定所述字符块的笔画区域像素点所在笔画的方向; 判断在所述笔画区域像素点所在笔画的方向上,所述笔画区域像素点与其下一个笔画 区域像素点之间是否存在笔画宽度突变区域,且所述笔画宽度突变区域的长度小于所述断 裂长度阈值,所述笔画宽度突变区域为空白区域、笔画宽度增大值大于设定第一宽度变化 阈值或笔画宽度减小值大于设定第二宽度变化阈值的区域; 当存在所述笔画宽度突变区域时,确定所述笔画区域像素点所在笔画为断裂的笔画, 确定所述笔画宽度突变区域为所述断裂的笔画中的断裂区域。
3. 根据权利要求1所述的光学字符识别方法,其特征在于,所述对所述断裂的笔画补 齐包括: 设所述断裂的笔画中的断裂区域沿其所在笔画的方向与其所在笔画的交界像素点分 别为第一交界点和第二交界点,将所述第一交界点和所述第二交界点之间沿所述第一交界 点的笔画方向、宽度等于所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度值的 平均值的区域设置为准笔画区域,其中,所述第一交界点的笔画宽度值和所述第二交界点 的笔画宽度值通过笔画宽度变换算法获得; 将所述准笔画区域的灰度值设置为与所述字符块中笔画区域的灰度值一致的值。
4. 根据权利要求3所述的光学字符识别方法,其特征在于,所述对所述断裂的笔画补 齐还包括: 当所述断裂区域为所述断裂的笔画中的笔画宽度显著增大区域时,将所述断裂区域中 处于所述准笔画区域之外的笔画区域的灰度值设置为与所述字符块中背景区域的灰度值 一致的值。
5. 根据权利要求1所述的光学字符识别方法,其特征在于,在所述对所述准识别图像 进行字符识别之前,还包括: 基于笔画宽度变换,检测所述字符块中的噪声; 消除所述噪声。
6. 根据权利要求5所述的光学字符识别方法,其特征在于,所述基于笔画宽度变换,检 测所述字符块中的噪声包括: 确定所述字符块的笔画宽度W,字符块i的笔画宽度等于第一宽度平均值与第二宽度 平均值之和的二分之一,所述第一宽度平均值为字符块i的平均笔画宽度值,字符块i的平 均笔画宽度值等于字符块i中所有笔画区域像素点的笔画宽度值的平均值,所述第二宽度 平均值为从所述原始图像中提取出的所有字符块的平均笔画宽度值的平均值,i为自然数, 笔画区域像素点的笔画宽度值通过笔画宽度变换算法获得; 设置字符笔画宽度误差d; 判断所述字符块中笔画宽度处于区间[w-d,w+d]之外的笔画区域是否满足如下成噪 条件之一:所述笔画区域的设定范围内没有与所述笔画方向相符合的笔画、沿所述笔画区 域的笔画宽度变化波动值大于设定波动阈值或者所述笔画区域的笔画长度小于设定长度 阈值; 当所述字符块中笔画宽度处于区间[w-d,w+d]之外的笔画区域满足所述成噪条件之 一时,判定所述字符块中笔画宽度处于区间[w-d,w+d]之外的笔画区域为噪声。
7. 根据权利要求5所述的光学字符识别方法,其特征在于,所述消除所述噪声包括: 将所述噪声的灰度值设置为与所述字符块中背景区域的灰度值一致的值。
8. 根据权利要求3或6所述的光学字符识别方法,其特征在于,所述笔画宽度变换算法 包括: 对所述字符块进行边缘检测,找到边缘像素点,所述边缘像素点具有一个方向梯度 值; 按照任一边缘像素点P的梯度方向dp沿路线r查找与边缘像素点p相匹配的边缘像素 点q,边缘像素点q的梯度方向dq与边缘像素点p的梯度方向dp相反,其中,r = p+n*dp,η 大于或等于〇 ; 当查找到所述边缘像素点q时,指定所述边缘像素点Ρ与所述边缘像素点q的连线上 每个像素点的笔画宽度值为所述边缘像素点P与所述边缘像素点q之间的欧式距离。
9. 一种光学字符识别装置,其特征在于,包括: 提取模块,用于从原始图像中提取字符块; 确定模块,用于基于笔画宽度变换,确定所述字符块中断裂的笔画; 补齐模块,用于对所述断裂的笔画补齐得到准识别图像; 识别模块,用于对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。
10. 根据权利要求9所述的光学字符识别装置,其特征在于,所述确定模块包括: 阈值设置单元,用于设置断裂长度阈值; 笔画方向确定单元,用于确定所述字符块的笔画区域像素点所在笔画的方向; 突变判断单元,用于判断在所述笔画区域像素点所在笔画的方向上,所述笔画区域像 素点与其下一个笔画区域像素点之间是否存在笔画宽度突变区域,且所述笔画宽度突变区 域的长度小于所述断裂长度阈值,所述笔画宽度突变区域为空白区域、笔画宽度增大值大 于设定第一宽度变化阈值或笔画宽度减小值大于设定第二宽度变化阈值的区域; 断裂笔画确定单元,用于当存在所述笔画宽度突变区域时,确定所述笔画区域像素点 所在笔画为断裂的笔画,确定所述笔画宽度突变区域为所述断裂的笔画中的断裂区域。
11. 根据权利要求9所述的光学字符识别装置,其特征在于,所述补齐模块包括: 准笔画区域设置单元,设所述断裂的笔画中的断裂区域沿其所在笔画的方向与其所 在笔画的交界像素点分别为第一交界点和第二交界点,所述准笔画区域设置单元用于将所 述第一交界点和所述第二交界点之间沿所述第一交界点的笔画方向、宽度等于所述第一交 界点的笔画宽度值和所述第二交界点的笔画宽度值的平均值的区域设置为准笔画区域,其 中,所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度值通过笔画宽度变换单元 获得; 第一灰度调整单元,用于将所述准笔画区域的灰度值设置为与所述字符块中笔画区域 的灰度值一致的值。
12. 根据权利要求11所述的光学字符识别装置,其特征在于,所述补齐模块还包括: 第二灰度调整单元,用于当所述断裂区域为所述断裂的笔画中的笔画宽度显著增大区 域时,将所述断裂区域中处于所述准笔画区域之外的笔画区域的灰度值设置为与所述字符 块中背景区域的灰度值一致的值。
13. 根据权利要求9所述的光学字符识别装置,其特征在于,在所述识别模块之前,还 包括: 噪声检测模块,用于基于笔画宽度变换,检测所述字符块中的噪声; 消除模块,用于消除所述噪声检测模块检测出的噪声。
14. 根据权利要求13所述的光学字符识别装置,其特征在于,所述噪声检测模块包括: 笔画宽度确定单元,用于确定所述字符块的笔画宽度W,字符块i的笔画宽度等于第一 宽度平均值与第二宽度平均值之和的二分之一,所述第一宽度平均值为字符块i的平均笔 画宽度值,字符块i的平均笔画宽度值等于字符块i中所有笔画区域像素点的笔画宽度值 的平均值,所述第二宽度平均值为从所述原始图像中提取出的所有字符块的平均笔画宽度 值的平均值,i为自然数,笔画区域像素点的笔画宽度值通过笔画宽度变换单元获得; 误差设置单元,用于设置字符笔画宽度误差d ; 成噪判断单元,用于判断所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域 是否满足如下成噪条件之一:所述笔画区域的设定范围内没有与所述笔画方向相符合的笔 画、沿所述笔画区域的笔画宽度变化波动值大于设定波动阈值或者所述笔画区域的笔画长 度小于设定长度阈值; 判定单元,用于当所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域满足所 述成噪条件之一时,判定所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域为噪 声。
15. 根据权利要求13所述的光学字符识别装置,其特征在于,所述消除模块包括: 灰度除噪单元,用于将所述噪声的灰度值设置为与所述字符块中背景区域的灰度值一 致的值。
16. 根据权利要求11或14所述的光学字符识别装置,其特征在于,所述笔画宽度变换 单元包括: 边缘检测子单元,用于对所述字符块进行边缘检测,找到边缘像素点,所述边缘像素点 具有一个方向梯度值; 匹配子单元,用于按照任一边缘像素点P的梯度方向4沿路线r查找与边缘像素点p 相匹配的边缘像素点q,边缘像素点q的梯度方向dq与边缘像素点p的梯度方向dp相反, 其中,r = p+n*dp, η大于或等于0 ; 指定子单元,用于当查找到所述边缘像素点q时,指定所述边缘像素点Ρ与所述边缘像 素点q的连线上每个像素点的笔画宽度值为所述边缘像素点P与所述边缘像素点q之间的 欧式距离。
17. -种光学字符识别装置,其特征在于,包括: 处理器; 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为执行如下指令: 从原始图像中提取字符块; 基于笔画宽度变换,确定所述字符块中断裂的笔画; 对所述断裂的笔画补齐得到准识别图像; 对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。
【文档编号】G06K9/54GK104112130SQ201410299362
【公开日】2014年10月22日 申请日期:2014年6月26日 优先权日:2014年6月26日
【发明者】陈志军, 张祺深, 臧虎 申请人:小米科技有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1