字符识别方法及装置的制造方法

文档序号:9866174阅读:452来源:国知局
字符识别方法及装置的制造方法
【技术领域】
[0001 ]本公开设及字符识别技术领域,尤其设及字符识别方法及装置。
【背景技术】
[0002] 目前,字符识别技术被应用在了众多领域。在进行诸如身份证信息提取等任务时, 出于种种原因字符切割地未必准确,会出现一些错误,常见的错是会将前一个字的偏旁被 切到了下一个字中,例如"川"字,在切割时,很容易把最右边的竖切到后面的字符中,从而 导致字符识别结果的准确度较低。

【发明内容】

[0003] 本公开实施例提供了字符识别方法及装置。所述技术方案如下:
[0004] 根据本公开实施例的第一方面,提供一种字符识别方法,包括:
[0005] 对字符图像进行字符识别,获得字符识别结果;
[0006] 从所述字符识别结果中,确定出置信度小于或等于第一预设阔值的目标字符;
[0007] 对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个 所述字符图像块中包括一个单元字符;
[000引根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。
[0009] 在一个实施例中,所述对所述目标字符所在的字符图像区域进行切割,包括:
[0010] 获取所述目标字符的字符排列方向;
[0011] 将所述字符排列方向作为切割方向,对所述目标字符所在的字符图像区域进行切 割。
[0012] 在一个实施例中,所述根据所述至少两个字符图像块对所述字符图像区域重新进 行字符识别,包括:
[0013] 分别对所述至少两个字符图像块进行字符识别,获得所述至少两个字符图像块各 自所包括的单元字符;
[0014] 按照所述至少两个字符图像块在所述字符图像区域中的排列顺序,对所述至少两 个字符图像块各自所包括的单元字符进行排列;
[0015] 对排列后的所述单元字符进行组合处理,获得至少两组字符组合;
[0016] 从所述至少两组字符组合中,确定出置信度满足预设条件的字符组合;
[0017] 将所述置信度满足预设条件的字符组合确定为所述字符图像区域的字符识别结 果。
[0018] 在一个实施例中,所述置信度满足预设条件的字符组合,包括W下第一种字符组 合或者第二种字符组合:
[0019] 第一种字符组合包括:组合内每个字符各自的置信度均大于第二预设阔值的字符 组合;其中,所述第二预设阔值大于或等于第一预设阔值;
[0020] 第二种字符组合包括:在所述至少两组字符组合中,组合内所有字符各自的置信 度之和最高的字符组合。
[0021 ]在一个实施例中,当所述目标字符包括汉字时,所述单元字符包括偏旁部首、或者 独体字。
[0022] 根据本公开实施例的第二方面,提供一种字符识别装置,包括:
[0023] 第一识别模块,用于对字符图像进行字符识别,获得字符识别结果;
[0024] 确定模块,用于从所述第一识别模块获得的所述字符识别结果中,确定出置信度 小于或等于第一预设阔值的目标字符;
[0025] 切割模块,用于对所述确定模块确定出的所述目标字符所在的字符图像区域进行 切割,获得至少两个字符图像块,每个所述字符图像块中包括一个单元字符;
[0026] 第二识别模块,用于根据所述切割模块获得的所述至少两个字符图像块对所述字 符图像区域重新进行字符识别。
[0027] 在一个实施例中,所述切割模块包括:
[0028] 获取子模块,用于获取所述目标字符的字符排列方向;
[0029] 切割子模块,用于将所述获取子模块获取到的所述字符排列方向作为切割方向, 对所述目标字符所在的字符图像区域进行切割。
[0030] 在一个实施例中,所述第二识别模块,包括:
[0031] 识别子模块,用于分别对所述至少两个字符图像块进行字符识别,获得所述至少 两个字符图像块各自所包括的单元字符;
[0032] 排序子模块,用于按照所述至少两个字符图像块在所述字符图像区域中的排列顺 序,对所述至少两个字符图像块各自所包括的单元字符进行排列;
[0033] 组合子模块,用于对所述排列后的所述单元字符进行组合处理,获得至少两组字 符组合;
[0034] 第一确定子模块,用于从所述至少两组字符组合中,确定出置信度满足预设条件 的字符组合;
[0035] 第二确定子模块,用于将所述置信度满足预设条件的字符组合确定为所述字符图 像区域的字符识别结果。
[0036] 在一个实施例中,所述置信度满足预设条件的字符组合,包括W下第一种字符组 合或者第二种字符组合:
[0037] 第一种字符组合包括:组合内每个字符各自的置信度均大于第二预设阔值的字符 组合;其中,所述第二预设阔值大于或等于第一预设阔值;
[0038] 第二种字符组合包括:在所述至少两组字符组合中,组合内所有字符各自的置信 度之和最高的字符组合。
[0039] 在一个实施例中,当所述目标字符包括汉字时,所述单元字符包括偏旁部首、或者 独体字。
[0040] 根据本公开实施例的第Ξ方面,提供了一种字符识别装置,包括:
[0041 ] 处理器;
[0042] 用于存储处理器可执行指令的存储器;
[0043] 其中,所述处理器被配置为:
[0044] 对字符图像进行字符识别,获得字符识别结果;
[0045] 从所述字符识别结果中,确定出置信度小于或等于第一预设阔值的目标字符;
[0046] 对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个 所述字符图像块中包括一个单元字符;
[0047] 根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。
[0048] 本公开的实施例提供的技术方案可W包括W下有益效果:
[0049] 本公开的实施例提供的技术方案,通过对字符图像区域进行细致的切割,获得无 法再进一步分割的字符图像块,再通过对字符图像块中单元字符的组合处理,获得置信度 较高的字符组合,将置信度较高的字符组合确定为字符图像区域的字符识别结果。该技术 提高了字符识别结果的准确度。
[0050] 应当理解的是,W上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本公开。
【附图说明】
[0051] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施 例,并与说明书一起用于解释本公开的原理。
[0052] 图1是根据一示例性实施例示出的一种字符识别方法的流程图。
[0053] 图2是根据一示例性实施例示出的一种字符图像的示意图。
[0054] 图3是根据一示例性实施例示出的另一种字符图像的示意图。
[0055] 图4是根据一示例性实施例示出的另一种字符识别方法的流程图。
[0056] 图5是根据一示例性实施例示出的一种字符识别装置的框图。
[0057] 图6是根据一示例性实施例示出的一种字符识别装置的框图。
[0058] 图7是根据一示例性实施例示出的适用于字符识别装置的框图。
【具体实施方式】
[0059] 运里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述设及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。W下示例性实施例 中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0060] 本公开实施例提供了
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1